Nowadays, social media is the most powerful and widespread mean of communication that exists among young people and adults. For more than a decade, they have won the hearts of all people civilized enough to afford the use of the Internet and a smartphone, and hypnotized their minds into being considered indispensable, even vital. However, trusting what is shown to us there is not always a good idea. Through this master's degree thesis, I want to deal with the difference between real, fake and bot-manipulated social profiles, and the constant presence of hoaxes within the various networks: the network is that place where it is very easy to pretend to be someone else or write and share what you want. Initially, I will talk about fake identities, i.e. social profiles associated with a fictional nickname and one or more images belonging to a second individual, often accompanied by degrading or misleading descriptions. In particular, I will answer the questions: what are the reasons that bring people to generate fake accounts? What are the characteristics of these? What precautions to take when you want to unmask a suspicious profile? Next, I will discuss about bots, the short form of "robot", a word that comes from the Czech "robota" or "slave". The term was created in 1920 by the writer Karel Cˇapek, precisely to say something "at the service" of people, but today, for bot, we mean, in the computer field, a program that performs automatic tasks on the Internet by simulating the behavior of a human user, an automated software designed to perform some specific tasks. The growing relevance of social media in our daily lives has been accompanied by efforts to manipulate online conversations and opinions, and this is just one of the goals of bots. When we access news from social media, we are exposed to a daily dose of fake or misleading news, hoaxes, conspiracy theories, click-bait headlines, junk science, and satire. We refer to such content collectively as "misinformation" and its massive digital dissemination has been identified as a major global risk. Within the third and penultimate chapter, I will explain what are fake news and their history. The counterfeiting of news, which can involve manipulative distortion of facts or outright disinformation, is carried out by ignoring editorial norms, rules, processes adopted to ensure compliance and verifiability, but, despite this, it has a powerful effect on a large number of people, often triggering fear or insecurity. Finally, the last and fourth chapter will examine a corpus of tweets and articles, provided by EVALITA for the task “The MULTI-Fake-DetectiVE”. Starting from the dataset, texts containing false information will be divided from those without false information into two different subsets, of which the most recurring words will be identified according to a specially created Python program. Given the list of the twenty-four words with the highest absolute frequency number within that dataset, the relative frequency of the terms appearing in both lists will be calculated, in relation to both corpora, and the two weirdness indices ( "weirdness_fakenews" and "weirdness_realnews"), one about the first subset and one about the second. Thanks to the weirdness index, given by the division between the relative frequency within the first corpus by that within the second, it is possible to understand how much a certain word is typical of a certain corpus. ​

tesiOggigiorno, i social media sono il mezzo di comunicazione più potente e diffuso che esista tra giovani e adulti. Da più di un decennio, hanno conquistato i cuori di tutte le popolazioni abbastanza civilizzate da permettersi l’uso di Internet e di un telefono cellulare, e ipnotizzato le loro menti, tanto da farsi considerare indispensabili, a tratti vitali. Tuttavia, è bene non fidarsi sempre di ciò che ivi ci viene mostrato. Attraverso questa tesi di laurea magistrale, intendo discorrere circa la differenza tra profili social veri, fake e manipolati da bots, e sulla costante presenza di bufale all’interno dei vari network: la rete è quel luogo in cui è molto facile fingersi qualcun altro o scrivere e condividere ciò che si vuole. Parlerò, inizialmente, di fake identities, vale a dire profili social cui è associato un nickname di fantasia e una o più immagini appartenenti a un secondo individuo, spesso accompagnate da descrizioni degradanti o fuorvianti. In particolar modo, risponderò alle domande: quali sono le motivazioni per cui alcuni individui generano fake accounts? Quali le caratteristiche di tali? Che accorgimenti avere nel momento in cui si vuole smascherare un profilo sospetto? Successivamente, discuterò sui bot, abbreviazione di “robot”, una parola che deriva dal ceco “robota” ovvero “schiavo”. Il termine fu creato nel 1920 dallo scrittore Karel Cˇapek, proprio per andare a significare un qualcosa “a servizio” delle persone , ma oggi, per bot, s’intende, in ambito informatico, un programma che svolge compiti automatici su Internet simulando il comportamento di un utente umano, un software automatizzato progettato per svolgere alcune specifici tasks. La crescente rilevanza dei social media nella nostra vita quotidiana è stata accompagnata da sforzi per manipolare conversazioni e opinioni online, e questo è solo uno degli obiettivi dei bot. Quando accediamo alle notizie dai social media, siamo esposti a una dose giornaliera di notizie false o fuorvianti, bufale, teorie del complotto, titoli click-bait, scienza spazzatura e satira. Ci riferiamo a tali contenuti collettivamente come "disinformazione" e la sua massiccia diffusione digitale è stata identificata come un grande rischio globale. All’interno del terzo e penultimo capitolo, tratterò l’argomento delle fake news e la loro storia. La contraffazione di notizie, che può coinvolgere la distorsione manipolativa dei fatti o la totale disinformazione, viene eseguita ignorando le norme editoriali, le regole, i processi adottati per garantire conformità e verificabilità, ma, nonostante ciò, ha un potente effetto su un gran numero di persone, spesso scatenando paura o insicurezza. L’ultimo e quarto capitolo, infine, esaminerà un corpus di tweet e articoli, fornito da EVALITA per il task “The MULTI-Fake-DetectiVE”. Partendo dal dataset, i testi dotati di notizie false verranno divisi da quelli privi di tali in due subset diversi, dei quali saranno individuate le parole maggiormente ricorrenti secondo un programma Python creato appositamente. Data la lista dei ventiquattro vocaboli con un numero di frequenza assoluta più alto all’interno di quel dataset, verrà calcolata la frequenza relativa dei termini che compaiono in tutte e due le liste, in rapporto a entrambi i corpora, e i due indici di weirdness (“weirdness_fakenews” e “weirdness_realnews”), uno circa il primo subset e uno circa il secondo. Grazie all’indice di weirdness, dato dalla divisione tra la frequenza relativa all’i

FAKE PROFILES, BOTS E FAKE NEWS SUI SOCIAL MEDIA: ANALISI DI CORPORA CONTENENTI NOTIZIE FALSE E NOTIZIE VERE

ALBANESE, STEFANIA
2022/2023

Abstract

tesiOggigiorno, i social media sono il mezzo di comunicazione più potente e diffuso che esista tra giovani e adulti. Da più di un decennio, hanno conquistato i cuori di tutte le popolazioni abbastanza civilizzate da permettersi l’uso di Internet e di un telefono cellulare, e ipnotizzato le loro menti, tanto da farsi considerare indispensabili, a tratti vitali. Tuttavia, è bene non fidarsi sempre di ciò che ivi ci viene mostrato. Attraverso questa tesi di laurea magistrale, intendo discorrere circa la differenza tra profili social veri, fake e manipolati da bots, e sulla costante presenza di bufale all’interno dei vari network: la rete è quel luogo in cui è molto facile fingersi qualcun altro o scrivere e condividere ciò che si vuole. Parlerò, inizialmente, di fake identities, vale a dire profili social cui è associato un nickname di fantasia e una o più immagini appartenenti a un secondo individuo, spesso accompagnate da descrizioni degradanti o fuorvianti. In particolar modo, risponderò alle domande: quali sono le motivazioni per cui alcuni individui generano fake accounts? Quali le caratteristiche di tali? Che accorgimenti avere nel momento in cui si vuole smascherare un profilo sospetto? Successivamente, discuterò sui bot, abbreviazione di “robot”, una parola che deriva dal ceco “robota” ovvero “schiavo”. Il termine fu creato nel 1920 dallo scrittore Karel Cˇapek, proprio per andare a significare un qualcosa “a servizio” delle persone , ma oggi, per bot, s’intende, in ambito informatico, un programma che svolge compiti automatici su Internet simulando il comportamento di un utente umano, un software automatizzato progettato per svolgere alcune specifici tasks. La crescente rilevanza dei social media nella nostra vita quotidiana è stata accompagnata da sforzi per manipolare conversazioni e opinioni online, e questo è solo uno degli obiettivi dei bot. Quando accediamo alle notizie dai social media, siamo esposti a una dose giornaliera di notizie false o fuorvianti, bufale, teorie del complotto, titoli click-bait, scienza spazzatura e satira. Ci riferiamo a tali contenuti collettivamente come "disinformazione" e la sua massiccia diffusione digitale è stata identificata come un grande rischio globale. All’interno del terzo e penultimo capitolo, tratterò l’argomento delle fake news e la loro storia. La contraffazione di notizie, che può coinvolgere la distorsione manipolativa dei fatti o la totale disinformazione, viene eseguita ignorando le norme editoriali, le regole, i processi adottati per garantire conformità e verificabilità, ma, nonostante ciò, ha un potente effetto su un gran numero di persone, spesso scatenando paura o insicurezza. L’ultimo e quarto capitolo, infine, esaminerà un corpus di tweet e articoli, fornito da EVALITA per il task “The MULTI-Fake-DetectiVE”. Partendo dal dataset, i testi dotati di notizie false verranno divisi da quelli privi di tali in due subset diversi, dei quali saranno individuate le parole maggiormente ricorrenti secondo un programma Python creato appositamente. Data la lista dei ventiquattro vocaboli con un numero di frequenza assoluta più alto all’interno di quel dataset, verrà calcolata la frequenza relativa dei termini che compaiono in tutte e due le liste, in rapporto a entrambi i corpora, e i due indici di weirdness (“weirdness_fakenews” e “weirdness_realnews”), uno circa il primo subset e uno circa il secondo. Grazie all’indice di weirdness, dato dalla divisione tra la frequenza relativa all’i
ITA
Nowadays, social media is the most powerful and widespread mean of communication that exists among young people and adults. For more than a decade, they have won the hearts of all people civilized enough to afford the use of the Internet and a smartphone, and hypnotized their minds into being considered indispensable, even vital. However, trusting what is shown to us there is not always a good idea. Through this master's degree thesis, I want to deal with the difference between real, fake and bot-manipulated social profiles, and the constant presence of hoaxes within the various networks: the network is that place where it is very easy to pretend to be someone else or write and share what you want. Initially, I will talk about fake identities, i.e. social profiles associated with a fictional nickname and one or more images belonging to a second individual, often accompanied by degrading or misleading descriptions. In particular, I will answer the questions: what are the reasons that bring people to generate fake accounts? What are the characteristics of these? What precautions to take when you want to unmask a suspicious profile? Next, I will discuss about bots, the short form of "robot", a word that comes from the Czech "robota" or "slave". The term was created in 1920 by the writer Karel Cˇapek, precisely to say something "at the service" of people, but today, for bot, we mean, in the computer field, a program that performs automatic tasks on the Internet by simulating the behavior of a human user, an automated software designed to perform some specific tasks. The growing relevance of social media in our daily lives has been accompanied by efforts to manipulate online conversations and opinions, and this is just one of the goals of bots. When we access news from social media, we are exposed to a daily dose of fake or misleading news, hoaxes, conspiracy theories, click-bait headlines, junk science, and satire. We refer to such content collectively as "misinformation" and its massive digital dissemination has been identified as a major global risk. Within the third and penultimate chapter, I will explain what are fake news and their history. The counterfeiting of news, which can involve manipulative distortion of facts or outright disinformation, is carried out by ignoring editorial norms, rules, processes adopted to ensure compliance and verifiability, but, despite this, it has a powerful effect on a large number of people, often triggering fear or insecurity. Finally, the last and fourth chapter will examine a corpus of tweets and articles, provided by EVALITA for the task “The MULTI-Fake-DetectiVE”. Starting from the dataset, texts containing false information will be divided from those without false information into two different subsets, of which the most recurring words will be identified according to a specially created Python program. Given the list of the twenty-four words with the highest absolute frequency number within that dataset, the relative frequency of the terms appearing in both lists will be calculated, in relation to both corpora, and the two weirdness indices ( "weirdness_fakenews" and "weirdness_realnews"), one about the first subset and one about the second. Thanks to the weirdness index, given by the division between the relative frequency within the first corpus by that within the second, it is possible to understand how much a certain word is typical of a certain corpus. ​
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
895220_tesimagistrale.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.29 MB
Formato Adobe PDF
1.29 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/50011