Grazie allo sviluppo tecnologico avvenuto negli ultimi anni il tema della comunicazione tra uomo e macchina sta diventando sempre più importante; i computer infatti non hanno le capacità di comprensione del linguaggio che hanno gli esseri umani: un linguaggio ricco di ambiguità, di metafore e sentimenti. Il Natural Language Processing (NLP) è una branca dell’intelligenza artificiale nata con l’obiettivo di dare ai computer i mezzi per comprendere testi scritti e vocali. Questa disciplina ha svariati campi di applicazione, come la traduzione di testi, rispondere a comandi vocali o ancora l’analisi dei sentimenti. Quest’ultimo task è la Sentiment Analysis (SA) che si occupa di rilevare in automatico la polaritá (positivo, negativo o neutro) delle opinioni nei testi, tramite l’Emotion Detection é possibile effettuare analisi piú a grana fine della Sentiment Analysis, esplorando anche le emozioni specifiche (esempio ”Gioia”, ”Rabbia”, ”Tristezza”, etc.). Con l’adozione globale dei Social Network la Sentiment Analysis è cresciuta molto di interesse e l’applicazione alla Social TV è una delle principali. Con Social TV si intendono i programmi televisivi che hanno iniziato ad interagire con il pubblico da casa sfruttando gli hashtag nei Social. Grazie all’enorme mole di dati disponibili è possibile estrarre le opinioni e i sentimenti che gli spettatori provano nel guardare uno show televisivo. Questo elaborato tratta di tecniche di Sentiment Analysis applicate a tweet con dati testuali e multimodali relativi ad una puntata di PropagandaLive, al fine di creare un corpus annotato. La creazione può essere riassunta in tre fasi: collezione e selezione del dataset di partenza, annotazione manuale delle emozioni espresse dai dati e della relazione tra testo ed immagine ed infine analisi del corpus ottenuto. Per annotare correttamente le emozioni, i testi sono stati stati annotati facendo riferimento al modello delle emozioni di Plutchik e la relazione tra testo ed immagine è stata valutata seguendo la tassonomia semiotica utilizzata da Dan Jurasky nei suoi lavori.
ProSAT: un corpus italiano per l'analisi multimodale delle emozioni di post Twitter
LUPARIA, ANDREA
2021/2022
Abstract
Grazie allo sviluppo tecnologico avvenuto negli ultimi anni il tema della comunicazione tra uomo e macchina sta diventando sempre più importante; i computer infatti non hanno le capacità di comprensione del linguaggio che hanno gli esseri umani: un linguaggio ricco di ambiguità, di metafore e sentimenti. Il Natural Language Processing (NLP) è una branca dell’intelligenza artificiale nata con l’obiettivo di dare ai computer i mezzi per comprendere testi scritti e vocali. Questa disciplina ha svariati campi di applicazione, come la traduzione di testi, rispondere a comandi vocali o ancora l’analisi dei sentimenti. Quest’ultimo task è la Sentiment Analysis (SA) che si occupa di rilevare in automatico la polaritá (positivo, negativo o neutro) delle opinioni nei testi, tramite l’Emotion Detection é possibile effettuare analisi piú a grana fine della Sentiment Analysis, esplorando anche le emozioni specifiche (esempio ”Gioia”, ”Rabbia”, ”Tristezza”, etc.). Con l’adozione globale dei Social Network la Sentiment Analysis è cresciuta molto di interesse e l’applicazione alla Social TV è una delle principali. Con Social TV si intendono i programmi televisivi che hanno iniziato ad interagire con il pubblico da casa sfruttando gli hashtag nei Social. Grazie all’enorme mole di dati disponibili è possibile estrarre le opinioni e i sentimenti che gli spettatori provano nel guardare uno show televisivo. Questo elaborato tratta di tecniche di Sentiment Analysis applicate a tweet con dati testuali e multimodali relativi ad una puntata di PropagandaLive, al fine di creare un corpus annotato. La creazione può essere riassunta in tre fasi: collezione e selezione del dataset di partenza, annotazione manuale delle emozioni espresse dai dati e della relazione tra testo ed immagine ed infine analisi del corpus ottenuto. Per annotare correttamente le emozioni, i testi sono stati stati annotati facendo riferimento al modello delle emozioni di Plutchik e la relazione tra testo ed immagine è stata valutata seguendo la tassonomia semiotica utilizzata da Dan Jurasky nei suoi lavori.File | Dimensione | Formato | |
---|---|---|---|
916381_tesi_andrea_luparia.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
1.71 MB
Formato
Adobe PDF
|
1.71 MB | Adobe PDF |
Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/84702