Grazie allo sviluppo tecnologico avvenuto negli ultimi anni il tema della comunicazione tra uomo e macchina sta diventando sempre più importante; i computer infatti non hanno le capacità di comprensione del linguaggio che hanno gli esseri umani: un linguaggio ricco di ambiguità, di metafore e sentimenti. Il Natural Language Processing (NLP) è una branca dell’intelligenza artificiale nata con l’obiettivo di dare ai computer i mezzi per comprendere testi scritti e vocali. Questa disciplina ha svariati campi di applicazione, come la traduzione di testi, rispondere a comandi vocali o ancora l’analisi dei sentimenti. Quest’ultimo task è la Sentiment Analysis (SA) che si occupa di rilevare in automatico la polaritá (positivo, negativo o neutro) delle opinioni nei testi, tramite l’Emotion Detection é possibile effettuare analisi piú a grana fine della Sentiment Analysis, esplorando anche le emozioni specifiche (esempio ”Gioia”, ”Rabbia”, ”Tristezza”, etc.). Con l’adozione globale dei Social Network la Sentiment Analysis è cresciuta molto di interesse e l’applicazione alla Social TV è una delle principali. Con Social TV si intendono i programmi televisivi che hanno iniziato ad interagire con il pubblico da casa sfruttando gli hashtag nei Social. Grazie all’enorme mole di dati disponibili è possibile estrarre le opinioni e i sentimenti che gli spettatori provano nel guardare uno show televisivo. Questo elaborato tratta di tecniche di Sentiment Analysis applicate a tweet con dati testuali e multimodali relativi ad una puntata di PropagandaLive, al fine di creare un corpus annotato. La creazione può essere riassunta in tre fasi: collezione e selezione del dataset di partenza, annotazione manuale delle emozioni espresse dai dati e della relazione tra testo ed immagine ed infine analisi del corpus ottenuto. Per annotare correttamente le emozioni, i testi sono stati stati annotati facendo riferimento al modello delle emozioni di Plutchik e la relazione tra testo ed immagine è stata valutata seguendo la tassonomia semiotica utilizzata da Dan Jurasky nei suoi lavori.

ProSAT: un corpus italiano per l'analisi multimodale delle emozioni di post Twitter

LUPARIA, ANDREA
2021/2022

Abstract

Grazie allo sviluppo tecnologico avvenuto negli ultimi anni il tema della comunicazione tra uomo e macchina sta diventando sempre più importante; i computer infatti non hanno le capacità di comprensione del linguaggio che hanno gli esseri umani: un linguaggio ricco di ambiguità, di metafore e sentimenti. Il Natural Language Processing (NLP) è una branca dell’intelligenza artificiale nata con l’obiettivo di dare ai computer i mezzi per comprendere testi scritti e vocali. Questa disciplina ha svariati campi di applicazione, come la traduzione di testi, rispondere a comandi vocali o ancora l’analisi dei sentimenti. Quest’ultimo task è la Sentiment Analysis (SA) che si occupa di rilevare in automatico la polaritá (positivo, negativo o neutro) delle opinioni nei testi, tramite l’Emotion Detection é possibile effettuare analisi piú a grana fine della Sentiment Analysis, esplorando anche le emozioni specifiche (esempio ”Gioia”, ”Rabbia”, ”Tristezza”, etc.). Con l’adozione globale dei Social Network la Sentiment Analysis è cresciuta molto di interesse e l’applicazione alla Social TV è una delle principali. Con Social TV si intendono i programmi televisivi che hanno iniziato ad interagire con il pubblico da casa sfruttando gli hashtag nei Social. Grazie all’enorme mole di dati disponibili è possibile estrarre le opinioni e i sentimenti che gli spettatori provano nel guardare uno show televisivo. Questo elaborato tratta di tecniche di Sentiment Analysis applicate a tweet con dati testuali e multimodali relativi ad una puntata di PropagandaLive, al fine di creare un corpus annotato. La creazione può essere riassunta in tre fasi: collezione e selezione del dataset di partenza, annotazione manuale delle emozioni espresse dai dati e della relazione tra testo ed immagine ed infine analisi del corpus ottenuto. Per annotare correttamente le emozioni, i testi sono stati stati annotati facendo riferimento al modello delle emozioni di Plutchik e la relazione tra testo ed immagine è stata valutata seguendo la tassonomia semiotica utilizzata da Dan Jurasky nei suoi lavori.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
916381_tesi_andrea_luparia.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.71 MB
Formato Adobe PDF
1.71 MB Adobe PDF

Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Usare il seguente URL per citare questo documento: https://hdl.handle.net/20.500.14240/84702