ProSAT: un corpus italiano per l'analisi multimodale delle emozioni di post Twitter

Grazie allo sviluppo tecnologico avvenuto negli ultimi anni il tema della comunicazione tra uomo e macchina sta diventando sempre più importante; i computer infatti non hanno le capacità di comprensione del linguaggio che hanno gli esseri umani: un linguaggio ricco di ambiguità, di metafore e sentimenti. Il Natural Language Processing (NLP) è una branca dell’intelligenza artificiale nata con l’obiettivo di dare ai computer i mezzi per comprendere testi scritti e vocali. Questa disciplina ha svariati campi di applicazione, come la traduzione di testi, rispondere a comandi vocali o ancora l’analisi dei sentimenti. Quest’ultimo task è la Sentiment Analysis (SA) che si occupa di rilevare in automatico la polaritá (positivo, negativo o neutro) delle opinioni nei testi, tramite l’Emotion Detection é possibile effettuare analisi piú a grana fine della Sentiment Analysis, esplorando anche le emozioni specifiche (esempio ”Gioia”, ”Rabbia”, ”Tristezza”, etc.). Con l’adozione globale dei Social Network la Sentiment Analysis è cresciuta molto di interesse e l’applicazione alla Social TV è una delle principali. Con Social TV si intendono i programmi televisivi che hanno iniziato ad interagire con il pubblico da casa sfruttando gli hashtag nei Social. Grazie all’enorme mole di dati disponibili è possibile estrarre le opinioni e i sentimenti che gli spettatori provano nel guardare uno show televisivo. Questo elaborato tratta di tecniche di Sentiment Analysis applicate a tweet con dati testuali e multimodali relativi ad una puntata di PropagandaLive, al fine di creare un corpus annotato. La creazione può essere riassunta in tre fasi: collezione e selezione del dataset di partenza, annotazione manuale delle emozioni espresse dai dati e della relazione tra testo ed immagine ed infine analisi del corpus ottenuto. Per annotare correttamente le emozioni, i testi sono stati stati annotati facendo riferimento al modello delle emozioni di Plutchik e la relazione tra testo ed immagine è stata valutata seguendo la tassonomia semiotica utilizzata da Dan Jurasky nei suoi lavori.

ProSAT: un corpus italiano per l'analisi multimodale delle emozioni di post Twitter

LUPARIA, ANDREA

2021/2022

Abstract

Grazie allo sviluppo tecnologico avvenuto negli ultimi anni il tema della comunicazione tra uomo e macchina sta diventando sempre più importante; i computer infatti non hanno le capacità di comprensione del linguaggio che hanno gli esseri umani: un linguaggio ricco di ambiguità, di metafore e sentimenti. Il Natural Language Processing (NLP) è una branca dell’intelligenza artificiale nata con l’obiettivo di dare ai computer i mezzi per comprendere testi scritti e vocali. Questa disciplina ha svariati campi di applicazione, come la traduzione di testi, rispondere a comandi vocali o ancora l’analisi dei sentimenti. Quest’ultimo task è la Sentiment Analysis (SA) che si occupa di rilevare in automatico la polaritá (positivo, negativo o neutro) delle opinioni nei testi, tramite l’Emotion Detection é possibile effettuare analisi piú a grana fine della Sentiment Analysis, esplorando anche le emozioni specifiche (esempio ”Gioia”, ”Rabbia”, ”Tristezza”, etc.). Con l’adozione globale dei Social Network la Sentiment Analysis è cresciuta molto di interesse e l’applicazione alla Social TV è una delle principali. Con Social TV si intendono i programmi televisivi che hanno iniziato ad interagire con il pubblico da casa sfruttando gli hashtag nei Social. Grazie all’enorme mole di dati disponibili è possibile estrarre le opinioni e i sentimenti che gli spettatori provano nel guardare uno show televisivo. Questo elaborato tratta di tecniche di Sentiment Analysis applicate a tweet con dati testuali e multimodali relativi ad una puntata di PropagandaLive, al fine di creare un corpus annotato. La creazione può essere riassunta in tre fasi: collezione e selezione del dataset di partenza, annotazione manuale delle emozioni espresse dai dati e della relazione tra testo ed immagine ed infine analisi del corpus ottenuto. Per annotare correttamente le emozioni, i testi sono stati stati annotati facendo riferimento al modello delle emozioni di Plutchik e la relazione tra testo ed immagine è stata valutata seguendo la tassonomia semiotica utilizzata da Dan Jurasky nei suoi lavori.

Scheda breve

	Facoltà/Dipartimento
	
				INFORMATICA
			
	Corso di studio
	
				INFORMATICA
			
	Lingua
	
				ITA
			
	Relatrice / Relatore
	
				LAI, Mirko
PATTI, Viviana
			
	Modalità consultazione tesi
	
				IMPORT DA TESIONLINE
			
	Appare nelle tipologie:
	
				Corso di Laurea

File in questo prodotto:

File	Dimensione	Formato
916381_tesi_andrea_luparia.pdf non disponibili Tipologia: Altro materiale allegato Dimensione 1.71 MB Formato Adobe PDF	1.71 MB	Adobe PDF

Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Usare il seguente URL per citare questo documento: https://hdl.handle.net/20.500.14240/84702