Natural language processing and more specifically Author Profiling are very present in everyday life. The goal of this research thesis is to show the entire path taken, to train an automatic model to the Task of profiling an author of a text. Given the complexity of the task, the focus fell on the prediction of its genre. The TAG-it Task (Cimino et al., 2020) (Basile et al.,2020) was essential for its drafting and implementation (Basile et al.,2020), from which it was possible to derive the dataset to train the prediction model and obtain results to be compared with the participants of the event organized by Evalita in 2020 (Basile et al., 2020) (Cimino et al., 2020) (Evalita, 2022). The thesis is divided into four chapters through which excellent results were highlighted in the area of gender prediction through text analysis. The outcomes were finally included in the concluding section of the paper.
L'elaborazione del linguaggio naturale e più precisamente l'Author Profiling sono molto presenti nella vita di tutti i giorni. L’obiettivo di questa tesi di ricerca è quello di mostrare l’intero percorso effettuato, per addestrare un modello automatico al Task di profilazione di un autore di un testo. Data la complessità del compito, il focus è ricaduto sulla predizione del suo genere. Per la sua stesura e la sua messa in pratica è stato essenziale il Task TAG-it (Cimino et al., 2020) (Basile et al.,2020), dal quale è stato possibile trarre il dataset per allenare il modello di predizione e ottenere risultati da confrontare con i partecipanti all’evento organizzato da Evalita nel 2020 (Basile et al., 2020) (Cimino et al., 2020) (Evalita, 2022). La tesi è suddivisa in quattro capitoli attraverso i quali sono stati messi in luce ottimi risultati nell’ambito della predizione di genere attraverso l’analisi di testi. Gli esiti sono stati infine inseriti nella sezione conclusiva dell'elaborato.
Impiego di tecniche di NLP per la profilazione automatica del genere degli autori di messaggi testuali.
SPOSATO, FABIO
2021/2022
Abstract
L'elaborazione del linguaggio naturale e più precisamente l'Author Profiling sono molto presenti nella vita di tutti i giorni. L’obiettivo di questa tesi di ricerca è quello di mostrare l’intero percorso effettuato, per addestrare un modello automatico al Task di profilazione di un autore di un testo. Data la complessità del compito, il focus è ricaduto sulla predizione del suo genere. Per la sua stesura e la sua messa in pratica è stato essenziale il Task TAG-it (Cimino et al., 2020) (Basile et al.,2020), dal quale è stato possibile trarre il dataset per allenare il modello di predizione e ottenere risultati da confrontare con i partecipanti all’evento organizzato da Evalita nel 2020 (Basile et al., 2020) (Cimino et al., 2020) (Evalita, 2022). La tesi è suddivisa in quattro capitoli attraverso i quali sono stati messi in luce ottimi risultati nell’ambito della predizione di genere attraverso l’analisi di testi. Gli esiti sono stati infine inseriti nella sezione conclusiva dell'elaborato.File | Dimensione | Formato | |
---|---|---|---|
919871_tesisposato919871.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
780.11 kB
Formato
Adobe PDF
|
780.11 kB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/137901