La tesi propone un’analisi del tema della disparità di genere nel mondo del lavoro tramite una prospettiva derivata dalla stance detection: cioè la rilevazione automatica della posizione dell’autore di un testo rispetto al target individuato. Il task è una delle modalità di applicazione del Natural Language Processing (o NLP), a cui è dedicato il primo capitolo. Si tratta di un campo di ricerca interdisciplinare il cui scopo è quello di analizzare, interpretare e quindi comprendere il linguaggio naturale. Come riportato dal Global Gender Gap Report 2022 la problematica del gender gap è estremamente attuale e non ancora conclusa: se i progressi verso la parità di genere procederanno allo stesso ritmo degli ultimi anni, il divario globale di genere sarà concluso tra 132 anni. A questo tema è dedicato il secondo capitolo, il quale offre una panoramica generale sull’argomento e ripercorre le tappe fondamentali che hanno portato all’acquisizione di maggiori diritti in merito. Nell’ambito del Natural Language Processing, i corpora vengono utilizzati per addestrare modelli basati su algoritmi di apprendimento supervisionato e per valutare l’efficacia di sistemi basati sull’apprendimento non supervisionato. Per questo motivo, nella parte di analisi, si descrive la creazione di un dataset di 500 tweet in lingua italiana etichettati da 4 annotatori, al fine di creare un corpus annotato sull’argomento. Nel capitolo 3 viene spiegato perché è stato scelto il social network Twitter come bacino dati e come è avvenuta la raccolta di questi ultimi grazie alle API di Twitter, tramite script nel linguaggio di programmazione Python. L’ultimo capitolo di questa tesi è dedicato al processo di annotazione; è stata calcolata l’affidabilità del corpus annotato utilizzando i coefficienti di Inter-Annotator Agreement. Infine, si discutono i risultati ottenuti e si traggono le conclusioni.

Stance detection: “disparità di genere nel mondo del lavoro”

PICCO, ALICE
2021/2022

Abstract

La tesi propone un’analisi del tema della disparità di genere nel mondo del lavoro tramite una prospettiva derivata dalla stance detection: cioè la rilevazione automatica della posizione dell’autore di un testo rispetto al target individuato. Il task è una delle modalità di applicazione del Natural Language Processing (o NLP), a cui è dedicato il primo capitolo. Si tratta di un campo di ricerca interdisciplinare il cui scopo è quello di analizzare, interpretare e quindi comprendere il linguaggio naturale. Come riportato dal Global Gender Gap Report 2022 la problematica del gender gap è estremamente attuale e non ancora conclusa: se i progressi verso la parità di genere procederanno allo stesso ritmo degli ultimi anni, il divario globale di genere sarà concluso tra 132 anni. A questo tema è dedicato il secondo capitolo, il quale offre una panoramica generale sull’argomento e ripercorre le tappe fondamentali che hanno portato all’acquisizione di maggiori diritti in merito. Nell’ambito del Natural Language Processing, i corpora vengono utilizzati per addestrare modelli basati su algoritmi di apprendimento supervisionato e per valutare l’efficacia di sistemi basati sull’apprendimento non supervisionato. Per questo motivo, nella parte di analisi, si descrive la creazione di un dataset di 500 tweet in lingua italiana etichettati da 4 annotatori, al fine di creare un corpus annotato sull’argomento. Nel capitolo 3 viene spiegato perché è stato scelto il social network Twitter come bacino dati e come è avvenuta la raccolta di questi ultimi grazie alle API di Twitter, tramite script nel linguaggio di programmazione Python. L’ultimo capitolo di questa tesi è dedicato al processo di annotazione; è stata calcolata l’affidabilità del corpus annotato utilizzando i coefficienti di Inter-Annotator Agreement. Infine, si discutono i risultati ottenuti e si traggono le conclusioni.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
920323_tesi_completa1.docx.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.2 MB
Formato Adobe PDF
1.2 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/138144