La mia dissertazione si propone di studiare il fenomeno dell'anafora nella teoria linguistica e approfondire la sua trattazione in campo computazionale. L'obiettivo finale del lavoro è lo sviluppo di un sistema informatico che sia in grado di risolvere in modo automatico le relazioni anaforiche nei testi. La risoluzione automatica dell'anafora è un argomento all'avanguardia nel panorama del Natural Language Processing, disciplina che si occupa dell'elaborazione computazionale del linguaggio naturale, ed è una questione dibattuta in particolare nel settore denominato Coreference Resolution. Riuscire a risolvere le relazioni anaforiche nei testi, cioè rintracciare il corretto antecedente di un'espressione anaforica, e per di più riuscirvi con un sistema che sia in grado di farlo in modo automatico, è una sfida ambiziosa. Molte sono infatti le diverse manifestazioni del fenomeno nella lingua, spesso ambigue, di difficile risoluzione anche per gli esseri umani. Tentare un approccio automatico significa cercare un modo per gestire tali ambiguità e risolverle. Passo fondamentale da compiere prima di tentare una trattazione computazionale del fenomeno è avere la giusta base di conoscenze linguistiche necessarie a sapere come gestirlo ed approcciarsi ad esso. Per questo motivo il mio lavoro inizia esaminando l'anafora e le sue manifestazioni nella teoria linguistica e prosegue solo in seguito descrivendo le ricerche e la trattazione del fenomeno nel NLP. Una volta poste le basi teoriche, linguistiche e computazionali, dell'anafora, verranno descritte la progettazione, lo sviluppo e la sperimentazione di un sistema a regole per la risoluzione automatica dell'anafora, testato su un corpus di articoli tratti dall'enciclopedia online Wikipedia. Pur trattando un numero limitato di casi (ma comunque adeguato rispetto alla sperimentazione del sistema), i risultati sono molto incoraggianti e lasciano spazio a interessanti sviluppi futuri, con alcuni problemi aperti ancora da affrontare.
L'anafora: dall'analisi linguistica alla trattazione computazionale. Sviluppo di un sistema a regole per la risoluzione automatica.
MARCHIONI, ELEONORA
2012/2013
Abstract
La mia dissertazione si propone di studiare il fenomeno dell'anafora nella teoria linguistica e approfondire la sua trattazione in campo computazionale. L'obiettivo finale del lavoro è lo sviluppo di un sistema informatico che sia in grado di risolvere in modo automatico le relazioni anaforiche nei testi. La risoluzione automatica dell'anafora è un argomento all'avanguardia nel panorama del Natural Language Processing, disciplina che si occupa dell'elaborazione computazionale del linguaggio naturale, ed è una questione dibattuta in particolare nel settore denominato Coreference Resolution. Riuscire a risolvere le relazioni anaforiche nei testi, cioè rintracciare il corretto antecedente di un'espressione anaforica, e per di più riuscirvi con un sistema che sia in grado di farlo in modo automatico, è una sfida ambiziosa. Molte sono infatti le diverse manifestazioni del fenomeno nella lingua, spesso ambigue, di difficile risoluzione anche per gli esseri umani. Tentare un approccio automatico significa cercare un modo per gestire tali ambiguità e risolverle. Passo fondamentale da compiere prima di tentare una trattazione computazionale del fenomeno è avere la giusta base di conoscenze linguistiche necessarie a sapere come gestirlo ed approcciarsi ad esso. Per questo motivo il mio lavoro inizia esaminando l'anafora e le sue manifestazioni nella teoria linguistica e prosegue solo in seguito descrivendo le ricerche e la trattazione del fenomeno nel NLP. Una volta poste le basi teoriche, linguistiche e computazionali, dell'anafora, verranno descritte la progettazione, lo sviluppo e la sperimentazione di un sistema a regole per la risoluzione automatica dell'anafora, testato su un corpus di articoli tratti dall'enciclopedia online Wikipedia. Pur trattando un numero limitato di casi (ma comunque adeguato rispetto alla sperimentazione del sistema), i risultati sono molto incoraggianti e lasciano spazio a interessanti sviluppi futuri, con alcuni problemi aperti ancora da affrontare.File | Dimensione | Formato | |
---|---|---|---|
327457_tesi_eleonoramarchioni_anafora.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
3.32 MB
Formato
Adobe PDF
|
3.32 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/58679