In this paper there will be discussed some methodologies for automatic extraction of semantic relationships between concepts. The task has been faced using a semantic representation tool called Semagrams, a slot-filler structure for conceptual modeling. In particular, using multi-layers perceptrons, it was possible to extract semantic properties which links concepts through Semagrams slots; these new information has been inserted into the original tool to increase its dimension (both for concepts and for fillers). With the new enhanced tool it was possible to create a Seq2Seq recurrent neural network for automatic words definition based on these semantic relations. To train all these neural networks a lot of corpora has been created, corpora which can bee seen as a real Gold standard for Semagrams-based tasks; moreover best performances has been obtained using concepts embeddings obtained from pre-trained vectors such as the ones given by GloVe.​
In questo trattato verranno esposte metodologie di machine learning per lestrazione automatica di relazioni semantiche che intercorrono tra concetti. Il task è stato affrontato attraverso luso di una risorsa basata sulla rappresentazione semantica denominata Semagram, ovvero una struttura di tipo slot-filler per la modellizzazione concettuale. In particolare, tramite percettroni multi-livello si sono potute estrarre proprietà semantiche che collegano concetti attraverso slot dei Semagram; tali nuove informazioni sono state inserite nella risorsa semantica originaria per aumentarne lestensione (sia per concetti che per filler). Con la nuova risorsa potenziata è stato poi possibile allenare una rete ricorrente Seq2Seq che permettesse di creare definizioni automatiche di concetti basate su tali relazioni semantiche. Per allenare le varie reti si sono creati dei corpora ad hoc che possono essere considerati dei Gold standard per questa tipologia di task mediante Semagram e le performance migliori le si sono ottenute tramite embedding dei concetti ottenuti da vettori pre-allenati di risorse come GloVe.​
Approcci di machine learning per lestrazione automatica di relazioni semantiche mediante utilizzo di Semagram
BELLO, ENRICO
2018/2019
Abstract
In questo trattato verranno esposte metodologie di machine learning per lestrazione automatica di relazioni semantiche che intercorrono tra concetti. Il task è stato affrontato attraverso luso di una risorsa basata sulla rappresentazione semantica denominata Semagram, ovvero una struttura di tipo slot-filler per la modellizzazione concettuale. In particolare, tramite percettroni multi-livello si sono potute estrarre proprietà semantiche che collegano concetti attraverso slot dei Semagram; tali nuove informazioni sono state inserite nella risorsa semantica originaria per aumentarne lestensione (sia per concetti che per filler). Con la nuova risorsa potenziata è stato poi possibile allenare una rete ricorrente Seq2Seq che permettesse di creare definizioni automatiche di concetti basate su tali relazioni semantiche. Per allenare le varie reti si sono creati dei corpora ad hoc che possono essere considerati dei Gold standard per questa tipologia di task mediante Semagram e le performance migliori le si sono ottenute tramite embedding dei concetti ottenuti da vettori pre-allenati di risorse come GloVe.File | Dimensione | Formato | |
---|---|---|---|
787573_bello_tesimagistrale.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
1.53 MB
Formato
Adobe PDF
|
1.53 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/51257