In this paper there will be discussed some methodologies for automatic extraction of semantic relationships between concepts. The task has been faced using a semantic representation tool called Semagrams, a slot-filler structure for conceptual modeling. In particular, using multi-layers perceptrons, it was possible to extract semantic properties which links concepts through Semagrams slots; these new information has been inserted into the original tool to increase its dimension (both for concepts and for fillers). With the new enhanced tool it was possible to create a Seq2Seq recurrent neural network for automatic words definition based on these semantic relations. To train all these neural networks a lot of corpora has been created, corpora which can bee seen as a real Gold standard for Semagrams-based tasks; moreover best performances has been obtained using concepts embeddings obtained from pre-trained vectors such as the ones given by GloVe.​

In questo trattato verranno esposte metodologie di machine learning per lestrazione automatica di relazioni semantiche che intercorrono tra concetti. Il task è stato affrontato attraverso luso di una risorsa basata sulla rappresentazione semantica denominata Semagram, ovvero una struttura di tipo slot-filler per la modellizzazione concettuale. In particolare, tramite percettroni multi-livello si sono potute estrarre proprietà semantiche che collegano concetti attraverso slot dei Semagram; tali nuove informazioni sono state inserite nella risorsa semantica originaria per aumentarne lestensione (sia per concetti che per filler). Con la nuova risorsa potenziata è stato poi possibile allenare una rete ricorrente Seq2Seq che permettesse di creare definizioni automatiche di concetti basate su tali relazioni semantiche. Per allenare le varie reti si sono creati dei corpora ad hoc che possono essere considerati dei Gold standard per questa tipologia di task mediante Semagram e le performance migliori le si sono ottenute tramite embedding dei concetti ottenuti da vettori pre-allenati di risorse come GloVe.​

Approcci di machine learning per lestrazione automatica di relazioni semantiche mediante utilizzo di Semagram​

BELLO, ENRICO
2018/2019

Abstract

In questo trattato verranno esposte metodologie di machine learning per lestrazione automatica di relazioni semantiche che intercorrono tra concetti. Il task è stato affrontato attraverso luso di una risorsa basata sulla rappresentazione semantica denominata Semagram, ovvero una struttura di tipo slot-filler per la modellizzazione concettuale. In particolare, tramite percettroni multi-livello si sono potute estrarre proprietà semantiche che collegano concetti attraverso slot dei Semagram; tali nuove informazioni sono state inserite nella risorsa semantica originaria per aumentarne lestensione (sia per concetti che per filler). Con la nuova risorsa potenziata è stato poi possibile allenare una rete ricorrente Seq2Seq che permettesse di creare definizioni automatiche di concetti basate su tali relazioni semantiche. Per allenare le varie reti si sono creati dei corpora ad hoc che possono essere considerati dei Gold standard per questa tipologia di task mediante Semagram e le performance migliori le si sono ottenute tramite embedding dei concetti ottenuti da vettori pre-allenati di risorse come GloVe.​
ITA
In this paper there will be discussed some methodologies for automatic extraction of semantic relationships between concepts. The task has been faced using a semantic representation tool called Semagrams, a slot-filler structure for conceptual modeling. In particular, using multi-layers perceptrons, it was possible to extract semantic properties which links concepts through Semagrams slots; these new information has been inserted into the original tool to increase its dimension (both for concepts and for fillers). With the new enhanced tool it was possible to create a Seq2Seq recurrent neural network for automatic words definition based on these semantic relations. To train all these neural networks a lot of corpora has been created, corpora which can bee seen as a real Gold standard for Semagrams-based tasks; moreover best performances has been obtained using concepts embeddings obtained from pre-trained vectors such as the ones given by GloVe.​
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
787573_bello_tesimagistrale.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.53 MB
Formato Adobe PDF
1.53 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/51257