Lexical resources are essential tools for natural language processing as they provide semantic and syntactic structures that support a wide range of applications, from semantic disambiguation to machine translation. In this context, VerbAtlas and VerbAligNet represent key tools for verb analysis. VerbAtlas is a resource that offers a detailed representation of English verbs through prototypical semantic frames that capture the basic meaning of a verb and its possible semantic roles, while VerbAligNet focuses on multilingual verb alignment, encoding alignments between English verbs and their counterparts in Italian and German. This thesis explores the integration and enhancement of lexical-semantic resources, with the aim of enriching the usability and informativeness of VerbAlignNet. The work is divided into two main parts: the first addresses the mapping between the verbal attributes of VerbAlignNet and the selectional preferences-specializations of semantic roles-defined in VerbAtlas, using other lexical resources such as WordNet and VerbNet. This process aims to establish a more precise connection between verbs and semantic roles in different linguistic contexts. In the second part, the thesis focuses on calculating the co-occurrence frequencies between subjects and objects found in VerbAligNet. Using a corpus provided by SketchEngine, this analysis of subject-verb-object co-occurrences improves the understanding of the syntactic-semantic dynamics of verbs. The results contribute to better integration of existing resources and aim to improve applications in NLP, facilitating the use of VerbAligNet in complex linguistic contexts.

Le risorse lessicali sono strumenti fondamentali per l'elaborazione del linguaggio naturale poiché forniscono strutture semantiche e sintattiche che supportano una vasta gamma di applicazioni, dalla disambiguazione semantica alla traduzione automatica. In questo contesto, VerbAtlas e VerbAligNet rappresentano strumenti chiave per l'analisi verbale. VerbAtlas è una risorsa che fornisce una rappresentazione dettagliata di verbi inglesi attraverso frame semantici prototipici che catturano il significato di base di un verbo e i suoi possibili ruoli semantici, mentre VerbAligNet si focalizza sull’allineamento verbale multilingue, codificando allineamenti tra verbi in inglese e i loro corrispondenti in italiano e tedesco. Questa tesi esplora l'integrazione e il miglioramento delle risorse lessico-semantiche, con l'obiettivo di arricchire la fruibilità e l'informatività di VerbAlignNet. Il lavoro si articola in due parti principali: nella prima viene affrontato il mapping tra gli attributi verbali di VerbAlignNet e le selectional preferences, delle specializzazioni di ruoli semantici, definite in VerbAtlas, utilizzando altre risorse lessicali, tra cui WordNet e VerbNet. Questo processo mira a stabilire una connessione più precisa tra verbi e ruoli semantici in diversi contesti linguistici. Nella seconda parte, la tesi si concentra sul calcolo delle frequenze di co-occorrenza tra soggetti e oggetti presenti all'interno di VerbAligNet. Attraverso l'utilizzo di un corpus fornito da SketchEngine, questa analisi delle co-occorrenze soggetto-verbo-oggetto migliora la comprensione delle dinamiche sintattico-semantiche dei verbi. I risultati ottenuti contribuiscono a una maggiore integrazione delle risorse esistenti e hanno l'obbiettivo di migliorare le applicazioni nell'NLP, facilitando l'uso di VerbAligNet in contesti linguistici complessi.

Integrazione di risorse lessico-semantiche e selezione preferenziale di argomenti verbali

LUCIANI, FABIO
2023/2024

Abstract

Le risorse lessicali sono strumenti fondamentali per l'elaborazione del linguaggio naturale poiché forniscono strutture semantiche e sintattiche che supportano una vasta gamma di applicazioni, dalla disambiguazione semantica alla traduzione automatica. In questo contesto, VerbAtlas e VerbAligNet rappresentano strumenti chiave per l'analisi verbale. VerbAtlas è una risorsa che fornisce una rappresentazione dettagliata di verbi inglesi attraverso frame semantici prototipici che catturano il significato di base di un verbo e i suoi possibili ruoli semantici, mentre VerbAligNet si focalizza sull’allineamento verbale multilingue, codificando allineamenti tra verbi in inglese e i loro corrispondenti in italiano e tedesco. Questa tesi esplora l'integrazione e il miglioramento delle risorse lessico-semantiche, con l'obiettivo di arricchire la fruibilità e l'informatività di VerbAlignNet. Il lavoro si articola in due parti principali: nella prima viene affrontato il mapping tra gli attributi verbali di VerbAlignNet e le selectional preferences, delle specializzazioni di ruoli semantici, definite in VerbAtlas, utilizzando altre risorse lessicali, tra cui WordNet e VerbNet. Questo processo mira a stabilire una connessione più precisa tra verbi e ruoli semantici in diversi contesti linguistici. Nella seconda parte, la tesi si concentra sul calcolo delle frequenze di co-occorrenza tra soggetti e oggetti presenti all'interno di VerbAligNet. Attraverso l'utilizzo di un corpus fornito da SketchEngine, questa analisi delle co-occorrenze soggetto-verbo-oggetto migliora la comprensione delle dinamiche sintattico-semantiche dei verbi. I risultati ottenuti contribuiscono a una maggiore integrazione delle risorse esistenti e hanno l'obbiettivo di migliorare le applicazioni nell'NLP, facilitando l'uso di VerbAligNet in contesti linguistici complessi.
Integration of lexical-semantic resources and preferential selection of verbal arguments
Lexical resources are essential tools for natural language processing as they provide semantic and syntactic structures that support a wide range of applications, from semantic disambiguation to machine translation. In this context, VerbAtlas and VerbAligNet represent key tools for verb analysis. VerbAtlas is a resource that offers a detailed representation of English verbs through prototypical semantic frames that capture the basic meaning of a verb and its possible semantic roles, while VerbAligNet focuses on multilingual verb alignment, encoding alignments between English verbs and their counterparts in Italian and German. This thesis explores the integration and enhancement of lexical-semantic resources, with the aim of enriching the usability and informativeness of VerbAlignNet. The work is divided into two main parts: the first addresses the mapping between the verbal attributes of VerbAlignNet and the selectional preferences-specializations of semantic roles-defined in VerbAtlas, using other lexical resources such as WordNet and VerbNet. This process aims to establish a more precise connection between verbs and semantic roles in different linguistic contexts. In the second part, the thesis focuses on calculating the co-occurrence frequencies between subjects and objects found in VerbAligNet. Using a corpus provided by SketchEngine, this analysis of subject-verb-object co-occurrences improves the understanding of the syntactic-semantic dynamics of verbs. The results contribute to better integration of existing resources and aim to improve applications in NLP, facilitating the use of VerbAligNet in complex linguistic contexts.
POZZATO, GIAN LUCA
Autorizzo consultazione esterna dell'elaborato
File in questo prodotto:
File Dimensione Formato  
tesi_magistrale_Luciani.pdf

non disponibili

Dimensione 1.72 MB
Formato Adobe PDF
1.72 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/8711