Studio delle abilità dei LLM di replicare
risorse semantiche e arricchimento automatico

I modelli del linguaggio di grandi dimensioni (Large Language Models, LLM) hanno suscitato notevole interesse in una vasta gamma di applicazioni. Questi modelli, addestrati su vasti e diversificati corpi testuali, dimostrano la capacità di apprendere schemi e relazioni linguistiche. Mediante interrogazioni, gli LLM sono in grado di generare risposte informative e coerenti con il contesto, rendendoli strumenti utili per affrontare molteplici compiti di elaborazione del linguaggio naturale (Natural Language Processing, NLP). Tra i compiti più rilevanti nell'ambito del NLP figura la rappresentazione della conoscenza, che implica l'organizzazione di informazioni estratte in una struttura specifica. Tuttavia, un ostacolo significativo è rappresentato dal tempo e dagli sforzi richiesti agli annotatori per eseguire questa operazione. In questo contesto, si propone un'analisi delle capacità degli LLM nel riprodurre la conoscenza già presente nelle basi di conoscenza. L'obiettivo è popolare automaticamente una base di conoscenza, affrontando così l'ostacolo dell'annotazione manuale. A tal fine, analizziamo l'approccio sulle risorse di Semagram, Wordnet e ConceptNet.

Studio delle abilità dei LLM di replicare risorse semantiche e arricchimento automatico

VENTRICE, LAURA

2022/2023

Abstract

I modelli del linguaggio di grandi dimensioni (Large Language Models, LLM) hanno suscitato notevole interesse in una vasta gamma di applicazioni. Questi modelli, addestrati su vasti e diversificati corpi testuali, dimostrano la capacità di apprendere schemi e relazioni linguistiche. Mediante interrogazioni, gli LLM sono in grado di generare risposte informative e coerenti con il contesto, rendendoli strumenti utili per affrontare molteplici compiti di elaborazione del linguaggio naturale (Natural Language Processing, NLP). Tra i compiti più rilevanti nell'ambito del NLP figura la rappresentazione della conoscenza, che implica l'organizzazione di informazioni estratte in una struttura specifica. Tuttavia, un ostacolo significativo è rappresentato dal tempo e dagli sforzi richiesti agli annotatori per eseguire questa operazione. In questo contesto, si propone un'analisi delle capacità degli LLM nel riprodurre la conoscenza già presente nelle basi di conoscenza. L'obiettivo è popolare automaticamente una base di conoscenza, affrontando così l'ostacolo dell'annotazione manuale. A tal fine, analizziamo l'approccio sulle risorse di Semagram, Wordnet e ConceptNet.

Scheda breve

	Facoltà/Dipartimento
	
				INFORMATICA
			
	Corso di studio
	
				INFORMATICA
			
	Lingua
	
				ITA
			
	Relatrice / Relatore
	
				DI CARO, Luigi
			
	Modalità consultazione tesi
	
				IMPORT DA TESIONLINE
			
	Appare nelle tipologie:
	
				Corso di Laurea Magistrale

File in questo prodotto:

File	Dimensione	Formato
882173_tesi_magistrale_def.pdf non disponibili Tipologia: Altro materiale allegato Dimensione 936.28 kB Formato Adobe PDF	936.28 kB	Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/144765