This thesis focuses on the study and implementation of a system in the field of Natural Language Processing, focusing on the text-to SQL task applied to the biological field. Modern deep learning techniques for solving this task will be described, with particular emphasis on the Transformer architecture. Furthermore, the database containing information about Italian microbial collections, developed within the MIRRI-IT (Microbial Resource Research Infrastructure) project, will be described. Subsequently, the datasets used for the fine-tuning of the linguistic models employed in the experimental phase will be presented, as well as the architecture of the web application, developed in Next.js, designed to allow biologists to effectively exploit the system. Finally, the obtained results and possible future improvements will be discussed.
Questa tesi si concentra sullo studio e l’implementazione di un sistema nel campo del Natural Language Processing, focalizzandosi sul task del text-to SQL applicato all’ambito biologico. Verranno descritte le moderne tecniche di deep learning per la risoluzione di questo task, con particolare enfasi sul l’architettura Transformer. Inoltre, sarà descritto il database contenente informazioni riguardanti le collezioni microbiche italiane, sviluppato all’interno del progetto MIRRI-IT (Microbial Resource Research Infrastructure). Successivamente, saranno presentati i dataset utilizzati per il fine-tuning dei modelli linguistici impiegati nella fase di sperimentazione e l’architettura dell’applicazione web, sviluppata in Next.js, progettata per consentire ai biologi di sfruttare efficacemente il sistema. Infine, verranno discussi i risultati ottenuti e i possibili miglioramenti futuri.
Leveraging deep neural networks for Text-to-SQL translation of microbial resources
METTA, MICHELE
2023/2024
Abstract
Questa tesi si concentra sullo studio e l’implementazione di un sistema nel campo del Natural Language Processing, focalizzandosi sul task del text-to SQL applicato all’ambito biologico. Verranno descritte le moderne tecniche di deep learning per la risoluzione di questo task, con particolare enfasi sul l’architettura Transformer. Inoltre, sarà descritto il database contenente informazioni riguardanti le collezioni microbiche italiane, sviluppato all’interno del progetto MIRRI-IT (Microbial Resource Research Infrastructure). Successivamente, saranno presentati i dataset utilizzati per il fine-tuning dei modelli linguistici impiegati nella fase di sperimentazione e l’architettura dell’applicazione web, sviluppata in Next.js, progettata per consentire ai biologi di sfruttare efficacemente il sistema. Infine, verranno discussi i risultati ottenuti e i possibili miglioramenti futuri.File | Dimensione | Formato | |
---|---|---|---|
tesi_Michele_Metta_completa.pdf
non disponibili
Descrizione: Questa tesi si concentra sullo studio e l’implementazione di un sistema nel campo del Natural Language Processing, focalizzandosi sul task del text-to SQL applicato all’ambito biologico.
Dimensione
4.37 MB
Formato
Adobe PDF
|
4.37 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/164329