This thesis focuses on the study and implementation of a system in the field of Natural Language Processing, focusing on the text-to SQL task applied to the biological field. Modern deep learning techniques for solving this task will be described, with particular emphasis on the Transformer architecture. Furthermore, the database containing information about Italian microbial collections, developed within the MIRRI-IT (Microbial Resource Research Infrastructure) project, will be described. Subsequently, the datasets used for the fine-tuning of the linguistic models employed in the experimental phase will be presented, as well as the architecture of the web application, developed in Next.js, designed to allow biologists to effectively exploit the system. Finally, the obtained results and possible future improvements will be discussed.

Questa tesi si concentra sullo studio e l’implementazione di un sistema nel campo del Natural Language Processing, focalizzandosi sul task del text-to SQL applicato all’ambito biologico. Verranno descritte le moderne tecniche di deep learning per la risoluzione di questo task, con particolare enfasi sul l’architettura Transformer. Inoltre, sarà descritto il database contenente informazioni riguardanti le collezioni microbiche italiane, sviluppato all’interno del progetto MIRRI-IT (Microbial Resource Research Infrastructure). Successivamente, saranno presentati i dataset utilizzati per il fine-tuning dei modelli linguistici impiegati nella fase di sperimentazione e l’architettura dell’applicazione web, sviluppata in Next.js, progettata per consentire ai biologi di sfruttare efficacemente il sistema. Infine, verranno discussi i risultati ottenuti e i possibili miglioramenti futuri.

Leveraging deep neural networks for Text-to-SQL translation of microbial resources

METTA, MICHELE
2023/2024

Abstract

Questa tesi si concentra sullo studio e l’implementazione di un sistema nel campo del Natural Language Processing, focalizzandosi sul task del text-to SQL applicato all’ambito biologico. Verranno descritte le moderne tecniche di deep learning per la risoluzione di questo task, con particolare enfasi sul l’architettura Transformer. Inoltre, sarà descritto il database contenente informazioni riguardanti le collezioni microbiche italiane, sviluppato all’interno del progetto MIRRI-IT (Microbial Resource Research Infrastructure). Successivamente, saranno presentati i dataset utilizzati per il fine-tuning dei modelli linguistici impiegati nella fase di sperimentazione e l’architettura dell’applicazione web, sviluppata in Next.js, progettata per consentire ai biologi di sfruttare efficacemente il sistema. Infine, verranno discussi i risultati ottenuti e i possibili miglioramenti futuri.
Leveraging deep neural networks for Text-to-SQL translation of microbial resources
This thesis focuses on the study and implementation of a system in the field of Natural Language Processing, focusing on the text-to SQL task applied to the biological field. Modern deep learning techniques for solving this task will be described, with particular emphasis on the Transformer architecture. Furthermore, the database containing information about Italian microbial collections, developed within the MIRRI-IT (Microbial Resource Research Infrastructure) project, will be described. Subsequently, the datasets used for the fine-tuning of the linguistic models employed in the experimental phase will be presented, as well as the architecture of the web application, developed in Next.js, designed to allow biologists to effectively exploit the system. Finally, the obtained results and possible future improvements will be discussed.
Autorizzo consultazione esterna dell'elaborato
File in questo prodotto:
File Dimensione Formato  
tesi_Michele_Metta_completa.pdf

non disponibili

Descrizione: Questa tesi si concentra sullo studio e l’implementazione di un sistema nel campo del Natural Language Processing, focalizzandosi sul task del text-to SQL applicato all’ambito biologico.
Dimensione 4.37 MB
Formato Adobe PDF
4.37 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/164329