In recent years, chatbots have taken on a growing role across various sectors, from customer support to virtual assistance, becoming key tools for automating interactions with users. Designed to simulate human conversations, chatbots leverage advanced deep learning models and NLP techniques to understand and generate coherent responses across different contexts. This thesis aims to explore various aspects of chatbots, including the creation and evolution process, the transition from retrieval-based to generative chatbots, and a detailed analysis of their design and operation. The focus is on the composition and functionality of the Seq2Seq model and on the thesis project analysis. The Seq2Seq model, based on an encoder-decoder structure, utilizes recurrent neural networks (RNNs) to provide a setup suitable for generating responses that maintain coherence and context. Additionally, it employs the attention mechanism, which allows it to handle longer input data sequences. The analysis of the design process carried out in this thesis project highlights how the Seq2Seq model serves as a solid foundation for chatbot development. However, the study concludes that, while offering a good starting point, the Seq2Seq model requires significant computational resources and extensive datasets to achieve optimal results, making its application challenging. The study also discusses the use of pre-trained models like BERT and DialoGPT, which may offer effective solutions to reduce computational costs and enhance dialogue capabilities. Integrating these models would allow for a system already trained on large amounts of textual data, thus optimizing development time and improving the chatbot’s adaptability to complex and varied contexts.
Negli ultimi anni, le chatbot hanno assunto un ruolo crescente in diversi settori, dall’assistenza clienti al supporto virtuale, diventando strumenti chiave per automatizzare le interazioni con gli utenti. Progettate per simulare conversazioni umane, le chatbot si avvalgono di modelli di deep learning avanzati e tecniche NLP per comprendere e generare risposte coerenti in vari contesti. Questa tesi si pone l’obiettivo di esplorarne le varie sfumature, come il processo di creazione e di evoluzione ed il passaggio da chatbot retrieval a chatbot generativa, addentrandosi successivamente nel funzionamento e nel processo di progettazione, concentrandosi infine sulla composizione e sul funzionamento del modello Seq2Seq e sull’analisi del progetto di tesi. Il modello Seq2Seq, composto da una struttura encoder-decoder, sfrutta le reti neurali ricorrenti (RNN) per fornire una configurazione adatta alla generazione di risposte che mantengano coerenza e contesto, aiutandosi inoltre con il meccanismo d’attenzione, che gli permette di gestire sequenze di dati in input più lunghe. L'analisi del processo di progettazione, svolta all'interno di questo progetto di tesi, evidenzia come il modello Seq2Seq rappresenti una base solida per lo sviluppo di chatbot. Tuttavia, lo studio conclude che, pur offrendo un buon punto di partenza, il modello Seq2Seq richiede elevate risorse computazionali e dataset estesi per garantire risultati ottimali, rendendo complicata la sua applicazione. Viene inoltre discusso l'uso di modelli pre-addestrati come BERT e DialoGPT, che potrebbero rappresentare soluzioni efficaci per ridurre i costi computazionali e migliorare le capacità dialogiche. L'integrazione di questi modelli consentirebbe infatti di partire da un sistema già addestrato su ampie quantità di dati testuali, ottimizzando il tempo di sviluppo e migliorando l’adattabilità della chatbot a contesti complessi e variegati.
Chatbot ed Intelligenza Artificiale: Applicazione del Modello Seq2Seq per la progettazione di una chatbot
MAZZOGLIO, ALESSANDRO
2023/2024
Abstract
Negli ultimi anni, le chatbot hanno assunto un ruolo crescente in diversi settori, dall’assistenza clienti al supporto virtuale, diventando strumenti chiave per automatizzare le interazioni con gli utenti. Progettate per simulare conversazioni umane, le chatbot si avvalgono di modelli di deep learning avanzati e tecniche NLP per comprendere e generare risposte coerenti in vari contesti. Questa tesi si pone l’obiettivo di esplorarne le varie sfumature, come il processo di creazione e di evoluzione ed il passaggio da chatbot retrieval a chatbot generativa, addentrandosi successivamente nel funzionamento e nel processo di progettazione, concentrandosi infine sulla composizione e sul funzionamento del modello Seq2Seq e sull’analisi del progetto di tesi. Il modello Seq2Seq, composto da una struttura encoder-decoder, sfrutta le reti neurali ricorrenti (RNN) per fornire una configurazione adatta alla generazione di risposte che mantengano coerenza e contesto, aiutandosi inoltre con il meccanismo d’attenzione, che gli permette di gestire sequenze di dati in input più lunghe. L'analisi del processo di progettazione, svolta all'interno di questo progetto di tesi, evidenzia come il modello Seq2Seq rappresenti una base solida per lo sviluppo di chatbot. Tuttavia, lo studio conclude che, pur offrendo un buon punto di partenza, il modello Seq2Seq richiede elevate risorse computazionali e dataset estesi per garantire risultati ottimali, rendendo complicata la sua applicazione. Viene inoltre discusso l'uso di modelli pre-addestrati come BERT e DialoGPT, che potrebbero rappresentare soluzioni efficaci per ridurre i costi computazionali e migliorare le capacità dialogiche. L'integrazione di questi modelli consentirebbe infatti di partire da un sistema già addestrato su ampie quantità di dati testuali, ottimizzando il tempo di sviluppo e migliorando l’adattabilità della chatbot a contesti complessi e variegati.File | Dimensione | Formato | |
---|---|---|---|
TesiMazzoglio.pdf
non disponibili
Dimensione
1.32 MB
Formato
Adobe PDF
|
1.32 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/5248