The tourism industry has undergone a profound transformation in recent years, driven by the adoption of advanced technologies aimed at enhancing the customer experience and optimizing operational efficiency. Artificial Intelligence (AI) has proven particularly promising in this context, opening new possibilities for personalized travel recommendations, simplified booking processes, and real-time traveler assistance. The development and refinement of effective AI systems largely depend on the availability of vast and diverse datasets. In this scenario, web scraping, the automated extraction of data from websites, has emerged as a crucial technique for gathering the necessary information to train and fine-tune AI models. This thesis work focused on the development and evaluation of a Retrieval-Augmented Generation (RAG) system specifically designed for tourism promotion in Piedmont, Italy. Starting from a dataset of tourist information, collected through web scraping and processed to be machine-readable, we explored the implementation of various RAG configurations, testing a range of natural language processing models and retrieval strategies to optimize system performance. Through rigorous evaluation based on relevant metrics, we assessed the system's ability to generate accurate, informative, and engaging responses to potential visitors' questions, shedding light on AI's potential to transform how we promote and experience tourism.

L'industria del turismo, negli ultimi anni, ha subito una profonda trasformazione grazie all'adozione di tecnologie avanzate, con l'obiettivo di migliorare l'esperienza del cliente e ottimizzare l'efficienza operativa. L'Intelligenza Artificiale (IA) si è rivelata particolarmente promettente in questo contesto, aprendo nuove possibilità per la personalizzazione delle raccomandazioni di viaggio, la semplificazione delle prenotazioni e l'offerta di assistenza in tempo reale ai viaggiatori. Lo sviluppo e il perfezionamento di sistemi di IA efficaci dipendono in larga misura dalla disponibilità di dataset vasti e diversificati. In questo scenario, il web scraping, ovvero l'estrazione automatizzata di dati dai siti web, è emersa come una tecnica fondamentale per raccogliere le informazioni necessarie per addestrare e affinare i modelli di IA. Questo lavoro di tesi si è concentrato sullo sviluppo e la valutazione di un sistema di Retrieval-Augmented Generation (RAG) specificamente progettato per la promozione turistica del Piemonte. Partendo da un dataset di informazioni turistiche, raccolte tramite web scraping e processate per essere machine-readable, viene esplorata l'implementazione di diverse configurazioni RAG, testando una varietà di modelli di elaborazione del linguaggio naturale e strategie di recupero per ottimizzare le prestazioni del sistema. Attraverso una rigorosa valutazione basata su metriche pertinenti, è stata valutata la capacità del sistema di generare risposte accurate, informative e coinvolgenti alle domande dei potenziali visitatori, gettando luce sul potenziale dell'IA nel trasformare il modo in cui promuoviamo e viviamo il turismo.

LLM per il Turismo Intelligente: sviluppo di un Chatbot RAG per un'Esperienza Turistica Personalizzata

IACOBELLIS, GIORGIA
2023/2024

Abstract

L'industria del turismo, negli ultimi anni, ha subito una profonda trasformazione grazie all'adozione di tecnologie avanzate, con l'obiettivo di migliorare l'esperienza del cliente e ottimizzare l'efficienza operativa. L'Intelligenza Artificiale (IA) si è rivelata particolarmente promettente in questo contesto, aprendo nuove possibilità per la personalizzazione delle raccomandazioni di viaggio, la semplificazione delle prenotazioni e l'offerta di assistenza in tempo reale ai viaggiatori. Lo sviluppo e il perfezionamento di sistemi di IA efficaci dipendono in larga misura dalla disponibilità di dataset vasti e diversificati. In questo scenario, il web scraping, ovvero l'estrazione automatizzata di dati dai siti web, è emersa come una tecnica fondamentale per raccogliere le informazioni necessarie per addestrare e affinare i modelli di IA. Questo lavoro di tesi si è concentrato sullo sviluppo e la valutazione di un sistema di Retrieval-Augmented Generation (RAG) specificamente progettato per la promozione turistica del Piemonte. Partendo da un dataset di informazioni turistiche, raccolte tramite web scraping e processate per essere machine-readable, viene esplorata l'implementazione di diverse configurazioni RAG, testando una varietà di modelli di elaborazione del linguaggio naturale e strategie di recupero per ottimizzare le prestazioni del sistema. Attraverso una rigorosa valutazione basata su metriche pertinenti, è stata valutata la capacità del sistema di generare risposte accurate, informative e coinvolgenti alle domande dei potenziali visitatori, gettando luce sul potenziale dell'IA nel trasformare il modo in cui promuoviamo e viviamo il turismo.
LLM for Smart Tourism: Developing a RAG Chatbot for a Personalized Tourist Experience
The tourism industry has undergone a profound transformation in recent years, driven by the adoption of advanced technologies aimed at enhancing the customer experience and optimizing operational efficiency. Artificial Intelligence (AI) has proven particularly promising in this context, opening new possibilities for personalized travel recommendations, simplified booking processes, and real-time traveler assistance. The development and refinement of effective AI systems largely depend on the availability of vast and diverse datasets. In this scenario, web scraping, the automated extraction of data from websites, has emerged as a crucial technique for gathering the necessary information to train and fine-tune AI models. This thesis work focused on the development and evaluation of a Retrieval-Augmented Generation (RAG) system specifically designed for tourism promotion in Piedmont, Italy. Starting from a dataset of tourist information, collected through web scraping and processed to be machine-readable, we explored the implementation of various RAG configurations, testing a range of natural language processing models and retrieval strategies to optimize system performance. Through rigorous evaluation based on relevant metrics, we assessed the system's ability to generate accurate, informative, and engaging responses to potential visitors' questions, shedding light on AI's potential to transform how we promote and experience tourism.
Autorizzo consultazione esterna dell'elaborato
File in questo prodotto:
File Dimensione Formato  
Iacobellis_Giorgia_Elaborato_Tesi.pdf

non disponibili

Dimensione 2.65 MB
Formato Adobe PDF
2.65 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/7614