This thesis presents the design and implementation of a predictive model based on machine learning algorithms to estimate delivery times (ETA) in logistics industry. The main objective of the research is to improve the accuracy of delivery time predictions by analysing historical data on shipments, logistics routes and operating conditions. Through an advanced feature engineering process and the use of regression models such as Linear Regression, XGBoost and CatBoost, key factors influencing delivery times were identified, including seasonality, geography and transport methods. The development infrastructure was set up using Google Colab, which enabled large datasets to be managed with access to advanced computational resources. Of the tested models, CatBoost proved to be the best performing, outperforming the other approaches due to its ability to effectively handle the numerous categorical variables in the dataset. This result underlines the potential of machine learning techniques in the optimisation of logistics processes. The research opens up new perspectives for further future developments, including the use of deep learning algorithms and time series analysis, which could lead to even more precise and reliable solutions.
In questa tesi viene presentata la progettazione e l'implementazione di un modello predittivo basato su algoritmi di machine learning per stimare i tempi di consegna (ETA) nel settore logistico. L'obiettivo principale della ricerca è migliorare l'accuratezza delle previsioni dei tempi di consegna, analizzando dati storici relativi alle spedizioni, ai percorsi logistici e alle condizioni operative. Attraverso un processo avanzato di feature engineering e l'utilizzo di modelli di regressione come la Regressione Lineare, XGBoost e CatBoost, sono stati identificati i fattori chiave che influenzano i tempi di consegna, tra cui stagionalità, zone geografiche e metodi di trasporto. L'infrastruttura di sviluppo è stata realizzata utilizzando Google Colab, che ha permesso di gestire dataset di grandi dimensioni grazie all'accesso a risorse computazionali avanzate. Tra i modelli testati, CatBoost si è rivelato il più performante, superando gli altri approcci grazie alla sua capacità di gestire efficacemente le numerose variabili categoriche presenti nel dataset. Questo risultato sottolinea il potenziale delle tecniche di machine learning nell'ottimizzazione dei processi logistici. La ricerca apre nuove prospettive per ulteriori sviluppi futuri, tra cui l'uso di algoritmi di deep learning e l'analisi delle serie temporali, che potrebbero portare a soluzioni ancora più precise e affidabili.
Applicazione di Algoritmi di Machine Learning per la Stima dei Tempi di Consegna nei Servizi di Logistica
MORIONDO, DIEGO
2023/2024
Abstract
In questa tesi viene presentata la progettazione e l'implementazione di un modello predittivo basato su algoritmi di machine learning per stimare i tempi di consegna (ETA) nel settore logistico. L'obiettivo principale della ricerca è migliorare l'accuratezza delle previsioni dei tempi di consegna, analizzando dati storici relativi alle spedizioni, ai percorsi logistici e alle condizioni operative. Attraverso un processo avanzato di feature engineering e l'utilizzo di modelli di regressione come la Regressione Lineare, XGBoost e CatBoost, sono stati identificati i fattori chiave che influenzano i tempi di consegna, tra cui stagionalità, zone geografiche e metodi di trasporto. L'infrastruttura di sviluppo è stata realizzata utilizzando Google Colab, che ha permesso di gestire dataset di grandi dimensioni grazie all'accesso a risorse computazionali avanzate. Tra i modelli testati, CatBoost si è rivelato il più performante, superando gli altri approcci grazie alla sua capacità di gestire efficacemente le numerose variabili categoriche presenti nel dataset. Questo risultato sottolinea il potenziale delle tecniche di machine learning nell'ottimizzazione dei processi logistici. La ricerca apre nuove prospettive per ulteriori sviluppi futuri, tra cui l'uso di algoritmi di deep learning e l'analisi delle serie temporali, che potrebbero portare a soluzioni ancora più precise e affidabili.File | Dimensione | Formato | |
---|---|---|---|
Diego_Moriondo_1021766_Tesi.pdf
non disponibili
Dimensione
4.84 MB
Formato
Adobe PDF
|
4.84 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/164157