Predictive Process Monitoring (PPM) is an emerging field within Process Mining that focuses on predicting the future progression of business process traces. It provides valuable tools for operational and decision-making optimization. However, current PPM techniques primarily concentrate on forecasting future events or detecting anomalies, often overlooking crucial aspects such as the responsibilities of the actors involved. This thesis aims to extend PPM by integrating the concept of responsibility into event logs. This work presents a framework capable of computing the state of responsibilities during process execution and enabling their prediction. To achieve this goal, a system was developed to model and infer the state of responsibilities in logs using a CLIPS-based engine, which applies logical rules and residual operations to dynamically determine the evolution of responsibilities over time. This process led to the creation of enriched datasets, which were subsequently used to train machine learning-based predictive models. These models were optimized through a hyperparameter tuning strategy to achieve the best possible performance in predicting the final state of responsibilities within process traces. A key aspect of this thesis is the critical interpretation of the obtained predictive results. In particular, an in-depth analysis of the experimental results was conducted by evaluating the performance of the predictive models. By examining the most relevant and discriminative features learned by these models, it was possible to identify the factors that most influenced classification and, consequently, the key elements that determine the evolution of responsibilities in process logs. Beyond predictive results, a significant contribution of this work is the development of a structured methodology for analyzing business processes. This approach allowed for a progressive assessment of the impact of different types of information on models, identifying the most relevant attributes in determining the final outcome of a process. The validity of this work was tested on real datasets, including those from the BPI Challenge 2017 and 2020, with the objective of evaluating the effectiveness of the approach in contexts with structured process traces and different decision dynamics. The results demonstrated how the integration of responsibilities and the critical analysis of models can enhance the understanding of internal process mechanisms, highlighting the key factors that influence predictions and potential areas for improving the use of available information.
Il Predictive Process Monitoring (PPM) rappresenta un ambito emergente del Process Mining, che si concentra sull'attività di prevedere l'andamento futuro delle tracce di processi aziendali. Esso offre strumenti utili per l'ottimizzazione operativa e decisionale. Tuttavia, le attuali tecniche di PPM si concentrano maggiormente sulla previsione di eventi futuri o sul rilevamento di anomalie, trascurando aspetti cruciali come le responsabilità degli attori coinvolti. Questa tesi si propone di estendere il PPM attraverso l'integrazione del concetto di responsabilità nei log di eventi. In questo lavoro viene fornito un framework che calcola lo stato delle responsabilità durante l'esecuzione del processo e ne consente anche la predizione. Per raggiungere questo obiettivo, è stato sviluppato un sistema in grado di modellare e inferire lo stato delle responsabilità nei log tramite un motore basato su CLIPS, che applica regole logiche e operazioni di residuazione per determinare dinamicamente l'evoluzione delle responsabilità nel tempo. Questo ha permesso di creare dei dataset arricchiti, che sono stati successivamente utilizzati per l'addestramento di modelli predittivi di machine learning. Questi modelli sono stati ottimizzati attraverso una strategia di ottimizzazione degli iperparametri con il fine di ottenere le migliori prestazioni possibili nella predizione dello stato finale delle responsabilità all'interno delle tracce. Un punto chiave di questo lavoro di tesi è l'interpretazione critica dei risultati predittivi ottenuti. In particolare, sono state effettuate delle analisi approfondite sui risultati degli esperimenti, tramite le prestazioni dei modelli predittivi utilizzati. Attraverso lo studio delle caratteristiche più rilevanti e discriminanti apprese da questi modelli, è stato possibile comprendere i fattori che hanno influenzato maggiormente la classificazione e, quindi, gli elementi chiave che determinano l'evoluzione delle responsabilità nelle tracce dei log analizzati. Oltre ai risultati predittivi, un contributo significativo di questo lavoro è stato l'elaborazione di una metodologia strutturata per l'analisi dei processi aziendali. Questo approccio ha permesso di valutare in modo progressivo l'impatto di diverse tipologie di informazioni sui modelli, identificando gli attributi più rilevanti nella determinazione dell'esito finale di un processo. La validità del lavoro è stata testata su dataset reali, come quelli dei BPI Challenge 2017 e 2020, con l'obiettivo di valutare l'efficacia dell'approccio in contesti con tracce di processo strutturate e dinamiche decisionali differenti. I risultati hanno mostrato come l'integrazione delle responsabilità e l'analisi critica dei modelli possano migliorare la comprensione dei meccanismi interni dei processi, evidenziando i fattori che influenzano maggiormente le predizioni e le potenziali aree di miglioramento nell'uso delle informazioni disponibili.
Estensione del Predictive Process Monitoring nel Process Mining con il calcolo e la predizione delle responsabilità
MASSAZA, TOMMASO
2023/2024
Abstract
Il Predictive Process Monitoring (PPM) rappresenta un ambito emergente del Process Mining, che si concentra sull'attività di prevedere l'andamento futuro delle tracce di processi aziendali. Esso offre strumenti utili per l'ottimizzazione operativa e decisionale. Tuttavia, le attuali tecniche di PPM si concentrano maggiormente sulla previsione di eventi futuri o sul rilevamento di anomalie, trascurando aspetti cruciali come le responsabilità degli attori coinvolti. Questa tesi si propone di estendere il PPM attraverso l'integrazione del concetto di responsabilità nei log di eventi. In questo lavoro viene fornito un framework che calcola lo stato delle responsabilità durante l'esecuzione del processo e ne consente anche la predizione. Per raggiungere questo obiettivo, è stato sviluppato un sistema in grado di modellare e inferire lo stato delle responsabilità nei log tramite un motore basato su CLIPS, che applica regole logiche e operazioni di residuazione per determinare dinamicamente l'evoluzione delle responsabilità nel tempo. Questo ha permesso di creare dei dataset arricchiti, che sono stati successivamente utilizzati per l'addestramento di modelli predittivi di machine learning. Questi modelli sono stati ottimizzati attraverso una strategia di ottimizzazione degli iperparametri con il fine di ottenere le migliori prestazioni possibili nella predizione dello stato finale delle responsabilità all'interno delle tracce. Un punto chiave di questo lavoro di tesi è l'interpretazione critica dei risultati predittivi ottenuti. In particolare, sono state effettuate delle analisi approfondite sui risultati degli esperimenti, tramite le prestazioni dei modelli predittivi utilizzati. Attraverso lo studio delle caratteristiche più rilevanti e discriminanti apprese da questi modelli, è stato possibile comprendere i fattori che hanno influenzato maggiormente la classificazione e, quindi, gli elementi chiave che determinano l'evoluzione delle responsabilità nelle tracce dei log analizzati. Oltre ai risultati predittivi, un contributo significativo di questo lavoro è stato l'elaborazione di una metodologia strutturata per l'analisi dei processi aziendali. Questo approccio ha permesso di valutare in modo progressivo l'impatto di diverse tipologie di informazioni sui modelli, identificando gli attributi più rilevanti nella determinazione dell'esito finale di un processo. La validità del lavoro è stata testata su dataset reali, come quelli dei BPI Challenge 2017 e 2020, con l'obiettivo di valutare l'efficacia dell'approccio in contesti con tracce di processo strutturate e dinamiche decisionali differenti. I risultati hanno mostrato come l'integrazione delle responsabilità e l'analisi critica dei modelli possano migliorare la comprensione dei meccanismi interni dei processi, evidenziando i fattori che influenzano maggiormente le predizioni e le potenziali aree di miglioramento nell'uso delle informazioni disponibili.File | Dimensione | Formato | |
---|---|---|---|
TesiTommasoMassaza.pdf
non disponibili
Dimensione
2.86 MB
Formato
Adobe PDF
|
2.86 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/164328