In recent years, the field of Explainable Artificial Intelligence (XAI) has received significant attention, particularly regarding model-agnostic approaches designed to elucidate the decision-making processes of machine learning models. This thesis focuses on enhancing the interpretability of models used for regression task in spatio-temporal settings. In particular, this work explores extensions and refinements of Randomized Input Sampling for Explanation (RISE) for the specific case study of predicting groundwater level prediction using weather image time series. Originally developed for image classification, RISE iteratively perturbs the input to generate saliency maps that highlight the most relevant elements driving model predictions. In this work, we extend RISE to address the spatio-temporal challenges inherent in meteorological video data. We formalize three variants: Spatial-RISE, which generates a 2D saliency map; Temporal-RISE, which produces a 1D saliency vector; and SpatioTemporal-RISE, which creates a 3D saliency video. In addition, we extend the original RISE evaluation metrics - Insertion and Deletion - to assess the quality of the generated explanations across spatial, temporal, and spatio-temporal dimensions in a regression framework. Initially, these extensions were implemented using structured masking with additive Gaussian noise. Later, we refined our approach by revisiting the original RISE formulation and adopting a perturbation strategy based on blurring and multiplicative noise. This alternative mechanism provides a more structured and physically meaningful degradation of meteorological inputs, thereby ensuring that the generated explanations maintain their physical significance and accurately reflect the underlying atmospheric processes. Furthermore, to offer a comprehensive evaluation, we extend and adapt two additional post-hoc model-agnostic XAI methods - LIME and SHAP - to the spatio-temporal regression context. These adaptations involve reconfiguring their superpixel-based segmentation strategies for video data, which, in turn, preserves the physical coherence of the explanations. Experimental results on a CNN-LSTM model, which forecasts water table depth (WTD) based on weather video data, demonstrate the potential of the proposed methods - particularly the SpatioTemporal-RISE variant - in providing fine-grained, high-resolution explanations with inherent physical meaning. Our findings suggest that the extended RISE formulation, along with the adapted LIME and SHAP methods, not only enhances model interpretability in hydrological applications but can also be generalized to any regression task operating on time-series images.
Negli ultimi anni, il campo dell'Intelligenza Artificiale Spiegabile (XAI) ha ricevuto una notevole attenzione, in particolare riguardo agli approcci agnostici al modello progettati per chiarire i processi decisionali dei modelli di machine learning. Questa tesi si concentra sul miglioramento dell'interpretabilità dei modelli utilizzati per compiti di regressione in contesti spaziotemporali. In particolare, questo lavoro esplora estensioni e affinamenti di Randomized Input Sampling for Explanation (RISE) per il caso di studio specifico della previsione del livello delle falde acquifere utilizzando serie temporali di immagini meteorologiche. Originariamente sviluppato per la classificazione delle immagini, RISE perturba iterativamente l'input per generare mappe di salienza che evidenziano gli elementi più rilevanti che guidano le predizioni del modello. In questo lavoro, estendiamo RISE per affrontare le sfide spaziotemporali insite nei dati video meteorologici. Formalizziamo tre varianti: Spatial-RISE, che genera una mappa di salienza 2D; Temporal-RISE, che produce un vettore di salienza 1D; e SpatioTemporal-RISE, che crea un video di salienza 3D. Inoltre, estendiamo le metriche di valutazione originali di RISE – Insertion e Deletion – per valutare la qualità delle spiegazioni generate attraverso le dimensioni spaziali, temporali e spaziotemporali in un contesto di regressione. Inizialmente, queste estensioni sono state implementate utilizzando il mascheramento strutturato con rumore gaussiano additivo. Successivamente, abbiamo perfezionato il nostro approccio rivedendo la formulazione originale di RISE e adottando una strategia di perturbazione basata su blurring e rumore moltiplicativo. Questo meccanismo alternativo fornisce una degradazione più strutturata e fisicamente significativa degli input meteorologici, garantendo così che le spiegazioni generate mantengano il loro significato fisico e riflettano accuratamente i processi atmosferici sottostanti. Inoltre, per offrire una valutazione completa, estendiamo e adattiamo due ulteriori metodi post-hoc model-agnostic – LIME e SHAP – al contesto di regressione spaziotemporale. Queste adattamenti comportano la riconfigurazione delle loro strategie di segmentazione basate sui superpixel per i dati video, preservando così la coerenza fisica delle spiegazioni. I risultati sperimentali su un modello CNN-LSTM, che prevede la profondità della falda acquifera (WTD) basandosi su dati video meteorologici, dimostrano il potenziale dei metodi proposti – in particolare la variante SpatioTemporal-RISE – nel fornire spiegazioni dettagliate e ad alta risoluzione con un significato fisico intrinseco. I nostri risultati suggeriscono che la formulazione estesa di RISE, insieme ai metodi adattati LIME e SHAP, non solo migliora l'interpretabilità del modello nelle applicazioni idrologiche, ma può anche essere generalizzata a qualsiasi compito di regressione che operi su immagini di serie temporali.
Spiegare le previsioni del livello delle acque sotterranee: un approccio basato sul metodo RISE con le serie temporali di immagini
PELLEGRINO, MARCO
2023/2024
Abstract
Negli ultimi anni, il campo dell'Intelligenza Artificiale Spiegabile (XAI) ha ricevuto una notevole attenzione, in particolare riguardo agli approcci agnostici al modello progettati per chiarire i processi decisionali dei modelli di machine learning. Questa tesi si concentra sul miglioramento dell'interpretabilità dei modelli utilizzati per compiti di regressione in contesti spaziotemporali. In particolare, questo lavoro esplora estensioni e affinamenti di Randomized Input Sampling for Explanation (RISE) per il caso di studio specifico della previsione del livello delle falde acquifere utilizzando serie temporali di immagini meteorologiche. Originariamente sviluppato per la classificazione delle immagini, RISE perturba iterativamente l'input per generare mappe di salienza che evidenziano gli elementi più rilevanti che guidano le predizioni del modello. In questo lavoro, estendiamo RISE per affrontare le sfide spaziotemporali insite nei dati video meteorologici. Formalizziamo tre varianti: Spatial-RISE, che genera una mappa di salienza 2D; Temporal-RISE, che produce un vettore di salienza 1D; e SpatioTemporal-RISE, che crea un video di salienza 3D. Inoltre, estendiamo le metriche di valutazione originali di RISE – Insertion e Deletion – per valutare la qualità delle spiegazioni generate attraverso le dimensioni spaziali, temporali e spaziotemporali in un contesto di regressione. Inizialmente, queste estensioni sono state implementate utilizzando il mascheramento strutturato con rumore gaussiano additivo. Successivamente, abbiamo perfezionato il nostro approccio rivedendo la formulazione originale di RISE e adottando una strategia di perturbazione basata su blurring e rumore moltiplicativo. Questo meccanismo alternativo fornisce una degradazione più strutturata e fisicamente significativa degli input meteorologici, garantendo così che le spiegazioni generate mantengano il loro significato fisico e riflettano accuratamente i processi atmosferici sottostanti. Inoltre, per offrire una valutazione completa, estendiamo e adattiamo due ulteriori metodi post-hoc model-agnostic – LIME e SHAP – al contesto di regressione spaziotemporale. Queste adattamenti comportano la riconfigurazione delle loro strategie di segmentazione basate sui superpixel per i dati video, preservando così la coerenza fisica delle spiegazioni. I risultati sperimentali su un modello CNN-LSTM, che prevede la profondità della falda acquifera (WTD) basandosi su dati video meteorologici, dimostrano il potenziale dei metodi proposti – in particolare la variante SpatioTemporal-RISE – nel fornire spiegazioni dettagliate e ad alta risoluzione con un significato fisico intrinseco. I nostri risultati suggeriscono che la formulazione estesa di RISE, insieme ai metodi adattati LIME e SHAP, non solo migliora l'interpretabilità del modello nelle applicazioni idrologiche, ma può anche essere generalizzata a qualsiasi compito di regressione che operi su immagini di serie temporali.File | Dimensione | Formato | |
---|---|---|---|
Pellegrino-Explaining Groundwater Level Predictions.pdf
non disponibili
Dimensione
24.2 MB
Formato
Adobe PDF
|
24.2 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/164331