In statistical models, interactions among variables play a fundamental role, allowing for better specification of the model and improvement of its predictive capacity. Tree-based methods are particularly useful for detecting interaction effects but they do not provide a useful and interpretable index for them. Interaction Forests is an algorithm similar to Random Forests that aims to identify interactions while improving results interpretability. Since it can be challenging to identify interactions in exploratory analysis especially in high dimensional data, instead of using Interaction Forests to predict, interactions are analyzed and used to specify a Generalized Additive Model (GAM) to predict. The validity of the algorithm's results is tested in a simulation design. In a real-world application, an improvement in predictive performance of GAM compared to Interaction Forests and a better interpretation of the results due to the incorporation of the algorithm's results into the model emerge.

Nei modelli statistici le interazioni tra le variabili ricoprono un ruolo fondamentale, consentendo di specificare meglio il modello e di migliorarne la predittività. I metodi basati sugli alberi sono particolarmente utili per trovare interazioni ma non forniscono un indice utile e interpretabile che ne indichi la presenza. Interaction Forests è un algoritmo simile al Random Forests che ha l'obiettivo di individuare le interazioni migliorando l'interpretabilità dei risultati. Poiché in un'analisi esplorativa può essere difficile individuare le interazioni specialmente quando il numero delle variabili è elevato, invece di impiegare Interaction Forests per predire, sono analizzate e utilizzate le interazioni per specificare un Modello Generalizzato Additivo (GAM) con cui fare previsioni. Nella simulazione è verificata la validità dei risultati dell'algoritmo. Nell'applicazione a dati reali emerge un miglioramento predittivo del GAM rispetto ad Interaction Forests e una miglior interpretazione dei risultati dovuti all'impiego nel modello dei risultati dell'algoritmo.

Interaction Random Forests: miglioramento della capacità predittiva e dell'interpretabilità di un modello statistico

ESPOSITO, GIUSEPPE
2022/2023

Abstract

Nei modelli statistici le interazioni tra le variabili ricoprono un ruolo fondamentale, consentendo di specificare meglio il modello e di migliorarne la predittività. I metodi basati sugli alberi sono particolarmente utili per trovare interazioni ma non forniscono un indice utile e interpretabile che ne indichi la presenza. Interaction Forests è un algoritmo simile al Random Forests che ha l'obiettivo di individuare le interazioni migliorando l'interpretabilità dei risultati. Poiché in un'analisi esplorativa può essere difficile individuare le interazioni specialmente quando il numero delle variabili è elevato, invece di impiegare Interaction Forests per predire, sono analizzate e utilizzate le interazioni per specificare un Modello Generalizzato Additivo (GAM) con cui fare previsioni. Nella simulazione è verificata la validità dei risultati dell'algoritmo. Nell'applicazione a dati reali emerge un miglioramento predittivo del GAM rispetto ad Interaction Forests e una miglior interpretazione dei risultati dovuti all'impiego nel modello dei risultati dell'algoritmo.
ITA
In statistical models, interactions among variables play a fundamental role, allowing for better specification of the model and improvement of its predictive capacity. Tree-based methods are particularly useful for detecting interaction effects but they do not provide a useful and interpretable index for them. Interaction Forests is an algorithm similar to Random Forests that aims to identify interactions while improving results interpretability. Since it can be challenging to identify interactions in exploratory analysis especially in high dimensional data, instead of using Interaction Forests to predict, interactions are analyzed and used to specify a Generalized Additive Model (GAM) to predict. The validity of the algorithm's results is tested in a simulation design. In a real-world application, an improvement in predictive performance of GAM compared to Interaction Forests and a better interpretation of the results due to the incorporation of the algorithm's results into the model emerge.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
969247_tesigiuseppeesposito.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 913.27 kB
Formato Adobe PDF
913.27 kB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/107651