L’utilizzo di modelli di machine learning molto avanzati comporta un miglioramento nella capacità predittiva di questi a discapito dell’interpretabilità e trasparenza rispetto alla previsione fornita. Per questa scarsa capacità nel riuscire a fornire una spiegazione rispetto a una certa previsione tali modelli sono anche definiti black box. L’obiettivo di questa tesi è quello di mostrare, attraverso l’utilizzo di tecniche post hoc, delle possibili spiegazioni rispetto alle decisioni assunte dalle black box. Le tecniche post-hoc generalmente utilizzate a questo scopo sono di quattro tipologie differenti: in questo lavoro, per ogni tipologia esplicativa, verrà utilizzata una specifica tecnica post-hoc che, a sua volta, fornirà delle spiegazioni che potranno risultare maggiormente utili a seconda dell’utente finale che riceverà la spiegazione. Le quattro tipologie sono: quella dell’Importanza dei Predittori, quella delle Spiegazioni basate su Regole Decisionali, quella dei Prototipi e quella dei Controfattuali. Per l’ Importanza dei Predittori verrà utilizzato l’algoritmo TreeSHAP di Lundberg e al. (2020), per le Regole Decisionali l’algoritmo GLocalX di Guidotti e al. (2021) o Anchor di Ribeiro e al. (2018), per i Prototipi il metodo sviluppato da Blanco-Justicia e al. (2020), che combina l’algoritmo MDAV con alberi decisionali e infine, per la tipologia dei Controfattuali l’algoritmo DiCE di Mothilal e al. (2020). ​

Tecniche Post Hoc con Alberi Decisionali per Interpretare Black Box ​

LAI, MATTEO
2020/2021

Abstract

L’utilizzo di modelli di machine learning molto avanzati comporta un miglioramento nella capacità predittiva di questi a discapito dell’interpretabilità e trasparenza rispetto alla previsione fornita. Per questa scarsa capacità nel riuscire a fornire una spiegazione rispetto a una certa previsione tali modelli sono anche definiti black box. L’obiettivo di questa tesi è quello di mostrare, attraverso l’utilizzo di tecniche post hoc, delle possibili spiegazioni rispetto alle decisioni assunte dalle black box. Le tecniche post-hoc generalmente utilizzate a questo scopo sono di quattro tipologie differenti: in questo lavoro, per ogni tipologia esplicativa, verrà utilizzata una specifica tecnica post-hoc che, a sua volta, fornirà delle spiegazioni che potranno risultare maggiormente utili a seconda dell’utente finale che riceverà la spiegazione. Le quattro tipologie sono: quella dell’Importanza dei Predittori, quella delle Spiegazioni basate su Regole Decisionali, quella dei Prototipi e quella dei Controfattuali. Per l’ Importanza dei Predittori verrà utilizzato l’algoritmo TreeSHAP di Lundberg e al. (2020), per le Regole Decisionali l’algoritmo GLocalX di Guidotti e al. (2021) o Anchor di Ribeiro e al. (2018), per i Prototipi il metodo sviluppato da Blanco-Justicia e al. (2020), che combina l’algoritmo MDAV con alberi decisionali e infine, per la tipologia dei Controfattuali l’algoritmo DiCE di Mothilal e al. (2020). ​
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
838577_tesi_definitiva.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 2.6 MB
Formato Adobe PDF
2.6 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/69307