Interpretazione di modelli black-box tramite co-clusterign gerarchico.

Nel corso degli anni i modelli per l'analisi dei dati sono diventati sempre più sofisticati e complessi; è però cresciuta anche l'opacità di tali modelli, rendendo difficile anche per gli esperti spiegarne le conclusioni. In questa tesi viene proposto un metodo per l'interpretazione di modelli black-box basato su HiCC, un algoritmo di co-clustering gerarchico, che viene impiegato per raggruppare gli attributi utilizzati da un generico classificatore black-box e per identificare quali di questi abbiano avuto maggiore importanza nella classificazione. Dopo un'analisi del tema della interpretabilità e dello stato dell'arte, viene presentato un modello interpretabile per la spiegazione di classificatori black-box basato sul co-clustering dei dati di test. Nella parte sperimentale si confronta il risultato del modello interpretabile proposto con il risultato di GoldenEye, un altro modello interpretabile basato sul clustering delle features. Infine, nella seconda ed ultima parte sperimentale, si allena un albero decisionale in modo da imitare la classificazione effettuata da un modello black-box, utilizzando però i cluster di features precedentemente individuati e non più le singole features. Dai risultati ottenuti è possibile affermare che HiCC è capace di restituire un clustering con score simile a quello di GoldenEye ed in alcuni casi anche superiore, richiedendo inoltre un tempo di calcolo nettamente inferiore.

Interpretazione di modelli black-box tramite co-clusterign gerarchico.

MANDORINO, ALESSIO

2019/2020

Abstract

Nel corso degli anni i modelli per l'analisi dei dati sono diventati sempre più sofisticati e complessi; è però cresciuta anche l'opacità di tali modelli, rendendo difficile anche per gli esperti spiegarne le conclusioni. In questa tesi viene proposto un metodo per l'interpretazione di modelli black-box basato su HiCC, un algoritmo di co-clustering gerarchico, che viene impiegato per raggruppare gli attributi utilizzati da un generico classificatore black-box e per identificare quali di questi abbiano avuto maggiore importanza nella classificazione. Dopo un'analisi del tema della interpretabilità e dello stato dell'arte, viene presentato un modello interpretabile per la spiegazione di classificatori black-box basato sul co-clustering dei dati di test. Nella parte sperimentale si confronta il risultato del modello interpretabile proposto con il risultato di GoldenEye, un altro modello interpretabile basato sul clustering delle features. Infine, nella seconda ed ultima parte sperimentale, si allena un albero decisionale in modo da imitare la classificazione effettuata da un modello black-box, utilizzando però i cluster di features precedentemente individuati e non più le singole features. Dai risultati ottenuti è possibile affermare che HiCC è capace di restituire un clustering con score simile a quello di GoldenEye ed in alcuni casi anche superiore, richiedendo inoltre un tempo di calcolo nettamente inferiore.

Scheda breve

	Facoltà/Dipartimento
	
				INFORMATICA
			
	Corso di studio
	
				INFORMATICA
			
	Lingua
	
				ITA
			
	Relatrice / Relatore
	
				PENSA, Ruggero Gaetano
			
	Modalità consultazione tesi
	
				IMPORT DA TESIONLINE
			
	Appare nelle tipologie:
	
				Corso di Laurea Magistrale

File in questo prodotto:

File	Dimensione	Formato
772182_tesi_mandorino.pdf non disponibili Tipologia: Altro materiale allegato Dimensione 1.59 MB Formato Adobe PDF	1.59 MB	Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/156576