L'alta dimensionalità è l'ostacolo che, al giorno d'oggi, mette alla prova molteplici approcci di Statistical Learning. In questa tesi sono trattati i Generalized Additive Models (GAM) e i principali approcci esistenti che tentano di rendere i GAM ancora più performanti, là dove possono presentare dei problemi. Questi sono: SpAM, Gamsel, Gamlasso e SPLAM. Il minimo comune denominatore di questi strumenti è il tentativo, da parte dei rispettivi autori, di applicare una metodologia di shrinkage per ridurre la dimensionalità: LASSO. Questi approcci, quindi, hanno tentato di mantenere il più possibile la flessibilità dei Modelli Additivi Generalizzati, ma provando, allo stesso tempo, a evitare di inserire nei modelli una complessità superflua. Il corpo della tesi è composto da una prima analisi prevalentemente teorica e da una seconda dedicata agli aspetti pratici e applicativi. Gli aspetti pratici sono approfonditi sfruttando dati simulati e confrontando i modelli citati sotto l'aspetto del tempo computazionale, della capacità selettiva e di quella predittiva. L'applicazione al caso reale riguarda l'analisi delle emissioni di ossidi di azoto dei camion utilizzati dai clienti di FPT Industrial. I problemi sono due: 1) approfondire, comprendere e selezionare quelle variabili maggiormente rilevanti nella determinazione degli ossidi di azoto e 2) individuare quelle combinazioni di fattori che provocano il superamento dei limiti regolamentari associati alle emissioni di sostanze inquinanti. Questa tesi ha integrato quello che è lo stato dell'arte relativo alle metodologie che applicano una penalità di tipo LASSO ai GAM, con un confronto basato su diversi fronti con dati simulati e con un applicazione su un caso reale del modello che si è avvicinato maggiormente agli obiettivi prefissati.

REGRESSIONE FLESSIBILE IN CONDIZIONE DI ALTA DIMENSIONALITÀ: APPLICAZIONE SU UN CASO REALE PRESSO FPT INDUSTRIAL

PALAIA, ALBERTO
2020/2021

Abstract

L'alta dimensionalità è l'ostacolo che, al giorno d'oggi, mette alla prova molteplici approcci di Statistical Learning. In questa tesi sono trattati i Generalized Additive Models (GAM) e i principali approcci esistenti che tentano di rendere i GAM ancora più performanti, là dove possono presentare dei problemi. Questi sono: SpAM, Gamsel, Gamlasso e SPLAM. Il minimo comune denominatore di questi strumenti è il tentativo, da parte dei rispettivi autori, di applicare una metodologia di shrinkage per ridurre la dimensionalità: LASSO. Questi approcci, quindi, hanno tentato di mantenere il più possibile la flessibilità dei Modelli Additivi Generalizzati, ma provando, allo stesso tempo, a evitare di inserire nei modelli una complessità superflua. Il corpo della tesi è composto da una prima analisi prevalentemente teorica e da una seconda dedicata agli aspetti pratici e applicativi. Gli aspetti pratici sono approfonditi sfruttando dati simulati e confrontando i modelli citati sotto l'aspetto del tempo computazionale, della capacità selettiva e di quella predittiva. L'applicazione al caso reale riguarda l'analisi delle emissioni di ossidi di azoto dei camion utilizzati dai clienti di FPT Industrial. I problemi sono due: 1) approfondire, comprendere e selezionare quelle variabili maggiormente rilevanti nella determinazione degli ossidi di azoto e 2) individuare quelle combinazioni di fattori che provocano il superamento dei limiti regolamentari associati alle emissioni di sostanze inquinanti. Questa tesi ha integrato quello che è lo stato dell'arte relativo alle metodologie che applicano una penalità di tipo LASSO ai GAM, con un confronto basato su diversi fronti con dati simulati e con un applicazione su un caso reale del modello che si è avvicinato maggiormente agli obiettivi prefissati.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
834358_tesi.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 2.55 MB
Formato Adobe PDF
2.55 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/44939