L'alta dimensionalità è l'ostacolo che, al giorno d'oggi, mette alla prova molteplici approcci di Statistical Learning. In questa tesi sono trattati i Generalized Additive Models (GAM) e i principali approcci esistenti che tentano di rendere i GAM ancora più performanti, là dove possono presentare dei problemi. Questi sono: SpAM, Gamsel, Gamlasso e SPLAM. Il minimo comune denominatore di questi strumenti è il tentativo, da parte dei rispettivi autori, di applicare una metodologia di shrinkage per ridurre la dimensionalità: LASSO. Questi approcci, quindi, hanno tentato di mantenere il più possibile la flessibilità dei Modelli Additivi Generalizzati, ma provando, allo stesso tempo, a evitare di inserire nei modelli una complessità superflua. Il corpo della tesi è composto da una prima analisi prevalentemente teorica e da una seconda dedicata agli aspetti pratici e applicativi. Gli aspetti pratici sono approfonditi sfruttando dati simulati e confrontando i modelli citati sotto l'aspetto del tempo computazionale, della capacità selettiva e di quella predittiva. L'applicazione al caso reale riguarda l'analisi delle emissioni di ossidi di azoto dei camion utilizzati dai clienti di FPT Industrial. I problemi sono due: 1) approfondire, comprendere e selezionare quelle variabili maggiormente rilevanti nella determinazione degli ossidi di azoto e 2) individuare quelle combinazioni di fattori che provocano il superamento dei limiti regolamentari associati alle emissioni di sostanze inquinanti. Questa tesi ha integrato quello che è lo stato dell'arte relativo alle metodologie che applicano una penalità di tipo LASSO ai GAM, con un confronto basato su diversi fronti con dati simulati e con un applicazione su un caso reale del modello che si è avvicinato maggiormente agli obiettivi prefissati.
REGRESSIONE FLESSIBILE IN CONDIZIONE DI ALTA DIMENSIONALITÀ: APPLICAZIONE SU UN CASO REALE PRESSO FPT INDUSTRIAL
PALAIA, ALBERTO
2020/2021
Abstract
L'alta dimensionalità è l'ostacolo che, al giorno d'oggi, mette alla prova molteplici approcci di Statistical Learning. In questa tesi sono trattati i Generalized Additive Models (GAM) e i principali approcci esistenti che tentano di rendere i GAM ancora più performanti, là dove possono presentare dei problemi. Questi sono: SpAM, Gamsel, Gamlasso e SPLAM. Il minimo comune denominatore di questi strumenti è il tentativo, da parte dei rispettivi autori, di applicare una metodologia di shrinkage per ridurre la dimensionalità: LASSO. Questi approcci, quindi, hanno tentato di mantenere il più possibile la flessibilità dei Modelli Additivi Generalizzati, ma provando, allo stesso tempo, a evitare di inserire nei modelli una complessità superflua. Il corpo della tesi è composto da una prima analisi prevalentemente teorica e da una seconda dedicata agli aspetti pratici e applicativi. Gli aspetti pratici sono approfonditi sfruttando dati simulati e confrontando i modelli citati sotto l'aspetto del tempo computazionale, della capacità selettiva e di quella predittiva. L'applicazione al caso reale riguarda l'analisi delle emissioni di ossidi di azoto dei camion utilizzati dai clienti di FPT Industrial. I problemi sono due: 1) approfondire, comprendere e selezionare quelle variabili maggiormente rilevanti nella determinazione degli ossidi di azoto e 2) individuare quelle combinazioni di fattori che provocano il superamento dei limiti regolamentari associati alle emissioni di sostanze inquinanti. Questa tesi ha integrato quello che è lo stato dell'arte relativo alle metodologie che applicano una penalità di tipo LASSO ai GAM, con un confronto basato su diversi fronti con dati simulati e con un applicazione su un caso reale del modello che si è avvicinato maggiormente agli obiettivi prefissati.File | Dimensione | Formato | |
---|---|---|---|
834358_tesi.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
2.55 MB
Formato
Adobe PDF
|
2.55 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/44939