REGRESSIONE FLESSIBILE IN CONDIZIONE DI ALTA DIMENSIONALITÀ: APPLICAZIONE SU UN CASO REALE PRESSO FPT INDUSTRIAL

L'alta dimensionalità è l'ostacolo che, al giorno d'oggi, mette alla prova molteplici approcci di Statistical Learning. In questa tesi sono trattati i Generalized Additive Models (GAM) e i principali approcci esistenti che tentano di rendere i GAM ancora più performanti, là dove possono presentare dei problemi. Questi sono: SpAM, Gamsel, Gamlasso e SPLAM. Il minimo comune denominatore di questi strumenti è il tentativo, da parte dei rispettivi autori, di applicare una metodologia di shrinkage per ridurre la dimensionalità: LASSO. Questi approcci, quindi, hanno tentato di mantenere il più possibile la flessibilità dei Modelli Additivi Generalizzati, ma provando, allo stesso tempo, a evitare di inserire nei modelli una complessità superflua. Il corpo della tesi è composto da una prima analisi prevalentemente teorica e da una seconda dedicata agli aspetti pratici e applicativi. Gli aspetti pratici sono approfonditi sfruttando dati simulati e confrontando i modelli citati sotto l'aspetto del tempo computazionale, della capacità selettiva e di quella predittiva. L'applicazione al caso reale riguarda l'analisi delle emissioni di ossidi di azoto dei camion utilizzati dai clienti di FPT Industrial. I problemi sono due: 1) approfondire, comprendere e selezionare quelle variabili maggiormente rilevanti nella determinazione degli ossidi di azoto e 2) individuare quelle combinazioni di fattori che provocano il superamento dei limiti regolamentari associati alle emissioni di sostanze inquinanti. Questa tesi ha integrato quello che è lo stato dell'arte relativo alle metodologie che applicano una penalità di tipo LASSO ai GAM, con un confronto basato su diversi fronti con dati simulati e con un applicazione su un caso reale del modello che si è avvicinato maggiormente agli obiettivi prefissati.

REGRESSIONE FLESSIBILE IN CONDIZIONE DI ALTA DIMENSIONALITÀ: APPLICAZIONE SU UN CASO REALE PRESSO FPT INDUSTRIAL

PALAIA, ALBERTO

2020/2021

Abstract

L'alta dimensionalità è l'ostacolo che, al giorno d'oggi, mette alla prova molteplici approcci di Statistical Learning. In questa tesi sono trattati i Generalized Additive Models (GAM) e i principali approcci esistenti che tentano di rendere i GAM ancora più performanti, là dove possono presentare dei problemi. Questi sono: SpAM, Gamsel, Gamlasso e SPLAM. Il minimo comune denominatore di questi strumenti è il tentativo, da parte dei rispettivi autori, di applicare una metodologia di shrinkage per ridurre la dimensionalità: LASSO. Questi approcci, quindi, hanno tentato di mantenere il più possibile la flessibilità dei Modelli Additivi Generalizzati, ma provando, allo stesso tempo, a evitare di inserire nei modelli una complessità superflua. Il corpo della tesi è composto da una prima analisi prevalentemente teorica e da una seconda dedicata agli aspetti pratici e applicativi. Gli aspetti pratici sono approfonditi sfruttando dati simulati e confrontando i modelli citati sotto l'aspetto del tempo computazionale, della capacità selettiva e di quella predittiva. L'applicazione al caso reale riguarda l'analisi delle emissioni di ossidi di azoto dei camion utilizzati dai clienti di FPT Industrial. I problemi sono due: 1) approfondire, comprendere e selezionare quelle variabili maggiormente rilevanti nella determinazione degli ossidi di azoto e 2) individuare quelle combinazioni di fattori che provocano il superamento dei limiti regolamentari associati alle emissioni di sostanze inquinanti. Questa tesi ha integrato quello che è lo stato dell'arte relativo alle metodologie che applicano una penalità di tipo LASSO ai GAM, con un confronto basato su diversi fronti con dati simulati e con un applicazione su un caso reale del modello che si è avvicinato maggiormente agli obiettivi prefissati.

Scheda breve

	Facoltà/Dipartimento
	
				ECONOMIA E STATISTICA "COGNETTI DE MARTIIS"
			
	Corso di studio
	
				METODI STATISTICI ED ECONOMICI PER LE DECISIONI
			
	Lingua
	
				ITA
			
	Relatrice / Relatore
	
				IGNACCOLO, Rosaria
			
	Modalità consultazione tesi
	
				IMPORT DA TESIONLINE
			
	Appare nelle tipologie:
	
				Corso di Laurea Magistrale

File in questo prodotto:

File	Dimensione	Formato
834358_tesi.pdf non disponibili Tipologia: Altro materiale allegato Dimensione 2.55 MB Formato Adobe PDF	2.55 MB	Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/44939