La presente tesi si pone l'obiettivo di analizzare i dati di un'azienda finanziaria pubblica che, in seguito ad alcune variazioni normative a livello comunitario, ha deciso di adottare un approccio data driven alla propria metodologia di lavoro. L'adozione di tale approccio comporta sia un cambiamento organizzativo, sia l'acquisizione di nuove competenze ed in particolare un maggiore investimento in attività di tipo statistico. I diversi database aziendali vengono quindi analizzati per individuare informazioni utili alla valutazione dei rischi e indispensabili per ottimizzare i costi. Dopo una prima esplorazione descrittiva dei dati, si procede mediante la tecnica chiamata "Analisi delle componenti principali" (PCA), volta a ridurre la dimensionalità dei fenomeni osservati. Le analisi statistiche sia descrittive, sia multivariate sono state computate in SAS. Per pervenire ad un dataset coerente ai fini dell'applicazione della PCA, si è utilizzato il linguaggio di programmazione open source Python per una prima preparazione e pulizia dei dati e con Python sono stati realizzati i grafici; successivamente i dati sono stati organizzati in un database dedicato costruito, tramite Python, su PostgreSQL; sono quindi state applicate alcune query (mediante il linguaggio SQL) per ottenere tutti i dati necessari, adeguatamente preparati. Il piano dell'opera prevede sei capitoli oltre a questa introduzione. Il secondo capitolo descrive l'azienda coinvolta, le esigenze specifiche da cui è nata la necessità di adottare un approccio statistico, le caratteristiche e l'organizzazione dei dati. Il terzo capitolo contiene l'analisi statistica descrittiva del dataset, discutendo le peculiarità delle variabili qualitative e quantitative utilizzate. Il quarto capitolo espone una trattazione teorica dell'Analisi delle componenti principali dal punto di vista analitico. Il quinto capitolo mostra l'applicazione della tecnica al dataset aziendale costruito e illustra i risultati ottenuti. Il sesto capitolo riepiloga il lavoro svolto e delinea le conclusioni.
ANALISI DELLE COMPONENTI PRINCIPALI (PCA) - Un caso di studio in azienda
STELLA, FLAVIA
2022/2023
Abstract
La presente tesi si pone l'obiettivo di analizzare i dati di un'azienda finanziaria pubblica che, in seguito ad alcune variazioni normative a livello comunitario, ha deciso di adottare un approccio data driven alla propria metodologia di lavoro. L'adozione di tale approccio comporta sia un cambiamento organizzativo, sia l'acquisizione di nuove competenze ed in particolare un maggiore investimento in attività di tipo statistico. I diversi database aziendali vengono quindi analizzati per individuare informazioni utili alla valutazione dei rischi e indispensabili per ottimizzare i costi. Dopo una prima esplorazione descrittiva dei dati, si procede mediante la tecnica chiamata "Analisi delle componenti principali" (PCA), volta a ridurre la dimensionalità dei fenomeni osservati. Le analisi statistiche sia descrittive, sia multivariate sono state computate in SAS. Per pervenire ad un dataset coerente ai fini dell'applicazione della PCA, si è utilizzato il linguaggio di programmazione open source Python per una prima preparazione e pulizia dei dati e con Python sono stati realizzati i grafici; successivamente i dati sono stati organizzati in un database dedicato costruito, tramite Python, su PostgreSQL; sono quindi state applicate alcune query (mediante il linguaggio SQL) per ottenere tutti i dati necessari, adeguatamente preparati. Il piano dell'opera prevede sei capitoli oltre a questa introduzione. Il secondo capitolo descrive l'azienda coinvolta, le esigenze specifiche da cui è nata la necessità di adottare un approccio statistico, le caratteristiche e l'organizzazione dei dati. Il terzo capitolo contiene l'analisi statistica descrittiva del dataset, discutendo le peculiarità delle variabili qualitative e quantitative utilizzate. Il quarto capitolo espone una trattazione teorica dell'Analisi delle componenti principali dal punto di vista analitico. Il quinto capitolo mostra l'applicazione della tecnica al dataset aziendale costruito e illustra i risultati ottenuti. Il sesto capitolo riepiloga il lavoro svolto e delinea le conclusioni.File | Dimensione | Formato | |
---|---|---|---|
600170_tesi_flavia_stella_600170.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
2.42 MB
Formato
Adobe PDF
|
2.42 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/106396