Il progetto si pone l'obiettivo di effettuare un'analisi sui dati meteorologici rilevati in diverse località della regione Piemonte nell'ultimo decennio, messi a disposizione sotto forma di dati aperti dall'ente regionale per la protezione ambientale. La sua realizzazione ha l'obiettivo di rendere possibile un'analisi più o meno approfondita dei dati meteorologici rilevati nell'arco dell'ultimo decennio, con particolare riferimento alla comparazione tra i dati rilevati nelle diverse località prese in considerazione, all'individuazione di eventuali correlazioni tra i parametri rilevati e all'individuazione di eventuali tendenze rispetto ai decenni precedenti: in questo modo, osservando e analizzando i suddetti dati sarà possibile ottenere un quadro generico dei pattern climatici che contraddistinguono ciascuna delle località di interesse. Il progetto è sviluppato in base a un approccio orientato alla business intelligence, intesa in senso ampio e non solo con riferimento al mondo aziendale come ricerca di pattern e conoscenza: in particolare, a partire dalle principali fonti (costituite dai dati resi disponibili dai portali ARPA e Sistema Piemonte) sono stati raccolti i dati storici giornalieri di 32 stazioni meteo nella regione, successivamente riuniti in dei data warehouse consistenti e analizzati attraverso vari strumenti, quali le tabelle, i grafici pivot e gli strumenti di data mining. I dati sono così stati resi più facilmente analizzabili e manipolabili attraverso questi strumenti, in primo luogo grazie alla possibilità di aggregazione su base annuale o mensile a partire dai dati rilevati su base giornaliera contenuti nel dataset da cui essi sono ricavati. Inoltre, si è cercato di elaborare una classificazione climatica, sulla base dei dati di temperatura e precipitazione per ciascuna delle località analizzate, in modo da individuare le principali “aree climatiche” (caratterizzate da un certo tipo di clima) presenti nella regione. In un'epoca in cui i dati aperti acquisiscono crescente importanza, questo progetto ha l'obiettivo di dimostrare come sia possibile eseguire delle analisi abbastanza approfondite su una grossa mole di dati, con riferimento ai dati meteoclimatici, per i quali la “filosofia” del dato aperto e disponibile a tutti è ancora poco diffusa e spesso limitata a piccoli dataset non coerenti tra loro, sebbene negli ultimi anni si possa osservare una tendenza alla messa a disposizione, da parte degli enti regionali che si occupano della loro gestione, di molti dati storici o analitici (sotto forma di rapporti mensili o annuali) di cui in precedenza non si poteva usufruire. Il seguente lavoro è esposto nella seconda parte di questo documento, mentre nella prima sono stati descritti alcuni concetti teorici legati alle procedure di data warehousing, analisi OLAP, data mining e al nuovo fenomeno dei “dati aperti”.

Il clima del Piemonte nell'ultimo decennio: analisi dei dati meteoclimatici

ABIS, ALESSANDRO
2018/2019

Abstract

Il progetto si pone l'obiettivo di effettuare un'analisi sui dati meteorologici rilevati in diverse località della regione Piemonte nell'ultimo decennio, messi a disposizione sotto forma di dati aperti dall'ente regionale per la protezione ambientale. La sua realizzazione ha l'obiettivo di rendere possibile un'analisi più o meno approfondita dei dati meteorologici rilevati nell'arco dell'ultimo decennio, con particolare riferimento alla comparazione tra i dati rilevati nelle diverse località prese in considerazione, all'individuazione di eventuali correlazioni tra i parametri rilevati e all'individuazione di eventuali tendenze rispetto ai decenni precedenti: in questo modo, osservando e analizzando i suddetti dati sarà possibile ottenere un quadro generico dei pattern climatici che contraddistinguono ciascuna delle località di interesse. Il progetto è sviluppato in base a un approccio orientato alla business intelligence, intesa in senso ampio e non solo con riferimento al mondo aziendale come ricerca di pattern e conoscenza: in particolare, a partire dalle principali fonti (costituite dai dati resi disponibili dai portali ARPA e Sistema Piemonte) sono stati raccolti i dati storici giornalieri di 32 stazioni meteo nella regione, successivamente riuniti in dei data warehouse consistenti e analizzati attraverso vari strumenti, quali le tabelle, i grafici pivot e gli strumenti di data mining. I dati sono così stati resi più facilmente analizzabili e manipolabili attraverso questi strumenti, in primo luogo grazie alla possibilità di aggregazione su base annuale o mensile a partire dai dati rilevati su base giornaliera contenuti nel dataset da cui essi sono ricavati. Inoltre, si è cercato di elaborare una classificazione climatica, sulla base dei dati di temperatura e precipitazione per ciascuna delle località analizzate, in modo da individuare le principali “aree climatiche” (caratterizzate da un certo tipo di clima) presenti nella regione. In un'epoca in cui i dati aperti acquisiscono crescente importanza, questo progetto ha l'obiettivo di dimostrare come sia possibile eseguire delle analisi abbastanza approfondite su una grossa mole di dati, con riferimento ai dati meteoclimatici, per i quali la “filosofia” del dato aperto e disponibile a tutti è ancora poco diffusa e spesso limitata a piccoli dataset non coerenti tra loro, sebbene negli ultimi anni si possa osservare una tendenza alla messa a disposizione, da parte degli enti regionali che si occupano della loro gestione, di molti dati storici o analitici (sotto forma di rapporti mensili o annuali) di cui in precedenza non si poteva usufruire. Il seguente lavoro è esposto nella seconda parte di questo documento, mentre nella prima sono stati descritti alcuni concetti teorici legati alle procedure di data warehousing, analisi OLAP, data mining e al nuovo fenomeno dei “dati aperti”.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
836765_tesiprat.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 3.88 MB
Formato Adobe PDF
3.88 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/148886