Spatio-Temporal Data arises in scenarios where data is collected across time and space. The ubiquity of this kind of data today in unquestionable and the research on methods of their analysis is very challenging. In this thesis work, we focus on a particular dataset: crime incidents reported by the Boston Police Department from 2015 to 2022. A crime event can generally be characterized by a point location and time, which denotes where and when the event occurred, respectively. In order to apply data analytics techniques, as a pre-processing step we have partitioned the whole city of Boston into a regular grid of rectangular regions and subsequently count the number of events occurred in each region at regular intervals of time, building a new dataset. Then, we have first applied classical ARIMA models without considering potential spatial correlation between the different regions. Finally, we have compared these results with those obtained using transformer neural networks, which are able to learn interactions between space and time through the attention mechanism.

I dati spazio-temporali hanno la peculiarietà di essere raccolti su due dimensioni: il tempo e lo spazio. L'ubiquità di questo tipo di dati oggi è indiscutibile e la ricerca sui metodi della loro analisi è impegnativa. In questo lavoro di tesi, ci concentriamo su un determinato dataset: gli eventi di crimine segnalati dal dipartimento di polizia di Boston dal 2016 al 2022. Un evento criminale può generalmente essere caratterizzato da due elementi: la posizione e l'instante temporale, che indicano rispettivamente dove e quando si è verificato l'evento. Al fine di cercare di risolvere il task di analisi predittiva, come step iniziale di pre-processing si è divisa l'intera città di Boston in una griglia regolare di regioni rettangolari e successivamente si è conteggiato il numero di eventi che si sono verificati in ciascuna regione ad ogni intervallo regolare di tempo, ottenendo quindi un nuovo dataset. Abbiamo prima applicato modelli classici ARIMA senza considerare alcuna correlazione spaziale, in modo da ottenere una baseline di partenza. Successivamente, abbiamo confrontato tali risultati con quelli ottenuti dal modello di reti neurali di tipo 'Transformer', che è in grado attraverso il meccanismo di attenzione di imparare le interazioni tra lo spazio ed il tempo. ​

Analisi di dati spazio-temporali utilizzando metodi statistici e Deep Learning

ERCOLI, DIEGO
2022/2023

Abstract

I dati spazio-temporali hanno la peculiarietà di essere raccolti su due dimensioni: il tempo e lo spazio. L'ubiquità di questo tipo di dati oggi è indiscutibile e la ricerca sui metodi della loro analisi è impegnativa. In questo lavoro di tesi, ci concentriamo su un determinato dataset: gli eventi di crimine segnalati dal dipartimento di polizia di Boston dal 2016 al 2022. Un evento criminale può generalmente essere caratterizzato da due elementi: la posizione e l'instante temporale, che indicano rispettivamente dove e quando si è verificato l'evento. Al fine di cercare di risolvere il task di analisi predittiva, come step iniziale di pre-processing si è divisa l'intera città di Boston in una griglia regolare di regioni rettangolari e successivamente si è conteggiato il numero di eventi che si sono verificati in ciascuna regione ad ogni intervallo regolare di tempo, ottenendo quindi un nuovo dataset. Abbiamo prima applicato modelli classici ARIMA senza considerare alcuna correlazione spaziale, in modo da ottenere una baseline di partenza. Successivamente, abbiamo confrontato tali risultati con quelli ottenuti dal modello di reti neurali di tipo 'Transformer', che è in grado attraverso il meccanismo di attenzione di imparare le interazioni tra lo spazio ed il tempo. ​
ENG
Spatio-Temporal Data arises in scenarios where data is collected across time and space. The ubiquity of this kind of data today in unquestionable and the research on methods of their analysis is very challenging. In this thesis work, we focus on a particular dataset: crime incidents reported by the Boston Police Department from 2015 to 2022. A crime event can generally be characterized by a point location and time, which denotes where and when the event occurred, respectively. In order to apply data analytics techniques, as a pre-processing step we have partitioned the whole city of Boston into a regular grid of rectangular regions and subsequently count the number of events occurred in each region at regular intervals of time, building a new dataset. Then, we have first applied classical ARIMA models without considering potential spatial correlation between the different regions. Finally, we have compared these results with those obtained using transformer neural networks, which are able to learn interactions between space and time through the attention mechanism.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
899799_ercolidiegomasterthesis.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 7.85 MB
Formato Adobe PDF
7.85 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/145099