The following study involves designing and developing an intelligent system for real-time anomaly detection within Intesa Sanpaolo's (ISP) internal infrastructure. This application is based on temporal data deriving from probes that consider the number of customers connected to the internet banking of ISP, ISP private banking, and Fideraum, both from desktop and mobile apps. This thesis project aims to understand if, at the current time, the data coming from the probes are anomalous or not, returning a confidence value of the prediction that will coincide with the level of gravity of the anomaly. In this way, it will be possible to promptly intervene in the "Hydrid Data Center & PAAS" infrastructure malfunctions. The study provides the implementation and comparison of different statistical and artificial intelligence strategies. The baseline will be represented by purely statistical approaches such as smoothing techniques and ARIMA (Autoregressive integrated moving average), then move on to machine learning approaches like Isolation Forest, K-means, and deep neural networks, e.g., Long-Short Term Memory (LSTM) or autoencoder (AE). These approaches will be evaluated using quantitative metrics to identify the best one for our purposes.
Il seguente caso di studio prevede la progettazione e lo sviluppo di un sistema intelligente per il rilevamento in tempo reale di anomalie all'interno dell'infrastruttura interna di Intesa Sanpaolo (ISP). Tale applicazione si basa su dati temporali derivanti da sonde che considerano il numero di clienti connessi all'internet banking di ISP, ISP private banking e Fideraum, sia da desktop che mobile. Lo scopo di questo progetto di tesi è capire se al tempo "attuale" i dati provenienti dalle sonde presentano anomalie, restituendo un valore di confidenza della predizione che coinciderà con il livello di gravità dell'anomalia. In questo modo sarà possibile intervenire in tempo ad eventuali malfunzionamenti dell'infrastruttura "Hydrid Data Center & PAAS" (Platform as a service). Lo studio effettuato prevede l'implementazione e il confronto di diverse tecniche statistiche e di intelligenza artificiale per l'anomaly detection. La baseline sarà rappresentata da degli approcci puramente statistici come alcune tecniche di smoothing e ARIMA (Autoregressive integrated moving average), le quali sono poi comparate con approcci di machine learning tra cui Isolation Forest, K-means e reti neurali profonde come Long-short term memory (LSTM) o autoencoder (AE). Le diverse strategie saranno valutate attraverso metriche quantitative in modo da identificare l'approccio migliore al nostro obiettivo.
Rilevamento di anomalie in tempo reale su serie temporale univariata per supporto al fallimento in infrastruttura PAAS
SANNICOLA, FRANCESCO
2021/2022
Abstract
Il seguente caso di studio prevede la progettazione e lo sviluppo di un sistema intelligente per il rilevamento in tempo reale di anomalie all'interno dell'infrastruttura interna di Intesa Sanpaolo (ISP). Tale applicazione si basa su dati temporali derivanti da sonde che considerano il numero di clienti connessi all'internet banking di ISP, ISP private banking e Fideraum, sia da desktop che mobile. Lo scopo di questo progetto di tesi è capire se al tempo "attuale" i dati provenienti dalle sonde presentano anomalie, restituendo un valore di confidenza della predizione che coinciderà con il livello di gravità dell'anomalia. In questo modo sarà possibile intervenire in tempo ad eventuali malfunzionamenti dell'infrastruttura "Hydrid Data Center & PAAS" (Platform as a service). Lo studio effettuato prevede l'implementazione e il confronto di diverse tecniche statistiche e di intelligenza artificiale per l'anomaly detection. La baseline sarà rappresentata da degli approcci puramente statistici come alcune tecniche di smoothing e ARIMA (Autoregressive integrated moving average), le quali sono poi comparate con approcci di machine learning tra cui Isolation Forest, K-means e reti neurali profonde come Long-short term memory (LSTM) o autoencoder (AE). Le diverse strategie saranno valutate attraverso metriche quantitative in modo da identificare l'approccio migliore al nostro obiettivo.File | Dimensione | Formato | |
---|---|---|---|
941291_thesis_francescosannicola.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
3.57 MB
Formato
Adobe PDF
|
3.57 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/78909