The last frontier of information management deals with Big Data: data with high volume, velocity and variety. Hence the business intelligence software, including reporting software, are evolving and, in order to extract knowledge from Big Data sources, are introducing new features and implementation approaches. In this thesis work, a comparison between QlikView and Oracle BIEE is done to choose, in a real business use case, the most suitable software to analyse Big Data extracted from Google BigQuery. This comparison shows distinctions in data model, architecture and different approaches between these two software products. Thereafter, an enterprise dashboard is built to show QlikView's ability to query and filter data, but some limitations emerge from data federation. Finally, different open source storage and processing technologies for Big Data are presented. Some data are imported from an RDBMS to HDFS using Apache Sqoop and Apache Parquet. Apache Hive, Cloudera Impala and QlikView are then used to query and analyse these data. Also in this case various limitations emerge but some solutions are proposed.

L'ultima frontiera della gestione dell'informazione affronta i Big Data: dati molto voluminosi, variegati e in rapido cambiamento. Pertanto gli strumenti di business intelligence, tra cui i software di reportistica, si stanno evolvendo e, per poter estrarre conoscenza dai Big Data, stanno introducendo nuove funzionalità e radicali novità implementative. In questa tesi viene svolto un confronto tra QlikView e Oracle BIEE, al fine di eleggere, in un reale caso d'uso aziendale, il software di reportistica più adatto ad analizzare Big Data estratti da Google BigQuery. Vengono evidenziate le differenze nel modello dati, nelle scelte architetturali e nei diversi approcci adottati da questi due software. In particolare, con la creazione di un business dashboard, vengono mostrate le migliori potenzialità di QlikView nell'interrogazione e filtraggio dei dati, ma anche i limiti delle tecnologie utilizzate nel realizzare la data federation. Successivamente vengono analizzati diversi strumenti open source di archiviazione e trattamento di Big Data. Alcuni dati presenti in un RDBMS vengono importati e memorizzati in HDFS facendo uso di Apache Sqoop e Apache Parquet. In seguito vengono interrogati tramite Apache Hive e Cloudera Impala e analizzati all'interno di un dashboard QlikView. Anche in questo caso sono evidenziati i problemi riscontrati ma anche le possibili soluzioni per superarli.

L'approccio della business intelligence ai Big Data: trattamento e analisi di dati con strumenti di reportistica aziendali

VARESANO, MARCO
2014/2015

Abstract

L'ultima frontiera della gestione dell'informazione affronta i Big Data: dati molto voluminosi, variegati e in rapido cambiamento. Pertanto gli strumenti di business intelligence, tra cui i software di reportistica, si stanno evolvendo e, per poter estrarre conoscenza dai Big Data, stanno introducendo nuove funzionalità e radicali novità implementative. In questa tesi viene svolto un confronto tra QlikView e Oracle BIEE, al fine di eleggere, in un reale caso d'uso aziendale, il software di reportistica più adatto ad analizzare Big Data estratti da Google BigQuery. Vengono evidenziate le differenze nel modello dati, nelle scelte architetturali e nei diversi approcci adottati da questi due software. In particolare, con la creazione di un business dashboard, vengono mostrate le migliori potenzialità di QlikView nell'interrogazione e filtraggio dei dati, ma anche i limiti delle tecnologie utilizzate nel realizzare la data federation. Successivamente vengono analizzati diversi strumenti open source di archiviazione e trattamento di Big Data. Alcuni dati presenti in un RDBMS vengono importati e memorizzati in HDFS facendo uso di Apache Sqoop e Apache Parquet. In seguito vengono interrogati tramite Apache Hive e Cloudera Impala e analizzati all'interno di un dashboard QlikView. Anche in questo caso sono evidenziati i problemi riscontrati ma anche le possibili soluzioni per superarli.
ITA
The last frontier of information management deals with Big Data: data with high volume, velocity and variety. Hence the business intelligence software, including reporting software, are evolving and, in order to extract knowledge from Big Data sources, are introducing new features and implementation approaches. In this thesis work, a comparison between QlikView and Oracle BIEE is done to choose, in a real business use case, the most suitable software to analyse Big Data extracted from Google BigQuery. This comparison shows distinctions in data model, architecture and different approaches between these two software products. Thereafter, an enterprise dashboard is built to show QlikView's ability to query and filter data, but some limitations emerge from data federation. Finally, different open source storage and processing technologies for Big Data are presented. Some data are imported from an RDBMS to HDFS using Apache Sqoop and Apache Parquet. Apache Hive, Cloudera Impala and QlikView are then used to query and analyse these data. Also in this case various limitations emerge but some solutions are proposed.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
328025_tesi_marco_varesano.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 3.55 MB
Formato Adobe PDF
3.55 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/158428