Al giorno d'oggi la stragrande maggioranza dei dati gestiti dalle organizzazioni risulta essere disponibile ed utilizzabile in formato elettronico. Si sta assistendo ad un passaggio dalla forma cartacea alla forma elettronica. Quest'ultima, pur offrendo notevoli ed indiscutibili vantaggi, ha portato con sé anche una serie di problemi legati all'aumento della mole di dati che un'entità organizzata gestisce; ciò è dovuto sia alla necessità di trattare più dati, sia alla possibilità di farlo grazie alla tecnologia disponibile. Questo rende rilevante il livello di attenzione che si deve prestare al livello di qualità dei dati stessi. Si può definire la Data Quality (QD) come ¿fitness for use¿, ossia come adeguatezza alle performance richieste ai dati nell'operatività e rispetto delle aspettative degli utenti in termini di efficienza ed efficacia. La presenza di errori e problemi di qualità dei dati non impatta però unicamente sugli aspetti operativi, ma ha ripercussioni anche a livello tattico-strategico, in quanto da un lato essi logorano i processi di business, e dall'altro ostacolano e talvolta limitano le opportunità di creazione di valore. Tuttavia, nonostante l'importanza della correttezza dei dati, in molte organizzazioni non si adotta un approccio sistematico per quanto riguarda la gestione della DQ. Da un lato, ciò può essere giustificato dal fatto che gli strumenti utilizzabili non sono del tutto completi e di immediato utilizzo; dall'altro esiste ancora una scarsa sensibilità verso questo problema, considerato nella maggior parte dei casi come marginale. L'obiettivo di questa tesi è l'investigazione e lo studio delle diverse metodologie e tecnologie esistenti a supporto dell'integrazione di sorgenti di dati eterogenee e distribuite in un ambiente unico, omogeneo e storicizzato. In uno scenario contraddistinto dalla presenza di diverse tecniche di integrazione dei dati sono state analizzate le principali metodologie di Data Integration, descrivendo funzionalità e caratteristiche delle diverse tecnologie presenti sul mercato. Concludiamo con l'esporre quelli che sono i rischi inerenti la scarsa qualità dei dati andando ad individuare soluzioni efficaci ed efficienti.

IL MERCATO DELLA ¿DATA QUALITY¿ E IL RISCHIO CONNESSO AI DATI

D'ARAIO, PAOLO
2016/2017

Abstract

Al giorno d'oggi la stragrande maggioranza dei dati gestiti dalle organizzazioni risulta essere disponibile ed utilizzabile in formato elettronico. Si sta assistendo ad un passaggio dalla forma cartacea alla forma elettronica. Quest'ultima, pur offrendo notevoli ed indiscutibili vantaggi, ha portato con sé anche una serie di problemi legati all'aumento della mole di dati che un'entità organizzata gestisce; ciò è dovuto sia alla necessità di trattare più dati, sia alla possibilità di farlo grazie alla tecnologia disponibile. Questo rende rilevante il livello di attenzione che si deve prestare al livello di qualità dei dati stessi. Si può definire la Data Quality (QD) come ¿fitness for use¿, ossia come adeguatezza alle performance richieste ai dati nell'operatività e rispetto delle aspettative degli utenti in termini di efficienza ed efficacia. La presenza di errori e problemi di qualità dei dati non impatta però unicamente sugli aspetti operativi, ma ha ripercussioni anche a livello tattico-strategico, in quanto da un lato essi logorano i processi di business, e dall'altro ostacolano e talvolta limitano le opportunità di creazione di valore. Tuttavia, nonostante l'importanza della correttezza dei dati, in molte organizzazioni non si adotta un approccio sistematico per quanto riguarda la gestione della DQ. Da un lato, ciò può essere giustificato dal fatto che gli strumenti utilizzabili non sono del tutto completi e di immediato utilizzo; dall'altro esiste ancora una scarsa sensibilità verso questo problema, considerato nella maggior parte dei casi come marginale. L'obiettivo di questa tesi è l'investigazione e lo studio delle diverse metodologie e tecnologie esistenti a supporto dell'integrazione di sorgenti di dati eterogenee e distribuite in un ambiente unico, omogeneo e storicizzato. In uno scenario contraddistinto dalla presenza di diverse tecniche di integrazione dei dati sono state analizzate le principali metodologie di Data Integration, descrivendo funzionalità e caratteristiche delle diverse tecnologie presenti sul mercato. Concludiamo con l'esporre quelli che sono i rischi inerenti la scarsa qualità dei dati andando ad individuare soluzioni efficaci ed efficienti.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
826744_tesipaolodaraio.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 7.81 MB
Formato Adobe PDF
7.81 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/55387