L'obiettivo di questo lavoro è stato lo studio ed applicazione di alcune metodologie di Data Mining, quali Cluster Analysis e Self Organizing Map (SOM), applicate all'analisi dei Big Data. I Big Data sono diventati ormai un asset strategico per molte organizzazioni che operano in svariati settori dell'industria e dei servizi, rappresentando una vera e propria risorsa economica se sfruttati opportunamente. Essi vanno intesi come una grande raccolta di dati, strutturati o non, che vengono generati da svariate fonti (social, video, industria, etc¿) e quasi costantemente in modo spontaneo: su tali dati si applicano diverse tecnologie e metodologie di raccolta, di gestione, analisi e tecniche predittive al fine di ricavarne il cosiddetto ¿valore¿. E' stata quindi effettuata la review della letteratura di riferimento sul tema Big Data illustrandone diversi aspetti, tra cui le varie caratteristiche dei dati generati, come si sono evoluti i sistemi informatici necessari per un'adeguata gestione degli stessi, quali sono le implicazioni per le aziende che comprendono l'importanza dell'analisi dei Big Data, nonché un cenno sulla relazione che esiste tra Big Data e Intelligenza Artificiale, intesa come un'ampia disciplina scientifica che include diverse aree tra cui metodi matematici e statistici, algoritmi sofisticati, tecnologie che permettono alle macchine di ¿simulare¿ il comportamento intelligente dell'uomo. Infine, in base alle tecniche di Data Mining che sono state approfondite in questo lavoro, si è esaminato, studiato e verificato in R un caso reale di applicazione di Big Data utilizzando un dataset open fornito da Expedia, una delle agenzie di viaggi online leader nel settore del turismo.
Data Mining per Big Data: Il caso Expedia
OZINO, DIEGO
2017/2018
Abstract
L'obiettivo di questo lavoro è stato lo studio ed applicazione di alcune metodologie di Data Mining, quali Cluster Analysis e Self Organizing Map (SOM), applicate all'analisi dei Big Data. I Big Data sono diventati ormai un asset strategico per molte organizzazioni che operano in svariati settori dell'industria e dei servizi, rappresentando una vera e propria risorsa economica se sfruttati opportunamente. Essi vanno intesi come una grande raccolta di dati, strutturati o non, che vengono generati da svariate fonti (social, video, industria, etc¿) e quasi costantemente in modo spontaneo: su tali dati si applicano diverse tecnologie e metodologie di raccolta, di gestione, analisi e tecniche predittive al fine di ricavarne il cosiddetto ¿valore¿. E' stata quindi effettuata la review della letteratura di riferimento sul tema Big Data illustrandone diversi aspetti, tra cui le varie caratteristiche dei dati generati, come si sono evoluti i sistemi informatici necessari per un'adeguata gestione degli stessi, quali sono le implicazioni per le aziende che comprendono l'importanza dell'analisi dei Big Data, nonché un cenno sulla relazione che esiste tra Big Data e Intelligenza Artificiale, intesa come un'ampia disciplina scientifica che include diverse aree tra cui metodi matematici e statistici, algoritmi sofisticati, tecnologie che permettono alle macchine di ¿simulare¿ il comportamento intelligente dell'uomo. Infine, in base alle tecniche di Data Mining che sono state approfondite in questo lavoro, si è esaminato, studiato e verificato in R un caso reale di applicazione di Big Data utilizzando un dataset open fornito da Expedia, una delle agenzie di viaggi online leader nel settore del turismo.File | Dimensione | Formato | |
---|---|---|---|
824740_tesidiegoozino.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
3.68 MB
Formato
Adobe PDF
|
3.68 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/94694