Nowadays, one of the most developing fields is technology. Thanks to the advent of technology over the years, it has been possible to transform all knowledge reported in books, into digital format. This process of transformation in the course of the elaboration has been referred to as digitalization. In particular, the huge number of interconnected and sensor-equipped devices means that a huge volume of data is produced, collected in what has been called Big Data. These represent an infinite wealth of information from which new models can be created and processes improved. With the advent of Big Data, containing exhaustive information about different content from each other, Data Mining becomes increasingly important. Data Mining, therefore, arises from the need for powerful and versatile tools with the purpose of automatically constituting valuable information consisting of massive amounts of data. This is a current, dynamic, evolving and quite promising field. Thus, it can be said that data mining is capable of transforming a large collection of data into knowledge. The process of data mining rests its foundation on what is the science addressed in the first chapter, namely that of machine learning, which was born with the aim of providing the best course of action for solving a problem by analyzing the totality of the data provided, in a completely autonomous manner. In conclusion, it was possible to analyze how effective the use of machine learning-based algorithms can be to make human work more effective. It is possible to apply such algorithms through some software, including the one explored in the thesis, namely Rapid Miner. Supporting this claim is the application example given in the last chapter, where the study of the application of the K-means algorithm through Rapid Miner for data clustering, particularly for image segmentation, was addressed. It was seen how through these programs the search for objects or people within images could be made more effective. From a practical point of view this could find many applications, particularly in the military it could prove useful in classifying images taken by satellites over enemy terrain, where through this program one would search for hostile elements that at first glance might not be detected by the human eye.

Oggigiorno, uno dei campi maggiormente in via di sviluppo è quello tecnologico. Grazie all’avvento della tecnologia nel corso degli anni è stato possibile trasformare tutta la conoscenza riportata sui libri, in formato digitale. Tale processo di trasformazione nel corso dell’elaborato è stato definito come digitalization. In particolare l’enorme numero di dispositivi interconnessi e dotati di sensori, fa in modo che siano prodotti un enorme volume di dati, raccolti in quelli che sono stati definiti Big Data. Questi rappresentano un infinito patrimonio informativo da cui è possibile creare nuovi modelli e migliorare i processi. Con l’avvento dei Big Data, contenenti informazioni esaurienti su contenuti differenti tra loro, il Data Mining diventa sempre più importante. Il Data Mining nasce, quindi, dalla necessità di avere strumenti potenti e versatili con lo scopo di costituire automaticamente informazioni di valore costituite da ingenti quantità di dati. Si tratta di un ambito attuale, dinamico, in continua evoluzione ed alquanto promettente. Quindi si può affermare che il Data Mining è capace di trasformare una grande collezione di dati in conoscenza. Il processo di data mining poggia le sue fondamenta su quella che è la scienza affrontata nel primo capitolo, ossia quella del machine learning che nasce con lo scopo di fornire la migliore linea di azione per la risoluzione di un problema, analizzando la totalità dei dati forniti, in maniera del tutto autonoma. In conclusione si è potuto analizzare come possa essere efficace l’uso di algoritmi basati sul machine learning, per rendere più efficace il lavoro dell’uomo. È possibile applicare tali algoritmi tramite alcuni software, tra cui quello approfondito nella tesi, ossia Rapid Miner. A supportare tale affermazione è l’esempio di applicazione riportato nell’ultimo capitolo, dove si è affrontato lo studio dell’applicazione dell’algoritmo K-means tramite Rapid Miner per il clustering di dati, in particolare per la segmentazione di immagini. Si è visto come tramite questi programmi si potrebbe rendere più efficace la ricerca di oggetti o persone all’interno di immagini. Dal punto di vista pratico questo potrebbe trovare numerose applicazioni, in particolare in ambito militare potrebbe rivelarsi utile nella classificazione di immagini scattate da satelliti su terreni nemici, dove tramite questo programma si andrebbe alla ricerca di elementi ostili che ad un primo sguardo potrebbero non essere rilevati dall’occhio umano.

Applicazione algoritmi di data mining per il clustering di dati tramite Rapid Miner

BIANCO, MANUEL
2021/2022

Abstract

Oggigiorno, uno dei campi maggiormente in via di sviluppo è quello tecnologico. Grazie all’avvento della tecnologia nel corso degli anni è stato possibile trasformare tutta la conoscenza riportata sui libri, in formato digitale. Tale processo di trasformazione nel corso dell’elaborato è stato definito come digitalization. In particolare l’enorme numero di dispositivi interconnessi e dotati di sensori, fa in modo che siano prodotti un enorme volume di dati, raccolti in quelli che sono stati definiti Big Data. Questi rappresentano un infinito patrimonio informativo da cui è possibile creare nuovi modelli e migliorare i processi. Con l’avvento dei Big Data, contenenti informazioni esaurienti su contenuti differenti tra loro, il Data Mining diventa sempre più importante. Il Data Mining nasce, quindi, dalla necessità di avere strumenti potenti e versatili con lo scopo di costituire automaticamente informazioni di valore costituite da ingenti quantità di dati. Si tratta di un ambito attuale, dinamico, in continua evoluzione ed alquanto promettente. Quindi si può affermare che il Data Mining è capace di trasformare una grande collezione di dati in conoscenza. Il processo di data mining poggia le sue fondamenta su quella che è la scienza affrontata nel primo capitolo, ossia quella del machine learning che nasce con lo scopo di fornire la migliore linea di azione per la risoluzione di un problema, analizzando la totalità dei dati forniti, in maniera del tutto autonoma. In conclusione si è potuto analizzare come possa essere efficace l’uso di algoritmi basati sul machine learning, per rendere più efficace il lavoro dell’uomo. È possibile applicare tali algoritmi tramite alcuni software, tra cui quello approfondito nella tesi, ossia Rapid Miner. A supportare tale affermazione è l’esempio di applicazione riportato nell’ultimo capitolo, dove si è affrontato lo studio dell’applicazione dell’algoritmo K-means tramite Rapid Miner per il clustering di dati, in particolare per la segmentazione di immagini. Si è visto come tramite questi programmi si potrebbe rendere più efficace la ricerca di oggetti o persone all’interno di immagini. Dal punto di vista pratico questo potrebbe trovare numerose applicazioni, in particolare in ambito militare potrebbe rivelarsi utile nella classificazione di immagini scattate da satelliti su terreni nemici, dove tramite questo programma si andrebbe alla ricerca di elementi ostili che ad un primo sguardo potrebbero non essere rilevati dall’occhio umano.
ITA
Nowadays, one of the most developing fields is technology. Thanks to the advent of technology over the years, it has been possible to transform all knowledge reported in books, into digital format. This process of transformation in the course of the elaboration has been referred to as digitalization. In particular, the huge number of interconnected and sensor-equipped devices means that a huge volume of data is produced, collected in what has been called Big Data. These represent an infinite wealth of information from which new models can be created and processes improved. With the advent of Big Data, containing exhaustive information about different content from each other, Data Mining becomes increasingly important. Data Mining, therefore, arises from the need for powerful and versatile tools with the purpose of automatically constituting valuable information consisting of massive amounts of data. This is a current, dynamic, evolving and quite promising field. Thus, it can be said that data mining is capable of transforming a large collection of data into knowledge. The process of data mining rests its foundation on what is the science addressed in the first chapter, namely that of machine learning, which was born with the aim of providing the best course of action for solving a problem by analyzing the totality of the data provided, in a completely autonomous manner. In conclusion, it was possible to analyze how effective the use of machine learning-based algorithms can be to make human work more effective. It is possible to apply such algorithms through some software, including the one explored in the thesis, namely Rapid Miner. Supporting this claim is the application example given in the last chapter, where the study of the application of the K-means algorithm through Rapid Miner for data clustering, particularly for image segmentation, was addressed. It was seen how through these programs the search for objects or people within images could be made more effective. From a practical point of view this could find many applications, particularly in the military it could prove useful in classifying images taken by satellites over enemy terrain, where through this program one would search for hostile elements that at first glance might not be detected by the human eye.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
1038520_tesistenmanuelbianco.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.17 MB
Formato Adobe PDF
1.17 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/79730