The amount of data collected has increased dramatically over the last decade, and extracting useful information from data sets has become a real challenge. Topological data analysis (TDA) is an approach to the analysis of data that has been around for a few years, which seeks to obtain information on data using methods of topological inspiration. It brings together ideas from different fields of pure and applied mathematics, the most important of which are statistics, geometry and algebra. In this work, after an initial introduction to some theoretical aspects necessary to understand the rest of the paper, an overview of the TDA’s core principles is provided. In particular, the focus is on a few but fundamental tools and topics: simplicial complexes and their use in this field, geometric inference and the theory of persistent homology. The latter plays a key role in TDA, and is described in detail. Finally, an example of application of such tools is given, demonstrating that, thanks to the progress of software, TDA methods can be easily applied in many areas of data science.
Nell'ultimo decennio la quantità di dati raccolti è aumentata drasticamente, ed estrarre dai data set informazioni utili è diventata una vera sfida. La topological data analysis (TDA) è un approccio all'analisi dei dati in circolazione da pochi anni, che cerca di ottenere informazioni sui dati utilizzando metodi di ispirazione topologica. Al suo interno confluiscono idee provenienti da diversi settori della matematica pura e applicata, i più importanti dei quali sono statistica, geometria e algebra. In questo lavoro, dopo un'iniziale introduzione ad alcuni concetti teorici necessari per comprendere il resto della trattazione, viene fornita una panoramica sui principi cardine della TDA. In particolare si pone attenzione su pochi, ma fondamentali strumenti e argomenti: i complessi simpliciali e il loro utilizzo in quest'ambito, l'inferenza geometrica e la teoria dell'omologia persistente. L'ultima gioca un ruolo fondamentale in TDA, ed è descritta in maniera dettagliata. Infine viene dato un esempio di applicazione di tali strumenti, dimostrando che, grazie allo sviluppo dei software, la topological data analysis può essere facilmente applicata in molti ambiti della data science.
Un introduzione alla Topological Data Analysis attraverso l'omologia persistente
COMBA, NICOLAS
2023/2024
Abstract
Nell'ultimo decennio la quantità di dati raccolti è aumentata drasticamente, ed estrarre dai data set informazioni utili è diventata una vera sfida. La topological data analysis (TDA) è un approccio all'analisi dei dati in circolazione da pochi anni, che cerca di ottenere informazioni sui dati utilizzando metodi di ispirazione topologica. Al suo interno confluiscono idee provenienti da diversi settori della matematica pura e applicata, i più importanti dei quali sono statistica, geometria e algebra. In questo lavoro, dopo un'iniziale introduzione ad alcuni concetti teorici necessari per comprendere il resto della trattazione, viene fornita una panoramica sui principi cardine della TDA. In particolare si pone attenzione su pochi, ma fondamentali strumenti e argomenti: i complessi simpliciali e il loro utilizzo in quest'ambito, l'inferenza geometrica e la teoria dell'omologia persistente. L'ultima gioca un ruolo fondamentale in TDA, ed è descritta in maniera dettagliata. Infine viene dato un esempio di applicazione di tali strumenti, dimostrando che, grazie allo sviluppo dei software, la topological data analysis può essere facilmente applicata in molti ambiti della data science.File | Dimensione | Formato | |
---|---|---|---|
tesiLaureaTriennale.pdf
non disponibili
Dimensione
1.85 MB
Formato
Adobe PDF
|
1.85 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/6766