The recent advancements in data collection have lead to a tremendous growth of multidimensional data. With more advanced data comes the difficult task of analyzing the data to determine its significant features. Furthermore it is now often the case that the data is given in the form of very long vectors, where all but a few of the coordinates turn out to be irrelevant to the questions of interest, and we do not necessarily know which coordinates are the interesting ones. The aim of topological data analysis is recovering the lost topology of sampled data. The standard recovery process has two steps: First, we approximate the underlying space of data using a combinatorial structure; Second, we compute topological invariants of this structure, such as homology. There are a number of methods for accomplishing the first step, they aim to construct a complex through which we can approximate the topological features of the sampled data. Constructing a complex is hard, as non-embedded complexes such as clique complexes can get very large, very fast, requiring large construction time and storage. It is a reasonable strategy to search for methods that reduce the size of the complex while preserving its topology. A main goal of this thesis is to develop a computer program using C++ language, that given a complex would reduce it to its tidy set. The tidy set as a minimal simplicial set that captures the topology of a simplicial complex first introduced by Zomorodian in [14], and is particularly effective for computing the homology of clique complexes.

I recenti progressi in rilevamento dai hanno portato ad un aumento dei dati multidimenzionali, con questo tipo di dati ci si è trovati davanti la necessità di analizzare i dati per determinare delle loro caratteristiche significative. Inoltre spesso i dati sono sotto forma di vettori molto lunghi, dove tutte tranne un piccolo numero sono irrilevanti, e non si sa con sicurezza quali di queste coordinate siano quelle importanti. Lo scopo dell'analisi topologica dei dati è di recuperare la topologia dei dati campionati. Il processo per il recupero di queste informazioni si divide in due parti: prima, si approssima lo spazio campionato usando una struttura combinatorica; successivamente si computano gli invarianti topologici di questa struttura, usando per esempio l'omologia. Esistono vari metodi per svolgere la prima parte, il loro scopo è quello di costruire un complesso attraverso il quale si possano approssimare le proprietà topologiche dei dati campionati. Costruire un complesso è difficile, visto che complessi come clique complex tendono a crescere molto velocemente il che richiede molto tempo e spazio di memoria. È ragionevole quindi cercare dei metodi che riducano la grandezza del complesso mantenendo la topologia. Lo scopo principale di questa tesi è di creare un programma in linguaggio C++ che dato un complesso lo riduca ad un tidy set. Un tidy set è un insieme simpliciale minimale che mantiene la topologia del complesso simpliciale introddo per primo da Zomorodian, ed è particolarmente efficace per computare l'omologia dei clique complex.

Omologia Persistente

PATANIA, ALICE
2011/2012

Abstract

I recenti progressi in rilevamento dai hanno portato ad un aumento dei dati multidimenzionali, con questo tipo di dati ci si è trovati davanti la necessità di analizzare i dati per determinare delle loro caratteristiche significative. Inoltre spesso i dati sono sotto forma di vettori molto lunghi, dove tutte tranne un piccolo numero sono irrilevanti, e non si sa con sicurezza quali di queste coordinate siano quelle importanti. Lo scopo dell'analisi topologica dei dati è di recuperare la topologia dei dati campionati. Il processo per il recupero di queste informazioni si divide in due parti: prima, si approssima lo spazio campionato usando una struttura combinatorica; successivamente si computano gli invarianti topologici di questa struttura, usando per esempio l'omologia. Esistono vari metodi per svolgere la prima parte, il loro scopo è quello di costruire un complesso attraverso il quale si possano approssimare le proprietà topologiche dei dati campionati. Costruire un complesso è difficile, visto che complessi come clique complex tendono a crescere molto velocemente il che richiede molto tempo e spazio di memoria. È ragionevole quindi cercare dei metodi che riducano la grandezza del complesso mantenendo la topologia. Lo scopo principale di questa tesi è di creare un programma in linguaggio C++ che dato un complesso lo riduca ad un tidy set. Un tidy set è un insieme simpliciale minimale che mantiene la topologia del complesso simpliciale introddo per primo da Zomorodian, ed è particolarmente efficace per computare l'omologia dei clique complex.
ENG
The recent advancements in data collection have lead to a tremendous growth of multidimensional data. With more advanced data comes the difficult task of analyzing the data to determine its significant features. Furthermore it is now often the case that the data is given in the form of very long vectors, where all but a few of the coordinates turn out to be irrelevant to the questions of interest, and we do not necessarily know which coordinates are the interesting ones. The aim of topological data analysis is recovering the lost topology of sampled data. The standard recovery process has two steps: First, we approximate the underlying space of data using a combinatorial structure; Second, we compute topological invariants of this structure, such as homology. There are a number of methods for accomplishing the first step, they aim to construct a complex through which we can approximate the topological features of the sampled data. Constructing a complex is hard, as non-embedded complexes such as clique complexes can get very large, very fast, requiring large construction time and storage. It is a reasonable strategy to search for methods that reduce the size of the complex while preserving its topology. A main goal of this thesis is to develop a computer program using C++ language, that given a complex would reduce it to its tidy set. The tidy set as a minimal simplicial set that captures the topology of a simplicial complex first introduced by Zomorodian in [14], and is particularly effective for computing the homology of clique complexes.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
308870_tesialicepatania.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.3 MB
Formato Adobe PDF
1.3 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/57250