Grazie alla creazione di database online come The Cancer Genome Atlas (TCGA), abbiamo a disposizione una grande quantità di dati genomici, epigenetici e trascrittomici sui diversi sottotipi tumorali. Si è quindi rivelato anche in questo ambito particolarmente importante il problema della ricerca di comunità, che ci può permettere di identificare quali geni siano alla base dell’eterogeneità dei casi clinici e idealmente di prevedere lo sviluppo di queste patologie. Infomap è un software che usa un metodo di clustering dinamico basato sulla map equation, che cerca partizioni che contengono a lungo il cammino di un random walker al loro interno. Questo metodo ha a lungo ignorato l’informazione sulla struttura bipartita delle reti, ma è stato recentemente proposto uno schema che codifica ed utilizza questa informazione a tassi differenti. Lo scopo di questa tesi è quindi quello di testare Infomap su una rete ricavata da dati del TCGA per comprenderne potenzialità e limiti nell’ambito della ricerca in biologia molecolare.

Possibilità e Limiti di Infomap nella Ricerca di Comunità in Reti Bipartite

MILANESIO, FEDERICO
2020/2021

Abstract

Grazie alla creazione di database online come The Cancer Genome Atlas (TCGA), abbiamo a disposizione una grande quantità di dati genomici, epigenetici e trascrittomici sui diversi sottotipi tumorali. Si è quindi rivelato anche in questo ambito particolarmente importante il problema della ricerca di comunità, che ci può permettere di identificare quali geni siano alla base dell’eterogeneità dei casi clinici e idealmente di prevedere lo sviluppo di queste patologie. Infomap è un software che usa un metodo di clustering dinamico basato sulla map equation, che cerca partizioni che contengono a lungo il cammino di un random walker al loro interno. Questo metodo ha a lungo ignorato l’informazione sulla struttura bipartita delle reti, ma è stato recentemente proposto uno schema che codifica ed utilizza questa informazione a tassi differenti. Lo scopo di questa tesi è quindi quello di testare Infomap su una rete ricavata da dati del TCGA per comprenderne potenzialità e limiti nell’ambito della ricerca in biologia molecolare.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
884369_tesimilanesio.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.27 MB
Formato Adobe PDF
1.27 MB Adobe PDF

Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Usare il seguente URL per citare questo documento: https://hdl.handle.net/20.500.14240/34081