Grazie alla creazione di database online come The Cancer Genome Atlas (TCGA), abbiamo a disposizione una grande quantità di dati genomici, epigenetici e trascrittomici sui diversi sottotipi tumorali. Si è quindi rivelato anche in questo ambito particolarmente importante il problema della ricerca di comunità, che ci può permettere di identificare quali geni siano alla base dell’eterogeneità dei casi clinici e idealmente di prevedere lo sviluppo di queste patologie. Infomap è un software che usa un metodo di clustering dinamico basato sulla map equation, che cerca partizioni che contengono a lungo il cammino di un random walker al loro interno. Questo metodo ha a lungo ignorato l’informazione sulla struttura bipartita delle reti, ma è stato recentemente proposto uno schema che codifica ed utilizza questa informazione a tassi differenti. Lo scopo di questa tesi è quindi quello di testare Infomap su una rete ricavata da dati del TCGA per comprenderne potenzialità e limiti nell’ambito della ricerca in biologia molecolare.
Possibilità e Limiti di Infomap nella Ricerca di Comunità in Reti Bipartite
MILANESIO, FEDERICO
2020/2021
Abstract
Grazie alla creazione di database online come The Cancer Genome Atlas (TCGA), abbiamo a disposizione una grande quantità di dati genomici, epigenetici e trascrittomici sui diversi sottotipi tumorali. Si è quindi rivelato anche in questo ambito particolarmente importante il problema della ricerca di comunità, che ci può permettere di identificare quali geni siano alla base dell’eterogeneità dei casi clinici e idealmente di prevedere lo sviluppo di queste patologie. Infomap è un software che usa un metodo di clustering dinamico basato sulla map equation, che cerca partizioni che contengono a lungo il cammino di un random walker al loro interno. Questo metodo ha a lungo ignorato l’informazione sulla struttura bipartita delle reti, ma è stato recentemente proposto uno schema che codifica ed utilizza questa informazione a tassi differenti. Lo scopo di questa tesi è quindi quello di testare Infomap su una rete ricavata da dati del TCGA per comprenderne potenzialità e limiti nell’ambito della ricerca in biologia molecolare.File | Dimensione | Formato | |
---|---|---|---|
884369_tesimilanesio.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
1.27 MB
Formato
Adobe PDF
|
1.27 MB | Adobe PDF |
Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/34081