The single cell transcriptome sequencing technology (scRNA-seq) has opened new scenarios in biomedical research, allowing to characterize the genotypic heterogeneity present in the same tissue or organ, without the prior knowledge necessary for other technologies such as, for example, the FACS. At the same time, the scRNA-seq underlined the presence of particular critical issues in the integration of data from different experiments. Among these, the recognition of cell clusters (cluster), containing similar cell types, in different experiments, is one of the most important, as it is essential to highlight similarities and differences between the cellular profiles of different patients who share the same pathology. In particular, in order to identify similar clusters between two datasets, I decided to use a method known as integrative factor analysis. This, like other approaches for identifying similar characteristics between clusters, uses a group of specific marker genes for each cluster that you intend to compare with others. In this manuscript I describe the characteristics of the integrative factor analysis in the integration of data from different experiments and the implementation of a tool that guarantees the reproducibility of the analyzes through the use of Docker container technology.
La tecnologia di sequenziamento del trascrittoma a singola cellula (scRNA-seq) ha aperto nuovi scenari nella ricerca biomedica, permettendo di caratterizzare l'eterogeneità genotipica presente in uno stesso tessuto o organo, senza le conoscenze a priori necessarie per altre tecnologie quali, ad esempio, il FACS. Al contempo, la scRNA-seq ha sottolineato la presenza di particolari criticità nell'integrazione di dati provenienti da esperimenti diversi. Tra queste, il riconoscimento di raggruppamenti cellulari (cluster), contenenti tipologie di cellule simili, in esperimenti diversi, è una delle più importanti, in quanto essenziale per evidenziare similarità e differenze tra i profili cellulari di diversi pazienti che condividano la stessa patologia. In particolare, allo scopo di identificare clusters simili tra due set di dati, ho deciso di usare una metodica nota come analisi integrativa fattoriale. Questo, come altri approcci di identificazione di caratteristiche simili tra clusters, utilizza un gruppo di geni marcatori specifici per ogni cluster che si intende comparare con altri. In questo manoscritto descrivo le caratteristiche dell'analisi integrativa fattoriale nell'integrazione di dati provenienti da esperimenti diversi e l'implementazione di uno strumento che garantisca la riproducibilità delle analisi attraverso l'uso della tecnologia dei Docker containers.
Integrazione di dati di single-cell RNA-seq attraverso l'uso dell'analisi integrativa fattoriale
MARTONE, GIUSEPPE
2019/2020
Abstract
La tecnologia di sequenziamento del trascrittoma a singola cellula (scRNA-seq) ha aperto nuovi scenari nella ricerca biomedica, permettendo di caratterizzare l'eterogeneità genotipica presente in uno stesso tessuto o organo, senza le conoscenze a priori necessarie per altre tecnologie quali, ad esempio, il FACS. Al contempo, la scRNA-seq ha sottolineato la presenza di particolari criticità nell'integrazione di dati provenienti da esperimenti diversi. Tra queste, il riconoscimento di raggruppamenti cellulari (cluster), contenenti tipologie di cellule simili, in esperimenti diversi, è una delle più importanti, in quanto essenziale per evidenziare similarità e differenze tra i profili cellulari di diversi pazienti che condividano la stessa patologia. In particolare, allo scopo di identificare clusters simili tra due set di dati, ho deciso di usare una metodica nota come analisi integrativa fattoriale. Questo, come altri approcci di identificazione di caratteristiche simili tra clusters, utilizza un gruppo di geni marcatori specifici per ogni cluster che si intende comparare con altri. In questo manoscritto descrivo le caratteristiche dell'analisi integrativa fattoriale nell'integrazione di dati provenienti da esperimenti diversi e l'implementazione di uno strumento che garantisca la riproducibilità delle analisi attraverso l'uso della tecnologia dei Docker containers.File | Dimensione | Formato | |
---|---|---|---|
868158_tesigiuseppemartone22luglio_dastampare.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
71.55 MB
Formato
Adobe PDF
|
71.55 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/155558