Lo studio dell'ancestry di un individuo, ovvero l'appartenenza genetica dell'individuo ad una determinata popolazione, è utile in diverse situazioni, ad esempio nelle scienze forensi, nella predizione del rischio medico e negli studi di storia evolutiva. In questa tesi studiamo vari aspetti metodologici legati alla ricostruzione dell'ancestry a partire da marcatori genetici: - stima delle frequenze genotipiche in una popolazione a partire da un campione finito di individui; - utilizzo di un classificatore di Bayes per l'assegnazione di un individuo ad una popolazione; - metodi per individuare i marcatori più informativi per l'assegnazione. Nei vari capitoli verranno presentate le differenze tra questi metodi di calcolo delle frequenze e di scelta di marcatori e ad ognuno di essi verrà associato uno score per decretare, attraverso vari test su diversi dataset, quale metodo risulti essere migliore. Tutti i metodi sono implementati su Python e testati su dati reali ottenuti da dataset pubblici, tra cui quello del 1000 Genomes Project.
Ancestry Informative Markers: metodi e applicazioni
RAMELLA, MARTINA
2016/2017
Abstract
Lo studio dell'ancestry di un individuo, ovvero l'appartenenza genetica dell'individuo ad una determinata popolazione, è utile in diverse situazioni, ad esempio nelle scienze forensi, nella predizione del rischio medico e negli studi di storia evolutiva. In questa tesi studiamo vari aspetti metodologici legati alla ricostruzione dell'ancestry a partire da marcatori genetici: - stima delle frequenze genotipiche in una popolazione a partire da un campione finito di individui; - utilizzo di un classificatore di Bayes per l'assegnazione di un individuo ad una popolazione; - metodi per individuare i marcatori più informativi per l'assegnazione. Nei vari capitoli verranno presentate le differenze tra questi metodi di calcolo delle frequenze e di scelta di marcatori e ad ognuno di essi verrà associato uno score per decretare, attraverso vari test su diversi dataset, quale metodo risulti essere migliore. Tutti i metodi sono implementati su Python e testati su dati reali ottenuti da dataset pubblici, tra cui quello del 1000 Genomes Project.File | Dimensione | Formato | |
---|---|---|---|
771489_tesifinita.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
1.31 MB
Formato
Adobe PDF
|
1.31 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/87515