Lo studio dell'ancestry di un individuo, ovvero l'appartenenza genetica dell'individuo ad una determinata popolazione, è utile in diverse situazioni, ad esempio nelle scienze forensi, nella predizione del rischio medico e negli studi di storia evolutiva. In questa tesi studiamo vari aspetti metodologici legati alla ricostruzione dell'ancestry a partire da marcatori genetici: - stima delle frequenze genotipiche in una popolazione a partire da un campione finito di individui; - utilizzo di un classificatore di Bayes per l'assegnazione di un individuo ad una popolazione; - metodi per individuare i marcatori più informativi per l'assegnazione. Nei vari capitoli verranno presentate le differenze tra questi metodi di calcolo delle frequenze e di scelta di marcatori e ad ognuno di essi verrà associato uno score per decretare, attraverso vari test su diversi dataset, quale metodo risulti essere migliore. Tutti i metodi sono implementati su Python e testati su dati reali ottenuti da dataset pubblici, tra cui quello del 1000 Genomes Project.

Ancestry Informative Markers: metodi e applicazioni

RAMELLA, MARTINA
2016/2017

Abstract

Lo studio dell'ancestry di un individuo, ovvero l'appartenenza genetica dell'individuo ad una determinata popolazione, è utile in diverse situazioni, ad esempio nelle scienze forensi, nella predizione del rischio medico e negli studi di storia evolutiva. In questa tesi studiamo vari aspetti metodologici legati alla ricostruzione dell'ancestry a partire da marcatori genetici: - stima delle frequenze genotipiche in una popolazione a partire da un campione finito di individui; - utilizzo di un classificatore di Bayes per l'assegnazione di un individuo ad una popolazione; - metodi per individuare i marcatori più informativi per l'assegnazione. Nei vari capitoli verranno presentate le differenze tra questi metodi di calcolo delle frequenze e di scelta di marcatori e ad ognuno di essi verrà associato uno score per decretare, attraverso vari test su diversi dataset, quale metodo risulti essere migliore. Tutti i metodi sono implementati su Python e testati su dati reali ottenuti da dataset pubblici, tra cui quello del 1000 Genomes Project.
ITA
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
771489_tesifinita.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.31 MB
Formato Adobe PDF
1.31 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/87515