L’odierna disponibilità commerciale di sistemi di genotipizzazione automatica di marcatori molecolari SNP (Single Nucleotide Polymorphism) ha fatto sì che le valutazioni genomiche degli animali da reddito, già ampiamente usate nelle popolazioni di bovini da latte, stiano diventando sempre più frequenti anche per le razze bovine da carne. Ad esempio l’A.N.A.Bo.Ra.Pi., per i torelli e i tori di inseminazione artificiale, pubblica due indici genomici per i caratteri riproduttivi. Tuttavia la dimensione della popolazione di stima (o reference) utilizzata è decisamente inferiore rispetto a quella solitamente utilizzata nelle razze bovine da latte cosmopolite e questo rende la capacità predittiva degli indici genomici minore. Oltretutto, ancora non sono disponibili indici genomici per i caratteri produttivi nelle femmine. Per utilizzare le vacche per le predizioni genomiche è necessario disporre dei loro genotipi alla stessa densità di quelli dei tori di IA, quindi in questo studio preliminare è stata analizzata l’accuratezza delle tecniche di imputazione per ricostruire i genotipi delle vacche di razza Piemontese, in previsione di un loro futuro utilizzo. Siccome per validare l’accuratezza di imputazione delle vacche non sono disponibili i loro genotipi a media densità (MD), dato che sono genotipizzate utilizzando solamente SNP chip a bassa densità (LD), allora sono stati valutati due gruppi di animali target: i maschi (M3-M4) e le femmine (F1-F2) imputati da uno SNP-panel a densità estremamente bassa (ELD) per ottenerne uno LD; successivamente è stata valutata l’accuratezza di imputazione nei maschi dal panel LD a quello MD (M1-M2), per un totale di sei scenari. È stato utilizzato il software FImpute, sia applicando solamente l’imputazione population-based (scenari M1, M3, F1) che sia la family + population-based (scenari M2, M4, F2). L’imputazione population-based è dimostrato essere più affidabile in presenza errori nel pedigree o pedigree incompleti. L’accuratezza di imputazione è stata valutata sia mediante la percentuale di genotipi correttamente imputati (CR) che il coefficiente di correlazione di Pearson (r) tra i genotipi imputati e quelli reali negli animali target. Sono state, inoltre, studiate le relazioni tra l’accuratezza di imputazione e alcuni dei principali fattori che la influenzano (frequenza dell’allele minore - MAF, parentela tra gli individui del gruppo target e reference, inclusione o meno dei genitori nel gruppo di reference, e, infine, il numero di antenati presenti nel gruppo di reference). Gli scenari M3 (CR: 0.87, r: 0.88) e F1 (CR: 0.88, r: 0.89) hanno riportato simili accuratezze di imputazione per animale, questo lascia ipotizzare che l’accuratezza di imputazione delle femmine, quando imputate da LD a MD, possa essere comparabile a quella dei maschi dello scenario M1 (CR: 0.97; r: 0.97). E’ stata messa in luce una relazione negativa tra CR e MAF ed una sostanziale indipendenza tra r e MAF (quando MAF >0.10). Inoltre, è stata evidenziata una relazione positiva tra r e la parentela media degli animali del gruppo target e quelli del gruppo reference, un’associazione positiva tra r e il numero di genitori inclusi nella reference e negativa tra r e il numero di antenati presenti nella medesima popolazione. I risultati sono in linea con quelli riportati in bibliografia.

Nowadays genomic evaluations of cattle are becoming spreadly used also across beef breeds. The A.N.A.Bo.Ra.Pi. publishes two genomic indexes of reproductive traits of Piemontese AI bulls, but the reference population employed is drastically fewer than that used by cosmopolitan dairy cattle and this makes the predictive power of indexes poorer. Still, productive traits genomic indexes for Piemontese cows are not yet available and thus indexes of females are deeply influenced by their pedigree. To use cows for genomic purposes it is necessary to have their genotypes at the same density of those of AI bulls; thus, in this preliminar study the accuracy of imputation techniques to reconstruct the genotypes of cows is investigated. Since medium density (MD) genotypes of females are not available to validate imputation accuracy, because females are genotyped using only low density SNP-chip, then two target scenario are used, in which males (M3-M4) and females (F1-F2) are represented separately, imputed from extremely low density (ELD) to low density (LD) panel; then the imputation accuracy of males is tested starting from LD to MD panel (M1-M2). The software FImpute is used to perform imputation in this analysis, is used both the population-based (scenario M1, M3, F1) and the family + population-based imputation (M2, M4, F2), the population-based imputation demonstrate to be more reliable when are present errors in the pedigree, for this reason this study focused on M1-M3-F1 scenarios. The imputation accuracy is estimated using the percentage of correctly imputed genotypes (CR) and Pearson's correlation coefficient (r) between true and imputed genotypes. M3 (CR: 0.87, r: 0.88) and F1 (CR: 0.88, r: 0.89) show comparable accuracy per animal and this let ipotize that the imputation accuracy of cows when imputing from LD to MD panel could be the same as males in the scenario M1 (CR: 0.97; r: 0.97). The relationships between imputation accuracy and some of the main factors that influence it (Minor Allele Frequency - MAF, kinship between target and reference individuals, parents included in the reference group, number of reference ancestors) are investigated, finding a negative relationship between CR and MAF, independence between r and MAF (when MAF > 0.10), positive relationship between r and kinship and parents included in the reference, negative between r and number of reference ancestors. The results are comparable with those reported in bibliography.

Uso dell'imputazione per la ricostruzione dei genotipi di bovine di Razza Piemontese

PORTAS, MANUELA
2020/2021

Abstract

Nowadays genomic evaluations of cattle are becoming spreadly used also across beef breeds. The A.N.A.Bo.Ra.Pi. publishes two genomic indexes of reproductive traits of Piemontese AI bulls, but the reference population employed is drastically fewer than that used by cosmopolitan dairy cattle and this makes the predictive power of indexes poorer. Still, productive traits genomic indexes for Piemontese cows are not yet available and thus indexes of females are deeply influenced by their pedigree. To use cows for genomic purposes it is necessary to have their genotypes at the same density of those of AI bulls; thus, in this preliminar study the accuracy of imputation techniques to reconstruct the genotypes of cows is investigated. Since medium density (MD) genotypes of females are not available to validate imputation accuracy, because females are genotyped using only low density SNP-chip, then two target scenario are used, in which males (M3-M4) and females (F1-F2) are represented separately, imputed from extremely low density (ELD) to low density (LD) panel; then the imputation accuracy of males is tested starting from LD to MD panel (M1-M2). The software FImpute is used to perform imputation in this analysis, is used both the population-based (scenario M1, M3, F1) and the family + population-based imputation (M2, M4, F2), the population-based imputation demonstrate to be more reliable when are present errors in the pedigree, for this reason this study focused on M1-M3-F1 scenarios. The imputation accuracy is estimated using the percentage of correctly imputed genotypes (CR) and Pearson's correlation coefficient (r) between true and imputed genotypes. M3 (CR: 0.87, r: 0.88) and F1 (CR: 0.88, r: 0.89) show comparable accuracy per animal and this let ipotize that the imputation accuracy of cows when imputing from LD to MD panel could be the same as males in the scenario M1 (CR: 0.97; r: 0.97). The relationships between imputation accuracy and some of the main factors that influence it (Minor Allele Frequency - MAF, kinship between target and reference individuals, parents included in the reference group, number of reference ancestors) are investigated, finding a negative relationship between CR and MAF, independence between r and MAF (when MAF > 0.10), positive relationship between r and kinship and parents included in the reference, negative between r and number of reference ancestors. The results are comparable with those reported in bibliography.
ENG
L’odierna disponibilità commerciale di sistemi di genotipizzazione automatica di marcatori molecolari SNP (Single Nucleotide Polymorphism) ha fatto sì che le valutazioni genomiche degli animali da reddito, già ampiamente usate nelle popolazioni di bovini da latte, stiano diventando sempre più frequenti anche per le razze bovine da carne. Ad esempio l’A.N.A.Bo.Ra.Pi., per i torelli e i tori di inseminazione artificiale, pubblica due indici genomici per i caratteri riproduttivi. Tuttavia la dimensione della popolazione di stima (o reference) utilizzata è decisamente inferiore rispetto a quella solitamente utilizzata nelle razze bovine da latte cosmopolite e questo rende la capacità predittiva degli indici genomici minore. Oltretutto, ancora non sono disponibili indici genomici per i caratteri produttivi nelle femmine. Per utilizzare le vacche per le predizioni genomiche è necessario disporre dei loro genotipi alla stessa densità di quelli dei tori di IA, quindi in questo studio preliminare è stata analizzata l’accuratezza delle tecniche di imputazione per ricostruire i genotipi delle vacche di razza Piemontese, in previsione di un loro futuro utilizzo. Siccome per validare l’accuratezza di imputazione delle vacche non sono disponibili i loro genotipi a media densità (MD), dato che sono genotipizzate utilizzando solamente SNP chip a bassa densità (LD), allora sono stati valutati due gruppi di animali target: i maschi (M3-M4) e le femmine (F1-F2) imputati da uno SNP-panel a densità estremamente bassa (ELD) per ottenerne uno LD; successivamente è stata valutata l’accuratezza di imputazione nei maschi dal panel LD a quello MD (M1-M2), per un totale di sei scenari. È stato utilizzato il software FImpute, sia applicando solamente l’imputazione population-based (scenari M1, M3, F1) che sia la family + population-based (scenari M2, M4, F2). L’imputazione population-based è dimostrato essere più affidabile in presenza errori nel pedigree o pedigree incompleti. L’accuratezza di imputazione è stata valutata sia mediante la percentuale di genotipi correttamente imputati (CR) che il coefficiente di correlazione di Pearson (r) tra i genotipi imputati e quelli reali negli animali target. Sono state, inoltre, studiate le relazioni tra l’accuratezza di imputazione e alcuni dei principali fattori che la influenzano (frequenza dell’allele minore - MAF, parentela tra gli individui del gruppo target e reference, inclusione o meno dei genitori nel gruppo di reference, e, infine, il numero di antenati presenti nel gruppo di reference). Gli scenari M3 (CR: 0.87, r: 0.88) e F1 (CR: 0.88, r: 0.89) hanno riportato simili accuratezze di imputazione per animale, questo lascia ipotizzare che l’accuratezza di imputazione delle femmine, quando imputate da LD a MD, possa essere comparabile a quella dei maschi dello scenario M1 (CR: 0.97; r: 0.97). E’ stata messa in luce una relazione negativa tra CR e MAF ed una sostanziale indipendenza tra r e MAF (quando MAF >0.10). Inoltre, è stata evidenziata una relazione positiva tra r e la parentela media degli animali del gruppo target e quelli del gruppo reference, un’associazione positiva tra r e il numero di genitori inclusi nella reference e negativa tra r e il numero di antenati presenti nella medesima popolazione. I risultati sono in linea con quelli riportati in bibliografia.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
801983_manuelaportas_tesi.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 4.89 MB
Formato Adobe PDF
4.89 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/152885