Numerous observational studies have shown an association between higher education and a lower risk of developing chronic diseases, especially diabetes. This thesis aims to analyze this observational association through a Mendelian randomization analysis, looking for possible causal relationships. A similar study is necessary as observational studies are strongly subject to the risk of distortion linked to confounders of various kinds and are not suitable for analyzing the phenomenon from a causal point of view, and a randomized controlled study is not applicable in such a context. Using a large number of single nucleotide polymorphisms (SNPs) associated with higher education levels, measured on the basis of the number of school years attended, as instrumental variables it is possible to make causal inference on the effect of having higher education levels on the risk to develop type II diabetes. This approach is commonly called Mendelian randomization. Such approach is based on the assumptions that adequate instrumental variables are available, associated with exposure but not with outcome or other confounders. In the thesis a brief introduction will be presented on the nature of instrumental variables, unconventional being genetic variants, and on the methods of instrumental variables in general and of Mendelian randomization in particular. The strengths of such an approach will be presented, as well as the limits and assumptions that need to be made so that it is possible to discuss causal association. The effects of exposure on the outcome will be estimated using two different estimators, the ratio of coefficients estimator and the two-stage estimator. The data used for Mendelian randomization, regarding the genetic variants used as instrumental variables, come from two different genome-wide studies, from which it was possible to obtain over 1200 SNPs relevant for the association with educational attainment. These variants will be combined into a single allele score for estimation purposes.

Numerosi studi osservazionali hanno evidenziato un’associazione tra educazione elevata e minore rischio di insorgenza di malattie croniche, in particolar modo diabete. Questa tesi si propone di analizzare tale associazione osservazionale attraverso un’analisi di randomizzazione Mendeliana, alla ricerca di possibili rapporti causali. Uno studio simile risulta necessario in quanto studi osservazionali sono fortemente soggetti a rischio di distorsione legata a confondenti di varia natura e non sono adatti ad analizzare il fenomeno dal punto di vista causale, ed uno studio controllato randomizzato non è applicabile in un simile contesto. Utilizzando un gran numero di polimorfismi a singolo nucleotide (SNP) associati ad elevati livelli di istruzione, misurati sulla base del numero di anni di scolarizzazione frequentati, come variabili strumentali è possibile fare inferenza causale sull’effetto di possedere livelli elevati di educazione sul rischio di sviluppare diabete di II tipo. Tale approccio è chiamato comunemente randomizzazione Mendeliana. Un simile approccio si basa sulle assunzioni che siano disponibili delle variabili strumentali adeguate, associate con l’esposizione ma non con l’outcome o altri confondenti. Nel corso della tesi verrà presentata una breve introduzione sulla natura delle variabili strumentali, non convenzionali in quanto varianti genetiche, e sui metodi delle variabili strumentali in generale e della randomizzazione Mendeliana in particolare. Verranno presentati i punti di forza di un simile approccio ma anche i limiti e le assunzioni che è necessario fare affinchè sia possibile discutere di associazione causale. Verranno stimati gli effetti dell’esposizione sull’outcome utilizzando due diversi stimatori, lo stimatore del rapporto dei coefficienti e lo stimatore a due stadi. I dati utilizzati per la randomizzazione Mendeliana, riguardanti le varianti genetiche utilizzate come variabili strumentali, provengono da due diversi studi genome-wide, dai quali è stato possibile ricavare oltre 1200 SNPs rilevanti per l’associazione con il livello di istruzione. Queste varianti saranno combinate in un unico allele score per finalità di stima.

Associazione tra titolo di studio e rischio di diabete di tipo 2: analisi con le tecniche della randomizzazione mendeliana

FERRERO, ALBERTO
2019/2020

Abstract

Numerosi studi osservazionali hanno evidenziato un’associazione tra educazione elevata e minore rischio di insorgenza di malattie croniche, in particolar modo diabete. Questa tesi si propone di analizzare tale associazione osservazionale attraverso un’analisi di randomizzazione Mendeliana, alla ricerca di possibili rapporti causali. Uno studio simile risulta necessario in quanto studi osservazionali sono fortemente soggetti a rischio di distorsione legata a confondenti di varia natura e non sono adatti ad analizzare il fenomeno dal punto di vista causale, ed uno studio controllato randomizzato non è applicabile in un simile contesto. Utilizzando un gran numero di polimorfismi a singolo nucleotide (SNP) associati ad elevati livelli di istruzione, misurati sulla base del numero di anni di scolarizzazione frequentati, come variabili strumentali è possibile fare inferenza causale sull’effetto di possedere livelli elevati di educazione sul rischio di sviluppare diabete di II tipo. Tale approccio è chiamato comunemente randomizzazione Mendeliana. Un simile approccio si basa sulle assunzioni che siano disponibili delle variabili strumentali adeguate, associate con l’esposizione ma non con l’outcome o altri confondenti. Nel corso della tesi verrà presentata una breve introduzione sulla natura delle variabili strumentali, non convenzionali in quanto varianti genetiche, e sui metodi delle variabili strumentali in generale e della randomizzazione Mendeliana in particolare. Verranno presentati i punti di forza di un simile approccio ma anche i limiti e le assunzioni che è necessario fare affinchè sia possibile discutere di associazione causale. Verranno stimati gli effetti dell’esposizione sull’outcome utilizzando due diversi stimatori, lo stimatore del rapporto dei coefficienti e lo stimatore a due stadi. I dati utilizzati per la randomizzazione Mendeliana, riguardanti le varianti genetiche utilizzate come variabili strumentali, provengono da due diversi studi genome-wide, dai quali è stato possibile ricavare oltre 1200 SNPs rilevanti per l’associazione con il livello di istruzione. Queste varianti saranno combinate in un unico allele score per finalità di stima.
ITA
Numerous observational studies have shown an association between higher education and a lower risk of developing chronic diseases, especially diabetes. This thesis aims to analyze this observational association through a Mendelian randomization analysis, looking for possible causal relationships. A similar study is necessary as observational studies are strongly subject to the risk of distortion linked to confounders of various kinds and are not suitable for analyzing the phenomenon from a causal point of view, and a randomized controlled study is not applicable in such a context. Using a large number of single nucleotide polymorphisms (SNPs) associated with higher education levels, measured on the basis of the number of school years attended, as instrumental variables it is possible to make causal inference on the effect of having higher education levels on the risk to develop type II diabetes. This approach is commonly called Mendelian randomization. Such approach is based on the assumptions that adequate instrumental variables are available, associated with exposure but not with outcome or other confounders. In the thesis a brief introduction will be presented on the nature of instrumental variables, unconventional being genetic variants, and on the methods of instrumental variables in general and of Mendelian randomization in particular. The strengths of such an approach will be presented, as well as the limits and assumptions that need to be made so that it is possible to discuss causal association. The effects of exposure on the outcome will be estimated using two different estimators, the ratio of coefficients estimator and the two-stage estimator. The data used for Mendelian randomization, regarding the genetic variants used as instrumental variables, come from two different genome-wide studies, from which it was possible to obtain over 1200 SNPs relevant for the association with educational attainment. These variants will be combined into a single allele score for estimation purposes.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
795405_tesialbertoferrero.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 1.11 MB
Formato Adobe PDF
1.11 MB Adobe PDF

Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Usare il seguente URL per citare questo documento: https://hdl.handle.net/20.500.14240/27700