Il Ranuncolo (Ranunculus asiaticus L; 2X=2n=16) è una specie ornamentale perenne appartenente alla famiglia delle Ranunculaceae. Il genere Ranunculus conta circa 600 specie ed è originario dell’Asia minore e del bacino del Mediterraneo. La produzione rappresenta lo 0,4% del mercato globale dei bulbi recisi ed è concentrata principalmente in Italia, Francia, Paesi Bassi, Israele, Sudafrica, California e Giappone. Tra i paesi produttori a livello mondiale, l’Italia è il principale, con una superficie coltivata di 300-350 ettari e una produzione annua di 132 milioni di bulbi. Per soddisfare la crescente domanda di mercato e migliorare l’efficienza del breeding in questa specie è fondamentale avere una comprensione più approfondita della struttura genetica di R.asiaticus. Sebbene lo sviluppo di strumenti molecolari utili per la selezione di varietà di elite non necessiti della conoscenza completa del genoma di una specie, questa semplifica ampiamente il processo di identificazione di marcatori associati a caratteri di interesse, permettendo inoltre di approfondire le loro basi funzionali. Tuttavia, a causa della complessità e delle dimensioni del suo genoma (dimensione attesa del genoma di circa 7,6Gb), fino ad oggi non è ancora stato pubblicato un genoma di riferimento di ranuncolo, e gli studi genetici si sono basati sull’ uso di tecniche di riduzione della complessità del genoma. L’obbiettivo principale di questa tesi è stato quello di testare tool di assemblaggio diversi per il sequenziamento dalle varietà “Niveo” di R.asiaticus utilizzando la piattaforma MinIon Mk1C. Dopo il sequenziamento, si è proceduto al base calling dei dati grezzi utilizzando il software Dorado versione 0.3.0, utilizzando modelli di alta precisione per il sequenziamento a 400 bps. Le reads ottenute sono state filtrate per mantenere quelle con il punteggio medio di qualità (qscore) superiore a 9, per un totale di 65GB. Successivamente gli assemblatori Flye e Wtgdb2 sono stati utilizzati per generare la sequenza genomica, in seguito migliorata effettuandone un “poolishing” con Medaka. L’assemblato ottenuto consiste in 211.116 scaffold con un N50 di 57.914 bp ed una dimensione totale del genoma di 5,1 Gb, che rappresenta circa il 70% del genoma di questa specie. La sequenza genomica ottenuta è stata successivamente annotata utilizzando il software di deep learning Helixer, che utilizza reti neurali per prevedere la classe genica utilizzando sequenze di DNA come input. L’annotazione ha identificato un totale di circa 112,000 geni, un numero elevato che potrebbe essere attribuito alle difficoltà di Helixer nel risolvere l'annotazione genica in genomi con alto numero di contig e che potrebbe essere risolvibile con approcci diversi di annotazione (Maker-p o Braker). Nonostante ciò, l’analisi di completezza effettuata utilizzando la pipeline BUSCO ha evidenziato come il 75% dei geni attesi è già presente nel genoma assemblato. La costruzione di questo primo genoma di riferimento di R. asiaticus rappresenta un importante avanzamento nella conoscenza genomica di ranuncolo, in quanto facilità lo sviluppo di marcatori molecolari utili nello sviluppo di nuove varietà elite, con caratteristiche qualitative e agronomiche superiori, e con migliori tratti di resistenza. Inoltre, l’ottenimento di un genoma di riferimento annotato aggiungerà informazioni importanti ai dati raccolti dalle analisi QTL già effettuata in precedenza.
Sequenziamento ed annotazione del primo genoma reference di Ranunculus asiaticus
VERGNANO, EDOARDO
2022/2023
Abstract
Il Ranuncolo (Ranunculus asiaticus L; 2X=2n=16) è una specie ornamentale perenne appartenente alla famiglia delle Ranunculaceae. Il genere Ranunculus conta circa 600 specie ed è originario dell’Asia minore e del bacino del Mediterraneo. La produzione rappresenta lo 0,4% del mercato globale dei bulbi recisi ed è concentrata principalmente in Italia, Francia, Paesi Bassi, Israele, Sudafrica, California e Giappone. Tra i paesi produttori a livello mondiale, l’Italia è il principale, con una superficie coltivata di 300-350 ettari e una produzione annua di 132 milioni di bulbi. Per soddisfare la crescente domanda di mercato e migliorare l’efficienza del breeding in questa specie è fondamentale avere una comprensione più approfondita della struttura genetica di R.asiaticus. Sebbene lo sviluppo di strumenti molecolari utili per la selezione di varietà di elite non necessiti della conoscenza completa del genoma di una specie, questa semplifica ampiamente il processo di identificazione di marcatori associati a caratteri di interesse, permettendo inoltre di approfondire le loro basi funzionali. Tuttavia, a causa della complessità e delle dimensioni del suo genoma (dimensione attesa del genoma di circa 7,6Gb), fino ad oggi non è ancora stato pubblicato un genoma di riferimento di ranuncolo, e gli studi genetici si sono basati sull’ uso di tecniche di riduzione della complessità del genoma. L’obbiettivo principale di questa tesi è stato quello di testare tool di assemblaggio diversi per il sequenziamento dalle varietà “Niveo” di R.asiaticus utilizzando la piattaforma MinIon Mk1C. Dopo il sequenziamento, si è proceduto al base calling dei dati grezzi utilizzando il software Dorado versione 0.3.0, utilizzando modelli di alta precisione per il sequenziamento a 400 bps. Le reads ottenute sono state filtrate per mantenere quelle con il punteggio medio di qualità (qscore) superiore a 9, per un totale di 65GB. Successivamente gli assemblatori Flye e Wtgdb2 sono stati utilizzati per generare la sequenza genomica, in seguito migliorata effettuandone un “poolishing” con Medaka. L’assemblato ottenuto consiste in 211.116 scaffold con un N50 di 57.914 bp ed una dimensione totale del genoma di 5,1 Gb, che rappresenta circa il 70% del genoma di questa specie. La sequenza genomica ottenuta è stata successivamente annotata utilizzando il software di deep learning Helixer, che utilizza reti neurali per prevedere la classe genica utilizzando sequenze di DNA come input. L’annotazione ha identificato un totale di circa 112,000 geni, un numero elevato che potrebbe essere attribuito alle difficoltà di Helixer nel risolvere l'annotazione genica in genomi con alto numero di contig e che potrebbe essere risolvibile con approcci diversi di annotazione (Maker-p o Braker). Nonostante ciò, l’analisi di completezza effettuata utilizzando la pipeline BUSCO ha evidenziato come il 75% dei geni attesi è già presente nel genoma assemblato. La costruzione di questo primo genoma di riferimento di R. asiaticus rappresenta un importante avanzamento nella conoscenza genomica di ranuncolo, in quanto facilità lo sviluppo di marcatori molecolari utili nello sviluppo di nuove varietà elite, con caratteristiche qualitative e agronomiche superiori, e con migliori tratti di resistenza. Inoltre, l’ottenimento di un genoma di riferimento annotato aggiungerà informazioni importanti ai dati raccolti dalle analisi QTL già effettuata in precedenza.File | Dimensione | Formato | |
---|---|---|---|
822396_tesi_edoardo_vergnano.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
2.25 MB
Formato
Adobe PDF
|
2.25 MB | Adobe PDF |
Se sei interessato/a a consultare l'elaborato, vai nella sezione Home in alto a destra, dove troverai le informazioni su come richiederlo. I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/107338