The hazel (Corylus avellana L.) is an arboreal species belonging to the genus Corylus (order Fagales, family Betulaceae, subfamily Coryloideae). The hazel cultivation show a growing trend worldwide and Italy is the second world producer with 104 000 mt per year after Turkey (570 000 mt). Hazelnuts are mainly intended for the confectionery industry, where they are used in the production of a wide range of products including creams, baked goods and other snacks. The genomic resources publicly available to date are mainly made up of a set of transcriptomic sequences (PRJNA168381) and a genomic sequence of the 'Jefferson' cultivar, released in 2009 by Oregon State University. Being the genomic sequence of the cv. 'Jefferson' very fragmented (N50 = 21 508; L50 = 4253), the purpose of this work was to conduct a new genomic sequencing using the cultivar 'Tonda Gentile' (syn. 'Tonda Gentile delle Langhe') and using the technology 10X Genomics. This method, based on the use of linked-reads sequenced by means of Illumina technology, allows to obtain: i) very extensive assembled molecules, ii) to discriminate haplotypes and iii) to solve areas with high repetitiveness. The genome was assembled using the Supernova assembler and improved with the GapCloser software which allows the number of undetermined bases (N) to be reduced. The product assembly shows a total size of 414 Mbp, and greater integrity (N50 = 51 567 bp; L50 = 1457), compared to that of the cv. 'Jefferson'. Thanks to the construction of a new genetic map, 748 scaffolds were combined into pseudomolecules reaching a size equal to a quarter of the genome (108 Mb). The structural annotation of the genome was carried out using the MAKER pipeline, revealing the presence of approximately 28 000 genes; the latter compared with a set of representative genes (BUSCO analysis) showed a completeness equal to 89.9%.​

Il nocciolo (Corylus avellana L.) è una specie arborea appartenente al genere Corylus (ordine Fagales, famiglia Betulaceae, sottofamiglia Coryloideae). Si tratta di una coltura in continua crescita a livello mondiale e l'Italia è il secondo produttore mondiale con 104 000 mt annue dopo la Turchia (570 000 mt). Le nocciole sono principalmente destinate all'industria dolciaria, dove vengono impiegate nella realizzazione di una vasta gamma di prodotti tra cui creme, prodotti da forno e altri snack. Le risorse genomiche pubblicamente disponibili ad oggi sono principalmente costituite da un set di sequenze trascrittomiche (PRJNA168381) e da una sequenza genomica della cultivar 'Jefferson', rilasciata nel 2009 dalla Oregon State University. Essendo la sequenza genomica della cv. Jefferson molto frammentata (N50= 21508; L50 = 4253), lo scopo di questo lavoro è stato quello di condurre un nuovo sequenziamento genomico utilizzando la cultivar Tonda Gentile (sin. Tonda Gentile delle Langhe) e avvalendosi della tecnologia 10X Genomics. Questo metodo, basato sull'impiego di linked-reads sequenziate per mezzo della tecnologia Illumina, consente di ottenere: i) molecole assemblate molto estese, ii) di discriminare gli aplotipi e iii) risolvere zone ad alta ripetitività. Il genoma è stato assemblato mediante l'utilizzo dellassemblatore Supernova e migliorato con il programma GapCloser che permette di diminuire il numero di basi indeterminate (N). Lassemblaggio prodotto mostra una dimensione totale di 414 Mbp, e una maggiore integrità (N50 = 51.567 bp; L50 = 1457), rispetto a quello della cv. 'Jefferson'. Grazie alla costruzione di una nuova mappa genetica, 748 scaffold sono stati riuniti in pseudomolecole raggiungendo una dimensione pari ad un quarto del genoma (108 Mb). Lannotazione strutturale del genoma è stata effettuata utilizzando la pipeline MAKER, rivelando la presenza di circa 28 000 geni; questi ultimi comparati con un set di geni rappresentativi (analisi BUSCO) ha mostrato una completezza pari al 89.9%.​

Assemblaggio del genoma di Corylus avellana cv. Tonda Gentile utilizzando linked-reads (10x Genomics)​

CAVALET-GIORSA, EMILE
2018/2019

Abstract

Il nocciolo (Corylus avellana L.) è una specie arborea appartenente al genere Corylus (ordine Fagales, famiglia Betulaceae, sottofamiglia Coryloideae). Si tratta di una coltura in continua crescita a livello mondiale e l'Italia è il secondo produttore mondiale con 104 000 mt annue dopo la Turchia (570 000 mt). Le nocciole sono principalmente destinate all'industria dolciaria, dove vengono impiegate nella realizzazione di una vasta gamma di prodotti tra cui creme, prodotti da forno e altri snack. Le risorse genomiche pubblicamente disponibili ad oggi sono principalmente costituite da un set di sequenze trascrittomiche (PRJNA168381) e da una sequenza genomica della cultivar 'Jefferson', rilasciata nel 2009 dalla Oregon State University. Essendo la sequenza genomica della cv. Jefferson molto frammentata (N50= 21508; L50 = 4253), lo scopo di questo lavoro è stato quello di condurre un nuovo sequenziamento genomico utilizzando la cultivar Tonda Gentile (sin. Tonda Gentile delle Langhe) e avvalendosi della tecnologia 10X Genomics. Questo metodo, basato sull'impiego di linked-reads sequenziate per mezzo della tecnologia Illumina, consente di ottenere: i) molecole assemblate molto estese, ii) di discriminare gli aplotipi e iii) risolvere zone ad alta ripetitività. Il genoma è stato assemblato mediante l'utilizzo dellassemblatore Supernova e migliorato con il programma GapCloser che permette di diminuire il numero di basi indeterminate (N). Lassemblaggio prodotto mostra una dimensione totale di 414 Mbp, e una maggiore integrità (N50 = 51.567 bp; L50 = 1457), rispetto a quello della cv. 'Jefferson'. Grazie alla costruzione di una nuova mappa genetica, 748 scaffold sono stati riuniti in pseudomolecole raggiungendo una dimensione pari ad un quarto del genoma (108 Mb). Lannotazione strutturale del genoma è stata effettuata utilizzando la pipeline MAKER, rivelando la presenza di circa 28 000 geni; questi ultimi comparati con un set di geni rappresentativi (analisi BUSCO) ha mostrato una completezza pari al 89.9%.​
ITA
The hazel (Corylus avellana L.) is an arboreal species belonging to the genus Corylus (order Fagales, family Betulaceae, subfamily Coryloideae). The hazel cultivation show a growing trend worldwide and Italy is the second world producer with 104 000 mt per year after Turkey (570 000 mt). Hazelnuts are mainly intended for the confectionery industry, where they are used in the production of a wide range of products including creams, baked goods and other snacks. The genomic resources publicly available to date are mainly made up of a set of transcriptomic sequences (PRJNA168381) and a genomic sequence of the 'Jefferson' cultivar, released in 2009 by Oregon State University. Being the genomic sequence of the cv. 'Jefferson' very fragmented (N50 = 21 508; L50 = 4253), the purpose of this work was to conduct a new genomic sequencing using the cultivar 'Tonda Gentile' (syn. 'Tonda Gentile delle Langhe') and using the technology 10X Genomics. This method, based on the use of linked-reads sequenced by means of Illumina technology, allows to obtain: i) very extensive assembled molecules, ii) to discriminate haplotypes and iii) to solve areas with high repetitiveness. The genome was assembled using the Supernova assembler and improved with the GapCloser software which allows the number of undetermined bases (N) to be reduced. The product assembly shows a total size of 414 Mbp, and greater integrity (N50 = 51 567 bp; L50 = 1457), compared to that of the cv. 'Jefferson'. Thanks to the construction of a new genetic map, 748 scaffolds were combined into pseudomolecules reaching a size equal to a quarter of the genome (108 Mb). The structural annotation of the genome was carried out using the MAKER pipeline, revealing the presence of approximately 28 000 genes; the latter compared with a set of representative genes (BUSCO analysis) showed a completeness equal to 89.9%.​
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
799256_tesi_emile_cavalet_giorsa.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 3.63 MB
Formato Adobe PDF
3.63 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/102231