Alternative mRNA polyadenylation (APA) is a widespread process to generate gene isoforms with alternative 3’ untranslated regions (UTRs). The expression of alternative 3’ UTR isoforms is highly cell type specific and is further controlled in a gene-specific manner. However, its relevance in physiological and pathological conditions has been only partially unveiled. APA is regulated at both co-transcriptional and post-transcriptional levels, and it can regulate the gene expression levels through several mechanisms, including modulation of mRNA export, stability, and translation rates. This regulation is mediated by RNA-binding proteins (RBPs) and microRNAs (miRNAs) which can differentially interact with isoforms with long and short 3’ UTRs. The RNA sequencing (RNA-Seq) analysis is able to identify and characterize APA which can potentially affect miRNA interactions. Shortening of 3’ UTRs through APA affects the post-transcriptional regulation of hundreds of genes, and its alteration is frequent in human cancers. Indeed, proliferating cells partly escape a miRNA-driven gene downregulation by expressing shorter 3’ UTRs, depleted of microRNA binding sites. A similar phenomenon was observed in breast cancer, and tumors expressing shorter 3’ UTRs tend to be more aggressive since it involves genes crucial in the tumor progression. Despite computational workflows for the identification of 3’ UTR events already exists, a computational pipeline for the differential expression analysis coupled with APA analysis and modeling of its downstream effects on miRNA-mRNA crosstalk is still missing. In this thesis, I propose a novel computational approach to analyze the effect of APA on the miRNA-mRNA interaction network. Starting from raw RNA-Seq gene expression data, differentially expressed genes, isoforms and differentially represented 3’ UTR splicing events are detected and their results embedded in the final genes-miRNA interaction network. The APA-based miRNA-mRNA interaction network allows the modeling of interaction changes between two experimental conditions with identification of novel mRNA-miRNA interactors. This pipeline was tested on data from two different experiments to evaluate the APA in the MCF-7 luminal breast cancer cell lines: the first experiment involved MCF-7 treated with siRNA targeting the Estrogen Receptor (ERα), or with control siRNA; the second experiment, instead, regards the same cells treated with siRNA targeting a crucial RBP involved in the ERα pathway, hnRNPL, or with control siRNA. Differential expression analysis showed a set of genes and isoforms significantly modulated by both treatment conditions involving 194 isoforms (155 with longer 3’ UTR, 39 with shorter 3’ UTR) in the first experiment, while 130 isoforms (92 with longer 3’ UTR, 38 with shorter 3’ UTR) in the second one. Two miRNA-mRNA interaction networks were defined, and their analysis showed that 79% of miRNA-mRNA target interactions were predicted to increase upon ERα silencing and 59% upon hnRNPL silencing. The network analysis showed a consistency between the shortening/elongation of 3’ UTR and the pipeline-predicted change in miRNA-mRNA interaction. The results showed a consistency and coherence between the network interactions and the current literature, and small subnetworks can be isolated to investigate notorious or less-known genes whose expression can be affected by APA in cancer tissue.

La poliadenilazione alternativa dell’mRNA (APA) è un processo molecolare che genera isoforme geniche con regioni 3’ non tradotte alternative (UTRs). L’espressione di isoforme alternative di 3’ UTR è tipo-cellulare specifica ed è controllata in una maniera gene-specifica. Tuttavia, la sua importanza in condizioni fisiologiche e patologiche è stata svelata solo in parte. L’APA è regolata sia a livello co-trascrizionale che post-trascrizionale, regolando i livelli di espressione genica con differenti meccanismi, tra cui la modulazione dell’esportazione, stabilità, e tassi di traduzione degli mRNA. Questa regolazione è mediata da proteine leganti l’RNA (RBPs) e i microRNA (miRNAs) che possono interagire differenzialmente con le isoforme con UTR lunghi o corti. L’analisi di dati di sequenziamento dell’RNA (RNA-Seq) permette di identificare e caratterizzare APA con possibili effetti sulle interazioni con i miRNA. L’accorciamento del 3’ UTR attraverso APA influenza la regolazione post-trascrizionale di centinaia di geni e la sua alterazione è frequente nei casi di cancro umano. Le cellule proliferanti fuggono parzialmente all’inibizione mediate da miRNA esprimendo 3’ UTR più corti, privi dei siti di legame. Lo stesso fenomeno è stato osservato in carcinoma mammario e tumori che esprimano 3’ UTR più corti tendono ad essere più aggressivi poiché il processo coinvolge geni cruciali nella progressione tumorale. Nonostante esistano già strategie di analisi per l’identificazione degli eventi al 3’ UTR, manca ancora una pipeline computazionale per predire gli effetti degli APA sul network di interazione miRNA-mRNA. In questa tesi propongo un nuovo approccio computazionale per analizzare l’effetto dell’APA sulla rete di interazione miRNA-mRNA. Iniziando dai dati grezzi di espressione genica da esperimenti di RNA-Seq, viene eseguita l’analisi dei geni ed isoforme differenzialmente espresse e degli eventi di splicing al 3’ UTR, ed i risultati sono racchiusi in una rete finale di interazione geni-miRNA. La rete risultante basata sull’APA permette la modellazione dei cambiamenti di interazione fra due condizioni sperimentali, con l’identificazione di nuovi possibili interattori. Questa pipeline è stata testata su dati da due esperimenti per valutare l’APA in MCF-7, linee di cancro mammario luminale: il primo esperimento riguarda MCF-7 trattate con siRNA contro il Recettore degli Estrogeni α (ERα), o con siRNA di controllo; il secondo esperimento, invece, riguarda MCF-7 trattate con siRNA contro una RBP cruciale coinvolta nella via di ERα, hnRNPL, o con siRNA di controllo. L’analisi ha mostrato un set di geni e di isoforme significativamente modulate da entrambe le condizioni sperimentali, evidenziando 194 isoforme (155 con 3’ UTR più lungo, 39 con 3’ UTR più corto) nel primo esperimento, mentre 130 isoforme (92 con 3’ UTR più lungo, 38 con 3’ UTR più corto) nel secondo. Due reti di interazione miRNA-mRNA sono state definite e la loro analisi ha mostrato che il 79% delle interazioni sono promosse dal silenziamento di ERα ed il 59% dal silenziamento di hnRNPL. L’analisi di rete ha dimostrato una consistenza fra l’accorciamento/allungamento del 3’ UTR ed i cambiamenti predetti dalla pipeline nell’interazione miRNA-mRNA. I risultati hanno mostrato una robustezza e coerenza fra le interazioni di rete, e piccole sottoreti possono essere isolate per investigare geni noti o meno conosciuti la cui espressione possa essere influenzata da APA nel carcinoma mammario.

Analisi degli effetti degli eventi del 3' UTR alternativo in cellule di carcinoma mammario attraverso una nuova pipeline bioinformatica per i dati di RNA-Seq

RICERCATO, MARCO
2022/2023

Abstract

La poliadenilazione alternativa dell’mRNA (APA) è un processo molecolare che genera isoforme geniche con regioni 3’ non tradotte alternative (UTRs). L’espressione di isoforme alternative di 3’ UTR è tipo-cellulare specifica ed è controllata in una maniera gene-specifica. Tuttavia, la sua importanza in condizioni fisiologiche e patologiche è stata svelata solo in parte. L’APA è regolata sia a livello co-trascrizionale che post-trascrizionale, regolando i livelli di espressione genica con differenti meccanismi, tra cui la modulazione dell’esportazione, stabilità, e tassi di traduzione degli mRNA. Questa regolazione è mediata da proteine leganti l’RNA (RBPs) e i microRNA (miRNAs) che possono interagire differenzialmente con le isoforme con UTR lunghi o corti. L’analisi di dati di sequenziamento dell’RNA (RNA-Seq) permette di identificare e caratterizzare APA con possibili effetti sulle interazioni con i miRNA. L’accorciamento del 3’ UTR attraverso APA influenza la regolazione post-trascrizionale di centinaia di geni e la sua alterazione è frequente nei casi di cancro umano. Le cellule proliferanti fuggono parzialmente all’inibizione mediate da miRNA esprimendo 3’ UTR più corti, privi dei siti di legame. Lo stesso fenomeno è stato osservato in carcinoma mammario e tumori che esprimano 3’ UTR più corti tendono ad essere più aggressivi poiché il processo coinvolge geni cruciali nella progressione tumorale. Nonostante esistano già strategie di analisi per l’identificazione degli eventi al 3’ UTR, manca ancora una pipeline computazionale per predire gli effetti degli APA sul network di interazione miRNA-mRNA. In questa tesi propongo un nuovo approccio computazionale per analizzare l’effetto dell’APA sulla rete di interazione miRNA-mRNA. Iniziando dai dati grezzi di espressione genica da esperimenti di RNA-Seq, viene eseguita l’analisi dei geni ed isoforme differenzialmente espresse e degli eventi di splicing al 3’ UTR, ed i risultati sono racchiusi in una rete finale di interazione geni-miRNA. La rete risultante basata sull’APA permette la modellazione dei cambiamenti di interazione fra due condizioni sperimentali, con l’identificazione di nuovi possibili interattori. Questa pipeline è stata testata su dati da due esperimenti per valutare l’APA in MCF-7, linee di cancro mammario luminale: il primo esperimento riguarda MCF-7 trattate con siRNA contro il Recettore degli Estrogeni α (ERα), o con siRNA di controllo; il secondo esperimento, invece, riguarda MCF-7 trattate con siRNA contro una RBP cruciale coinvolta nella via di ERα, hnRNPL, o con siRNA di controllo. L’analisi ha mostrato un set di geni e di isoforme significativamente modulate da entrambe le condizioni sperimentali, evidenziando 194 isoforme (155 con 3’ UTR più lungo, 39 con 3’ UTR più corto) nel primo esperimento, mentre 130 isoforme (92 con 3’ UTR più lungo, 38 con 3’ UTR più corto) nel secondo. Due reti di interazione miRNA-mRNA sono state definite e la loro analisi ha mostrato che il 79% delle interazioni sono promosse dal silenziamento di ERα ed il 59% dal silenziamento di hnRNPL. L’analisi di rete ha dimostrato una consistenza fra l’accorciamento/allungamento del 3’ UTR ed i cambiamenti predetti dalla pipeline nell’interazione miRNA-mRNA. I risultati hanno mostrato una robustezza e coerenza fra le interazioni di rete, e piccole sottoreti possono essere isolate per investigare geni noti o meno conosciuti la cui espressione possa essere influenzata da APA nel carcinoma mammario.
ENG
Alternative mRNA polyadenylation (APA) is a widespread process to generate gene isoforms with alternative 3’ untranslated regions (UTRs). The expression of alternative 3’ UTR isoforms is highly cell type specific and is further controlled in a gene-specific manner. However, its relevance in physiological and pathological conditions has been only partially unveiled. APA is regulated at both co-transcriptional and post-transcriptional levels, and it can regulate the gene expression levels through several mechanisms, including modulation of mRNA export, stability, and translation rates. This regulation is mediated by RNA-binding proteins (RBPs) and microRNAs (miRNAs) which can differentially interact with isoforms with long and short 3’ UTRs. The RNA sequencing (RNA-Seq) analysis is able to identify and characterize APA which can potentially affect miRNA interactions. Shortening of 3’ UTRs through APA affects the post-transcriptional regulation of hundreds of genes, and its alteration is frequent in human cancers. Indeed, proliferating cells partly escape a miRNA-driven gene downregulation by expressing shorter 3’ UTRs, depleted of microRNA binding sites. A similar phenomenon was observed in breast cancer, and tumors expressing shorter 3’ UTRs tend to be more aggressive since it involves genes crucial in the tumor progression. Despite computational workflows for the identification of 3’ UTR events already exists, a computational pipeline for the differential expression analysis coupled with APA analysis and modeling of its downstream effects on miRNA-mRNA crosstalk is still missing. In this thesis, I propose a novel computational approach to analyze the effect of APA on the miRNA-mRNA interaction network. Starting from raw RNA-Seq gene expression data, differentially expressed genes, isoforms and differentially represented 3’ UTR splicing events are detected and their results embedded in the final genes-miRNA interaction network. The APA-based miRNA-mRNA interaction network allows the modeling of interaction changes between two experimental conditions with identification of novel mRNA-miRNA interactors. This pipeline was tested on data from two different experiments to evaluate the APA in the MCF-7 luminal breast cancer cell lines: the first experiment involved MCF-7 treated with siRNA targeting the Estrogen Receptor (ERα), or with control siRNA; the second experiment, instead, regards the same cells treated with siRNA targeting a crucial RBP involved in the ERα pathway, hnRNPL, or with control siRNA. Differential expression analysis showed a set of genes and isoforms significantly modulated by both treatment conditions involving 194 isoforms (155 with longer 3’ UTR, 39 with shorter 3’ UTR) in the first experiment, while 130 isoforms (92 with longer 3’ UTR, 38 with shorter 3’ UTR) in the second one. Two miRNA-mRNA interaction networks were defined, and their analysis showed that 79% of miRNA-mRNA target interactions were predicted to increase upon ERα silencing and 59% upon hnRNPL silencing. The network analysis showed a consistency between the shortening/elongation of 3’ UTR and the pipeline-predicted change in miRNA-mRNA interaction. The results showed a consistency and coherence between the network interactions and the current literature, and small subnetworks can be isolated to investigate notorious or less-known genes whose expression can be affected by APA in cancer tissue.
IMPORT DA TESIONLINE
File in questo prodotto:
File Dimensione Formato  
957424_957424_thesis_marco_ricercato.pdf

non disponibili

Tipologia: Altro materiale allegato
Dimensione 3.93 MB
Formato Adobe PDF
3.93 MB Adobe PDF

I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/20.500.14240/145804