Il lavoro svolto ha come obiettivo la creazione di un database di modelli tridimensionali (3-D), ottenuti per omologia, da utilizzare successivamente per applicazioni di ricerca di potenziali agenti terapeutici. In particolare sono stati creati dei modelli di proteine integrali di membrana: i recettori per le proteine G (GPCR) di classe A. Un modello 3-D di una proteina è una rappresentazione degli atomi che fanno parte di una molecola in uno spazio a tre dimensioni . Sperimentalmente le coordinate di questi atomi sono ottenute attraverso una procedura che consiste nell'isolare la proteina, purificarla e in seguito, tramite varie tecniche (diffrazione a raggi x, NMR ecc..), ottenere le coordinate degli atomi. Questo tuttavia è un processo dispendioso sia in termini di tempo che di risorse. Una soluzione è quella di utilizzare una metodologia nota come modellizzazione per omologia o ¿homology modelling¿. Considerando che proteine con simili sequenze presentano anche simili strutture, questa tecnica permette, attraverso un allineamento delle sequenze aminoacidiche della proteina di nostro interesse (target) e di quella da utilizzare come stampo (templato), di inferire la struttura di una rispetto all'altra utilizzando specifici software. Si è scelto di creare un database di modelli di GPCR, poiché tali proteine (GPCR) mancano di una corretta regolazione per molte patologie umane, ed è stato stimato che costituiscono il target per il 40% dei farmaci attualmente utilizzati in clinica: questo le rende oggetto di numerose ricerche; inoltre la possibilità di utilizzare dei modelli 3-D per testare virtualmente sul calcolatore possibili farmaci rende questi modelli di proteine molto interessanti dal punto di vista commerciale. Le sequenze di GPCR di classe A di cui si è voluto generare il modello per omologia sono 273. Dato l'elevato numero si è ritenuto utile studiare un approccio automatizzato, che permettesse la costruzione dei modelli in serie. Tale metodo ha reso necessario l'impiego di vari software per ogni passaggio dl protocollo, al fine di utilizzare i risultati del software più accurato e veloce. Per la costruzione degli allineamenti ottimali fra sequenza templato e sequenza del target, sono stati valutati i risultati dei programmi di allineamento multiplo ¿Mafft¿, ¿Muscle¿ e ¿ClustalW¿; stessa cosa è stata fatta, per la verifica dei modelli creati, utilizzando i software di allineamento strutturale ¿Mustang¿ e ¿Sheba¿. Sono stati inoltre utilizzati il programma di modelling "Nest", per originare, dall'allineamento sequenza target/templato, i modelli 3-D, e gli algoritmi di minimizzazione energetica ¿Steepest descent¿ e ¿Simulated annealing¿ per migliorarli. Infine è stato utilizzato il software di verifica delle struttura ¿Whatcheck¿, in grado di effettuare una analisi geometrica dei modelli. A causa dell'elevato numero di software utilizzati e di modelli da ottenere, si è reso necessario elaborare dei programmi (script) che permettessero l'utilizzo e l'analisi dei dati ottenuti da ciascun software. Tali script sono disponibili presso l'azienda torinese S.A.F.AN. BIOINFORMATICS, che mi ha gentilmente accettato come tesista, fornendomi i materiali e le conoscenze.
metodi automatici per il modelling di recettori GPCR di classe A
CAMPA, CARLO COSIMO
2008/2009
Abstract
Il lavoro svolto ha come obiettivo la creazione di un database di modelli tridimensionali (3-D), ottenuti per omologia, da utilizzare successivamente per applicazioni di ricerca di potenziali agenti terapeutici. In particolare sono stati creati dei modelli di proteine integrali di membrana: i recettori per le proteine G (GPCR) di classe A. Un modello 3-D di una proteina è una rappresentazione degli atomi che fanno parte di una molecola in uno spazio a tre dimensioni . Sperimentalmente le coordinate di questi atomi sono ottenute attraverso una procedura che consiste nell'isolare la proteina, purificarla e in seguito, tramite varie tecniche (diffrazione a raggi x, NMR ecc..), ottenere le coordinate degli atomi. Questo tuttavia è un processo dispendioso sia in termini di tempo che di risorse. Una soluzione è quella di utilizzare una metodologia nota come modellizzazione per omologia o ¿homology modelling¿. Considerando che proteine con simili sequenze presentano anche simili strutture, questa tecnica permette, attraverso un allineamento delle sequenze aminoacidiche della proteina di nostro interesse (target) e di quella da utilizzare come stampo (templato), di inferire la struttura di una rispetto all'altra utilizzando specifici software. Si è scelto di creare un database di modelli di GPCR, poiché tali proteine (GPCR) mancano di una corretta regolazione per molte patologie umane, ed è stato stimato che costituiscono il target per il 40% dei farmaci attualmente utilizzati in clinica: questo le rende oggetto di numerose ricerche; inoltre la possibilità di utilizzare dei modelli 3-D per testare virtualmente sul calcolatore possibili farmaci rende questi modelli di proteine molto interessanti dal punto di vista commerciale. Le sequenze di GPCR di classe A di cui si è voluto generare il modello per omologia sono 273. Dato l'elevato numero si è ritenuto utile studiare un approccio automatizzato, che permettesse la costruzione dei modelli in serie. Tale metodo ha reso necessario l'impiego di vari software per ogni passaggio dl protocollo, al fine di utilizzare i risultati del software più accurato e veloce. Per la costruzione degli allineamenti ottimali fra sequenza templato e sequenza del target, sono stati valutati i risultati dei programmi di allineamento multiplo ¿Mafft¿, ¿Muscle¿ e ¿ClustalW¿; stessa cosa è stata fatta, per la verifica dei modelli creati, utilizzando i software di allineamento strutturale ¿Mustang¿ e ¿Sheba¿. Sono stati inoltre utilizzati il programma di modelling "Nest", per originare, dall'allineamento sequenza target/templato, i modelli 3-D, e gli algoritmi di minimizzazione energetica ¿Steepest descent¿ e ¿Simulated annealing¿ per migliorarli. Infine è stato utilizzato il software di verifica delle struttura ¿Whatcheck¿, in grado di effettuare una analisi geometrica dei modelli. A causa dell'elevato numero di software utilizzati e di modelli da ottenere, si è reso necessario elaborare dei programmi (script) che permettessero l'utilizzo e l'analisi dei dati ottenuti da ciascun software. Tali script sono disponibili presso l'azienda torinese S.A.F.AN. BIOINFORMATICS, che mi ha gentilmente accettato come tesista, fornendomi i materiali e le conoscenze.File | Dimensione | Formato | |
---|---|---|---|
337324_tesi30marzoinvio.pdf
non disponibili
Tipologia:
Altro materiale allegato
Dimensione
3.26 MB
Formato
Adobe PDF
|
3.26 MB | Adobe PDF |
I documenti in UNITESI sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.
https://hdl.handle.net/20.500.14240/71132