Sei sulla pagina 1di 6

quali sono gli step da seguire per fare modelling di omologia 2 input: sequenza da modellare e banca dati con

tutti i possibili templati cioe ' pdb prendo la sequenza, faccio una ricerca con blast per cercare omologhi a struttur a nota a questo punto posso usare l'omologo come stampo per costruire la nostra protein a come? devo sapere quale amminoacido si copia sul templato devo fare un allineamento multiplo da cui estraggo quello a coppie: valina del t emplato e valina del mio modello per esempio. l'allineamento multiplo mantiene tutta l'evoluzione tra le due proteine e mi da molta informazione sui residui importanti ci sono dei programmi che possono ottimizzare questi allineamenti utilizzando HM M su diverse banche dati una volta che ho allineato le due sequenze devo costruire il modello 2 tecniche: -Assemblaggio di frammenti usata da SwissMod che e' un programma apposta -Satisfaction of spatial restraints fatto con Modeller che e' il programma piu' diffuso e si trova in rete il nostro lavoro di tre o 4 ore viene fatto da un programma in dieci minuti e an che meglio di come lo facciamo noi quando ho ottenuto i modelli che mi servono devo andare a valutarli 2 modi livello a qualita' (stereochimica) tutte le lunghezze di legame siano nella norm a, che gli angoli corrispondano a Ramachandran, che le distanze di legame siano corrette ecc.....tutto attraverso SwissMod che gia' da solo vede di correggere u n po' la vera validazione la si puo' fare solo sperimentalmente perche' il modello e' solo teoria SwissMod trasferisce le coordinate da swisspdb devo dare in input la struttura del templato e lui costruisce il core( parte evo lutivamente piu' conservata e coincide con la regione piu' strutturata, piu' rig ida) della proteina il programma trasferisce le coordinate di una sequenza nel templato (il programm a lavora solo con il backbone) cambiando il nome degli amminoacidi allineati la nuova proteina avra' delle regioni non modellate a causa di gap o altri motiv i, il programma infatti non si preoccupa di riempirle la seconda fase si occupa appunto di riempire i buchi cioe' le regioni in cui il templato non ce l'ho: modelling dei loops non ho programmi che fanno questa cosa in modo corretto quindi tutte le conclusi oni saranno solo ipotesi, non c'e' niente di certo o sicuro a meno che non ho in formazioni sperimentali che mi confermano se ho ragione o no ho pero' 2 possibilita' 1 genero una banca dati di loops e nella regione da modellare inserisco il loop piu' simile a quello che mi serve e copio le coordinate 2 ricostruzione ab-initio con algoritmi che ottimizzano l'energia delle varie co nformazioni del loop e utilizzo quello con migliori interazioni elettrostatiche, van der waals, atomi abbastanza distanziati ecc... in base a quel che mi serve Cosa manca? Le catene laterali viene fatto sempre tramite dei programmi che usano delle "librerie di rotameri" rotamero = diverse conformazioni che puo' prendere una catena laterale a seconda del suo angolo scelgo un rotamero e vedo come reagisce nel complesso proteico, lo lascio se a l ivello energetico e' conveniente per la mia struttura, altrimenti ne provo un al tro finche' non trovo una conformazione ideale Programma utilizzato SCWRL: prova rotameri iterativamente FINE del modelling per omologia dall'allineamento multiplo devo estrarre solo l'allineamento a coppie tra la mia

struttura e l'omologo noto cancellando quelle che sono in mezzo...prendendo l'o utput di clustalw e metterlo su file di testo e togliere quel che non serve su swisspdb viewer teniamo una sola catena dal templato poi carichiamo la sequen za della human thioesterase caricando il file FASTA. adesso il programma fa un t hreading--->infilare e copia le coordinate del templato nella mia proteina in ac cordo con l'allineamento se avessimo mantenuto la catena B potrebbe non dare problemi ma qualche volta su ccede quindi e' stato meglio toglierla la sequenza si carica con Swissmodel----> Load Raw Sequence To Model una volta caricata compare una nuova struttura ora costruisco il modello col metodo per omologia per fare cio' devo trovare lo stampo per modellare la nuova struttura caricata---> la struttura che cerco e' a ppunto la 1C8U per utilizzarla come stampo e' di fare un allineamento di sequnza e il resto lo fa il programma l'allineamento e' gia' fatto ma il programma non mi lascia caricarlo---> Wind e poi Sequence Alignment Qua si apre una nuova finestra con le due sequenze non allineate pero' e l'allin eamento si fa a mano per il threading devo copiare l'allineamento a coppie ottenuto con clustalw se trovo un gap devo inserirlo il tutto si fa con la barra spaziatrice per spostare avanti la sequenza mentre faccio questa cosa la nuova struttura e' sparita perche' si sta creando finito l'allineamento si tratta di togliere i gaps che non servono cioe' un gap allineato con un altro gap adesso dobbiamo eliminare le tracce che non ci solo utili a livello evolutivo quindi dobbiamo trovare le strutture secondarie ed eliminare i gaps da li dobbiamo colorare l'1c8u e raggruppiamo i gaps. lo scopo e' di togliere i gaps d alle regioni a struttura secondaria e raggrupparli in un loop se possibile. elim iniamao anche i gap corrispondenti tra sopra e sotto selezioniamo 1c8u poi su color coloriamo la SECONDARY STRUCTURE cosi possiamo ve dere le strutture secondarie che sono colorate in giallo per aiutarci ad elimina re i gap devo raggruppare i gap vicini ed aggiungerli poi insieme a quello nella regione grigia che indica i loop..i gap dei loop posso spostarli dove voglio e quindi li alline o con tre gap dell'altra struttura e posso eliminarli come ho fatto prima fin qua abbiamo fatto l'allineamento del backbone per fare il modello bisogna andare sul sito swissmodel che ci permette di fare d iversi tipi di modelli (vedi colonna di sinistra) alcuni completamente automatic i come il DeepView e' pero' sconsigliato perche' servono omologhi con una buona percentuale di similarita' (>45-50%) questo sito ci da un interfaccia per fare l'allineamento oggi useremo Project (optimize) Mode e quello che fa e' ottimizzare il nostro la voro per esempio facendo la modellizzazione dei loops quindi dobbiamo caricare i l progetto sul sito il risultato sara' una proteina e dei grafici che indicano la qualita' del model lo -Anolea: stima dell'energetica in base a dati noti degli amminoacidi (campo di f orza media) su pdb guardano le distanzatra amminoacidi generando una distanza me dia (ad es ala con tutti gli altri) e viene associato un'energia. Se i dati trov ati col modello vanno daccordo con quello che trovo sul pdb (PATHWAYS da DATI NO TI) -Gromos: e' un campo di forza. Ce ne sono tanti di questi campi (hammer per es). Utilizza una descrizione dell'energetica della proteina la analizza e vede se e ' o meno favorevole. Le misurazioni fatte sono sui legami e sulla loro Costante di forza elastica cio e' le oscillazioni permesse dal legame. Anche gli angoli tra gli atomi sono cons iderati. Considera le forze di Coulomb e per finire il potenziale di Lennard-Jon

es -Verify3D: verifica la qualita' delle strutture cristallografiche partendo dalla sequenza come ogni amminoacido si trova nel suo stato utilizzando sempre pdb pe r vedere quali sono gli amminoacidi e gli stati preferiti es un ambiente idrofob ico per un amminoacido apolare ecc...(PROFILI 1D-3D) sono 3 controlli di qualita' che fa Swisspdbviewer controllando che i parametri del mio modello rientrano nei valori dei tre sistemi sopra Il modello deve essere validato sperimentalmente per avere la certezza che sia c orretto. Le informazioni che mi servono per fare questa cosa sonosciamo il sito attivo del templato, e sarebbe da capire qual'e' il sito attivo della proteina. Come? Prendiamo la struttura del templato e il modello che abbiamo creato e vediamo ne lla corrispondenza del templato cosa trovo nel modello per fare questo torniamo su swissmodel e scarichiamo il file DeepViewer, troviam o su swissprot il sito attivo della proteina di partenza, in questo caso la tioe sterasi e ci segnamo i numeri corrispondenti al sito attivo poi vediamo cosa suc cede nelle due catene in corrispondenza di questi amminoacidi il sito attivo trovato sul sito uniprot del templato 1c8u e' fatto da D,S,Q (asp , ser, gln) nel target cioe' nel nostro modello e' D,T,Q(asp, tre, gln) la differensa e' nelle strutture degli amminoacidi del sito attivo vorremmo vedere che cosa fa l'OH della serina visto che e' li la differenza. la treonina ha infatti un OH sempre ma ha anche un gruppo metile in piu' dobbiamo stare attenti pero' perche' il sito attivo e' stato trovato per similar ita'(questa informazione si trova su uniprot alla sezione sito attivo della huma n thioesterase---> by similarity) Dinamica Molecolare quando siamo in grado di modellare l'energia per tutte le interazioni interatomi che so che conoscendo l'energia potenziale posso conoscere la sua accelerazione programmi di simulazione di dinamica molecolare e studiare come evolve nel tempo la struttura, come interagiscono col ligando, quali sono le regioni piu' mobili ecc... Un esperimento che valuta la qualita' dei predittori, siano essi umani che autom atici: si chiama CASP, si fa ogni due anni. Ci sono strutture nuove che stanno p er essere risolte e vengono rese pubbliche per fare in modo che tutti quelli che vogliono hanno un tot di tempo per modellare le strutture. Quando vengono risol te c'e' la valutazione dei modelli. La cosa importante e' che tutta la comunita' puo' partecipare. Modeller: ci sono due modi generali per costrurire il modello: allineamento, swissmodel e tutta la trafila gia' fatta oppure utilizzzare modeller la tecnologia e' diversa, non fa copia incolla delle coordinate la tecnica e' il satisfaction of spatial restraints una funzione che ottimizza per generare il modello: tre termini principali -restraints -valutazione dell'energia: valuta il campo di forza charmm attraverso queste tre funzioni viene ottimizzato e fatto il modello predizione automatica di modelli: HHPRED utilizzano famiglie di Markov i cui profili vengono definiti da un allineamento multiplo con i risultati da psiblast sulla banca dati nr inserisco la sequenza e il programma costruisce il profilo di Markov, allinea po i questo profilo con tutti gli altri in banca dati

inseriamo la solita sequenza di human thioesterase, usiamo la banca dati PDB70, le iterazioni di psiblast ne mettiamo 2 idnumber: 1717891 il primo templato trovato e' proprio 1c8u ora possiamo verificare che la sequenza allineata sul progetto viene molto simil e a quella trovata dall'allineamento l'output ci da diverse informazioni sspred= predizione struttura secondaria (usano un algoritmo detto reti neurali) in cui troviamo le seguenti lettere h: helix e: extended beta-sheet c: coil ssconf: secondary structure confidence: da un numero in base a quanto la predizi one e' affidabile 1 basso 9 alto poi abbiamo la sequenza poi il consensus che sono gli amminoacidi piu' conservati in quella famiglia, se maiuscolo e' conservato in assoluto se e' minuscolo non e' identico in tutta la famiglia ma e' abbastanza presente T= template: ss_conf, ss_pred, ss_dssp cioe' la struttura secondaria vera della proteina sovrapponiamo questa struttura con quella che abbiamo predetto sul target e se s ul templato da lo stesso risultato ottenuto qui allora abbiamo fatto un buon lavoro oppure possiamo vedere cosa non e' stato fat to c'e' una parte dell'output con una serie di icone..click sulla prima che dice sh ow histogram per avere un'altro modo di vedere i risultati per capire se un amminoacido e' piu' o meno conservato basta guardare il grafico e vedere per ogni amminoacido quante variazioni abbiamo..questo si vede nelle b arrette con le lettere ognuna e' un amminoacido diverso. se per ogni posizione a bbiamo diverse barrette abbiamo poca conservazione (per vedere allinementi si puo' usare jalview) Posso generare il modello con CREATE MODEL in alto nei vari tab noi faremo a singolo templato. quello multitemplato prende tutti i templati trov ati, li sovrappone e li raggruppa. In base ai vari gruppi si decide quale utiliz zare e solo poi mi fara' il modello. (Lo si usa per es quando abbiamo il target che ha diversi templati piu' piccoli che non lo coprono da soli ma per avere una sequenza templato completa devo unirne piu' di uno. Anche in questo caso e' com unque meglio lavorare dominio per dominio) Usiamo quindi a singolo templato. Per default prende il primo templato che e' pr oprio quello che ci serve il formato dell'allinemento e' fatto su misura per modeller inseriamo la chiave per utilizzare il progrmma(modeliranje) e facciamo partire. l'output sara' da utilizzare come un .pdb s salviamo dunque il file FFAS03 non utilizza profili di markov e fa lo stesso lavoro di quello sopra ROBA GIA' DETTA fold recognition -threading -metodo di profili le differenze stanno nel come faccio i calcoli nel metodo di profili calcolo in banca dati un profilo 3D che pero' non calcola

le frequenze degli amminoacidi nel loro ambiente ideale ma (visto sapendo che gl i amminoacidi hanno delle similarita' di tipo fisico o chimico tra loro possiamo avere) sequenze di proprieta' anziche' di amminoacidi (e generare una banca dat i). prendo la sequenza di interesse e rimpiazzo gli amminoacidi con le loro propriet a' e posso allineare le proprieta' dette appunto PROFILI anziche' gli amminoacid i (PHYRE). EVA altro progetto che studia le performance dei programmi appena descritti (una cosa tipo CASP) Se trovo un omologo a struttura nota le cose appena viste non le considero affat to. Threading utilizza l'energia per il calcolo della probabilita' per poi assegnare un valore di energia per ogni ripiegamento in cui posso utilizzare la sequenza programma ngthreader trovato su psipred -----DICEMBRE quando parlo di hhpred ecc parlo di programmi che lavorano al limite del fold re cognition e riescono a trovare omologie molto distanti tra loro GenThreader Psipred programma nato per fare predizioni di struttura secondaria sul sito dell 'ucl. Carichiamo la struttura e aspettiamo la risposta La proteina con cui lavoro potrebbe essere non ancora risolta al livello di str uttura secondaria e a quel punto devo usare delle tecniche dette di modelling ab -initio. La sequenza veniva presa e introdotta in un campo di forza per le dinamiche mole colari per fare in modo di avere un ripiegamento a seconda della sua energia. Poi si e' iniziato ad usare tecniche statistiche ma in realta' non si ha ancora un modo di risolvere le strutture ab-initio Questo perche' il delta dell'energia libera di una proteina random ad una ripieg ata e' molto bassa e c'e' un errore implicito che e' sicuramente maggiore di que st'energia libera. Quindi non c'e' modo di modellare la proteina ab-initio Da qualche anno sono nati due programmi Rosetta in cui si generano delle banche dati in cui si prendono da pdb tutte le proteine frammentate per avere sequenze di 9 amminoacidi. FragFold prende frammenti di struttura supersecondaria (es be tafoglietto seguito da betafoglietto avra' dei loop in mezzo con una struttura d eterminata detta supersecondaria) da 3 a 5 amminoacidi e genera anche lui una ba nca dati con sequenze cosi fatte Con fragfold valuto ogni pezzo facendo un fold recognition per ciascuno e con il Knowledge based potential prendo i migliori fold per ognuno dei pezzettini di p roteina Poi devo assemblare tutti questi pezzettini e valutarne l'energetica per avere l a proteina completa Mutiamo a livello sperimentale gli amminoacidi in alanina VirtualAlanineScanning per vedere che succede. ----------VMD carichiamo il file di progetto del modello fatto sull'1c8u e il templato ............ TROVARE PUNTINI trovo una sequenza su PDB, la metto su BLAST e guardo che abbia l'identita' che

mi interessa , una volta trovato carico i due file su spdbv (tolgo slide, le col oro diverse con color-->layer, poi faccio unn fit--> Magic Fit, quindi con Fit-> Improve Fit) Trovo quindi il risultato (RMDS--> guardo dove si posiziona nel grafico e vedo s e si trova abbastanza in zona curva oppure si differenzia dalla normalita' dei r isultati)