Sei sulla pagina 1di 87

SBOBINATURE del corso di BIOCHIMICA I

(Lezioni del Prof. Raugei) A/A 2008/09

ATTENZIONE
Queste sbobinature sono state realizzate da studenti, e come tali possono contenere errori. Lo scopo di queste sbobinature NON quello di sostituire la frequenza personale dei corsi, ma di fornire del materiale in pi utile alla preparazione dell'esame; gli studenti sono pertanto invitati a seguire le lezioni e a prendere personalmente gli appunti, rimediando cos agli errori e alle imprecisioni che possono essere presenti in queste pagine.

Biochimica - Lezione del 28-04-09 [Prof. Raugei]


La volta precedente avevamo esaminato la struttura del DNA, la cui comprensione molto importante per gli argomenti che andremo ad affrontare, e da qui riprendiamo. Prima di andare avanti, ricordiamo che il DNA ha una sua direzionalit o polarit che dir si voglia: molto importante la direzione 5'--> 3', lungo la quale usualmente si svolge la sintesi. Ricordiamo anche che DNA ed RNA sono molto simili: le differenze principali consistono nella presenza della timina e un -H in posizione 2' nel DNA, laddove nell'RNA abbiamo uracile (che si ottiene togliendo un gruppo -CH3 dalla timina), e la presenza di un -OH in posizione 2'. Concentriamo adesso la nostra attenzione sui legami ad idrogeno: si formano due legami ad idrogeno tra adenina e timina e tre legami ad idrogeno tra guanina e citosina. Si tratta di legami deboli in generale, i legami deboli rivestono una grandissima importanza nelle interazioni molecolari; sono gli enzimi, che entrano in gioco nel metabolismo, ad agire soprattutto sui legami covalenti. Nella struttura del DNA sono importanti sia legami covalenti, nella costruzione della sua impalcatura di pentoso-fosfato-base azotata (quest'ultima intrattiene un legame N-glicosidico), sia i legami deboli, che tengono insieme le due catene a formare una doppia elica. La caratteristica del legame debole quella di essere facilmente reversibile. Il legame debole tipicamente spezzato tanto facilmente quanto facilmente pu essere riformato. In effetti, i legami ad idrogeno che tengono insieme le due catene del DNA sono importanti, grazie a quest'ultima caratteristica, per numerosi processi che interessano questa molecola (es. trascrizione), mentre zone a doppio filamento intramolecolari invece danno la peculiare forma al tRNA. Il legame ad idrogeno tipicamente coinvolge (1) un H legato ad un atomo elettronegativo come N, O o, pi raramente, S e (2) un atomo con parziale carica negativa. Rottura e formazione di legami covalenti entrano in gioco solamente durante la replicazione. Nel normale funzionamento del DNA (cio, il funzionamento in cellule in fase G) si rompono e si formano legami deboli. Per normale funzionamento si intende soprattutto la trascrizione, processo che implica la rottura di legami deboli preesistenti per l'apertura della doppia elica, e il nuovo instaurarsi di altri legami deboli per dirigere la sintesi dell'RNA dal punto di vista di quest'ultimo, entrano in gioco anche legami covalenti, ma dal punto di vista del DNA sono coinvolti solo legami deboli. Il DNA , come abbiamo visto, una doppia elica. All'esterno abbiamo l'impalcatura di zucchero-fosfato, mentre all'interno sono poste le basi. Le basi sono orientate parallelamente al piano immaginario su cui poggia la molecola, e sono impilate una sopra l'altra. La doppia elica pu esistere in diverse forme, si parla di DNA A, DNA Z e DNA B, dove quest'ultimo quello pi interessante perch fisiologicamente presente nelle cellule. La struttura a doppia elica del DNA B ha una particolarit: l'asse dei legami ad idrogeno non passa per l'asse della doppia elica. L'elica in qualche modo si avvolge intorno al suo asse, senza per toccarlo, perch i legami ad idrogeno che legano le due basi affacciate verso l'interno passerebbero per l'asse se i due zuccheri fossero a 180; in realt, gli zuccheri stanno a 120. Quindi l'elica ha una sorta di andamento a zig zag, con la formazione di un solco maggiore e uno minore. Questa nozione ci permette di introdurre un altro concetto. Il DNA una molecola che funziona interagendo con proteine, che sono in grado di leggerlo. Un esempio l'RNA polimerasi, che deve legarsi ad un promotore per iniziare la trascrizione: deve quindi esistere un meccanismo che renda le proteine capaci d riconoscere particolari sequenze del DNA ancora chiuso. Questo riconoscimento reso possibile in quanto particolari posizioni delle basi azotate sono esposte all'esterno della molecola grazie alla presenza dei solchi a cui abbiamo accennato. Non facile da visualizzare. Un osservatore esterno che si ponesse nel solco maggiore potrebbe osservare, a livello di una purina, le posizioni 6, 7 e 8. La posizione 6 permette di distinguere tra le due purine (l'adenina ha un -NH2, la guanina un doppio legame con l'O), mentre le posizione 7 e 8 non sono diagnostiche. Anche il solco minore consente delle esposizioni, a livello del carbonio in posizione 2. Le proteine hanno una conformazione tale da poter interagire selettivamente con

certi gruppi funzionali, cos da distinguere i nucleotidi. Per quando riguarda le pirimidine, solo la parte esposta nel solco maggiore permette di differenziare una citosina e una timina. La differenza molto grande: la posizione 4 diversa, inoltre la timina metilata in posizione 5, dove la citosina ha solo un H. A livello del solco minore invece questa distinzione non pu essere fatta. Tutto questo fa s che una certa sequenza di DNA sia riconoscibile grazie ai gruppi chimici esposti a livello del solco maggiore (sia per purine che per pirimidine) o del solco minore (solo per le purine) , offrendo siti di lettura anche per il DNA chiuso. Ci sono poi delle sequenze aminoacidiche, conservate in molte proteine diverse, che sono tanto diffuse da consentire, qualora vengano ritrovate su proteine dalla funzionalit ignota, di dedurre con una certa sicurezza che queste abbiano a che fare con il DNA. Queste strutture sono essenzialmente di tre tipi: Elix-Turn-Elix; ovvero, una zona costituita da un dominio ad -elica, seguita da una corta sequenza aminoacidica senza una struttura secondaria particolare, che permette una certa libert di piegamento, seguita a sua volta da una seconda -elica. In genere queste proteine sono dei dimeri. Le -elica sono le zone della proteina che prendono contatto con i gruppi chimici esposti a livello dei solchi. Zinc Fingers, una struttura curiosa, dove si hanno delle zone quasi a forma di dita, che si inseriscono nelle scanalature del solco maggiore e del solco minore prendendo contatto con i gruppi chimici esposti. Si tratta di una struttura di tipo terziario, dove uno ione zinco si coordina con gruppi -SH di cisteine, formando le dita. Le cisteine per ogni dito in genere sono quattro: due sono separate da 3-4 aminoacidi circa, poi in genere presente un loop (qualche decina di aminoacidi), e infine le altre due, sempre vicine tra loro. Questa struttura piuttosto peculiare, ed spesso ripetuta a distanze regolare (ognuna rappresenta un dito) permettendo cos di riconoscere gli zinc fingers gi a livello della struttura primaria. Si possono trovare fino a 9 zinc fingers. Leucyn Zipper (cerniere a leucina); in realt questa struttura non serve tanto per interagire con il DNA, quanto per formare dimeri. La struttura sfrutta interazioni tra leucine, che un aminoacido dotato di una lunga catena di tipo idrocarburico, quindi apolare. Questo significa che former facilmente interazioni di tipo Van der Waals con altre leucine. In genere, le strutture di tipo leucyn zipper coinvolgono delle -eliche, in cui tra le leucine sono interposti aminoacidi in numero tale da far s che queste sporgano tutte dalla stessa parte dell' -elica. In genere ci sono 3,5 aminoacidi per ogni giro di -elica, per un totale di 7 aminoacidi per ogni 2 giri. facile immaginare come le leucine siano presenti ogni 7 aminoacidi, cos da risultare impilate una sopra l'altra. Alla fine, si hanno due -eliche, con una fila di leucine su un lato, che si interagiscono tra loro attraverso interazioni di tipo idrofobico.

Ricordiamo inoltre che in genere le proteine che interagiscono con il DNA sono cariche positivamente (hanno cio un punto isoelettrico di tipo basico) al contrario della gran parte delle altre proteine, cariche negativamente. Ovviamente la carica positiva facilita di per s l'interazione con il DNA, dato che quest'ultima molecola carica negativamente: una proteine carica negativamente genererebbe interazioni di tipo repulsivo. Il funzionamento del DNA, come abbiamo visto, coinvolge essenzialmente legami deboli; tuttavia, il DNA ha un suo metabolismo: viene prodotto e pu essere anche catabolizzato. In genere in un organismo quest'ultima attivit viene evitata. A differenza di tutte le altre molecole (proteine, RNA, etc.), che sono in gran parte usa e getta, il DNA tende ad essere mantenuto. La replicazione del DNA infatti di tipo semiconservativo, il che significa, tra l'altro, che da qualche parte nel nostro organismo due cellule probabilmente contengono uno dei due filamenti di DNA che si trovava nello zigote da cui ci siamo originati. Il catabolismo del DNA entra in gioco soprattutto quando ci nutriamo: quasi sempre ingeriamo anche cellule, il cui DNA deve essere digerito. Deve esistere quindi una classe di enzimi in grado, all'occorrenza, di smantellare la struttura del DNA. Si tratta di idrolasi (quindi in grado di agire a livello del legame fosfodiesterico), nucleasi (agiscono sugli acidi nucleici), fosfodiesterasi (agiscono su un legame fosfodiesterico). Si possono poi distinguere esonucleasi, endonucleasi, desossiribonucleasi, ribonucleasi, etc.

La classificazione comunque molto varia. Ad ogni modo, particolarmente importante la distinzione tra esonucleasi ed endonucleasi. Sono esonucleasi quegli enzimi che, avendo un filamento con entrambe le estremit libere, tagliano il primo legame fosfodiesterico dopo il primo o l'ultimo nucleotide: esistono infatti le esonucleasi 5' (che iniziano a digerire il DNA a partire dall'estremit 5'), e le esonucleasi 3' (che iniziano a digerire il DNA dall'estremit 3'). Il taglio di tipo P, di gran lunga il pi comune, taglia tra il 3' e il fosfato, lasciando attaccato il gruppo fosfato al 5'; il taglio di tipo T, molto pi raro, taglia tra il 5' e il fosfato, lasciando attaccato il gruppo fosfato al 3'. Le endonucleasi sono enzimi che tagliano il legame fosfodiesterico all'interno della catena . Anche in questo caso, esistono tagli di tipo P e T, ed esistono endonuclasi specifiche per RNA e DNA, cos come endonucleasi aspecifiche. In entrambi i casi, l'azione soltanto su UNO solo dei due filamenti di DNA. In sintesi, si tratta di due classi di enzimi che hanno lo scopo di frammentare il DNA a scopi catabolici, ottenendo un pool di dNTP, monomeri che consistono di deossinucleosidi dei quattro tipo possibili (nel caso del DNA) proprio come le proteasi catabolizzando le proteine portano ad ottenere un pool di aminoacidi. La differenza tra endonuclesi ed esonucleasi anche nella specificit riguardo alla sequenza di basi azotate di DNA. Come si pu immaginare, il DNA pu essere danneggiato. Uno dei danni pi tipici che pu subire questa molecola la rottura di un singolo legame fosfodiesterico, cosa che di solito , fortunatamente, priva di conseguenze. La rottura in s infatti non un grosso danno, in quanto il DNA una doppia elica che trova stabilit nella interazione tra i due filamenti singoli. La struttura della molecola non viene turbata dal nick; la sua struttura stessa garantisce, attraverso i legami ad idrogeno, che la conformazione rimanga inalterata; i nick sono in genere riparate da ligasi. Un filamento di appena 20 nucleotidi implica decine di legami ad idrogeno. Se, tuttavia, il nick avviene in corrispondenza di un altro nick, oppure molto vicino, si pu verificare un danno gravissimo: una soluzione di continuit nella doppia elica; i legami a idrogeno non sono abbastanza numerosi da garantire l'integrit. Tuttavia, in condizioni normali, estremamente improbabile che avvenga una cosa del genere. L'azione di una endonuclasi si esplica su uno dei due filamenti, casualmente, introducendo dei nick, che possono o meno portare ad una rottura. Le endonucleasi in genere non riescono a frammentare il DNA sino a portare al singolo monomero; in genere frammentano il filamento in oligomeri, e poi delle esonucleasi finiscono il lavoro. Tuttavia, per la funzionalit del DNA, anche una singola rottura un evento disastroso. Esiste poi una classe particolare di endonucleasi che hanno la caratteristica di essere estremamente specifiche riguardo alla sequenza di taglio: sono le endonucleasi di restrizione. Questi enzimi tagliano la doppia elica con due nick ravvicinati (uno su un filamento e uno sull'altro) in corrispondenza di particolari sequenze. In altre parole, se si mettono in contatto questi enzimi con un filamento di acido desossiribonucleico di sequenza conosciuta, saremo in grado di predire i punti in cui saranno creati i nick, e il numero di pezzi in cui verr tagliata la molecola. Questi enzimi sono stati, e anche se in misura minore, ancora sono, un importantissimo strumento per l'ingegneria genetica; sono utilizzate spesso per rompere il DNA in modo da poter inserire delle sequenze desiderate all'interno delle molecole. Sono presenti in moltissimi batteri, che esprimono questi enzimi per difendersi dagli attacchi mediati dal DNA. Tipici agenti di questi attacchi sono virus, come i batteriofagi. Questi infettano la cellule trasferendo il proprio materiale genetico all'interno di esse e sfruttando i loro apparati metabolici per riprodursi. Diviene intuibile come avere degli enzimi di restrizione in grado di frammentare certe sequenze aiuti i batteri a difendersi. EcoR1 stato uno dei primi enzimi di restrizione scoperti e attualmente uno dei meglio conosciuti; stato fondamentale per la comprensione della struttura di questi enzimi, e della struttura della sequenza che viene riconosciuta. Il nome di questi enzimi costituito da un acronimo che deriva dal nome del batterio da cui sono stati isolati. EcoM1 deriva da Escherichia coli, ceppo R, 1 in quanto stato il primo ad essere scoperto (finora ne sono stati caratterizzati 4); HinD3 deriva da Haemophilus influentiae, etc. Ognuno di questi enzimi ha un suo sito di restrizione (le sequenze nucleotidiche specifiche che sono in grado di riconoscere), la cui struttura peculiare: deve essere infatti a simmetria centrale; sono dei palindromi, in sostanza. Il sito di restrizione riconosciuto da EcoR1 ad esempio questo:

5'-G A A T T C-3' 3'-C T T A A G-5' Questa struttura fa s che su due filamenti ci sia esattamente la stessa sequenza (letta secondo 5'--> 3'). Grazie alla loro simmetria centrale le due sequenze sono identiche. Questo sito di restrizione come vediamo ha 6 basi di riconoscimento; altri siti sono solo a 4 basi di riconoscimento. Il taglio della endonucleasi pu essere di due tipi. Un primo tipo ( il caso di EcoR1) prevede che la endonucleasi tagli un certo legame fosfodiesterico (es. quello tra la G e la A, vedi freccia) sia su un filamento che sull'altro: quindi la endonucleasi riconosce uno dei due filamenti e taglia tra G ed A; in un secondo momento, riconosce la stessa sequenza sull'altro filamento ed effettua il secondo taglio. Nel caso che abbiamo visto sopra, saremo in una situazione di due nick ravvicinati su due filamenti: pochi legami ad idrogeno tengono insieme la doppia elica in seguito all'inserimento dei due nick. Un secondo tipo di taglio prevede che i due nick avvegano in corrispondenza dello stesso legame fosfodiesterico. Il taglio del primo tipo tipicamente produce le cosiddette estremit coesive: i legami ad idrogeno non sono sufficienti per tenere insieme i due monconi, ma esiste una certa complementariet, che rende appiccicosi le due estremit, anche se il legame, di fatto, non pu tenere insieme la doppia elica. Nel tempo, ci possono essere tuttavia degli istanti in cui questo legame diviene stabile. Il taglio del secondo tipo invece porta alle estremit piatte: in questo caso, i due monconi non hanno possibilit di riunione, dato che non si formano legami ad idrogeno. L'importanza di questi enzimi sta anche nel fatto che si formano delle estremit coesive specifiche, che potranno essere riunite da delle ligasi, enzimi che in pratica effettuano un'azione antagonista rispetto alle endonucleasi, restaurando i legami fosfodiesterici e revertendo l'azione di taglio. Notare tuttavia che si pu riunire il DNA tagliato da un solo enzima di restrizione; far agire due diverse endonucleasi di restrizione significherebbe compromettere la compatibilit delle estremit coesive. Un'altra cosa interessante da notare riguardo l'utilizzo di endonucleasi e ligasi che, se separiamo una molecola di DNA in due monconi utilizzando EcoR1, possiamo poi sfruttare una ligasi per unire queste estremit ai monconi di una molecola di DNA di origine diversa, tagliata con lo stesso enzima di restrizione, formando una nuova molecola di DNA. Questo il principio su cui si basa la tecnica del DNA ricombinante: mettere insieme frammenti di DNA che in natura non si incontrerebbero mai, creando per esempio plasmidi batterici con geni umani, etc. Nel nostro organismo, la ricombinazione genica avviene praticamente solo a livello della gametogenesi e nelle cellule deputate alla produzione di anticorpi. In generale, la ricombinazione del DNA proveniente da organismi diversi possibile perch, dal punto di vista chimico, il DNA identico in tutte le forme di vita. Quello che cambia tra gli organismi soltanto la sequenza. A questo punto, adesso che abbiamo esaminato a grandi linee gli enzimi di restrizione, sorge spontanea una domanda. Gli enzimi endonucleasici sono enzimi potenzialmente pericolosi, come tutti gli enzimi litici in generale. Per esempio, nella necrosi dovuta ad ipossia, il contenuto lisosomiale viene riversato al di fuori dei lisosomi, liberando pericolosissime proteasi e anche nucleasi; la necrosi quindi anche dovuta alla digestione degli acidi nucleici. Come possono quindi le cellule produrre degli enzimi potenzialmente letali per il proprio DNA? Questo possibile perch si sono evoluti sistemi di protezione del DNA. Questi sistemi sono interessanti anche perch ci permettono di prendere in esame una prima forma di modifica del DNA: la metilazione. In questo corso parleremo di metilazione in almeno tre casi diversi tra loro, ma vedremo sempre che la metilazione ha una funzione di marker, una sorta di bandierina che serve a segnalare qualcosa. A questo punto, possiamo precisare che l'attivit di restrizione non comprende solamente il taglio endonucleasico, di cui abbiamo parlato finora, ma anche la modificazione del DNA, a livello della sequenza

di riconoscimento, la quale consiste di una metilazione. Cio, il batterio ha un enzima che riconosce la sequenza EcoR1 ed esercita a livello di questa un'attivit endonucleasica, ed un secondo enzima che riconosce la stessa sequenza ma esercita un'attivit di metilazione, in particolare sulla prima adenina del sito di restrizione. Quindi, dobbiamo immaginare che il DNA del batterio sia metilato a livello di ogni adenina di ogni sito di restrizione. Questa modificazione impedisce il taglio da parte dell'enzima di restrizione che il batterio stesso produce. Cosa succede quando il batterio si duplica? Le due cellule figlie, in seguito al processo di replicazione del DNA, che, come sappiamo, avviene con meccanismo semiconservativo, posseggono ciascuna una molecola di DNA formata da un filamento vecchio e uno nuovo; quest'ultimo non metilato. In altre parole, un filamento protetto, ed uno no. Questo per non costituisce un problema: al massimo, potr formarsi un solo nick, che da solo non sufficiente a compromettere la struttura dell'acido desossiribonucleico, e sar riparato da una ligasi. Possiamo essere ragionevolmente sicuri che prima della successiva replicazione del DNA, con il tempo, la attivit di metilasi sar esercitata anche sul filamento nuovo. Alla successiva duplicazione, entrambi i filamenti saranno protetti. Se dall'esterno giunge del materiale genetico esogeno ( il caso del DNA virale, ma anche di altro DNA batterico), questo sar un DNA nudo dal punto di vista della metilazione e sar prontamente digerito. Gli enzimi di restrizione furono proprio scoperti grazie alla caratteristica di alcuni batteri di restringere la capacit infettiva dei virus.

Biochimica - Lezione del 29-04-09 [Prof. Raugei]


La volta scorsa avevamo parlato degli enzimi di restrizione, che avevamo visto essere un interessante sistema di difesa batterico contro agenti infettivi che utilizzano il DNA. Essendo questa molecola una componente essenziale del virus (che formato da materiale genetico contenuto in capside proteico), in quanto porta con s le informazioni necessarie alla sintesi delle proteine virali, se il batterio possiede un sistema per frammentare il DNA virale pu neutralizzarne l'attacco e rendere inoffensivo il virus. Avevamo anche visto come il sito di restrizione, ovvero la sequenza di DNA che normalmente viene attaccata dall'enzima di restrizione, venga protetto dall'azione delle endonucleasi da una metilazione sulla prima adenina della sequenza stessa: questo impedisce che il DNA del batterio stesso venga frammentato. La metilazione a carico di enzimi detti metilasi, enzimi di modificazione del DNA che riconoscono le stesse sequenze riconosciute dagli enzimi di restrizione, ma invece che eseguire un taglio, metilano. Avevamo visto anche come, quando il DNA va incontro a replicazione semiconservativa, vi sia un momento iniziale in cui uno solo dei due filamenti (il filamento parentale, o stampo) metilato; con il tempo, la metilasi agir anche sul filamento nuovo. Nel frattempo, vero che solo un filamento protetto dai tagli, mentre l'altro no, ma sappiamo anche che un taglio su un solo filamento non sufficiente a compromettere la stabilit della struttura della doppia elica, e in definitiva non un danno preoccupante. Tra parentesi, vi sono var tipi di metilazione del DNA: l'adenina diviene N-6-metil-adenina; in altre situazioni si possono avere metilazioni a livello della guanina e della citosina peraltro, la metil-citosina estremamente simile alla timina. In tutti i casi comunque la metilazione utilizza come donatore di metili la Solfo-adenosin-metionina, che nel processo di donazione del metile diventa Solfo-adenosin-omocisteina. I siti di restrizione sono, in gran parte, a 4 o a 6 basi; statisticamente, nel DNA, sar pi frequente trovare dei siti di restrizione formati casualmente dalla giustapposizione delle basi quando sono a 4 basi che non quando sono a 6. La probabilit teorica di trovare una sequenza particolare di 4 basi in un DNA casuale 1/256, da 44. La stessa probabilit teorica calcolata per una sequenza di 6 basi d come risultato 1/4096, da 4 6. La probabilit di trovare sequenze di un numero maggiore di basi cala esponenzialmente, come si pu immaginare. Naturalmente, queste sono soltanto stime che forniscono un'ordine di grandezza, se non altro perch la sequenza del DNA di un organismo non casuale (tanto vero che la ricchezza relativa in GC

varia da organismo a organismo). Possiamo affermare comunque che, tendenzialmente, una certa sequenza di 4 basi comparir ogni qualche centinaia di basi, una a 6 basi ogni qualche migliaio di basi, una a 8 ogni qualche decina di migliaia di basi. Per cui, un enzima che ha un sito di restrizione di 4 basi taglia in media ogni qualche centinaia di basi, etc. Ci sono diverse classi di enzimi di restrizione. Quelli di cui stiamo parlando sono gli enzimi di tipo II; in questa classe di enzimi, vi sono due diversi enzimi, uno che taglia e uno che protegge la stessa sequenza. Entrambi quindi presenteranno almeno due domini: uno, in comune, che avr una di quelle strutture viste la volta scorsa e che in grado di riconoscere la stessa sequenza; un secondo dominio, diverso tra i due enzimi, che in un caso sar endonucleasico, in un caso avr la capacit di metilazione. Vi sono altri enzimi di restrizione in cui c' un unico enzima con tre domini: uno di riconoscimento, uno di taglio, e uno di modificazione. Nelle biotecnologie si utilizzano solo gli enzimi di restrizione di tipo II. Soffermiamoci, prima di andare avanti, su questa domanda: quante molecole di DNA ci sono in una cellula somatica umana? Nel nucleo vi sono normalmente 46 molecole (ogni cromosoma una molecola, quindi in caso di aberrazioni questo numero pu variare), pi una molecola per ogni mitocondrio (ogni mitocondrio possiede il suo piccolo cromosoma circolare); il numero di mitocondri varia da cellula a cellula, ma, mediamente, siamo nell'ordine delle migliaia. E in un batterio? In genere una, perch ha un solo cromosoma circolare (anche se nel momento appena precedente la scissione cellulare abbiamo due cromosomi nella stessa cellula), pi i plasmidi, il cui numero pu variare: in genere ne abbiamo decine. Ricordiamo che i plasmidi sono elementi genetici accessori che alcuni batteri possono contenere. Al di fuori del numero di molecole, qual la grandezza del genoma? Un genoma batterico tipico dell'ordine di grandezza del milione di basi. Nell'ambito degli eucarioti, si ha una grande variazione. I lieviti, eucarioti molto semplici, hanno genomi dell'ordine di grandezza delle decine di milioni di basi, mentre il genoma dei mammiferi di qualche miliardo di basi (circa 3 miliardi come corredo aploide). Un cromosoma, in media, ospita centinaia di milioni di basi (108). Il pi piccolo cromosoma umano, il cromosoma 22, grande 3 x 107 basi; molti altri cromosomi sono grandi 5-6 x 108. Questo significa che una molecola di DNA tendenzialmente pi lunga di 100 milioni di basi. Per quanto riguarda procarioti, il genoma in entrambi i casi costituito da DNA a doppio filamento; la differenza sta nel fatto che il genoma procarioti circolare, negli eucarioti lineare. Nei virus, il genoma , in molti casi, costituito da RNA. Peraltro, questa la ragione per cui i virus mutano cos velocemente: l'enzima che sintetizza le molecole di RNA, detto RNA polimerasi, commette molti pi errori della DNA polimerasi. Prima abbiamo menzionato i plasmidi; ne parliamo adesso perch stato l'altro elemento decisivo per l'ingegneria genetica e la nascita della tecnologia del DNA ricombinante. L'enzima di restrizione lo strumento che ci serve per aprire una molecola di DNA, inserirvi un DNA diverso, e richiuderlo; il plasmide il vettore di questo DNA. Fare questa operazione a livello cromosomico un problema: come abbiamo visto i cromosomi sono molecole enormi; un plasmide invece una sorta di piccolo cromosoma, anche questo circolare: ospita dei geni, ma rispetto ai cromosomi umani pi gestibile e maneggevole, in quanto ha una grandezza di qualche migliaio di basi. In genere i plasmidi contengono geni cosiddetti dispensari: geni non strettamente necessari alla vita del batterio, ma che possono rivelarsi utili in certe condizioni. Qual' la struttura di un plasmide? Prima di tutto abbiamo un'origine di replicazione, una zona che rende possibile il processo di inizio della duplicazione del DNA; se rimuoviamo questa sequenza, il plasmide non si duplica e prima o poi sparir da una popolazione batterica. I plasmidi in genere si duplicano quando avviene la duplicazione del DNA, e al momento della scissione della cellula vengono ripartiti tra le cellule; in questo modo, la quantit di plasmidi rimane costante nel tempo. Se la loro sintesi cessa di essere messa in atto, con i cicli di divisione il loro numero si ridurr progressivamente finch non scompariranno. Oltre all'origine, in un plasmide vi sono var geni. La differenza tra il cromosoma batterico e un plasmide che il primo contiene molti pi geni (un batterio ha circa 8-10,000 geni); un plasmide ha pochi ma caratteristi geni. Geni classici che si trovano a livello dei plasmidi sono quelli per la resistenza agli antibiotici. Come sappiamo, gli antibiotici sono strumenti farmacologici attivi contro le malattie batteriche; funzionano perch

discriminano tra i meccanismi metabolici di procarioti ed eucarioti. In pratica, sono veleni cellulari (che possono colpire ad es. la trascrizione o la traduzione) per i procarioti, ma che hanno poco o nessun effetto sugli eucarioti. Purtroppo, gli antibiotici sono sempre meno efficaci perch i batteri diventano resistenti: il loro DNA muta, e, casualmente, si pu sviluppare un qualche sistema di difesa. Per questo motivo, l'abuso di antibiotici sconsigliato, in quanto aumenta la probabilit che vengano selezionati ceppi resistenti anche a farmaci di nuova generazione. Tornando ai plasmidi, la resistenza agli antibiotici spesso veicolata da queste molecole. Dato che in molti batteri abbastanza facile il trasferimento di plasmidi da un batterio all'altro, la resistenza ad un antibiotico si pu rapidamente espandersi ad una intera popolazione batterica molto rapidamente. Il fenomeno che rende possibile tutto questo la coniugazione, il passaggio di un plasmide da un batterio ad un altro. Facciamo un esempio: supponiamo che un batterio possegga un plasmide con un gene per la resistenza all'amphicilina; significa che in grado di crescere in presenza di amphicilina, in quanto i geni producono sostanze in grado di proteggere il batterio dall'azione dell'antibiotico. In questo caso, l'amphicilina un antibiotico -lattamico; il gene per la resistenza all'amphicilina codifica per una lattamasi che viene riversata dal batterio sul terreno di coltura e idrolizza la molecola dell'antibiotico. Altri geni classici che possono essere veicolati da plasmidi sono quelli per la produzione di tossine; i batteri, nella loro evoluzione, hanno sviluppato meccanismi che consentissero loro di occupare tutto lo spazio possibile. Oltre alla crescita estremamente rapida, un altro sistema, utile per eliminare altre specie batteriche o microorganismi, proprio quello di eliminare la concorrenza attraverso sostanze venefiche. Infine, sono molto diffusi i geni che consentono di utilizzare fonti di carbonio atipiche, come il petrolio. Es. lo pseudomonas in grado di utilizzare il petrolio come fonte di carbonio grazie a dei geni che consentono l'espressione di particolari enzimi idrolitici. Questi geni ovviamente aumentano la fitness dei batteri. Ritornando all'ingegneria genetica, vediamo come si possono utilizzare i plasmidi come vettori di DNA esogeno. Supponiamo di avere un plasmide di 4000 basi circa; grazie al computer, si possono ricercare i siti di restrizione dei var enzimi di restrizione (EcoR1, EcoR5, etc.). In altre parole, si viene a creare una mappa dove sono segnate le posizioni a livello delle quali tagliano gli enzimi di restrizione. A questo punto, si pu scegliere un enzima che riconosca un sito di restrizione che compare una sola volta; in questo modo siamo sicuri che taglier in un solo punto, in modo da rendere il plasmide un filamento lineare anzich circolare. Questo si pu verificare effettuando un'elettroforesi su gel di agarosio. L'agar un polisaccaride che si ottiene da un'alga chiamata Agar agar; una sorta di gelatina, che forma una maglia e contrasta la migrazione di molecole di DNA; queste, essendo cariche negativamente, vengono trascinate verso il polo positivo quando sottoposte ad un campo elettrico. Le maglie del gel tendono a frenare questa migrazione in maniera inversamente proporzionale alla carica del DNA: per cui le pi piccole si fanno strada pi facilmente attraverso il gel di agarosio e migrano pi velocemente; quelle pi grandi procedono pi lentamente. Il DNA viene visualizzato perch trattato con bromuro di etidio, una molecola che lo colora. Eseguendo un'elettroforesi su gel, si pu verificare quante volte stato tagliato il DNA: se vediamo una sola striscia, vuol dire che c' un solo tipo di molecola. In generale, avremo tante strisce quanti sono i frammenti in cui stato tagliato il DNA. Abbiamo introdotto i plasmidi a questo punto soprattutto per accennare ad un argomento in particolare: una superstruttura del DNA che molto importante. Abbiamo esaminato la struttura del singolo filamento; abbiamo poi visto la doppia elica formata da due filamenti; in vivo per il DNA ha una superstruttura. Il DNA di cui abbiamo parlato finora un DNA rilassato, in una situazione di equilibrio; in vivo, il DNA una molecola che ha accumulato dell'energia, che lo fa assomigliare ad una molla: stiamo parlando del superavvolgimento del DNA. Ci sono degli enzimi che, con spesa di ATP, torcono il DNA, che accumula tensione; altri enzimi eseguono il lavoro inverso, senza spesa di energia ( un processo esoergonico) e fanno s che il DNA rilasci la tensione. Abbiamo parlato dei plasmidi perch questo fenomeno, nonostante sia valido per tutte le molecole di DNA, pi facile da capire se ci si riferisci ai plasmidi. In effetti, nei plasmidi che questo fenomeno stato scoperto. Il plasmide una molecola di DNA relativamente piccola, di qualche migliaio di basi, di cui possibile calcolare il peso molecolare. Effettuando l'elettroforesi su gel dei plasmidi, emergeva un fatto apparentemente inspiegabile: le specie molecolari sembravano due. Il fatto si spieg ipotizzando che il DNA, nella cellula batterica, non fosse in una stato rilassato, ma superavvolto. Con superavvolto si intende che, oltre all'avvolgimento destrorso, intrinseco alla doppia elica, la molecola di DNA nel suo complesso pu avere degli ulteriori avvolgimenti; questi superavvolgimenti possono essere positivi se sono nello stesso senso dell'avvolgimento della doppia elica (questo in natura non esiste), oppure

negativi se sono nel senso opposto. Il superavvolgimento negativo fa s che si crei una ultrastruttura: il DNA tende a compattarsi. Una delle ragioni dell'esistenza del superavvolgimento infatti proprio quella di avere un DNA pi compatto. Nella cellula il superavvolgimento si ottiene aprendo il plasmide; il resto del doppio filamento viene poi fatto passare attraverso la rottura, che infine viene riparata. In altre parole, le cellule creano dei nodi; il DNA in questo modo non in equilibrio, accumula energia; la sua struttura viene distorta da un punto di vista tridimensionale in modo che diventi pi compatto. Gli enzimi che si occupano di queste attivit enzimatiche sono le topoisomerasi di tipo II (dette girasi in E. coli); il nome eloquente: gli enzimi di questa famiglia non cambiano niente dal punto di vista chimico; cambiano solo la topologia della molecola. Le girasi sono topoisomerasi che con spesa di energia superavvolgono negativamente il DNA. Le topoisomerasi di tipo I invece eseguono il lavoro inverso, togliendo i superavvolgimenti del DNA. Nella cellula batterica comunque le girasi sono pi attive, sicch il plasmide , per la maggior parte del tempo, superavvolto cos come il cromosoma. Come dicevamo prima, una prima ragione per l'esistenza di questo fenomeno quella di avere un DNA pi compatto. Il DNA infatti una molecola gigantesca: difficile anche solo immaginare come questa struttura possa compattarsi all'interno di un batterio. Per quanto riguarda la seconda ragione, prima dobbiamo chiarire un concetto. Il superavvolgimento negativo (ribadiamo che con negativo si intende che avviene in senso opposto rispetto all'avvolgimento della doppia elica) fa s che nella cellula ci sia un equilibrio non enzimatico tra la forma superavvolta negativamente e una forma pi rilassata. La forma rilassata per non pu essere uguale alla forma rilassata del DNA che conosciamo, dato che la molecola ha acquistato energia: dove viene spesa l'energia accumulata? Nella rottura di alcuni legami ad idrogeno. Notiamo che un superavvolgimento positivo porterebbe ad una maggiore chiusura della doppia elica, con il risultato che per aprire la doppia elica sarebbe necessario spendere ancora pi energia. Invece, il superavvolgimento negativo sottrae energia: per aprire la doppia elica basta una energia minore. Quindi, la seconda probabile ragione che spiega l'esistenza di questo fenomeno che il DNA cos pu anche essere pi facilmente aperto a singolo filamento. Questo importante perch le due principali attivit in cui coinvolto il DNA sono la replicazione e la trascrizione, ed entrambe prevedono come prima tappa l'apertura della doppia elica. Questo sembra confermato anche dal fatto che, sperimentalmente, si vede che i batteri che hanno delle topoisomerasi II difettose si duplicano molto pi lentamente del ceppo di controllo. In un plasmide, introdurre superavvolgimenti abbastanza facile, in quanto un dominio topologico chiuso, ovvero una molecola che non ha estremit libere. Se, con un enzima di restrizione, si linearizzasse un plasmide per poi tentare di superavvolgerlo, la molecola semplicemente ruoterebbe su s stessa. La topoisomerasi II un enzima eterotetramerico che con consumo di ATP taglia un filamento e forma un nodo facendo passare l'altro filamento attraverso il taglio. Questo equivale a superavvolgere il DNA: da un plasmide rilassato, la girasi, con consumo di ATP, in grado di produrre la struttura superavvolta. Il superavvolgimento in natura stato osservato solo negativo; un superavvolgimento positivo sarebbe una sorta di inibizione all'apertura di una doppia elica, dunque poco conveniente. Le topoisomerasi I, come abbiamo visto, tolgono i superavvolgimenti. Questa una operazione piuttosto semplice. Gi soltanto tagliando uno dei due filamenti si pu svolgere la doppia elica. Inoltre, l'enzima non ha nemmeno bisogno di ATP: il processo spontaneo. Il superavvolgimento del DNA non riguarda solo i plasmidi batterici: un fenomeno comune a tutto il DNA di tutti gli organismi, compreso il nostro. Tuttavia, sorge spontanea una domanda: come possiamo pensare a dei domini topologici chiusi, dato che i cromosomi sono lineari? Non abbiamo ancora esaminato la struttura della cromatina, ma per il momento ci basti sapere che i nostri cromosomi possono essere considerati dei domini topologici chiusi. Una molecola lineare pu diventare un dominio topologico chiuso qualora se ne fissino le estremit cos da tenerle ferme. Nel nucleo c' una gigantesca quantit di proteine; il DNA nel nucleo non certo una molecola libera, ma strettamente legata ad altre molecole. Questo fa s che il DNA, di fatto, sia costituito da tanti domini topologici chiusi, e questo permette l'avvolgimento. Se assumiamo che i cromosomi siano domini topologici chiusi, questo significa che la topoisomerasi II pu agire su di essi, e quindi anche per i cromosomi avremo un equilibrio tra una ultrastruttura compatta e una forma rilassata con una zona a singolo filamento. Si pu capire che il DNA superavvolto esaminandolo a livello degli ottameri nucleosomici, intorno ai quali il DNA avvolto a rocchetto. Non a caso, quando il DNA viene trascritto, la struttura nucleosomica deve essere smantellata. La trascrizione quindi anche negli eucarioti viene favorita

perch il DNA energeticamente pronto ad aprirsi. Il DNA viene tenuto fermo ai capi dagli istoni, e i nucleosomi che si trovano in mezzo ai due capi vengono smantellati, cos si pu instaurare l'equilibrio. Quando si purifica il DNA dagli istoni, la forma superavvolta viene persa, per cui non ci si accorti di questa ultrastruttura se non esaminando i plasmidi. Parliamo adesso della replicazione del DNA. Diamo per scontato che siano ben compresi alcuni concetti base: che si tratta di una replicazione semiconservativa; che la direzione di sintesi 5'-->3', per cui la sintesi avviene in sensi opposti sui due filamenti; che su un filamento la sintesi continua, mentre sull'altro discontinua. A differenza della trascrizione, che, vedremo, coinvolge un solo filamento di DNA, la replicazione del DNA coinvolge entrambi i filamenti. Si tratta di un processo sorprendentemente efficiente per replicare una enorme molecola come quella del DNA, anche se un processo complesso da organizzare per gli enzimi coinvolti. A livello del singolo filamento abbiamo la copiatura, sulla base della sequenza del filamento stampo, di un filamento complementare. Per cui le DNA polimerasi non inventano niente dal punto di vista della sequenza di DNA. La premessa per l'azione di questi enzimi la presenza di un filamento che faccia da stampo. Tranne quando diversamente specificato, parleremo di questi fenomeni in riferimento ai procarioti. Prima di tutto perch in genere i processi metabolici sono meglio conosciuti nei procarioti che negli eucarioti, e poi perch finora, quando un processo stato approfondito anche per quanto riguarda i procarioti, si sempre visto che i meccanismi erano estremamente simili. Naturalmente, vi sono casi in cui due processi sono molto diversi; alcuni processi poi esistono solo negli eucarioti (es. lo splicing). La duplicazione del DNA inizia in un punto ben preciso, detto origine di replicazione, o, abbreviato, OriC. Nei cromosomi eucariotici ci sono diverse origini di replicazione, ma il significato lo stesso. Si tratta di zone del DNA con una sequenza particolare, che viene riconosciuta dagli enzimi che devono interagire con Ori C. Solitamente le origini di replicazione sono sequenze di 13 nucleotidi ripetute 3 volte. Altre sequenze sono di 9 nucletidi e sono ripetute 4 volte (in una direzione o nell'altra). Le sequenze consenso sono sequenze medie: sono sequenze che non sono sempre perfettamente uguali, ma molte posizioni sono conservate. Una tipica sequenza consenso : GAT C T N TT N TTTT N significa che pu esservi qualunque nucleotide come abbiamo detto, le sequenze consenso sono molto conservate, ma non identiche. Questa sequenza di 13 nucleotidi ripetuta 3 volte. L'altra, di 9 nucleotidi, ripetuta 4 volte, : TTAT N CANA Queste sequenze, come si vede, sono particolarmente ricche in T ed A. Queste basi rappresentano, come sappiamo, dei punti di debolezza del doppio filamento. Quindi, non solo qui saremo verosimilmente in presenza di DNA superavvolto negativamente (il che, abbiamo visto, facilita l'apertura della doppia elica), ma abbiamo anche delle sequenze la cui composizione di basi azotate molto ricca di T ed A, che formano solo 2 legami ad idrogeno. In questa zona, la doppia elica si apre con relativamente poca energia. La presenza di queste sequenze serve quindi non solo come riconoscimento per quegli enzimi deputati ad iniziare il processo di replicazione, ma anche come zona favorevole all'apertura. Abbiamo dei fattori proteici, detti DNA A, DNA B e DNA C, che interagiscono con l'origine di replicazione per formare un complesso aperto da cui inizia il fenomeno della replicazione del DNA. Per primo si lega DNA A, in una struttura che ricorda vagamente quella di un nucleosoma. Si forma quindi una sorta di complesso ottamerico grazie all'interazione tra la DNA A e le sequenze viste prima; il DNA si apre a singolo filamento, con formazione di una forcella di replicazione a destra e una a sinistra, ed entrano in gioco DNA B e DNA C. DNA B una elicasi che scorre sul DNA e, con consumo di ATP, rompe i legami ad idrogeno. l'attivit enzimatica che serve ad ampliare la forcella di replicazione. Nel complesso, ci

saranno due elicasi, una per ogni forcella di replicazione: procedendo in due direzioni opposte, ampliano le rispettive forcelle di replicazione. A questo punto, la sintesi a carico della DNA polimerasi III. In natura, tutte le DNA polimerasi sintetizzano in direzione 5'-->3'. Grazie al filamento stampo, l'enzima effettua la sintesi del nuovo filamento. L'enzima necessita di un -OH libero in 3', a livello del quale catalizza la formazione di un nuovo legame fosfodiesterico con un nuovo deossinucleoside trisfosfato, stabilito secondo la complementariet delle basi. La DNA polimerasi ha infatti affinit per i deossinucleosidi trifosfato - la sintesi avviene perch abbiamo substrati gi attivati con un gruppo trifosfato: da un punto di vista termodinamico, sono identici all'ATP. Il legame si forma senza ulteriore dispendio energetico perch l'energia gi presente in questi legami. Formatosi il legame fosfodiestere con attacco nucleofilo, viene perso un gruppo pirofosfato, che l'enzima pirofosfatasi trasforma prontamente in due gruppi fosfato, rendendo la reazione ancora pi esoergonica (G ancora pi negativo). Insomma, la reazione di sintesi viene resa esoergonica dall'idrolisi dei due legami anidridici tra i fosfati, che sono ad alta energia; prima l'idrolisi avviene a livello dei nucleosidi trifosfato, poi a livello del pirofosfato. L'equilibrio della reazione quindi si sposta verso i prodotti grazie al fatto che viene utilizzato un substrato attivato. La DNA polimerasi, come enzima, affine al suo substrato: i 4 deossinucleosidi trifosfato. Per ognuno di questi ha la stessa identica affinit. La scelta di quale dei quattro deossinuclesidi trifosfato possibili verr inserita viene fatta, in pratica, dal filamento stampo. La DNA polimerasi procede per tentativi: inserisce i deossinucleosidi trifosfato uno per volta, finch, sulla base della complementariet con le basi del filamento stampo, non trova quello adatto. La sintesi, vale la pena ribadirlo, sempre in direzione 5'--> 3' dal punto di vista del filamento stampo, quantomeno. La notazione 5' 3' significa che viene utilizzato il 3' libero per legare il 5' di un nuovo nucleotide. Questo ha anche un'altra conseguenza: la DNA polimerasi ha bisogno di un -OH libero in 3' per iniziare la sintesi; questo significa che serve un qualcosa per iniziare la sintesi. La cellula risolve questa situazione cos: nel momento iniziale della sintesi, viene posto un innesco sotto forma di RNA, che presenta un 3' -OH libero; per la DNA polimerasi questo substrato sufficiente, e cos pu iniziare la sintesi del DNA. I primer di RNA sono due: uno per ogni filamento. Chiaramente, se il filamento stampo ha una direzionalit di tipo 5'-->3', il filamento stampo sar 3'-->5', e viceversa. Ci sar un filamento su cui la DNA polimerasi pu procedere sintetizzando in maniera continua. Su uno dei due filamenti per la DNA polimerasi costretta a sintetizzare in direzione opposta. Su questo filamento, nel momento in cui la DNA elicasi apre la forcella di replicazione, vengono deposti via via nuovi inneschi, ciascuno ogni 1000 basi circa; la DNA polimerasi sintetizza quei frammenti di DNA, di circa 1000 basi, che si trovano tra un innesco e l'altro: i frammenti di Okazaki. La sintesi sul filamento discontinuo verr completata con l'eliminazione dell'innesco di RNA e la sintesi del DNA mancante; infine, una ligasi unir i frammenti di DNA tra loro. A sintesi completata, la differenza non si vedr. In E. coli, vi sono tre tipi di DNA polimerasi (I, II, III); in E. coli, la DNA pol III l'enzima pi coinvolto nel processo di sintesi, che sintetizza quasi tutto il DNA. La DNA pol I l'enzima che sintetizza il DNA mancante sul filamento discontinuo. La DNA pol II invece non coinvolta nella sintesi, ma nella riparazione. Dal punto di vista strutturale, la DNA polimerasi III un enzima estremamente complesso, composto da 8 o 12 subunit diverse. Le subunit sono nominate con lettere greche: , , , , . Possiamo considerare l'enzima come diviso in due met: alcune subunit (es. , che sono come delle pinze per mantenere il contatto con il DNA, , , che la subunit catalitica) sono presenti in entrambe le met dell'enzima, altre invece sono presenti solo in una delle due, con il risultato che una delle due unit di cui composto l'enzima pi grande. Le subunit servono a connettere le due met e a tenerle insieme. L'unit pi piccola cura la sintesi del filamento continuo, l'unit pi grande si occupa della sintesi del filamento discontinuo. Quindi le sintesi avvengono insieme. Di fatto, come avviene la sintesi? Come possono la sintesi lenta e la sintesi veloce avvenire insieme, visto che procedono in direzioni diverse? La sintesi avviene a livello del grosso complesso multienzimatico chiamato replisoma, che comprende una DNA polimerasi III (l'enzima che, come abbiamo visto, opera la sintesi del DNA), una elicasi (l'enzima che apre la doppia elica), e una primasi (l'enzima che deposita gli inneschi). Per far avvenire insieme le due sintesi, uno dei due filamenti, quello della sintesi lenta, viene ruotato di 180 grazie alla formazione di una ansa: in questo modo la sintesi, da un punto di vista topologico,

pu procedere nella stessa direzione. L'ansa di circa un migliaio di basi, vale a dire una quantit corrispondente ad un frammento di Okazaki. Quindi, la parte sinistra dell'enzima, che cura la sintesi continua, opera su un filamento; sul filamento piegato ad ansa la primasi deposita l'innesco, mentre la parte pi complessa della DNA polimerasi proceder alla sintesi di un frammento di circa 1000 basi. La struttura poi si smantella, il complesso scorre di circa mille basi, e si forma un'altra ansa, che equivale ad un altro frammento di Okazaki. Essendo le due parti di enzima legate insieme, la sintesi lenta rallenta la sintesi veloce, perch di fatto le due sintesi procedono alla stessa velocit chiamata sintesi veloce perch di fatto andrebbe molto veloce. Se la sintesi veloce procedesse alla velocit massima, e la sintesi lenta fosse un processo separato, avremmo il formarsi di una grande quantit di DNA a singolo filamento, perch, dei due filamenti separati dalla elicasi, uno sarebbe rapidamente coperto, mentre l'altro, nell'attesa di passare dalla DNA polimerasi, rimarrebbe spaiato. Questa una situazione estremamente pericolosa per la cellula: se il singolo filamento subisse un nick, avremmo una rottura della doppia elica. Durante la replicazione del DNA infatti, esistono delle proteine dette SSBPs (Single Strand Binding Proteins) che si legano al singolo filamento e che hanno la duplice funzione di mantenere il DNA aperto stabilizzando il singolo filamento e di proteggerlo dalle rotture. Quindi: una situazione in cui vi molto DNA a singolo filamento libero indesiderata; la maniera che l'evoluzione ha trovato per ovviare a questa situazione stata quella di legare insieme le due sintesi.

Biochimica - Lezione del 4-05-09 [Prof. Raugei]


Lo scopo di questa parte del corso cercare di capire, a partire descrizione di ci che avviene nella cellula, la conoscenza di questi fenomeni abbia reso possibile il loro utilizzo in vitro e nell'ingegneria genetica. Per quanto riguarda la replicazione del DNA, abbiamo visto che a livello della forca di replicazione si monta questo grosso complesso proteico composto, oltre che da elicasi (un enzima a forma di cuneo che, con consumo di ATP, rompe i legami a idrogeno e apre la doppia elica) e primasi (un enzima che sintetizza gli inneschi a RNA), dalla DNA polimerasi, che in E. coli la III questo enzima cura la gran parte della sintesi del DNA. Si tratta di un enzima composto da due unit: uno si occupa della sintesi veloce, l'altro della sintesi lenta quest'ultima ha 5 subunit in pi; il resto delle subunit sono uguali tra le due parti dell'enzima. Di queste, le subunit sono quelle responsabili dell'attivit polimerasica; le subunit sono quelle che tengono insieme le due met dell'enzima; la forma una sorta di struttura a pinza che si associa al DNA; la che ha attivit esonucleasica, responsabile della capacit di proof reading tipica delle attivit DNA polimerasiche (che vedremo dopo). Secondo la teoria pi accreditata, si formerebbe una sorta di ansa, di circa 1000 basi, che permetterebbe alle due sintesi di procedere contemporaneamente. La primasi una RNA polimerasi che si occupa della sintesi degli inneschi a partire dai quali pu iniziare la sintesi dei frammenti di Okazaki; durante la sintesi i frammenti di Okazaki sono frammisti agli inneschi di RNA, che vengono in seguito eliminati da un enzima detto eraser; nelle zone a singolo filamento che si formano dove prima vi erano gli inneschi sintetizzato prontamente del DNA dalle DNA polimerasi I e III, a partire stavolta dai 3'OH dei frammenti di Okazaki. La DNA polimerasi I un altro enzima fondamentale nella duplicazione del DNA, ma che non partecipa direttamente alla sintesi; rifinisce il lavoro, ed coinvolto anche nella riparazione del DNA. un enzima molto importante anche perch forse il principale enzima utilizzato nell'ingegneria genetica. Verosimilmente, in tutto il mondo, ogni giorno ne viene utilizzato qualche Kg, perch viene utilizzato nelle tecniche pi disparate, a partire dalla PCR fino alle tecniche di sequenziamento del DNA. Perch questo enzima cos diffuso? La DNA polimerasi III molto complesso come enzima, essendo formato da numerose subunit: difficile anche solo da studiare. La DNA polimerasi I invece un enzima molto semplice, poich monomerico. un unico polipeptide, nemmeno molto grande, di circa 100 kDa questo significa che formato da circa 900 aminoacidi: 100 kDa = 100,000 Da; dato che il peso medio di un

aminoacido circa 110 Da, 100,000 / 110 900 aminoacidi. Questo un peso tutto sommato medio per una proteina. La cosa interessante che, nonostante sia un unico polipeptide, si possono riconoscere dei domin in generale, in una proteina si possono riconoscere dei domin se questa ha attivit o capacit diverse. Per esempio, se una proteina ha la capacit di riconoscere un recettore ed ha anche una attivit enzimatica, verosimile che abbia due domin; oppure, quando una proteina ha diverse attivit enzimatiche, spesso possibile riconoscere dei domin quasi come se fossero diversi quartieri di una citt. In questo caso, le attivit possedute dalla DNA polimerasi I sono - polimerasi 5'-->3', che ci attendiamo - una esonucleasi 3'-->5' , responsabile del proof reading - nucleasi 5'-->3' Quindi questo enzima ha anche delle attivit esonucleasiche; come vedremo, l'attivit di esonucleasi 3'-->5' comune a tutte le DNA polimerasi: permette di correggere eventuali errori, il che risulta in una aumentata fedelt di copia. In pi, abbiamo anche una attivit 5'-->3' esonucleasica. Questo enzima, dal punto di vista della attivit di DNA polimerasi, non molto efficace, dato che molto pi lento della DNA polimerasi III, ed poco processivo. Cos' la processivit? Nel caso della sintesi del DNA, non dobbiamo pensare che l'enzima inizi la sintesi, e si fermi solo in fondo alla sequenza da duplicare, a replicazione ultimata. Questo raramente vero per una reazione; nel caso della DNA polimerasi si attacca alla forcella di replicazione, procede per qualche migliaio di basi, poi in genere si stacca e se ne attacca un altro. La processivit quanto dura il lavoro di una singola molecola; DNA polimerasi III molto processiva, ed anche veloce. DNA pol I lenta e poco processiva per, dato che deve sostituire gli inneschi, non importante che sia molto veloce n processiva, dato che si tratta di decine di basi. Inoltre, anche se una singola DNA polimerasi I non dovesse farcela, ci sono molte altre molecole in grado di prendere il suo posto. In effetti, si chiama DNA polimerasi I perch stata scoperta per prima, e questo successo perch particolarmente abbondante: si parla di decine di migliaia di copie. Klenow, ricercatore degli anni '50, riusc, con un taglio endopeptidasico operato con un enzima che casualmente aveva questa specificit, ad eliminare una parte dell'enzima detto frammento piccolo, ottenendo il cosiddetto frammento grande di Klenow, che mantiene l'attivit polimerasica ed esonucleasica 3'-->5'. Si tratta di una sorta di versione ridotta dell'enzima, che per in vitro funziona perfettamente, sotto certi aspetti anche meglio dell'enzima completo, perch in vivo l'altra attivit esonucleasica tendeva a rallentare la reazione. Nell'ingegneria genetica si utilizza in effetti questo frammento, per lo pi. La polimerasi I, come struttura tridimensionale, si pu assimilare ad una mano in cui indice e pollice formano un orifizio attraverso il quale passa il DNA appena sintetizzato. Il dominio polimerasico dato dalle dita; nel palmo c' l'attivit esonucleasica di proof reading. Tutte le DNA polimerasi hanno capacit di proof reading, ovvero di correzione delle bozze. Questo nome deriva dalla figura, tipica del giornalismo di un tempo, del correttore delle bozze (proof reader), che correggeva gli errori di ortografia nelle bozze degli articoli scritti dai giornalisti, cosicch queste fossero corrette prima di andare in stampa. Alcuni enzimi fanno qualcosa di simile al correttore di bozze: sono le DNA polimerasi, e un altro enzima chiamato Aminoacil-tRNA sintetasi, che lega l'aminoacido al proprio tRNA corrispondente enzima che vedremo a suo tempo. Dunque sono pochissimi gli enzimi in grado di esercitare questa attivit. Supponiamo di avere un filamento stampo con la sua sequenza, con una DNA polimerasi che sta sintetizzando. Pu succedere che l'enzima commetta un errore, per esempio appaiando una G ad una T. Questo errore genererebbe una mutazione, ma l'enzima pu sentire l'errore in virt della sua particolare struttura. Dato che il DNA una doppia elica antiparallela, questa mantiene il suo calibro solamente se vi sono degli appaiamenti corretti tra le basi: abbiamo una purina (leggermente pi voluminose) che si accoppia con una pirimidina (leggermente pi piccole), e questo fa s che sul piano di legame vi siano sempre tre anelli, due della purina e uno della pirimidina. Se, in seguito ad un errore, avviene un appaiamento non corretto (es. due purine) l'elica si distorce inevitabilmente; anche se si accoppiasse una purina con una pirimidina, il fatto che non si instaurino le giuste interazioni deboli perturba la struttura della doppia elica. Con un effetto di tipo allosterico, l'attivit polimerasica si ferma immediatamente appena la DNA polimerasi avverte l'errore. La stessa distorsione induce anche un altro: l'enzima torna indietro, un po' come facciamo noi quando, scrivendo al computer, ci accorgiamo di aver commesso un errore: premiamo il tasto delete, cancelliamo la parola sbagliata tornando indietro, e riscriviamo. La DNA polimerasi allo stesso modo, esercita la sua attivit esonucleasica 3'-->5', che fa s che l'enzima torni indietro rispetto alla direzione di

sintesi di 5-10 nucleotidi. A quel punto, si blocca l'attivit esonucleasica e riprende la normale attivit polimerasica. L'evoluzione ha portato a mettere a punto, come si vede, un sistema di replicazione del DNA estremamente preciso e raffinato si pu capire, dato che il DNA il nostro patrimonio genetico, ed fondamentale che venga replicato adeguatamente. Questo vero soprattutto per gli organismi pi semplici, che hanno cicli di replicazione velocissimi. Le mutazioni sono quasi sempre negative. Abbiamo visto quasi tutte le attivit enzimatiche di questo processo molto complesso che la replicazione del DNA (negli eucarioti sono stati evidenziati meccanismi simili, leggermente pi complessi, ma in cui la logica di fondo rimane la stessa la differenza pi grossa tra procarioti ed eucarioti che questi ultimi hanno pi origini di replicazione per cromosoma): DNA B: inizia lo svolgimento dell'elica Primasi DNA A, poi sostituita da Elicasi con consumo di ATP, spezza i legami ad idrogeno della doppia elica. SSBP stabilizzano il singolo filamento DNA polimerasi III Eraser elimina gli inneschi di RNA DNA polimerasi I riempie gli spazi lasciati dagli inneschi di RNA eliminati DNA Ligasi unisce i frammenti di Okazaki tra loro con consumo di ATP formando il legame fosfodiesterico tra il 3' OH e un 5' P; formare questo legame un processo endoergonico. Durante la sintesi il processo viene portato avanti dal fatto che si utilizzano substrati attivati, ma qui non avviene. DNA Girasi Ci rimane da vedere l'ultima, la DNA girasi, una topoisomerasi con un ruolo molto importante. Abbiamo detto che l'elicasi apre il doppio filamento. L'elicasi, in questa operazione, crea superavvolgimenti positivi ( come se stesse chiudendo la doppia elica); se non ci fosse un meccanismo per togliere i superavvolgimenti positivi il processo si fermerebbe. Per questo, esiste la DNA girasi che introduce superavvolgimenti negativi, permettendo in pratica la rotazione del DNA e annullando i superavvolgimenti positivi. Tuttavia, c' un problema nella sintesi del DNA. Pensiamo ad un cromosoma circolare, o ad un plasmide. Si forma una apertura a livello dell'origine di replicazione, le due forche di replicazione procedono una in senso orario, l'altra in senso antiorario, e infine si incontrano. La sintesi allora completata. I procarioti non hanno problemi, perch il cromosoma, essendo circolare, viene automaticamente copiato per intero. Ma per un cromosoma lineare, come quelli eucariotici? Alla fine della sintesi emerge un problema a livello dei telomeri, le zone terminali dei cromosomi lineari. Arrivate al rispettivo telomero, le due forche di replicazione ad un certo punto separeranno completamente i due filamenti di DNA. Un filamento sar copiato per sintesi veloce, che non crea problemi. L'altro filamento sar copiato per sintesi discontinua: dato che la primasi pone inneschi ogni 1000 basi circa, cosa succede se l'ultimo innesco prima della fine del cromosoma a 100 basi di distanza? La primasi non pu a questo punto porre l'innesco, e la DNA polimerasi non potr sintetizzare il DNA. Inevitabilmente, il filamento si accorcia, e una parte di DNA viene perso: ad ogni generazione del DNA, si verifica un accorciamento dei telomeri, che nei batteri non avviene perch il genoma circolare. Come fanno gli eucarioti a risolvere il problema? Prendiamo in esame un eucariota molto semplice, come un lievito -questi, in sostanza, si coltivano come batteri, e, quasi come i batteri, sono abbastanza rapidi a crescere. Se non avessero strategie per difendersi dall'accorciamento dei telomeri, con le generazioni i cromosomi tenderebbero ad accorciarsi, e ad un certo punto i cromosomi verrebbero intaccati in zone codificanti. Questo prima o poi porterebbe alla impossibilit di riprodursi. Esistono delle attivit enzimatiche dette telomerasi che allungano le estremit dei cromosomi. Questi enzimi aggiungono ai telomeri segmenti di DNA non codificante, cosicch l'accorciamento elimini DNA inutile. Quindi le telomerasi aggiungono DNA tampone alla fine del cromosoma, cosicch l'accorciamento dei telomeri riguardi DNA inessenziale dal punto di vista genico. Le telomerasi aggiungono sequenze ripetute (vedremo tra un attimo di che si tratta) in set diversi, di decine, centinaia o migliaia di basi (a seconda della specie) allungando il 3'OH. Questi prolungamenti possono essere perduti senza conseguenze. Le telomerasi sono sempre attive negli eucarioti molto semplici che si riproducono spesso (come i lieviti);

negli animali le telomerasi non sono sempre attive, ma sono attive solo in momenti precisi e circoscritti: a livello della gametogenesi, e nelle prime fasi dell'embriogenesi. In quest'ultimo caso, nelle cellule postzigotiche, le telomerasi sono attive, e si accumulano telomeri molto lunghi. I nostri cromosomi hanno telomeri lunghissimi all'inizio della nostra vita; le cellule hanno una sorta di patrimonio di telomeri, che viene progressivamente speso, nella vita dell'organismo, durante le generazioni. Il nostro organismo, con i suoi 300 tessuti diversi, formato da miliardi di cellule. In genere, le cellule proliferano prima di differenziarsi; quando si differenziano terminalmente, smettono di riprodursi (es. neuroni, globuli rossi). Naturalmente, queste cellule non proliferano, ma svolgono la loro funzione nell'economia dell'organismo. La proliferazione necessaria per arrivare alla variet di cellule esistenti per ogni tessuto; alcune cellule differenziate del nostro organismo hanno alle spalle non pi di 100 generazioni, e possiamo considerare questo come un tetto massimo. I telomeri devono essere sufficienti per sopperire alla perdita di DNA per circa 100 generazioni, quindi. Alcune teorie ipotizzano che l'accorciamento dei telomeri sia una delle cause dell'invecchiamento, insieme agli errori che si accumulano nel DNA e ai danni ossidativi. Per quanto sia improbabile che l'accorciamento dei telomeri rappresenti l'unico fattore che porta all'invecchiamento, certamente probabile che abbiano un ruolo. I telomeri sono importanti anche nei tumori. Almeno nel 50% dei tumori analizzati le telomerasi hanno ripreso a funzionare. Una delle ragioni per cui la cellula cancerosa pu continuare a proliferare anche perch supera il problema dei telomeri, che tenderebbero ad accorciarsi. C' da dire che in molti tumori le telomerasi non sono attive, per cui ci dev'essere qualche altro meccanismo per bypassare il problema, che potrebbe coinvolgere il riarrangiamento di aberrazioni cromosomiche. Si era pensato a strategie antitumorali che andassero ad inibire le telomerasi, ma si sono rivelate un fallimento completo, e anche questo denuncia la probabile esistenza di altri meccanismi. Quindi, normalmente le telomerasi sono attive solo per un breve periodo del nostro ciclo vitale. Gi dallo stadio di feto e per tutto il resto della vita, le telomerasi non dovrebbero essere pi attive se non a livello delle gonadi. interessante esaminare il funzionamento delle telomerasi. Dal punto di vista enzimatico, si tratta di DNA polimerasi, dato che sintetizzano DNA. Devono quindi sottostare alle condizioni a cui sottostanno le DNA polimerasi: (1) ha bisogno di un 3'OH per iniziare la sintesi; (2) ha bisogno di una sequenza stampo su cui impostare la sintesi. Per quanto riguarda la prima condizione, l'innesco semplicemente il tratto di DNA prima del telomero. A soddisfare la seconda condizione vi un filamento di RNA. Quindi, si tratta di una DNA polimerasi RNA dipendente, perch sintetizza DNA sulla base di uno stampo di RNA. Un'altra celeberrima DNA polimerasi RNA dipendente la trascrittasi inversa dei retrovirus, nota per costituire una clamorosa eccezione al dogma centrale della biologia (DNA trascrizione--> RNA traduzione--> proteine). La cosa davvero curiosa, tuttavia, che lo stampo di RNA legato all'enzima. La telomerasi composta da una parte proteica che utilizza come gruppo prostetico una corta molecola di RNA. C' una zona dell'RNA che normalmente trova una certa complementariet a livello del telomero, associandosi; l'RNA presenta poi una zona libera che pu essere copiata dall'attivit polimerasica della telomerasi. L'RNA viene copiato con un movimento a bruco: la sequenza viene copiata, e poi si ritrae. La sequenza presenta uno stelo in cui, bizzarramente, G accopiato a T; questo accoppiamento non contribuisce alla stabilit dell'elica, per non la destabilizza poi molto. Il G del legame a idrogeno tra T e G leggermente negativo, e si forma. Abbiamo quindi uno stelo, piuttosto lungo (di 500-3000 basi). Il fatto che si formi questo stelo con accoppiamenti esotici ma permessi, con T-G, T-T, G-G, un meccanismo che serve a far s che non vi sia DNA a singolo filamento libero: i momenti in cui esiste DNA a singolo filamento libero sono momenti di debolezza per la cellula. Il risultato dell'attivit della telomerasi produce quindi una serie piuttosto lunga di sequenze ripetute che formano i telomeri. Nelle normali cellule somatiche, possiamo aspettarci dei lunghi telomeri in una cellula giovane, poco distante dallo zigote come generazioni; in una cellula terminalmente differenziata, che si gi riprodotta diverse volte, i telomeri sono considerevolmente ridotti. Nel momento in cui una cellula diventa cancerosa,spesso le telomerasi ritornano attive, e la proliferazione pu andare avanti senza problemi. Focalizziamoci adesso sulla capacit del DNA di replicare s stesso con estrema precisione. Qualunque

attivit enzimatica commette degli errori. Qualunque sia la reazione catalizzata, verosimilmente saranno commessi errori, come gruppi funzionali attaccati in posizioni aberranti, etc. Se il tasso di errori si mantiene basso, non ci sono di solito effetti significativi: tra le centinaia di molecole sintetizzate correttamente, un prodotto difettivo solitamente non crea problemi e viene semplicemente distrutto. Questo discorso si pu estendere all'RNA ma non al DNA. L'RNA viene sintetizzato, e occasionalmente potranno essere presenti degli errori: al massimo questo potr portare ad un certo numero di proteine con aminoacidi sbagliati. L'RNA dopo poco (in genere minuti od ore, massimo giorni) viene degradato. Il DNA per una molecola che, come abbiamo visto, ha una certa eternit: rimane costante nelle generazioni. Un errore commesso a livello del DNA ha conseguenze che si estendono ben al di l del breve termine: ogni mutazione viene ereditata e sar presente nelle molecole successive. Ovviamente, una sintesi perfetta non possibile, ma si sono evoluti dei meccanismi che tendono a minimizzare gli errori. Le DNA polimerasi hanno un tasso di errore tutto sommato basso, e riconoscono gli errori pi grossolani, ma si calcola che commettano errori con frequenza 10-4. Se si pensa che ogni errore una mutazione, ci si rende ben conto che un tasso di mutazioni simile sarebbe enorme, probabilmente incompatibile con la vita (ricordiamo che ogni mutazione un errore). La capacit di proof reading delle DNA polimerasi corregge gi alcuni errori a livello della sintesi, facendo scendere il tasso di errori a 10-7. Questo significa che su 1000 errori commessi, 999 vengono riconosciuti subito. L'evoluzione per ha ulteriormente abbassato questo tasso di mutazione: si sviluppato un ulteriore livello di controllo, un proof reading a valle della replicazione, che fa scendere la frequenza di errori definitiva a 10-9 per i batteri e tra 10-9 e 10-10 per gli eucarioti. Questa stata la frequenza di mutazioni che l'evoluzione ha sancito essere compatibile con la vita. Si possono trovare mutanti, in specie tra i batteri, in cui tale tasso di errori sia pi alto, per difetti nei meccanismi di correzione. Questi batteri, in genere, accumulano troppi errori, con conseguenze deleterie. interessante notare per che sono stati trovati mutanti con tasso di mutazione ancora inferiore, nei quali cio la mutazione aveva perfezionato i meccanismi di proof reading. Questo significa che il meccanismo di proof reading che si stabilizzato non il pi preciso possibile, ma per qualche motivo si rivelato migliore. Questo lascia intendere che le mutazioni, in parte, sono necessarie. Quindi, possiamo aggiornare la lista delle funzioni del DNA. Il DNA: replica s stesso viene trascritto in RNA muta L'evoluzione non sarebbe stata possibile senza un minimo di mutazioni. Le mutazioni, per quanto in gran parte negative, sono alla base della capacit dei batteri di diventare resistenti agli antibiotici. Se non ci fossero mutazioni, il batterio non potrebbe mai fare una cosa del genere. Questo un sistema di adattamento dei batteri: casualmente, possono comparire mutanti pi adatti a sopravvivere a certe condizioni ambientali. In una popolazione di batteri che venga posta in un ambiente con una temperatura che non consente un adeguato funzionamento delle attivit cellulari (per esempio, a causa di proteine che tendono a denaturarsi etc.), un batterio nel quale una mutazione casuale rendesse la DNA polimerasi funzionante anche alle nuove temperature prenderebbe il sopravvento. Vediamo qual' il fenomeno chimico alla base degli errori: la tautomeria cheto-enolica. Ognuna delle basi del DNA (cos come molte altre molecole) pu esistere in diverse forme, dette tautomeri, che cambiano per la disposizione degli elettroni. Ognuna delle basi ha un tautomero principale, nella cui forma si trova per la maggior parte del tempo, e diversi tautomeri minori, che nel tempo esistono raramente e per pochissimo tempo. Il tautomero principale della timina, per esempio, corrisponde alla timina come siamo abituati a vederla, ed quello che si lega alla adenina. Tuttavia questa base azotata pu esistere anche in forma di tautomero enolico, che si forma quando si instaura un doppio legame temporaneo tra la N e la C dell'anello pirimidinico, con uno spostamento di un elettrone a formare un gruppo -OH. La timina esiste in forma di tautomero enolico per pochissimo tempo, ma se, casualmente, la tautomeria si verifica proprio nel momento in cui sta arrivando la DNA polimerasi, pu presentarsi l'occasione per un errore. L'ossigeno del gruppo carbonilico, che normalmente un accettore di legami a idrogeno, nella forma enolica un -OH, che un donatore di legami a idrogeno. Si presenta quindi la possibilit per la timina in conformazione enolica di legare la guanina con tre legami ad idrogeno.

Quindi: quando la DNA polimerasi arriva a livello della timina, normalmente questa sotto forma di tautomero chetonico e lega una adenina; se per la timina in conformazione enolica, viene legata una guanina. Questo non un vero e proprio errore della DNA polimerasi, quindi. Pochi istanti dopo, La DNA polimerasi prosegue, ma la timina ha assunto nuovamente la sua conformazione chetonica standard. A questo punto, abbiamo una timina con una guanina, il che provoca la distorsione dell'elica che induce la DNA polimerasi a fermarsi. La stragrande maggioranza delle volte, un errore come questo viene corretto dalla DNA polimerasi improbabile che, tornando indietro, la timina sia nuovamente in conformazione enolica. Lo stesso avviene anche per l'adenina, che per ha una tautomeria amino-imminica. L'adenina ha un gruppo aminico -NH2 in posizione 6 dell'anello esaatomico; si pu avere il passaggio di un elettrone in modo tale che si ha la formazione di un doppio legame con l'azoto, che diventa imminico. Come tautomero imminico, l'adenina stabilizza una citosina. Si pu avere quindi un accoppiamento adenina-citosina che rappresenta un errore, il quale per il pi delle volte corretto poich l'adenina ritorna quasi subito nella sua conformazione aminica. I tautomeri sono presenti nelle forme minori sono per tempi limitatissimi, e questo consente agli errori di venire corretti la maggior parte delle volte, perch la doppia elica distorta viene sentita dalla DNA polimerasi. Tuttavia, potremmo chiederci come fa la DNA polimerasi a distinguere, tra le due basi sbagliate, quale la base da cancellare? In realt la risposta semplice, perch la DNA polimerasi in grado di distinguere tra filamento stampo e filamento neosintetizzato. E se il meccanismo di correzione della DNA polimerasi fallisce? A questo punto, abbiamo una situazione in cui la sintesi finita l'errore non stato corretto. Supponiamo di avere una adenina appaiata ad una citosina. Questo accaduto perch l'adenina era diventata tautomerica stabilizzando una citosina, e il sistema di proof reading della DNA polimerasi ha fallito. Se questo errore non venisse separato, alla successiva duplicazione, in una delle due eliche figlie verrebbe fissata una mutazione. Abbiamo visto per che c' una seconda possibilit di correggere l'errore. Il problema per un altro. Come si pu stabilire, a duplicazione avvenuta, qual il nucleotide corretto e quale quello sbagliato? Nel caso precedente, la DNA polimerasi poteva distinguere il filamento in corso di sintesi e quello stampo, ma in questo caso come si pu fare? Nelle cellule sia eucariotiche che procariotiche c' un sistema di marcatura del DNA in modo che il sistema di riparazione possa identificare con certezza qual' stato dei due il filamento stampo. Questo possibile perch il DNA viene metilato in maniera asimmetrica. C' una metilasi detta DAM (Deossi Adenosin Metilasi) che metila le adenine che compaiono all'interno della sequenza GATC. Questa sequenza, in media, presente ogni 100-200 basi; quindi ogni 100-200 basi c' una adenina metilata. Nel momento immediatamente successivo alla replicazione del DNA, solo il filamento stampo metilato, mentre il filamento di nuova sintesi no. Con il tempo, anche nuovo filamento verr metilato, ma c' una finestra temporale tra la duplicazione del DNA e la metilazione del filamento nuovo nella quale la doppia elica metilata asimmetricamente. Grazie a questa asimmetria, non ci sono dubbi su quale filamento correggere. L'assenza di metilazione rende il DNA di nuova sintesi riconoscibile, e i meccanismi di riparazione sfruttano questo fenomeno per cercare gli errori di accoppiamento e sostituire la base che sta sul filamento nuovo, dando per scontato che la copia giusta sul filamento vecchio. Il meccanismo di riparazione pi conosciuto in E. coli chiamato Mut H, Mut S, Mut L, dal nome delle tre proteine che partecipano al processo. Mut S una proteina che scorre sul DNA nei momenti immediatamente successivi alla replicazione alla ricerca di zone in cui l'accoppiamento dei due filamenti non corretto. Mut H una endonucleasi, che riconosce e si lega alla sequenza metilata sul filamento vecchio e introduce un nick sull'altro filamento. A livello del nick agisce una esonucleasi che cancella la porzione di filamento tra il nick e il punto dove ha aderito Mut S. Si forma a questo punto un gap che ricorda in tutto e per tutto il gap che si forma dopo l'eliminazione dei primer a RNA. La DNA polimerasi I quindi l'enzima che colma il gap risintetizzando il frammento mancante. Una DNA ligasi poi ultima il lavoro. Questo processo deve avvenire subito dopo la replicazione del DNA: se avviene troppo tardi, anche il filamento nuovo verr metilato e reso indistinguibile dal filamento vecchio.

Questo uno dei meccanismi che portano ad una fedelt di copia intorno a 10-9.

Biochimica - Lezione del 5-05-09 [Prof. Raugei]


Abbiamo visto che il primo meccanismo di correzione degli errori nella replicazione ad opera della polimerasi stessa; se questo meccanismo fallisce, c' una seconda chanche, molto ben conosciuta nei batteri (un meccanismo simile presente anche negli eucarioti), e che il sistema visto ieri, composto dalle tre proteine Mut S, Mut H, Mut L. Rivediamo meglio le caratteristiche principali di questo sistema. Per correggere un miss match (cio un accoppiamento di basi sbagliato che deriva da un errore nella duplicazione) necessario un sistema per distinguere il filamento corretto da quello sbagliato: questa distinzione operata da una metilazione asimmetrica del DNA. Subito prima della duplicazione del DNA possiamo supporre che entrambi i filamenti della doppia elica siano metilati a livello di particolari sequenze; subito dopo la replicazione, il filamento nuovo non ancora metilato. Mut S una sorta di scanner del DNA, su cui scorre alla ricerca di appaiamenti non corretti, aderendo alla doppia elica laddove ne identifichi uno. Mut H in grado sia di riconoscere il filamento metilato, sia, essendo una endonucleasi, di operare un nick a livello dell'altro filamento. Il nick diventa un punto di attacco per una esonucleasi che digerisce il filamento nuovo fino al punto in cui si adesa Mut S. Mut H e Mut S sono quindi gli estremi del campo d'azione su cui lavora l'esonucleasi che digerisce una porzione di filamento nuovo fino a digerire anche il punto contenente l'errore. Mut L crea una sorta di ansa nel DNA che limita l'azione della DNAasi. Si crea quindi una zona a singolo filamento, una situazione che nel DNA , solitamente, temporanea. Questa situazione viene facilmente riparata dalla DNA polimerasi I, enzima presente in molte copie nella cellula, quindi pronto a riempire il gap. Infine, una ligasi salda il frammento neosintetizzato con il resto del filamento nuovo corretto. Con il tempo, anche questo verr metilato. Questo sistema di correzione quindi efficace solo nella finestra temporale che si trova tra la duplicazione e la metilazione, perch solo in questo lasso di tempo si pu distinguere il filamento stampo da quello di nuova sintesi. Il DNA una molecola che ha una sua fragilit, nel senso che pu subire una serie di modificazioni, soprattutto a livello delle basi, dovute, nella maggior parte dei casi, ad agenti chimici. Si tratta di modificazioni non enzimatiche, spesso ossidative, che creano basi modificate. Queste basi modificate possono portare a mutazioni. Modificazioni di questo genere hanno modi diversi di essere riparate, ma possono essere riparate. Sono eventi che possono capitare in qualunque momento, indipendentemente dalla fase del ciclo cellulare (possono interessare anche cellule che passano la loro vita in fase G0, senza mai duplicare il loro DNA, ovvero senza mai entrare in fase S). In queste cellule, i meccanismi di riparazione che abbiamo visto finora non sono pi attivi, dato che il DNA non viene duplicato; tuttavia, il DNA pu essere sempre modificato, da raggi UV, agenti ossidanti, sostanze chimiche, etc. Anche nella cellula il cui DNA non si duplica esistono per questo motivo sistemi che monitorano il DNA e quando possibile lo riparano. Questo processo detto safeguarding del DNA. Dato che il sistema molto complesso, faremo solo alcuni cenni. Affronteremo per primo un caso molto particolare. Tutti questi effetti che vedremo provengono in gran parte dall'ambiente; nel mondo moderno ci sono molte sostanze aggressive per il DNA rispetto al passato; tuttavia, anche prima dell'industrializzazione o della comparsa dell'uomo il DNA veniva modificato: esistono molti ossidanti naturali, tossine, radiazioni, etc. forse meno concentrate rispetto a oggi, per sono sempre esistiti agenti con la potenzialit di danneggiare il DNA e con l'evoluzione si sono anche sviluppati sistemi di riparazione. Un caso particolare di modificazione pu avvenire normalmente in ogni momento nel nostro DNA. Una citosina pu subire una deaminazione ossidativa. Questo accade perch all'interno della cellula si producono normalmente dei ROS, potenti ossidanti derivati dall'ossigeno (es. H2O2), soprattutto a livello dei mitocondri. Le cellule hanno dei sistemi enzimatici per neutralizzare queste molecole molto reattive che si generano per

il semplice fatto che le nostre cellule utilizzano ossigeno nella respirazione cellulare: superossido dismutasi e altri enzimi che quasi sempre eliminano queste sostanze tossiche. Tuttavia, alcune di queste molecole sfuggono ai sistemi di difesa, e possono andare a danneggiare una serie molto ampia di molecole (RNA, proteine, che per essendo usa e getta non creano problemi) tra cui il DNA. Quindi, poich normale che alcuni ROS diffondano all'interno del citoplasma, non insolito che la citosina subisca deaminazione ossidativa, per circostanze del tutto naturali. La citosina dopo aver subito questa reazione non enzimatica diventa un uracile. Come mai questo pu portare ad una mutazione? Se questa modificazione non viene corretta, alla successiva duplicazione un filamento stampo avr una G, e si accoppier con una C generando una doppia elica non mutata, ma il filamento stampo con l'uracile si accoppier con una A, perch l'uracile un sinonimo della timina, che dunque stabilizza l'adenina. Questo introdurrebbe una mutazione. L'uracile, essendo molto simile alla timina, non destabilizza la doppia elica, quindi all'interno del DNA non crea distorsioni della molecola. Tuttavia, l'uracile si trova nell'RNA e non nel DNA: alla base del meccanismo di riparazione c' proprio il fatto che l'uracile non deve essere presente nella seconda molecola, dunque non ci sono dubbi su quale sia la base da correggere. Questo un principio che sta alla base dei sistemi di riparazione che vedremo dopo: esistono meccanismi per riconoscere tutta una serie di basi alterate (in questo caso l'uracile) del DNA, e per il fatto stesso di essere modificate vengono corrette. Anche l'adenina tende, meno della citosina per, a deaminare, diventando una inosina. Anche in questo caso viene prontamente riconosciuta per il fatto di essere una base anomala rispetto alle quattro classiche. Il meccanismo di riparazione prevede l'escissione della base: una N-glicosidasi il legame N-glicosidico che lega la base allo scheletro zucchero fosfato del DNA. Notiamo che l'assenza della base azotata non compromette la stabilit del doppio filamento: in quel punto non si formano legami a idrogeno, ma le molecole circostanti li formano, e questo sufficiente a stabilizzare la doppia elica. Quindi, il principio che sta alla base di tutti i meccanismi che vedremo sempre questo: prima un sistema per riconoscere le basi anomale, seguito dall'escissione della base stessa. Il risultato un sito abasico o sito aP (apirimidinico o apurinico): i meccanismi successivi riconoscono la carenza di una base che sar ripristinata a partire dalla complementariet con la base rimasta sull'altro filamento. Il processo detto nick translation. Nel caso della nostra citosina deaminata ad uracile, per prima cosa una N-glicosidasi specifica per l'uracile taglia il legame N-glicosidico e forma il sito abasico. Il sito abasico a questo punto viene riconosciuto da una specifica DNAasi, una endonucleasi che opera un nick sul filamento da riparare, nelle vicinanze del sito. Il nick rende possibile l'azione di una esonucleasi 5'-->3' che digerisce il singolo filamento che conteneva il sito abasico. Infine, la DNA polimerasi I riempie il gap a partire da un 3' OH libero e utilizzando come stampo il filamento singolo rimasto; una DNA ligasi salder il tutto. Il processo si chiama nick translation perch viene formato un primo nick; dopo l'azione della DNA polimerasi I, ma prima dell'intervento della ligasi, sembra che questo nick si sia trasferito qualche base pi in l. Naturalmente il nick non si trasferisce realmente, ma il nome rimasto questo. In definitiva, il meccanismo non cos diverso dal sistema delle Mut che abbiamo visto la volta scorsa: in entrambi i casi, abbiamo prima l'intervento di una endonucleasi che forma un nick, poi una esonucleasi che cancella il frammento di singolo filamento contenente l'errore, e infine la DNA Polimerasi I e la ligasi che restituiscono integrit della doppia elica. Si crede che una delle ragioni che hanno evolutivamente favorito l'affermarsi della timina nella struttura del DNA (ricordiamo che le teorie attuali prevedono un iniziale mondo a RNA: il DNA si sarebbe evoluto successivamente) sia la possibilit di questa riparazione. Se la struttura del DNA prevedesse l'uracile, in caso di deaminazione della citosina sarebbe problematico capire quale filamento riparare. Al contrario, la presenza della timina rende possibile il riconoscimento delle deaminazioni della citosina. Una quota notevole di deaminazioni ossidative di citosina e adenina sono naturali; vediamo adesso qualche caso di modificazioni indotte da sostanze chimiche. Le sostanze mutagene sono un numero enorme. In generale, qualunque agente ossidante ha una potenziale azione mutagena. La attuale popolarit dei prodotti contenenti antiossidanti dovuta anche al fatto che possibile che questi composti tamponino lo stress ossidativo a cui sottoposto il DNA. Un esempio di sostanza ossidante mutagena l'acido nitroso, che

favorisce la deaminazione della citosina a uracile. Il sistema di riparazione presente nelle cellule basato su una frequenza di mutazione naturale; se questa frequenza aumenta, per esempio in seguito ad esposizione a sostanze chimiche ossidanti, il sistema entra in crisi e diventa probabile la fissazione di molte mutazione. Agenti chimici ossidanti aumentano anche la quota di modificazioni a carico dell'adenina, che la trasformano in ipoxantina. L'idrossilamina un esempio delle numerose sostanze che possono aggiungere gruppi chimici alle basi. La modificazione di una base (es. l'idrossilaminazione della citosina) molto spesso porta ad una situazione in cui la base modificata stabilizza una base diversa da quella consueta. Nel caso della citosina idrossiamilata, questa non stabilizza pi la guanina, ma una adenina. Con queste modificazioni, in altre parole, le basi non smettono di funzionare, ma stabilizzano basi diverse, il che pu portare a mutazioni. La nitrosoguanidina e il solfato sono altre sostanze che fanno s che le basi si travestano da altre basi dal punto di vista dell'appaiamento. Questo potenzialmente sufficiente per introdurre una mutazione. Altre sostanze sono gli analoghi di base, come il bromo-deossi-uracile, un analogo di base che viene riconosciuto come se fosse una timina, e come tale pu venire inserito nel DNA. Tuttavia, non stabilizza una adenina con i legami ad idrogeno, ma una guanina. Quindi: il bromouracile pu venire inserito al posto di una timina, per stabilizza la guanina e come tale pu indurre mutazioni. Un caso a parte sono i raggi UV, che hanno un'azione benefica, ma in grosse dosi sono dannosi. Nel mondo primordiale la vita non si potuta sviluppare sulla terraferma per molto tempo a causa della grande quantit di raggi UV, incompatibile con la vita. Solo quando stata prodotta una quantit di ossigeno sufficiente, che in parte diventato ozono, si potuta sviluppare la vita. L'ozono ancora oggi fa da schermo ai raggi UV tutti gli organismi sono in grado di difendersi da una quota ragionevole di raggi UV, che quindi, in basse dosi, non sono dannosi. Il danno principale provocato dai raggi UV la formazione di dimeri di timina. L'azione dei raggi UV pu portare alla formazione di legami tra due timine adiacenti. I dimeri di timina sono piuttosto pericolosi per il DNA perch possono portare a mutazioni estese. Ci sono due tipi di riparazione. Il primo tipo attivato dalla luce e consiste di una DNA liasi che rompe i legami che tengono insieme il dimero, permettendo di ritornare alla situazione iniziale con due timine adiacenti. A testimonianza di quanto sia importante per la nostra sopravvivenza riparare i dimeri di timina, esiste un altro meccanismo, comune a tutti gli organismi, che si conservato con poche modificazioni. Consta di un enzima detto escinucleasi, una esonucleasi che rimuove il frammento di DNA contenente il dimero. Si forma anche in questo caso un gap a singolo filamento che viene riparato come abbiamo gi visto (DNA polimerasi I e poi ligasi). Nei batteri l'enzima si chiama UVR-ABC. Una delle pi grandi differenze tra eucarioti e procarioti che nei primi vengono eliminati 17 nucleotidi, nei secondi 12; per il resto, il meccanismo pressoch identico. Si tratta quindi di un meccanismo di difesa primordiale altamente conservato. Questo secondo sistema di riparazione si effettua al buio. Una vastissima serie di sostanze non formano legami covalenti con il DNA, ma si intercalano nella sua struttura. Si tratta di sostanze con strutture molecolari cicliche o policicliche planari e relativamente idrofobiche, che ricordano le basi, e per questo si intercalano facilmente tra le basi. Spesso queste sostanze distorcono la doppia elica; quando non corrette, portano a mutazioni di delezione o inserimento di base, entrambe mutazioni molto gravi. Il bromuro di etidio un esempio di queste molecole: planare e policiclico, e tende a inserirsi nel DNA. Ne parliamo perch frequentemente utilizzata in laboratorio per visualizzare il DNA sui gel di agarosio. L'etidio bromuro fluorescente, e legandosi al DNA permette di evidenziarlo. Il bromuro di etidio molto utile, ma pericoloso da maneggiare. Le radiazioni ionizzanti in genere sono potenti mutageni, in grado anche di spezzare in due la doppia elica. Tutte le sostanze di cui abbiamo parlato sono collettivamente dette mutageni, in quanto modificano il DNA e pertanto possono potenzialmente indurre mutazioni. Le mutazioni normalmente sono dannose: o per la nostra

progenie (se le modificazioni avvengono a livello della linea germinale) o per noi stessi, sotto forma di tumori. I tumori derivano, in larga parte, da mutazioni di protooncogeni (normali geni che del nostro organismo) che diventano oncogeni, favorendo la proliferazione cellulare. Nei casi pi gravi, la capacit di proliferare si associa anche alla capacit di trasferirsi in distretti diversi rispetto alla sede iniziale. Le mutazioni possono avvenire per cause naturali con una certa probabilit, ma se veniamo in contatto con agenti mutageni, in genere la aumentiamo di molto. In un mondo in cui la chimica organica permette ogni giorno la sintesi di molecole nuove (basti pensare ai farmaci, ma non solo), dobbiamo chiederci quale azione abbiano, e se queste possano avere azione mutagena. Un test preliminare si potrebbe effettuare purificando il DNA e mettendovi in contatto la molecola in vitro: si pu vedere se la molecola in queste condizioni interagisce con il DNA oppure no. Tuttavia, questo non un test soddisfacente, perch il DNA si trova all'interno delle cellule di organismi viventi, ed entrano in gioco molti fattori (es. entra in gioco il metabolismo d'organo): alcune sostanze non vengono assunte, per esempio. Sono stati messi a punto numerosi test che consentono di osservare la mutagenicit su organismi, a cominciare da quelli meno complessi procedendo verso quelli pi complessi (batteri, poi lieviti, cavie, etc.). Ci sono dei test specifici non tanto di tossicit quanto di mutagenicit. Oggi vediamo un test un po' datato, ma facilmente comprensibile. Gli altri test sono essenzialmente estensioni di questo. Il test di Ames risale agli anni '50, ed usato per vedere se una sostanza capace di indurre mutazioni. Una sostanza positiva al test di Ames potenzialmente molto pericolosa e necessita di particolari precauzioni finch non se ne chiariscono gli effetti. Il test prevede l'impiego di ceppi di Salmonella itinurium, un batterio molto facile da coltivare. In genere si sfrutta un ceppo mutante istidina (leggere: istidina meno), ovvero incapaci di sintetizzare l'aminoacido istidina. I normali batteri sono in grado di sintetizzare tutti gli aminoacidi, e quindi sono anche istidina + (leggere: istidina pi); tuttavia, per mutazioni, possono esserci dei ceppi batterici incapaci di sintetizzare un aminoacido come appunto l'istidina: potrebbero essere privi di un gene che codifica per un enzima chiave nella sintesi di questo aminoacido. Un batterio istidina in grado di crescere solo se viene aggiunta istidina nel terreno di coltura. Togliendo l'istidina, non si ha crescita batterica. Quindi, abbiamo una piastra di agarosio a cui stata aggiunta istidina, e numerose colonie batteriche in crescita. Si prende a questo punto un piccolo dischetto di carta assorbente, imbibito della sostanza che si vuole testare. Appoggiando il dischetto di carta sulla piastra, la sostanza si distribuir nell'agarosio con un gradiente di concentrazione inversamente proporzionale alla distanza dal tampone e quindi dal centro della piastra. Si pu utilizzare la sostanza a bassa o ad alta concentrazione, perch la sostanza pu essere debolmente mutageno o fortemente mutageno. Poi si trasferisce un'impronta della piastra batterica su un terreno privo di istidina. Se si formano colonie, significa che la sostanza ha provocato una mutazione. Per esempio, se mettiamo la sostanza a bassa concentrazione, e notiamo che crescono diverse colonie, significa che abbiamo a che fare con una sostanza fortemente mutagena. Evidentemente una retromutazione ha reso il ceppo nuovamente istidina +. Su questa base, possiamo affermare che, dato che avevamo utilizzato la sostanza a bassa concentrazione, questa sar molto mutagena, tanto che se si utilizzasse una concentrazione maggiore di mutageno, avremmo cos tante mutazioni da essere letali per i batteri, che non crescerebbero. Ovviamente si allestisce anche un ceppo di controllo, senza utilizzo di tamponi. Questo un test molto semplice che serve per testare la mutagenicit di una sostanza, che pu essere variabile. La nitrosoguanidina per esempio una sostanza gravemente mutagena, che anche a concentrazioni bassissime in grado di indurre numerose mutazioni. Altre sostanze per produrre lo stesso effetto devono essere in concentrazioni molto pi alte. Naturalmente, questo test non risolutivo: pu indicare che i batteri sono sensibili alla sostanza, ma la cosa potrebbe non essere vera per noi, magari perch a causa del metabolismo d'organo non arriva alle cellule. Passiamo ad un altro argomento: la trascrizione. Iniziamo con una precisazione. In genere, quando si pensa alle attivit del DNA, si pensa a replicazione, trascrizione e traduzione come a dei processi che si susseguono uno dopo l'altro. Questo non del tutto vero. Trascrizione e traduzione sono intimamente legate, e in genere l'una segue l'altra. Nei procarioti questo vero la gran parte delle volte: quando c' trascrizione, quasi sempre

c' la traduzione del trascritto. Negli eucarioti invece questa non pi una regola: a causa della regolazione post trascrizionale, che molto elaborata, non sono infrequenti gli mRNA che non vengono mai tradotti. Diciamo, come principio generale, che la trascrizione non implica necessariamente la traduzione. La duplicazione invece un processo a s stante, perch legato alla proliferazione cellulare e una cellula pu essere metabolicamente attiva anche senza proliferare. Le cellule terminalmente differenziate fanno il loro lavoro rimanendo sempre in fase G0. Anche le cellule staminali, che sono cellule con alta capacit proliferativa, non proliferano continuamente, ma solo quando ce n' bisogno. In altre parole, la duplicazione del DNA un fenomeno spesso assente nelle cellule, oppure che si verifica solo in alcuni citotipi e in alcuni momenti fisiologici, in maniera estremamente regolata la proliferazione cellulare incontrollata una evenienza patologica al contrario di traduzione e trascrizione che invece avvengono continuamente in tutte le cellule (con poche eccezioni; es. globuli rossi). La DNA polimerasi I comunque sempre attiva, perch serve a riparare il DNA, mentre la III attiva solo in cellule che proliferano. La cellula terminalmente differenziato quindi hanno degli impedimenti cos forti alla proliferazione che non si riprodurranno mai pi. Addirittura, se prima si pensava che i tumori potessero derivare anche da cellule terminalmente differenziate, sta cominciando a prendere piede l'opinione che i tumori derivino solo da cellule staminali, dato che hanno meno impedimenti a proliferare. Esistono segnali di tipo ormonale e fattori di crescita che segnalano alla cellula di cominciare a proliferare. La proliferazione, e quindi la duplicazione del DNA, un evento o tutto o niente: alla cellula o viene segnalato di proliferare, e allora duplica tutto il DNA, o di non farlo, e allora non si duplica niente. L'evento duplicativo va avanti automaticamente. C' un comando iniziale, che riguarda tutto il DNA, e che viene portato a completamento. Per la trascrizione invece diverso, perch un evento circoscritto al singolo gene. La trascrizione non riguarda mai tutti i nostri 30,000 geni contemporaneamente piuttosto ci sono cellule dove alcuni geni non verranno mai trascritti. Ci sono geni detti architetto, che inducono la formazione dell'embrione, e che vengono espressi per poche ore durante lo sviluppo e poi mai pi. Altri geni sono tessuto-specifici e vengono espressi solo da certi citotipi. Quindi, la trascrizione un processo regolato a livello del singolo gene. Non entreremo nel dettaglio circa questo processo, che gi stato affrontato durante il corso di biologia, ma descriveremo la RNA polimerasi. Questo un enzima che aderisce al DNA e sintetizza un filamento di RNA utilizzando come stampo soltanto uno dei due filamenti - l'RNA una molecola a singolo filamento. La differenza fondamentale dal punto di vista enzimatico non nella formazione del legame fosfodiesterico (che pressoch uguale), ma a livello dei substrati (abbiamo nucleosidi trifosfato in luogo di deossinucleosidi trifosfato; ribouracile trifosfato in luogo della deossiribotimina trifosfato). Durante l'evoluzione non si sviluppato un sistema che privilegiasse la fedelt di copia come successo per il DNA; l'RNA polimerasi fa molti pi errori della DNA polimerasi: la frequenza 10 -4. Quindi, i nostri RNA contengono, in media, 1 errore ogni 104 nucleotidi, ma questo sembra essere assolutamente compatibile con la vita. Attenzione, perch non si tratta di mutazioni (si parla di mutazioni solo quando sono ereditabili), ma di errori. Ci sono alcuni virus che hanno come loro patrimonio genetico l'RNA: in questo caso l'RNA polimerasi copia l'RNA duplicando quello che per il virus il genoma. Dato che l'RNA polimerasi piuttosto imprecisa, questi virus saranno soggetti a frequenti mutazioni: si creano di continuo nuovi genomi virali. la ragione per cui c' un vaccino per l'influenza ogni anno: da un anno all'altro, il virus cambia molto; ed sempre per la stessa ragione che possibile che malattie degli animali, per mutazione, possano infettare l'uomo, e per ulteriori mutazioni, propagarsi da uomo a uomo. Nei procarioti c' un solo tipo di RNA polimerasi che cura la sintesi di tutti gli RNA, mentre negli eucarioti ci sono diverse RNA polimerasi la polimerasi I si trova nel nucleolo dove avviene la sintesi degli rRNA; la polimerasi II coinvolta nella sintesi degli mRNA; la polimerasi III cura la sintesi dei tRNA, dell'rRNA 5S, dei snRNA e i microRNA, recentemente scoperti. In ogni cellula c' una certa quota dei vari RNA, di cui gli rRNA sono tendenzialmente i pi abbondanti, potendo rappresentare il 50 o addirittura il 70% degli RNA totali; il 10-15 % sono tRNA; gli mRNA sono quelli che variano di pi, a seconda di quanto attiva la cellula. In un epatocita, cellula metabolicamente molto attiva, dal momento che sintetizza tutte le proteine del siero, presenta una elevata percentuale di mRNA in cellule meno coinvolte nell'espressione proteica, o che sintetizzano poche proteine, la quota di mRNA pu essere relativamente bassa.

L'RNA polimerasi procariotica ha varie subunit: una subunit importante che la lega al DNA; una subunit pi prettamente catalitica; una subunit che partecipa alla catalisi; una subunit che riconosce il promotore (elemento del DNA di cui parleremo pi tardi). Diciamo che, mentre le varie subunit sono deputate al corretto funzionamento della DNA polimerasi (subunit di lavoro), la subunit ha il compito di riconoscere dove iniziare la trascrizione. Ricordiamo che, a differenza della replicazione, che interessa tutto il DNA (da telomero a telomero nel caso di cromosomi eucariotici, dall'origine di replicazione fino a fare tutto il giro nei procarioti), la trascrizione riguarda i singoli geni. Nel DNA, la quota di genoma effettivamente trascritto il 6-7%. Tra un gene e un altro ci sono grossi spazi: importante che la RNA polimerasi sappia qual la sequenza che deve trascrivere. Per questo motivo, ogni gene ha un promotore all'inizio del gene e un terminatore alla fine. Nei procarioti, la subunit che riconosce il promotore; negli eucarioti, c' un'altra subunit molto simile che fa lo stesso. La trascrizione un lavoro molto segmentato, regolato gene per gene, a fronte della replicazione che un evento globale. Per l'inizio della trascrizione ci sono attivatori e repressori. Ci sono una serie di comandi che, prima di tutto, dicono alle RNA polimerasi, per quel particolare gene, se trascrivere o non trascrivere. L'inizio della trascrizione implica che la RNA polimerasi, che scorre sul DNA, riconosce il promotore; in quel punto si ha l'apertura della doppia elica, seguita dall'attivit di polimerasi che provoca l'elongazione. Alla fine del gene, vi la terminazione; vi sono una serie di segnali che provocano il distacco dell'RNA polimerasi dal DNA, che pu essere dipendente o indipendente da un aggregato proteico che vedremo dopo. L'RNA polimerasi totalmente processiva: l'enzima riconosce il promotore, e poi trascrive ininterrottamente fino al terminatore. Se per qualche motivo l'RNA polimerasi si stacca dal DNA prima di completare la sintesi, non subentra un altro enzima a completare il lavoro; l'RNA trascritto fino a quel punto viene degradato, ed necessario ricominciare da capo. Adesso vedremo, in sintesi, la struttura di un gene procariotico; dopo vedremo quella di un gene eucariotico. Il gene procariotico ci d degli ottimi esempi di regolazione. In genere abbiamo un promotore, che viene riconosciuto dalla DNA polimerasi; poco a valle del promotore, comincia la trascrizione. L'RNA viene sintetizzato in direzione 5'-->3', sulla base della complementariet del filamento stampo, che pu essere soltanto quello che procede in direzione 3'-->5' rispetto al verso di sintesi. Il filamento non trascritto detto filamento senso perch ha esattamente la stessa sequenza dell'RNA che viene trascritto. Il DNA trascritto invece ha, chiaramente, una sequenza complementare. Arrivato al terminatore l'enzima si distacca dal DNA. La lunghezza del trascritto dipende dalla distanza tra promotore e terminatore. interessante vedere la struttura del promotore procariotico. Da tutte le sequenze di tutti i promotori si pu elaborare una sequenza consenso: non si tratta di una sequenza particolare, ma di una sequenza media. Anche qui abbiamo una ricchezza di T ed A: si tratta di una zona di debolezza del doppio filamento. L'apertura della doppia elica infatti avviene proprio in questa posizione, che nei procarioti si chiama Pribnow box, mentre negli eucarioti si chiama TATA box. Sono due sequenze situate a -10 basi rispetto al punto di inizio della trascrizione, considerato il punto 0. A volte il promotore ha anche un altro elemento, detto elemento -35 perch si trova -35 basi rispetto al punto di inizio della trascrizione. La RNA polimerasi copre circa 70-80 basi della doppia elica. Via via che avviene l'elongazione del trascritto, la RNA polimerasi scorre, aprendo la doppia elica proprio nel punto in cui avviene la sintesi la zona che rimane aperta e che si appaia con l'mRNA in formazione di circa 12 nucleotidi. Via via che aggiunto un nucleotide nuovo al 3', vengono dissolti i legami a idrogeno dell'ultimo nucleotide ancora adeso al DNA, e la parte di RNA gi sintetizzato, che sporge dalla DNA polimerasi, aumenta di lunghezza. Ci possono essere, sullo stesso gene, molecole multiple di RNA polimerasi che stanno lavorando in sequenza, ciascuna con la propria bolla di trascrizione, trascrivendo pi mRNA per lo stesso gene. Ovviamente, gli enzimi che hanno iniziato la trascrizione per primi avranno mRNA pi lunghi rispetto agli enzimi che hanno iniziato a trascrivere pi tardi. L'inizio della trascrizione un evento che pu avvenire in maniera ravvicinata nel tempo. Sulla doppia elica del DNA, tra le peculiarit di ogni singolo gene quale dei due filamenti deve essere

trascritto. Noi abbiamo, nella doppia elica, due filamenti: la trascrizione non avviene sempre sullo stesso, ma dipende dai geni. Ci sono geni per i quali viene trascritto un filamento e geni per i quali viene trascritto l'altro. Il filamento trascritto per un gene sar sempre quello, dato che soltanto una sequenza nucleotidica codifica per la proteina; la sequenza del filamento complementare non ha senso dal punto di vista della trascrizione. Vediamo adesso la terminazione, un fenomeno che dipende dalla sequenza dell'RNA. Anche se noi chiamiamo l'elemento presente sul DNA terminatore - per parallelismo con la sequenza del promotore, che una sequenza del DNA ma non ha controparte sull'RNA in realt il vero terminatore l'RNA. Infatti, la sequenza del terminatore, quando viene trascritta, e proprio perch viene trascritta, induce una formazione di una superstruttura tridimensionale dell'RNA che porta alla terminazione. La sequenza fatta soprattutto di coppie G e C, legami forti (3 legami a idrogeno per ciascuna coppia), che forma una forcina robusta. Appena l'RNA viene trascritto, si forma la struttura, perch si tratta di una ripetizione inversa: nell'ambito della stessa molecola di RNA, abbiamo una sequenza seguita dalla sequenza complementare e antiparallela lo stesso principio guida il ripiegamento del tRNA. Si forma quindi uno stello particolarmente robusto seguito da una sequenza poliU. A livello del terminatore, la forcina che si forma disturba il legame tra la RNA polimerasi e il DNA. In pi, subito dopo vi una sequenza poliU, un punto debole del legame tra l'mRNA nascente e il DNA. Questo porta, di fatto, al distacco dell'RNA e della RNA polimerasi dal DNA. In alcuni geni, questo avviene con la collaborazione di un complesso proteico formato da 6 subunit, la proteina . Questa proteina, con consumo di ATP, scorre sul DNA e contribuisce ad una terminazione precisa. Alcuni geni terminano senza la compartecipazione della proteina, altri invece s, e la terminazione di questi ultimi un processo pi preciso. Questo un caso di collaborazione tra DNA e proteine.

Biochimica - Lezione del 6-05-09 [Prof. Raugei]


L'ultima volta ci eravamo fermati alla terminazione della trascrizione, che avviene grazie al formarsi di una particolare struttura secondaria a livello dell'RNA. Mentre il DNA una molecola rappresentabile come una doppia elica complessivamente cilindrica (naturalmente, potr poi ulteriormente ripiegarsi o deformarsi, ma senza mai alterare la sua struttura filamentosa), non possiamo pensare l'RNA in soluzione come una struttura filamentosa distesa. Il singolo filamento di RNA non mai disteso, perch le varie parti della catena trovano facilmente degli schemi di complementariet intramolecolari e formano anse e steli. Il tRNA un ottimo esempio di questo fenomeno. Questo fenomeno in qualche modo analogo al folding delle proteine, le cui catene polipeptidiche si ripiegano su s stesse sfruttando legami di tipo debole di varia natura (idrogeno e Van der Waals), anche se le strutture delle proteine sono pi complesse questo essenzialmente perch le interazioni che possono instaurare le catene possono a loro volta essere molto complesse. Sfruttando i soli legami a idrogeno, anche una molecola di rRNA certamente ha una struttura secondaria abbastanza complessa. Le strutture secondarie dell'RNA si formano molto spesso per la presenza delle cosiddette ripetizioni inverse: due sequenze nella stessa molecola risultano complementari ed antiparallele. Una struttura del genere inevitabilmente forma degli accoppiamenti. Il trascritto corrispondente al terminatore inevitabilmente si ripiega in modo da formare la sovrastruttura di cui parlavamo ieri. Questa forcina disturba in maniera rilevante l'interazione tra la RNA polimerasi e il doppio filamento, per cui la struttura responsabile della trascrizione si smantella, aiutata anche dal fatto che subito a valle del terminatore c' una sequenza poliU, debole nel suo legame con il filamento di DNA. Queste strutture si trovano abbastanza spesso nel DNA, e fanno sospettare che si possa formare una struttura simile quando vengono trascritte. Il meccanismo della trascrizione che abbiamo visto relativamente simile tra procarioti ed eucarioti, quantomeno per quello che ci interessa. Chiaramente se si dovesse andare a studiare il processo nel dettaglio

troveremmo differenze enormi, ma per gli scopi del corso, possiamo considerare i processi simili. I processi trascrizionali (ricordando che quando si parla di trascrizione, si parla di trascrizione del singolo gene) sono molto differenti invece per quanto riguarda la regolazione. Sia nei batteri che negli eucarioti il segnale che induce la trascrizione di un gene diverso da gene a gene: ogni gene regolato come un elemento a s. Nei batteri questo fenomeno relativamente semplice, che si complica negli eucarioti e ancor di pi negli eucarioti superiori. Un batterio in fondo un organismo relativamente semplice rispetto alla complessit degli organismi pluricellulari: la regolazione che richiede un organismo unicellulare il cui unico scopo riprodursi semplice. Certi geni vengono espressi se presente un certo metabolita, etc. In un eucariota, in specie gli eucarioti superiori, c' bisogno di una regolazione pi complessa: basti pensare al nostro organismo, fatto di tanti tessuti diversi. Un tessuto diverso da un altro non perch il genoma diverso il patrimonio genetico lo stesso in tutte le cellule dello stesso organismo, tranne i gameti ci che diverso quale parte dell'informazione viene utilizzata. Vengono attivati solo sottoinsiemi di geni, specifici per ogni tessuto. A questo, si sovrappongono altre regolazioni che portano ad attivazione di altri geni, in dipendenza di una ampia gamma di fattori: se una cellula sana o meno, se sotto certi tipi di stress, etc. Infine, vi la presenza della regolazione ormonale, che spesso ha effetto anche a livello genico, inibendo o inducendo la trascrizione di certi geni. In un batterio, organismo unicellulare, le cose sono relativamente pi semplici. Ormai circa 50 anni fa, Jacob e Monod vinsero un premio Nobel perch riuscirono per primi a capire il meccanismo di regolazione di un gene. Il classico esempio che si fa parlando di geni batterici quello dell'operone lattosio (operone Lac) operone sinonimo di gene. Nei batteri, in certi casi un gene porta alla traduzione di pi polipeptidi. Negli eucarioti invece questo in genere non vero: possiamo grossolanamente affermare che negli eucarioti vale la relazione un gene una proteina. Nei batteri invece la relazione spesso un gene pi polipeptidi. Questo sistema molto semplice ed economico. Se abbiamo varie proteine coinvolte nello stesso processo (nel caso dell'operone Lac, 3 enzimi coinvolti nell'utilizzazione di una fonte di carbonio alternativa), e lo stesso trascritto porta alla traduzione di tutte le proteine che servono, abbiamo un sistema che garantisce che tutte le proteine che servono vengono prodotte nella stessa quantit. I batteri, quando possono, preferiscono utilizzare il glucosio come fonte di carbonio, dato che il metabolita pi diretto; ma hanno un ampia gamma di possibilit per utilizzare altri zuccheri, come il lattosio. Pu capitare che nell'ambiente del batterio vi sia questo disaccaride, ma molto spesso non c'. Jacob e Monod si osservarono che il gene per l'utilizzazione del lattosio come fonte di carbonio viene trascritto se presente lattosio nell'ambiente del batterio; se invece non c', non viene trascritto. Dato che il metabolismo dei batteri improntato alla crescita pi rapida possibile, questi organismi cercano di fare economia: se c' un gene che non serve, questo non viene trascritto. Abbiamo un meccanismo estremamente efficiente nella sua semplicit, che prevede la presenza di un repressore. La struttura dell'operone lattosio questa: promotore-lac z-lac e-lac a-terminatore Il gene dell'operone Lac prevede naturalmente un promotore, che viene riconosciuta dal fattore e poi dall'RNA polimerasi; il legame porterebbe alla trascrizione. In questo caso per esiste un'altra proteina, prodotta da un suo gene, presente nel genoma batterico, e che ha la capacit di legare una zona a valle del promotore, detta operatore. In condizioni normali (in cui il lattosio non presente nel terreno) il promotore bloccato dalla presenza del legame della proteina repressore con l'operatore. L'RNA polimerasi cos non pu iniziare la trascrizione, perch disturbata fisicamente dalla presenza della proteina. In condizioni di assenza di lattosio il gene non viene trascritto a causa del repressore. Questo repressore per sensibile al lattosio: in presenza dello zucchero, probabile che qualche molecola di lattosio entri nella cellula. Il lattosio un regolatore allosterico per il repressore: se avviene il legame tra le due molecole, il repressore va incontro ad una distorsione della struttura dimensionale, per cui perde affinit con il DNA e si stacca, rendendo possibile la trascrizione del gene. Il lattosio in definitiva induce la trascrizione del gene, che porta alla traduzione di 3 enzimi: galattosidasi: l'enzima che scinde il lattosio in glucosio e galattosio; permeasi: facilita l'ingresso del lattosio nella cellula acetilasi: partecipa all'azione della permeasi

Una volta che il gene trascritto, il batterio dispone di un set contenente tutti gli enzimi necessari a utilizzare il lattosio. La forza di un meccanismo di questo tipo che flessibile. Quando il lattosio, per qualche motivo, non pi presente nell'ambiente della cellula (per esempio, perch finito), il gene si spegne automaticamente. Diminuendo la concentrazione di lattosio questo si staccher dal repressore; questo riacquister la sua conformazione originaria e torner ad essere pienamente affine all'operatore, legandovisi e impedendo la trascrizione del gene. Questo solo uno dei meccanismi esistenti: ce ne sono altri in cui il repressore attivo quando legato al metabolita. il caso del triptofano, per esempio. Questo aminoacido deve essere prodotto in una certa quantit; quando abbondante rispetto alla esigenze della cellula, il triptofano, data la sua alta concentrazione, si lega al repressore, che si attiva e si lega all'operone; quando il triptofano diminuisce di concentrazione, si stacca dal repressore, che perde affinit, e il gene contenente il set di enzimi per la sintesi del triptofano viene riattivato. O attivamente o passivamente ci sono varii geni che funzionano tramite l'attivit di un repressore che pu essere o attivo o inattivo a seconda che sia legato a un metabolita o un prodotto. Tipicamente un metabolita attiva, il prodotto invece inattiva il feedback negativo funziona secondo lo stesso principio. Il prodotto di una via biosintetica blocca con effetto allosterico o direttamente un enzima a monte, oppure il gene che codifica per un enzima. Un sistema del genere pu funzionare efficacemente solo perch i prodotti di cui viene inibita la sintesi (RNA e proteine) sono molecole ad alto turnover. Se l'RNA si mantenesse nella cellula per giorni e le proteine per settimane, anche spegnendo il gene la presenza di enzimi perdurerebbe. Pensiamo all'esempio del triptofano: se nell'ambiente rimanessero mRNA e relative proteine, la sintesi potrebbe andare avanti per giorni o settimane anche a gene spento- invece nei batteri le proteine hanno ore di vita, gli RNA minuti. Se si inibisce la trascrizione, l'effetto si verifica dopo poco. Il fatto che i prodotti siano transienti rende efficace questa regolazione. Le ricerche comunque hanno evidenziato che le cose in realt sono pi complesse: ci sono molecole che sono dei segnali per il metabolismo (secondi messaggeri), dei messaggi chimici che all'interno della cellula portano dei comandi. Uno di questi l'AMP ciclico, cAMP. Deriva dall'ATP per ciclizzazione a livello del fosfato tra il 5' e il 3', ad opera dell'enzima adenilato ciclasi; una molecola di per s inutile, ma la cellula la produce perch un messaggio chimico all'interno della cellula. Nei batteri e, in una certa misura, anche nelle cellule eucariotiche - un segnale di fame o di saziet. Se c' disponibilit di glucosio ovvero, la cellula in un ambiente in cui la fonte di carbonio preferita presente in abbondanza il batterio lo esprime con bassi livelli di cAMP. Se il batterio comincia ad essere in situazioni di sofferenza, essendoci poco glucosio, il cAMP aumenta. La carenza di glucosio, con varii meccanismi che incidono sulla adenilato ciclasi incrementando la conversione di ATP, innesca un aumento dei livelli di cAMP. Questo detto segnale di carenza, un segnale di sofferenza dal punto di vista delle fonti di carbonio utilizzate. Bassi livelli di cAMP reprimono la trascrizione di geni per l'utilizzazione di altre fonti di carbknio (se c' glucosio, la cellula preferisce usare quello); una carenza di glucosio attiva la trascrizione di questi geni innalzando i livelli di cAMP. Infatti, l'operone in realt regolato in due maniere: in una maniera dal lattosio, come abbiamo visto prima; in una seconda maniera, dal glucosio, attraverso il cAMP. Esiste infatti, sul DNA, anche un'altra zona di regolazione: il sito CAP (catabolism activating protein), in cui si lega una proteina che si lega al DNA solo in presenza di cAMP (solo quando la cellula ha fame, quindi -il cAMP un regolatore allosterico della proteina) e che induce la trascrizione. Nel caso in cui ci sia molto glucosio (quindi bassi livelli di cAMP) e non ci sia lattosio, il sito CAP vuoto, presente il repressore e non abbiamo trascrizione. Nel caso in cui ci sia poco glucosio (quindi alti livelli di cAMP) e non ci sia lattosio, la proteina CAP si lega al sito CAP, e indurrebbe la trascrizione, ma la mancanza di lattosio fa s che sia presente il repressore, e non abbiamo trascrizione. Nel caso in cui ci sia molto glucosio (quindi bassi livelli di cAMP) e ci sia lattosio, il sito CAP vuoto, mentre il repressore assente. Tuttavia, manca l'induttore, e l'operone non viene trascritto in maniera significativa.

Nel caso in cui ci sia poco glucosio (alti livelli di cAMP) e ci sia lattosio, la proteina CAP presente e il repressore staccato. In questo caso, l'operone lac viene trascritto ai massimi livelli. Riassumendo, l'operone represso in tutti i casi in cui non c' lattosio; quando invece il lattosio presente nel terreno, l'operone funzionerebbe, ma nel caso in cui ci sia il glucosio, l'operone non funziona in maniera apprezzabile perch ha bisogno anche della proteina CAP, che si lega nelle adiacenze del gene quando il cAMP ad alti livelli (il cAMP un fattore allosterico). Quindi si legano due fenomeni: uno la repressione dell'operone lattosio (legata alla presenza/assenza di lattosio); l'altro l'induzione della trascrizione (legata alla presenza/assenza di glucosio). Per quanto riguarda gli eucarioti, il meccanismo in s della trascrizione molto simile a quello degli eucarioti. Le differenze sostanziali si riconoscono a livello dell'inizio e della fine di questo processo inoltre, si verifica successivamente un processo in pi, lo splicing. La prima diversit deriva direttamente dalle strutture molto diverse delle cellule procariotiche ed eucariotiche: la cellula procariotica non ha nucleo, quindi trascrizione e traduzione avvengono nello stesso compartimento anzi, nei batteri trascrizione e traduzione possono avvenire in concomitanza: un mRNA ancora in via di sintesi gi viene tradotto. Questo possibile perch i due processi sono collineari. Un mRNA in fase di trascrizione che fuoriesce dal complesso della RNA polimerasi espone il suo 5', mentre il 3' ancora all'interno dell'enzima. Il ribosoma per, responsabile della traduzione che procede in direzione 5'--> 3', ha il 5' terminale necessario a iniziare il processo, e pu gi scorrere sull'RNA; prima che il ribosoma possa scorrere fino in fondo alla molecola, la trascrizione sar finita. Poich entrambi i processi procedono nella stessa direzione, nei procarioti possono avvenire contemporaneamente. Addirittura, pu essere coinvolta una catena di ribosomi che sintetizzano in parallelo sullo stesso mRNA in trascrizione. Negli eucarioti questo non possibile, perch i due processi avvengono in due distretti diversi. La trascrizione avviene nel nucleo; poi ci deve essere un processo di esportazione dell'mRNA nel citoplasma, dove avviene la traduzione. Tra l'altro, il prodotto della trascrizione negli eucarioti non un mRNA, ma un trascritto primario, che dovr subire lo splicing e altri processi di maturazione, e solo allora diverr un mRNA, che viene esportato dal nucleo attraverso i pori nucleari. Di contro alla traduzione cotrascrizionale procariotica, negli eucarioti abbiamo quindi che i due processi avvengono in distretti diversi; inoltre il trascritto prima di essere tradotto subisce delle modificazione. Negli eucarioti le RNA polimerasi sono di tre tipi. Una prima classificazione delle RNA polimerasi fu stabilita sulla base della loro sensibilit alla -amanitina, tossina per noi letale, prodotta dal fungo Amanita falloide. Questo veleno blocca la trascrizione, ma in maniera diversa: estremamente attiva sulla RNA polimerasi II, che produce gli mRNA blocca quindi la trascrizione degli RNA che sostengono la sintesi proteica. meno attiva sulla III, non attiva sulla I. Le tre RNA polimerasi quindi si possono distinguere sulla base della loro sensibilit a questa tossina. Il primo effetto dell'intossicazione da -amanitina si ha sul fegato, dato che gli epatociti sono molto impegnati sulla sintesi proteica. Questa tossina non ha alcun effetto sui procarioti, mentre letale per gli eucarioti: una sorta di antibiotico al contrario. Gli antibiotici sono delle molecole che riescono a distinguere tra attori metabolici procariotici ed eucariotici, soprattutto a livello di trascrizione e traduzione. Per esempio, possono essere attivi sulla RNA polimerasi batterica ma non su quella eucariotica: il caso della rifamicina. Assumendo questa sostanza in presenza di una infezione batterica, dovrebbe sterminare la popolazione bloccando la trascrizione, a meno che i batteri non siano resistenti. Ci sono alcuni antibiotici che agiscono a livello trascrizionale, a alcuni che agiscono a livello traduzionale in particolare, essendo quest'ultimo processo molto complesso, sono state trovate moltissime molecole che inibiscono una variet di fattori di traduzione procariotici ma non eucariotici. Come funzionano queste molecole? La lifamicina si lega alla subunit della RNA polimerasi procariotica, bloccandola; non ha effetto sul nostro organismo perch la nostra RNA polimerasi non ha un sito di legame per questa molecola. Un'altra sostanza la actinomicina D, che attiva su tutte le RNA polimerasi: questo

perch non esplica la sua funzione sulle proteine, ma sul DNA, rendendo pi difficile l'apertura della doppia elica, complicando trascrizione e replicazione. Questa sostanza non un vero e proprio antibiotico perch attiva anche sugli eucarioti, dato che la molecola di DNA identica. Nel procariota, alcuni geni possono essere operoni, come abbiamo visto. Un operone un gene policistronico cistrone un sinonimo di gene; questo termine stato coniato negli anni '50, ed indicava una vecchia definizione di gene. Un mRNA policistronico indica un mRNA che pu portare alla produzione di pi proteine. Questo pu accadere perch sullo stesso mRNA si ha un codone di inizio (AUG), poi un codone di stop, seguito da un altro AUG e un altro codone di stop, etc. Ad ogni AUG si ha una nuova proteina. Un mRNA di questo tipo sostiene la sintesi di pi polipeptidi. Questo succede solo nei procarioti. Negli eucarioti abbiamo la presenza di un solo AUG e un singolo codone di stop nell''ambito dello stesso mRNA. Inoltre, nei procarioti ci che viene trascritto l'mRNA, che quindi una copia perfetta del DNA; negli eucarioti l'mRNA solo una parte del trascritto primario. Negli eucarioti continuiamo ad avere un promotore riconosciuto dalla RNA polimerasi, un sito di inizio della trascrizione, un filamento stampo (che quello 5'-->3' da destra verso sinistra, che viene copiato dalla RNA polimerasi in direzione 5'-->3' da sinistra verso destra); l'altro filamento il filamento senso, che non partecipa alla trascrizione. Da questo punto di vista, i due fenomeni sono molto simili. I geni sono abbastanza dispersi nel genoma eucariotico; nei procarioti sono piuttosto vicini uno all'altro, perch le zone intergeniche sono corte. Si definisce gene strutturale quella parte di DNA che viene trascritta. In pratica, quella regione compresa tra promotore e terminatore. Negli eucarioti il trascritto primario, che la copia esatta del gene strutturale, subisce una vistosa riduzione di taglia, con lo splicing, per dare l'mRNA, che poi dar proteine, che potranno subire modificazioni post traduzionali, etc. A livello dell'inizio della trascrizione negli eucarioti abbiamo degli eventi che ricordano ci che avviene nei procarioti; altre cose per sono diverse. Prima di tutto, abbiamo la TATA box. Il nome deriva dal fatto che la struttura di questa parte del promotore alla quale si lega la RNA polimerasi ricca in A e T, perch qui si deve aprire la bolla di trascrizione. Andando a fare una sequenza media del sito, troviamo numerose posizioni dove molto spesso abbiamo A o T. Questi due nucleotidi rappresentano una zona di debolezza del doppio filamento. La TATA box si trova a -25 posizioni rispetto al sito di inizio della trascrizione la Pribnow box pi vicina, si trova a -10. L'inizio della trascrizione eucariotica invece molto complesso: esistono fattori diversi che contribuiscono all'inizio della trascrizione. Uno in particolare, il fattore TF2B (Trascriptional Factor) simile alla subunit della RNA polimerasi procariotica, perch riconosce la TATA box. L'inizio della trascrizione vero e proprio costituito dal riconoscimento della TATA box dal fattore TF2B. La TATA box una sorta di bandierina che segna l'inizio di un gene. Per essere trascritto, il gene deve richiamare l'RNA polimerasi al promotore, e il primo passaggio il riconoscimento da parte di TF2B del promotore, tramite la TATA box. Dopo questo primo evento, sopraggiungono altri fattori, tra cui la parte catalitica della RNA polimerasi II vera e propria, per forma prima il cosiddetto complesso di pre-inizio, che un complesso detto chiuso in quanto il DNA ancora a doppio filamento. La formazione del complesso di pre-inizio una conditio sine qua non la trascrizione non pu avvenire, ma non implica che avverr necessariamente. Il complesso di preinizio pu formarsi a livello di un gene: questo significa che il gene pronto per essere trascritto, ma esiste una catena segnalatoria per impartire l'ordine di trascrivere il gene. Si pu pensare che molti geni siano in questa condizione, ovvero con il complesso di preinizio formato, ma senza essere trascritti perch non viene dato il segnale. Tutta questa collezione di fattori trascrizionali diversi si assembla a livello della TATA box. La RNA

polimerasi ha una coda che, nel momento in cui inizia la trascrizione vera e propria, viene fosforilata. Nella parte finale della coda sono presenti molte serine e treonine che vengono fosforilate con una chinasi, che trasferisce a questi residui aminoacidici un gruppo fosfato prendendolo dall'ATP. I tre aminoacidi che comunemente vengono fosforilati sono serina, treonina e tirosina, che hanno in comune la presenza di un -OH. Questo l'ultimo evento che avviene prima dell'inizio della trascrizione. Si forma, con l'intervento di una elicasi, un complesso aperto, e poi comincia la trascrizione. La catena di segnali che stabilisce se avviare o meno la trascrizione si trova in due posizioni diverse. Subito a monte della TATA box possono esserci numerosi elementi che inducono o reprimono la trascrizione. Quando parliamo di elementi in cis (cis rispetto al DNA) intendiamo particolari sequenze sul DNA: anche la TATA box un elemento in cis. Gli altri elementi in cis sono riconosciuti da diversi fattori trascrizionali. Quindi, in definitiva, un elemento in cis una sequenza di DNA riconosciuta da un fattore trans (essendo di natura proteica) capace di legare questo elemento. Ogni gene caratterizzato dalla presenza della TATA box, che virtualmente sempre presente, e da una peculiare collezione di questi elementi, che possono essere in posizioni diverse. Per esempio, la GC box che riconosciuta da un fattore trascrizionale detto SD1, se presente si trova in posizione -50; un altro elemento detto CAAT box riconosciuta da diversi fattori, e spesso in posizione -75 ma pu essere anche in posizioni diverse. Quindi, un gene ha sempre la TATA box, ma pu avere o non avere elementi di questo tipo, o averli in posizioni diverse in pi di una copia. La TATA box un elemento basale; gli altri sono elementi a monte, nelle vicinanze del promotore (entro 100-200 basi massimo di distanza dal promotore), la cui presenza influenza spesso positivamente, altre volte negativamente, la trascrizione. Quindi, la catena di segnalazioni di cui parlavamo costituita in parte dal riconoscimento da parte di elementi proteici di questi elementi in cis, che attivano la trascrizione. Ogni gene, in questo, fa storia a s, dato che ognuno ha una diversa collezione di questi elementi, e quindi la regolazione di ogni gene sar diversa. L'altro modo principale in cui si esprime la catena di segnalazioni la presenza degli enhancer, o potenziatori. In generale, sono distanti dal promotore e inducono fortemente la trascrizione di un gene risultando spesso decisivi. C' una catena di comando molto complessa, come si vede. Da una parte, abbiamo la presenza di questi elementi a monte, che funzionano in virt della loro contiguit con il promotore: la loro presenza o assenza sul DNA influenza la RNA polimerasi. Dall'altra parte, abbiamo gli enhancer, elementi distanti, anche a migliaia di basi di distanza, o a valle del promotore, a cui si legano dei fattori trascrizionali. Si forma un'ansa nel DNA, in modo tale che l'elemento enhancer e il fattore trascrizionale vengono a essere contigui al promotore, in questo modo influenzando la trascrizione. Vediamo un esempio che ritroveremo pi avanti. Gli ormoni lipofili (una classe di questi ormoni, derivati dal colesterolo, sono detti glucocorticoli) hanno la caratteristica di poter penetrare all'interno della cellula. Un ormone peptidico come l'insulina non pu entrare all'interno della cellula: questo ormone ha dei recettori sulla superficie cellulare e tramite il legame con tali recettori attiva una segnalazione intracellulare attraverso dei secondi messaggeri che arriver anche a livello del nucleo. Gli ormoni lipofili penetrano la membrana plasmatica; hanno un recettore endocellulare, citoplasmatico, che, una volta legato all'ormone, diventa capace di migrare nel nucleo, e legarsi ad un enhancer. Si crea l'ansa, e influenza la trascrizione di molti geni diversi. Per cui abbiamo sia elementi prossimali che elementi distali. Per quanto riguarda la struttura del recettore che si lega agli ormoni lipofili, e che poi diventa un fattore trascrizionale, prendiamo come esempio il GRE (Glucocorticol Receptor Element), che il recettore citoplasmatico del glucocorticolo. Si tratta di una proteina con tre domin diversi. Prima di tutto, ha un dominio di legame per l'ormone C-terminale; l'ormone, legandovisi, induce un cambiamento

conformazionale della proteina che la rende capace di migrare nel nucleo. Qui, pu legarsi al DNA grazie ad un secondo dominio; si tratta di un dominio di legame al DNA specifico per un certo enhancer, per cui si pu legare specificamente a quell'elemento. Il terzo dominio agisce sul promotore una volta che si formata l'ansa, attivando in maniera finale la trascrizione. Questa proteina ha, peraltro, una struttura a Zinc Finger, che avevamo gi visto. Le dita sono strutture ripetute a intervalli regolari (12-15 nucleotidi); in ciascun dito ci sono delle cisteine(o pi raramente delle istidine), separate da pochi aminoacidi, che coordinano uno ione Zinco bivalente. Attraverso le dita, la proteina in grado di riconoscere quel particolare elemento. Un esempio di gene regolato in questo modo la metallotioneina, una proteina del siero prodotta nel fegato. Risponde a varii stimoli ormonali, tra l'altro anche all'ormone glucocorticoide attraverso GRE. Il suo enhancer in posizione -300. Tuttavia, la sua trascrizione regolata da tutta un'altra serie di fattori. Abbiamo una TATA box, due volte CAAT box, una GC box, pi altri elementi che non fanno parte di quelli che abbiamo visto noi come l'MRE, Metal Responsive Element. Dato che una delle funzioni della metallotioneina eliminare i metalli pesanti che si trovano nel sangue ( una scavenger per queste sostanze) esiste un sistema di regolazione per cui un sensore della presenza di questi metalli fa s che MRE sia riconosciuto da un fattore trascrizionale apposito che induce la trascrizione del gene. Vediamo come la trascrizione di un gene pu avvenire solo se ci sono tutta una serie di segnali, il che rende la trascrizione eucariotica un processo estremamente complesso alcuni aspetti non sono ancora del tutto chiari. La complessit emerge soprattutto dal fatto che ogni gene un caso a s, e va studiato singolarmente per capire come venga regolato. Per questo motivo, il numero di geni di cui si conosce esattamente la modalit di trascrizione non elevatissimo. Un altro aspetto di grande diversit tra procarioti ed eucarioti nella struttura dell'mRNA. Prima di tutto, per la presenza del fenomeno dello splicing, che vedremo dopo per. Adesso concentriamoci sulla struttura al 5' e al 3' del trascritto. Al 5' c' il famoso cap, un cappuccio di tipo chimico aggiunto post trascrizionalmente a questa estremit presumibilmente, a scopi protettivi verso una eventuale digestione esonucleasica, ma anche per legare l'mRNA al ribosoma. In genere, la prima base ad essere presente al 5' una adenina o una guanina. Nei procarioti, l'estremit un nucleotide trifosfato; negli eucarioti, viene aggiunto una 7-metil-guanosina. Prima viene aggiunta una guanosina, che poi viene metilata in posizione 7. Questa base aggiuntiva inserita post trascrizionalmente forma un legame assolutamente atipico per un acido nucleico, perch si tratta di un legame 5'-5': come se fosse legata al contrario, e in mezzo rimane un ponte trifosfato. Il cap pu prevedere, oltre alla presenza della 7-metil guanosina, due altre possibili metilazioni sulle prime due basi. Sulla base 1 se una adenina, o anche sulla base 2 a seconda della base. Come finisce la trascrizione negli eucarioti? Nei procarioti, lo smantellamento della struttura dovuta ad una forcina che si forma con le modalit che abbiamo visto. Negli eucarioti non chiaro come stanno le cose. Non chiaro, in particolare, come viene definita la fine dell'RNA, la sua estremit 3'. Nei procarioti, sappiamo che la fine della molecola di RNA dopo la sequenza di poliU, ma negli eucarioti sembra che l'estremit dell'RNA sia prodotta da un taglio endonucleasico. Alla fine dell'RNA sembra ci sia una sequenza detta sequenza segnale di poliadenilazione.. una sequenza che viene riconosciuta da particolari fattori proteici, che inducono l'azione di una endonucleasi che taglia l'RNA una decina di basi a valle; successivamente, l'RNA viene poliadenilato. Come sappiamo infatti gli RNA eucariotici sono tendenzialmente caratterizzati da una coda di poliA, aggiunta post trascrizionalmente da una poliA polimerasi, la quale aggiunge la coda di poliadenosinmonofosfato sfruttando ATP. Per cui, dato che gli RNA vengono tagliati, non sappiamo dove in realt la trascrizione finisce; possibile che il meccanismo sia simile a quello eucariotico, ma le possibilit di indagine sono limitate dal fatto che non si riesce a vedere la molecola di RNA appena trascritta nella sua completezza, ma viene tagliata immediatamente. Mentre nei procarioti l'estremit dell'RNA veniva prodotta dal fatto che la RNA polimerasi si staccava, negli eucarioti l'estremit viene prodotta da un taglio endonucleasico a valle della sequenza segnale di poliadenilazione.

Ci che si ottiene immediatamente dopo la trascrizione il trascritto primario. Questo viene modificato al 3' con il taglio e la poliadenilazione, al 5' con il cap, e poi subisce lo splicing. Lo splicing un processo il cui significato biologico non stato ancora completamente chiarito. Non chiaro perch la cellula produca una molecola per distruggerne immediatamente tra il 50% e il 90%. Ci sono alcune ipotesi su quali possano essere le funzioni di questo processo, ma per un motivo o per l'altro sono scarsamente convincenti. In ogni caso, il risultato una molecola molto pi piccola, l'mRNA. Lo splicing consiste nell'eliminazione degli introni. In un trascritto primario abbiamo un susseguirsi di introni (sequenze interposte), in genere di diverse decine di basi, a volte superando il centinaio, ed esoni (sequenze espresse). Lo splicing prevede il taglio a livello delle estremit di ogni introni e la giunzione degli esoni consecutivi. L'ordine degli esoni non cambia, vengono soltanto eliminati gli introni. La riduzione di taglia abbastanza drastica, a volte si arriva anche al 90-95%. In altri casi (eccezionali, a dire il vero), per esempio nel caso delle globline, la riduzione solo del 40-50%. In genere, le riduzioni sono intorno al 7080%. A cosa serve lo splicing? In genere, nell'evoluzione, le strutture inutili non vengono conservate. Invece, confrontando geni ortologi (gli stessi geni in organismi diversi), per esempio geni umani e murini, ci accorgiamo che sono estremamente simili a livello della struttura esoni-introni. Questo ci fa capire che la strutturazione esoni-introni precedente alla separazione tra la nostra specie e altri mammiferi, e che soprattutto sorprendentemente conservata. Questo significa che c' una ragione per l'esistenza dello splicing, altrimenti sarebbe difficile spiegare perch sia cos conservata. Oggi conosciamo la sequenza di interi genomi, e questo possibile grazie al sequenziamento dei geni. Sequenziare un gene significa arrivare a conoscerne la sequenza. Un tipico gene comprende un promotore, con alcuni elementi in cis, e una TATA box, 25 basi a valle della quale c' l'inizio della trascrizione. Vi poi la sequenza che dar origine al trascritto primario: migliaia di basi. Gi a livello della sequenza genica si possono evidenziare gli esoni e gli introni. La precisione del processo di splicing impressionante, insieme alla quantit di RNA che viene eliminato: viene cancellato il 70% del lavoro di trascrizione appena fatto.

Biochimica - Lezione del 11-05-09 [Prof. Raugei]


Abbiamo visto che nei procarioti il legame che c' tra trascrizione e traduzione molto diretto, dato che il mRNA pu essere tradotto gi mentre ancora in atto la trascrizione. Negli eucarioti invece i due processi sono nettamente distinti, e divisi in due compartimenti diversi. Sono inoltre funzionalmente separati da una serie di modificazioni del prodotto della trascrizione, tra cui un profondo taglio: il trascritto primario (hnRNA, eterogeneo nucleare) la copia esatta del gene strutturale la parte di DNA che viene copiata in RNA, a valle del promotore fino al terminatore. detto eterogeneo perch gli altri RNA principali non sono eterogenei: i tRNA sono molecole abbastanza piccole (<100 basi), e, con qualche decina di basi l'uno dall'altro, sono molecole abbastanza simili. I rRNA sono di tre tipi diversi, ma sono molecole identiche tra loro. Invece, le hnRNA, cio copie dei geni, sono molto diversi tra loro come taglia: ogni gene caratterizzato da una sua lunghezza, e si va da qualche migliaio di basi (come i trascritti delle globine, tra i pi piccoli) a centinia di migliaia di basi. Questo poi non nemmeno direttamente connesso con la taglia dell'mRNA, che dipende dall'entit dello splicing. Ci sono trascritti primari relativamente corti che perdono per sequenze introniche piccole e non sono ridotti in maniera esagerata; altri trascritti sono lunghissimi ma perdono il 95% della loro lunghezza con lo splicing. Non sempre c' una proporzionalit tra hnRNA e mRNA, anche se spesso si trova un qualche rapporto. Quindi, sono detti hnRNA perch ogni trascritto ha una sua misura. Anche il rapporto tra lunghezza dell' mRNA e numero di aminoacidi della relativa proteina non sempre diretto: non tutto l'mRNA sequenza codificante; tuttavia, in genere, pi grande l'mRNA, pi

grande sar la proteina. Proseguiamo con lo splicing. Il processo fu scoperto perch al microscopio elettronico si evidenzi un fenomeno inconsueto. Ponendo in contatto DNA con il suo mRNA, si formavano delle strutture che evidenziavano una non perfetta capacit dell'mRNA di appaiarsi al proprio DNA. Nei batteri, mettendo insieme mRNA e DNA a singolo filamento si formava una doppia elica ibrida perfetta; negli eucarioti, il DNA formava della anse, che denunciavano l'esistenza di zone di complementariet separate da zone senza alcuna complementariet. Nel DNA c'erano quindi delle sequenze in pi che evidentemente nell'mRNA vengono eliminate. Lo splicing un processo estremamente preciso, che avviene in virt della presenza di uno spliceosoma. Questo uno degli esempi di come proteine ed RNA possano collaborare, una evidenza che sembra avvalorare la tesi del mondo a RNA. Strutture come quelle dello spliceosoma mostrano come, verosimilmente, l'RNA all'inizio avesse anche capacit catalitiche; in sostanza, sarebbero stati ci che oggi sono gli enzimi (catalizzatori biologici a base proteica). Probabilmente le proteine sono state preferite all'RNA a causa della loro maggiore versatilit, conferita loro dal maggior numero di aminoacidi contro i soli 4 nucleotidi dell'RNA. Nel processo dello splicing troviamo una sorta di collaborazione dell'RNA con le proteine: l'RNA mette insieme le strutture che devono essere giunte (gli esoni consecutivi). Nel trascritto primario c' sempre un esone pi rispetto al numero degli introni, perch l'RNA inizia e finisce con un esone. Si forma una struttura in cui la fine di un esone e l'inizio del successivo sono posti vicino, in virt della formazione di un doppio filamento grazie a legami a idrogeno dovuti all'appaiamento delle basi; l'RNA che trova omologia con la prima parte dell'introne e l'ultima parte dell'introne stesso l'snRNA, small nuclear RNA. Si tratta di piccoli RNA (160 basi circa) che si trovano all'interno del nucleo, che hanno delle sequenze complementari alle sequenze introniche poste all'inizio e alla fine (che infatti sono molto conservate nei vari introni): GUAAGU all'inizio, e CAG alla fine. Si forma quindi una struttura tridimensionale in cui due zone (anche molto distanti tra loro, dato che un introne pu essere lungo anche migliaia di basi) vengono portate vicine. Si forma quindi un'ansa, o cappio; a seconda della lunghezza dell'introne, cambia la dimensione dell'ansa. Gli enzimi quindi trovano la struttura da tagliare e saldare gi topologicamente pronta. Gli spliceosomi sono detti anche SNRNP, Small Nuclear RiboNuclear Protein:sono strutture che assomigliano vagamente a ribosomi in quanto composte da proteine ed RNA; le proteine operano le attivit enzimatiche che riguardano i legami covalenti; gli RNA formano i legami ad idrogeno necessari a posizionare i soggetti della catalisi nella posizione corretta. Notare che il numero di legami fosfodiesterici presenti non cambia: per ogni introne vengono tagliati due legami fosfodiesterici (tra ognuna delle due estremit dell'introne e le estremit degli esoni contigui), ma poi si riformano due legami: uno a livello delle estremit degli esoni che vengono saldati, ed uno a livello dell'introne. Si forma infatti una struttura a cappio sfruttando una adenina che si trova all'interno della sua sequenza per formare un legame 2'-5'. L'adenina all'interno dello scheletro zucchero-fosfato 5'-3'; ha in pi un sito di ramificazione in 2', in cui l'OH eccezionalmente forma un legame con la guanina all'inizio dell'introne tagliato. Questa comunque una forma transiente perch l'introne poi viene eliminato. Tutto ci succede grazie all'snRNA che sfrutta dei siti di complementariet che ci sono sempre all'inizio e alla fine degli introni; queste sequenze, molto conservate, sono funzionali al meccanismo di splicing. Disturbando il processo dello splicing, per esempio intervenendo a livello delle sequenze suddette, ed impedendo la rimozione di un introne, gli effetti a livello dell'mRNA sono disastrosi: in mezzo alla sequenza codificante rimane una lunga sequenza che non serve alla proteina. Lo splicing deve quindi avvenire, e avvenire in maniera esatta: l'inserimento di una sola base in pi nella sequenza codificante farebbe saltare lo schema di lettura a valle. Il taglio deve avvenire in punti esatti. Lo splicing alternativo una modalit abbastanza comune per un gene di produrre proteine parzialmente diverse. Un esempio la troponina: ci sono diversi tipi di troponina; una tipica del muscolo striato, ed una tipica del muscolo liscio. Il meccanismo di splicing verosimilmente un meccanismo regolato, non casuale (almeno la maggior parte delle volte), e dipende dal tipo cellulare in cui questo splicing avviene. Le modalit

con cui avviene lo splicing multiplo sono varie. In alcuni citotipi, un esone tra due introni viene ignorato, e si considera il tutto un unico grande introne. L'esone quindi non viene inglobato nell'mRNA. Lo stesso trascritto primario, in altri citotipi, viene processato in modo che sia un esone differente ad essere considerato introne. Per cui, si hanno due prodotti alternativi in cui c' o un esone o l'altro; ci che succede che vengono prodotte due proteine in parte diverse: il risultato sar che alcuni domini della proteina potranno esserci o non esserci alternativamente. Un'altra modalit di splicing multiplo produce differenze molte pi vistose: lo splicing alternativo pu essere una modalit di regolazione negativa nella produzione di una proteina. In questi casi, un esone o viene ignorato oppure viene inserito nella sequenza dell'mRNA. Nel primo caso, la proteina sar codificata sulla base dei 5 esoni sui 6 potenzialmente presenti. Se per lo splicing viene indotto a intraprendere una strada diversa, considerando anche l'esone inizialmente ignorato, verr prodotto un mRNA pi lungo (avendo un esone in pi); tuttavia, l'esone in pi contiene un codone di stop che tronca la traduzione, e allora si avr una proteina pi corta che in alcuni casi non funzionale, in altri casi ha una funzione diversa. Adesso vediamo la traduzione. Abbiamo visto la trascrizione, che per certi versi simile tra procarioti ed eucarioti ma viene regolata in modo diverso; l'mRNA viene modificato negli eucarrioti, e vi la grossa differenza data dallo splicing. I procarioti prediligono la velocit e l'economia delle risorse, mentre gli eucarioti hanno una grande zavorra di introni. Per gli scopi del corso, possiamo pensare che anche la sintesi proteica sia grossolanamente simile: ovviamente diversa andando nello specifico delle molecole coinvolte, della loro struttura, etc. Gli attori del processo sono, da una parte, rRNA e proteine ribosomiali. La struttura dei ribosomi procariotici ed eucariotici abbastanza simile; i ribosomi eucariotici sono leggermente pi complessi, con un numero maggiore di proteine e rRNA di taglia diversa.Le misure tradizionalmente si esprimono in Svedberg, le unit di sedimentazione in apposito gradiente; tali misure sono proporzionali al peso molecolare, anche se non in modo lineare. Il ribosoma procariotico identificato come 70 S, contro gli 80 S del ribosoma eucariotico. formato da due subunit, una maggiore e una minore, rispettivamente 50 S e 30 S; per il ribosoma eucariotico invece abbiamo 60 S e 40 S. Tralasciando le proteine, che nel ribosoma eucariotico sono in numero maggiore, dal punto di vista degli rRNA, nel procariotico c' 23 S, 16 S e 5 S. Nel ribosoma eucariotico abbiamo 28 S e 18 S, pi altri due piccoli rRNA. Purificando questi rRNA dal citoplasma di cellule eucariotiche, possibile porli su gel di agarosio e separarli per peso molecolare. Anche gli rRNA, pur essendo a singolo filamento, riescono ad inglobare molecole di etidio bromuro in maniera sufficiente. Si vedono allora tre bande di accumulo principali, di cui una ha corso pi lentamente ed una pi velocemente: sono i due rRNA principali, 28 S e 18 S. Facendo lo stesso con un RNA purificato da colture batteriche, vediamo le due stesse bande (che hanno corso un po' pi velocemente, essendo gli rRNA procariotici un poco pi corti): il 23 S e il 16 S. In fondo, c' una zona dove si accumulano i piccoli rRNA d i tRNA in entrambi i casi. Gli mRNA, essendo molecole eterogenee, non hanno taglie uniche, ma sono diversi da gene a gene. In cellule molto attive con la sintesi proteica si vede quindi un alone sul fondo, che sta a testimoniare la presenza di molte molecole diverse tra loro. Se purificassimo l'RNA da tutta la cellula, piuttosto che solo dal citoplasma, in realt vederemmo la stessa cosa: il trascritto primario infatti una struttura transiente, subisce subito lo splicing, ed molto difficile da vedere, mentre l'mRNA molto pi stabile. I ribosomi sono alcune delle strutture di cui si sa di pi, sono stati molto studiati. Quando si accoppiano, le due subunit lasciano una sorta di foro, attraverso il quale scorre l'mRNA; quest'ultimo scorre di tre basi in tre basi, per presentare di volta in volta il codone successivo. L'altro RNA coinvolto il tRNA. Sono molecole in qualche misura eterogenei, ma le loro dimensioni sono pressappoco le stesse (<100 basi, in genere da 73 a 93). Sono di 32 tipi diversi, ma hanno all'incirca tutti la stessa forma, perch la diversit di taglia tra un tRNA e un altro viene compensata dall'aumento o la diminuzione di un'ansa che si forma

nell'ambito della sua struttura, chiamata ansia variabile, appunto. Il resto della struttura rimane invariata, e presenta 4 steli che si formano in virt delle complementariet intracatena che consentono la formazione di brevi tratti a doppio filamento. Abbiamo uno stelo accettore, dove si lega l'aminoacido; un'ansa d, chiamata cos per via della diidrouridina (vedremo dopo perch), un'ansa b, e l'ansa dell'anticodone, con tre basi che costituiscono l'ansa dell'anticodone. Al momento in cui il tRNA viene prodotto, non contiene gli ultimi 3 nucleotidi detti -CAA; questi sono aggiunti post-trascrizionalmente e sono uguali per tutti i tRNA. L'adenosina quella che accetter l'aminoacido. Eccezionalmente, i tRNA contengono dei nucleosidi atipici, che si producono in seguito a modifiche post trascrizionali. La trascrizione del tRNA avviene normalmente, e vengono utilizzati i 4 nucleosidi tipici. Post trascrizionalmente, degli enzimi modificano alcune basi. L'ansa d chiamata cos perch in alcuni tRNA contiene la diidrouridina, una uridina ridotta, in cui sono stati introdotti due H. Un altro nucleoside atipico la ribotimidina, un uracile che viene metilato e cos diventa timina. La pseudouridina invece prevede un legame al carbonio in posizione 5; non pi un legame N-glicosidico, quindi. L'nosina una adenina deaminata ossidativamente. Si pensa che queste modificazioni servano a diversificare tra loro i varii tRNA, producendo artificialmente delle differenze pi marcate tra un tRNA e l'altro, facilitando l'accoppiamento di un tRNA al suo aminoacido. Da un punto di vista tridimensionale, la struttura assomiglia ad una L. Il processo di traduzione inizia con l'identificazione, sull'mRNA, di un particolare sito di inizio, che il codone AUG, che anche il codone per la metionina. Mentre negli eucarioti non fa differenza se il codone AUG si trova all'inizio o all'interno della sequenza codificante (il tRNA sempre lo stesso, quello che porta la metionina), nel caso dei procarioti il primo codone particolare: stabilizza un tRNA particolare che porta la formil-metionina. Si tratta di un aminoacido particolare, una metionina modificata che all'NH2 terminale ha legato un gruppo formile. Si pensa che questo abbia un significato protettivo: quella del primo aminoacido infatti sar l'estremit N-terminale della futura proteina, a livello della quale sarebbe esposto un gruppo -NH2, particolarmente reattivo. possibile che il gruppo formile ne prevenga la reazione con gruppi etilici che non dovrebbero reagire. Per qualche ragione, questo meccanismo andato perso negli eucarioti, verosimilmente perch hanno modalit diverse di protezione. A parte questo, l'inizio avviene nella stessa maniera. La subunit minore ribosoma scorre sull'mRNA e in generale si blocca a livello di uno dei primi AUG che incontra (il secondo o il terzo) e l si stabilizza. A questo punto, sopraggiunge il primo tRNA che trasporta, come abbiamo visto, o metionina o formil-metionina, e si posiziona eccezionalmente nel sito P. Successivamente, una volta montata la struttura completa del ribosoma, si evidenziano due siti, ognuno dei quali inquadra una tripletta. Il sito A la tripletta che prende contatto con l'anticodone del tRNA che porta aminoacido, il sito P la tripletta precedente. Quello che avviene in tutta la traduzione che il tRNA carico con l'aminoacido prende contatto con il sito A. Solo all'inizio, eccezionalmente, il tRNA carico con l'aminoacido entra nella struttura ribosomiale nel sito P. Subito dopo, abbiamo la situazione che si riproporr sempre durante la traduzione: il sito P occupato da un tRNA, e il sito A libero che inquadra un codone. Per cui, il tRNA successivo, che avr l'anticodone complementare, potr entrare nel sito A. Successivamente, si romper il legame tra il tRNA e l'aminoacido sar quindi libero per formare il legame peptidico con l'aminoacido precedente. Tutta la struttura scorre di tre basi: il tRNA scarico passa in un sito detto E, da dove viene espulso; il secondo aminoacido che stava nel sito A si ritrova nel sito P; il sito A di nuovo libero e inquadra un codone che potr essere riconosciuto dall'anticodone del prossimo tRNA carico. Il ciclo si ripete tante volte quante sono i codoni dell'mRNA. Il processo finisce in modo relativamente semplice, inquadrando un codone di stop. Il segnale dato dal fatto che non ci sono tRNA in grado di occupare quella posizione. Non ci sono anticodoni capaci di legare i codoni di stop il processo in realt pi complesso, ma questo l'evento principale. Il fatto che il sito A sia libero un segnale di destabilizzazione dell'mRNA, del ribosoma e della proteina nascente. Il macchinario di traduzione si smantella. Come avevamo visto nella trascrizione, anche in questo caso la proteina in via di traduzione sporge fuori dal ribosoma, e la catena polipeptidica sar tanto pi lunga quanto pi avanzato il processo di traduzione. Tuttavia, non dobbiamo immaginarci una sorta di filo di perle, perch la proteina prende gi la sua struttura tridimensionale con il processo del folding via via che viene tradotta. Ricordiamo pi ribosomi

possono essere impegnati sullo stesso mRNA, a formare polisomi, visibili anche al microscopio elettronico, ad indicare che l'mRNA fortemente trascritto. Negli eucarioti, dato che esiste lo splicing alternativo, non pi vero l'assioma un gene-una proteina; ancora vero che un mRNA una proteina: lo splicing multiplo pu produrre pi messaggeri, ma da un certo messaggero si tradurr invariabilmente una proteina. Nei procarioti, dato un certo mRNA, nel caso degli operoni per esempio, possono derivare pi proteine. Questo invece negli eucarioti non avviene. Essenzialmente, si pu dividere il processo della sintesi proteica in 5 fasi,. La prima fase costituisce il presupposto fondamentale: legare gli aminoacidi ai tRNA. Questo da una parte rende il tRNA trasportabile verso i ribosomi, ma soprattutto lo attiva dal punto di vista termodinamico rendendo possibili i tre passi successivi. Le fasi successive (inizio, allungamento, termine e rilascio) che costituiscono la vera e propria sintesi della proteina, con l'instaurazione dei legami peptidici tra gli aminoacidi. L'ultima fase comprende il ripiegamento e le modificazioni post-traduzionali. Il folding non solo fortemente regolato, ma alla base di numerose malattie neurodegenerative, in cui problemi a livello del folding delle proteine diventano problemi a livello cellulare che poi diventano problemi a livello dell'organismo. Il primo stadio, come abbiamo visto, prevede il legame dell'aminoacido al tRNA, nonch la sua attivazione. Il processo di traduzione infatti, come tutti i processi di sintesi, un processo endoergonico e l'energia tratta da varie molecole (soprattutto ATP e GTP), che, con l'idrolisi dei loro legami fosforici, spingono la reazione verso la sintesi della proteina. Gi in questo primo livello l'attivazione dell'aminoacido comporta la spesa di un ATP: inizialmente si forma un intermedio che l'aminoacil-AMP; l'ATP perde un gruppo pirofosfato (PP, che verr poi idrolizzato a due molecole di fosfato dall'enzima pirofosfatasi, con un rilascio energetico importante). L'aminoacido, teoricamente, potrebbe legarsi in due maniere: o a livello dell'N terminale, o a livello del -COOH terminale. Nelle cellule, il gruppo -COOH viene impegnato in un legame con il fosfato dell'ATP, che rimane come si detto con un solo fosfato (AMP, adenosin monofosfato). Questo legame che si forma un legame fosfoanidridico, e ha un contenuto energetico molto elevato: per questo si parla di attivazione dell'aminoacido. La molecola aminoacidica deve essere legata con legame ad alta energia all'AMP, pronta per i passaggi successivi. Infatti, il passaggio successivo, che il legame con il tRNA, un passaggio che non prevede ulteriore spesa energetica. Nella reazione, l'aminoacil-AMP si scinde in aminoacido e AMP, e il legame fosfoanidridico che lega l'aminoacido all'AMP viene sostituito da un legame di tipo estere che lega l'aminoacido al 2' o al 3' della ultima adenosina presente sul tRNA l'ultimo nucleoside al 3' dell'RNA una adenina (contenuta nella sequenza 5'-CAA-3'). In realt, non ci interessa tanto l'adenina in s, quanto il suo ribosio, che presenta 2 residui -OH, in 2' e in 3' appunto. In questo salto da un legame fosforoanidrico a un legame estere c' un salto energetico negativo. Con una reazione di transensterificazione, anche gli aminoacidi che sono stati legati al 2' vengono legate al 3': alla fine, gli aminoacil-tRNA sono tutti legati al 3'. Abbiamo visto l'attivazione dell'aminoacido con un legame all' AMP, e poi al suo tRNA: l'enzima fondamentale che catalizza tutte queste reazioni la aminoacil-tRNA sintetasi. Oltre ad avere queste capacit catalitiche, molto specifico nel riconoscere uno specifico RNA e il suo aminoacido. Per essere corretti, quella delle aminoacil tRNA sintetasi una famiglia di 20 enzimi, uno per aminoacido. Ciascuna, ha un dominio con cui riconosce l'aminoacido, e un altro dominio con cui riconosce quei tRNA che hanno l'anticodone compatibile. Si pu dire che il vero traduttore del sistema della sintesi proteica questo enzima. Il tRNA solo un carrier, un adattatore tra il codice a triplette e l'aminoacido, ma le molecole che guidano questo accoppiamento sono questi enzimi. L'interpretazione del codice genetico avviene a questo livello, pi a valle tutto automatico. E in effetti, la traduzione non permette correzione degli errori, che invece sono corretti a livello di DNA (sia durante la sintesi, sia dopo) e anche a questo livello. Certi aminoacidi sono simili tra loro (es. glicina e alanina), ma la amnoacil tRNA sintetasi pu avvertire, tramite delle modifiche conformazionali, se l'accoppiamento aminoacido-tRNA giusto, e in caso di errore, esercitare un'attivit idrolasica sul legame estere. Si stima che la precisione dell'associazione dell'aminoacido al suo tRNA aumenti di due o tre ordini di grandezza con questo meccanismo, riducendo parimenti gli errori importante capire che una volta commesso un errore a questo livello, non esistono altre modalit di controllo. Se si verifica una mutazione in una di queste aminoacil tRNA sintetasi che compromettano il riconoscimento

degli aminoacidi, in genere si hanno effetti disastrosi. A questo punto, si ha un pool di aminoacidi legati ai loro tRNA. Il ribosoma, abbiamo detto, si posiziona a livello di uno dei primi AUG. Quali sono le modalit con cui il ribosoma si aggancia? Sono abbastanza diverse tra procarioti ed eucarioti, e nei primi sono molto interessanti. Quasi sempre, all'interno del mRNA procariotici riconoscibile un po' a monte dell'AUG (c' sempre una zona, al 5', che non tradotta; un mRNA non inizia mai con un AUG), all'interno della zona non tradotta, c' una sequenza particolare chiamata Shine-Delgarno. Si pu anche in questo caso estrarre una sequenza consenso, cio una sequenza molto probabile, che complementare al rRNA 16 S, componente principale della subunit minore del ribosoma. cos che quest'ultima trova la zona dell'AUG: il suo rRNA sfruttando la forza dei legami ad idrogeno di due sequenze complementari (quella dell'rRNA e la sequenza di Shine Delgarno) posiziona il ribosoma dove deve stare. Se la sequenza di Shine Delgarno non c', l'AUG viene ingnorato (anche se il primo dell'mRNA). L'AUG spesso il primo, ma la sua funzione subordinata alla presenza, a monte, della sequenza complementare al 16 S. Questo da una parte ci fa capire come viene scelto l'AUG, dall'altra come si stabilizza la subunit piccola del ribosoma, che l'evento iniziale della traduzione. Negli eucarioti meno chiaro come viene riconosciuto il primo AUG: stato notato che molte volte (ma non sempre) l'AUG d'inizio all'interno della sequenza di Kozak, che sembra responsabile del riconoscimento del codone iniziale. Una differenza importante tra eucarioti e procarioti che, mentre nei procarioti la sequenza di Shine-Delgarno sembra assicurare, almeno nella fase iniziale, il legame tra ribosoma e rRNA, negli eucarioti fondamentale il ruolo dei due terminali modificati (cap e poliA) del mRNA, che servono anche a trovare contatto con la subunit piccola del ribosoma; poi, con un meccanismo in cui verosimilmente coinvolta la sequenza di Kozak, viene trovato l'AUG iniziale. Tuttavia, all'inizio c' un legame abbastanza stabile tra le due estremit dell'mRNA e la subunit minore del ribosoma. Al processo della traduzione partecipano anche dei fattori traduzionali, ovviamente di natura proteica (di solito molecole chiamate fattori sono proteine), dette, in questa prima fase di inizio, IF (Initiating Factor). Questo quello che accade nei procarioti: negli eucarioti, tutto un po' pi complesso (es. i fattori sono pi numerosi), ma lo schema generale lo stesso. A cosa servono i fattori? IF1 occupa il sito A. Questo uno dei motivi per cui il primo tRNA carico va ad occupare eccezionalmente il sito P: anche perch il sito A, dove arriva normalmente il tRNA carico, inizialmente occupato fisicamente da IF1. IF3 invece serve per impedire, in un primo momento, l'arrivo della subunit maggiore. IF2, con consumo di GTP, serve per posizionare il tRNA con l'aminoacido formil-metionina nel sito P, in corrispondenza del codone AUG, corrispondente all'anticodone (complementare) CAU. Il GTP viene rilasciato come GDP nel corso del posizionamento del tRNA, cos come vengono rilasciati anche gli altri fattori, cos che la subunit maggiore del ribosoma possa legarsi a formare il ribosoma. La sintesi vera e propria non ancora iniziata: stata soltanto posizionata la formil metionina, e il secondo codone libero per accogliere un secondo tRNA. Le funzioni dei numerosi fattori eucariotici sono fondamentalmente le stesse dei tre fattori procariotici. Il terzo stadio corrisponde alla fase di allungamento, che si pu suddividere in varie sottofasi. La prima fase quella dell'arrivo del secondo tRNA. Come abbiamo visto per la formil-metionina, serve del GTP per posizionare il tRNA a livello del codone; serve ugualmente GTP per portare ogni tRNA carico a livello del codone corrispondente. Il secondo aminoacido si lega al fattore di traduzione TU, che legato a GTP, che accompagna e favorisce il posizionamento del secondo aminoacido e di tutti quelli successivi a livello del codone corrispondente. Il fattore TU legato a GTP porta i tRNA carichi a livello del sito A, e questo si ripete ogni volta che si deve aggiungere un nuovo aminoacido. Il legame del tRNA al sito A viene mediato dal rilascio di un P, con conversione del GTP in GDP. TU si deve poi ricaricare con GTP: deve quindi rilasciare il GDP e legare un altro GTP. Quest'ultimo passaggio mediato da un ulteriore fattore detto TS: TU si lega a TS, e questo legame scalza il GDP che viene rilasciato; il GTP poi si lega a TU, scalzando a sua volta TS, e ricaricando TU. Questa prima fase, che si ripete per ogni codone, vede il posizionamento del tRNA carico. La fase 2 vede l'instaurarsi del legame peptidico. Questo pu accadere perch stata stabilita contiguit tra

l'aminoacido precedente e quello appena posto sul sito A; i due tRNA sono legati ai due codoni adiacenti, e in questo modo i due aminoacidi vengono ad essere anch'essi adiacenti e pronti ad essere legati tra loro. Quello che succede che si forma il legame peptidico: viene idrolizzato, a livello dell'aminoacido sul sito P, il legame tra il COOH e il 3' del ribosio del tRNA, mentre viene instaurato il legame peptidico tra questo COOH e l'NH2 dell'aminoacido successivo (quello nel sito A); in questo modo, ogni aminoacido aggiunto ha l'estremit C-terminale libera. Per cui: quando gli aminoacidi si legano al tRNA vengono impegnati con il COOH; quando sono coinvolti nel legame peptidico, il primo aminoacido mantiene l' NH2 libero e si lega a livello del COOH, mentre l'aminoacido che viene aggiunto si lega con l'NH2 e mantiene il COOH libero. In altre parole, l'aminoacido legato al tRNA con il COOH, e questo COOH si stacca dal tRNA e si lega all'NH2 dell'aminoacido successivo, a sua volta attaccato con il COOH ad un tRNA; al tRNA legato a quest'ultimo aminoacido ora attaccato un peptide. Questo succede ad ogni ciclo, ad opera della peptidil transferasi. interessante notare che questa attivit catalitica non deputata ad un enzima proteico, ma ad ribozima, un catalizzatore biologico ad RNA, probabilmente un altro ricordo del mondo ad RNA, dove appunto le funzioni catalitiche erano assolte da queste molecole. Il passo successivo la traslocazione. Questa fase prevede la partecipazione di un fattore detto EFG, un altro fattore che si lega al GTP (siamo a 3 molecole ad alta energia utilizzate: una all'inizio e due durante la traduzione): questo fattore aiuta la traslocasi, che fa scorrere di tre basi il ribosoma sull'mRNA. In questo modo, il tRNA scarico viene scalzato, e posto in un sito ulteriore detto E, da cui poi verr espulso; il peptide nascente legato al tRNA posizionato al sito P, e il sito A viene liberato, pronto ad accogliere il tRNA corrispondente al codone che ha appena inquadrato. Arrivato il nuovo aminoacido, la catena nascente verr spostata a livello dell' NH2 dell'aminoacido appena arrivato secondo le modalit che abbiamo appena visto. Questo processo di allungamento avviene tante volte quante sono gli aminoacidi che compongono la proteina. Questo processo va avanti fino all'ultimo stadio, quello della terminazione. Il sito A rimane vuoto, e un releasing factor detto RF si lega e blocca questa posizione.

Biochimica - Lezione del 12-05-09 [Prof. Raugei]


L'ultima volta avevamo velocemente esaminato l'ultima fase del processo della traduzione, la terminazione. Questo passaggio si basa sul fatto che, dei 64 codoni possibili, ce ne sono tre che sono detti di stop, perch non hanno una controparte come anticodone, e non ci sono tRNA capaci di occupare la posizione A. Arrivato a uno di questi tre codoni, il sito A rimane vuoto, e questo il segnale di smantellamento della struttura. In pi, come accennavamo ieri esiste un fattore proteico RF (Releasing Factor) la cui struttura tridimensionale ricorda il tRNA: riconosce il sito A, vi si lega e lo occupa. Questo assicura una terminazione ancora pi precisa. Ogni volta che c' un codone di stop alla fine della sequenza codificante la sintesi proteica termina. Ogni tanto ci saranno degli errori, e la terminazione fallir cio, viene comunque inserito un tRNA nonostante il codone di stop . La sintesi proteica quindi va avanti, e verranno riconosciuti codoni successivi, ma probabilmente finir dopo poco perch viene trovato un altro codone di stop. Una cosa da aggiungere a questo proposito la presenza, riscontrata nei batteri, di mutanti (mutazioni sono cambiamenti di base a livello dell'acido nucleico che funge da materiale genetico) per i geni che codificano per i tRNA. Esistono quindi mutanti in cui si modificato l'anticodone di alcuni tRNA, diventando capace per mutazione di riconoscere il codone di stop. I geni per i tRNA sono multipli, quindi una mutazione in un gene non elimina la presenza del tRNA normale. Quello che succede in una cellula con queste mutazioni che ogni tanto la terminazione fallisce, non per un errore del meccanismo di terminazione, ma perch esistono dei tRNA che per mutazione riconoscono i codoni di stop. Questi ceppi si chiamano soppressori di terminazione; in questi ceppi si osserva che molte proteine sono pi lunghe di quanto dovrebbero essere.

La traduzione il bersaglio principale dei prodotti farmacologici intesi come antibiotici. Abbiamo gi parlato di queste molecole, a volte anche molto complesse, capaci di bloccare meccanismi fondamentali per la vita di una cellula (come traduzione o trascrizione), il che ha esito letale. La forza di queste sostanze sta nel fatto che l'interazione con i meccanismi specifica per i procarioti o per gli eucarioti. Questo per il fatto che, sebbene i meccanismi di traduzione siano grossolanamente simili, le molecole coinvolte sono diverse; anche i ribosomi procariotico ed eucariotico possono essere considerati vagamente simili, ma solo finch non si entra nello specifico. Una molecola capace di bloccare un ribosoma procarioticoo legandovisi verosimilmente non riuscir a trovare una zona di complementariet abbastanza simile su un ribosoma procariotico. Su questa possibilit di specificit si basa l'azione della gran parte degli antibiotici. Un antibiotico chiaramente deve essere attivo sui procarioti ed inattivo sugli eucarioti una sostanza attiva su di noi non la chiamiamo pi antibiotico, ma veleno. Alcuni di quelli che menzioneremo oggi non si utilizzano pi, ma i loro nomi sono senz'altro familiari. Actinomicina Neomicina Tetraciclina (tuttavia, occorre ricordare che alcune tetracicline sono attive sugli eucarioti: queste non sono antibiotici) Puromicina (alcune attive sugli eucarioti) Eritromicina Acido fusidico La actinomicina inibisce l'inizio e l'allungamento della traduzione perch interagisce con la subunit 30S; non attiva con gli eucarioti perch la subunit corrispondente la 40S, che diversa. Le neomicine influenzano la traduzione in generale perch si legano a vari siti sia dei ribosomi sia di altre strutture solo nei procarioti. Le tetracicline si legano alla 30S alcune si legano alla 40S, e sono quelle attive sugli eucarioti, ovviamente. Queste ultime meglio evitarle perch per noi sono dei veleni :) La puromicina importante nell'ambito della ricerca, utilizzata quando si vuole bloccare transientemente la traduzione di una cellula (per esempio, per verificare quale sia il turnover di una proteina si blocca la traduzione e si misura il tempo in cui la proteina rimane dosabile). La puromicina inibisce la peptidil transferasi per cui la traduzione rimane bloccata a met. A seconda dei tipi, la puromicina pu legarsi al 70S o all'80S, quindi o all'intero ribosoma procariotico, o all'intero ribosoma eucariotico. L'eritromicina si lega alla subunit 50S dei procarioti. L'acido fusilico si lega a uno dei fattori elongazione tipicamente batterici. Il cicloesimide usato nell'ambito della ricerca, ed un veleno cellulare eucariotico in quanto si lega all'80S. In ogni caso, sono tutte molecole che riescono a distinguere tra procarioti ed eucarioti e come tali sono interessanti dal punto di vista farmacologico. Abbiamo visto come funziona in generale la traduzione. Adesso rivediamo il codice genetico, arricchendo con qualche notizia questo concetto. Attenzione a non confondere codice genetico con patrimonio genetico! Il patrimonio genetico il genoma, il totale del DNA: ha un corrispettivo molecolare, insomma. Il codice genetico non una molecola, un concetto. una tabella di conversione che mette in relazione due codici: quello degli acidi nucleici a triplette con gli aminoacidi. Si pu rappresentare facendo una lista dei 64 codoni possibili viene fuori proprio 64 perch si tratta di parole di tre lettere composte con un alfabeto di 4 lettere. Quali sono le caratteristiche del codice genetico? universale: significa che comune, per quello che se ne sa, a tutti gli eucarioti. C' qualche eccezione tra i procarioti una singolare eccezione data dai mitocondri, che avendo un proprio genoma hanno anche un loro apparato di traduzione: il loro codice genetico per molto simile al nostro. Questo comunque significa che il codice genetico antichissimo, e apparentemente la scelta di questo codice deve anche aver avuto molto successo, come si pu dedurre dal fatto che, a quanto se ne sa, non esistono nicchie ecologiche in cui si sviluppato un codice diverso. Non ambiguo: significa che, data una certa tripletta, possiamo sempre dire a cosa corrisponde, sia un aminoacido o un codone di stop. ridondante: significa che, dato un aminoacido, non possiamo dire con certezza a quale codone

corrisponde fatta eccezione per la metionina e il triptofano, che sono codificati da un codone solo. Pi codoni possono codificare per lo stesso aminoacido. Non ha punteggiature: significa che in una sequenza codificante la cornice di lettura impostata a partire dalla prima tripletta. Se abbiamo una sequenza codificante per 100 aminoacidi, questa sequenza, essendo i codice a triplette, sar lunga 300 basi (303 considerando il codone di stop).

Com' strutturato il codice genetico? Fatta eccezione per gli unici due aminoacidi specificati da un codone solo (metionina e triptofano), tutti gli altri aminoacidi sono specificati da almeno due codoni in un caso tre, molti quattro, alcuni addirittura 6 codoni. Non una distribuzione casuale: ci sono dei principi precisi. Quattro aminoacidi sono codificati da 4 codoni diversi. Perch 4? perch in questo modo la terza base di ogni codone, quella al 3', pu cambiare. Una situazione del genere ci permette, per esempio, di descrivere i codoni che codificano per l'alanina come GCN, dove N equivale ad una qualsiasi delle 4 basi: GCA, GCG, GCC, GCU. Cio, mentre le prime due basi rimangono sempre uguali, in terza base ci pu essere una qualsiasi delle quattro. Il risultato che, di fatto, questi quattro aminoacidi sono specificati da due basi: GC nel caso dell'alanina, GG per la glicina, CC per la prolina, AC per la treonina. Per quanto riguarda gli aminoacidi a due basi, in questi casi i loro codoni sono fatti in modo che in terza base ci possano essere entrambe le pirimidine ( il caso della asparagina, cisteina, acido aspartico) o entrambe le purine (acido glutammico) Gli aminoacidi con riconoscimento a 6 basi sono tre, e sono la somma delle due regole: abbiamo un gruppo di 4 codoni dove le prime due basi sono fisse e la terza pu essere una qualsiasi, e un gruppo di due codoni che segue la regola del due, ovvero in terza base ritroviamo o entrambe le purine o entrambe le pirimidine. interessante notare il caso dell'isoleucina, l'unico aminoacido codificato da tre codoni. Sostanzialmente, segue la regola del 4, meno uno. I codoni da cui specificato infatti sono: AUA, AUC, AUU. La base mancante la G, che darebbe origine ad AUG, il codone di inizio e della metionina. Da un punto di vista molecolare, la ragione il fenomeno del vacillamento. Da un punto di vista termodinamico, le basi importanti dal punto di vista energetico per il legame tra l'anticodone del tRNA e il codone dell'mRNA sono le prime due; la terza molto meno. Non significa che la terza base non specifica, ma solo che meno importante dal punto di vista energetico nella stabilizzazione del legame. Le prime due basi si accoppiano sempre in maniera perfetta, e sono quelle che tengono insieme il legame. La terza base serve per specificare meglio la relazione tra codone e anticodone ma dal punto di vista energetico ha meno importanza. Vediamo il caso degli aminoacidi con 4 codoni diversi. Abbiamo visto che nel DNA possono esistere basi anomale, come l'inosina, che una adenina deaminata ossidativamente. L'inosina una sorta di base jolly perch pu accoppiarsi, anche se in modo energeticamente non importante, con tre basi diverse: C, U ed A. Nei casi in cui il codone che si presenta all'anticodone del tRNA contenga una di queste basi, il tRNA potr accoppiarsi con tutti e tre. Considerando che ci vuole un anticodone per G, questo significa che per 4 codoni bastano due anticodoni. Uno con l'inosina in terza posizione che riconosce tre codoni, e uno che riconosce il codone con G in terza base. Gli anticodoni sono meno dei codoni, quindi. I tRNA, invece di essere 61, sono solo 32: c' un risparmio dato dal fatto che l'inosina pu riconoscere tutte le basi possibili meno una. Per esempio, l'isoleucina ha queste tre basi riconosciute dall'inosina. I tre codoni dell'isoleucina vengono riconosciuti da un solo tRNA, quindi. Questo dato dal fatto che il G di legame per l'inosina appena negativo, per cui favorevole all'instaurarsi del legame; non contribuisce molto alla stabilit, ma non destabilizza nemmeno. Nel caso degli aminoacidi a due codoni, l'anticodone sempre uno, perch abbiamo il possibile accoppiamento tra G e U dal punto di vista energetico non d un grosso contributo, ma non destabilizza. Se abbiamo un codone in terza base con C o U, sufficiente un anticodone unico con una G, perch G si

accoppia con C ma anche con U. La stessa cosa vale per le purine, ma nell'anticodone ci sar in questo caso una U, che si accoppia con A e G. Riassumendo, per riconoscere gli aminoacidi codificati da quattro codoni, bastano due anticodoni. Per gli aminoacidi codificati da due codoni ne basta uno solo. Anche per l'isoleucina ne basta uno solo, mentre per gli aminoacidi specificati da 6 codoni ne servono tre: due anticodoni per un gruppo di quattro codoni, e un anticodone per un gruppo da due. I due aminoacidi codificati da un solo codone ovviamente hanno un solo anticodone. In totale, i tRNA sono 32 a fronte di 61 codoni i 3 codoni di stop non dovrebbero avere anticodoni corrispondenti. Introduciamo adesso il concetto di Open Reading Frame. Se abbiamo una sequenza che codifica per una proteina, questa avr un codone di inizio e una serie di triplette, che possiamo contare. Il numero delle triplette corrisponde al numero di aminoacidi della proteina tradotta: data una certa sequenza, prendendo in esame tripletta dopo tripletta, e confrontando ciascuna con il codice genetico, possibile risalire alla sequenza aminoacidica. La sequenza finisce non appena si incontra un codone di stop. Quindi, se avessimo davanti una sequenza di DNA, e volessimo sapere se questa sequenza codifica una proteina, quello che dovremmo fare per prima cosa sarebbe cercare un AUG; da l dovremmo iniziare a contare le triplette fino al codone di stop. In genere, se si trova un numero di triplette inferiore a 50, non si pu parlare di Open Reading Frame, intesa come una sequenza che potr portare realmente alla sintesi di una proteina, perch non esistono proteine cos corte. Il concetto di open reading frame ci serve per capire, data una certa sequenza, se una sequenza apparentemente codificante lo potr essere davvero. Se abbastanza lunga, almeno 50 codoni, abbiamo una potenziale open reading frame, ed possibile, se non probabile, che dia luogo ad una proteina. Nei batteri, le open reading frame sono continue con il DNA, perch l'mRNA una copia pedissequa del DNA: quindi una ORF che ritroviamo in un mRNA esiste anche nel DNA. Negli eucarioti questo non pi vero, in quanto una ORF la troviamo solo nell'mRNA, ovvero un trascritto primario che ha subito lo splicing: nel gene, le open reading frame sono interrotte dagli introni. In un qualsiasi RNA, sia procariotico che eucariotico, l'Open Reading Frame solo una parte (di solito preponderante) della molecola: c' sempre un 5' e un 3' non tradotto. Negli eucarioti, questa parte non tradotta pu anche essere molto lunga. Quindi, l'open reading frame una sequenza centrale che si identifica per la presenza di un AUG iniziale e, dopo almeno 50 codoni, per la presenza di un codone di stop. Se per si prende una sequenza assolutamente casuale, che non ha a che fare con sequenze codificanti, molto improbabile trovare una open reading frame pi lunga di qualche decina di codoni. Prendendo una sequenza a caso, e dividendola in tripletta, statisticamente dovremmo trovare un codone di stop circa una volta ogni 20 triplette. I codoni di stop sarebbero molto comuni in sequenze casuali. Una open reading frame, una sequenza casuale, un qualcosa che si selezionato nel tempo e che si mantenuto. Ha un'entropia molto bassa infatti un open reading frame pu facilmente diventare qualcosa di diverso a causa di mutazioni, che possono introdurre codoni di stop. Questo significa anche che, presa una sequenza a caso, estremamente improbabile che una sequenza casuale sia una open reading frame. Una open reading frame deve fare i conti con le mutazioni. La sequenza della proteina pu subire modificazioni se il gene muta. Un errore di una molecola di mRNA infatti dar origine a qualche proteina non corretta su migliaia, e non vi sono effetti biologici. Se la modificazione avviene a livello del materiale genetico si chiama mutazione. Abbiamo da una parte le cosiddette mutazioni silenti, ovvero avviene una mutazione a livello genotipico, ma a livello fenotipico non c' nessun effetto perch la proteina tradotta identica. Un esempio di mutazione silente lo abbiamo se una tripletta codificante per l'istidina CAC muta in CAU, perch uno degli aminoacidi a due triplette: in terza posizione possono essere presenti entrambe le pirimidine. Molti genomi hanno mutazioni silenti. Una mutazione missenso una mutazione puntiforme che cambia un aminoacido. Per esempio, se, in un codone di un aminoacido codificato da 4 codoni muta uno dei primi due, verr specificato un altro

aminoacido. Un tipo particolare di missenso la mutazione non senso: una mutazione cambia il significato del codone, che diventa un codone di stop. Le mutazioni missenso possono anche essere gravi, si deve prendere in esame caso per caso. Gli aminoacidi cambiano: dipende da dove cambiano e come cambiano. Prima di tutto, si parla di mutazioni conservative e non conservative. Se un aminoacido viene sostituito da uno simile dal punto di vista chimico (es. serina e cisteina), si parla di mutazione conservativa; probabile che queste mutazioni non abbiano grosse influenze sulla struttura delle proteine, ma non detto. Esistono per esempio enzimi in cui la cisteina un aminoacido critico per la catalisi, e cambiandolo con una serina l'enzima non funziona pi. Quelle non conservative solo le mutazioni che tendenzialmente hanno maggiore influenza sulla funzionalit delle proteine, perch anche se avvengono in zone che hanno un'importanza solo strutturale, possibile che questo influenzi la struttura tridimensionale della proteina. Per esempio, se la glicina, che un aminoacido molto piccolo, viene sostituito dal triptofano, voluminoso e idrofobico, si possono avere effetti anche rilevanti. Insomma, non tutte le mutazioni sono effettive: alcune sono silenti, altre conservative. Quelle conservative, solitamente, hanno un'influenza scarsa sul fenotipo. Di recente, si provato a simulare al computer altri codici genetici, per cercare di capire come mai l'evoluzione ha fissato proprio quello che conosciamo: secondo una teoria, probabilmente questo codice genetico ha avuto successo perch pi tamponato verso le mutazioni. La quota di mutazioni conservative con questo codice genetico era maggiore che con altri codici. L'aminoacido cambia, ma spesso cambia in modo che venga sostituito con un aminoacido abbastanza simile. Sembra che l'evoluzione abbia minimizzato il numero di mutazioni negative. Un esempio di mutazione non conservativa offerto da una variante mutata dell'emoglobina: un acido glutammico in posizione 6 nella catena dell'emoglobina ( un aminoacido molto ingombrante, acido, carico positivamente) viene sostituito da una lisina (carica positivamente): questo disturba il legame con l'ossigeno. Altre volte, al posto dell'acido glutammico una mutazione inserisce una valina, un grosso aminoacido apolare; in questo modo si crea una zona fortemente idrofobica: mentre l'acido glutammico esposto sulla superficie della proteina, la valina tende a ritrarsi verso l'interno distorcendo la struttura dell'emoglobina. Altre mutazioni sono quelle che provocano la delezione di una base: se si eliminano basi in maniera non multipla di 3, avremo a valle codoni tutti diversi. La gravit di questa mutazione dipende da dove avviene: se avviene a livello della sequenza codificante per gli ultimi aminoacidi della catena polipeptidica, la proteina potrebbe rimanere funzionale. Ma se la mutazione frameshift avviene all'inizio della sequenza codificante sar impossibile avere una proteina funzionante. Se la delezione di tre basi, verr saltato un aminoacido; di nuovo, la gravit di una mutazione di questo tipo pu essere variabile. Abbiamo parlato del caso pi ovvio: mutazioni puntiformi a livello di una sequenza codificante. Ma il DNA pu mutare dovunque. Se andiamo a vedere la quota del genoma che codifica realmente per proteine una quota ridicola. La stragrande maggioranza delle mutazioni cade da altre parti, non codificante. Le mutazioni che incidono sulle sequenze codificanti avranno un'influenza diretta sulla qualit della proteina prodotta, ma anche mutazioni in zone non codificanti possono avere effetto. certamente vero che gli eucarioti hanno accumulato DNA nell'evoluzione: secondo alcune teorie questo DNA sarebbe comodo per le mutazioni, perch la gran parte di queste avverrebbe in DNA non codificante, e dunque nella maggior parte dei casi non hanno effetto fenotipico. In realt si sta scoprendo che questa massa di DNA non inutile, ma ha delle funzioni. Le mutazioni in alcuni casi possono avvenire in zone regolatorie. La struttura di un gene fatta di esoni e introni se una mutazione avviene a livello di un esone, siamo di nuovo nel caso di una mutazione in una regione di DNA codificante. Ma i geni hanno anche un promotore, che comprende una sequenza abbastanza specifica, la TATA box, come per esempio: TATAAT Se una mutazione puntiforme trasforma una A in una G, probabile che questo abbia una influenza, magari facendo s che il promotore venga riconosciuto con pi difficolt: nell'unit di tempo, verr riconosciuto un numero di volte inferiore dalla RNA polimerasi rispetto al promotore non mutato. La trascrizione del gene, in virt della mutazione, ne risentir. L'effetto fenotipico in questo caso non ricade sulla proteina, che sar

identica, ma sulla quantit di proteine sintetizzate. Un altro punto regolativo che abbiamo visto a livello dello splicing, che avviene perch ci sono delle sequenze alle due estremit degli introni, che guidano il processo. Se la mutazione avviene proprio in una di queste sequenze, probabilmente il meccanismo di splicing ne risentir in termini di precisione: una certa quota di trascritto primario subir uno splicing non corretto. Una classe di malattie nell'uomo sono le talassemie: sono sempre a carico delle globine, ma la malattia non dovuta al fatto che la proteina ha subito una mutazione per cui la proteina leggermente diverse; nelle talassemie, l'emoglobina prodotta normale, ma ne viene prodotta meno. Nel globulo rosso, le catene e di cui composta l'emoglobina sono prodotte in quantit uguali. Se il gene per le catene non viene espresso adeguatamente, nei globuli rossi si accumulano molte catene , disturbando le funzioni del globulo rosso, che trasporta meno ossigeno. Le talassemie sono quindi dovute in parte a mutazioni trascrizionali, cio quelle mutazioni che cadono a livello del promotore: dato che la TATA box centrata a -25 (+1 dove inizia la trascrizione), mutazioni che per esempio colpiscono a livello di -28 o -29 sono mutazioni che interessano la TATA box; in queste, una A muta in una C o una G. Una mutazione in posizione -87 o -88 riguarda una CAAT box, uno degli elementi a monte del promotore. Queste sono tutte mutazioni a carico del promotore: nei geni mutati, l'RNA polimerasi inizia la trascrizione con pi difficolt, i trascritti sono meno abbondanti, e conseguentemente anche la proteine sono meno abbondanti. Le mutazioni + sono mutazioni che portano ad una scarsa produzione di proteine; sono mutazioni che se presenti in forma eterozigote garantiscono una vita praticamente normale, perch lo sbilanciamento non molto grave. Mutazioni che modificano lo splicing vanno a colpire o zone introniche o zone esoniche molto importanti: per esempio, esistono delle mutazioni per sostituzione a livello dell'introne 1 o dell'introne 2, a livello di varie sequenze, alcune delle quali non abbiamo citato. Anche in questo caso, alcune mutazioni sono meno gravi e classificate come +: circa il 20-30% dei trascritti primari subisce uno splicing anomalo, e quindi abbiamo una riduzione del numero di molecole di mRNA correttamente splicingate, e correttamente tradotte. Nel caso di mutazioni a livello delle sequenze pi importanti, che sono le sequenze alle estremit degli introni, abbiamo mutazioni 0: lo splicing cos disturbato dalla mutazione che il trascritto primario non subisce mai uno splicing corretto. L'mRNA proveniente dall'allele pressoch inservibili. Le mutazioni 0 anche in forma eterozigotica sono abbastanza gravi in forma omozigotica non sono praticamente compatibili con la vita. Le mutazioni frameshift e nonsenso riguardano le sequenze codificanti, e portano alla mancata sintesi della proteina; si verificano sui primi aminoacidi (entro i primi 20-30 codoni), in una posizione molto iniziale della proteina, e impediscono la sua corretta sintesi. Queste sono tutte mutazioni 0 perch la proteina non viene prodotta: gli mRNA non sono funzionali, dato che la traduzione tipicamente si blocca precocemente. Di queste mutazioni regolative esistono molti esempi: per esempio, a livello degli oncogeni, cio geni che contribuiscono all'instaurarsi di tumori, che sono dovute anche a mutazioni regolative; altre, puntiformi, cambiando un aminoacido fanno diventare una proteina oncogenica. Mentre a livello del gene avviene solo la trascrizione in RNA, a livello delle proteine possono avvenire numerose modificazioni post traduzionali che tendono ad aumentare enormemente il numero di molecole finali diverse. Noi abbiamo circa 30,000 geni; possiamo pensare che, nell'arco della nostra vita, prima o poi quasi tutti o tutti questi geni verranno espressi. Si avranno, in tempi diversi, circa 30,000 trascritti primari. Per, dato che lo splicing alternativo molto comune, gi gli mRNA saranno molti di pi. Si pu pensare che ci sia almeno il doppio di mRNA maturi, che porteranno alla traduzione di un numero uguale di proteine.

Tuttavia, dopo la traduzione, si ha una vera e propria esplosione di diversificazione dovuta al fatto che le proteine subiscono tante modificazioni post-traduzionali, in modo che il numero di singole molecole diverse tra loro aumenta esponenzialmente. Pensiamo all'insulina, che viene prodotto come singolo polipeptide, e che prima di diventare ormone maturo deve andare incontro ad un taglio proteolitico. Ci che succede che dopo la traduzione abbiamo la proteina inattiva, che poi diventa attiva, con modificazioni post traduzionali. La proteina pu essere localizzata e trasportata verso particolari distretti, subendo diverse modificazioni a seconda del compartimento dove verranno trasportate. Il destino naturale della proteina sar essere degradata ci sono proteine degradate molto velocemente, altre che sono pi stabili. Vedremo meglio le modificazioni post traduzionali nel corso di Biochimica II; adesso vogliamo solo introdurre qualche concetto basilare: proteine di secrezione, di membrana, localizzazione delle proteine nei var distretti cellulari. Le modificazioni post traduzionali possono essere divise in due grandi gruppi: reversibili e irreversibili. L'aggiunta di carboidratici, gruppi isoprenilici, etc. sono esempi di modificazioni irreversibile. La glicosilazione una delle modifiche post traduzionali pi comuni. Un altro esempio di modificazione irreversibile , ovviamente, il taglio proteolitico. La formazione di legami solfuro sono invece parzialmente reversibili: sono importanti per la stabilizzazione della struttura tridimensionale della proteina. Alcune delle modificazioni a livello di singoli aminoacidi, come la fosforilazione, sono tipicamente reversibili; in particolare, la fosforilazione/defosforilazione un comune sistema di attivazione/inattivazione delle proteine. La fosforilazione avviene essenzialmente a livello di tre aminoacidi: serina, la treonina e la tirosina, che hanno tutti un -OH a cui si lega il fosfato. Altre modificazioni che avvengono a livello dei singoli aminoacidi, in generale con funzione regolatoria, sono: metilazione, carbossilazione, acetilazione, adenilazione, etc.

Biochimica - Lezione del 14-05-09 [Prof. Raugei]


Adesso faremo una rapida panoramica sulla secrezione proteica, sulle proteine di membrana e sull'organizzazione della cromatina, per poi affrontare l'organizzazione del genoma. Abbiamo visto che la traduzione l'ultimo momento del trasferimento dell'informazione, ma non l'ultima elaborazione che viene fatta sulle proteine. Il momento della traduzione quello in cui l'intero messaggio presente sulla sequenza codificante dell'mRNA viene tradotto in proteina. La proteina ha quindi, in un primo momento una sua forma iniziale, che per quasi tutte le proteine non corrisponde alla forma definitiva. Per esempio, abbiamo visto che la traduzione comincia praticamente sempre con la metionina, che quindi l'aminoacido N-terminale per tutte le proteine appena tradotte tuttavia, nelle proteine funzionali, quasi mai c' una metionina all'estremit N-terminale. Di solito, la metionina viene tagliata insieme ad altri aminoacidi presenti all'estremit N-terminale. Anche per le proteine che non subiscono altre modificazioni post traduzionali, questo un must o quasi. Molto spesso le proteine subiscono diverse altre modificazioni post traduzionali. La traduzione inizia con l'assemblamento della subunit minore del ribosoma con l'mRNA e il primo tRNA, seguito dall'arrivo della subunit maggiore; si forma il ribosoma, e comincia a scorrere sull'mRNA e parallelamente comincia a fuoriuscire la proteina dalla struttura del ribosoma. La cellula tuttavia, che incredibilmente complessa, organizzata in numerose strutture: per esempio, una di queste strutture la membrana cellulare, che individua un esterno della cellula. Ci sono molte proteine che sono citosoliche: tanti processi del metabolismo avvengono a livello del citoplasma, e gli enzimi che catalizzano questi processi rimangono in questo compartimento. Ma ci sono anche molte proteine di membrana; gran parte delle cellule inoltre

produce proteine di secrezione, che vengono trasportate all'esterno della cellula. Per esempio, nei batteri, la resistenza all'ampicilina si realizza tramite una proteina di secrezione: un enzima che viene immesso nell'ambiente, una -lattamasi che idrolizza l'anello dell'antibiotico aprendolo, e rendendo inattiva la molecola. Nel nostro organismo, pensiamo al fegato, che secerne quasi tutte le proteine del siero: queste sono proteine che vengono indirizzate fuori dalla cellula. Per quanto riguarda le proteine residenti nel citoplasma, abbastanza semplice: la traduzione inizia nel citoplasma, qui va avanti e termina; quando la struttura si smantella, la proteina gi dove deve essere. Per le proteine di secrezione succede una cosa diversa. Le prime porzioni delle proteine che devono essere secrete, in genere i primi 13-40 aminoacidi N-terminali, sono simili tra loro, e sono dette sequenze segnale del reticolo endoplasmatico. In altre parola, questa parte della proteina quella che viene subito esposta fuori dal ribosoma iniziata la sintesi; segnala il reclutamento del macchinario di traduzione sul reticolo endoplasmatico. Il RER, reticolo endoplasmatico ruvido, si chiama cos perch vi aderiscono i ribosomi; questi sono l perch stanno producendo una proteina che ha un peptide segnale. I ribosomi normalmente sono liberi nel citoplasma: aderiscono al RER nel momento in cui iniziano a tradurre una proteina che presenti questo peptide segnale, che viene riconosciuto e media il trasferimento della struttura a livello della membrana del RER. Le caratteristiche della sequenza segnale lo rendono facile da riconoscere: in genere ha 1-2 aminoacidi Nterminali a carica positiva (es. arginina) subito all'inizio, seguiti da una catena ricca di residui idrofobici (leucina, alanina, etc.). Dopo questa catena idrofobica, inizia la parte specifica della proteina. Si chiama peptide segnale perch, proprio per le sue caratteristiche, viene riconosciuto da un particolare meccanismo che illustra un altro esempio di collaborazione tra RNA e proteine. La particella responsabile del riconoscimento si chiama SRP, Signal Recognition Particle particella di riconoscimento del segnale. piuttosto complessa: vi sono sei proteine e un RNA 7 S, il cui ruolo non chiaro. Il ruolo di SRP riconoscere il peptide segnale, e legarsi alla Docking Protein; quest'ultima funge da proteina di attracco sulla superficie del RER per la SRP. Quindi la SRP riconosce il peptide segnale, e a sua volta si lega alla Docking Protein (o recettore dell'SRP), facendo s che il ribosoma venga reclutato sulla superficie del reticolo endoplasmatico. La proteina che viene via via sintetizzata viene inserita nel lume del RER; la sintesi va avanti regolarmente fino al codone di stop. La proteina sintetizzata quindi non sar pi nel citoplasma, ma nel lume del RER. Una delle prime cose che succedono che il peptide segnale viene tagliato da una specifica endopeptidasi, per cui le proteine mature non hanno mai il peptide segnale; infatti il peptide segnale una sequenza di cui stata scoperta l'esistenza piuttosto tardi: per molto tempo si sono studiate solo le proteine mature; il peptide segnale una entit presente per pochissimo tempo, tra l'inizio e la fine della traduzione, per cui non purificabile. La sua esistenza stata dimostrata con il sequenziamento dei geni e dei mRNA: per molte proteine si era visto che, oltre alla sequenza presente nella proteina, prima vi era una sequenza codificante che non risultava nella proteina matura. Sull'mRNA quindi si pu vedere la sequenza totale della proteina, indipendentemente dalle sue modifiche post traduzionali. A questo punto la proteina uscita dal citoplasma quasi come se fosse gi fuori della cellula. In virt di questo peptide segnale di indirizzamento al reticolo endoplasmatico, la proteina nascente viene riconosciuta dalla particella ribonucleoproteica che riconosce tutti i peptidi segnale, i quali, sebbene leggermente diversi, hanno una struttura sufficientemente simile per essere riconosciuti dalla SRP che la ancora a livello della membrana del RER. Per mezzo di vescicole, il materiale del RER passa al Golgi, e sempre per vescicolazione abbiamo passaggio di materiale dal Golgi cis al Golgi trans, e infine il materiale si fonde con la membrana plasmatica. In ognuno di questi passaggi la proteina potr subire delle modifiche, la pi comune delle quali la glicosilazione, che avviene esclusivamente all'interno di questi compartimenti. Questo significa che le proteine citoplasmatiche, in condizioni normali, non sono glicosilate. Ci sono vescicole secretorie di vari tipi. Ci sono quelle costitutive, in cui viene prodotta una vescicola per essere subito esportata; la vescicola procede direttamente verso la superficie della cellula. Ci sono vescicole secretorie regolate ( il caso di neuropeptidi e diversi tipi di ormoni) che vengono accumulate e secrete solo in dipendenza di un segnale che induce la secrezione: il caso per esempio di ormoni che vengono prodotti, accumlati, e secreti solo quando ce n' bisogno.

L'altro argomento interessante da vedere sono le proteine di membrana: possiamo considerarle come proteine di secrezione che hanno fallito la secrezione. Nel processo di trasferimento della proteina all'interno del reticolo endoplasmatico la proteina rimane intrappolata all'interno del doppio strato fosfolipidico. Proteine di questo tipo hanno sequenze segnale, per cui vengono indirizzate al RER, ma poi all'interno della loro sequenza hanno un'ulteriore sequenza detta sequenza di arresto del trasferimento; questa una sequenza molto conservata di una ventina di aminoacidi, essenzialmente idrofobici, che formano un'-elica. Questa una struttura perfetta per incastrarsi nel doppio strato fosfolipidico, che ha uno spessore pari alla lunghezza -elica di 20 aminoacidi. questa la struttura che ancora le proteine di membrana al doppio strato fosfolipidico. Ad un certo momento del passaggio della proteina attraverso la membrana del RER il passaggio si blocca e la sintesi della proteina continua all'esterno, sulla faccia citoplasmatica del RER. Se il segnale di arresto vicino all'estremit N-terminale, la parte pi abbondante della proteina sar sulla faccia citoplasmatica; se centrale, le due porzioni della proteina (fuori o dentro il lume del RER) saranno comparabili; se vicino all'estremit C-terminale, sar la porzione non citosolico ad essere prevalente. Ovviamente, se non c' segnale di arresto, avremo una proteina di secrezione, perch il trasferimento nel lume sar completo. Il peptide segnale indirizza il ribosoma sul reticolo endoplasmatico; la sequenza di arresto fa s che la proteina venga fissata al doppio strato lipidico; la sintesi pu poi continuare. Infine, avremo che una parte della proteina rimarr nel lume del RER, un'altra parte sulla faccia citosolica. Per vescicolazioni successive, dal RER si passa alla superficie della cellula, la vescicola si apre, si fonde sulla membrana citoplasmatica, e la parte citoplasmatica rimane sempre nel citoplasma; la parte che era nel lume del RER viene a trovarsi all'esterno, esposta sulla superficie della cellula. Questo avviene per molte proteine di membrana. Essendo il doppio strato una sorta di fluido, queste proteine possono muoversi sulla superficie della cellula, pur mantenendo sempre la zona idrofobica intrappolata nello spessore del doppio strato fosfolipidico. osservazione comune che, andando ad analizzare una proteina di membrana con una faccia citoplasmatica e una faccia extracitoplasmatica di misure diverse, eventuali glicosilazioni si trovano solo sulla faccia extracitoplasmatica, che era interna al lume del RER e del Golgi, e che stata quindi modificata. La faccia citoplasmatica non pu subire modificazioni. Per esempio, le immunoglobuline sono glicosilate sulla faccia esterna. La faccenda sarebbe molto pi complessa, perch, se tutto andasse come abbiamo descritto noi, tutte le proteine di membrana dovrebbero avere l'N-terminale all'esterno e C-terminale all'interno della cellula. Per molte proteine di membrana cos, ma ci sono anche sistemi pi complessi che portano a risultati diversi. In generale, c'entrano sempre peptidi segnale e sequenze di arresto. Molte proteine poi, con un altro meccanismo ben conosciuto, possono avere domini transmembrana multipli, fino a 7. Tutti questi meccanismi sono essenzialmente evoluzioni dello schema che abbiamo appena visto. Le cellule hanno molti compartimenti dove le proteine vengono indirizzate. Uno dei compartimenti pi interessanti il nucleo. Le proteine vengono prodotte a livello del citoplasma, tuttavia nel nucleo presente una quantit enorme di proteine: gli istoni, una quantit di proteine regolatorie, etc. Come pu una proteina essere trasportata al nucleo? In questo caso, le proteine al loro interno hanno hanno una sequenza detta NLS (Nuclear Localization Sequence) che una sequenza tra i 7 e i 9 aminoacidi, con aminoacidi basici e carichi positivamente; una sequenza interna alla proteina, non viene tagliata via come una sequenza segnale; rimane all'interno della proteina, e viene riconosciuta da un'altra proteina citoplasmatica, l'importina, che lega questa sequenza e media il trasferimento della proteina attraverso i pori nucleari verso il nucleo. Quindi, le proteine del nucleo vengono prodotte come proteine citoplasmatiche; queste espongono la NLS basica (il fatto che sia basica garantisce che sia esposta sulla superficie della proteina) per il legame con l'importina. importante il fatto che questo segnale rimanga nella proteina. Per esempio, quando durante la divisione cellulare il nucleo viene smantellato, le proteine nucleari vengono disperse; quando il nucleo si riforma, importante che le proteine nucleari abbiano ancora la loro sequenza NLS per poter essere prontamente reimportate al nucleo neoformato.

Quindi, la sequenza di localizzazione al nucleo una breve sequenza di circa 9 aminoacidi che si trova all'interno della proteina, e questa sufficiente per garantire l'importazione nel nucleo. Proteine modificate biotecnologicamente nelle quali stata inserita una sequenza di questo tipo vengono importate nel nucleo. Per quanto riguarda i mitocondri, nonostante il fatto che abbiano un genoma produttivo, le proteine prodotte nel mitocondrio e che vi rimangono sono poche; il mitocondrio ha bisogno di molte proteine codificate dal genoma della cellula. Anche queste proteine devono quindi avere un sistema che le indirizza al mitocondrio. Questo sistema relativamente simile al sistema che abbiamo visto per il reticolo endoplasmatico; c' un peptide segnale che serve alla proteina per superare la membrana esterna del mitocondrio, e un secondo che serve per superare la membrana interna, che delimita la matrice mitocondriale; ci sono due peptidi segnale, uno di seguito all'altro, che indirizzano la proteina all'interno del mitocondrio, o facendogli superare solo la prima membrana o entrambe. Adesso vediamo a grandi linee la struttura della cromatina. Il DNA si complessa a formare nucleosomi con l'ottamero, e che aggregandosi forma la fibra di cromatina di 30 nm. Questo un tipo di struttura molto importante, che ha anche un ruolo funzionale. Questa fibra di 30 nm non libera nel nucleo, ma strettamente legata a delle proteine scaffold (impalcatura); si formano delle anse che sono i domin topologici chiusi di cui parlavamo. Il DNA non quindi libero nella cromatina, ma strettamente legato ci sono delle cosiddette Scaffold Associated Region, regioni particolari del DNA non importanti dal punto di vista genico ma importanti per il legame che contraggono con le proteine scaffold. Quando il DNA viene duplicato, questa struttura deve essere smantellata non tutto insieme, ma deve, un po' per volta, essere aperto nella sua forma di DNA nudo: solo in questa forma infatti che gli enzimi che operano con il DNA possono eseguire i loro compiti (es. aprire la forcella di replicazione). Nel momento della duplicazione quindi il DNA deve essere, prima o poi, tutto in forma nuda. Tuttavia, in una cellula che non si duplica (la condizione largamente pi comune) siamo in una situazione in cui la cromatina mediamente addensata (la struttura ad anse che abbiamo visto), e i geni che vengono attivati non hanno bisogno di smantellare questa struttura. All'interno di un'ansa possono trovare posto decine o centinaia di geni, quindi per la trascrizione sufficiente smantellare la struttura nucleosomica a livello dell'ansa contenente i geni che devono essere trascritti. Quindi, il fatto che la fibra di 30 nm possa decondensarsi fino a DNA nudo un discorso che vale ansa per ansa; non dobbiamo pensarlo come un fenomeno che avviene a livello dell'intero DNA. Questo fenomeno riguarda solo le zone di DNA che vengono trascritte. Un DNA nella conformazione a 30 nm non un DNA che viene attivamente trascritto; per la trascrizione necessario lo smantellamento della struttura nucleosomica, che un evento regolativo molto importante per l'attivazione di un gene. Tutto questo per avviene a livello di zone molto limitate. La struttura a 30 nm di certe anse pu essere smantellata, mentre le anse limitrofe rimangono intatte. Si pu pensare che, dato che in una cellula solo una certa quota dei geni presenti nella cellula vengono trascritti, la maggior parte del DNA rimanga sempre in questa forma addensata e solo transientemente questa struttura si apra per permettere la trascrizione. Questo il confine tra eucromatina ed eterocromatina. L'eucromatina rappresenta zone di DNA che sono trascritte o che potranno essere trascritte; l'eterocromatina rappresenta zone di DNA non trascritte (es. corpo di Barr) e molto addensate. I nucleosomi sono composti da istoni, proteine basiche, e per questa caratteristica naturalmente affini al DNA, acido in virt dei fosfati. Hanno delle strutture N-terminali che formano il rocchetto attorno al quale si si avvolge il DNA, ma che soprattutto presentano delle zone pi esterne, delle teste ricche di lisine, aminoacidi basici cariche positivamente che si attaccano al DNA rendendo pi stretta l'interazione tra DNA e istoni. La presenza di lisina in queste zone crea legami di tipo elettrostatico molto robusto, e in questa conformazione le proteine istoniche sono fortemente legate al DNA. Pu succedere per che queste lisine subiscano una modificazione post traduzionale che l'acetilazione. La lisina ha una catena alifatico arricchita alla sua estremit da un -NH2, carico positivamente al pH fisiologico. Se per subisce l'aggiunta di un acetile, formando un legame tra un carbonio della catena e il

carbonio carbossilico dell'acetile, la carica viene annullata. Questo fa s che venga persa la carica positiva che era maggiormente responsabile dell'interazione con il DNA. Il legame tra istoni e DNA che prima era molto robusto, se viene eliminata la carica positiva, diventa molto pi debole. L'acetilazione il segnale principale che porta allo smantellamento della struttura nucleosomica. Quindi, se necessario che i geni contenuti in una particolare ansa vengano trascritti, necessario prima di tutto smantellare la struttura nucleosomica, andando ad acetilare gli istoni presenti a livello dell'ansa. A livello dell'ansa si ha uno smantellamento della struttura a 30 nm, fino ad arrivare al completo rilascio da parte degli istoni della doppia elica nuda. Nella cellula esistono delle attivit enzimatiche contrapposte: da una parte abbiamo gli enzimi HAT (Histone Acetyl Transferase), enzimi che acetilano le lisine all'Nterminale degli istoni, annullandone le cariche positive e riducendo di molto l'affinit degli istoni per il DNA e portando allo smantellamento della struttura nucleosomica. Questo meccanismo revertito da enzimi detti HDAC (Histone DeACetylase) che deacetilano le lisine acetilate restaurando la carica positiva; automaticamente queste si riappropriano della loro affinit per il DNA e si riforma la struttura nucleosomica a livello dell'ansa. Anche in questo caso, lo scopo del corso non dare un'informazione esaustiva su questi fenomeni ma di dare un'idea della complessit della regolazione della trascrizione. Come abbiamo visto, non basta la regolazione a livello del promotore; servono anche segnali che permettano alla fibra da 30 nm di liberarsi degli istoni, e tutto questo avviene in zone ben precise del cromosoma e questo reso possibile dall'esistenza delle anse. Esistono delle zone di cromosoma fisicamente separate le une dalle altre perch formano anse ancorate alle proteine stesse. Gli istoni possono essere modificati in molte altre maniere, e queste sono tutte modificazioni che rendono pi difficile la formazione degli ottameri. Vediamo adesso la struttura del genoma. Cosa c' nel nostro genoma? Ci sono dei dati riguardo al DNA che lasciano un po' perplessi. Il concetto di complessit dell'organismo non molto scientifico, n misurabile, ma intuitivo. Possiamo affermare che un batterio meno complesso di un lievito (organismo eucariotico), e che questo a sua volta meno complesso di un organismo pluricellulare come un mammifero. Verosimilmente il numero di geni che deve avere, rispettivamente, un batterio, un lievito e un mammifero devono essere diversi, uno maggiore dell'altro. Per cui non sorprendente sapere che abbiamo pi geni di un batterio o di un lievito. Allora, estendo il concetto, non sorprendente sapere che abbiamo pi DNA di un batterio o di un lievito. Il paradosso del valore C noto fin dagli anni '60. Il valore C il contenuto di DNA, la taglia del genoma. Confrontando il contenuto di DNA delle cellule si possono avere delle sorprese. Alcuni batteri hanno pochissimo DNA: tra 106 e 107 basi. Pu essere sorprendente che vi possa essere un ordine di grandezza di diversit a seconda delle specie, ma, grossolanamente, si pu affermare che abbiano poco DNA. Per gli organismi superiori diploidi si considera il genoma aploide. Il DNA aumenta regolarmente attraverso funghi, alghe, lieviti, etc. In animali e piante la situazione diversa. Tutti i mammiferi hanno, all'incirca, la stessa quantit di genoma aploide, circa 3 109. Tuttavia, per rettili e anfibi, il range di quantit di DNA si muove su due ordini di grandezza: alcuni rettili hanno una quantit di DNA leggermente inferiore alla nostra, ma altri ne hanno una quantit 10, a volte anche 50 volte superiore alla nostra: si arriva quasi fino a 10 11. Le piante con fiori il range di quantit di DNA spazia su tre ordini di grandezza: alcune piante hanno pochissimo DNA, altre un'enormit, addirittura 1011, cio pi di 100 volte quello che abbiamo noi. Il pesce palla ha un genoma eccezionalmente piccolo: 10 volte pi piccolo del nostro. Nel panorama dei pesci un caso eccezionale. La quantit di DNA quindi c'entra poco con la complessit dell'organismo: avere una quantit maggiore di DNA non implica avere pi informazione. La quantit di DNA non proporzionale alla quantit di informazione. Dunque, molto DNA non ha prerogative informazionali. Una notizia pi moderna rispetto alla quantit di DNA il numero di geni. I geni umani sono circa 30,000, per la precisione un po' meno. La quantit di geni in effetti abbastanza correlata con la complessit di un

organismo, ma la differenza tra specie diverse molto meno di quella che intuitivamente ci si potrebbe aspettare. Un rospo ha un numero di geni appena inferiore al nostro. Il C. elegans un verme di un millimetro di lunghezza, molto utilizzato in laboratorio perch semplice da coltivare, composto esattamente di 72 cellule (tra cui un neurone!) - stato importante nell'embriologia. Questo vermetto ha un numero di geni comparabile al nostro: circa la met. Drosophila melanogaster, il moscerino della frutta, ha un po' meno geni di questo. La quantit di DNA invece qualcosa di totalmente scorrelato: per esempio, in C. elegans, la quantit di DNA molto minore della nostra: ha circa 50 volte meno DNA di noi, avendo solo la met dei geni. Questo ci dice che il numero di geni non correlato alla quantit di DNA: il DNA pu aumentare moltissimo mentre il numero di geni rimane costante. Ci pu essere molto DNA non genico, e le differenze di quantit di DNA tra le varie specie sono dovute soprattutto a sequenze di DNA non geniche. Nel nostro caso, i geni sono dispersi nel genoma, molto distanti tra loro. Drosophila melanogaster ha la met dei nostri geni ma molto meno DNA: i geni sono pi vicini tra loro. Le zone intergeniche di C. elegans sono ancora pi ridotte. Nei batteri le sequenze non codificanti sono al minimo: il DNA genico il 50% del genoma. In alcuni virus ci sono geni sovrapposti: sfruttando la stessa sequenza di DNA con differenti schemi di lettura producono due proteine diverse. In ogni organismo durante l'evoluzione si instaura un equilibrio tra accumulo di DNA e perdita di DNA. In alcune specie, questo equilibrio sbilanciato verso l'accumulo, per cui, fermo restando il numero di geni, c' stato un accumulo di DNA non genico, senza mai perdita. In altre specie, come per esempio il pesce palla, c' stato un equilibrio meno teso verso l'accumulo, per cui nella sua evoluzione non ha accumulato molto DNA. La nostra una situazione intermedia: abbiamo accumulato DNA, ma non tanto quanto alcuni anfibi o rettili. Nei batteri invece l'equilibrio spostato verso la perdita: i genomi batteri contengono solo i geni strettamente necessari. Apparentemente, l'accumulo eccessivo di DNA sembrerebbe un processo svantaggioso (basta pensare al costo, in termini di risorse, di un processo come la duplicazione del DNA). L'altra cosa interessante che emerge dallo studio dei genomi che questi sono abbastanza simili tra loro, ed in effetti si pu parlare di geni ortologhi: un gene ortologo un gene corrispondente in un altro organismo. Per esempio, noi abbiamo le globine, ma anche il topo avr le sue globine e sono molto simili. Questi sono geni ortologhi, sono geni riconoscibili come geni che si sono evoluti da un gene ancestrale comune (es. prima della diversificazione tra uomo e topo). Per alcuni geni questo rapporto pi ovvio, per altri geni meno perch la diversificazione stata maggiore. Un certo gene pu avere dei geni fratelli all'interno dello stesso genoma? I geni paraloghi sono geni dello stesso organismo che differiscono lievemente. probabile che i geni paraloghi si siano originati da un unico gene, che per duplicazione genica si moltiplicato, e poi i varii geni si sono evoluti indipendentemente accumulando lievi differenze. Alcuni geni paraloghi che presentano differenze rilevanti potrebbero anche essere frutto di una evoluzione convergente: un altro gene che casualmente ha evoluto una struttura molecolare simile ad un altro. Per esempio, le immunoglobuline hanno una struttura molecolare ad anse tenuta insieme da legami insolubili. Moltissimi recettori hanno una struttura simile, che viene chiamata appunto Ig-like (ImmunoGlobuline like); in alcuni casi si tratta proprio di immunoglobuline; in altri casi la somiglianza vaga e c' la possibilit che si tratti di una evoluzione convergente. Riassumendo: i geni ortologhi sono geni simili in organismi diversi; i geni paraloghi sono geni simili all'interno del nostro organismo; in entrambi i casi si pu dire che c'era un gene ancestrale comune, ma, nel caso degli ortologhi, il gene era in un organismo anch'esso ancestrale comune; nel caso dei paraloghi, si sono evoluti due geni simili per duplicazione genica.

Biochimica 18-05-09 [Prof. Raugei]

La lezione oggi riguarder la struttura del nostro genoma. Molto di quello che diremo valido per la maggior parte dei mammiferi e per molti animali. La struttura del genoma in linea generale sempre di questo tipo che vedremo; cambiano solo le percentuali. Queste percentuali non sono esatte, con il procedere delle scoperte possono cambiare, ma non di molto. Nel momento in cui abbiamo avuto a disposizione l'intera sequenza del nostro genoma, abbiamo potuto analizzarlo. Ci sono 24 sequenze, lunghe milioni di basi cio, pari alla lunghezza dei vari cromosomi il loro numero 24 considerando 22 autosomi e 2 cromosomi sessuali. Queste 24 sequenze in totale danno la sequenza del nostro genoma. Il sequenziamento del genoma stato completato nel 2000; questo per stato solo l'inizio del lavoro. Sapere la sequenza non serve a molto di per s: come conoscere tutte le lettere scritte in un libro, ma non avere idea di che lingua si tratti. C' quindi bisogno di interpretare il genoma: cercare di capire quali sono le unit funzionali, i geni. Dove stanno i geni? Quanti sono? La prima classificazione che si pu fare individuare il DNA genico, ovvero tutto ci che si pu riferire a quelli che noi abbiamo sempre inteso come geni. Si tratta dei classici geni che dopo lo splicing producono un mRNA che codifica per una proteina. Questo assolutamente lo schema pi classico, ma non l'unico. Tutto il DNA che si pu riferire a questi geni classici intorno al 25%. In realt, di questo 25%, i veri geni, che producono proteine, costituiscono il 10-15%. Considerando l'importanza dello splicing dal punto di vista quantitativo, si pu dire che di questi geni, tra il trascritto primario (la copia del gene strutturale) e l'mRNA ne viene eliminata la gran parte (in media il 70-80%) - la quota del nostro genoma di materiale genetico che realmente contiene il messaggio di codifica per proteine un 20-30% di un 15%: siamo a delle quote minimali. Tutto il resto qualcos'altro. Anche all'interno di questo 25% ci sono poi geni particolari (per esempio, quelli degli istoni) e poi dei geni che non producono proteine, come i geni per i tRNA, gli rRNA, gli snRNA, etc. Un'altra classe molto importante quella degli pseudogeni: gli pseudogeni derivano da geni normali, ma non sono pi funzionali. Nel genoma di quasi tutti gli organismi eucariotici il genoma aumenta di quantit, essenzialmente per fenomeni di duplicazione genica, ma difficilmente diminuisce. Per cui esistono entrambi i fenomeni di aumento e di diminuzione del DNA, ma il primo nettamente preponderante sul secondo. Possiamo affermare che noi, oggi, abbiamo pi DNA dei nostri antenati, e verosimilmente ne abbiamo meno di quanto ne avranno dei nostri pronipoti, dato che il DNA tendenzialmente aumenta, essendo l'accumulo preponderante sulla perdita. Un altro 75% del genoma, la parte preponderante, DNA che non ha apparentemente valore genico, e di cui sappiamo ben poco. Sappiamo come funziona, ma non a cosa serve. Si tratta di DNA detto ripetitivo: sequenze di DNA che si ripetono molte volte nel genoma: c' il DNA moderatamente ripetitivo (corrisponde essenzialmente ai trasposoni), altamente ripetitivo (detto anche DNA satellite). Infine, c' una certa quantit di DNA (il 25% di questo 75%), che tende a diminuire, e che non classificabile: sequenze che non sono assimilabili a sequenze ripetute. La differenza in termini di quantit di genoma che si riscontra negli organismi dovuta a DNA che non ha valore genico. Il numero di geni molto simile tra gli animali: tra i 20,000 e i 30,000 geni; ci che pu cambiare in maniera anche rilevante il DNA non genico, o di tipo ripetitivo, o del tipo senza specificazione. In altre parole, ci che cambia tra gli organismi la percentuale del genoma che rappresenta il DNA genico, perch alcuni organismi hanno molto pi DNA non genico di noi. Molti ricercatori si sono stupidi del nostro basso numero di geni. Inizialmente, si pensava che i geni fossero centinaia di migliaia, poi le stime sono scese sempre di pi, e oggi si ritiene verosimile che il numero di geni sia intorno ai 27-30,000. Si conoscono gran parte dei geni, e sono pochi, e poco diversi rispetto a quelli degli altri animali. sorprendente pensare che abbiamo solamente il doppio dei geni del C. elegans, un organismo semplicissimo, a malapena visibile a occhio nudo. La chiave di questo fatto sta probabilmente in questo ragionamento: non dobbiamo pensare ad un gene come ad una sequenza la cui unica funzione sia

l'espressione genica. Un gene ha due funzioni: o funziona o non funziona. Questo significa che in un organismo ipotetico composto da due geni non c' la possibilit di esprimere solo due informazioni (o funziona uno o funzionano tutti e due), ma quattro: (1) il primo gene funziona, il secondo no; (2) il primo gene funziona, il secondo anche; (3) il primo gene non funziona, il secondo s; (4) nessuno dei due geni funziona. Ci sono almeno quattro possibilit diverse, perch poi ci sono anche vari livelli di regolazione dell'espressione, e questo aumenta enormemente la capacit di espressione di informazione da parte di un genoma. Spesso i prodotti di geni diversi funzionano in collaborazione. Inoltre, pensiamo alle modificazioni post-traduzionali, allo splicing alternativo, etc. Insomma, un repertorio apparentemente limitato di geni contiene molta pi informazione rispetto al numero di geni. Andiamo adesso ad esaminare pi da vicino il 25% di DNA genico. Non parleremo dei geni singoli: abbiamo gi visto che hanno il loro promotore, pi o meno complesso, comprendono il gene strutturale, producono mRNA, etc. Gran parte dei nostri 27,000 geni sono geni singoli, di questo tipo: esistono in una copia sola nel nostro genoma, hanno una funzione ben precisa, etc. Ci sono poi i cosiddetti cluster, e questo pu farci intuire cosa pu essere successo durante l'evoluzione. La parola cluster significa raggruppamento. I cluster possono essere geni particolari, come il cluster delle globine, uno dei pi studiati. Noi abbiamo diversi geni nell'ambito delle globine, leggermente diversi tra loro. Cosa significa questo? Verosimilmente, un nostro progenitore, ancora prima della divisione tra le varie specie di mammiferi, doveva avere un solo gene di globine, che nel tempo ha subito duplicazioni geniche. C' una maniera abbastanza facile per spiegare come possono avvenire duplicazioni geniche, anche se non detto che tutte siano avvenute in questo modo comunque, uno dei meccanismi per i quali il DNA pu aumentare di quantit pu avvenire a livello della meiosi. Questo l'unico momento della vita di un organismo in cui il DNA subisce delle rotture e dei ricongiungimenti lo splicing infatti avviene a livello dell'RNA. Quello della replicazione meiotica l'unico momento in cui il DNA viene tagliato e ricombinato. Normalmente si ricombinano frammenti corrispondenti di cromosomi fratelli. Nella mitosi si ha una semplice replicazione del DNA, e in situazioni normali i cromosomi non si scambiano materiale genetico. Nel crossing over, che avviene nella meiosi, avviene invece scambio di materiale genetico. In teoria, non dovrebbe andar perso niente: il DNA si dovrebbe ritrovare, anche se ricombinato, nei cromosomi dopo il crossing over. A volte per pu succedere, e si capito anche come, che vi sia un errore. A volte l'appaiamento, che in un crossing over normale avviene tra parti di DNA simili (alleli, varianti una zona di DNA si appaia con quella corrispondente), avviene in modo non corretto. Ci sono sequenze che confondono il crossing over, come le sequenze ripetute; queste tendono a creare le condizioni perch si verifichino errori nel crossing over. Alla fine, si ha uno scambio ineguale di frammenti, per cui un cromosoma ha mantenuto il proprio frammento e ha acquisito anche l'altro, mentre l'altro cromosoma non ha acquisito niente. La somma di DNA sempre uguale; tuttavia, se all'interno delle sequenze che sono passate allo stesso cromosoma vi era un gene, questo pu spiegare il fenomeno della duplicazione genica. Questo meccanismo pu giustificare la creazione di strutture in cui geni simili sono vicini tra loro: queste sono probabilmente dovute a fenomeni di duplicazione genica. Una volta che abbiamo avuto la duplicazione genica, gli organismi che hanno due geni duplicati in genere non sono svantaggiati: semplicemente, un organismo ha una dose doppia del gene su quel cromosoma. A questo punto i due geni muteranno in maniera indipendente e casuale nell'arco delle generazioni. Per questo motivo i geni che ritroviamo adesso sono leggermente diversi tra loro. L'evoluzione ha poi sfruttato questa diversificazioni: globine diverse hanno ora funzioni diverse. Per esempio, la globina costituisce l'emoglobina fetale, pi affine all'ossigeno e dunque molto utile al feto per strappare l'ossigeno ai globuli rossi materni. Oggi, grazie alla diversit delle globine, il nostro sistema di trasporto dell'ossigeno pi versatile. I cluster si conoscono abbastanza bene. L'origine degli pseudogeni la stessa, ma il crossing over ineguale invece di generare due geni completi ne ha generato uno incompleto, a cui manca un pezzo, ad esempio il promotore. Abbiamo quindi una duplicazione genica in cui uno dei geni incompleto e non funziona. Lo pseudogene una sequenza, che, di fatto, non serve a niente, non espressa. un gene inutile, insomma, che come gli altri geni subisce mutazioni, ma, a differenza di quanto accade per i geni normali, non vengono selezionate. Mentre un gene normale, se subisce una mutazione negativa, tender a sfavorire la selezione dell'organismo che lo contiene,

e il gene mutato prima o poi sparir, uno pseudogene pu accumulare molte mutazioni. Gli pseudogeni si riconoscono perch, tipicamente, ricordano i geni normali, ma in cui si trovano mutazioni nonsense e frameshift, che lo rendono abbastanza diverso da quello originale, ma facilmente riconoscibile. La cosa interessante notare come il gene non viene eliminato, ma solo accumulato. Questi sono tutti meccanismi con cui il DNA si accumula nel genoma. I geni delle globine inoltre sono rimarchevoli in quanto hanno introni eccezionalmente piccoli l'mRNA codificante circa il 50%. Quello che abbiamo descritto solo un tipo di pseudogene. Per questo meccanismo, ci aspettiamo che gli pseudogeni da crossing over ineguale siano nelle vicinanze del gene da cui si sono duplicati: questa una ulteriore conferma del meccanismo con cui questa duplicazione avvenuta. Tuttavia, questo non sempre vero: a volte ci possono essere dei salti da un cromosoma all'altro. Il DNA una molecola che mantiene la memoria del passato: il nostro DNA ha centinaia di migliaia di anni, milioni di anni in quanto mammiferi. Se il DNA accumula e non dimentica niente, dobbiamo pensare che anche meccanismi e processi estremamente improbabili siano potuti avvenire, e adesso sono registrati nel genoma. In una scala temporale cos vasta, non dobbiamo stupirci se anche eventi con una probabilit infinitesimale di avvenire sono avvenuti. Un altro tipo di pseudogene si origina con un meccanismo singolare. Non ci aspetteremmo di trovare nel genoma qualcosa che somiglia a un mRNA: un gene che ha perduto gli introni. Invece, esistono delle sequenze che ricordano davvero da vicino un mRNA, in quanto la sequenza codificante addirittura seguita da una coda di poliA. Deve essere stata una molecola di mRNA, trasformata in DNA a doppio filamento, che si integrata nel genoma. Siccome i trasposoni si duplicano attraverso un intermedio a RNA, possibile che il meccanismo di retrotrascrizione in DNA e integrazione per sbaglio abbia preso di mira una mRNA qualsiasi, che stato erroneamente retrotrascritto e integrato nel DNA. stato una sorta di rarissimo incidente, ma in una scala temporale enorme c' sempre la possibilit che accada. Dove ci aspettiamo di trovare questi pseudogeni? Ovviamente lontani dal gene originale; si pu pensare che questo gene abbia prodotto il suo mRNA, portato a livello del citoplasma, dove accaduto un incidente di retrotrascrizione, e poi il frammento stato integrato a caso nel genoma. Questi sono detti pseudogeni da retrotrascrizione, e solitamente si trovano su cromosomi diversi rispetto al cromosoma che contiene gene di provenienza. Possiamo riconoscere i geni di provenienza perch la loro sequenza codificante ancora relativamente simile a quella dello pseudogene. Sempre restando all'interno di quel 25% di DNA genico, ovvero quella parte del genoma che pu essere messo in relazione a geni probabilmente questo pu essere messo in relazione a adesso pi chiaro: geni singoli, geni presenti in varie copie perch sono dei cluster, pseudogeni, etc.: tutti elementi che sono riferibili a un gene. C' un altro tipo di gene che illustrato dall'esempio degli istoni, proteine che dobbiamo considerare, per varii motivi, molto particolari. Per esempio, i loro geni non hanno introni; i loro mRNA sono tra i pochi a non avere una coda di poliA, etc. Nonostante queste particolarit, sono geni che vengono trascritti e tradotti in proteine. Una caratteristica degli introni che sono ripetuti nel genoma: non sono a copia singola. Anche i geni istonici sono riuniti in cluster. Questa struttura una sorta di pacchetto che produce per gli istoni dell'ottamero pi l'istone H1; nell'uomo ripetuta circa 30-40 volte. In altri organismi questo numero pu variare, arrivando a ripetizioni di 100 o 300 volte. Anche i geni per gli rRNA e i tRNA sono ripetuti molti volti. Si pensa che, dato che si tratta di geni importantissimi, bene che ce ne siano molte copie, in modo che se una copia subisce delle mutazioni, ce ne sono altre di backup. L'evoluzione di questi geni infatti lentissima: anche tra organismi filogeneticamente lontani, le differenze sono minime. probabile che siano proteine che sono state inventate molto presto nell'evoluzione, per poi rimanere molto simili tra loro verosimilmente funzionano al meglio nello stato attuale, coscch ogni ulteriore cambiamento solo peggiorativo. Alcuni geni quindi trovano la loro particolarit nel fatto di essere ripetuti decine di volte nel nostro genoma. Tuttavia, attenzione a non confondere questi geni con le sequenze ripetute: questi sono geni ripetuti in tandem poche decine di volte. Tutto ci di cui abbiamo parlato finora quindi il 25% di DNA riferibile ai geni.

Passiamo adesso a quella parte di DNA altamente o mediamente ripetuto. La caratteristica principale sta nella frequenza con cui alcune di queste sequenze sono ripetute: alcune sono ripetute cos tante volte che rappresentano il 10% del nostro DNA! Questa presenza cos diffusa uno dei motivi di interesse. Queste sequenze non sono necessariamente identiche, ma hanno un motivo molto conservato , cos che si riconoscono facilmente. Sono facili da riconoscere, e quindi facilmente classificabili, e si vede che le altamente ripetitive sono meno abbondanti delle mediamente ripetitive. Cosa significa quindi altamente o moderatamente ripetute? Altamente e mediamente ripetute non si riferisce al numero di volte che sono ripetute nel genoma, ma si riferisce alla struttura della zona dove queste sequenze esistono. Le altamente ripetitive sono sequenze molto corte (10-100 basi) ripetute tantissime volte di seguito; sono dette altamente ripetitive perch sono come delle piccole parole ripetute una accanto all'altra, di seguito, tantissime volte. Le mediamente ripetute sono sequenze un po' pi lunghe (100-1000 basi) che a volte sono ripetute, mentre altre volte sono disperse. Questa la classe di sequenze pi abbondante. Quindi, le altamente ripetute sono tantissime e corte, ma la sequenza in particolare non molto presente nel cromosoma (1% del genoma); le altre hanno ripetizioni pi lunghe e pi disperse nel genoma, ma in generale sono pi presenti nel genoma. Alcune altamente ripetute sono presenti in particolari zone del cromosoma (es. centromeri), e non hanno ovviamente interesse informativo. Le moderatamente ripetute sono disperse, e si trovano all'interno degli introni e delle zone intergeniche, e sono molto abbondanti. Sono sequenze ben riconoscibili. Nella gran parte dei casi corrispondono ai trasposoni. I trasposoni sono stati studiati soprattutto nei batteri, dove per sono pochi, perch l'equilibrio tra aumento del DNA e diminuzione molto vicino all'equilibrio, per cui sembrerebbe che il DNA batterico non tenda ad accumulare materiale. I trasposoni si dividono essenzialmente in due categorie: trasposoni a DNA e a RNA, ovvero con intermedio di trasposizione a DNA o a RNA. Un trasposone essenzialmente una certa zona di DNA dell'ordine delle migliaia di basi, capace di duplicarsi e spostarsi in un'altra zona del genoma. E a seconda di come avviene questa duplicazione avviene si parla di trasposoni in cui la trasposizione mediata da DNA e quelli la cui trasposizione mediata da RNA. Quelli ad RNA sono quelli decisamente preponderanti nell'uomo, mentre quelli a DNA sono comuni in piante e batteri. Dal punto di vista storico, gli elementi DS del mais furono quelli scoperti da Barbara McClintock, e gli valsero il Nobel. I trasposoni a DNA, con vari tipi di meccanismi, duplicano la loro sequenza, producendo un DNA episomiale, cio staccato dal cromosoma, che una copia del trasposone. Il trasposone non si muove dal DNA, semplicemente guida la copia di un DNA uguale a s stesso. Il nuovo elemento poi si integra in un'altra zona del genoma. In un momento successivo alla duplicazione e alla inserzione quindi gli elementi sono due: quello originale e quello nuovo. Per quanto riguarda le possibilit di aumento del DNA, prima abbiamo visto la duplicazione genica per crossing over ineguale; qui ne stiamo vedendo un'altra: da un segmento di DNA se ne ottengono due. Il nostro genoma aumenta di quantit perch, durante le generazioni, seppur con molta lentezza, avvengono di continuo fenomeni di questo tipo. Perci il nostro genoma tende ad aumentare inevitabilmente di quantit. I trasposoni a RNA sono leggermente pi complessi, e hanno un meccanismo pi barocco di trasposizione. Questi trasposoni, detti anche retrotrasposoni, hanno un intermedio a RNA. Questo in un certo senso vero per tutti i trasposoni: i trasposoni sono elementi di cui non si conosce la funzione, ma sappiamo che tutti i trasposoni vengono trascritti. Mentre le seguenze altamente ripetitive non vengono trascritte, tutti i trasposoni hanno il loro trascritto primario, proprio come se fossero geni. Quindi, tutti i trasposoni hanno i loro trascritti. I trasposoni a RNA vengono trascritti, e generano un intermedio a RNA (questo un vero e proprio mRNA, in quanto pu produrre proteine), che, a volte, ad opera di una trascrittasi inversa (enzima molto particolare: una DNA polimerasi RNA dipendente), viene retrotrascritto in un DNA a doppio filamento. Questo quello che deve essere successo anche agli pseudogeni da retrotrascrizione; mRNA che non erano correlati al retrotrasposone sono stati erroneamente riconosciuti da questo meccanismo e retrotrascritti in DNA. Normalmente la copia di RNA dei retrotrasposoni viene retrotrascritta e integrata in

un'altra zona del DNA. Anche in questo caso, da una sola sequenza se ne ottengono due: i retrotrasposoni, come i trasposoni, stanno aumentando. I retrotrasposoni nel nostro organismo sono molto diffusi, e si distinguono in due categorie: i retrotrasposoni di tipo non virale e di tipo virale. Questa classificazione si basa esclusivamente sulla struttura, perch il funzionamento molto simile. Quelli di tipo virale sono cos chiamati perch estremamente simili ai retrovirus; hanno una struttura che li richiama da vicino. Quelli di tipo non virale non sono simili ai retrovirus, ma il funzionamento lo stesso. Ci che cambia solo la loro struttura. I retrotrasposoni non virali nell'uomo sono importanti perch sono di gran lunga le sequenze pi abbondanti presenti nel nostro genoma. Si possono distinguere, tra questi trasposoni non virali, i LINE (Long INterdispersed Elements) e i SINE (Short INterdispersed Elements). Le LINE sono elementi di 6-7 Kb e circa il 15% del genoma umano composto di queste sequenze. Le SINE sono ripetizioni di qualche centinaio di basi (200-300), le pi diffuse delle quali sono le sequenze ALU (10% del nostro genoma). Ci sono circa un milione di queste sequenze di 200-300 basi disperse nel nostro genoma. Prendendo una sequenza a caso di 10-20,000 basi dal nostro genoma quasi impossibile non ritrovare almeno una LINE e una SINE. L'RNA 7SL una molecola di RNA che si trova nella particella di riconoscimento della sequenza segnale. La sequenza ALU, non sappiamo bene perch estremamente simile a questo RNA. I retrotrasposoni quindi sono tutte sequenze che vengono trascritte, e attraverso l'intermedio a RNA possono ridiventare DNA e integrarsi nel genoma, aumentando continuamente di numero. I retrotrasposoni di tipo virale, anche se in realt sono molto rari, sono interessanti perch ricordano da vicino la struttura dei retrovirus. La loro struttura ci consente di parlarne un po' come se fossero geni. Quando integrati nel DNA, hanno, all'inizio e alla fine, delle strutture dette LTR (Long Terminal Repeats). Quella iniziale funge da promotore, quella finale da terminatore. Queste sequenze vengono trascritte in modo vivace, e questo trascritto in certi casi porta a delle sequenze codificanti tanto vero che nei retrotrasposoni si riconoscono due proteine: una la trascrittasi inversa, l'altra l'integrasi. I retrotrasposoni quindi codificano per le due proteine che servono loro per duplicarsi. La trascrittasi inversa agisce retrotrascrivendo l'RNA in DNA, mentre l'integrasi media l'integrazione di questo DNA neosintetizzato nel genoma. Questo trasposone un elemento autosufficiente, in quanto codifica per i due enzimi che servono per il processo. Un retrovirus molto simile: la differenza tra un retrovirus e un retrotrasposone di tipo virale semplicemente che il genoma del primo pi ampio. Le LTR sono anche nei retrovirus; quando integrato pressoch indistinguibile da un retrotrasposone, se non che la sequenza compresa tra le LTR molto pi ampia. Il genoma del retrovirus, quando trascritto, capace di produrre un numero maggiore di proteine, di solito 8, invece che due. Il retrotrasposone pu solo retrotrascrivere il proprio RNA e inserirlo da un'altra parte. Il retrovirus pu invece avere un ciclo extracellulare. Il retrovirus pu incapsulare il proprio genoma in una teca proteica, uscire dalla cellula, e infettare altre cellule. Mentre il retrotrasposone pu essere ereditato solo verticalmente (essendo integrato nel DNA, ereditato dalla progenie della cellula che lo contiene), il retrovirus pu essere ereditato sia verticalmente (se integrato nel genoma) sia orizzontalmente, infettando cellule vicine. Il retrotrasposone rimane all'interno di una cellula; il retrovirus ha invece la capacit di uscire dalla cellula. Il retrovirus ha questa capacit perch delle 8 proteine, due sono l'integrasi e la trascrittasi inversa; altre quattro sono proteine della teca proteica che costituisce l'involucro per il genoma. L'RNA del retrovirus, invece di subire immediatamente la retrotrascrizione e l'integrazione, pu anche essere incapsidato e uscire dalla cellula. Il virus dell'HIV un famigerato retrovirus. Ha una struttura molto complesso, con un capside proteico e un pericapside fosfolipidico di origine cellulare, ma arricchito di proteine di tipo virale. Si tratta di proteine integrali di membrana codificate dal genoma virale. All'interno del nucleocapside ci sono delle molecole di trascrittasi inversa.

Tra i cicli del retrovirus e quelli del retrotrasposone c' un notevole parallelismo. Per quanto riguarda il retrovirus: a partire dall'infezione, una particella virale infetta una cellula bersaglio, per effetto del capside virale entra dentro la cellula; il capside si smantella, e l'RNA viene retrotrascritto in cDNA (DNA copia di un RNA). Il cDNA del retrovirus procede all'integrazione, e la sequenza di DNA chiamata provirus. Questo il ciclo RNA-retrotrascritto-integrazione il trasposone si ferma qui. Nel retrotrasposone abbiamo solo questa parte qui. Nel retrovirus, la trascrizione del cDNA retrovirale inserito nel genoma della cellula porta a copie di RNA. Questo RNA ha due significati diversi: da una parte un RNA che porter a codificare proteine, ma dall'altro anche genoma virale. Per cui, una parte di RNA subir la traduzione dando origine alle proteine del capside; l'altra quota di RNA, non utilizzati per la traduzione, diventano genomi retrovirali che vengono inglobati nei capsidi ed espulsi per gemmazione. I retrovirus potranno poi andare ad infettare altre cellule. Il ciclo del retrovirus si arricchisce di questa parte extracellulare, cosa che non possibile per i retrotrasposoni, confinati nella cellula, dato che il loro genoma meno ricco di sequenze codificanti. O retrovirus ha le sequenze per la trasposizione, ma in pi ha anche le sequenze per fare il capside, che protegge il genoma virale durante il ciclo extracellulare. La realizzazione di vaccini contro l'HIV finora si rivelata un fallimento; il virus si tiene a bada con farmaci particolari ma non esiste vaccino. Essenzialmente il motivo di questo risiede nel fatto che i retrovirus mutano velocemente. Si parla di mutazioni per cambiamenti a livello del genoma; il genoma dei retrovirus RNA, e il processo che porta alla produzione di RNA la trascrizione. Mentre il DNA si replica con la replicazione, guidata dalle DNA polimerasi, che hanno un tasso di errori relativamente basso, la trascrizione catalizzata dalle RNA polimerasi II cellulari, che commette errori una volta ogni 10 4 nucleotidi. Per il retrovirus questi errori sono mutazioni, perch cambia la molecola che costituisce il genoma. Per questo motivo questi virus tendono a mutare molto velocemente. La stessa cosa succede per il virus dell'influenza, ma l'enzima in quel caso una replicasi, che replica RNA in RNA. Il retrovirus ha un genoma simile a quello di un retrotrasposone di tipo virale, con sequenze LTR all'inizio e alla fine, ma pi esteso. capace di produrre otto proteine da tre regioni del genoma dette Gag, Pol, ed Env. Gag essenzialmente produce proteine legate alla zona del capside e del pericapside. Pol produce trascrittasi inversa, integrasi e la proteasi (alcuni farmaci anti-HIV sono inibitori della proteasi), un enzima che serve per modificare post traduzionalmente delle proteine che vengono prodotte come proteine pi lunghe. Env sta per Envelope, cio contenitore : sono le proteine di superficie e transmembrana. Quindi; le sequenze per le proteine del nucleocapside e del capside sono contenute in Gag; sono proteine citoplasmatiche che vengono prodotte dai trascritti del cDNA virale; queste si assemblano intorno a due molecole di RNA virale formando nucleocapside e capside. In seguito alla gemmazione, intorno al virus rimane una membrana cellulare arricchita dalle proteine le cui sequenze sono contenute in Env. Queste sono proteine dotate di peptide segnale e uno di arresto; sono proteine integrali di membrana prodotte a partire dal genoma virale, ma poi processate dalla cellula come qualsiasi altra proteina. La cellula in breve tempo espone molte di queste proteine sulla propria membrana, e quando il virus fuoriesce per gemmazione, acquisisce anche queste proteine, fondamentali per il ciclo del virus perch mediano l'attacco alla superficie cellulare. I virus sono estremamente specie-specifici, e all'interno di una cellula i virus tipicamente sono molto specifici verso particolari tipi cellulari. Questa specificit spesso mediata dalle proteine di superficie che trovano dei recettori particolari delle cellule. La cosa da ricordare quindi l'esistenza dei trasposoni, elementi del genoma in grado di saltare da una parte all'altra; alcuni hanno semplicemente un meccanismo duplicativo a DNA, che si inserisce semplicemente da un'altra parte. I retrotrasposoni sono leggermente pi complessi: sono veri e propri geni che vengono trascritti e producono anche proteine; ogni tanto questi trascritti vengono retrotrascritti in DNA e inseriti nel genoma. In pi, alcuni di questi sono di tipo non virale, mentre altri sono di tipo virale perch ricordano da vicino i retrovirus. La differenza pi grande tra retrovirus e retrotrasposone la taglia, pi grande nel primo e pi ristretta nel secondo. Questo perch il retrovirus ha a disposizione anche la trasmissione di cellula in cellula, e per fare questo deve produrre la particella virale per la quale servono proteine (del nucleocapside, del capside, e le transmembrana che passano al virus con il pericapside). Si pu capire, soprattutto osservando i batteri, che l'utilit dei trasposoni sia creare scompiglio nel DNA. Questi DNA vengono prodotti ed entrano nel genoma: possono non creare danni, ma anche disturbare

qualche gene utile. D'altro canto, l'LTR un promotore fortissimo. Potrebbe anche avvenire che un retrotrasposone si inserisca nelle vicinanze di un gene silente e per questo inizi ad essere trascritto in alcuni casi, questo pu essere causa di tumori. Da una parte ci pu essere l'inattivazione di geni, dall'altra l'attivazione di geni inattivi. Questi sono meccanismi che hanno verosimilmente portato a salti evolutivi molto drastici, che non sarebbero potuti avvenire con un tipo di mutazione molto lenta come la mutazione puntiforme. Probabilmente la gran parte di questi eventi sono catastrofici, ma possibile che, ogni tanto, uno fosse positivi, permettendo salti evolutivi. Del resto, la maggior parte delle mutazioni sono negative, ma ogni tanto qualcuna positiva.

Biochimica 19-05-09 [Prof. Raugei]


()? Per il resto delle sequenze, le cose che abbiamo visto insieme sono abbastanza vicine a quello che il quadro attuale della ricerca. Anche la grande quantit del DNA una questione poco chiara e discussa; una delle prime ipotesi fu che accumulando molto DNA inutile, mutazioni casuali non avrebbero avuto effetto. Questa potrebbe essere una delle ragioni, ma difficilmente spiega tutto, anche perch tra organismi anche simili tra loro, le quantit di DNA sono diverse. Ovviamente questo potrebbe anche derivare dalla differente storia evolutiva. Adesso affronteremo un argomento che, seguendo l'ordine logico, avremmo dovuto fare prima, ma che affrontiamo adesso che conosciamo un po' meglio la struttura del genoma. Ritorniamo sulla regolazione genica, come viene regolato il funzionamento dei geni. Affinch un gene venga trascritto in un dato momento, esistono numerose condizioni che devono essere soddisfatte: la presenza di una TATA box, la presenza di una serie di segnali sul DNA riconosciuti da fattori proteici e trascrizionali, ed elementi pi distanti quali gli enhancer. Questa era la versione delle cose circa 15 anni fa, quando sembrava che tutto potesse essere spiegato con la regolazione di ogni singolo gene. Tuttavia, come sempre accade, la ricerca ha aperto nuove prospettive. Ci si accorti quindi che il controllo della trascrizione una cosa diversa dal controllo dell'espressione genica. Per controllo della trascrizione si intende il controllo della trascrizione di un singolo gene, che viene operato con una serie di comandi che comandano la trascrizione o meno. Un gene che non viene trascritto come se non esistesse. Per, pi in generale, si parla di regolazione dell'espressione genica intendendo che la regolazione pu essere anche pi a valle della trascrizione: un gene pu essere trascritto senza che il suo mRNA venga mai tradotto. Si parla di regolazioni epigenitiche. Il concetto di epigenetica piuttosto sfuggente. Epigenetico designa un qualsiasi fattore che influenza il fenotipo ma non dipende dal genoma. Un esempio tipico di questo il sesso: in alcuni animali viene determinato in maniera casuale, o in relazione a fattori ambientali (come la temperatura). Si ha la repressione dei cromosomi sessuali a seconda di qualche fattore esterno. Questo un fattore epigenetico nel vero senso della parola: un qualcosa che influenza l'espressione di geni, ma non per via di mutazione, duplicazione genica, etc., ma proprio in quanto fattore esterno, che accende o spegne certi geni. Tuttavia, il termine epigenetico utilizzato anche in un'altra accezione, che quella ormai pi comune, che significa non direttamente connesso al gene. Per esempio, un promotore ha un'influenza diretta sull'espressione del gene; tutto ci che proviene da altri fattori che non sono la regolazione a livello del promotore designato come epigenetico. Per esempio, la metilazione di particolari zone del DNA; l'acetilazione degli istoni; tutti fenomeni indipendenti dal promotore. Un altro esempio: l'adrenalina influenza tra le altre cose l'espressione di alcuni geni, ma non un fattore epigenetico, perch agisce a livello dei promotori. La regolazione della struttura dei nucleosomi pu portare ad un blocco trascrizionale. Sono fattori che

regolano la trascrizione un altro l'interferenza a RNA. Due parole sulla metilazione del DNA: nel caso dei batteri protegge il DNA dal taglio dei loro stessi enzimi di restrizione; aiuta nella scelta del filamento da correggere con il proof reading. La metilazione di particolari basi un segnale che volta volta significa qualcosa. Un altro caso di metilazione quello delle isole CPG, sigla che indica un nucleotide che contiene citosina, il fosfato del legame fosfodiesterico, e un nucleotide con una G. In altre parole, un CG sul DNA. Le CPG islands sono zone del DNA particolarmente ricche in CG, si trovano abbastanza facilmente, di solito a monte di alcuni geni. In queste zone, la C pu essere metilata, e questa una regolazione epigenetica abbastanza comune in cui la trascrizione di alcuni geni inibita dalle isole CPG. La metilazione di una CPG islands nei pressi di un gene infatti spesso un indice di mancanza di trascrizione. L'inibizione dovuta anche al fatto che in quella zona del genoma non si smantella la struttura nucleosomica. La metilazione connessa anche al rimodellamento della prima fila (cio lo smantellamento della struttura nucleosomica). Le modificazioni degli istoni (acetilazione, metilazione, fosforilazione) si classificano in due tipi: un primo tipo di modificazioni influenzano le interazioni tra istoni e DNA. Riprendendo la struttura della cromatina, abbiamo la scaffold protein, con la fibra da 30 nm disposta in anse. Se in una certa zona vi sono dei geni non trascritti di cui si rende necessaria la trascrizione, verosimilmente ci sar una CPG island metilata che viene demetilata portando allo smantellamento della struttura nucleosomica attraverso modificazioni post traduzionali degli istoni, soprattutto fosforilazioni e acetilazioni. Queste sono dette modificazioni di classe II. Gli istoni tuttavia possono subire anche altre modificazioni, che in, un momento intermedio dello smantellamento della struttura del DNA, servono per reclutare in quella zona del DNA tutta una serie di fattori necessari per la trascrizione. Sono le cosiddette modificazioni di classe I, e mediano il reclutamento di fattori proteici, come enzimi che catalizzano ulteriori modificazioni degli istoni, fattori trascrizionali, ed enzimi che portano a termine la modificazione della cromatina. Quindi: le modificazioni di classe II sono quelle pi direttamente correlate allo smantellamento della struttura nucleosomica, per lasciare il DNA nudo; le modificazioni di classe I sono modificazioni che, in un momento in cui gli istoni sono ancora in contatto con il DNA ma la struttura si sta smantellando, attirano a livello del DNA enzimi che portano a compimento lo smantellamento della struttura nucleosomica, e fattori trascrizionali che andranno ad interagire con le zone del promotore necessarie ad attivare la trascrizione. L'intervento dei fattori trascrizionali quindi profondamente connesso alla struttura nucleosomica, influenzata a sua volta dalle modificazioni degli istoni, che se da una parte tendono a smantellare questa struttura, dall'altra mediano l'arrivo di una serie di proteine necessarie alla trascrizione. I geni da una parte si rendono disponibili alla trascrizione perch la struttura nucleosomica si smantella, ma contemporaneamente questo processo media l'attacco di una serie di fattori che servono a mandare avanti la trascrizione. Questo essenzialmente riguarda un momento precedente alla trascrizione la cellula sta ancora prendendo la decisione se il gene verr trascritto o no. Un gene verr trascritto se ci sono i fattori trascrizionali giusti, se la struttura nucleosomica viene smantellata, se i fattori vengono reclutati a livello dell'ansa che deve essere trascritta etc. Se tutte queste variabili sono soddisfatte, il gene verr trascritto; ci pu essere poi un ulteriore fattore che riconosce l'enhancer e il gene viene trascritto molto di pi. Quando i segnali vengono meno, la trascrizione cessa, i fattori si staccano, e la struttura nucleosomica si riassembla. Pochi anni fa il capitolo sulla regolazione si concludeva qui. Tuttavia, mentre nei procarioti vero che se un gene viene trascritto in genere anche tradotto, questo non sempre vero per gli eucarioti. Non sempre i geni sono trascritti portano necessariamente ad una traduzione. Ci sono dei trascritti costantemente presenti nella cellula, le cui proteine sono invece presenti solo in certi momenti. Ci sono molte ragioni per questo, la pi importante delle quali l'interferenza a RNA. Questo un fenomeno scoperto circa 15 anni fa, e i cui aspetti sono stati chiariti solo nel 1998; nel 2006 stato assegnato un Nobel

per questo fenomeno. L'interferenza a RNA un tipo di regolazione post trascrizionale; un gene pu essere trascritto e produrre un mRNA, ma con questo fenomeno se ne pu bloccare la traduzione o pu addirittura essere idrolizzato. L'interferenza a RNA si ha un blocco traduzionale di specifici RNA o anche degradazione specifica. mediata da degli RNA prodotti a livello del genoma. Interferenza significa che alcuni mRNA vengono riconosciuti da altri RNA prodotti dalla cellula stessa allo scopo di essere distrutti o di bloccarne la traduzione. Questo spiega perch alcuni geni sono trascritti, ma la proteina non presente: il loro mRNA non arriva ad essere tradotto. Il fenomeno stato scoperto nelle piante come meccanismo antivirale si visto che questo fenomeno presente anche nelle cellule animali, ma con significato regolativo. Come funziona questo fenomeno? In molte zone del genoma sono stati scoperti geni che portano alla produzione di RNA con struttura caratteristica: i microRNA. Sono stati trovati sia in zone intergeniche sia all'interno di introni particolarmente grandi. Sono trascritti dalla RNA polimerasi II, e sono delle ulteriori zone di DNA che vengono trascritte portando alla produzione di questo RNA che, appena trascritti, prendono una forma a stelo con una ansa, perch hanno una complementarit non perfetta ma solida. Si forma a livello nucleare, ad opera della RNA polimerasi II, un trascritto primario detto primary microRNA come se si trattasse di veri e propri geni. Ancora nel nucleo, questi primary microRNA vengono processati da vari enzimi, e il trascritto primario viene frammentato in frammenti simili a forcine (pre-microRNA), che sono poi esportati nel citoplasma dove subiscono tutta una serie di processamenti, che consentono a queste molecole di raggiungere la forma matura, che a doppio filamento. Infatti i microRNA sono anche chiamati dsRNA, dove ds sta per double strand, doppio filamento. Quindi: i microRNA vengono trascritti sotto forma di precursori pi complessi; sono poi processati, e diventano delle specie di steli a forcina, vengono esportati dal nucleo e poi vanno a influenzare la traduzione. Il processo che consente la maturazione dei microRNA estremamente conservato e molto simile tra specie filogeneticamente lontane (piante, animali, etc.). La funzione di questo processo quella di frammentare l'RNA, ed mediato da una RNAsi detta proteina Dicer; si lega all'RNA e lo ritaglia in piccoli frammenti di 20-22 basi detto small interfering RNA questo l'RNA a doppio filamento che andr veramente ad attuare il blocco traduzionale. L'siRNA viene poi complessato con una proteina detta RISC (RNA Induced Silencing Complex), a formare il complesso che induce il silenziamento, cio il blocco della traduzione. La traduzione dell'mRNA di un gene che si starebbe esprimendo vede la sua traduzione bloccata perch questo microRNA, che adesso a singolo filamento, ha una sequenza complementare a particolari mRNA. Ogni microRNA trascritto a livello genico non ha una sequenza casuale, ma ha delle sequenze che sono complementari a particolari mRNA. La scelta dell'obiettivo messa in atto per interazioni di tipo Watson & Crick tra il microRNA prodotto a livello genico, che una volta ridotto a singolo filamento, va ad interagire con specifici mRNA. il microRNA a singolo filamento che riconosce il target, una volta che si formato il complesso con la partecipazione di RISP e altre attivit enzimatiche, che portano al taglio endonucleasico dell'mRNA. come se quell'mRNA non fosse mai stato trascritto. Quindi, con interazioni a valle, viene inibita la produzione del prodotto traduzionale senza inibire la trascrizione. un processo che nelle piante ha valore antivirale, ed molto logico se lo pensiamo in questi termini. Nelle piante la cosa pi comune che succede che, quando una cellula viene infettata da un virus, il virus trascriver i propri geni, dunque la cellula sar piena di mRNA virali. Si sono cos evoluti geni che portano alla produzione di microRNA, i quali, dopo il processamento, hanno come obiettivo l'mRNA virale. Questo un sistema logico per difendersi dagli attacchi dei virus. La cellula ha conservato delle sequenze simili o comunque complementari a quelle virali per poterle riconoscere e degradarle, bloccando il progredire dell'infezione. Si pensa che negli animali debba esistere un fenomeno del genere, tanto vero che alcuni virus hanno evoluto dei geni per contrattaccare, bloccando meccanismi di questo tipo. Quindi, circuiti difensivi di questo tipo nelle cellule animali o esistevano fino a poco tempo fa, o esistono tuttora ma non li abbiamo trovati. Nelle cellule animali questo meccanismo sembra avere un'importanza regolativa del livello proteico

derivante dalla trascrizione di particolari geni. Si tratta di una modalit di regolazione dell'espressione genica totalmente a valle, fatta direttamente sull'mRNA. A volte questo viene digerito, altre volte ne viene bloccata la traduzione. L'effetto comunque lo stesso nel senso che la proteina non viene prodotta. Se le due sequenze sono perfettamente complementari, spesso si ha la digestione; se invece la complementariet non perfetta abbiamo il blocco della traduzione. Quindi, a livello genico, si visto che particolari zone che non erano sospettate di essere trascritte in effetti lo sono. Il fenomeno dell'interferenza a RNA comunque in fase di studio. Ad oggi, sono stati riconosciuti 300 tipi diversi di microRNA nell'uomo, ma probabile che ve ne siano molti altri. Non un caso che un fenomeno del genere sia rimasto nascosto fino ad oggi: molecole di RNA di questo tipo sono molto sfuggenti e difficili da individuare; la loro scoperta stato un caso fortuito. Sapendo della loro esistenza, con le tecniche odierne, possibile mettere a punto delle tecniche per individuarli. L'RNA una molecola con un turnover molto veloce, per cui isolarla in generale molto difficile. Ricapitolando, l'interferenza a RNA stata scoperta come una sorta di sistema immunitario intracellulare contro non il genoma del virus, ma gli mRNA prodotti sulla base di quel genoma virale, che servono al virus per costruire il capside. Questo fenomeno stato in seguito evidenziato sia in C. elegans che in Drosophila melanogaster. Nei mammiferi, stato visto come la funzione preponderante del fenomeno sia invece la regolazione genica, soprattutto per quanto riguarda i geni che controllano lo sviluppo (geni architetto), e che vengono tradotti solo in periodi precoci dell'embriogenesi, con la funzione di stabilire gli assi dell'embrione sono coinvolti anche nell'organogenesi. I geni che conferiscono lo stato di cellula staminale indifferenziata sono regolati anche per mezzo dell'interferenza a RNA. Le cellule staminali sono cellule immature, che ancora devono differenziarsi nei vari tessuti. La loro esistenza conosciuta da moltissimo tempo in un primo momento si pensava che esistessero solo a livello del midollo osseo, ma recentemente si scoperto che queste cellule esistono a livello di tutti i tessuti, del cui ricambio sono responsabili. Naturalmente, la velocit e l'efficienza del ricambio varia da tessuto a tessuto il ricambio del tessuto nervoso infatti molto lento. Le cellule staminali sono conservate nella loro staminalit anche attraverso l'espressione di particolari geni che servono alla cellula per mantenere questo stato di immaturit, e questi geni sono regolati anche con i meccanismi dell'interferenza a RNA. Molti geni regolati attraverso l'interferenza a RNA sono coinvolti nella proliferazione cellulare. Quando si parla di geni coinvolti nella proliferazione cellulare siamo vicini a parlare di tumori. La staminalit e la proliferazione cellulare sono abbastanza connesse l'indirizzo attuale del pensiero scientifico quello di riconoscere che i tumori derivino da cellule staminali piuttosto che dalle cellule terminalmente differenziarsi. Le cellule staminali hanno infatti ancora la possibilit di proliferare, capacit che invece non pi concessa alle cellule terminalmente differenziate. Questa regolazione della proliferazione operata anche attraverso questo sistema dei microRNA di cui abbiamo parlato tanto vero che dei malfunzionamenti a livello di questo meccanismo sono riconosciuti come causa di alcuni tumori. Se alcuni dei geni per microRNA che regolano la staminalit mutano e vengono danneggiati, il blocco viene meno, e la cellula staminale che ha subito quel danno acquista capacit proliferativa; senz'altro questa sar una delle cause che potrebbero portare quella cellula a diventare una cellula tumorale. Ci sono decine di esempi che confermano che un malfunzionamento nei microRNA che regolano la proliferazione cellulare chiaramente legato alla genesi tumorale di particolari tumori. Prima di passare all'ultima parte del corso, che riguader essenzialmente l'ingegneria genetica, parleremo oncogeni. Questi sono concetti che saranno affrontati in dettaglio in corsi successivi, ma importante avere fin da ora qualche nozione di base. Gli oncogeni sono tutti quei geni connessi con i tumori. Una osservazione ovvia che si pu fare per quanto riguarda i tumori che la loro insorgenza strettamente legata all'et. Il numero di cellule di un organismo aumenta dal concepimento (1 cellula, lo zigote) fino alla nascita, continuando ad aumentare fino al raggiungimento dello stato adulto. Nell'organismo adulto, dato che ci sono

tessuti dove il ricambio minimo, e altri dove pi veloce, ma di solito c' un equilibrio con la morte di altre cellule; insomma, il numero di cellule dovrebbe trovare un plateau. In realt, vi leggera perdita il numero dei neuroni scende con l'et. Se invece il numero totale di cellule di un organismo adulto tende ad aumentare, l'unica spiegazione possibile il tumore. In una delle cellule che dovrebbero rimanere in numero ben preciso (es. le cellule terminalmente differenziate non dovrebbero proliferare, le staminali dovrebbero farlo solo se ce n' bisogno, etc.) qualcosa andato storto per cui, per esempio, una particolare cellula staminale comincia a proliferare in assenza di segnali che inducano proliferazione. L'incidenza dei tumori perfettamente correlata con l'et sono rarissimi e purtroppo di solito estremamente gravi i tumori del neonato o a livello fetale. Anche i tumori pediatrici e adolescenziali sono rari; poi l'incidenza aumenta lentamente fino ai 40-45 anni, e dai 50 anni in su c' un picco. Sembrerebbe, solo giudicando da questi dati, che sia un fenomeno derivato da un accumulo di qualcosa: ci vuole tempo per accumulare questo qualcosa che poi origina il tumore. Nel nostro organismo ci sono circa 300 tipi di tessuto diversi, ed esistono circa 200 tipi diversi di tumore che colpiscono molti di questi tessuti. Ci sono tumori di derivazione ectodermica (es. carcinomi), endodermica e mesodermica (es. sarcomi, leucemie, mielomi). La correlazione con l'et si spiega con l'osservazione che i tumori derivano da modificazioni del DNA, in particolare da mutazioni non solo mutazioni puntiformi, ma anche riarrangiamenti pi importanti del genoma. Le mutazioni sono diverse a seconda che avvengano a livello della linea germinale o a livello delle cellule somatiche. Nel primo caso, sono mutazioni che hanno importanza per la progenie e in generale per la specie, perch se quel genoma andr a costituire una parte del genoma di uno zigote, il nuovo organismo avr una mutazione nuova che spesso consister in una variante genotipica di nessuna importanza (es. mutazioni a livello di introni, zone intergeniche, mutazioni silenti, etc.); in altri casi si avr un'espressione fenotipica di poca importanza, mentre in altri casi ancora saranno malattie genetiche (varianti che hanno un fenotipo non vantaggioso). Nel secondo caso, ovvero mutazioni a carico di cellule somatiche, si tratta di mutazioni non trasmissibili, e hanno importanza per l'organismo. Supponiamo che avvenga una mutazione letale per la cellula che la subisce questa mutazione non ha grande importanza, abbiamo miliardi di cellule, il tessuto rimane comunque funzionante. La morte di una cellula per mutazione non un evento grave in un organismo pluricellulare. Le mutazioni per possono andare a colpire due particolari classi di geni: i protoncogeni e gli oncosoppressori. Si tratta di geni che vanno a regolare la proliferazione cellulare, regolando lo stato proliferativo di ogni cellula. Normalmente questo stato di non proliferazione certamente a livello delle cellule terminalmente differenziate, ma anche a livello delle cellule staminali, in genere il segnale di non proliferazione. Il segnale di proliferazione viene inviato solo in particolari condizioni di solito per sopperire alla morte di altre cellule terminalmente differenziale. Per esempio, se si subisce una emorragia, perdiamo sangue, e le cellule staminali nel midollo vengono attivate per ripristinare le cellule perse; una volta che il numero delle cellule sanguigne si normalizzato, la proliferazione cessa. Insomma, si tratta di cellule che normalmente sono in stato di non crescita, ma che possono rispondere a segnali di proliferazione solo in particolari momenti. Tutto questo regolato da una serie di geni (compresi i geni che producono microRNA), che regolano lo stato proliferativo di una cellula. Se questi geni subiscono mutazioni il processo di regolazione della crescita cellulare pu subire delle variazioni: una cellula che non doveva proliferare diventa capace di farlo in maniera incontrollata. Queste sono mutazioni che portano in prima battuta ad un tumore benigno, cio un tumore localizzato. Una delle prime cose che sono state capite che per operare un cambiamento cos drastico sembra non essere sufficiente una sola mutazione, dato che la regolazione di questo fenomeno molto complessa e coinvolge numerosi geni; la mutazione di uno solo di questi non sufficiente a disturbare il controllo. Tuttavia, l'accumulo di mutazioni successive porta alla misregolazione della proliferazione. Questo spiega la proporzionalit diretta con l'et: cellule giovani hanno accumulato poche mutazioni, ma, andando avanti con

il tempo, in un ambiente ricco di sostanze mutagene che rendono pi veloce l'accumulo di mutazioni, le cellule subiscono un numero sempre crescente di modificazioni del genoma. Il primo passaggio verso un tumore benigno, ancora localizzato, che tende ad essere istologicamente diverso, ma ulteriori mutazioni a carico delle stesse cellule possono portare al cancro, un tumore detto maligno perch possiede tutta una serie di capacit che lo rendono molto aggressivo. Un tumore diventa quasi come un organismo che cresce, sempre pi diverso dalle cellule dell'organismo da cui stato prodotto. Una delle capacit pi temute la metastasi, la propagazione del tumore in altre zone dell'organismo. Le cellule come queste, che hanno subito danni al DNA, normalmente dovrebbero andare in apoptosi. L'apoptosi il suicidio cellulare, un meccanismo per eliminare quelle cellule che hanno subito danni al DNA. Molti geni che inducono l'apoptosi sono inibiti per mutazione, per cui le cellule cancerogene raramente vanno incontro a questo destino. Si tratta di cellule terribili, che vanno a colonizzare altre sedi; un tumore in metastasi ancora oggi spesso letale. Quindi, un tumore nella sua fase iniziale un qualcosa che pu sempre cambiare e diventare un tumore maligno, acquisendone le capacit: proliferazione, metastasi, immunit all'apoptosi, capacit angiogenica con la quale i tumori inducono la crescita di vasi sanguigni. Adesso parliamo meglio dei geni coinvolti in tutto questo: i protooncogeni e i geni oncosoppressori, i geni che subendo mutazioni portano ad una perturbazione dell'equilibrio tra proliferazione e non proliferazione. In termini generali, i geni che controllano la capacit proliferativa (ma non solo: anche la capacit di andare o meno in apoptosi, capacit migratoria) sono rappresentati da queste due categorie di geni, che prendono il loro nome proprio perch influenzano queste caratteristiche della cellula, in generale contribuendo alla trasformazione tumorale di una cellula. I protooncogeni possiamo pensarli come dei geni che favorirebbero la proliferazione, mentre gli oncosoppressori tendono a inibirla. L'equilibrio di questi geni, in una cellula normale porta, in condizioni normali, all'assenza di proliferazione. In momenti particolari, particolari segnali che arrivano ai protooncogeni fanno s che la loro attivit sia transientemente prevalente su quella degli oncosoppressori e si ha proliferazione. Per la maggior parte del tempo, sono estremamente attivi gli oncosoppressori e scarsamente attivi i protooncogeni. Queste due categorie di geni, protoocogeni e oncosoppressori sono geni assolutamente normali e fondamentali per il funzionamento di una cellula sana. Sono entrambi componenti di un meccanismo di regolazione della proliferazione cellulare che fondamentale per le cellule sane. Queste due categorie di geni per, come qualsiasi altro segmento di DNA, possono subire mutazioni di qualunque tipo (puntiformi, o riarrangiamenti pi vistosi da un punto di vista molecolare). Dal punto di vista funzionale, le mutazioni possono portare i protooncogeni a diventare oncogeni quella di oncogene la forma attivata, che regola positivamente la proliferazione. Il caso pi semplice quello di un gene la cui espressione finemente regolata dal punto di vista quantitativo. Una mutazione pu portare ad una non regolazione della trascrizione, che diventa costitutiva (cio continua), oppure pu portare alla mutazione di un microRNA che doveva tenere a bada l'mRNA: il risultato che in entrambi i casi il prodotto genico, da poco, aumenta. Questa una maniera ovvia per cui si ha attivazione. La proteina ha un'azione molto maggiore semplicemente perch pi abbondante. In altri casi, si hanno delle mutazioni a livello molecolare che rendono una proteina pi funzionale. Queste mutazioni attivanti sono dominanti: basta che uno dei due alleli muti, che, essendo attivante, diventa dominante. Il gene mutato fa qualcosa in pi, per cui annulla il fatto che l'altro allele sia rimasto normale e esprime meno. Queste mutazioni attivanti portano quindi ad aumento della proliferazione, maggiore capacit migratoria, inibizione dell'apoptosi, etc. Gli oncosoppressori sono invece geni che regolano negativamente la proliferazione o facilitano l'entrata in apoptosi quando una cellula subisce danni al DNA. Se questi vengono mutati abbiamo una minore inibizione

della proliferazione e una minore sensibilit all'apoptosi. In questi casi la mutazione di tipo recessivo, per cui diventa importante se viene subita da entrambi gli alleli. Gli oncosoppressori si disattivano, e anche questo fatto concorre a generare un fenotipo trasformato. Quindi abbiamo due diverse categorie di geni: una che tende a influenzare positivamente la proliferazione e che normalmente inattiva; l'altra che sono normalmente attivi e mantengono le cellule in uno stato di non proliferazione. Mutazioni a carico degli uni o degli altri o stimolano la proliferazione, o smettono di inibirla o fanno perdere alla cellula la capacit di andare in apotosi. In tutti i casi, dato che il tumore la somma di molte mutazioni diverse, se una cellula acquista mutazioni a carico di entrambi, lo schema di regolazione della proliferazione viene meno e la cellula diventa tumorale. Abbiamo detto che i protooncogeni si trasformano in oncogeni subendo mutazioni attivanti. Una mutazione attivante significa che si ha un aumento della funzione spesso questo significa che la sua funzione non pi regolata: il protooncogene come un campanello che suona quando lo premiamo, ma, rilasciando il dito, smette; l'oncogene un campanello difettoso che suona indipendentemente dal fatto che lo si prema o no. Le mutazioni di attivazione portano ad un effetto di questo tipo, e l'attivazione pu consistere: o in un aumento di quantit del prodotto genico (per amplificazione genica, per traslocazioni, inserzioni retrovirali in vicinanza di promotori etc.), o per esempio, per difetto del meccanismo di regolazione a interferenza di RNA, o aumento di attivit, per cui la proteina costantemente attiva. In quest'ultimo caso, facciamo un esempio molto comune: abbiamo due recettori per fattori di crescita, per esempio per l'EGF, Epithelial Growth Factor; normalmente questo fattore di crescita poco presente, ma fa s che le cellule, stimolate, proliferino in maniera controllata per rimpiazzare le cellule perse per desquamazione a livello dell'epidermide; ugualmente, in seguito ad una ferita, la pelle deve ricostituirsi, e una delle modalit con cui questo avviene perch l'EGF ne stimola la crescita. L'EGF si lega al recettore transmembrana, e questo normalmente dimerizza e d un segnale di proliferazione intracellulare, per esempio sotto forma di una chinasi. Quando l'EGF viene meno, i recettori perdono la dimerizzazione, e lo stimolo cessa. Questo recettore per l'EGF uno dei pi comuni protooncogeni: per mutazione (si forma un codone di stop) pu perdere la parte extracellulare; la proteina rimane identica nella parte citoplasmatica. Per ragioni che ora sono anche chiare dal punto di vista strutturale, una molecola proteica fatta in questo modo diventa capace di dimerizzare anche in assenza del ligando. Il protooncogene diventa oncogene perch in questa forma molecolare si ha la segnalazione di proliferazione cellulare indipendentemente dalla presenza dell'EGF. come se le cellule ricevessero uno stimolo continuo da parte dell'EGF, anche se questo fattore di crescita non presente. Acquisendo la capacit di dimerizzare, questi recettori diventano attivi da un punto di vista enzimatico e segnalano proliferazione, che diventa indipendente dalla reale presenza del ligando. Un esempio abbastanza simile offerto dal recettore HER2, per il fattore di crescita HER2; pu subire una mutazione coinvolta nel 50% dei casi del tumore alla mammella, ed anche uno dei bersagli molecolari usati per le terapie con anticorpi monoclonali. Anche in questo caso il meccanismo lo stesso: i recettori sono sempre presenti sulla superficie delle cellule, e l'azione del ligando quella di far s che i recettori dimerizzino e la dimerizzazione attiva la parte citoplasmatica (una tirosina-chinasi) che induce una risposta cellulare di attivazione. Nelle cellule della ghiandola mammaria, in un 50% dei casi, una delle mutazioni che pu aver luogo consiste nella sostituzione di una valina presente nella porzione transmembrana con una glutammina. Grazie a questa mutazione, i recettori divengono capaci di dimerizzare indipendentemente dalla presenza del ligando, come prima. Anche qui abbiamo una attivazione del recettore costitutiva, indipendente dalla presenza del ligando. Ci sono molti fattori che possono portare all'attivazione di un oncogene. Questi oncogeni in genere hanno nome c-onc: c-ras, c-nic, c-fos, etc. dove c sta per cellulare. Uno dei quadri tumorali meglio studiati quello del tumore al colon, e dimostra proprio come la trasformazione tumorale sia dovuta ad accumulo di mutazioni. In questo caso si riscontra un quadro che poi risulta essere abbastanza comune: prima la presenza di un polipo, che diventa un tumore benigno, poi un adenoma, e poi a un certo punto si sviluppa il carcinoma, un tumore maligno con capacit metastatica. Insomma, si tratta di stadi via via pi gravi, sempre delle stesse cellule: una cellula subisce una prima mutazione e forma un polipo; all'interno del polipo una cellula subisce un'altra mutazione e d luogo ad un adenoma, nell'ambito dell'adenoma una cellula subisce un'ulteriore mutazione e diventa carcinoma.

Sono state individuale le mutazioni pi probabili che portano a questa evoluzione: molto spesso la prima mutazione un oncosoppressore chiamato APC, che regola negativamente la proliferazione; spesso la seconda mutazione interessa il gene k-ras, un protooncogene che diventa oncogene e stimola la proliferazione; poi abbiamo mutazioni a livello di altri due oncosoppressori, uno dei quali chiamato DCC; l'altro molto ben conosciuto: quello che codifica per la famosa proteina p53, che stimola da una parte la riparazione dei danni al DNA, dall'altra l'entrata in apoptosi. Danni a questo oncosoppressore, comuni in pi della met dei tumori, pi un'altra decina di mutazioni circa, portano alla malignit. Quindi il cancro un evento che si origina dall'accumulo di mutazioni con il tempo: questo ci fa capire come la principale cura per il cancro sia la prevenzione e la diagnosi precoce. Prima il tumore viene individuato, pi si in condizioni migliori. Quando si superato un certo stadio, ancora oggi la probabilit di guarigione per alcuni tumori bassissima. Adesso introduciamo l'argomento che sar oggetto delle prossime lezioni, che riguarder l'ingegneria genetica, di cui verranno affrontate le nozioni fondamentali. Infine, parleremo di anticorpi e immunoglobuline. Per quanto riguarda la parte dell'ingegneria genetica, abbiamo gi avuto modo di parlare dell'importanza dei plasmidi, elementi genetici aggiuntivi che si ritrovano nei batteri, che servono per ospitare geni che hanno attivit particolari, come la resistenza agli antibiotici, l'uso di fonti di carbonio atipiche, etc. stato dimostrato che possibile inserire del DNA eterologo in un plasmide, ed su questo che fondamentalmente si basa una grande quota dell'ingegneria genetica. Inserendo del DNA eterologo, il plasmide non perde la sua attivit, e rimane capace di duplicarsi come qualsiasi altro plasmide. Per DNA eterologo si intende qualsiasi sequenza di DNA: questo possibile perch la molecola di DNA dal punto di vista chimico identica in tutti gli esseri viventi, cambia solo la sequenza delle basi. Il plasmide un elemento dotato di una certa elasticit anche se questo vero per tutto il DNA in genere: abbiamo visto come nei nostri cromosomi si verifichino inserzioni di trasposoni, traslocazioni geniche, etc. e durante questi fenomeni la funzionalit del DNA rimane inalterata. Questo rende possibile esperimenti di clonaggio, ovvero inserzione di DNA in un plasmide. Da una parte questo possibile perch noi possiamo aprire un plasmide in un singolo punto con gli enzimi di restrizione, e poi con la ligasi saldare un frammento di DNA eterologo tagliato con lo stesso enzima di restrizione. Richiudendo con la ligasi, si pu riottenere la circolarit del plasmide, ma il plasmide allungato da una zona di DNA eterologo. Da questo deriva il termine DNA ricombinante, con cui si intende la ricombinazione in vitro di DNA di origini diverse: da una parte quello plasmidico, tipicamente batterico, dall'altra un DNA di qualunque origine. Ci sono delle evidenze che batteri abbiano ottenuto dei geni eucariotici, ma comunque la probabilit che avvenga un fenomeno di questo genere in natura bassissima. Si opera sia in vivo che in vitro. Un tipico esperimento vede la partecipazione di un batterio contenente un certo plasmide, che chiamiamo vettore di clonaggio; purifichiamo poi il plasmide, operazione abbastanza facile e realizzabile in meno di un'ora. In genere, permettendo al batterio di moltiplicarsi, si pu ottenere un numero maggiore di plasmidi. I plasmidi purificati vengono poi manipolati in vitro: si aprono con enzimi di restrizione e si richiudono con ligasi in modo che rimanga inserito un frammento eterologo di DNA. Con un altro procedimento, detto trasformazione batterica, si possono inserire questi plasmidi manipolati in vitro in un batterio libero da altri plasmidi. Il batterio pi utilizzato E. coli. Il risultato dell'operazione consiste nel fatto che abbiamo batteri contenenti DNA manipolato, rendendo possibile la purificazione successiva di grandi quantit di questo plasmide. Il plasmide, una volta purificato, o viene reinserito in una cellula batterica, oppure in un lievito, o in cellule animali in coltura; infine, con un DNA di questo tipo, si possono produrre animali e piante transgenici. Il sistema pi utilizzato di espressione di proteine eterologhe coinvolge i batteri, ma possono essere usate anche altre cellule.

In vitro quindi si ottiene l'apertura del vettore di clonaggio, inseriamo la porzione eterologa, richiudiamo, e trasformiamo un batterio, per poi purificare di nuovo il plasmide ricombinante. Questa un'operazione che essenzialmente serve per studiare questo DNA, per sequenziare, etc. Da poche copie ne dobbiamo ottenere tante per poi poterle analizzare. Quello che si fa quindi clonare questo frammento di DNA Clonare un frammento di DNA significa produrne tante copie. Tuttavia, in questo modo non stiamo sfruttando appieno il DNA, perch un frammento pu contenere informazione sotto forma di sequenza codificante. L'informazione di una sequenza codificante perfettamente leggibile anche da parte di una cellula batterica, anche se il messaggio di un eucariota superiore, perch il codice genetico universale. Quindi, una sequenza codificante di una proteina umana ha esattamente lo stesso significato anche in una cellula batterica. Un messaggio di albumina umana contiene lo stesso messaggio in una cellula batterica. Il nostro frammento di DNA quindi una open reading frame, ovvero una sequenza potenzialmente capace di produrre una proteina. Se si inserisce in una sequenza di questo tipo in un plasmide, ponendola sotto il controllo di un promotore, questa sequenza diventa non solo presente nel plasmide, ma anche nell'ambito di un gene. Il promotore promuove la trascrizione della sequenza a valle, quindi nel batterio si avr produzione di mRNA contenenti questa open reading frame, che verr letta dal macchinario di traduzione proteica, portando alla produzione di una proteina. In altre parole, inserendo semplicemente una sequenza codificante a valle di un promotore si pu dare espressione fenotipica a un gene: quindi trascriverlo, produrre un mRNA. Si pu ottenere questo grazie a un promotore. Se il trascritto contiene una open reading frame (cio un AUG, seguito da un certo numero di codoni capaci di specificare per aminoacidi, e infine un codone di stop) il batterio sar costretto a tradurre questo mRNA. Questa la modalit comunemente utilizzata per produrre proteine eterologhe in batteri. Il batterio letteralmente si riempir di qualsiasi proteina vogliamo tradurre. In questo modo sono prodotti i biofarmaci.

Biochimica 20-05-09 [Prof. Raugei]


Con lo scopo di tenersi aggiornati, pochi giorni fa su Nature Genetics uscito un articolo che presentava il risultato uno studio molto approfondito sui retrotrasposoni. Questo lavoro getta una luce nuova sulla possibile funzione di questi elementi del nostro genoma, che vengono trascritti, grazie alla presenza di sequenze, alle loro estremit, che fungono da promotori, anche molto forti. Lo studio ha analizzato i trascritti di tutti i retrotrasposoni, trovando che si verifica un'espressione tessuto-specifica; non tutti i trasposoni vengono espressi sempre in tutti i tessuti. Inoltre stato visto che molti degli inizi di trascrizione di altri geni sono influenzati dai trasposoni. I trasposoni influenzano la trascrizione di geni che codificano per proteine; alcuni perch sono al 5' e tendono ad attivare questi geni, altri perch sono al 3' e tendono a disattivarli. Vediamo quindi una forte vocazione regolatoria di questi elementi. La loro tessuto-specificit non fa che confermare questo fatto. Un'altra novit che i retrotrasposoni vengono trascritti, ma i trascritti nella maggioranza dei casi i trascritti rimangono in ambito nucleare. La retrotrascrizione accade abbastanza raramente. Questo esperimento ha fatto uso di una tecnica molto complessa che permette un'analisi di tipo globale dei trascritti; in un solo esperimento si analizzano tutti i trascritti in un tipo cellulare, e si possano comparare con i trascritti di un'altro citotipo. Si tratta di analisi estremamente potenti che generano milioni di dati in un solo esperimento, richiedendo analisi computerizzate molto sofisticate. Riprendendo l'argomento di ieri, avevamo visto a grandi linee gli eventi che caratterizzano gli esperimenti di clonaggio. Abbiamo un vettore di clonaggio, o plasmide, che, sfruttando un sito di restrizione singolo riconosciuto da una endonucleasi specifica, viene linearizzato. Se poi si mettono a contatto dei frammenti eterologhi di DNA con questo plasmide, si possono poi sfruttare delle ligasi per ottenere una molecola di

DNA ricombinante, cio del DNA batterico (il plasmide) in cui stato inserito DNA di qualsivoglia origine. Questo plasmide ricombinante ottenuto in vitro viene inserito in una cellula mediante trasformazione. Nel caso dei batteri, si devono superare due barriere: la parete cellulare e il doppio strato fosfolipidico della parete citoplasmatica. Il DNA una molecola gigantesca, difficile che superi il doppio strato fosfolipidico. Per cui, si mandano incontro i batteri a degli shock salini, che provocano la formazione di soluzioni di continuit (non letali) nella parete dei batteri e nella membrana plasmatica; in rari casi, il DNA pu entrare all'interno del batterio. A questo punto diventa importante la selezione con l'ampicillina. Se abbiamo un miliardo di batteri che hanno subito questo trattamento, come facciamo a sapere quali sono i pochi che hanno acquisito il plasmide? Se il plasmide conteneva un gene per la resistenza all'ampicillina, si mettono in contatto le cellule con l'antibiotico, e tutte le cellule che non hanno acquisito il plasmide muoiono. Le cellule che invece l'hanno acquisito sono resistenti e possono sopravvivere, formando colonie. Una volta che abbiamo selezionato le cellule, si possono far moltiplicare, cos possiamo avere molte copie del plasmide, che pu essere purificato per essere sequenziato, etc. Questo era un vettore di clonaggio. Quello che interessante per il vettore di espressione, di cui avevamo iniziato a parlare la volta scorsa. Si tratta di un plasmide in cui si inserisce un frammento eterologo allo scopo di ottenere l'espressione dell'informazione che questo frammento contiene dove per informazione si intende una sequenza codificante. Il frammento in altre parole una open reading frame: una sequenza che comincia con un AUG, un certo numero di codoni codificanti per aminoacidi (pi di 50), e un codone di stop. Questa sequenza potenzialmente codificante; per esserlo in atto, deve essere trascritta in RNA come succede per un normale gene, e poi l'mRNA deve essere tradotto. Tutto questo molto semplice da realizzare, essenzialmente basta mettere la sequenza a valle di un promotore. Questa una affermazione naturalmente approssimata, ma non cos tanto. La sequenza a valle di un promotore viene trascritta indipendentemente dal suo contenuto, fino al terminatore. A questo punto, se nella sequenza c' una open reading frame, la cellula batterica tradurr automaticamente la sequenza perch i ribosomi batterici incontreranno un AUG. Un promotore forte viene riconosciuto dalla RNA polimerasi della cellula molto spesso nell'unit di tempo. I promotori deboli invece sono quelli per i quali la traduzione inizia meno spesso nell'unit di tempo. Spesso i promotori forti sono presi dai geni virali. La strategia dei virus infatti quella di costringere la cellula a trascrivere i propri geni. I promotori virali si sono evoluti in modo da venir scelti pi spesso dei promotori batterici. Spesso isoliamo dal genoma virale queste sequenze, e a valle si inserisce la sequenza codificante. Senza entrare nei dettagli tecnici, con le tecniche odierne possibile ottenere un DNA di qualunque sequenza si vuole. Una volta elaborato il progetto di una sequenza, in qualche modo si pu realizzare. Una volta che si ottenuto il plasmide ricombinante, il batterio inizier ad esprimere la proteina eterologa. In genere, in un plasmide di questo tipo troveremo: 1) un'origine di replicazione; 2) la resistenza all'antibiotico, che consente la selezione dei batteri che hanno assunto il plasmide; 3) il promotore forte; 4) a valle di questo, l'inizio della trascrizione; 5) volendo, si pu far s che sia presente la sequenza di Shine-Dalgarno, che indirizza l'mRNA al ribosoma, favorendo l'inizio della traduzione; 6) la sequenza codificante; 7) il terminatore. La sequenza trascriver una sequenza codificante, con un AUG, i vari codoni senso, e infine un codone di stop. Con uno schema del genere, si pu esprimere in teoria qualunque proteina cambiando la sequenza codificante. Conoscendo la struttura primaria di una proteina, si pu anche scriverne la sequenza manualmente, aminoacido per aminoacido. un sistema estremamente flessibile. Esaminiamo alcuni esempi pratici, reali, di espressione. Qualche anno fa andavano di moda i detersivi agli enzimi, che erano delle lipasi che aiutavano il lavaggio della biancheria perch in grado di sciogliere i grassi. Queste lipasi erano prodotte proprio con la tecnologia del DNA ricombinante. Le lipasi in questione erano quelle prodotte da Pseudomonas, scelte per la loro resistenza alla temperatura, cosicch potessero operare anche alle alte temperature della lavatrice. Tuttavia, le colture di Pseudomonas non avrebbero mai prodotto quantit di enzimi abbastanza elevate da far risultare il processo conveniente. Per cui, si inser il gene che codificava per le lipasi e si inser in un vettore di espressione. Come i tipici geni procariotici, anche questo ha un promotore, la sequenza di adesione al ribosoma, l'open reading frame, e il terminatore. I ricercatori isolarono la sequenza codificante per la lipasi dal genoma di Pseudomonas, e la inserirono senza ulteriori modifiche, in un vettore di espressione come quello che abbiamo descritto. La struttura di un normale gene

ricostituita all'interno del vettore: la differenza sta nel fatto che, se associata ad un promotore forte, la sequenza verr espressa migliaia di volte di pi di quanto lo sarebbe nel suo contesto naturale. Pseudomonas non interessato alla produzione in serie dell'enzima, ma solo a produrne la quantit necessaria alle sue esigenze: il promotore debole, perch consente un utilizzo adatto nella fisiologia del batterio. Nel vettore, non solo il promotore forte, ma probabile che sia presente in decine di copie nella cellula, dato che i plasmidi possono essere anche 100. Tutto questo fa s che nella cellula batterica con questi vettori di espressione, la proteina diventi quella largamente pi rappresentata nel batterio, arrivando a raggiungere un'espressione pari al 30% delle proteine totali. Il batterio costretto a produrre quantit abnormi della proteina. Poi, si possono raccogliere le cellule batteriche e purificare la proteina. Nel caso dei biofarmaci, la purificazione dovr essere molto accurata. Abbiamo visto un caso semplice, in cui avevamo una sequenza codificante per una certa proteina, che abbiamo preso dal suo contesto naturale e inserito in un vettore d'espressione. Questo per i batteri facile, perch i geni sono continui, e hanno la stessa sequenza dell'mRNA che viene trascritto. Per tutti i geni batterici possiamo seguire il procedimento che abbiamo descritto. I geni eucariotici hanno invece il difetto di essere, nella grande maggioranza, geni interrotti, in quanto presentano degli introni. In un caso del genere, la sequenza codificante, nel gene, estremamente dispersa. Se in un vettore d'espressione batterico inserissimo la sequenza del gene, introni compresi, il batterio avrebbe davanti una sequenza che per il suo sistema di traduzione non ha alcun significato: nei batteri non avviene lo splicing. Arrivato alla fine del primo esone, tradurrebbe una sequenza che non un'open reading frame, e non ne verrebbe fuori una proteina produttiva, probabilmente. Dov' che in un eucariota troviamo la sequenza codificante? Nell'mRNA, una molecola che ha subito lo splicing, l'eliminazione degli introni. Insomma, l'mRNA che ci interessa, e che contiene la sequenza codificante di una qualsiasi delle nostre proteine. Negli eucarioti, gli open reading frame si trovano a livello degli mRNA, non nei geni o meglio, sono nei geni, ma non sono continue. Non possibile tecnicamente inserire una molecola di RNA in un plasmide, perch non DNA. Di nuovo, prendiamo in prestito qualcosa che in natura esiste gi. Avremmo bisogno di trasformare in DNA questo RNA, e abbiamo trovato un processo di questo tipo proprio affrontando uno degli ultimi argomenti, a proposito di retrotrasposoni e retrovirus. Del resto, anche gli pseudogeni da retrotrascrizione: questi erano degli mRNA erroneamente retrotrascritti e incorporati nel genoma. Essenzialmente, in vitro si pu retrotrascrivere un mRNA, e poi ricavare un'open reading frame in DNA, che si pu inserire nel vettore d'espressione. L'mRNA viene copiato da una trascrittasi inversa questa una DNA polimerasi, e ha bisogno di un innesco, sotto forma di un oligonucleotide facilmente sintetizzabile in laboratorio. In genere, questo oligonucleotide un poliT, perch gli mRNA eucariotici hanno una coda di poliA. Un innesco di poliT si appaia alla coda di poliA. C' quindi un 3'OH libero per iniziare la sintesi, e un filamento stampo. La trascrittasi inversa una DNA polimerasi RNA-dipendente, quindi in questo caso il filamento stampo a RNA. Una volta che stato copiato il primo filamento, abbiamo gi trasferito l'informazione dell'mRNA in DNA. A questo punto, si pu eliminare il filamento di mRNA, cosa che si pu fare aumentando il pH, dato che l'RNA una molecola pi labile del DNA. A pH 12-13, l'RNA si idrolizza, mentre il DNA non ne risente affatto. Rimane dunque il singolo filamento di DNA, e a questo punto con una serie di artifici che possiamo evitare di descrivere, si sintetizza il secondo filamento con una DNA polimerasi. Questo secondo filamento ha la stessa sequenza dell'mRNA originale, e si tratta di un cDNA. Questa sequenza si pu a questo punto inserire in un vettore di espressione: nonostante sia di origine eucariotica, per un batterio equivale ad una qualunque sequenza codificante. A questo punto non si pu pi distinguere se la sequenza codificante di origine batterica o eucariotica, dato che come struttura sono indistinguibili a questo punto. Ricapitolando, una qualsiasi sequenza derivata da un mRNA, se ritrascritta in un doppio filamento di DNA, pu essere inserita in un vettore di espressione. Abbiamo visto come inserire una qualunque sequenza codificante, di qualsiasi origine, in un vettore di espressione batterico. In questo modo, si pu far s che in un batterio venga espressa qualunque proteina. Si tratta di una modalit di produzione di proteine molto veloce ed economica.

Il sistema si pu applicare non solo ai batteri, ma anche ad altri sistemi come i lieviti, le cellule animali in coltura, etc. La conoscenza di questi meccanismi aumentata molto da quando si sono rese disponibili tecniche per sequenziare i cDNA, che consente, di fatto, di analizzare le sequenze di un mRNA. Inizialmente, si trova la parte 5' non tradotta, che esiste in tutti gli mRNA ma non serve per la traduzione. Si trova poi l'ATG (ovvero, l'AUG questo un cDNA!), seguito dai codoni per gli aminoacidi che compongono la proteina. Alla fine, si trova un codone di stop. Tuttavia, sequenziando la proteina purificata per la quale questa sequenza codificherebbe, si possono trovare delle differenze tra la sequenza dell'mRNA e la sequenza aminoacidica della proteina in vivo. Questo pu essere dovuto alla presenza, per esempio, di sequenze segnale nel caso delle proteine di secrezione, che non sono presenti poi nella proteina in vivo, perch vengono immediatamente tagliate. Ecco come sono state scoperte sequenze come queste. Dopo il codone di stop, vi una sequenza al 3' non tradotta, che non ha valore traduzionale. Con il clonaggio dei cDNA stato possibile avere la copia degli mRNA, il che stato prezioso per capire qual' la struttura della proteina nel momento in cui viene sintetizzata. Questo ha senz'altro contribuito alla nascita delle biotecnologie a DNA. Le biotecnologie come tali esistono da sempre, fin da quando l'uomo ha iniziato a selezionare gli incroci di specie di piante simili al fine di ottenere specie pi produttive o pi resistenti. Anche per gli animali da allevamento successa la stessa cosa. Le biotecnologie moderne nascono negli anni '70 e fioriscono negli anni '80. Oggi quando si parla di biotecnologie essenzialmente ci si riferisce alle biotecnologie che fanno uso di tecnologie del DNA ricombinante. Oggi le biotecnologie come queste, che permettono di mettere in contatto di frammenti di DNA di origine diversa, si avvalgono delle conoscenze della genetica, della biochimica e della biologia molecolare. Queste tecnologie sono usate anche a fini medici: si creano microorganismi geneticamente modificata. Un batterio in cui si inserisce un vettore d'espressione contenente la sequenza codificante per l'albumina umana un microorganismo geneticamente modificato (MOGM), perch ha un genoma diverso dal batterio comune. Questi sono diversi dagli OGM, piante o animali geneticamente modificati. OGM un acronimo che oggi viene guardato con sospetto dall'opinione pubblica, sospetto in minima parte giustificato, ma in larga parte sfruttato per altri motivi. Tra l'altro, il timore soprattutto verso gli OGM, mentre gli MOGM sono poco conosciuti. A fini medici, per la produzione di biofarmaci, gli MOGM sono largamente utilizzati, e poi cellule animali geneticamente modificate. ...(?) Dove sono le differenze? Se si comparano le differenze del genoma di individui diversi, le differenze a livello genico (cio, dei geni che producono proteine) sono pochissime; probabilmente, gran parte delle differenze saranno a livello di trasposoni, sequenze altamente ripetute etc. Sembra che la differenza sia soprattutto quantitativa: intere zone di genoma che mancano in un individuo e sono presenti in un altro. Questo sembra confermare che queste zone non hanno praticamente nessuna utilit; altre sequenze rientreranno nel quadro della variabilit genetica. Riprendendo il discorso sui biofarmaci, cerchiamo di capire meglio cosa sono. I farmaci sono molecole a base organica con particolari funzioni farmacologiche. I biofarmaci sono farmaci a base proteica. Le proteine si ottengono solo da organismi; si possono anche sintetizzare, ma in maniera molto laboriosa. Sintetizzare polipeptidi con pi di 20 aminoacidi un'operazione molto complessa: pi facile farlo fare ad un batterio o comunque ad una cellula. In un primo tempo, i biofarmaci sono stati utilizzati per replicare la funzione di proteine difettive; per esempio, insulina per i diabetici; fattori di coagulazione negli emofiliaci, etc. La loro attivit replicava quella della proteina naturale. Esistono poi biofarmaci che bloccano la funzione di altre proteine. Per esempio, abbiamo visto che tra i protooncogeni esistono recettori di membrana che diventano costituzionalmente attivi. Se si trova una

molecola che riesce a bloccare la dimerizzazione dei recettori, questa potrebbe essere un candidato interessante come farmaco inibitori. Altri farmaci sono detti Decoy receptor, molecole che riconoscono altre molecole e le inibiscono. Anche gli anticorpi sono biofarmaci, una classe di biofarmaci importantissima di cui ci sar modo di parlare meglio. Oggi i biofarmaci rappresentano circa il 30% del prodotto farmaceutico mondiale, e si pensa che in pochi anni diverranno preponderanti in pochi anni. In particolare, si prevede una vasta applicazione nel campo dell'oncologia. In generale, il campo dei biofarmaci cresce di giorno in giorno. I biofarmaci trovano la loro forza nella loro grande specificit. L'ottica del biofarmaco quella di andare ad interagire esattamente con il meccanismo che interessa, minimizzando cos gli effetti collaterali questo nella cura dei tumori importantissimo. I classici farmaci antitumorali erano sostanze che andavano ad inibire la sintesi del DNA. Dato che le cellule tumorali sono cellule in rapida proliferazione. Inibendo la replicazione del DNA, si inibisce la replicazione delle cellule tumorali, ma anche di tutte le altre cellule dell'organismo, con gravi effetti collaterali, anche se non letali, e questo ci fa capire come nel nostro organismo le cellule che si replicano in realt sono poche. L'effetto pi vistoso la perdita (anche se reversibile) dei capelli; un effetto collaterale clinicamente pi rilevante l'immunodepressione, dato che un altro sito di proliferazione cellulare il midollo osseo, dove vengono prodotti anche i globuli bianchi, responsabili della risposta immunitaria. Insomma, erano farmaci paragonabili a delle bombe in grado di distruggere molti obiettivi, lanciate nella speranza di distruggerne uno. Questi farmaci sono usati ancora oggi, almeno in certi casi, ma sono molto pesanti. L'ideale sarebbe un proiettile in grado di colpire esattamente un certo recettore importante per la genesi di un tumore, presente solo su certe cellule. I biofarmaci, almeno in prospettiva, hanno la potenzialit di poter essere estremamente specifici. Per adesso, non sembra possibile individuare LA cura per il cancro, ma potrebbe essere verosimile, nel prossimo futuro, l'esistenza di centinaia di cure diverse per i tumori, che potranno essere selezionati per la terapia con una diagnosi estremamente precisa. In ogni caso, la chirurgia oggi come oggi lo strumento principale per la terapia dei tumori solidi. Per altri tumori, come le leucemia, i farmaci funzionano molto bene. In alcuni casi anche possibile aggiungere o cambiare volutamente degli aminoacidi all'interno di una molecola biologica per migliorare la sua azione dal punto di vista farmacologico; non si usa quindi solo il prodotto naturale, ma anche delle sequenze mutate, in cui alcuni codoni sono stati cambiati, sfruttando tecnologie di cui non parleremo, ma che sono piuttosto comuni. Di nuovo, possibile realizzare praticamente qualunque sequenze. Oggi molti biofarmaci sono proteine modificate per ragioni brevettuali, a dire il vero: non possibile brevettare l'insulina umana, ma possibile brevettare proteine differenti per pochi aminoacidi, perch non sono pi insulina. Tuttavia, vero che certe volte possibile migliorare una molecola con una mutazione, ma altre volte le ragioni sono pi economiche. Perch produrre una proteina ricombinante? Perch produrre i biofarmaci? Si fa una crescita in vitro della coltura batterica che contiene il vettore d'espressione, e poi in vari modi si purifica la proteina. I vantaggi sono ovvi: -Si possono ottenere proteine in quantit virtualmente illuminata con pochissimi sforzi (sfruttando fermentatori della capacit di m3). Un litro di coltura batterica pu fornire quantit di proteina nell'ordine delle centinaia di mg con 10 litri di coltura batterica si pu produrre biofarmaco in quantit nell'ordine dei grammi, e i biofarmaci vengono utilizzati in dosi di g. In termini quantitativi, facile produrre biofarmaci. Inoltre, siccome sono proteine molto espresse nei batteri, si possono purificare in maniera molto facile. - I biofarmaci sono relativamente economici. Tuttavia, le company che producono i biofarmaci in genere li fanno pagare a un prezzo elevato rispetto ai costi di produzione per poter recuperare i costi del loro sviluppo possibile per che la concorrenza tra aziende farmaceutiche possa ridurre i costi.

- I biofarmaci sono sicuri. Per esempio, l'emofilia, una patologia originata dalla carenza di uno dei fattori di coagulazione (nel caso pi comune, del fattore VIII), fino a 15 anni fa era trattata con trasfusioni regolari di sangue. Dal sangue che riceveva, l'emofiliaco poteva trarre il fattore VIII e vivere una vita relativamente normale. In effetti, a causa di queste trasfusioni, ci sono stati molti casi di infezioni di HIV tra gli emofiliaci. Oggi il sangue pi sicuro, grazie ai test che vengono effettuati sulle sacche, ma non si pu escludere che un domani vi sia una nuova infezione da parte di un virus sconosciuto che possa infettare chi riceve trasfusioni. Oggi come oggi, i cosidetti emoderivati vengono usati solo in casi di estrema necessit. Infatti, il fattore VIII stato una delle prime proteine ricombinanti ad essere prodotte certo che non esistono virus comuni tra un batterio e l'uomo. Da questo punto di vista, i prodotti sono assolutamente sicuri. Anche altri biofarmaci sono prodotti da cellule animali in coltura, ma, quando possibile, mai da cellule umane, perch potrebbero portare un virus. Spesso si utilizzano cellule di insetti si tratta di cellule praticamente uguali alle nostre, e ci possiamo quindi esprimere proteine umane, ma allo stesso tempo sono sicure da virus. Ci sono per dei problemi che necessario conoscere. Per esempio, possibile produrre un enzima, purificandolo da E.coli, essendo certi che la sua sequenza primaria quella corretta, ma testando enzimaticamente la proteina non funziona. Questo pu succede, per esempio, per la presenza di modificazioni post-traduzionali: ci sono proteine che necessitano di essere glicosilate per poter funzionare. Queste proteine non potranno essere tradotte nei batteri, perch non hanno un apparato per la glicosilazione. In generale, se siamo a conoscenza del fatto che le proteine dovranno subire delle modificazioni posttraduzionali, non le potremo tradurre nei batteri. Tuttavia, anche una proteina che non deve subire modificazioni post traduzionali, se espressa nel batterio non funziona lo stesso. Questo pu succedere per esempio perch la struttura terziaria non corretta. Le proteine, mentre sono prodotte a livello del ribosoma, acquisiscono via via il folding, il ripiegamento tridimensionale, che una caratteristica essenziale della proteina. Scaldando le proteine infatti si rompono i legami deboli che guidano le interazioni tra le catene laterali degli aminoacidi, e questo si chiama denaturazione. Se si abbassa di nuovo la temperatura, da un punto di vista termodinamico, la proteina non ha una sola struttura terziaria stabile a temperatura ambiente, ma in teoria ne ha decine diverse, delle quali solo una quella naturale. Il pi delle volte, la proteina non riprende la struttura giusta, ma prende una delle decine di strutture termodinamicamente plausibili. per questo che la proteina si denatura; questo il fenomeno per cui l'albume dell'uovo, trasparente prima della cottura, diventa bianco via via che si cuoce, ma, una volta spenta la fiamma, non ritorna trasparente: le sue proteine oramai sono denaturate. Ritornando ai biofarmaci, l'ambiente del batterio diverso da quello di una cellula eucariotica, e la proteina viene fuori con una conformazione tridimensionale diversa da quella che avrebbe nella cellula eucariotica. Il folding delle proteine nei procarioti leggermente diverso. In entrambe le cellule, esiste il sistema delle proteine chaperone. Lo chaperone, tipica figura del secolo scorso, era un accompagnatore, che usciva insieme ad una coppia di fidanzati per assicurarsi che la moralit fosse rispettata. Le proteine chaperone aiutano il folding delle proteine. Mentre la proteina sta uscendo dal ribosoma, viene subito complessata con queste proteine, che aderiscono alla proteina nascente guidandone il folding. Uno dei problemi principali sta nel fatto che le proteine hanno zone idrofobiche che tendono ad aggregarsi tra loro per sfuggire all'ambiente acquoso. Le proteine cheperone aderiscono a queste zone idrofobiche impedendo l'aggregazione delle proteine, per essere poi rimosse successivamente, in modo che la proteina possa alla fine avere il suo folding finale. Il folding estremamente importante, ed un malfunzionamento di questi meccanismi all'origine di molte patologie cosiddette da accumulo, come l'Alzheimer, o la malattia della mucca pazza. Sono tutte malattie in cui si ha accumulo all'interno delle cellule di materiale proteico, dovuto al fatto che le proteine si sono appiccicate tra loro in maniera anomala, formando degli ammassi che portano le cellule all'apoptosi. Altre proteine sono dette chaperonine, e sono pi complesse, e servono per il ripiegamento delle proteine con una struttura tridimensionale ancora pi complessa. Questi sistemi esistono sia in procarioti che in eucarioti, ma sono diversi tra loro, per cui una proteina

eucariotica pu non trovare l'assistenza necessaria per avere il ripiegamento corretto. Questo si pu vedere solo sperimentalmente. Ci sono delle tecniche per tentare di rinaturare la proteina, ma non sempre funzionano, e a quel punto si deve abbandonare il sistema di espressione batterico. Questo succede, circa, nel 30% dei casi. Nella maggioranza delle proteine, tuttavia, il sistema batterico sfruttabile. La prima proteina ricombinante prodotta stata l'insulina. Questa un a proteina piuttosto piccola, e che ha una profonda modificazione post-trascizionale in quanto proteina di secrezione. La prima ad essere sintetizzata la pre-proinsulina, che contiene ancora il peptide segnale; la proinsulina la forma della proteina che si trova all'interno del RER dopo che il peptide segnale stato eliminato. L'insulina viene prodotta come una singola catena (anche questo stato dimostrato quando si purificato l'mRNA dell'insulina): la proteina a livello del RER e poi del Golgi, subisce due tagli endopeptidasici, con cui viene rimossa la catena C, mentre la catena A e la catena B si legano, e a questo punto si ha la forma matura dell'insulina umana. Nel diabete di tipo I si ha carenza o assenza di produzione dell'insulina a livello del pancreas, per cui nei soggetti affetti da questa patologia la glicemia fuori controllo. La malattia viene trattata fornendo l'ormone: tutti i giorni necessario fare delle inizioni di insulina. Per tanto tempo l'insulina utilizzata stata di origine porcina, perch fortunatamente non un ormone specie-specifico, per cui l'insulina dei mammiferi funziona anche nel nostro organismo. Perch dunque c' stata la necessit di creare insulina ricombinante? Una certa quota di diabetici mostrava segni di resistenza. L'insulina porcina non identica a quella umana, ma ha alcuni aminoacidi di differenza. Questo fa s che in alcuni soggetti, 1/1000 circa, il sistema immunitario cominci a reagire, ed necessario aumentare sempre di pi la dose di insulina finch in questi soggetti qualunque sia la dose iniettata, viene eliminata immediatamente dagli anticorpi e la terapia diviene inutile. Questo era un problema socialmente rilevante, ma facilmente aggirabile con la tecnologia del DNA ricombinante. L'insulina una proteina semplice, ma viene prodotta in maniera molto complessa, a causa delle modificazioni post-traduzionali che deve subire. Per questo vengono utilizzati due ceppi batterici separati: uno che produce la catena A, e l'altro che produce la catena B. In un fermentatore, ci sono batteri che contengono un vettore di espressione con un promotore solo per la catena A; nell'altro fermentatore, i batteri contengono un vettore di espressione con un promotore solo per la catena B. Si purificano separatamente le due catene, e, in vitro, in ambiente blandamente ossidante si fanno formare i ponti disolfuro SS tra i due gruppi -SH di ciascuna catena. Infine, si forma la catena dell'insulina attiva. Con questo procedimento si formano anche dei prodotti non corretti, con ponti disolfuro in posizioni anomale, ma una quota accettabile di insulina viene sintetizzata nel modo giusto. Anche se una parte di proteina va persa, la sua facilit di produzione non rende questo un ostacolo. L'insulina pu essere poi utilizzata e usata in terapia. Un'altra proteina tra le prime ad essere prodotte stato l'ormone della crescita HGH (Human Growth Hormone), prodotto dall'ipofisi, e fondamentale per il corretto sviluppo delle ossa lunghe, in modo da avere un'altezza normale. Anche qui il problema era abbastanza semplice: vi era carenza di un'ormone proteico di 180 aminoacidi. La soluzione adottata un tempo era di purificare l'ormone della crescita dall'ipofisi di cadaveri (a differenza dell'insulina, l'HGH specie-specifico, serviva quello umano) e iniettarlo nei bambini, ma molti morivano per infezioni virali come succede quando si hanno scambi di materiale tra individui della stessa specie. La metodologia in questo caso fu molto semplice. Si ottenne il cDNA dall'mRNA purificato, si inser in un vettore di espressione, e l'HGH venne prodotto senza problemi. Oggi le proteine terapeutiche sono moltissime: l'insulina certamente la pi utilizzata, ma anche l'eritropoietina molto utile in individui con anemie ma il 99% dell'uso che viene fatto dell'eritropoietina a scopo di doping :) Una dei doping pi comuni per gli atleti l'EPO appunto, che consente di aumentare il numero di globuli rossi e non costa molto. Il CFU, Colony Stimulating Factor, un fattore di crescita che stimola la risposta immunitaria, e come tale molto utile negli individui immunodepressi. I fattori emofilici, non solo l'VIII, ma anche il X-A, sono tutti prodotti biotecnologicamente, cos come i vaccini ricombinanti.

Questi sono tutti biofarmaci di prima generazione, in cui le proteine sono uguali a quelle naturali. Poi si cominciato a studiare molecole diverse da quelle naturali, nel tentativo di migliorarne l'attivit farmacologica. In termini generali, si parla di muteine, molecole in cui sono state introdotte alcune mutazioni. La tecnica di mutagenesi molto semplice, e serve per introdurre codoni diversi. La modalit con cui ancora oggi si cambia un codone in una sequenza codificante per una proteina prevede che si faccia uso di un plasmide in cui sia stata inserita tale sequenza. Supponiamo di voler cambiare un codone per la cisteina (TGT o TGC) con il codone per una serina (TCN, dove N = una qualsiasi delle quattro basi). una modificazione minima, dato che tra i due aminoacidi c' un atomo di differenza: dove c' un S nella cisteina, la serina ha un O. Sostituendo la seconda base, dato che la prima casualmente la stessa, l'mRNA con questa mutazione produrr una proteina identica a prima, esclusa una cisteina al cui posto vi sar una serina. sufficiente sintetizzare una sequenza oligonucleotidica di DNA complementare ad una parte della sequenza della proteina normale, ma con un errore (per es. una G al posto di una T, cos che su un mRNA copiato venga inserita una C nella posizione da noi voluta). Si scalda poi il DNA corretto, in modo da separare la doppia elica e farla appaiare con il DNA da noi sintetizzato. I legami a idrogeno che si formano sono sufficienti a tenere insieme i due filamenti nonostante l'errore. In presenza di DNA polimerasi, questa copier l'intero plasmide a partire dall'oligonucleotide, per cui otterremo un plasmide doppio filamento, con due filamenti identici tra loro escluso un punto dove c' un miss match. A questo punto, si prende il plasmide a doppio filamento, e nel batterio, alla prima duplicazione, avremo un plasmide identico a quello non mutato, e un plasmide che invece avr inglobato la mutazione. In questo modo si ottiene un vettore d'espressione che consentir l'espressione di una proteina con un aminoacido di differenza.

Biochimica 21-05-09 [Prof. Raugei]


La volta scorsa abbiamo visto come una modificazione di un biofarmaco porti ad una alterazione delle qualit farmacologiche della proteina. Sfruttando un oligonucleotide con una sequenza sbagliata, si pu formare un secondo filamento che ha la sequenza identica a quello complementare escluso un punto. Ottenere una cosa del genere non difficile dal punto di vista tecnico. Ci che difficile stabilire cosa fare, non come fare. Una proteina o un enzima sono macromolecole estremamente complesse, e soltanto in pochi casi si conosce come funzionano. In genere, negli enzimi, c' un sito attivo, una tasca idrofobica, in cui si inserisce il substrato che poi viene idrolizzato in due prodotti, oppure in cui due substrati vengono legati insieme. Con analisi di sequenze e strutture tridimensionali, in molti casi si conoscono gli aminoacidi coinvolti nella catalisi. Tuttavia, la prova finale per capire quali aminoacidi sono realmente coinvolti nella catalisi la mutagenesi. Le tecniche che abbiano visto l'altra volta sono quindi utili anche per capire il funzionamento delle proteine a livello molto fine. Esiste una classe di enzimi chiamati fosfatasi, che esercitano una azione antagonista rispetto alle chinasi (defosforilano le proteine): l'aminoacido catalitico di questi enzimi una cisteina, che forma un intermedio fosforilato legandosi al gruppo fosfato presente su una tirosina del substrato da defosforilare. Se la cisteina viene sostituita da una serina, la catalisi non avviene pi perch il fosfato si lega pi facilmente ad S che ad O. Questa tuttavia dovrebbe essere una modificazione molto conservativa, perch serina e cisteina sono quasi identiche; la struttura della proteina verosimilmente rimane invariata, ma cambiando quel singolo aminoacido si compromette la catalisi, dunque se ne deduce che la cisteina l'aminoacido coinvolto nella catalisi. La mutagenesi stata molto utile per studi del genere in quanto , come si dice, sito-diretta, ovvero diretta a modificare in maniera controllata un singolo codone. Tuttavia, per essere sfruttata a pieno si deve avere a

monte una ipotesi forte, molto precisa. Insomma, nella mutagenesi, il grosso del lavoro viene prima. Si deve poter formulare un'ipotesi molto precisa: le proteine sono formate da migliaia di aminoacidi, non possibile procedere scegliendone uno a caso. Lo stesso vale anche in campo applicativo, se si vuole migliorare in senso farmacologico una certa molecola. necessario partire con una idea di cosa si vuol fare. Molti dei biofarmaci oggi in commercio derivano da mutazione, per due ragioni: da una parte, per migliorare l'attivit farmacologica di questi prodotti; dall'altra, per motivi di brevetto. Uno degli esempi pi interessanti offerto dalla PTA, attivatore tissutale del plasminogeno. Il plasminogeno una proteina che si trova nel sangue, ed parte del processo estremamente controllato della coagulazione. La coagulazione da una parte un evento assolutamente necessario (in caso di emorragia, importante che questa sia arrestata in poco tempo, grazie alla formazione di un tappo di fibrina), dall'altra la coagulazione non deve avvenire quando non ce n' bisogno. Esiste tutta una serie di patologie (infarti, ischemie cerebrali, etc.) che sono originate da anche minimi problemi di coagulazione. sufficiente la formazione di un piccolo trombo nel circolo sanguigno per bloccare arteriole che possono portare a ischemia (mancanza di flusso sanguigno a valle), con possibile morte di tessuto, e a questo punto si hanno infarti pi o meno gravi. Questo dovuto alla (rara) formazione di questi coaguli. Un farmaco come il PTA pu aiutare nella ripresa dall'evento patologico. Vediamo come funziona. Supponiamo che un coagulo di fibrina si sia formato in pratica corrisponde a quelle che nel linguaggio comune sono chiamate croste, e che si possono osservare pochi giorni dopo che ci si procurati una ferita; osservazione comune che, una volta che il tessuto cicatrizzato, la crosta sparisce. Questo avviene perch esiste un enzima, la plasmina, che attacca la fibrina idrolizzandola. Nella cascata di coagulazione esistono enzimi che vengono attivati per proteolisi; il plasminogeno uno di questi, e viene attivato a plasmina, che poi agisce sulla fibrina. Il responsabile di questa attivazione proprio il PTA, che quindi, di fatto, un fattore anti-coagulazione, in quanto contribuisce a sciogliere questi coaguli. Si tratta di una proteina che viene oggi ampiamente utilizzata in terapia intraospedaliera per trattare i casi post-infarto. uno dei pi potenti eliminatore di coaguli che si conosca, ed una endopeptidasi di una classe di proteasi dette a serina perch nel sito attivo c' una serina, oltre ad una istidina ed un aspartico. La definizione precisa di proteasi a serina e anche la scoperta del coinvolgimento degli altri due aminoacidi nel meccanismo di catalisi un esempio di studio attraverso mutagenesi. Una ventina di anni fa, la risposta conclusiva sul meccanismo di catalisi fu data da esperimenti mirati di mutagenesi. L'enzima non era pi in grado di idrolizzare il plasminogeno se uno dei tre aminoacidi veniva cambiato per mutagenesi. Qualsiasi cambiamento a livello di questi residui comprometteva l'attivit enzimatica dell'enzima. Oggi questo enzima viene prodotto in batteri con metodi praticamente identici a quelli che abbiamo visto: promotore forte, sequenza codificante, terminatore, vettore d'espressione in un sistema batterico. Naturalmente, questo farmaco viene utilizzato con estrema cautela, in quanto una dose esagerata pu portare ad emorragie interne. Proprio per questa sua pericolosit sono state attuate alcune mutazioni. Sul foglio illustrativo del medicinale viene scritto se si tratta di proteine mutate o nella forma nativa; nel primo caso, la formula utilizzata del tipo Thr-103-Asp, che significa che la treonina (Thr) in posizione 103 stata sostituita da una asparagina (Asp). In altri casi, viene utilizzata la nomenclatura ad una lettera per indicare gli aminoacidi. In ogni caso, la mutazione aumenta 10 volte la stabilit dell'enzima nel sangue. L'enzima, come tutte le proteine, ha un suo turnover nel siero, per cui a un certo punto viene attaccato da delle proteasi. Questo logico: essendo un enzima potenzialmente pericoloso, avr un turnover molto veloce, in modo che la sua quantit nel sangue possa essere pi finemente regolata. Il fatto che l'enzima venga degradato poche decine di minuti dopo che viene prodotto assicura che la sua quantit nel sangue non sia mai troppo elevata. La mutazione che stata introdotta, in qualche modo, la stabilit viene aumentata perch l'aminoacido sostituito a livello con il sito dove le specifiche proteasi agiscono, rendendo pi difficile il processo. Dato che l'enzima si mantiene pi a lungo del siero, se ne pu utilizzare meno. stato dimostrato che questo minimizza gli effetti collaterali (il crearsi di emorragie interne). Un'altra mutazione coinvolge una sequenza un po' pi estesa, e viene realizzata con altri tipi di tecniche rispetto a quella che abbiamo descritto. Un tetrapeptide che parte dall'aminoacido 296, con sequenza naturale Lisina-Istidina-Arginina-Arginina stato sostituito con quattro Alanine. Anche questa mutazione ha lo scopo di minimizzare la quantit di prodotto utilizzato, perch aumenta l'affinit dell'enzima per i coaguli di fibrina.

Il TPA infatti ha una certa affinit con la fibrina, per cui vi si lega; in questo modo, quando una molecola di plasminogeno arriva nei pressi del complesso TPA-fibrina, viene convertito in plasmina, e pu subito interagire con la fibrina perch le due molecole si trovano gi vicine. Il TPA ha quindi una certa affinit per la fibrina, ma non perch agisce su questa molecola. Con questa mutazione abbiamo detto che si aumenta questa affinit per la fibrina, quindi di fatto aumentiamo l'attivit di questo enzima, perch ne aumentiamo la concentrazione l dove serve, sui coaguli. stato dimostrato sperimentalmente che anche questo riduce gli effetti collaterali. Questo sforzo pe trovare dei mutanti che lo rendano meno pericoloso ci fa capire la gravit degli effetti collaterali. Tuttavia, in casi gravi, questo farmaco pu essere utilizzato. Proseguendo con i nostri esempi, anche nel caso dell'insulina i ricercatori si sono sforzati per trovare molecole pi funzionali. Per esempio, quando l'insulina viene prodotta anche naturalmente dalle cellule del pancreas non subito pronta; si aggrega in polimeri che per tendono a disgregarsi in poche decine di minuti. Quando l'insulina arriva ad essere un dimero o un monomero, capace di legarsi al recettore dell'insulina delle cellule bersaglio e abbassare la glicemia. Quindi, l'insulina naturale ha un suo tempo di latenza tra il momento in cui viene secreta e il momento in cui diviene attiva e questo vale anche per l'insulina prodotta in vitro, che tendono anch'esse ad aggregarsi. Sono state sviluppate mutazioni in entrambi i sensi, o per diminuire o per aumentare questa tendenza ad aggregarsi. Per esempio, una delle insuline ricombinanti pi utilizzate quella chiamata Lys-Pro; il nome deriva dal fatto che sono state invertite le posizioni 28 e 29 (naturalmente la sequenza Pro-Lys) e questo fa s che l'insulina formi meno polimeri. Nel momento in cui viene iniettata, gi prontamente attiva (ed per questo chiamata insulina pronta): una molecola di questo tipo si adatta bene ad un protocollo di terapia che prevede pi iniezioni in un giorno, per un controllo pi stretto sulla glicemia. Altre mutazioni cambiano le propriet di solubilit dell'insulina, che, nella forma naturale, a pH fisiologico relativamente solubile. Alcune mutazioni rendono l'insulina leggermente meno solubile a pH7, mentre a pH leggermente acido (intorno a 6) perfettamente solubile. Questa insulina viene prodotta e mantenuta a pH leggermente acido; quando viene iniettata sottocute, si ritrova a pH leggermente superiore a 7, e tende a precipitare, e viene poi rilasciata lentamente nelle ore successive. Questa insulina, detta lenta, si adatta a protocolli che prevedono inizioni meno frequenti (ogni due giorni, per esempio). Insomma, le caratteristiche delle insuline mutate le rendono adatte a diversi protocolli, che si adattano meglio a certi tipi di pazienti piuttosto che ad altri. L'insulina utilizzatissima in tutto il mondo, dato il grande numero di malati di diabete, e questo ha implementato la ricerca su questa proteina, portando a creare 15 insuline ricombinanti diverse. Si sta studiando, ormai da anni, il modo per realizzare insulina che possa essere assunta per via orale. Senz'altro prendere una pillola meglio che subire una iniezione. L'ostacolo pi grosso sta nell'assorbimento. Infatti, si pu evitare l'idrolisi a livello gastrico incapsulandola, e in questo modo facendola arrivare a livello intestinale. L'assorbimento a livello intestinale un problema, anche se non irrisolvibile. Si sta tentando di promuoverne l'assorbimento legandola ad altre molecole. Esistono dei peptidi idrofobici che facilitano l'ingresso di proteine delle cellule un fenomeno dimostrato sperimentalmente. A proposito di quest'ultima trovata, vediamo come sia possibile aggiungere un peptide ad una delle catene dell'insulina. Questa modalit consiste nel creare una proteina di fusione. Supponiamo di voler inserire un peptide segnale (potrebbe essere qualunque altro frammento proteico). Possiamo codificare il peptide da aggiungere naturalmente, come una proteina nativa. sufficiente che a livello della sequenza codificante si aggiungano dei codoni a monte, in modo tale che siano in frame, ovvero con lo stesso schema di lettura della proteina. sufficiente che dopo l'AUG iniziale si pongano i codoni della sequenza proteica che si vuole aggiungere, poi, all'ultimo codone della proteina aggiunta, lego il codone della proteina a cui ho aggiunto il peptide. Una proteina di fusione detta cos perch si sono fuse due sequenze codificanti diverse una di seguito all'altra. Un altro esempio molto interessante di proteine ricombinanti riguarda i vaccini ricombinanti. Un vaccino

prototipo di tutti i vaccini di questo tipo il vaccino della pertosse. Il vaccino della pertosse di per s non stato un vaccino che ha cambiato la vita della gente, ma c' da dire che adesso utilizzato, mentre prima non veniva utilizzato. stato importante perch stato il primo vaccino di questo tipo, e un giorno la ricerca potrebbe portare allo sviluppo di un vaccino per il colera. Vediamo prima di capire che cos' un vaccino: si tratta di un preparato iniettato per profilassi nei confronti di una malattia. Per esempio: la pertosse dovuta all'infezione di un batterio, la Bordetella pertussis; questa di per s non sarebbe una infezione seria, ma pu dare pertosse perch questo batterio produce una tossina. Si tratta di un enzima, una ADP-ribosilasi, la cui azione modifica le proteine. Ha come substrato il NAD, da cui prende un ADP-ribosio e lo aggiunge a particolari proteine, per esempio a proteine sulla superficie della membrana cellulare che regolano proteine G. Questa modificazione porta ad una disregolazione delle proteine G, e ad un disequilibrio ionico della cellula. Di fatto una sola molecola di tossina in grado di provocare la morte di una cellula. Tossine come questa, come quella botulinica, come la tossina del vibrione del colera, sono tutte tossine accomunate dal fatto di essere enzimi che attaccano proteine di superficie delle cellule, portando a morte la cellula su cui agiscono. Un tempo il vaccino consisteva nel purificare la tossina da una coltura del batterio, per poi denaturarla con calore o solventi inorganici rendendola non pi attiva. Una volta iniettata, il sistema immunitario era comunque in grado di riconoscerla come tossina, producendo anticorpi e cellule della memoria, in modo tale che un secondo contatto con la tossina innescasse una reazione rapida ed efficiente. Un vaccino del genere in grado di proteggere dalla malattia, come chiunque abbia contratto la pertosse. Questo sistema per aveva dei difetti: in una certa quota di casi la proteina tendeva a dare dei problemi anche gravi dovute a forti reazioni allergiche, circa in 1 caso su 10,000. Era necessario quindi trovare un vaccino che funzionasse meglio, e che avesse meno effetti collaterali. Questo vaccino stato sviluppato dalla Novartis, nello stabilimento che si trova a Siena, attualmente il pi grande centro mondiale di produzione di vaccini. stato proprio questo vaccino uno dei primi realizzati dalla compagnia. Il vaccino ha previsto la produzione di ceppi mutanti che annullassero l'attivit enzimatica della proteina. Questa proteina una tossina perch un enzima: se si annulla l'attivit enzimatica, questa proteina non dovrebbe essere pi tossica. Si clonata quindi la sequenza codificante, e sono cominciati esperimenti di mutagenesi mirati. Anche in questo caso, il grosso del lavoro stato a monte: capire dove andare a mutagenizzare. Era necessario capire qual era il sito attivo e quali mutazioni fossero in grado di comprometterne l'attivit. Sono state infine trovate due mutazioni, ognuna delle quali indipendentemente annulla l'attivit enzimatica, e con essa la tossicit della molecola. Si tratta di una proteina piuttosto grande, circa 600 aminoacidi. Cambiare uno o due aminoacidi significa non provocare grandi cambiamenti dal punto di vista strutturale, ma allo stesso tempo stata soppressa l'attivit enzimatica. Ci ritroviamo una proteina praticamente identica, che pu essere riconosciuta dal sistema immunitario. In effetti, si tratta di un ottimo vaccino. L'FDA americana, l'organismo di fatto mondiale che approva i farmaci, per ragioni di sicurezza esige che mutazioni siano sempre almeno due, indipendenti. Se la mutazione fosse una sola, c' sempre una probabilit non uguale a zero che in un batterio nel fermentatore avvenga casualmente una retromutazione (dato che il DNA muta continuamente), per cui ritorna l'aminoacido vecchio: a quel punto non viene pi prodotto vaccino, ma tossina. Visto che la tossicit di queste molecole enorme, questo sarebbe molto pericoloso. Se le mutazioni sono due, indipendenti tra loro, la probabilit diventa estremamente bassa, quasi uguale a zero: anche se avvenisse una sola mutazione, non sarebbe sufficiente a restaurare la tossicit della molecola. Con questa tecnologia si sta tentando di sviluppare un vaccino per il colera, che un enzima simile a questo. Questo un esempio che illustra come conoscere bene l'attivit enzimatica di una molecola possa servire per capire dove andare a colpire in una seconda. Ieri abbiamo visto come sia vantaggioso produrre proteine ricombinanti sfruttando batteri perch semplice, poco costoso, alla portata di ogni laboratorio, ma delle volte non possibile, perch per esempio ci possono essere dei problemi di folding. Per cui, alcune volte produciamo una proteina per la quale non ci sarebbe

nessuna ragione per non poterla produrre in un batterio, ma questa non funzionante. In questi casi bisogna ricorrere ad altri sistemi, sfruttando ad esempio i lieviti. Queste sono cellule molto diverse dai batteri perch sono eucarioti, anche se sempre possibile coltivarli in vitro, nonostante siano un po' pi lenti a crescere. Si crea anche in questo caso un plasmide ricombinante in vitro; la cosa particolarmente semplice perch anche nei lieviti esistono i plasmidi. Sono dei plasmidi che di fatto non hanno niente di diverso da quelli visti per i batteri. L'origine di replicazione diversa perch deve essere riconosciuta dal macchinario di replicazione del lievito, ma il loro funzionamento assimilabile ai plasmidi batterici. Un esempio di utilizzo di questo sistema dato dal vaccino per l'epatite B, una vaccinazione obbligatoria per chi opera in ambito sanitario. Questa una malattia dovuta al virus dell'epatite B, che possiede un capside su cui esposta una proteina ricombinante detta proteina S. In questo caso sembrava molto semplice produrre un vaccino, in quanto la proteina S sembrava quella pi esposta nel virus: se il nostro sistema immunitario fosse in grado di riconoscere e neutralizzare questa proteina, il problema potrebbe essere risolto. I ricercatori clonarono dal genoma del virus la sequenza codificante per la proteina S e la espressero in coli. Tuttavia, la proteina S, oltre che formare il capside, forma anche delle particelle dette ghost, che si ritrovano comunemente nei pazienti colpiti dal virus, e rappresentano dei capsidi che hanno fallito l'incapsidamento del materiale genetico del virus. Vengono espulsi dalle cellule come aggregati proteici, non come virus. Queste particelle, chiamate HGS (HG sta per antigene), venivano una volta purificate dal sangue dei malati, e costituivano un ottimo vaccino: era stato quindi dimostrato a priori che la proteina S come tale era un ottimo vaccino. Si pensava quindi che la produzione in E. coli avrebbe risolto il problema. Invece, nel batterio si otteneva la proteina con la struttura primaria corretta, ma la struttura tridimensionale era cos diversa che la proteina purificata da coli era fatta di monomeri, non c'era mai aggregazione. In soggetti in cui veniva iniettata questa preparazione, si verificava una reazione immunitaria, ma non protettiva per la malattia. La proteina era strutturalmente diversa rispetto alla proteina S. Una molecola del genere non era di nessuna utilit come vaccino. Il problema fu risolto inserendo la sequenza codificante in un plasmide di lievito, e facendo produrre la proteina al lievito. Si vide subito che le particelle che si ottenevano erano molto simili ai ghost di cui parlavamo prima, e questo a conferma che la struttura tridimensionale della proteina era abbastanza simile a quella naturale da far s che i monomeri proteici potessero ancora dare questi aggregati, che iniettati erano in grado di scatenare una reazione immunitaria protettiva. Questo un ottimo esempio di come un cambio di tecnologia pu risolvere un problema. Ci sono anche casi in cui tentare di produrre una proteina del tutto inutile, sia che si utilizzino batteri o lieviti, perch magari le proteine sono glicosilate o hanno delle strutture tridimensionali estremamente complesse. Un esempio in questo caso offerto dalle immunoglobuline (Ig), glicosilate e dotate di struttura quaternaria molto complessa. Per proteine di questo tipo, anche il lievito impotente: vero che il lievito glicosila le proprie proteine, ma in maniera molto diversa dagli altri eucarioti. Probabilmente questa glicosilazione particolare indurrebbe una forte reazione immunitaria. In tutti questi casi, in cui le modificazioni post-traduzionali sono pesanti, l'unica possibilit che abbiamo quella di usare un sistema il pi vicino possibile a quello naturale. Per esempio, se si parla di proteine umane, possiamo utilizzare qualsiasi mammifero o a volte insetti. Abbiamo allora cellule animali in coltura. Si tratta di un sistema utilizzatissimo. Le cellule animali in coltura si coltivano in piastre petri, molto piccole, o al massimo di una decina di cm. In genere, queste cellule, se sono di un tessuto solido, queste cellule per la loro sopravvivenza hanno la necessit di aderire ad un substrato, che in laboratorio costituito dalla piastra stessa. Se si staccano le cellule dal substrato queste vanno in apoptosi. Le cellule del sangue invece sono capaci di crescere in sospensione. Si parla di cellule in coltura primaria quando, per esempio, si prende un campione di tessuto, si mette in una piastra, e si osserva che alcune cellule che stavano proliferando in vivo (essenzialmente fibroblasti), danno pochi cicli proliferativi, e poi entrano in quiescienza fino alla morte. La durata della vita delle cellule dipende dal tessuto. Per produrre proteine ricombinanti, queste colture sono poco utilizzabili.

Esistono per le cellule immortalizzate: tutte quelle cellule che hanno acquisito la capacit di crescere indefinitamente in vitro. Per quanto molto pi complesse da coltivare, queste cellule diventano simili a dei batteri. Tali cellule sono piuttosto lente a riprodursi (un ciclo ogni 15-20 ore), ma essenzialmente si potr avere una coltura continua, ottenendo dopo un certo tempo molte piastre da una sola iniziale. Essenzialmente, queste cellule spesso derivano da tumori, cellule in cui saltato il meccanismo di controllo della proliferazione cellulare e che spontaneamente sono diventate capaci di proliferare indefinitamente, almeno in un ambiente adatto (con nutrienti, ossigeno, fattori di crescita, etc.). In pratica, si deve ricreare nelle colture l'ambiente corporeo. Alcune volte queste cellule derivano da tumori, altre volte l'infezione da parte di virus oncogenici sufficiente a renderle immortali. Queste cellule sono simili alle cellule normali, perch l'immortalizzazione comporta sempre una qualche dedifferenziazione delle cellule. Si in grado di riconoscere, per esempio, se una cellula tumorale di derivazione epatica, ma non una cellula epatica. Un tumore tanto pi grave quanto pi dedifferenziato. Inoltre, spesso si tratter non di cellule epatiche, ma di precursori. Comunque, se abbiamo una cellula epatica che ha acquisito la capacit di proliferare, in generale sar abbastanza simile ad una cellula epatica, tanto che, per esempio, probabilmente manterr la capacit di produrre albumina e altre proteine considerate marker degli epatociti. Cellule ulteriormente dedifferenziate perdono anche questa capacit, ma si pu affermare che in tutti i casi si tratta di cellule abbastanza simili a quelle dei tessuti di provenienza. Queste cellule hanno una proliferazione illiminata. Le prime cellule messe in coltura (negli anni '70) si chiamano HeLa, che deriva dal nome della paziente che aveva il carcinoma uterino da cui queste cellule sono state tratte. Sono in coltura ormai da quasi 40 anni, e si calcola che siano state prodotte in quantit nell'ordine della tonnellata. Oggi abbiamo migliaia di linee cellulari immortalizzate, spesso derivate da tumori, che possono essere congelate in opportune condizioni e conservate in azoto liquido. In questo modo le cellule si possono scambiare tra ricercatori, e sono molto utili nella ricerca perch fare ricerca su un epatocita immortalizzato approssima in maniera abbastanza buona una ricerca condotta su un reale epatocita del fegato. Oppure, possono essere utilizzate come produttori di proteine ricombinanti. In queste cellule il DNA ricombinante, con una apposita struttura, pu essere trasfettato: si pu far s che il DNA arrivi nel nucleo e sia espresso come un normale gene. Prima di tutto esaminiamo la struttura del vettore; si tratta di un plasmide su cui si lavora in vitro, di cui se ne pu ottenere una quantit illimitata trasferendolo in un batterio. Nella fattispecie si tratta di grossi plasmidi, che constano di due parti. In parte, abbiamo un plasmide di E.coli come lo conosciamo, con un Ori C, e un gene per la resistenza all'ampicillina che consente di tracciare il plasmide. Tutto il resto, un frammento eterologo. Se si inserisce in E. coli un plasmide di questo tipo, il batterio in grado di riconoscere l'Ori C e il gene di resistenza all'ampicillina. Quindi, il batterio diventer resistente all'antibiotico e sar in grado di replicare il plasmide: il frammento eterologo non ha alcun significato per il suo sistema di trascrizione, ma viene replicato normalmente. Si possono quindi ottenere grandi quantit di questo DNA. Le sequenze eterologhe che per un batterio non hanno significato, lo hanno quando il DNA raggiunge il nucleo di una cellula animale in coltura: c' la sequenza codificante per la proteina che si vuole produrre, a valle di un promotore eucariotico forte, che venga riconosciuto dalla RNA polimerasi II eucariotica. Anche in questo caso di solito prendiamo in prestito questo promotore da un virus. La sequenza avr poi un terminatore, e sar seguita da un gene con funzione simile a quella che aveva il gene per la resistenza all'antibiotico nei procarioti: selezionare le cellule che hanno acquisito il plasmide. In genere si tratta di un gene per la resistenza ad un veleno cellulare chiamato G418, che provoca la morte delle cellule con cui entra in contatto, a meno che queste non esprimano una resistenza. Riassumendo, il plasmide fatto di due parti: una parte di E. coli, che serve semplicemente a replicare tutto il resto; l'altra parte che acquista significato per il sistema di trascrizione eucariotico quando questo DNA viene trasferito nel nucleo delle cellule, e contiene due geni. La RNA polimerasi II non riconosce il promotore eucariotico, ma trascrive i due geni, uno per la proteina che vogliamo esprimere, e l'altro per la proteina che conferisce resistenza a G418. Quando il vettore nel nucleo, la cosa di per s non importante; vero che viene prodotta la proteina, ma il vettore non viene replicato, perch nelle cellule animali non ci sono plasmidi. Via via che le cellule proliferano, il vettore via via diluisce fino a sparire da una popolazione dopo qualche giorno. In pratica,

l'espressione episomiale avviene solo per qualche giorno, a meno che non avvenga casualmente un altro fenomeno, che quello dell'integrazione. Molto raramente, abbiamo l'integrazione nel genoma di questo DNA. Una cellula di questo tipo pu essere definita transgenica: una cellula che ha acquisito del DNA in pi, che contiene due geni, e questa cellula diventata anche resistente a G418. Quindi, se trattiamo la popolazione cellulare con questo veleno, mentre tutte le altre celule muoiono, la cellula che ha integrato pu sopravvivere. Il fatto che la cellula abbia integrato implica che quando avviene la replicazione del DNA, anche quello viene replicato, e dunque tutta la progenie di questa cellula conterr i due geni aggiuntivi e sar resistente a G418. Di fatto, quello che succede che si trasfetta il DNA nelle cellule su una piastra, e di solito in un paio di cellule della piastra avviene l'integrazione. Si aggiunge quindi G418 alla piastra, e, sebbene a prima vista sembra che tutte le cellule siano morte, in realt quelle due cellule sono sopravvissute, e in genere dopo qualche giorno si potranno vedere delle colonie sviluppatesi dalle cellule sopravvissute. In questo modo si possono ottenere alcune cellule in cui avviene la produzione di proteina, sia come proteina endocellulare che come proteina di secrezione (inserendo un peptide segnale). Se la proteina endocellulare, per ottenerla si devono lisare le cellule e poi purificarla. Qual il problema del trasferimento del DNA all'interno delle cellule? Il problema sta nel superamento della barriera costituita dal doppio strato fosfolipidico costituito dalla membrana plasmatica. La tecnica pi utilizzata prevede l'utilizzo dei liposomi. I liposomi sono costituiti da fosfolipidi che in acqua spontaneamente formano dei doppi strati sferici, molecolarmente identici alla membrana plasmatica. Se questa operazione si compie in presenza di un DNA, si formeranno delle micelle di questo tipo con all'interno del DNA. Mettendo i liposomi a contatto con le cellule, questi vi aderiscono, i doppi strati si fondono, e il DNA si trova nel citoplasma. Il passaggio del DNA al nucleo molto meno complesso, perch possiede i pori nucleari, ma non chiaro il meccanismo preciso con cui questo avviene. Una volta nel nucleo si visto che spesso il DNA rimane episomiale, per cui dopo un po' sparisce dalla popolazione cellulare, ma raramente si integra nel DNA e la cellula ha acquisito nuovi geni ed in grado di mantenerli. Il pericolo pi grosso di questo tipo di tecniche che le cellule possono facilmente essere contaminate da batteri. Si possono anche creare organismi animali transgenici, ovvero organismi nelle cui cellule possiamo ritrovare un certo gene in pi. I topi transgenici sono gli animali pi utilizzati, ma non ci sono ragioni per cui altri animali non dovrebbero essere realizzati. In genere si parte dallo zigote, anche se ci sono delle eccezioni; per esempio le stelle marine: se viene tagliato un braccio, il braccio ricresce, e dal moncone cresce un'altra stella marina. Come la prima cellula aveva l'informazione per creare l'organismo, siccome l'informazione la stessa per tutte le cellule, questa informazione c' anche in qualsiasi altra cellula. Nelle piante, possibile per moltissime specie far ricrescere un organismo intero a partire da una porzione di un altro organismo; negli animali di solito no, ma ci sono delle eccezioni. Si pensa che questo non sia possibile negli animali superiori perch il differenziamento cos complesso che pu avvenire solo nell'embriogenesi. Quindi, se vogliamo creare un animale transgenico, l'unica possibilit che abbiamo partire dallo zigote. Con tecniche di fecondazione in vitro, possibile creare uno zigote, che diventa embrione; poi deve essere impiantato in utero per il successivo sviluppo. Allo stadio di zigote, in vitro, si pu operare un traferimento di DNA direttamente a livello del nucleo: si inietta direttamente nel nucleo il DNA. Spesso il DNA in questo modo si integra. Gli zigoti poi vengono impiantati in animali pseudogravidi, ovvero trattati con ormoni in modo da creare una gravidanza farmacologica. In pratica, la stessa cosa che accade con la fecondazione artificiale. Si aspetta poi la nascita degli animali, per esempio topolini, e si effettuano delle analisi del DNA che confermino la presenza del gene. In caso affermativo, i topolini dovrebbero esprimere la proteina nei loro tessuti anche se dipende dal tipo di promotore utilizzato.

Pratiche come queste sono state di un'utilit enorme nel campo della ricerca, ad esempio per studiare funzioni delle proteine. Per esempio, se si sospetta che un gene sia un oncogene, che se espresso abbondantemente induce tumori, si produono topi transgenici che esprimono questa proteina a livelli elevati per cercare di dimostrare che sviluppa tumori. Si pu avere un'indicazione del ruolo della proteina, delle funzioni dei geni, etc. Un sistema di questo tipo utilizzabile a fini biotecnologici; se si utilizza un promotore tessuto-specifico, i cDNA che abbiamo clonato vengono espressi solo nelle cellule da noi desiderate. Per esempio, si potrebbe far s che solo le cellule delle ghiandole mammarie esprimano una certa proteina, che ritroveremmo poi nel latte. In pratica per questo sistema viene usato poco, dato che economicamente molto rischioso. Una mandria di animali transgenici si possono ammalare, per esempio; una coltura cellulare compromessa invece non un problema. Animali di questo tipo sono troppo preziosi singolarmente. Con la tecnica del knock-out di un gene, si pu eliminare l'espressione di un gene per studiarne la funzione.

Biochimica 26-05-09 [Prof. Raugei]


Oggi parleremo di immunoglobuline. Proteine come queste, e come altre che abbiamo visto (collagene, emoglobina) sono fondamentali, e dunque un corso introduttivo come questo non pu prescindere da esse. Noi vedremo le immunoglobuline molto sinteticamente, soprattutto dal punto di vista strutturale e di come vengono prodotte, senza occuparci se non quando necessario degli aspetti immunologici della questione. In corsi successivi lo studente avr modo di approfondire questi aspetti. Quando si parla di immunoglobuline (da adesso in poi Ig, ndr) si parla di una classe di molecole, molto simili tra loro, in cui le differenze tra una classe e un'altra sono sottili dal punto di vista strutturale ma fondamentali dal punto di vista funzionale. La struttura che vedremo pi in dettaglio sar quella delle IgG, che sono molto simili a tutte le altre. Le IgG sono le tipiche Ig della reazione immunitaria di tipo umorale. Molto in breve, la reazione immunitaria si divide in due grandi categorie: la reazione cellulare e la reazione umorale. La reazione umorale quella mediata dalle cellule B, che producono anticorpi, mentre quella cellulare mediata dalle cellule T. Per certi versi, la pi importante per certi tipi di malattie quest'ultima, ma non ne parleremo. Noi parleremo solo di Ig, che si trovano in circolo nel sangue (sono solubili) e sono prodotte dalle plasmacellule, che fanno parte della linea B. Le IgG sono quelle che mediano la risposta immunitaria umorale contro tossine, antigeni, batteri virus etc; sono di tipo monomerico. Le IgE mediano anch'esse reazioni di tipo patologico, in particolare di tipo allergico. Le IgA sono dei dimeri, quelle pi importanti a livello delle mucose, mediano reazioni immunitarie a livello intestinale. Le IgM sono quelle di pronto intervento; nel caso di infezioni etc. le pi attive saranno le IgG, ma verranno prodotte pi tardi. Le IgM sono invece prodotte subito. Facendo una ricerca sierologica per una certa infezione, troveremo IgG relative a infezioni anche di anni prima, mentre se troviamo IgM contro un certo antigene significa che l'infezione in corso o c' appena stata. Si tratta di quindi di una risposta molto rapida ma di breve durata. Per esempio, per la mononucleosi: se abbiamo IgG e IgM vuol dire il processo patologico in corso; se abbiamo solo IgG vuol dire che abbiamo passato la malattia. Le IgM hanno una struttura complessa, pentamerica. Le IgG sono quelle della normale risposta immunitaria. Anche se in modo diverso, rimane conservata una struttura tipica. Si tratta di una struttura quaternaria (oltre alla struttura terziaria anche una struttura quaternaria), e questo significa che sono presenti pi catene polipeptidiche. Sono quattro catene a due a due identiche: catena pesante e catena leggera. Ovviamente, una pi lunga e l'altra pi corta; complessivamente, il peso totale di una Ig di circa 150 kDa, dovuto al fatto che la catena leggera formata da 214 aminoacidi (circa 25

kDa), mentre la catena pesante composta da poco pi del doppio degli aminoacidi, 446 e pesa circa 50 kDa. La struttura quaternaria tenuta insieme da legami covalenti disolfuro. Nella catena polipeptidica ci sono quindi delle cisteine, che si legano con posti cistinici per permettere la formazione dela struttura quaternaria. Trattando infatti un purificato di Ig con molecole riducenti, si riducono questi ponti cistinici ottenendo catene pesanti e leggere separate. In condizioni fisiologiche tuttavia la struttura tenuta insieme dai ponti cistinici. Questa struttura stata oggetto di studi sin dall'800, dato costituiva una frazione del siero quantitativamente importante, e ha come caratteristica quella di legare un antigene. Un antigene qualsiasi tipo di molecola (non solo proteica) che viene riconosciuta da queste Ig. Abbiamo spesso parlato di recettori e di ligandi. Per esempio, l'insulina un ormone che si trova in circolo nel sangue e raggiunge poi le sue cellule bersaglio; queste ultime sono identificate dal fatto che possiedono i recettori per l'insulina, ovvero molecole capaci di legare l'insulina. Le Ig sono all'incirca la stessa cosa: dobbiamo pensarle come recettori solubili in cui c' una parte in grado di legare una molecola (o un'altra classe di molecole), che viene chiamata antigene. Si tratta di molecole che sono state evolute dagli organismi per questa funzione: legare un recettore, che nella fattispecie si chiama antigene. L'antigene non self: non self designa tutto quello che non siamo noi. Le nostre molecole sono self, e dovrebbero essere ignorate da questo sistema di riconoscimento, che per pronto, e vedremo come, a riconoscere qualsiasi molecola proveniente dall'esterno, per esempio le molecole portate dalle infezioni di batteri, virus, etc. Dunque, possiamo pensare che il rapporto recettore-ligando molto simile al rapporto Ig-antigene. Quando si cominciato a studiare le Ig, ci si accorti subito che legava molecole diverse, e che la capacit di legame risiedeva in una parte ben precisa della molecola. Nei primi esperimenti si cerc di tagliare l'Ig, e in uno di questi esperimenti si utilizz la papaina, una endopeptidasi di origine vegetale, che casualmente tagliava le Ig in un punto solo. Si formavano quindi due frammenti: in uno c'erano le catene leggere e met di una catena pesante, e un'altro frammento in cui c'era solo la catena pesante. Si accorsero che solo uno di questi frammenti legava l'antigene. Questo frammento, che possiamo ottenere artificialmente, si chiama FAB, frammento Antigen Binding, che lega l'antigene. L'altro frammento, F C, no: C sta per cristallizzabile. Si possono cristallizzare molecole che sono tutte identiche tra loro. Se si purificano dal nostro siero delle Ig, ci si accorge che queste molecole sono estremamente eterogenee. Nel nostro siero normalmente circolano immunoglobuline capaci di reagire contro migliaia di antigeni diversi, per cui c' una forte eterogeneit. Ma questa eterogeneit risiede solo nella parte della molecola FAB, mentre FC rappresenta una parte costante. Queste sono identiche in tutte le Ig che il nostro organismo pu produrre. La prima met N-terminale della catena leggera e il primo quarto N-terminale della catena pesante corrispondono alla parte variabile, che pu variare da Ig ad Ig e fa s che possano riconoscere antigeni diversi. La parte costante una specie di stelo, e serve per supportare i frammenti variabili, che costituiscono la caratteristica di ogni singola Ig di legare un certo antigene. Stiamo dicendo che nel nostro organismo siamo capaci di produrre centinaia di milioni di Ig diverse. Quindi: all'N-terminale abbiamo la parte che pu variare da molecola a molecola, mentre un'altra parte, pi C-terminale, costante. Questa molecola cristallizzabile proprio perch prendendo Ig diverse la parte F C identica e forma dei cristalli; la parte FAB eterogenea tra una immunoglobulina e un'altra e non pu cristallizzare. Da un punto di vista strutturale, interessante vedere che oltre ai ponti disolfuro che tengono insieme le due catene pesanti e la catena pesante legata alla catena leggera, ci sono anche dei ponti disolfuro intracatena che sono molto importanti, perch fanno s che la proteina abbia una struttura a lobi, che sono tenuti insieme proprio da questi punti. Questa struttura lobata tipica delle Ig: altre molecole che non sono Ig, ma che le ricordano per struttura, sono dette Ig-like. Spesso queste molecole fungono da recettori. Quando, con il sequenziamento delle proteine (dagli anni '50), e poi dei cDNA e dei geni delle Ig (dalla fine degli anni '70), si potuto effettuare un'analisi molto pi sottile della struttura molecolare, confermando da una parte le osservazioni fatte precedentemente, e apprendendo ulteriori dettagli. Le Ig sono proteine glicosilate, assolutamente necessaria per il loro funzionamento. La glicosilazione importante per mantenere la struttura ad Y aperta; senza glicosilazione l'immunoglobulina non pi

funzionale. Sequenziando molte Ig diverse, si visto che all'interno delle parti variabili (la prima met delle catene leggere, e il primo quarto delle catene pesanti) erano riconoscibili delle zone relativamente poco estese, di 10-20 aminoacidi, dette CDR, Complementarity Determining Regions; queste, all'interno della zona variabile, sono dette frammenti ipervariabili, perch queste zone della catena polipeptidica sono estremamente diverse tra un anticorpo e un altro, mentre il resto della catena tende a variare molto meno. In altre parole, nell'ambito della parte variabile, non tutta la sequenza responsabile della differenza tra le Ig; ci che determina la differenza sono queste zone pi ristrette, che cambiano in maniera decisa tra un Ig e un'altra. Insomma, l'attivit di binding all'antigene non solo ristretta alla parte variabile: ancora pi ristretta! Si tratta essenzialmente di queste 3 o a volte 4 zone di 10-20 aminoacidi ognuna, molto diverse in struttura primaria tra un anticorpo e un altro, chiamate CDR. La variabilit si riduce quindi a queste zone. Dal punto di vista tridimensionale, si vede che la parte apicale delle Ig (la prima parte della catena pesante) ha una struttura simile alle dita di una mano; dato che le CDR sono le zone che di fatto devono venire a contatto con l'antigene e lo riconoscono, la posizione pi vantaggiosa dove possono stare sulla punta delle dita, dove in effetti stanno. Queste infatti sono le zone pi esposte, che permette alle CDR di essere pi a contatto con l'ambiente esterno. Quindi, nel nostro sangue circolano milioni di Ig diverse, ognuna con la capacit di riconoscere un certo antigene, perch sono diverse l'una dall'altra all'N-terminale della catena nell'ambito della prima met, o del primo quarto, della catena leggera o pesante si visto che la variabilit ristretta a zone di poche decine di amonoacidi. Ricapitolando, abbiamo una struttura quaternaria formata da quattro catene due a due uguali: le due catene leggere sono identiche tra loro, e le due catene pesanti sono identiche tra loro. Le catene sono legate insieme da ponti disolfuro; la struttura intracatena di tipo lobato. Sono proteine di secrezione glicosilate che vengono prodotte dalle plasmacellule e riversate nel circolo sanguigno. La diversit degli anticorpi eccezionalmente ampia: si parla di centinaia di milioni di Ig diverse. La questione : come facciamo a produrre tutte queste immunoglobuline diverse? Abbiamo cento milioni di geni diversi, ognuno dei quali produce un'Ig? Eppure sappiamo che i geni sono circa 30,000: impossibile che la diversit anticorpale derivi da una diversit genetica, ci deve essere un meccanismo diverso. Fu un ricercatore giapponese ad intuire per primo come stavano le cose alla fine degli anni '80: la produzione degli anticorpi sfrutta un meccanismo di ricombinazione. come se tutte le cellule avessero a disposizione un mazzo di carte uguale, e poi in ogni cellula il mazzo di carte venga mischiato in maniera diversa. In pratica, a livello dei geni delle Ig abbiamo un diverso evento ricombinativo in ogni cellula, cos che a livello delle parti variabili, ogni cellula ricava da uno stesso gene iniziale una versione diversa del gene funzionale. Questo giustifica la capacit di plasmacellule diverse di produrre anticorpi diversi. Una prima versione del gene subisce molte ricombinazioni e questo avviene nelle cellule somatiche, un'eccezione alla regola che vuole che la ricombinazione tra geni avvenga solo a livello della meiosi (ricombinazione genica di tipo germinale), dove per ricombinazione si intende che parti di cromosoma vengono tagliate e poi saldate nuovamente. L'altra eccezione che abbiamo incontrato data dai trasposoni, che si inseriscono nei cromosomi, i quali vengono tagliati e poi saldati (ricombinazione somatica). La ricombinazione dei geni per le immunoglobuline avviene nelle prime fasi della nostra vita, quando si sviluppa il sistema immunitario, solo a livello delle cellule B. In qualunque altro citotipo, i geni delle Ig rimangono silenti n si ricombinano. Eventi ricombinativi avvengono indipendentemente a livello di due geni (uno per la catena pesante e uno per

la catena leggera). Subito dopo la nostra nascita, il nostro sistema immunitario comincia a svilupparsi. A livello delle cellule B, che sono precursori delle cellule che produrranno gli anticorpi, avviene, a livello dei geni delle immunoglobuline, avviene l'evento ricombinativo. Vedremo quello che avviene a livello della catena leggera: a livello della catena pesante avviene qualcosa di simile, anche se pi complesso. La struttura della zona che contiene il gene delle catene leggere prima dell'evento ricombinativo molto complessa. Abbiamo un singolo esone che codifica per la parte costante. Per il resto della parte codificante, ci sono versioni diverse. Quindi il gene per la catena leggera costituito da una parte costante C e da una parte variabile in cui si distinguono due parti: J, vicina alla parte costante, e V, che terminale. V e J non sono uniche nel gene, ma ci sono centinaia di versioni diverse per le rispettive parti codificanti. Per costruire il gene, dobbiamo mettere insieme le tre zone: V, J e C. Per C non abbiamo alternative, ma di J e V ne abbiamo diverse (5 per J, diverse centinaia per V). La ricombinazione prima di tutto avviene mettendo un segmento V vicino a un certo segmento J. Ci sono molti segmenti J uno accanto all'altro; si ha una delezione che elimina il DNA che c' tra i due segmenti V e J, e poi i due monconi vengono saldati insieme; cos le due parti arrivano ad essere vicini. Questa ricombinazione genica. Ogni parte V porta con s non solo la sequenza codificante, ma anche un promotore. Quando viene inserito vicino a J, il promotore diventa attivo, e il gene delle Ig diventa funzionale: a questo punto, ha: una delle centinaia di versioni di V, una delle varie versioni di J, e poi una parta costante che sempre la stessa. Nel trascritto primario abbiamo V, J, un introne, e la parte costante; questo trascritto subisce poi splicing, e d un mRNA che verr avviato verso la traduzione. La ricombinazione poi non precisa, ma strutturata in maniera tale che introduce degli errori, delle ulteriori mutazioni. stato calcolato che questo aumenta di molto la variabilit; senza contare quest'ultimo fatto, abbiamo almeno 3000 ricombinazioni diverse, solo per quanto riguarda la catena leggera. Nelle stesse cellule per avviene, indipendentemente, un altro evento ricombinativo a livello delle catene pesanti, con modalit simili a quelle che abbiamo visto, ma con una complicazione in pi: oltre a V e J, c' un'altra zona D. A livello delle catene pesanti la variabilit ancora maggiore: si calcola, per difetto, che siano possibili almeno 5000 ricombinazioni diverse. Siccome una immunoglobilina matura composta da entrambe le catene, e in una cellula i due eventi ricombinativi sono indipendenti, la variabilit della immunoglobulina complessivamente sar il prodotto delle due variabilit singole, vale a dire circa 2,5 107 cio decine di milioni. Considerando anche le mutazioni introdotte, si pensa che la potenzialit del nostro sistema immunitario di produrre Ig diverse sia (stimando per difetto) intorno a 108, vale a dire centinaia di milioni. Se abbiamo 100 milioni di cellule B che si stanno differenziando, in ognuna di esse avviene un evento ricombinativo indipendente a livello del gene delle catene pesanti e del gene della catena leggera in modo tale che ognuna delle cellule B abbia la capacit di produrre un anticorpo diverso da un altro, a livello della parte variabile. Le Ig diverse che potranno essere prodotto in questo modo sono pi di 108. Ricordiamo comunque che, nelle cellule B, che sono diploidi, una copia dei geni per le catene leggere e pesanti viene inattivata: tutto quello che abbiamo visto avviene a livello di una sola copia dei geni per catene leggere e pesanti. Per cui si avuto un evento di ricombinazione genica a livello delle cellule somatiche. Nel nostro sistema immunitario che si sta sviluppando a un certo punto si crea un repertorio enorme di cellule B, ognuna potenzialmente capace di produrre un anticorpo diverso da tutte le altre.

interessante vedere che, a livello del gene della catena pesante, nella parte corrispondente al C terminale, c' un esone aggiuntivo che codifica per un dominio transmembrana. Ovviamente si ha anche una sequenza segnale, perch sia la catena pesante che la catena leggera sono proteine di secrezione: finiscono nel reticolo endoplasmatico, dove la catena pesante verr glicosilata. Ma, in un momento iniziale, nella cellula B, in realt la catena pesante una proteina di membrana. Viene sintetizzata come una proteina di secrezione che per, nelle fasi finali della sintesi, si blocca. Infatti, le Ig, nelle cellule B, sono delle proteine di membrana. L'ultima parte del C terminale della catena pesante ha un dominio transmembrana che intrappola l'anticorpo nella membrana. Qui ancora pi chiaro come le Ig possano essere viste come recettori: in questo caso sono proprio proteine transmembrana! Quindi, noi abbiamo nel nostro organismo, una enorme collezione di cellule B pronte a riconoscere, attraverso le Ig, un certo antigene. Subito vengono eliminate le cellule B che producono anticorpi contro le nostre stesse molecole (self). Per cui, le cellule B che rimangono espongono anticorpi che non reagiscono contro nostre molecole: le Ig contro antigeni non self vengono mantenute, a livello degli organi linfatici (milza, linfonodi), con gli anticorpi legati a livello della membrana. Quindi, a livello delle cellule B l'anticorpo come un recettore di membrana. Come funziona la risposta immunitaria? Possiamo pensarla come una sorta di selezione clonale, in cui l'antigene che sceglie l'anticorpo con cui reagisce. Per esempio, riprendiamo un caso che avevamo gi incontrato: il vaccino della pertosse. Si trattava, come avevamo visto, di una molecola detossificata. Si tratta di un forte antigene, che pu anche avere epitopi diversi - gli epitopi sono antigeni diversi sulla stessa molecola; per esempio, le molecole proteiche possono avere dominii diversi, e ciascuno di questi pu essere un antigene. Nel sangue, l'antigene viene a contatto con le cellule B. Quell'antigene che casualmente viene a contatto con un anticorpo, esposto sulla superficie di una cellula B, a cui , casualmente, abbastanza complementare da potervisi legare. tutto casuale: in un repertorio cos elevato di anticorpi, ognuno leggermente diverso, per cui capace di formare interazioni diverse, casualmente, c' (quasi) sempre almeno una molecola capace di aderire. In generale, pi una molecola diversa dalle nostre, pi ci estranea, pi sar un antigene potente. Per esempio, avevamo visto che nel caso dell'insulina porcina, solo in alcuni soggetti si innescava una risposta immunitaria: dato che l'insulina porcina molto simile alla nostra, il nostro sistema immunitario di solito non la vede, perch sono state eliminati tutti gli anticorpi che erano in grado di legarsi a molecole self e molecole molto simili. In alcuni soggetti questo fenomeno stato meno drastico, e ci sono anticorpi che sono in grado di riconoscere l'insulina porcina. Con insulina umana non ci dovrebbe essere risposta immunitaria, il sistema immunitario non dovrebbe venir eccitato perch dovrebbero essere stati eliminati tutti gli anticorpi per il self. Statisticamente, qualunque molecola non self, dovrebbe sempre trovare almeno un anticorpo capace di legarlo verosimilmente, ne trover decine: alcuni che lo legano in maniera pi forte, altre meno. L'importante che, una volta che l'antigene ha legato un anticorpo, la cellula B che lo portava stata scelta dall'antigene; il legame scatena una risposta che porta al differenziamento della cellula B in plasmacellule, le cellule che producono l'anticorpo non pi come proteina di membrana, ma come proteina di secrezione. Questo perch durante il differenziamento, l'ultimo esone, che conteneva la sequenza transmembrana, viene ignorato, e la proteina finisce a monte. Le Ig prodotte nelle plasmacellule quindi non hanno pi il dominio transmembrana, ma hanno sempre il peptide segnale; entrano nel RER, ma non rimangono incastrate nella sua parete. Nelle plasmacellule, la stessa identica molecola che esposta nelle cellule B viene secreta perch manca il dominio transmebrana, ma la specificit identica: una cellula B, una volta subita la ricombinazione, potr produrre solo un anticorpo in tutta la sua vita, e lo stesso per le plasmacellule a cui d origine. Altre cellule B riconosceranno altri epitopi, magari presenti sulla stessa molecola, avviando un secondo

processo di selezione clonale. La selezione clonale consiste di questo processo, in cui viene selezionata una cellula B, che porter alla formazione di cloni (cellule uguali, con la stessa capacit di produrre l'anticorpo); prima avviene una proliferazione di cellule, e poi un differenziamento in plasmacellule (le plasmacellule sono terminalmente differenziate, non proliferano pi. Inoltre, quando la cellula B viene riconosciuta dall'epitopo, e viene attivata, non si differenzia solo in plasmacellule (quella la risposta immediata, con cui viene prodotta una gran quantit di anticorpi), ma anche in cellule della memoria. Sono cellule B particolari, con una durata della vita (life span) lunghissima, che fanno s che, incontrando lo stesso antigene una seconda volta, il sistema immunitario sia molto pi pronto a reagire, perch ci sono molte pi cellule in grado di riconoscere l'antigene rispetto alla prima volta, quando c'era una sola cellula B. Mentre la prima volta si aveva il picco protettivo di immunoglobulineG dopo una quindicina di giorni, le volte successive si ha dopo 2-3 giorni. Questo il principio su cui cui si basa la pratica della vaccinazione: si utilizza un antigene che produca una risposta immunitaria protettiva verso la malattia. In genere lo facciamo, per esempio, con molecole proteiche del capside di un virus, che non sono infettanti, ma sono ugualmente in grado di scatenare una reazione immunitaria identica a quella che avremmo se fossimo stati realmente infettati. Quando poi davvero incontriamo il virus, il sistema immunitario pronto a reagire grazie alle numerose cellule B della memoria che sono state prodotte. La risposta delle plasmacellule dura un mese, poi tendono a sparire. Quello che importante la presenza di centinaia di cellule della memoria. Dato che improbabile che un antigene eliciti solo una cellula B, ci saranno decine di recettori anticorpali capaci di reagire, quindi si ha una risposta policlonale. Il sistema immunitario da una singola cellula B vede proliferare molti cloni, che producono anticorpi che reagiscono contro l'antigene. Si pu introdurre a questo punto il concetto di linea monoclonale. La linea monoclonale di una cellula B quella che deriva da una cellula B capostipite ed composta di cellule che hanno in comune la capacit di produrre un particolare anticorpo, la cui struttura lo rende capace di reagire con un certo antigene. Noi abbiamo, oltre alla risposta immunitaria che abbiamo visto, un'immunit innata, che fornisce protezione in maniera aspecifica; teorie molto recenti indicano che questa risposta aspecifica sia sufficiente contro virus, batteri, etc. e che in realt la complessit del sistema immunitario serva a proteggerci da noi stessi. Nei tumori, molto spesso, le cellule tumorali cambiano, esponendo sulla loro superficie proteine leggermente diverse (abbiamo visto che alcuni protooncogeni recettori cambiano la loro struttura diventando oncogeni): non pi una molecola self, diventata non self, e il sistema immunitario capace di riconoscerla. Quindi, l'importanza del sistema immunitario sembra che sia soprattutto nella difesa dai tumori. In effetti, nei casi di immunodeficienza, una delle ragioni di morte la formazione di tumori che sono pi frequenti negli individui immunodepressi. I tumori nascerebbero quindi dal fatto che il sistema immunitario ogni tanto fallisce. Abbiamo visto che la risposta policlonale composta da tante risposte monoclonali. Abbiamo poi visto come le immunoglobuline sono molecole capaci di riconoscere un'altra molecola in maniera anche estremamente specifica. Per esempio, nel sangue dei diabetici il cui sistema immunitario riconosce l'insulina porcina ci sono immunoglobuline in grado di riconoscere l'insulina porcina ma non quella umana. Le Ig sono potenzialmente capaci di riconoscere altre molecole in maniera estremamente specifica. Le Ig funzionano bene come sonde molecolari, quindi. Per esempio, se abbiamo delle cellule tumorali, e vogliamo vedere se esprimono un certo recettore oppure no, ci si pu procurare un anticorpo contro quella molecola e vedere se reagiscono o meno: in caso affermativo, significa che la molecola c'. In medicina di laboratorio gli anticorpi sono molto utilizzati, e molte delle analisi clinche prevedono il loro utilizzo; anche nella ricerca sono fondamentali. Da qualche anno, il loro utilizzo stato anche introdotto nelle terapie

antitumorali: se un anticorpo riesce a riconoscere un certo oncogene recettore di membrana che diventato oncogene, si pu interferire con il suo funzionamento (es. bloccando la dimerizzazione, nel caso dell'oncogene che avevamo visto). Quindi, abbiamo uno spettro enormemente ampio di utilizzi per un anticorpo con una specificit: sia a scopi diagnostici, terapeutici, di ricerca. Da subito si cominci a intuire l'importanza degli anticorpi come sonde molecolari. Gli anticorpi vengono prodotti da un organismo e quando l'organismo viene a contatto con un antigene; tante cellule B si attivano, e abbiamo la risposta immunitaria. Questa situazione si pu riprodurre anche in laboratorio: se iniettiamo in un animale da laboratorio un antigene, questo produrr Ig di vario tipo contrp quell'antigene. Tuttavia questo sistema poco utilizzabile perch la risposta immunitaria estremamente diversa da animale ad animale, un qualcosa di individuale: quindi, per scopi diagnostici o di ricerca questo tipo di produzione poco adatto, abbiamo un prodotto standardizzato. Fu quindi messa a punto, intorno agli anni '70, la tecnologia degli anticorpi monoclonali. Con questa, si prende in considerazione un solo clone e un solo tipo di immunoglobulina. Dal punto di visto immunitario, un topo essenzialmente identico a noi. I geni sono leggermente diversi, ma come tipo di funzionamento di ricombinazione identico. Si inietta un antigene purificato in un topo, e questo produrr una risposta immunitaria; dopo una settimana si pratica una seconda iniezione, e dopo un'altra settimana si pu essere abbastanza sicuri che la risposta immunitaria sia cominciata. Supponiamo che si stia studiando il tumore alla mammella, del tipo dipendente dall'espressione dell'oncogene HER2, il recettore di membrana; se si vogliono produrre anticorpi contro questa molecola, si purifica da cellule tumorali che lo esprimono, e poi si inietta nel topo, il quale, essendo una molecola umana, la riconoscer come non self producendo una risposta immunitaria. Nella milza del topo, le cellule B cominciano a proliferare per produrre plasmacellule, che sintetizzeranno anticorpi. Nel topo si saranno attivate come minimo decine di cellule B, ognuna in grado di produrre un anticorpo che pu reagire con HER2, alcuni di pi, altri di meno. Se si potesse prelevare la milza del topo, da questa estrarre le plasmacellule, coltivarle in vitro, e far s che potessero proliferasse indefinitamente, avremmo una cellula in grado di produrre anticorpo in quantit illimitata. Tuttavia, sappiamo che questo non possibile: avevamo detto le cellule somatiche sono impossibili da coltivare per pi di qualche settimana, poi muoiono. Qual il trucco? Si prevelano le cellule della milza del topo; essenzialmente avremo una collezione eterogenea di plasmacellule; queste saranno verosimilmente tutte in grado di reagire contro HER2 perch l'antigene somministrato al topo in quel momento. Ognuna di esse sar capace di produrre un certo anticorpo. A questo punto, le immortalizziamo con un trucco: si fanno fondere con cellule di mieloma, un tumore (nella fattispecie una leucemia) trattandole con PEG, polyethylenglycole, una molecola che facilita la fusione di cellule diverse. Si formano cellule dette ibridomi: il termine rende l'idea della fusione tra la cellula della milza del topo, capace di produrre l'anticorpo, e cellule di mieloma; gli ibridomi sono cellule che acquisiscono immortalit e capacit di proliferare indefinitamente per via delle cellule di mieloma, ma trattengono la capacit di produrre l'anticorpo dovuta alle plasmacellule. L'ibridoma quindi una cellula immortalizzata e capace di produrre l'anticorpo. I mielomi sono cellule che prima di diventare tumorali avevano la capacit di produrre anticorpi, ma l'hanno persa; la trasformazione tumorale le ha dedifferenziate. Le caratteristiche conferite dalle plasmacellule rendono possibile la produzione di anticorpi. Poi le cellule vengono isolate, e poste su delle piastre in cui vi sono tanti piccoli pozzetti di 1-2 cm, contenenti terreno di coltura. In ogni pozzetto viene messa una singola cellula, da cui nasceranno cloni. Da ognuno dei pozzetti quindi si potr avere un diverso anticorpo, ma ognuno capace di reagire contro la molecola desiderata. Essendo proteine di secrezione, gli anticorpi si potranno ritrovare a livello del sopranatante; si saggia quindi il sopranatante per vedere quale anticorpo presenta le caratteristiche ottimali: alcuni riconosceranno molto bene l'antigene, ma saranno poco specifici; altri saranno molto specifici, ma riconosceranno l'antigene con difficolt. Infine, sar possibile trovare un anticorpo specifico e che riconosce bene l'antigene. Si fa espandere quindi il relativo pozzetto: in questo modo si ha una coltura cellulare continua di cellule immortalizzate capaci di produrre l'anticorpo nel sopranatante. possibile mantenere inalterate nel tempo le caratteristiche dell'anticorpo mantenendo le cellule in azoto liquido con apposite tecniche. Quindi, dopo

anche anni, si possono rimettere le cellule in coltura e ottenere lo stesso anticorpo monoclonale, perch fatto da una singola cellula capostipite, per cui tutte le cellule figlie produrranno lo stesso anticorpo. Oggi al mondo esistono milioni di anticorpi monoclonali diversi, che i ricercatori si possono scambiare secondo le necessit. facile intuire la potenza di una tecnologia del genere, che permette di avere delle sonde molecolari con caratteristiche standard che rimangano costanti nel tempo. Si tratta di molecole utilizzatissime nella ricerca; gran parte degli ordini degli odierni laboratori sono anticorpi monoclonali, che sono utili sonde molecolari. Per esempio, come fare a capire se una proteina fosforilata o meno? Esistono anticorpi capaci di distinguere la proteina fosforilata da quella non fosforilata. Con un semplice saggio di questo tipo siamo in grado di capire lo stato della proteina. Altrimenti, gli anticorpi possono essere utilizzati semplicemente per misurare la quantit di proteina presente in una cellula, o per verificarne semplicemente la presenza. Oggi esistono tecnologie molto sofisticate, come il microscopio confocale, con cui si possono vedere cellule vive, e si possono visualizzare le singole molecole riconoscendole con anticorpi legati a sostanze fluorescenti. Domani continueremo a parlare degli anticorpi monoclonali. Gli anticorpi non umani possono essere usati in terapia? Vedremo quali soluzioni sono state trovate dalle biotecnologie a questi problemi.

Biochimica 27-05-09 [Prof. Raugei]


Ieri abbiamo accennato al limite dell'utilizzo degli anticorpi monoclonali. Tutti gli anticorpi dei mammiferi in generale sono strutturalmentge simili, indistinguibili dal punto di vista strutturale e funzionale. Il problema che la parte costante delle IgG di topo un antigene relativamente forte per il nostro organismo. Se noi usassimo in terapia gli anticorpi di topo, in seguito ad un uso prolungato questi verrebbero eliminati rapidamente, rendendo inutile la terapia. In alcuni casi ci sarebbero dei fenomeni allergici, anche mortali. Quando si misero a punto gli anticorpi monoclonali, si pens di poterli utilizzare, ma nella pratica venne confermata quella che inizialmente era un'ipotesi: la impossibilit di usarle se non in casi eccezionali. Qui entra in gioco l'ingegneria genetica. In fondo una Ig una normalissima proteina di secrezione. Complessa nella sua struttura, ma una proteina, codificata da due open reading frame: uno per la catena pesante e uno per la catena leggera. Si tratta di un problema che in fondo dovrebbe essere possibile affrontare con i metodi dell'ingegneria genetica. Nei giorni scorsi, abbiamo visto come sia possibile inserire in cellule animali in coltura (ovvero cellule che siano realmente in grado di esprimere proteine come queste, proteine glicosilate con struttura quaternaria complessa) vettori che portano grossi frammenti eterologhi con i geni che vogliamo noi. Potremmo inserire, per esempio, la catena pesante di una Ig, insieme alla resistenza a G418, necessaria a selezionare le cellule che hanno inserito nel loro genoma questo gene. Insomma, niente ci vieta di esprimere delle Ig con questo sistema che abbiamo visto essere valido con qualunque sequenza codificante una qualunque proteina. Si pu mettere a punto un sistema d'espressione in cui si produce una Ig con una sequenza su cui abbiamo lavorato. Non scenderemo nei particolari tecnici, che non sono poi molto interessanti, ma ricordiamo che a livello di una sequenza di DNA si pu lavorare con facilit, ottenendo alla fine la sequenza desiderata. Le proteine che costruiamo a tavolino in questi casi sono anticorpi detti chimerici o umanizzati. Abbiamo visto che l'Nterminale di entrambe le catene la parte variabile; la seconda met della catena leggera e i secondi tre quarti della catena pesante rappresentano la parte costante. In un qualsiasi anticorpo monoclonale, la parte importante per il riconoscimento dell'antigene la parte variabile. Tutto il resto una sorta di manico glicosilato che tiene in posizione le altre due parti. Insomma, si pu riconoscere una zona strutturale e

un'altra funzionale, che ha la capacit di riconoscere l'antigene. Lo scopo dell'anticorpo chimerico quello di arrivare a produrre un anticorpo che abbia le parti variabili dell'anticorpo monoclonale di topo con la specificit voluta, ma le parti strutturali, quelle che soprattutto stimolano la risposta immunitaria, umane. Realizzare un anticorpo ibrido in cui il frammento funzionalmente interessante identico a quello dell'anticorpo monoclonale scelto, mentre si sostituisce la parte strutturale murina con una parte strutturale umana. Nella pratica: supponiamo che si voglia curare un certo tumore; abbiamo un anticorpo monoclonale di topo che riconoscere un particolare marker tumorale in maniera forte e specifica. Questo potrebbe essere un potenziale farmaco contro il tumore: gli anticorpi potrebbero bloccare questa molecola (verosimilmente un recettore per un fattore di crescita) rallentando la crescita del tumore. Solo che non si pu usare quello murino, perch dopo un po' sarebbe inefficace; d'altra parte, a noi dell'anticorpo murino interessa solo la parte che riconosce l'antigene, quindi si pu sostituire la parte strutturale con una umana. Sintetizzare in laboratorio una proteina in questo modo non possibile, ma diventa fattibile se lo realizziamo a livello di sequenza codificante: si prende la sequenza codificante per la parte variabile murina, e si lega alla sequenza codificante di una parte costante umana, e questo per entrambe le catene. Infine, si esprime il tutto in un vettore d'espressione. Avremo poi un promotore forte, e un gene per la selezione (tipicamente, la resistenza a G418). Gli anticorpi monoclonali di topi sono prodotti da ibridomi, cellule immortalizzate capaci di produrre un particolare anticorpo. Le cellule producono questo particolare anticorpo perch a livello cellulare viene trascritto mRNA per la catena leggera e mRNA per la catena pesante. Si potranno isolare i due mRNA e trarne i relativi cDNA, potendo ottenere la sequenza corrispondente alle parti variabili di entrambe le catene. Si pongono a valle del promotore, e si completa la struttura dell'anticorpo aggiungendo catene costanti umane, isolando mRNA da qualunque plasmacellula (la parte costante sempre la stessa per ogni anticorpo) e traendone il relativo cDNA. Infine, avremo dei cDNA inseriti nel vettore: la prima parte sar quella variabile murina, la seconda parte sar quella costante umana. Ricordiamo che il primo terzo della catena pesante e la prima met della catena leggera sono variabili. Se si riesce a fare in modo che una cellula assuma questi costrutti e integri nel proprio genoma due nuovi geni che porteranno alla sintesi delle due catene, leggera e pesante. Entrambi questi due peptidi hanno all'Nterminale un peptide segnale per cui le due sequenze proteiche si ritroveranno all'interno del RER, dove si formeranno i legami disolfuro necessari e verr operata la glicosilazione delle catene. Infine, verranno secreti anticorpi strutturalmente indistinguibili da un qualsiasi altro anticorpo. Viene per detto ibrido perch la parte funzionalmente specifica viene dall'anticorpo monoclonale, mentre la parte strutturale umana. Il vantaggio di avere un anticorpo del genere ovvio: dovrebbe stimolare una risposta molto pi marginale dal nostro sistema immunitario, potendo essere usato molto pi facilmente come biofarmaco, somministrandolo per mesi o anni, come succede tipicamente per le terapie antitumore. Si pu anche andare oltre: la parte funzionalmente importante non nemmeno tutta la parte variabile, ma si trova a livello delle sequenze CDR che sono solo una parte della zona variabile. Sono in numero di 3-4 in ogni zona variabile, e sono sequenze aminoacidiche di 10-20 aminoacidi, sparse nella sequenza della parte variabile. Sono queste sequenze che veramente determinano la specificit; il resto della parte variabile ha anch'essa un intento soprattutto strutturale, cio di tenere in posizione le CDR (le punte delle dita). Sono le CDR che davvero prendono contatto con l'antigene. Quello che possiamo fare prendere il cDNA per la catena pesante di un qualunque anticorpo umano; sia che l'anticorpo sia umano o murino, le CDR sono sempre nelle stesse posizioni. Quindi si tolgono dalla sequenza dell'anticorpo umano le parti corrispondenti alle CDR e si sostituiscono con le CDR murine prese dall'anticorpo monoclonale che ci interessa. Questo sempre a livello del cDNA. Si fa lo stesso per la catena leggera, e si otterr un anticorpo umanizzato: si tratta di un vero e proprio anticorpo umano. Il nostro sistema immunitario per caso potrebbe anche produrlo! Noi conosciamo la sua origine, ma totalmente indistinguibile da un normale anticorpo. Questi sono gli anticorpi che garantiscono la maggiore probabilit di assenza di reazione immunitaria; in rari casi la reazione immunitaria avviene lo stesso, per motivi poco chiari, ma nella maggior parte dei casi questo non avviene.

Fino al 2004 sono stati sviluppati una serie di biofarmaci per diverse patologie; dal 2004 ad oggi non c' stata una espansione delle patologie trattate, ma c' stata un'enorme espansione del numero di biofarmaci per ogni patologia. Questi numeri sono destinati a crescere: ogni volta che la ricerca dedicata ai tumori identifica una nuova molecola interessante, potenziale bersaglio, nascono nuovi biofarmaci. Di fatto, ogni molecola coinvolta nella genesi di un tumore un potenziale bersaglio. Risale al 1986 il primo anticorpo monoclonale murino utilizzato in terapia. Per ragioni non molto chiare, in quel caso la reattivit del sistema immunitario stata molto bassa. Gli anticorpi chimerici (quella in cui viene sostituita tutta la parte variabile) cominciano a comparire dalla met degli anni '90. Dalla fine degli anni '90 invece entrano in scena gli anticorpi umanizzati. Da allora, questi ultimi due dominano il campo. Il nome di questi farmaci tipicamente finisce in -mab: il suffisso indica che si tratta di un biofarmaco, e in particolare di un anticorpo. Da un punto di vista di indicazioni terapeutiche (quali malattie si possono pensare di combattere), sono varie. Per esempio, il tetano, che dovuto alla produzione di una tossina da parte di un batterio e che agisce a livello muscolare portando a morte per soffocamento. Si potrebbe intervenire con un anticorpo di origine esogena (il nostro sistema immunitario produce anticorpi, ma la tossina pi veloce) contro la tossina. Un tempo questi anticorpi erano di origine bovina, venivano purificati, e il siero veniva iniettato in soggetti a rischio di tetano. Un tempo esisteva il siero antivipera, che era prodotto allo stesso modo. Questi anticorpi erano molto utili, ma molto rischiosi dalla seconda somministrazione in poi, perch si potevano verificare fenomeni allergici. L'ulteriore sviluppo si avuto con le -globuline, immunoglobuline umane, prodotte da volontari che si facevano iniettare con particolari antigeni sviluppando anticorpi. Quest'ultimo sistema oramai viene quasi sempre evitato, perch il rischio di infezioni (AIDS, epatiti, etc.) elevato. In questo panorama, l'utilizzo di anticorpi ibridi o umanizzati molto pi sicuro. Basti pensare che non c' bisogno di usare cellule umane per produrre anticorpi umanizzati; si possono usare anticorpi di qualsiasi mammifero. In genere si usano le cellule filogeneticamente pi distanti possibile. Dunque, una delle prima applicazioni stata quella contro malattie infettive, oggi divenuta marginale. L'altra applicazione degli anticorpi a scopo terapeutico si avuta con i tumori, che stanno diventando le patologie a cui sono indirizzate la gran parte degli anticorpi prodotti. Questi anticorpi vanno a bloccare particolari molecole, in genere sulla superficie della cellula, protooncogeni divenuti oncogeni che stimolano le cellule tumorali; con l'adesione degli anticorpi si pu pensare di bloccarne l'azione. Le altre applicazioni si hanno verso malattie di tipo infiammario: asma, psoriasi, artrite reumatoide, etc. Le infiammazioni sono mediate da molecole prodotte dalle cellule del sistema immunitario, le citochine. Un particolare tipo di citochine sono quelle pro-infiammatorie, che servono a produrre l'infiammazione, un fenomeno in parte positivo, perch serve a combattere certi tipi di patologie. Spesso per, in alcune malattie, l'infiammazione sfugge al controllo e diventa essa stessa il problema. L'infiammazione diventa allora patologia, e in questi casi i farmaci agiscono bloccando l'infiammazione a varii livelli. I farmaci classici sono relativamente aspecifici, mentre l'idea degli anticorpi di andare a bloccare la citochina importante nel processo infiammatorio. I bersagli sono diversi, ma i principali sono il TNF, Tumor Necrosis Factor, oppure le interleuchine come IL-2 e IL-6, prodotte dai macrofagi, che agiscono a livello locale come attrattori di linfociti. Con gli anticorpi, si pu sperare di bloccare queste citochine non appena prodotte, annullandone l'azione e facendo crollare il meccanismo di infiammazione. Un altro importante campo quello dei trapianti, il cui problema pi grossa il rigetto. In molti casi si ha il rigetto acuto, immediatamente successivo al trapianto (causa del 90% dei fallimenti), una reazione molto forte e immediata del sistema immunitario contro l'organo trapiantato. Si pu poi avere un rigetto di lunga durata che pu essere tenuto a bada con trattamenti immunodepressivi. Esiste una serie di anticorpi che possono andare a mascherare i determinanti antigenici del trapianto. Stanno uscendo sempre nuovi anticorpi, ed stato dimostrato che aiutano a prevenire il rigetto . Questo molto importante, perch un'operazione di

trapianto molto impegnativa, sotto molti aspetti: aumentare il successo dei trapianti sarebbe un grande risultato. Concludiamo con un esempio particolare. Ci sono due farmaci molto famosi: uno il Trastuzumab, contro il cancro alla mammella metastatico; l'altro, relativamente nuovo, Avastin, pensato per un ampio spettro di tumori: va a bloccare il VEGF, un fattore di crescita vascolare. Questo comune a tutti i tumori solidi: quando un tumore solido cresce oltre una certa misura deve essere vascolarizzato. Bloccando questi fattori di crescita si dovrebbe bloccare la vascolarizzazione. Vedremo ora il funzionamento del Trastuzumab. Il recettore coinvolto HER2, un recettore per un fattore di crescita tipico delle cellule epiteliali, normalmente espresso pochissimo in cellule somatiche. Nel 50% dei tumori, la trasformazione del protoncogene HER2 in oncogene determina l'overespressione del gene, e la proteina esposta in gran quantit sulla cellula. Sono cos abbondanti che dimerizzano anche in assenza del fattore di crescita segnalando la proliferazione. Il Trastuzumab, anche chiamato Herceptin, un anticorpo monoclonale umanizzato capace di riconoscere il recettore. Ci sono due fasi di uso, come due modalit di utilizzo, una successiva all'altra. Quand' che si pu usare questo farmaco? Non in tutti i tumori; alcuni tumori, circa il 50%, sono tali non perch overesprimono HER2, ma che hanno accumulato altre mutazioni. Questi ultimi non sono eleggibili per una terapia di questo tipo. Prima di tutto si deve fare una diagnosi precisa, molecolare, del tumore, e si pu fare con il farmaco stesso. Si prelevano cellule dal tumore e cellule normali (per controllo) e si sottopongono all'azione dell'anticorpo, che andr a riconoscere il recettore. Si tratta di diagnostica ex vivo, in vitro. Gli anticorpi sono di solito marcati con fluorocromo, una sostanza che illuminata con una certa lunghezza d'onda emette luce. Le cellule normali non dovrebbero colorarsi, si dovrebbero legare pochissimi anticorpi. Nel tessuto tumorale, se il risultato non cambia, significa che non vi overspressione di HER2; se invece le cellule si colorano fortemente significa che overesprimono HER2, e potremo usare lo stesso anticorpo sulle cellule in vivo. Questo dovrebbe portare ad una riduzione della capacit proliferativa della cellula. Questi farmaci non sono risolutivi; sono efficaci, ma non risolutivi. Si parla di un aumento della sopravvivenza a 5 anni, non di una cura. Probabilmente, aggredendo le cellule con 5 o 6 farmaci diversi, si avr una cura quasi totale del tumore. Il singolo farmaco risolutivo per non esiste, almeno per adesso.