Sei sulla pagina 1di 180

BIOLOGIA MOLECOLARE

Prof: Stefan Schoeftner

Sven Turkalj

1
INTRODUZIONE: CHE COS’E’ LA BIOLOGIA MOLECOLARE?

E’ difficile sistemare la moderna biologia molecolare in un campo ben preciso. Essa e’ connessa
con molte altre discipline biologiche: in primis con la biochimica, che studia le reazioni chimiche
dei sistemi biologici, poi con la genetica classica che si occupa delle relazioni fra genotipo e
fenotipo (una branca emergente, la genetica molecolare, vede le applicazioni della biologia
molecolare nella genetica classica) ma anche con la biologia cellulare, con la quale e’
strettamente imparentata (dato che le molecole studiate dalla biologia molecolare si trovano
tutte nella cellula, e ne determinano la struttura e le funzioni).
Dovendo essere precisi, possiamo dire che la nascita della biologia molecolare corrisponda alla
scoperta della doppia elica del DNA da parte di Watson e Crick1.
I temi che verranno analizzati in questa disciplina saranno tutti legati al cosidetto DOGMA
CENTRALE DELLA BIOLOGIA MOLECOLARE: si tratta di una regola che descrive il flusso di
informazione genetica che parte dal DNA, passa per l’ RNA ed infine viene convertita in
proteine. Piu’ concretamente, ci occuperemo di:
-struttura e organizzazione degli acidi nucleici
- organizzazione del genoma e trasposizione
- mantenimento del genoma: replicazione del DNA, riparazione e mutabilita’, ricombinazione
omologa e sito-specifica
- espressione del genoma: trascrizione, splicing e traduzione
- regolazione: espressione genica negli eucarioti e nei procarioti

1
Non bisogna dimenticare il fondamentale contributo di Rosalind Franklin!

2
CAPITOLO 1: STRUTTURA E TOPOLOGIA DEL DNA

1.1: Struttura chimica:


Il DNA (acido deossiribonucleico) e’ una macromolecola biologica con la peculiare caratteristica
di essere formata da due catene polinucleotidiche, avvolte una sull’ altra a forma di doppia
elica. Ogni catena e’ formata da nucleotidi, ed ogni nucleotide contiene una base azotata, uno
zucchero chiamato deossiribosio ed un gruppo fosfato.

Come si vede dall’ imagine, una molecola di


acido fosforico forma un legame fosfoestereo
con il carbonio alla posizione 5’ del zucchero. La
base invece forma un legame glicosidico con il
carbonio alla posizione 1’. In questo modo si
forma il nucleotide, con la perdita di 2 molecole
di H2O.
Lo zucchero unito alla sola base forma invece il
nucleoside.

I nucleotidi si uniscono insieme per polimerizzazione dando origine ad una catena singola. Il
legame fra due nucleotidi consecutivi si chiama legame fosfodiesterico: in esso, il fosforo fra i
due nucleotidi e’ unito ad uno zucchero esterificato mediante l’ ossidrile 3’ e ad un secondo
zucchero esterificato mediante l’ ossidrile in 5’. Il legame fosfodiesterico crea un’ impalcatura
zucchero/fosfato, una caratteristica costante del DNA, che chiameremo scheletro di
deossiribosio/fosfato2. Esso e’ caricato negativamente data la presenza dei fosfati con la carica
negativa. In una molecola di DNA, ci sono due scheletri, che corrispondono a due catene:
queste vengono unite da ponti idrogeno (hydrogen bonds) che s’ instaurano fra le basi azotate
sporgenti dalle catene. Ogni catena ha inoltre due estremita’: un’ estremita’ 5’, dove sporge un
fosfato, ed un’ estremita’ 3’ dove sporge un gruppo ossidrile – come si vede dall’ immagine
seguente, che rappresenta schematicamente la struttura del DNA, le due catene possiedono la
stessa geometria ma direzioni 5’3’ opposte. In altre parole, la direzione di una catena dal 5’ al
3’ e’ antiparallela rispetto alla direzione dal 5’ al 3’ dell’ altra.

2
Lo zucchero si chiama deossiribosio dato che in posizione 2’ manca di un gruppo –OH, invece del quale c’e’ un H.

3
Il DNA e’ composto da 4 diverse basi azotate, che
si dividono in due gruppi: purine e pirimidine. Le
prime hanno una struttura a doppio anello e sono
l’ adenina (A) e la guanina (G) , le pirimidine
invece sono fatte da un anello singolo e
comprendono la citosina (C) e la timina (T).
A e C sono donatrici di idrogeno per creare i ponti
H, G e T sono accettori di idrogeno sempre per
creare i ponti H.
Quello che e’ fondamentale e’ il fatto che legarsi
coi ponti idrogeno possono soltanto l’ adenina-
timina e la citosina-guanina. La prima coppia
forma due legami idrogeno, la seconda ne forma
3, come si vede dall’ immagine3. Non ci sara’ mai
un’ interazione a ponti idrogeno fra due
pirimidine o fra due purine.
Ogni base azotata puo’ inoltre esistere in due
conformazioni tautomeriche, ma dentro la
molecola del DNA assume quasi sempre la forma
che le concede di creare quanti piu’ ponti idrogeno possibili4. Come sappiamo dalla chimica
generale, un solo legame a ponte d’ idrogeno e’ un legame (o meglio dire interazione) debole,
ma quando si uniscono molti di questi legami, allora la loro forza collettiva aumenta
notevolmente. E’ proprio questo il caso della doppia elica del DNA che e’ stabile5 sia per la
presenza di molti ponti idrogeno, sia per le forze di van der Waals che ci sono fra le nubi
elettroniche dei singoli nucleotidi, e che sono dovute all’ impilamento delle basi una sull’ altra
perpendicolarmente all’ asse longitudinale della molecola.
Spesso puo’ accadere un fenomeno interessante, ovvero quello della rotazione della base (o
base flipping): alcuni enzimi metilatori o riparatori che devono fissare la base sul loro substrato
non possono farlo mentre la base e’ impegnata nell’ interazione con un’ altra base, per pure
ragioni steriche, e per questo devono ruotarla all’ esterno dello scheletro del DNA. La pagina
seguente schematizza le strutture delle 5 basi azotate e l’ appaiamento nel DNA delle 4 basi
A,T,G e C.

3
Si intuisce dunque che il legame C-G sara’ un attimino piu’ forte/stabile del legame A-T: la zona del DNA ricca di
coppie C-G sara’ conseguentemente piu’ stabile.
4
L’ adenina e la citosina si trovano quasi sempre nella forma amminica, la guanina e la timina quasi sempre in
quella chetonica. La tautomeria puo’ causare anche delle mutazioni, dato che tautomeri diversi della stessa base
sono in grado di fare appaiamenti con basi diverse.
5
Stabile si, ma anche abbastanza flessibile da potersi denaturare a temperature ragionevoli, come vedremo in
seguito.

4
Ecco le formule di struttura delle 5 basi:

Qui invece e’ rappresentato l’ appaiamento di Watson-Crick che si forma fra le basi:

5
Schematizzando ora quello che e’ stato detto finora, la molecola del DNA, in un’
approssimazione, sguarda come illustrato nell’ immagine seguente:
Si nota la presenza di un solco
maggiore e di un solco minore. Il fatto
che esistano due solchi diversi e’
dovuto all’ esistenza di due angoli
diversi che ci sono fra i 2 legami
glicosidici (in una coppia di nucleotidi).
L’angolo meno ampio genera il solco
minore, quello piu’ ampio genera il
solco maggiore. Il solco maggiore
fornisce molte informazioni di tipo
chimico, perche’ contiene piu’ gruppi
donatori e accettori di idrogeni: in altre
parole, e molto piu’ facile riconoscere
le specifiche sequenze di DNA guardando il solco maggiore6. Questo diventa importante
quando entrano in gioco delle proteine che devono appaiarsi a una specifica sequenza di DNA-
fenomeno chiamato sequence-specific binding (lo effettuano, ad esempio, i fattori di
trascrizione).
Anche se nelle cellule nella maggior parte dei casi incontriamo il DNA nella sua forma piu’ tipica,
quella che vediamo nell’ immagine’, denominata forma B del DNA, con la cristallografia a raggi
X si e’ scoperto che esistono anche altri modelli, quali forma A (dove il solco maggiore e’ piu’
grande e il solco minore e’ piu’ piccolo di quelli che incontriamo nel DNA B), e poi anche la
forma Z. E’ importante notare che mentre le forme A e B del DNA presentano una molecola
destrorsa, la forma Z e’ una molecola sinistrorsa.
Un attimo fa, abbiamo descritto come l’ elica del DNA e’ tenuta assieme dai numerosi ponti
idrogeno fra le basi. Anche se conferiscono una notevole stabilita’ alla molecola, queste
interazioni sono piu’ deboli dei legami covalenti e in opportune condizioni possono spezzarsi:
ad esempio se il DNA viene posto in una soluzione e viene scaldato oltre la temperatura
fisiologica (vicino ai 100 gradi centigradi), I ponti idrogeno cessano di esistere e le due catene si
separano. Questo processo e’ noto sotto il nome di denaturazione. La denaturazione e’
comunque un cambiamento reversibile- se le condizioni tornano alla normalita’, le due catene
complementari7 si riuniranno e i ponti idrogeno fra le basi si riformeranno. Questo fatto rende
possibile la formazione di molecole ibride, se in soluzione viene introdotta una catena di DNA

6
Anche se certi enzimi possono ottenere abbastanza informazioni anche dal solco minore.
7
Che possono cioe’ formare i corretti appaiamenti fra le basi.

6
proveniente da fonti diverse8. Quando il DNA si denatura, aumenta la sua assorbanza, dato che
una catena singola assorbe circa 40% di luce in piu’ rispetto all doppia catena.
I fattori che determinano la stabilita’ di una molecola di DNA si dividono in intrinseci
(composizione delle basi, peso molecolare) ed estrinseci (T, pH, forza ionica9). Quanto piu’
stabile e’ una molecola di DNA, tanto la temperatura di denaturazione sara’ maggiore.
Negli eucarioti, solitamente la molecola di DNA e’ una molecola lineare. Incontreremo pero’ nel
mondo delle monere (virus) e dei batteri molecole di DNA circolari.

1.2: Topologia del DNA:


Il DNA e’ una molecola flessibile: nel DNA lineare, poiche’ le estremita’ sono libere, il numero di
avvolgimenti di un filamento attorno all’ altro puo’ essere modificato mediante la rotazione
specifica. Questo non e’ il caso del cccDNA, ovvero DNA circolare covalentemente chiuso, che
non presenta estremita’ libere10. Per questo si dice che il cccDNA sia una struttura
topologicamente vincolata. A questo punto introduciamo il numero di legame topologico
(linking number) che si indica con Lk e che indica il numero di volte che un filamento deve
essere fatto passare attraverso l’ altro affinche’ le catene si separino una dall’ altra. Il Lk puo’
essere anche rappresentato matematicamente:
Lk=Tw+Wr
dove Tw corrisponde al numero di twist e Wr al numero di writhe. Il numero di twist indica
quante volte un filamento gira attorno all’ altro, mentre il numero di writhe indica quante volte
la doppia elica gira attorno a se’ stessa. Se Wr ≠0, allora vuol dire che la molecola del DNA e’
superavvolta. Bisogna tenere in mente che se la doppia elica gira attorno a se’ stessa in modo
destrorso, Wr>0 e la doppia elica viene definita superavvolta positivamente, se gira in modo
sinistrorso, Wr<0 e la doppia elica viene definita superavvolta negativamente. I nucleosomi,
che sono i costituenti principali della cromatina e che sono composti da un nucleo proteico
attorno al quale e’ avvolta la doppia elica del DNA, introducono superavvolgimenti negativi
nella struttura del DNA. Due topoisomeri sono due molecole di DNA con lo stesso peso
molecolare ma con Lk diversi : queste molecole possono essere separate per elettroforesi dato
che due topoisomeri si muovono con velocita’ diverse nel gel di agarosio – il cccDNA rilassato si
muove molto piu’ lentamente dello stesso cccDNA, ma superavvolto. E’ da intuire che la
velocita’ aumenta con l’ incremento di Wr.

8
Questo fatto sta alla base di numerose tecniche di biologia molecolare, quali il Southern blot e l’ analisi dei
microarray, che veranno viste in seguito.
9
In presenza di cationi Na+, il DNA e’ piu’ stabile dato che questi vanno ad interagire con lo scheletro del DNA che
e’ caricato negativamente.
10
Si tratta del DNA che troviamo nei procarioti.

7
1.2.1: I TIPI E I RUOLI DELLE TOPOISOMERASI
Esiste una straordinaria categoria di enzimi, chiamati topoisomerasi, che sono in grado di
cambiare il Lk della molecola di DNA, ritagliando una o due catene e apportando opportuni
cambiamenti. Ci sono due tipi di topoisomerasi:
-Topoisomerasi I: possono ritagliare solo un filamento della doppia elica cambiando il Lk di un’
unita’ alla volta. Non hanno bisogno di ATP per funzionare.
-Topoisomerasi II: possono ritagliare due filamenti cambiando il Lk di due unita’ per volta, ma
hanno bisogno di ATP per funzionare.
Nei procarioti poi abbiamo un particolare
tipo di Topoisomerasi II chiamato DNA
girasi, che introduce superavvolgimenti
negativi nella molecola di cccDNA.
I ruoli delle topoisomerasi sono molteplici.
Ad esempio, la Topoisomerasi II puo’
concatenare due molecole di cccDNA,
introducendo un taglio alla prima molecola
e facendo passare la seconda attraverso il
taglio.

A questo punto dedichiamoci qualche momento al


meccanismo di reazione delle topoisomerasi (per
semplicita’ si prendera’ in considerazione il tipo I).
Dalla catena polipeptidica della topoisomerasi sporge
l’ amminoacido tirosina, il cui gruppo R e’ formato
dall’ anello benzenico al quale e’ legato un gruppo –
OH. L’ ossigeno dell’ –OH effettua un attacco
nucleofilo (avendo 2 dopietti elettronici attorno a se’)
al fosforo (che fa da nucleofilo) del gruppo fosfato sul
filamento di DNA, spezzando temporaneamente il
legame fosfodiesterico fra il fosfato e lo zucchero. Il
legame neoformato e’ definito legame fosfotirosinico.

8
L’ immagine mostra lo stato in cui si trova il filamento al quale e’ attaccato il residuo di tirosina.
Siccome il legame fosfotirosinico conserva l’ energia formata dall’ idrolisi del legame
fosfoesterico, la reazione e’ facilmente invertibile- quando la topoisomerasi finisce il suo
compito, si riforma il legame fosfodiesterico e il filamento di DNA ritorna ad essere quello di
prima11.
Ora che abbiamo visto come si lega la topoisomerasi al filamento del DNA, vediamo perche’ lo
fa. Inanzitutto, dall’ immagine sottostante vediamo che la struttura quaternaria di questo
enzima e’ formata da 4 domini diversi. Il dominio III (verde) e’ quello che si lega alla catena (nel
modo appena visto). A questo punto avviene un cambiamento conformazionale che rende
possibile il passaggio del secondo filamento attraverso l’ apertura formata. Con un secondo
cambio conformazionale il taglio viene chiuso, ed infine il dominio III si stacca dal filamento del
DNA.

11
Non e' necessario nessun dispendio di ATP dato che le reazioni appena viste sono termodinamicamente
favorevoli a causa l' energia che viene conservata: la Topoisomerasi II usa ATP per altri motivi (cambiamento di
conformazione).

9
CAPITOLO 2: STRUTTURA E VERSATILITA’ DELL’ RNA;
PROTEINE
L’ RNA, o acido ribonucleico, e’ l’ altro acido nucleico del quale ci occuperemo. Come vedremo
lungo il corso, le sue funzioni sono molto piu’ numerose di quelle del DNA – l’RNA e’ una
molecola dinamica che svolge ruoli di fondamentale importanza nella trascrizione, nella
traduzione e nel regolamento dell’ espressione genica. Vedremo anche che alcuni RNA facciano
persino da enzimi.

2.1 : STRUTTURA
L’ RNA si differenzia dal DNA per alcune caratteristiche:
1) Lo zucchero dal quale e’ composto e’ il ribosio che
sul carbonio 2’ ha un gruppo OH12.

2) Invece della base azotata timina (che troviamo nel


DNA) troviamo l’ uracile, che si differenzia dalla timina
solo per il fatto che in posizione 5 non ha un gruppo
metile13.

3) La catena di RNA e’ a filamento singolo. E’ facile


intuire che per questo motivo l’ RNA e’ piu’ flessibile del
DNA.

L’ immagine a sinistra schematizza la struttura chimica dell’ RNA mostrando il ribosio e l’


uracile.
Una caratteristica fondamentale dell’ RNA e’
che spesso il filamento si ripiega su se’ stesso
formando appaiamenti fra basi . Questa
caratteristica viene chiamata struttura
secondaria dell’ RNA. Un esempio tipico sono le
strutture a stem-loop. In una molecola di RNA
possono esserci piu’ struttre secondarie. Nell’
immagine a destra si vede bene come funziona:

12
Ricordiamo che nel DNA c'era il 2'-deossiribosio che sul carbonio in posizione 2' non aveva il gruppo OH.
13
Importante considerazione: il DNA non ha l' uracile per un motivo fondamentale. Quando le citosine vanno
incontro a deamminazione spontanea, si trasformano nell' uracile, il quale viene espulso dai meccanismi di
riparazione del DNA. E' chiaro dunque perche'l' uracile come base regolare non puo' esistere nel DNA – questi
meccanismi non sarebbero in grado di capire quale uracile sia quello regolare e quale invece quello ottenuto dalla
deamminazione citosinica.

10
Le U s’ appaiano alle A mentre le altre basi s’ appaiano secondo la regola Watson-Crick (che,
come vedremo fra un attimo, NON e’ il caso delle strutture secondarie elicari). Le basi che non
sono complementari (dette ‘mismatch’) sporgono dalla struttura secondaria, e se piu’ mismatch
si trovano uno dietro l’ altro si formano anse interne. Una struttura secondaria particolarmente
stabile sono i tetraloop dove oltre ai legami a ponte H incontriamo anche forze di van der
Waals fra le basi del filamento in struttura secondaria (impilamento fra le basi)
Una forma particolare di struttura secondaria e’ la forma elicare: in essa l’ RNA forma doppie
eliche simili al DNA ; qui pero’ NON viene rispettata la regola di Watson-Crick, bensi’ troviamo
appaiamenti di ogni genere (tipo UG e AG). Queste forme elicari sono simili alla forma A del
DNA.
Non finisce qui: la molecola di RNA puo’ anche formare strutture terziarie il che’ ne aumenta
ulteriormente la complessita’. Queste strutture sono rese possibli dato che l’ RNA puo’ ruotare
facilmente attorno ai legami fosfodiesterici dei tratti che non formano la doppia elica. Nella
struttura terziaria c’e’ un’ interazione anche fra tre basi contemporaneamente!
Interessante notare come l’ RNA sia piu’ antico del DNA, cosi’ come l’ uracile e’ piu’ antico della
timina. La DNA polimerasi non puo’ lavorare con l’ uracile, l’ RNA polimerasi invece non lavora
con la timina.

2.2: TIPOLOGIA
Ci sono vari tipi di acido ribonucleico. Finora abbiamo conosciuto essenzialmente 3 tipi di RNA:
1) mRNA – RNA messaggero che effettua la trascrizione
2) tRNA – RNA transfer il quale gioca il ruolo centrale nella traduzione. E’ un ottimo
esempio se si vogliono spiegare le strutture secondarie, dato che ne e’ ricco.
3) rRNA – RNA ribosomale che e’ il costituente dei ribosomi
Questi tre tipi di RNA verranno pero’ approfonditi quando tratteremo i meccanismi dei quali
essi sono protagonisti. Quello che ci interessa al momento e’ che esiste pero’ una miriade di
altri RNA (alcuni dei quali sono stati scoperti recentemente) che svolgono funzioni regolatorie e
talvolta enzimatiche. Tra questi troviamo:
1) microRNA: piccolo molecole (cca. 22 nucleotidi) che si attaccano all’ mRNA, formando
un ibrido double strand : questo serve essenzialente a silenziare l’ mRNA.
2) sRNA: o small RNA, si trova nei batteri e serve per regolare l’ espressione genica
3) lncRNA: o long non-coding RNA che interagiscono con protein e regolano l’ espressione
genica
Gli RNA non codificanti sono molto piu’ numerosi di quelli codificanti.

11
Un RNA puo’ anche assumere il ruolo di un enzima: a quel punto parliamo di ribozima14. Un
ribozima riesce a svolgere da solo una reazione enzimatica grazie alla sua complessa struttura
terziaria, che contiene un sito attivo, il sito di legame per il substrato e quello per i cofattori.
Uno dei primi ribozimi scoperti e’ la RNasi P che e’ una ribonucleasi che svolge un ruolo
fondamentale nel processamento del tRNA. Un altro esempio di ribozima e’ l’ hammerhead ,
una molecola di RNA a forma di martello che troviamo in agenti virali detti viroidi15. Questi
viroidi, una volta entrati nella cellula, replicandosi creano molte copie del loro genoma in forma
di una lunga molecola di RNA16: ogni viroide ‘figlio’ si crea mediante il taglio di un pezzo di
questa molecola, che viene effettuato proprio dal hammerhead che si trova subito vicino al
punto di taglio. Dato che il meccanismo di reazione di questo ribozima si basa sull’ autoidrolisi,
esso non procura spese energetiche all’ ospite. Dopo il taglio, il substrato (che sarebbe il
nucleotide da ritagliare) s’ allontana dal ribozima e viene sostituito da un altro substrato (si
intuisce che si tratta del seguente nucleotide da ritagliare).

2.3: BREVE ACCENNO ALLE PROTEINE


Anche se sono uno dei protagonisti della biologia molecolare, in questo corso accenneremo
soltanto brevemente alle proteine che veranno poi trattate meglio in biochimica.
Le proteine sono polimeri biologici I cui ‘mattoni’ costitutivi sono 20 diversi amminoacidi. Ogni
amminoacido ha un carbonio al quale sono legati un gruppo carbossilico, un gruppo amminico,
un idrogeno e una catena laterale che indicheremo con R. Sono proprio le catene R (o residui
laterali) quelle che differenziano i 20 amminoacidi, dato che le altre strutture sono uguali in
tutti gli amminoacidi.
Il gruppo carbossilico di un amminoacido e il gruppo amminico dell’ altro formano il legame
peptidico con la perdita di una molecola d’ acqua17. Molti amminoacidi uniti in questo modo
formano la sequenza primaria di una proteina: questa sequenza determinera’ poi come saranno
fatte la struttura secondaria e terziaria (in particolare la struttura secondaria e’ data dai legami
a ponte idrogeno e dalla flessibilita’ delle catene polipeptidiche mentre la struttura terziaria
dipende anche dai residui laterali). Le due strutture secondarie sono l’ alfa elica e il beta
foglietto. La struttura terziaria invece s’ ottiene con il ripiegamento della catena: e’ proprio la
forma della proteina ripiegata a definire la sua funzione. In questa struttura incontriamo domini
proteici. C’e’ un ulteriore livello di organizzazione che chiamiamo struttura quaternaria delle
proteine. La proteina in questa struttura e’ composta da piu’ subunita’ ognuna delle quali e’ in
realta’ una proteina a se’, che si e’ unita con le altre (subunita’) per formare il polipeptide
definitivo in struttura quaternaria. Un esempio di questo genere sono i fattori di trascrizione,

14
Attenzione a non confondere un ribozima con un RNA che reagisce con un enzima e contribuisce alla sua
funzione (quello non e' un ribozima).
15
Si tratta di particolari aggenti infettanti che attaccano le piante.
16
Si tratta dell' RNA policistronico!
17
La formazione di questi legami avviene nel processo di traduzione.

12
che solitamente sono composti da
almeno due subunita’, una che
interagisce col DNA e l’ altra che
interagisce con altri enzimi. Le
proteine che interagiscono con il
DNA lo fanno solitamente mediante
il solco maggiore che offre molte
informazioni di tipo chimico. Nell’
immagine a fianco sono
rappresentate alcune interazioni fra
amminoacidi e DNA. Nelle figure di
sotto vediamo invece a sinistra una
catena proteica primaria: essa e’
abbastanza flessibile da formare
angoli torsionali che permettono le
strutture secondarie che vediamo a
destra, stabilizzate da legami
idrogeno.

13
CAPITOLO 3: L’ ORGANIZZAZIONE DEL GENOMA NUCLEARE:
GENI, CROMOSOMI, CROMATINA, TRASPOSIZIONE

3.1: GENERALITA’
Finora abbiamo analizzato il DNA e la sua natura chimica fuori dal contesto cellulare. In questo
capitolo ci occuperemo invece di come il DNA sia organizzato nel nucleo della cellula e di come
questa lunghissima catena possa esistere all’ interno di un nucleo cosi’ piccolo.
Inanzitutto bisogna dire che ci sia una differenza fra l’ organizzazione dei procarioti e quella
negli eucarioti. Nei procarioti (batteri) il DNA lo troviamo in forma di un’ unica molecola
circolare che si trova nel citoplasma (vedremo che sia piu’ corretto dire cromosoma circolare) .
Nel nucleo degli eucarioti invece abbiamo il DNA in forma di cromatina.
Quello che e’ comune ai procarioti e agli eucarioti e’ pero’ la struttura denominata cromosoma,
dove il DNA e’ associato alle proteine. Il cromosoma comporta essenzialmente 3 grandi
vantaggi:
1) Rende il DNA adatto per essere contenuto nel nucleo e lo protegge da possibili danni
2) Si tratta di una struttura molto stabile
3) Facilita i processi di regolazione genica
La struttura dei cromosmi verra’ pero’ discussa in seguito.
Il genoma umano e’ stato sequenziato per il 99.99% durante un proggetto che duro’ 13 anni e
che coinvolse tantissimi laboratori mondiali, chiamato HUMAN GENOME PROJECT (Progetto
Genoma Umano). Questa scoperta ha poi segnato l’ inizo dell’ era della genomica funzionale il
cui obiettivo e’ quello di descrivere le funzioni e le caratteristiche dei genomi, proteomi,
trascrittomi e metabolomi – tutti quanti sistemi integrali del fenomenale mondo cellulare.

3.2: LE CARATTERISTICHE DEL GENOMA CHE DETERMINANO LA


COMPLESSITA’ DEGLI ORGANISMI
Un dato di fatto e’ che il genoma e le sue caratteristiche siano direttamente correlati alla
camplessita’ di un organismo. Inanzitutto perche’ organismi piu’ complessi possano lavorare
bene serve un numero di geni molto piu’ grande che per far funzionare un batterio. E’ pero’
importante dire che per determinare la complessita’ non sia tanto la lunghezza stessa del
genoma quello che conta bensi’ e’ il numero di geni in relazione con la lunghezza del DNA,
ovvero la densita’ genica. Piu’ concretamente, quanto un organismo e’ piu’ complesso tanto la

14
sua densita’ genica diminisce. Questa densita’ si calcola ponendo in relazione il numero di geni
e la lunghezza della catena sulla quale questi geni si trovano.
Data questa situazione, ci sono organismi anche molto piu’ semplici di noi che hanno il nostro
quasi stesso numero di geni – hanno pero’ una densita’ genica molto maggiore. In altre parole,
questo stesso numero di geni nell’ organismo meno sviluppato e’ disposto in una catena molto
piu’ corta.
Da questo si puo’ dedurre facilmente che il DNA non sia dunque formato solo da geni. In realta’,
negli organismi piu’ complessi la stragrande maggioranza del genoma e’ non-coding (non
codifica per proteine). Questa parte del genoma e’ composta principalmente da sequenze
intergeniche, che sono formate da sequenze uniche e sequenze ripetute. Le sequenze ripetute
sono quelle assolutamente piu’ numerose. Inoltre, negli organismi piu’ sviluppati aumenta
anche il numero delle parti non codificanti all’ interno di un singolo gene, che si chiamano
introni18. L’ uomo ha circa 7 introni per gene. Quando questi introni non vengono eliminati
bene durante lo
splicing si puo’
arrivare anche a
tumori.

L’ immagine
schematizza molto
bene quanto detto sul
genoma umano.

Un altro tipo di sequenza ripetuta (piu’ precisamente sequenza altamente ripetuta) sono gli
elementi trasponibili (dispersed repeats). Sono composti da trasposoni a DNA e da
retrotrasposoni; questi ultimi si dividono in line elements e sine elements. Si tratta di
sequenze che possono spostarsi da una parte all’ altra del genoma. Nel corso della
trasposizione19, l’ elemento trasponibile si sposta in una nuova posizione nel genoma, spesso
lasciando la copia originale nella posizione preesistente. Quindi queste sequenze si moltiplicano

18
Essi verranno poi eliminate nel processamento dell' RNA definito anche RNA splicing, che vedremo in seguito.Gli
introni vengono dunque trascritti ma non vengono tradotti in proteine dato che vengono eliminate dal
trascrittoma.
19
Che analizzeremo in dettaglio piu' tardi in questo capitolo.

15
e accumulano nel genoma. Anche se nelle cellule umane questo processo e’ raro, queste
sequenze occupano una notevole parte del genoma- cca. Il 45%!
Dato che abbiamo menzionato parecchi elementi, facciamo uno schema che spiega bene
quanto detto finora a proposito delle costituenti del genoma (per le percentuali guardare l’
immagine a pagina 13):
Il DNA e’ essenzialmente formato da:
1) Geni e sequenze correlate ai geni: questa parte e’ composta dal DNA codificante e dal
DNA non codificante, quest’ ultimo formato da pseudogeni20, frammenti di geni ed
introni.
2) DNA intergenico: Tutta questa parte del genoma non e’ codificante. E’ formata da
sequenze uniche e sequenze ripetute. Le sequenze ripetute poi si dividono in
trasponibili (trasposomi) e non trasponibili (DNA satelliti, minisatelliti, microsatelliti)
La lunghezza (distanza) fra blocchi di sequenze differisce da specie a specie. E’ poi importante
notare che ogni singolo individuo (anche della stessa specie) abbia il genoma differente. Anche
se ereditiamo meta’ genoma nucleare dalla madre e meta’ dal padre, si creano poi delle piccole
modificazioni al genoma stesso che determinano il genetic fingerprint, importante nella scienza
forense.
Nuove ricerche genomiche hanno portato ad ipotizzare che sia proprio la misteriosa parte non
codificante del genoma a definire la complessita’ dell’ organismo21. Fino a poco tempo fa la
funzione di questa parte era completamente sconosciuta, mentre oggi ne sappiamo solo un
piccolo pezzo. Sara’ il compito dei futuri biologi molecolari scoprire quali segreti si nascondono
in questa affascinante struttura, un lavoro che richiedera’ tanti anni e che probabilemente
aprira’ innumerevoli domande nuove.

20
Anche se si pensava che i pseudogeni non abbiano alcuna funzione codificante, con le nuove scoperte si e'
arrivato a contestare questa convinzione. I pseudogeni veranno analizzati nella parte riguardante la regolazione
della trasposizione.
21
Come aveva detto Collavin, una possibile ipotesi e’ che ci sia tutta questa grande parte del genoma non
codificante per ridurre la possibilita’ che le mutazioni avvengano sulla parte codificante del genoma. Come
vedremo in seguito I danni causati dalle mutazioni possono portare a conseguenze gravi, e per questo e’ nell’
interesse della cellula ridurre la probabilita’ che avvengano al minimo.

16
3.3: I CROMOSOMI
E’ venuto il momento di descrivere piu’ in dettaglio la struttura e
l’ organizzazione cromosomica.
Semplicemente, il cromosoma e’ una struttra che contiene un
pezzo del genoma nucleare complessivo. Il cariotipo sarebbe l’
insieme di tutti i cromosomi di un organismo che assieme
contengono l’ intero genoma nucleare. Quello che immaginiamo
quando diciamo ‘cromosoma’ e’ la struttura che si vede nell’
immagine, che non e’ del tutto giusto –dovendo esser precisi, la
struttura nell’ immagine e’ un cromosoma metafasico. Nell’
interfase, il DNA e’ organizzato in maniera molto diversa che vedremo un attimo dopo.
Il cromosoma metafasico e’ fatto da due cromatidi fratelli22 che sono uniti dalla struttura detta
centromero, una struttura necessaria per la corretta segregazione dei cromosomi dopo la
replicazione del DNA. Nel centromero troviamo l’ eterocromatina (zona non leggibile). Agli
estremi di ogni cromatidio troviamo i telomeri che sono strutture necessarie per ‘tamponare’ la
perdita dei pezzi di DNA alla fine della replicazione (si vedra’ nel capitolo 4 ). I telomeri
contengono sequenze che non codificano per nessuna proteina (TTAGGG) , bensi’ servono
soltanto come ‘scarto’.
Nei procarioti i cromosomi sono di forma circolare (le cellule procariotiche hanno uno o piu’
cromosmi circolari) e prendono il nome di nucleoide, mentre negli eucarioti sono strutture
lineari. Il numero di cromosomi cambia da specie a specie, ma a parte malfunzionamenti
genetici, questo numero e’ identico per tutti gli individui di una specie. L’ uomo ad esempio ne
ha 46, cioe’ 23 coppie delle quali una coppia sono cromosomi sessuali.
Ora che abbiamo descritto come sguardano i cromosomi, chiediamoci da che cosa sono
composti. La struttura che compone i cromosomi e’ la cromatina – la forma nella quale il DNA
si trova nell’ interfase.
Prima di descrivere gli aspetti molecolari della
cromatina, guardiamo l’ immagine a destra. Essa
rappresenta il risultato ottenuto con l' ibridazione in
situ SKY-FISH dei cromosomi metafasici: una volta
finita la divisione cellulare, il DNA si organizza in
forma di cromatina in tutto il nucleo. Vediamo pero'
che la disposizione della cromatina non sia random,
bensi' specifici cromosomi (ognuno dei quali e'

22
Ogni cromatidio e' in realta' un cromosoma, ma per semplicita' definiamo il cromosoma come una struttura
formata da due cromatidi. I cromatidi fratelli sono uguali fra di loro!

17
indicato in un colore diverso grazie alle molecole ibride che sono legate ad essi) si trovano in
specifiche posizioni nel nucleo.

3.4: LA CROMATINA
La cromatina e’ formata essenzialmente da nucleosomi uniti fra di loro dal DNA linker. Questo
le conferisce una tipica struttura che viene definite come collana a perle. Il nucleosome e’
composto dalla catena di DNA che e’ arrotolato attorno a un nucleo proteico formato da
proteine basiche dette istoni. A pH neutro queste proteine sono cariche positivamente. Degli
istoni ci sono 5 tipi ragruppati in due classi:
1) Non-core proteins: questa classe contiene solo un tipo, chiamato H1. E’ il tipo piu’
variabile di istoni.
2) Core proteins: qui abbiamo 4 tipi, H2A, H2B, H3, H4. A pH neutro sono cariche
positivamente. Questa nozione e’ fondamentale in quanto le cariche + degli istoni
attirano la carica - dello scheletro deossiribosio-fosfato del DNA che si attorciglia attorno
al nucleo formato dai core proteins.

Gli istoni sono proteine


eterogenee – variano da
tessuto a tessuto. Un istone e’
composto da un tetramero
(H3-H4)x2 e da due dimeri
H2A-H2B. Cca. 200 paia di
basi s’ attorcigliano attorno al
nucleo istonico, e vengono
tenute ferme dalla proteina
H1 (unica proteina istonica
che non fa parte del nucleo
istonico) che si lega al DNA
linker. Un trattamento con
pepsina o alte concentrazioni saline rimuove H1 il che provoca una degradazione del sistema
appena descritto. Gli istoni legano tipiche regioni del DNA- importante segnalare che il
tetramero (H3-H4)x2 lega regioni differenti del DNA dai due dimeri H2A-H2B. Il contatto che il
tetramero prende col DNA avviene pero’ soltanto nella regione del solco minore23. La maggior
parte delle interazioni avviene mediante legami idrogeno, che s’ instaurano sia fra la proteina e
l’ ossigeno del legame fosfodiesterico (maggiormente) che fra la proteina e le basi azotate (in
minor misura). L’ elevato numero dei legami idrogeno fornisce l’ energia necessaria a curvare il

23
Proprio per questo si tratta di interazioni non specifiche: ricordiamo che il solco minore offre poche informazioni
chimiche e non offre alcuna informazione sull' appaamento specifico.

18
DNA attorno al nucleo istonico, il che e’ ulteriormente facilitato dalle cariche (+) possedute
dagli istoni che schermano le cariche (-) presenti sullo scheletro zucchero-fosfato del DNA24. Le
code ammino-terminali degli istoni stabilizzano ulteriormente il complesso, avvolgendosi
attorno all’ ottamero proteico (nucleo istonico).
Il DNA avvolto attorno ai nucleosomi e’ superavvolto negativamente. Uno potrebbe chiedersi il
perche’ di questo fenomeno. La risposta e’ semplice- un superavvolgimento negativo favorisce
lo svolgimento del DNA stesso, e ricordiamo che la cellula debba svolgere il DNA molto spesso –
ad esempio per iniziare la replicazione, effettuare la trascrizione, ricombinazione ecc.
Nel nucleo, la cromatina appare essenzialmente in due forme: eucromatina ed eterocromatina.
L’ eterocromatina ha un aspetto condensato – in questa zona l’ espressione genica e’ assai
ridotta. Al contrario, l’ eucromatina che e’ molto meno condensata presenta un’ attivita’ di
espressione genica notevolmente maggiore. La differenza fra le due forme sta nel fatto che i
nucleosomi siano organizzati in modo diverso nell’ eucromatina e nell’ eterocromatina: in altre
parole, l’ eterocromatina presenta strutture di ordine superiore25.
I nucleosomi sono disposti a zig-zag nel ‘filo
di perle’ per via dell’ istone H1 che lega il
DNA linker e crea angolature definite con le
quali il DNA entra in contatto col nucleo
istonico.
H1 stabilizza anche la struttura nota come
fibra cromatinica: si tratta di una forma
che puo’ assumere il modello di solenoide26
oppure il modello a zig-zag, di spessore
30nm, formata da nucleosomi
impachettati. Oltre alla proteina H1, anche
le code istoniche ammino-terminali sono
responsabili della formazione della fibra
cromatinica.
L’avvolgimento del DNA intorno agli istoni
creerebbe pero’ una tensione tale da
permettere il superavvolgimento. Per
evitare questo, si creano ulteriori strutture
chiamate anse radiali. Queste anse, che
contengono un elevato numero di basi, sono bloccate alla loro base da una struttura proteica

24
Se non ci fossero le cariche positive, il DNA non potrebbe avvolgersi bene perche' le cariche negative
creerebbero repulsioni fra di loro.
25
Queste pero' sono visibili solo al microscopio elettronico.
26
Nel modello a solenoide, il DNA linker e' molto meno accessibile che nella forma a zig-zag.

19
chiamata scaffold nucleare27. Ci sono ulteriori livelli di organizzazione come si vede dall’
immagine, fino ad arrivare alla struttura che comunemente chiamiamo cromosoma metafasico.

3.4.1: REGOLAZIONE DELLA STRUTTURA CROMATINICA ED


EPIGENETICA
L’ interazione del DNA con l’ ottamero istonico e’ dinamica. Alla base di questo sta il fatto che il
DNA sia legato al nucleo istonico mediante interazioni deboli ed elettrostatiche, che possono
spezzarsi nei momenti di esigenza. Oltre pero’ a questa dinamicita’, la stabilita’ del nucleosoma
e’ influenzata anche da grossi complessi proteici detti complessi di rimodellamento dei
nucleosomi. Questi complessi usano l’ energia liberata dall’ idrolisi di ATP per facilitare i
cambiamenti della posizione dei nucleosomi. Ci sono poi nucleosomi che assumono posizioni
fisse e che si spostano raramente: questo perche’ il DNA linker adiacente a questi nucleosomi
contiene ad esempio dei siti di legame per le proteine regolatrici.
Un altro fatto importante, che vedremo nel dettaglio in seguito, e’ che la regolazione dell’
espressione genica negli eucarioti sia collegata con la struttura della cromatina. Se dei geni
devono rimanere silenti per un periodo e dunque non devono essere espressi, questi si
troveranno nella porzione eterocromatinica che e’ poco accessibile alle proteine e all’ RNA, nel
modo da non essere accessibili per la trascrizione.
L’accessibilita’ della cromatina e’
influenzata anche dalle modificazioni
post-trascrizionali delle code istoniche che
sporgono dal nucleosoma. Queste
modificazioni possono essere metilazioni,
acetilazioni, ubiquitinazioni, fosforilazioni
ecc. dei vari amminoacidi che
costituiscono la coda. L’ insieme di tutte
queste modificazioni viene chiamato
codice epigenetico. Questo codice puo’
essere letto dai complessi di
rimodellamento. Questi ultimi agiranno in
base al codice, apportando le opportune
modificazioni ai nucleosomi. E’
importante osservare che specifiche
modificazioni siano associate a nucleosomi coinvolti in processi cellulari diversi. Nell’ immagine
sono raffigurate 4 code istoniche, ognuna con un codice diverso.

27
Le proteine che compongono questa struttura sono oggetti di molti studi: per ora c'e ancora moltissimo da
scoprire a proposito dello scaffold.

20
Per citare un esempio
pratico di questi
meccanismi,
orientiamoci all’
immagine a sinistra. In
mezzo vediamo un
nucleosoma con code
istoniche non
modificate. L’
espressione dei geni
contenuti nel DNA
avvolto e’
relativamente bassa. Se
le code vengono metilate, l’ espressione si spegne perche’ dei complessi di rimodellamento (in
questo caso con cromodominio) vanno a legarsi sulle porzioni metilate compattando
ulteriormente la struttura del nucleosoma (il DNA diventa ancor meno accessibile). Al contrario,
se le code vengono acetilate, altri complessi di rimodellamento (questa volta col
bromodominio) vanno a legarsi sulle porzioni acetilate e fanno in modo da ‘rilassare’ il
nucleosoma (gli istoni non legano piu’ tanto fortemente il DNA) il che causa un’ espressione
genica piu’ alta. Ci sono anche degli enzimi che contengono domini che preferiscono interagire
con le code istoniche non modificate (dominio SANT). In accordo con l’ ipotesi che ci siano
enzimi con domini proteici che riconoscono i siti modificati delle code istoniche, in molti casi le
proteine con questi domini riconoscono preferenzialmente solo uno fra i tanti siti modificati su
quella coda28!
La conclusione da trarre e’ che il codice epigenetico giochi un ruolo fondamentale nell’
espressione genica: le modificazioni del nucleosoma e il rimodellamento cooperano per
aumentare l’ accessibilita’ del DNA in quelle porzioni che devono essere lette e trascritte,
mentre diminuiscono l’ accessiblita’ in quelle zone del DNA dove si trovano geni che in quel
momento devono rimanere silenti.

3.5: GENOMA NON CODIFICANTE, ELEMENTI TRASPONIBILI E


MECCANISMI DI TRASPOSIZIONE29
Una bella porzione del genoma umano (cca. 50%!) e’ occupata da elementi trasponibili o
trasposoni. Il meccanismo di trasposizione prevede lo spostamento dei trasposoni da un sito
del genoma ad un altro. Questo puo’ avvenire per escissione del trasposone dalla sua posizione

28
Ad esempio la proteina HP1 contiene un dominio che riconosce solo la lisina 9 metilata dell' istone H3, ma
nessun' altro sito metilato su quell' istone.
29
Schoeftner ha fatto questa parte ora per descrivere la mobilita' del genoma. In realta' i meccanismi affrontati in
questa parte andrebbero capiti meglio se fatti dopo la replicazione e la ricombinazione del DNA.

21
sul DNA (ed eventuale spostamento sul nuovo sito) oppure con la creazione di una nuova copia
che va ad inserirsi in un sito del genoma, lasciando fisso il trasposone originario.

Generalmente, quando gli elementi trasponibili si muovono, presentano una scarsa selettivita’
nella scelta del sito d’ inserzione. Il risultato e’ che possono inserirsi all’ interno di un gene,
spesso distruggendone completamente le funzioni. Altre volte possono inserirsi all’ interno di
una sequenza regolatrice del gene, nel modo da interferire con il modello dell’ espressione
genica30. In molti organismi, questi elementi sono dunque la causa di diverse mutazioni, che
talvolta portano a malattie gravi (emofilia, cancro, immunodeficienze, malattie
neurodegenerative). Comparando i vari genomi, si nota una grande varieta’ nella quantita’ di
materiale trasponibile: nell’ uomo solo 2% di genoma codifica per proteine mentre il 50% e’
composto da trasposoni. Al contrario, i genomi di organismi come la mosca o il lievito sono
‘ricchi di geni’ e ‘poveri di
trasposoni’.
Vediamo ora la suddividione
degli elementi trasponibili in
base alla loro
organizzazione e al
meccanismo di
trasposizione:
1) Trasposoni a DNA
2) Retrotrasposoni –
distinguiamo
retrotrasposoni simili ai
virus e retrotrasposoni poli-
A.

I 3 tipi essenziali di trasposoni. Notare in b) le due sequenze LTR (direct repeats)


uguali fra loro e in c) 2 sequenze UTR che sono diverse fra di loro!!

30
Proprio grazie a questa compromissione della funzionalita' dell' espressione genica Barbara McClintock scopri' gli
elementi trasponibili.

22
L’ essenziale differenza e’ che i retrotrasposoni per effettuare il meccanismo della trasposizione
usano come mediatore una molecola di RNA.

3.5.1: TRASPOSONI A DNA


I trasposoni a DNA sono composti sia dalle sequenze che servono come siti per la
ricombinazione sia dai geni che codificano per le proteine che partecipano alla trasposizione. Le
prime sono organizzate come sequenze ripetute e invertite che servono per il riconoscimento
della ricombinasi – la proteina che esegue la ricombinazione e che nel caso della trasposizione
prendera’ il nome di trasposasi. Le sequenze immediatamente fiancheggianti il trasposone
sono dette duplicazioni del sito bersaglio (le vedremo in seguito). Oltre al gene per la
trasposasi, queso tipo di trasposoni al suo interno puo’ contenere dei geni che codificano per
proteine regolanti le attivita’ di trasposizione31. I trasposoni a DNA possono essere autonomi,
cioe’ possono avere al proprio interno tutti gli elementi necessari per una trasposizione
completa, oppure possono essere non autonomi: questi ultimi non contengono il gene per la
trasposasi, il che’ significa che per muoversi dipendono dai trasposoni autonomi presenti nel
DNA.
I meccanismi di trasposizione che vedremo per questo tipo di trasposoni sono la trasposizione
taglia e incolla e la trasposizione replicativa.
TRASPOSIZIONE TAGLIA E INCOLLA: Si tratta del meccanismo piu’ semplice, che prevede l’
escissione del trasposone dalla sua posizione inizale sul DNA, seguita dall’ integrazione dello
stesso in un nuovo sito del DNA.
Per inizare, la trasposasi (che viene codificata dal trasposone nel caso di trasposone autonomo)
si lega alle estremita’ invertite e ripetute del trasposone. Una volta riconosciute queste
sequenze, l’ enzima avvicina le due estremita’ del trasposone dando origine a un complesso
nucleo-proteico stabile che viene chiamato complesso sinaptico o traspososoma, che contiene
2 o 4 subunita’ di trasposasi e le due estremita’ del DNA. Il compito di questo complesso non e’
soltanto di unire le due estremita’ ma anche di proteggerle dagli enzimi cellulari. A questo
punto inizia il taglio: la trasposasi taglia un filamento di ogni estremita’ che si trova in
corrispondenza del DNA fiancheggiante. Ambedue i filamenti ritagliati alle estremita’ hanno i
gruppi 3’- OH liberi. Per terminare l’ escissione anche il secondo filamento di ogni estremita’
deve esser tagliato – le modalita’ del taglio di questo ‘secondo’ filamento sono pero’ dipendenti
dal tipo di trasposone, e in seguito ne vedremo alcuni. A questo punto avviene il bello: le
estremita’ 3’-OH dei filamenti ritagliati per primi dalla trasposasi effettuano un attacco
nucleofilico (con la coppia di elettroni che si trovano sull’ ossigeno) al fosforo del gruppo fosfato
che si trova nel sito di nuova inserzione, attacandone il legame fosfodiesterico. La sequenza di
DNA dove avviene questa reazione si chiama DNA bersaglio. La maggior parte dei trasposoni

31
Molti trasposoni batterici contengono geni che codificano proteine che inducono resistenza a uno o piu'
antibiotici.

23
non sono selettivi- il DNA bersaglio puo’
praticamente avere qualsiasi sequenza. Il
risultato dell’ attacco nucleofilico e’ un nuovo
legame covalente fra il trasposone e il DNA nel
sito bersaglio. L’ interruzione che si forma sul
DNA bersaglio (che si vede nella figura a fianco)
viene saldata mediante un unico passaggio di
transesterificazione, noto come trasferimento
del filamento di DNA. Il traspososoma
menzionato prima serve anche a garantire che le
due estremita' del trasposone attachino
contemporaneamente le due eliche sullo stesso
sito bersaglio, il che' e' fondamentale per un'
inserzione corretta dell' elemento trasponibile32.
La distanza sul DNA bersaglio fra i due siti di
attacco (ci saranno due ovviamente, per
ambedue le estremita' del trasposone) e' molto
piccola, ed e' fissa per ogni trasposone. Una
volta che l' inserzione e' terminata, il compito del
traspososoma e' finito.
Sotto a destra e' rappresentanto il meccanismo

chimico dell' inserzione del trasposone per


mezzo dell' attacco nucleofilico.Non
dobbiamo scordare che quando il trasposone
s' aggancia al DNA bersaglio, in ogni
estremita' resta una rottura del singolo
filamento del DNA, che termina col 3'-OH.
Questa rottura deve ovviamente essere
saldata- compito che si assume una DNA Pol
specializzata nella riparazione dei filamenti33.
Interessante notare che in questo processo
le estremita' 3'-OH fungano da primer.
Quando finisce la riparazione, siamo in grado
di dire qual' era la distanza iniziale fra i due
siti di attacco del trasposone sul DNA

32
O 'transponible', da leggere col simpatico accento tedesco di Schoeftner ;)
33
Non sono sicuro di che Pol si tratti, da controllare!

24
bersaglio- diciamo che si crea una sorta di 'footprint'. Anche il sito della 'vecchia' inserzione
viene riparato.
Sta ora a vedere alcuni meccanismi per tagliare il filamento non trasferito durante il processo di
trasposizione. La figura sotto rappresenta alcune modalita'34.

1) Modalita' Tn7 (batteri): Il trasposone Tn7 codifica la sua trasposasi TnsB e un' altra
proteina TnsA. Quest' ultima ritaglia il filamento non trasferito. In realta' TnsA e TnsB s'
assemblano e lavorano insieme, 'dividendo' fra loro i compiti.
2) Modalita' Tn10, Tn5 (Drosophila): In questa modalita', la trasposasi promuove tutti i
passaggi: dopo il taglio del primo filamento, la trasposasi usa l' estremita' 3'-OH libera
che effettua un attacco al legame fosfodiesterico dell' altro filamento (sempre con la sua
coppia di elettroni) e crea una reazione di transesterificazione, che porta alla formazione
di una forcina. Essa contiene due anse che derivano dall' unione covalente di due
filamenti del DNA. A questo punto, la forcina viene escissa e le due anse vengono

34
Questo e' un tipico esempio di come possa essere piu' semplice studiare con l' immagine che con il testo. In
questo caso,secondo me, conviene usare l' immagine per ricordarsi i meccanismi, usando il testo come supporto.

25
spezzate dalla trasposasi. Il trasposone e' ora pronto a essere inserito in una nuova
posizione sul DNA.
3) Modalita' Hermes: Questa modalita' e' molto simile a quella della Drosophila in quanto
implica la formazione di forcine, ma questa volta non sul trasposone bensi' sulle
estremita' del DNA ospite che non fanno parte del trasposone. Come si vede dall'
immagine di sopra, l' OH che svolge l' attacco (reazione di transesterificazione) non fa
parte del trasposone. Questo OH viene a legarsi covalentemente con l' altro filamento
del DNA ,formando una forcina e liberando cosi' il trasposone che e' pronto a essere
inserito nel nuovo sito di DNA. Notare che in questo caso le prime estremita' del
trasposone a essere liberate sono le 5' (non le 3' come per gli altri due modelli)
TRASPOSIZIONE MEDIANTE MECCANISMO REPLICATIVO: Come gia’ accennato sopra, questa
parte potrebbe essere poco chiara se non si e’ familiari con il meccanismo replicativo. Detto
questo, orientiamoci all’ immagine sottostante e descriviamo brevemente il meccanismo.
Inanzitutto, anche se i prodotti sono diversi, questo meccanismo
e' simile a quello taglia e incolla in quanto non prevede alcun
intermediario a RNA.
Il primo passaggio consiste sempre nell' assemblaggio delle
trasposasi su ambedue le estremita' del trasposone creando il
complesso del traspososoma (fondamentale per coordinare il
resto del meccanismo). Il passo seguente consiste nel tagliare le
due estremita' del trasposone nel modo da avere due filamenti
che terminano col 3'-OH alle due estremita'. Queste reazioni
sono catalizzate sempre dalla trasposasi. Al contrario del
meccanismo taglia e incolla, qui il secondo filamento NON viene
ritagliato e non si ha dunque l' escissione del trasposone dal DNA
ospite. Le estremita' 3'-OH vengono quindi unite al sito bersaglio
(uguale come nel meccanismo taglia-incolla), ma come evidente
dalla figura, si ha la formazione di una molecola di DNA con una
doppia ramificazione: le estremita' 3' del trasposone sono unite
al nuovo DNA mentre le 5' restano unite al DNA iniziale. I 2
bracci di DNA hanno la struttura di una forca replicativa35. Le
proteine replicative si assemblano su uno solo di questi bracci
(nel Fago Mu, la forma meglio studiata). L' estremita' 3'-OH sul
DNA bersaglio fanno da innesco per la sintesi del nuovo
filamento (qui verra' a crearsi il leading strand) . La replicazione
avviene lungo la sequenza del trasposone per finire sulla

35
Vedi capitolo sulla replicazione per ulteriori chiarimenti sulla forca replicativa.

26
seconda forca. Questo processo genera due copie del trasposone, che, come si vede dalla
figura, sono separate sulla molecola di DNA bersaglio.
La trasposizione replicativa puo' spesso creare delle duplicazioni o delezioni sul cromosoma,
creando gravi danni genetici. Per questo motivo, la maggioranza dei meccanismi di
trasposizione favorisce una completa escissione dell' elemento trasponibile prima di inserirlo
nel DNA bersaglio.

3.5.2: TRASPOSONI A RNA


Questa variante di trasposoni, chiamati anche retrotrasposoni, differisce da quelli a DNA
principalmente perche' per muoversi da un sito ad un altro usano un intermedio a RNA. Quest'
innovazione conferisce un modo elegante di trasposizione che non necessita del taglio del
secondo filamento – il trasposone a RNA dunque non viene mai escisso dalla sua posizione
originaria. Ci sono 2 tipi di retrotrasposoni:
1) Retrotrasposoni simili ai virus
2) Retrotrasposoni a Poli-A
RETROTRASPOSONI SIMILI AI VIRUS: Vengono
chiamati cosi' perche' il loro meccanismo d' azione e'
quasi identico a quello dei retrovirus che inseriscono il
loro genoma nella cellula ospite. Vediamo come
funziona: la sequenza del retrotrasposone viene
trascritta in RNA dalla RNA polimerasi. La trascrizione
inizia dal promotore posto sulla LTR. Questa molecola
di RNA viene poi retrotrascritta in DNA a doppio
filamento mediante il meccanismo di trascrizione
inversa (che verra' visto fra un po') effettuato dalla
trascrittasi inversa. Il DNA formato e' detto cDNA. Il
passaggio seguente e' effettuato dall' integrasi (simile
alla trasposasi, e' codificata dal retrotrasposone) che
identifica il cDNA e ritaglia alcuni nucleotidi su
entrambi i filamenti in 3'. Fatto questo, l' integrasi
catalizza l' inserimento delle estremita' 3' nel genoma
dell' ospite, mentre le proteine di riparazione della
cellula ospite riempiono le interruzioni che si sono
formate sul sito bersaglio (portando alla duplicazione
del sito bersaglio) . Come vediamo, la seconda parte
del meccanismo e' completamente identica al
meccanismo taglia- incolla (solo che invece della
trasposasi c'e' l' integrasi).

27
RETROTRASPOSONI A POLI-A:
Si dividono in elementi LINE (autonomi) e SINE (non
autonomi)36. Anche questi retrotrasposoni si
muovono mediante un intermedio a RNA, ma il
meccanismo di retrotrascrizione avviene in maniera
diversa e prende il nome di trascrizione inversa
innescata dal sito bersaglio. La trascrizione, che e'
svolta dall' RNA polimerasi, in questo caso parte dal
primo nucleotide del trasposone. La molecola di
RNA neosintetizzata a questo punto esce dal nucleo
entrando nella porzione citoplasmatica, dove viene
tradotta dal macchinario ribosomale in due
proteine, ORF1 e ORF2 che, appena tradotte, vanno
a legarsi all' intermedio di RNA che le ha codificate.
ORF1 e' una proteina legante l' RNA mentre ORF2 ha
attivita' endonucleasica e di trascrittasi inversa.
Questo complesso ribonucleoproteico rientra poi
nel nucleo. ORF2 promuove il taglio del DNA ospite
(attivita' endonucleasica) dove la sequenza poli-A
presente sull' RNA va ad interagire con una
sequenza di T ripetute sul DNA. L' estremita' 3'-OH
che si e' venuta a formare con l' incisione del DNA
serve ora come innesco per la retrotrascrizione dell'
RNA in DNA. I passaggi finali non sono ancora ben
compresi dai ricercatori, ma includono la sintesi del
secondo filamento di cDNA (con decadimento dell'
intermedio RNA), la riparazione della rottura nel sito
d' inserzione e la ligazione utile a saldare i filamenti
di DNA.

A questo punto, prima di trattare il tema sulla regolazione della trasposizione, faro' una breve
digressione sulla trascrizione inversa per descriverne il meccanismo. Da notare che quest'
ultimo non sia materia d' esame.

36
La differenza fra i due verra' approfondita nella sezione riguardante la regolazione della trasposizione.

28
APPROFONDIMENTO: La trascizione inversa effettuata dalla trascrittasi inversa:
Il mondo dei virus37 e' un mondo che presenta spesso fenomeni assolutamente peculiari e non
di rado affascinanti. Basta solo pensare che il virus sia un' entita' la cui esistenza si trova al
confine fra la natura vivente e quella non vivente, che coi suoi meccanismi molecolari puo'
devastare la cellula e persino sfruttarla al proprio favore, per rigenerarsi dal nulla. Uno dei
meccanismi e' quello dei retrovirus, chiamato trascrizione inversa, che abbiamo incontrato
parlando dei retrotrasposoni. Come implicato dal suo nome, l' enzima chiamato trascrittasi
inversa sintetizza, a partire da una molecola di RNA (detta filamento +, che ai termini ha due
sequenze R identiche fra di loro) , un filamento di DNA complementare (detto filamento -).
Infine, essa catalizza anche la formazione del secondo filamento del DNA (detto filamento + del
DNA) creando il DNA duplex. Come se non bastasse, un' altra funzione di questo enzima e'
quella RNAasica – degrada la molecola di RNA che fa parte dell' ibrido DNA-RNA per creare
spazio per il filamento + del DNA.
Come le DNA polimerasi, la trascrittasi inversa ha bisogno di un innesco: esso e' rappresentato
da un tRNA38 . Una sua sequenza di 18 nucleotidi al 3' viene ad appaiarsi con un sito a 100-200
basi dall' estremita' 5' dell' RNA che verra' trascritto. La trascrittasi inversa inizia a sintetizzare il
filamento complementare di DNA usando l' RNA come stampo, partendo dal primer (tRNA) : qui
sorge pero' un problema: questo succede a sole 100-200 basi a valle dell' estremita' 5' di RNA.
La domanda e': cosa succede quando la trascrittasi arriva alla fine? Avvengono essenzialmente
due cose: la trascrittasi con la sua attivita' Rnasi H degrada la regione R+U5 dell' RNA stampo,
dopo di che si verifica il primo salto (first jump) dove la trascrittasi cambia stampo portandosi
all' altra estremita' della molecola di RNA (dove c'e' la sequenza R identica a quella degradata
all' altra estremita', con la quale si appaia la porzione di DNA neosintetizzato complementare).
A questo punto l' enzima puo' continuare con la sintesi del filamento – del DNA. Quando questo
processo finisce, la molecola di RNA viene degradata: ne restano soltanto alcuni frammenti che
serviranno da innesco per la sintesi dell' altro filamento del DNA (filamento +). Partendo da
questi inneschi, viene sintetizzata la parte del filamento + che finisce con l' estremita' 3'. Ora,
sia il tRNA che gli inneschi vengono degradati (non c'e' piu' traccia di alcun RNA). Avviene a
questo punto il secondo salto (second jump) dove il filamento + viene trasportato sull 'altra
parte del filamento – e la sua sintesi viene finita dalla trascrittasi. Dopo di questo, viene
completata anche la sequenza del filamento – e cosi' termina la sintesi della molecola di DNA
duplex a partire da una singola molecola di RNA, processo noto come trascrizione inversa.
L' immagine di sotto fornisce una figura piu' chiara di quanto detto sopra. Bisogna notare che
questa mia descrizione della trascrizione inversa e' una rappresentazione semplificata del vero
processo. Bisogna anche notare che diversi libri rappresentano alcuni passaggi di questo
processo in modo diverso, e per questo non posso garantire che la mia sia la rappresentazione

37
Definiti 'a volte pazzeschi' da Licio Collavin
38
RNA transfer che verra' analizzato nel capitolo sulla Traduzione.

29
completamente giusta39. Ai fini dell' esame bastera' ricordare che il tRNA serve da primer e che
nel processo avvengono due salti, il first e il second jump (per fortuna mia e di chi legge).

39
In particolare, 'Il gene X' di Lewin (pag. 403-404) rappresenta alcuni passaggi in un modo notevolemente diverso,
che mi lascia un attimino perplesso.

30
3.5.3: REGOLAZIONE DELLA TRASPOSIZIONE
Il motivo fondamentale per il quale i trasposoni sono cosi’ numerosi all’ interno del nostro
genoma e’ il fatto che hanno reso possibile una coesistenza ‘pacifica’ e non dannosa con la
cellula. Immaginiamo solo quali danni potrebbero causare inserendosi all’ interno di un gene e
modificandone la struttura (e conseguentemente la funzione). Per ‘monitorare’ dunque l’
attivita’ di trasposizione, nella cellula deve esistere una modalita’ di regolazione che abbia sotto
controllo la frequenza di trasposizione. Ci sono piu’ varianti, ma noi vedremo in particolare
quella in cui i trasposoni regolano il numero delle proprie copie e in questo modo limitano l’
impatto deleterio sul genoma40.
La famiglia di trasposoni IS4, della quale fa parte
il trasposone Tn10, offre un ottimo esempio di
questo tipo di regolazione. Esso limita il proprio
numero di copie all’ interno della cellula usando
un RNA antisenso per controllare l’ espressione
del gene per la trasposasi. Come si vede dall’
immagine, il promotore che dirige la sintesi dell’
RNA verso l’ interno (Pin) e’ responsabile dell’
espressione del gene per la trasposasi mentre
quello che dirige la sintesi all’ esterno (Pout) e’
responsabile per l’ RNA antisenso. Le prime 36
basi di ciascun trascritto sono complementari
fra di loro, e per questo l’ RNA antisenso puo’
andare a legarsi con l’ mRNA, bloccando la sua
attivita’ e conseguentemente bloccando la
trasposizione. Se in una cellula ci sono molti
Tn10, la frequenza di trasposizione sara’ bassa
(dato che la vita media dell’ RNA antisenso e’ in
genere maggiore di quella dell’ mRNA che serve
a creare il trasposone). Se invece il numero di
Tn10 e’ basso, l’ appaiamento fra i due RNA
sara’ raro e di conseguenza si avra’ una frequenza di trasposizione piu’ alta perche’ l’ mRNA
verra’ tradotto in trasposasi.
A destra e’ rappresentato Tn10, formato da un
gene per la resistenza alla tetraciclina e da due
mini-trasposoni, IS10L e IS10R (quest’ ultimo
codifica per la trasposasi).

40
Un’ altra variante sarebbe il controllo della scielta del sito bersaglio, per trasferirsi in zone non codificanti.

31
Un altro modo per regolare la trasposizione e’ quello al
livello della cromatina: compattandola, e’ possibile
silenziare i trasposoni che si trovano in quella zona e
conseguentemente ridurre la frequenza di trasposizione.
Questo e’ il compito delle metiltransferasi che metilano le
citosine.
Ora, torniamo un attimino ai due tipi di retrotrasposoni a
poli-A che non sono dotati di LTR: SINE (short interspersed nuclear element) e LINE (long
interspearsed nuclear element) elements. La differenza e’ che quest’ ultimi sono
completamente autonomi nel processo di trasposizione mentre i SINE dipendono dai LINE per
poter farlo. I LINE dunque, oltre a promuovere la propria mobilita’ codificano per proteine che
serviranno per mobilitare gli elementi SINE. Sia gli uni che gli altri sono molto numerosi
all’interno del genoma.
Parlando dei LINE, poniamo
una domanda interessante:
come fanno a non trasporre gli
altri mRNA cellulari?
Ricordiamo che praticamente
ogni mRNA maturo ha una
sequenza poli-A al termine,
che lo rende un buon
substrato per la trasposizione. In effetti, il sequenziamento del genoma ha fornito delle chiare
evidenze della trasposizione degli RNA cellulari: per molti geni cellulari del genoma esistono
delle copie aggiuntive di sequenze estremamente simili, copie che sembrano aver perso il
promotore e gli introni, e spesso presentano delezioni all’ estremita’ 5’. Queste sequenze sono
note come pseudogeni processati e in genere non vengono espresse. Gli pseudogeni sono
spesso fiancheggiati nel DNA bersaglio da corte sequenze ripetute – struttura che corrisponde
esattamente a un mRNA trasposto da un LINE. Questo porta a credere che durante l’ evoluzione
gli mRNA prodotti da geni codificanti proteine siano stati influenzati dall’ attivita’ degli elementi
LINE per essere infine trasposti (che non era l’ obiettivo iniziale di questi mRNA). Ultimamente
pero’, le nuove ricerche stanno ipotizzando che anche i pseudogeni abbiano qualche funzione
(non ancora ben conosciuta) che contribuisca al funzionamento della cellula41.
Per vedere come la trasposizione sia rilevante anche per l’ uomo, citiamo l’ esempio della
ricombinazione V(D)J. Essa ha luogo nelle immunocellule dei vertebrati. In particolare, le cellule
B producono anticorpi che si muovono nel circolo sanguigno e riconoscono agenti estranei quali
i virus e i batteri. Questi anticorpi devono poter riconoscere la parete/capside dell’ organismo
patogeno. Sappiamo pero’ che di organismi patogeni ce ne sono un’ infinita’ di specie, che

41
Non smette mai di stupire, la natura: anche gli elementi formati ‘per caso’ vengono infine convertiti in fattori
funzionali (questo mi ricorda le ipotesi endosimbiontiche riguardanti i mitocondri). Sara’ l’ evoluzione?

32
significa che ci dovranno essere anche tantissime varianti di anticorpi capaci di riconoscere una
miriade di molecole diverse. Il meccanismo principale delle cellule per produrre un cosi’ vasto
numero di anticorpi si basa su una serie di reazioni di riarrangiamenti del DNA simili alla
trasposizione che si chiama ricombinazione V(D)J. La parte dell’ anticorpo (che e’ una proteina)
che interagisce con la molecola estranea si chiama sito di legame dell’ antigene. Questa
regione e’ costituita dai domini Vh e VL
(estremamente variabili) mentre il resto dell’
anticorpo e’ detto regione costante C. La regione del
genoma che codifica per la catena leggera (VL) ha
300 segmenti genici codificanti per diverse versioni
della sola VL.. In piu’ ci sono 4 segmenti codificanti
per la regione J (un’ altra regione dell’ anticorpo) ed
un solo segmento codificante la regione C. La
ricombinazione V(D)J puo’ unire il DNA tra
qualunque coppia di segmenti V e J. Il risultato e’
che quest’ unica regione genomica possa produrre
1200 VL diverse! Per Vh il tutto e’ ancor’ piu’
complesso dato che c’e’ un’ ulteriore segmento
genico detto segmento D. Con tutte le combinazioni
possibili arriviamo a 4800 varianti di Vh e tutto
sommato a 1200x4800 possibili anticorpi!!

Vediamo dunque che la ricombinazione V(D)J


sia fondamentale per la difesa immunitaria dei
vertebrati. Il meccanismo di questa
ricombinazione e’ estremamente simile a
quello della trasposizione taglia e incolla. Per
unire un segmento V con un segmento J
bisogna tagliare la porzione genomica che c’e
fra i due. Questo accade come rappresentato
nell’ immagine a sinistra. Adiacenti ai due
segmenti che veranno uniti sono le due
sequenze segnale per la ricombinazione che
vengono riconosciute dall’ enzima ricombinasi,
composto dalle subunita’ RAG1 e RAG2. RAG1
catalizza il taglio che lascia libere delle porzioni
3’-OH dei segmenti genici. A questo punto
33
avviene la stessa cosa come nella modalita’ Hermes di trasposizione taglia e incolla (pag. 26).
Infine le forcine vengono idrolizzate e unite, come anche le due sequenze segnale. La struttura
contenente le sequenze segnale viene eliminata dalla cellula mentre la struttura V+J va incontro
ad un’ ulteriore ricombinazione.

3.5.4: LA SCOPERTA DEI TRASPOSONI


La scoperta degli elementi trasponibili del genoma viene attribuita a Barbara Mcclintock che
vinse il premio Nobel nel 1983 per questa importante innovazione. Alla fine degli anni ’40, la
scienziata osservo’ la presenza degli ‘elementi di controllo’ del mais, ai quali e’ dovuto il colore
variegato della pannocchia. In particolare,
osservo’ 4 modalita’ diverse:

1) Gene C senza trasposoni: il fenotipo ha una pigmentazione viola


2) Gene C con elemento Ds (non autonomo): il fenotipo completamente senza
pigmentazione
3) Gene C con elemento Ds e in presenza di elemento Ac (autonomo): alcune cellule del
fenotipo presentano pigmentazione (quelle dove Ds e’ stato trasposto grazie ad Ac)
4) Gene C con elemento Ac: stesso risultato come nel punto 3.
Questi risultati portarono la Mcclintock a pensare correttamente che l’ attivita’ dell’
espressione genica sia spesso influenzata da degli elementi di controllo che noi oggi chiamiamo
trasposoni.
Con questo, chiudiamo il capitolo riguardante l’ organizzazione del genoma e cominciamo a
vedere come il genoma riesce ad autoreplicarsi, portando alla continuita’ delle specie.

34
CAPITOLO 4: REPLICAZIONE DEL DNA
4.1: LA SCOPERTA DEL MECCANISMO SEMICONSERVATIVO
La replicazione del DNA avviene quando la cellula va incontro alla divisione. Questo avviene in
modo semiconservativo – significa che i singoli filamenti della doppia elica parentale
rimangono conservati e ognuno viene distribuito in una delle due molecole figlie durante il
processo replicativo. Questo fatto venne dimostrato dall’ esperimento di Meselson-Stahl. I due
scienziati eseguirono questo esperimento sui batteri, con l’ uso di due isotopi radioattivi, 15N e
14N. I batteri che crescono in condizioni normali avranno il DNA con 14N , mentre il DNA dei

batteri che crescono in coltura in presenza dell’ isotopo 15N sara’ piu’ pesante. I filamenti con
isotopi diversi avranno dunque massa diversa e conseguentemente possono essere separati col
metodo di centrifugazione.
Il primo passo dell’ esperimento era far crescere una generazione di batteri in coltura con la
presenza di 15N. Questi avevano dunque la doppia elica pesante. Nel secondo passo la prima
generazione venne trasferita in condizioni normali dove c’era l’ isotopo 14N. Con la seguente
replicazione, si noto’ la presenza di molecole di DNA ibride, composte da un filamento con 14N
(neosintetizzato) e da uno con 15N (derivante dalla prima generazione). Nella prossima
generazione, da due molecole di DNA ibride si crearono due completamente leggere e due
ibride. Queste molecole vennero poi estratte e separate col metodo della centrifugazione, e
venne cosi’ provato che la replicazione del DNA sia un meccanismo semiconservativo.
La replicazione del DNA garantisce dunque la continuita’ genetica. Essa avviene una sola volta
per ciclo cellulare! I filamenti parentali che si separano servono da stampo per la sintesi dei
nuovi filamenti complementari, e si avra’ cosi’ la formazione di due molecole figlie identiche a
quella parentale. Si tratta pero’ di un processo complesso che presenta varie problematiche,
dalla sintesi del lagging strand all’ accorciamento dei telomeri, che vedremo in seguito.

4.2: LA CHIMICA DELLA SINTESI DI DNA


Prima di vedere in dettaglio il processo di replicazione, dobbiamo chiarire la natura chimica che
sta dietro al processo. Per la sintesi del filamento di DNA servono due substrati:
1) I 4 deossiribonucleotidi trifosfato: dGTP, dCTP, dATP, dTTP. Essi sono formati da 3
gruppi fosforici alfa, beta e gamma attaccati al 2’-deossiribosio tramite il legame 5’-
ossidrilico. Queste sono le molecole che verranno attaccate al filamento in sintesi, col
rilascio della molecola di pirofosfato (formata da due gruppi fosforici). D’ ora in poi
chiameremo queste molecole con la sigla dNTP.
2) Complesso chiamato giunzione innesco:stampo, formata da un filamento singolo di
DNA (ssDNA) e da un pezzo di doppio filamento di DNA (dsDNA). Questo complesso e’
formato dallo stampo che sarebbe il filamento ‘vecchio’ di DNA che dirige l’ aggiunta dei
dNTP complementari, e dall’ innesco (primer) che e’ l’ altro filamento del DNA, molto

35
piu’ corto, che serve come sito dove ha inizio l’ aggiunta di nuovi dNTP e che presenta,
alla sua estremita’, un 3’-OH libero.

La chimica della sintesi del nuovo filamento prevede la crescita allungando l’ innesco all’
estremita’ 3’: questo implica l’ aggiunta dei nuovi dNTP che avviene tramite una reazione Sn242:
l’ –OH dell’ estremita’ 3’ esegue un attacco nucleofilo al fosfato alfa del nuovo dNTP creando un
legame fosfodiesterico, con l’ uscita del gruppo contenente i fosfati beta e gamma. E’ il
filamento stampo quello a determinare quale dei 4 nucleotidi verra’ aggiunto (quello
complementare certamente).
L’ aggiunta dei nuovi nucleotidi a un filamento con n nucleotidi viene indicato cosi’:
XTP+ (XNP)n  (XNP)n+1 + P-P
Questa reazione ha pero’ ha ΔG>0 ed e’ dunque termodinamicamente sfavorevole. Quello che
la rende favorevole e’ l’ idrolisi del pirofosfato effettuata dalla pirofosfatasi che spezza il
legame fra i due gruppi fosfati il che comporta un contributo energetico notevole43. La reazione
finale e’
XTP+ (XNP)n  (XNP)n+1 + 2Pi
In totale abbiamo dunque la rottura di 2 legami fosfato, e ΔGtot<0.

42
Che avviene in uno stadio solo- l’ attacco nucleofilo e l’ uscita dell’ altro gruppo accadono contemporaneamente
- Chimica organica!
43
I legami fosfato sono altamente energetici.

36
Vediamo ora in dettaglio il meccanismo d’ azione della DNA polimerasi, enzima responsabile
della replicazione del DNA. Inanzitutto bisogna dire che di DNA polimerasi ce ne siano piu’ tipi,
ognuno con la sua specializzazione, e che si differenziano nei procarioti ed eucarioti.
Importante ricordare che la
polimerasi abbia un solo sito
attivo per tutti i quattro dNTP
diversi.
L’ enzima controlla la
capacita’ del dNTP di creare il
giusto appaiamento di Watson
e Crick con la base
complementare del filamento
stampo. Come si vede dall’
immagine, soltanto quando si
e’ creato il giusto
appaiamento, il 3’-OH dell’
innesco e il fosfato del
nucleotide da aggiungere si
trovano in una posizione
favorevole per reagire. Coppie di basi non corrette portano a un drastico abbassamento della
velocita’ di polimerizzazione dovuto a un sfavorevole allineamento dei substrati44.
La polimerasi e’ anche in grado
di discriminare fra
deossiribonucleotidi e
ribonucleotidi, come si vede
dall’ immagine a destra. Questo
e’ causato dal fatto che il sito di
legame sia troppo piccolo per i
ribonucleotidi e non sia
compatibile col 2’-OH, dato che
gli amminoacidi discriminatori
creano interazioni di van der
Waals con l’ anello dello
zucchero se questo e’ il
deossiribosio.45

44
Questo e' un ottimo esempio di selezione cinetica dove l' enzima usa uno dei possibili substrati per catalizzare la
reazione.
45
Sostituendo questi amminoacidi con altri aventi R piu’ piccoli, si ottiene una polimerasi molto meno specifica che
non discrimina fra i due tipi di nucleotidi.

37
La spiegazione del meccanismo di funzionamento della polimerasi risiede nella sua struttura,
che assomiglia a una mano afferrante la giunzione innesco:stampo. I tre domini della polimerasi
vengono detti police, dita e palmo. Il palmo e’ composto da un beta foglietto ed oltre a
contenere gli elementi del sito catalitico lega due cationi46 (di norma Mg2+ o Zn2+) che
chiamiamo gruppi prostetici (biochimica!!) che hanno una duplice funzione:
1) Un catione riduce l’ affinita’ del 3’-OH per il suo idrogeno, generando un 3’-O- che serve
per l’ attacco nucleofilo al fosfato alfa del dNTP che verra’ polimerizzato
2) L’ altro catione coordina le cariche negative dei fosfati beta e gamma e stabilizza cosi’ il
pirofosfato che andra’ a formarsi in seguito alla polimerizzazione
Il palmo ha anche il compito di controllare l’ appaiamento fra le basi dello stampo e del
filamento in sintesi. Attraverso il solco minore, il palmo crea numerosi legami idrogeno e altre
interazioni con le basi ma solo se queste sono appaiate correttamente – se invece l’
appaiamento e’ errato, questo diminuisce notevolmente la velocita’ di polimerizzazione e i
nucleotidi appaiati in modo sbagliato vengono eliminati (proofreading).
Anche le dita hanno una funzione importante: oltre a legare i nucleotidi che dovranno essere
polimerizzati, una volta creato l’ appaiamento Watson-Crick fra il nucleotide e il suo
complementare sullo stampo le dita si muovono per trattenere e racchiudere il nucleotide.

Questo e’ evidente dalla figura dove si vede come l’ elica delle dita si muova di 40 gradi per fare
in modo che il residuo di tirosina crei delle interazioni con la base mentre i residui carichi
interagiscono con i gruppi fosfati (che veranno ritagliati quando si formera’ il legame

46
I cationi sono tenuti in posizione mediante interazioni con i residui di due aspartati dell' enzima.

38
fosfodiesterico). Le dita stabilizzano
dunque il dNTP che verra’ inglobato
nel filamento in sintesi, ma hanno
anche un altro compito: entrano in
contatto anche con la regione dello
stampo piegando di circa 90 gradi il
legame fosfodiesterico fra la prima e
la seconda base dello stampo. Questa
curvatura fa si’ che solo la prima base
dello stampo che si trova dopo l’
innesco venga esposta al sito attivo
ed elimina qualsiasi possibilita’ di
confusione nella scelta del
nucleotide.
Il pollice invece non interviene direttamente nella catalisi bensi’ interagisce col DNA
neosintetizzato mediante interazioni elettrostatiche facendo in modo che l’ innesco si trovi
sempre nella posizione favorevole per il seguente attacco; stabilizza inoltre il complesso
polimerasi +substrato. Tutto questo rende piu’ processivo l’ enzima.
La catalisi mediate dalla polimerasi e un evento
estremamente rapido: circa 1000 nucleotidi
vengono aggiunti con ogni secondo. Questo e’
dovuto al fatto che la DNA polimerasi e’ un
enzima processivo, cioe’ un enzima che come
substrato ha un polimero. Il grado di processivita’
della DNA polimerasi viene definito come numero
di nucleotidi polimerizzati ogni volta che l’ enzima
si lega a una giunzione stampo:innesco. La
processivita’ varia nei diversi tipi di DNA
polimerasi. Una polimerasi non e’ processiva
quando le condizioni non sono favorevoli per la
sintesi dei filamenti. Come si vede dall’ immagine,
l’ evento chiave e’ il legame con la giunzione
stampo:innesco dopo di che viene sintetizzato un
enorme numero di nucleotidi. La processivita’ e’
aumentata notevolmente dal fatto che la
polimerasi interagisce col DNA, e lo fa in modo
non sequenza- specifico. Ricordiamo l’ interazione elettrostatica fra il pollice e i fosfati dell’
impalcatura, che e’ una driving force importante nel processo. Queste interazioni sono anche
importanti nel momento che viene aggiunto un dNTP e il DNA viene rilasciato parzialmente per
essere spostato di una base: i legami idrogeno che si formano fra l’ enzima e il DNA attraverso il
39
solco minore vengono rotti per permettere lo scorrimento e l’ unica cosa che tiene assieme l’
enzima e il DNA sono queste interazioni elettrostatiche.
Come se non bastasse, questo straordinario enzima ha un’ altra
funzione, quella esonucleasica: in parole povere quest’ attivita’
permette alla polimerasi di correggere un appaiamento sbagliato
effettuando un taglio al filamento del DNA47. Questo diminuisce
drasticamente la frequenza dell’ errore effettuato dalla
polimerasi, che avviene circa ogni 107 nucleotidi. Come si vede
dall’ immagine a destra questi errori possono accadere quando
viene inserita la forma tautomerica sbagliata della base.
Quest' appaiamento errato fa si' che le
coppie di nucleotidi vengano posizionati
per l' attivita' di catalisi. La nucleasi che
svolge quest' attivita' viene chiamata
esonucleasi correttore di bozze
(proofreading exonuclease): essa
demolisce il DNA a partire dall'
estremita' 3'. L' attivita' di questo
enzima viene attivata solamente
quando si arriva ad un appaiamento non
corretto. Dopo il lavoro della parte
esonucleasica, alla polimerasi viene
offerta l' opportunita di aggiungere di
nuovo un dNTP (sperando sia corretto stavolta, dai!). La
rimozione dei nucleotidi errati e' facilitata ulteriormente dalla
ridotta capacita' della polimerasi di aggiungere nuovi nucleotidi a
una coppia che non rispetti il principio di complementarieta'.
Tratti del DNA scorrettamente appaiati alterano la geometria del 3'-OH, determinando una
debole reazione del dNTP col palmo dell' enzima. Quest' alterazione riduce la velocita' di catalisi
e favorisce l' inserzione del nucleotide giusto al posto di quello sbagliato che verra' escisso,
aumentando la velocita' di correzione dell' errore. Il sito dell' esonucleasi ha dunque un' affinita'
molto alta per la parte dove c'e un appaiamento scorretto. Notiamo dall' immagine che tutto
questo avvenga senza che il DNA debba distaccarsi completamente dall' enzima- solamente la
parte che si trova in prossimita' dell' appaiamento scorretto viene destabilizzata rendendo
possibile il trasferimento del filamento dal sito di polimerizzazione a quelllo dell' esonucleasi. La
polimerasi e' , come vediamo, un ottimo esempio di enzima con un unico substrato ma dove i
diversi domini svolgono compiti diversi fondamentali per il corretto funzionamento enzimatico.

47
Le esonucleasi idrolizzano il DNA all’ estremita’, mentre le endonucleasi effettuano un taglio all’ interno del
filamento.

40
4.3: LA FORCA REPLICATIVA
Quello visto finora e’ una situazione artificiale dove avviene la sintesi di un unico filamento del
DNA guidata da un’ unica giunzione innesco:stampo. In realta’ le cose sono ben piu’ complesse
in quanto nella cellula entrambi i filamenti della doppia elica vengono replicati
contemporaneamente. Affinche’ cio’ avvenga, e’ necessaria la separazione dei due filamenti
della doppia elica in modo da ottenere due filamenti singoli che faranno da stampo. Il punto
che si trova fra i due filamenti separati e la doppia elica che non ha ancora subito il processo di
duplicazione e’ noto come forca replicativa. Questo e’ il punto dove vengono attivamente
sintetizzate le nuove catene di DNA. La forca si sposta in continuo verso il DNA non duplicato e
quindi non replicato, laciandosi indietro i due filamenti separati che veranno usati da stampo e
che veranno conseguentemente convertiti in molecole di DNA a doppia elica.
La natura antiparallela della doppia elica crea una notevole complicazione per la replicazione
simultanea dei due stampi alla forca replicativa: poiche’ la DNA polimerasi sintetizza il DNA
aggiungendo nucleotidi al terminale 3’, soltanto uno dei filamenti stampo puo’ essere replicato
seguendo in modo continuo l’ andamento della forca. Il DNA neosintetizzato su questo
filamento, sul quale la polimerasi semplicemente aggiunge nucleotidi seguendo la forca, viene
chiamato leading strand (filamento guida). La sintesi di DNA che ha come stampo l’ altro
filamento e’ piu’ complicata in quanto esso impone alla DNA polimerasi di muoversi in direzione
opposta rispetto all’ andamento della forca replicativa. Il DNA neosintetizzato su questo stampo
viene quindi detto lagging strand (filamento discontinuo). Mentre la polimerasi puo’
sintetizzare il leading strand non appena lo stampo e’ disponibile, la sintesi sul lagging strand
deve essere ritardata in modo tale che la forca possa creare una quantita’ sufficientemente
lunga di singolo filamento. Ogni qualvolta si crea uno stampo di lunghezza adeguata inizia la
sintesi di DNA, fino a raggiungere il terminale 5’ del precedente tratto di DNA guida gia’
sintetizzato. Questo crea dei frammenti di nuova sintesi che si chiamano frammenti di
Okazaki48. Vedremo questi frammenti piu’ in dettaglio fra un attimo, ma diciamo ora che
possono variare in lunghezza (1000-2000 nt procarioti, 100-400 nt eucarioti).

48
Il nome deriva dallo scienziato Reiji Okazaki che un po’ prima del 1970 dimostro’ l’ esistenza di questi frammenti.

41
4.3.1: L’ INIZIO DELLA REPLICAZIONE
Come gia’ descritto, la DNA polimerasi richiede un innesco che presenti un OH al 3’. Dato che
questo enzima non puo’ sintetizzare DNA de novo , interviene una speciale RNA polimerasi
chiamata primasi che permette la formazione di corti (5-10 nt) primer a RNA che vengono
prodotti utilizzando come stampo il DNA a singolo filamento. Questi primer vengono poi
allungati dalla DNA polimerasi che li usa per inizare la sintesi del filamento di DNA49. La
frequenza con la quale la primasi interviene sui due filamenti e’ molto diversa: sul leading
strand basta aggiungere un primer e la sintesi procede senza problemi mentre sul lagging
strand serve un primer a RNA per ogni frammento di Okazaki. La primasi non richiede sequenze
specifiche per sintetizzare l’ innesco (a differenza di mRNA, rRNA o tRNA) , ma preferisce
iniziare la sintesi avvaldendosi di un tratto di ssDNA contenente un particolare trimero (GTA in
Escherichia). Interessante notare che questo trimero sia piu’ frequente sul filamento che fara’
da stampo per il lagging strand (logicamente).
L’ attivita’ della primasi e’ significativamente aumentata quando si unisce a un altro enzima
attivo sulla forca replicativa noto col nome di elicasi. Questo enzima svolge la doppia elica a
livello di forca creando 2 stampi di ssDNA sui quali
lavorera’ la primasi50.
Certamente, i primer dovranno essere rimossi e
rimpiazzati da deossiribonucleotidi affinche’ la
replicazione del DNA sia completa: questo evento puo’
essere visto come azione di riparazione del DNA (capitolo
5). Per rimpiazzare il primer viene usato l’ enzima
denominato RNasi H, che riconoscie e rimuove maggior
parte di ciascun primer. Esso idrolizza l’ RNA appaiato con
catene di DNA (mediante appaiamento Watson-Crick) :
riesce a rimuovere tutto il primer eccetto il nucleotide
legato covalentmente al filamento di DNA (questo
perche’ l’ RNasi H riesce a idrolizzare solo legami presenti
fra due ribonucleotidi). Quest’ ultimo nucleotide viene
eliminato da una 5’-esonucleasi (che in seguito
chiameremo DNA polimerasi 1) che riesce a degradare
indifferentemente l’ RNA o il DNA a partire dal terminale
5’. Il gap che si e’ venuto a formare e’ un ottimo substrato
per la DNA polimerasi che a partire dalla giunzione
innesco:stampo sintetizza i mancanti nucleotidi basandosi

49
Sebbene la DNA polimerasi possa polimerizzare soltanto deossiribonucleotidi, e' comunque in grado di iniziare la
sintesi usando sia inneschi di RNA che di DNA.
50
Questo fa si che la primasi sia solo attiva sul tratto di DNA svolto da poco sulla forca replicativa.

42
sul filamento stampo. A questo punto rimane un’ ultima cosa fare dato che la polimerasi non
riesce a inserire l’ ultimo nucleotide e unire il terminale 3’-OH e quello 5’ fosfato sul filamento
riparato: questo compito viene svolto dall’ enzima ligasi che usa un cofattore ad alto contenuto
energetico (tipo ATP) per creare il legame fosfodiesterico. Solo quando tutti i primer vengono
eliminati e tutte le interruzioni vengono saldate, possiamo dire che la replicazione sia finita.

4.3.2: LO SVOLGIMENTO DELL’ ELICA E PROBLEMATICHE CORRELATE


Abbiamo gia’ detto che la DNA elicasi catalizza la separazione dei due filamenti del DNA,
vediamo ora come lo fa. Questo enzima si lega e si sposta lungo il singolo filamento di DNA
utilizzando l’ energia fornita dall idrolisi di nucleotidi trifosfato (ATP). Di norma questi enzimi
hanno una forma esamerica (6 substrati) ad anello. Come le polimerasi, anche le elicasi sono
enzimi processivi che restano associate al substrato separando numerose coppie di basi. Questa
processivita’ e’ data appunto dalla forma ad anello: il rilascio del DNA non e’ favorito dato che
implicherebbe l’ apertura dell’ anello.
L’ elicasi puo’ dunque dissociarsi quando
raggiunge l’ estremita’ del filamento. La
struttura dell’ enzima pone certe
problematiche che sono evidenti nell’
esempio del cromosoma circolare che non
presenta estremita’51. Per questo vi sono
dei meccanismi che aprono l’ anello e lo
posizionano intorno al filamento prima di
racchiuderlo, il che aumenta la
processivita’ dell’ enzima.
L’ elicasi ha una caratteristica detta
polarita’ della DNA elicasi: un’ elicasi che
lavora sul filamento discontinuo (ad
esempio quella dell’ immagine) avra’ una
polarita’ 5’3’ per dirigersi verso la parte
della forca non ancora denaturata.
La seguente domanda che si pone e’: come fa l’ elicasi a sfruttare l’ idrolisi dell’ ATP per
muoversi lungo il DNA? La risposta sta nella sua struttura (immagine a pagina 41). Nella figura a
vediamo chiaramente le 6 subunita’ e il poro centrale. Ogni subunita’ ha una struttura detta
ansa ‘a forcina’. L’ immagine b raffigura invece solo 2 delle 6 anse e il DNA che sta nel poro
centrale . In realta’ la struttura rafigurata nell’ immagine a e’ solo una rappresentazione

51
Dato che anche nei cromosomi lineari le elicasi sono posizionate quasi sempre nei siti interni, questa
problematica e' rilevante anche negli eucarioti.

43
istantanea in quanto l’ enzima e’ in continuo movimento (con modificazione della
conformazione) e ciascuna delle 6 subunita’ si trova in uno stadio diverso nel processo di
traslocazione sul DNA. Nell’ immagine b vediamo come la subunita’ (in viola) sfrutti l’ idrolisi di
ATP per cambiare conformazione e spostarsi lungo il filamento di DNA, legando sempre il
prossimo fosfato. Da notare che se non c’e’ nessun nucleotide, l’ ansa non si lega al DNA –
servira’ dunque che l’ ATP si leghi di nuovo per ripetere il processo. Ognuna delle 6 subunita’
passa attraverso il processo del’ immagine b: dapprima lega l’ ATP, poi l’ ADP ed infine rilascia il
nucleotide, con l’ eventuale attacco del nuovo ATP. In sintesi, possiamo immaginare che l’
elicasi abbia 6 mani che tirano una fune spostandosi di volta in volta52, eliminando i ponti
idrogeno fra le basi man mano che viaggiano lungo il filamento. Da notare anche che il poro
centrale sia abbastanza grande per ospitare l’ ssDNA (single stranded DNA) ma troppo piccolo
per far passare il dsDNA (double stranded DNA).
(https://www.youtube.com/watch?v=bePPQpoVUpM – video sull’ elicasi)
L’ ssDNA formatosi non e’ particolarmente stabile: per questo c’e’ una classe di proteine
denominate ssDNA-binding proteins (SSB) che si legano rapidamente al singolo filamento. La
presenza di una SSB facilita il legame di un’ altra SSB al pezzo di DNA adiacente – processo detto
legame cooperativo , che avviene grazie al fatto che le due SSB adiacenti interagiscano fra di
loro53.

52
Questo processo si sta studiando intensamente e non sono ancora ben chiari tutti i passaggi svolti dall' enzima.
53
Dalla biochimica e' noto che in questo processo la nucleazione (che di solito e' sfavorita) e' seguita da una
propagazione piu' o meno favorita.Con la nucleazione ΔS<0 ma con la conseguente propagazione nel fattore della

44
Questo legame cooperativo fa in modo che ,non appena l’ ssDNA emerge dalla forca, esso
venga rapidamente coperto dalle SSB54. Questo fa assumere al DNA una conformazione estesa
che facilita la replicazione. Il legame delle SSB col DNA e’ sequenza-indipendente e si basa su
interazioni elettrostatiche coi gruppi fosfato e sull’ impilamento con le basi.
Dal momento che i due filamenti vengono separati, a
valle della forca si formano dei superavvolgimenti
positivi. Questo accumulo di superavvolgimenti e’ il
risultato dell’ attivita’ elicasica che elimina i ponti
idrogeno fra le basi: il numero di legame (ossia il numero
di volte che un filamento s’ attorciglia attorno all’ altro
filamento) contenuto dal DNA deve essere lo stesso in un
numero di coppie di basi progressivamente minore – la
ragione e’ dunque puramente di carattere fisico. Questo
problema deve pero’ essere risolto, altrimenti si
rischierebbe di avere una tensione troppo elevata sul
DNA che si trova di fronte alla forca di replicazione. I
superavvolgimenti vengono dunque eliminati dalla gia’
citata topoisomerasi che agisce sul dsDNA a valle della
forca. Quest’ enzima taglia uno o entrambi i filamenti del
DNA (dipendentemente dal tipo di topoisomerasi) e
facendo passare lo stesso numero di filamenti attraverso
la rottura, come si puo’ vedere dall’ immagine a sinistra.
Quest’ attivita’ permette poi il corretto lavoro degli
enzimi a livello della forca replicativa.
Finora abbiamo affrontato i diversi enzimi che funzionano
a livello di forca replicativa, potendo dedurre un fatto fondamentale: tutti questi sono in
funzione della polimerasi, cioe’ agiscono per permettere alla polimerasi di sintetizzare bene i
nuovi filamenti di DNA. Vediamoli nella tabella:

ligasi Lega il filamento di DNA


RNasi H Elimina gran parte dell’ innesco
SSB (single stranded DNA binding proteins) Legano e stabilizzano l’ ssDNA
elicasi Svolge la doppia elica
primasi Sintetizza l’ innesco

variazione di energia libera di Gibbs entrano in gioco anche le interazioni fra le SSB che rendono favorevole la
reazione contrastando la diminuzione di entropia.
54
Il legame cooperativo e' una caratteristica di molte proteine che legano il DNA, proprio per il fatto che si tratti di
una molecola lunga che deve di solito interagire con tanti individui di una singola specie proteica.

45
A questo punto dobbiamo specificare anche che di DNA polimerasi ce ne siano piu’ tipi che
svolgono funzioni diverse. Nei procarioti, la DNA polimerasi III e’ quella principalmente
coinvolta nella sintesi di nuovi nucleotidi. La DNA Pol III e’ di solito inglobata in un complesso
che la rende molto piu’ processiva e che si chiama DNA Pol III oloenzima. L’ attivita 5’-
esonucleasica menzionata prima che elimina l’ ultimo nucleotide dell’ innesco viene invece
svolta dalla DNA polimerasi I , che in seguito sintetizza la porzione di DNA che va a sostituire il
buco che si e’ formato dall’ eliminazione del primer. Per questo motivo, a differenza della DNA
Pol III, la DNA Pol I non e’ processiva in quanto deve sintetizzare solamente da 20 a 100
nucleotidi (cioe’ corte regioni). Ambedue le polimerasi menzionate hanno pero’ un’ attivita’
nucleasica in quanto devono essere precise nell’ aggiunta di nuovi nucleotidi. La DNA
polimerasi II serve invece per riparare il DNA (si vedra’ nel capitolo 5). Negli eucarioti, dove ci
sono circa 15 tipi di polimerasi, 3 sono quelle essenziali per la replicazione, che sono DNA Pol
δ, DNA Pol α e DNA Pol ε. In seguito ci sono due tabelle, la prima che mostra i principali tipi di
polimerasi procariotiche e la seconda che rappresenta le principali polimerasi eucariotiche:

Pol I Rimozione dell’ innesco


Pol II Riparazione del DNA
Pol III core Replicazione, 3 subunita’
Pol III oloenzima Replicazione, 9 subunita’

Pol α Sintesi dell’ innesco (ruolo primasico)


Pol β Riparazione delle basi eliminate
Pol δ Sintesi del DNA sul filamento discontinuo
Pol ε Sintesi del DNA sul filamento guida

Vediamo dunque che le diverse polimerasi hanno anche un diverso numero di subunita'.
Questo e' dovuto principalmente al fatto che svolgano funzioni diverse che richiedono un
contesto chimico diverso.

4.3.3: LE SLIDING CLAMP AUMENTANO LA PROCESSIVITA’ DELLA


POLIMERASI
Abbiamo gia’ detto che la DNA polimerasi sia un enzima altamente processivo a livello di forca
replicativa : una volta che inzia di lavorare sullo stampo, polimerizza da migliaia a milioni di
nucleotidi senza staccarsi dal DNA. E’ stato pero’ dimostrato che questa processivita’ sia dovuta
a specifiche proteine che durante la replicazione si legano alla polimerasi, senza le quali questa
puo’ sintetizzare solo da 20 a 100 nucleotidi a volta. Un tipo di queste proteine viene chiamato
DNA sliding clamp : si tratta di specie proteiche a piu’ subunita’ uguali fra loro che nel loro
complesso determinano una struttura a ciambella, come notiamo dall’ immagine:

46
La struttura riesce a far passare al suo interno l’ intera molecola di DNA ; inoltre, nello strato
che c’e’ fra il DNA e i bordi della sliding clamp vanno a posizionarsi uno o due strati di molecole
d’ acqua che stabilizzano ulteriormente la struttura e permettono alla proteina di scivolare
lungo il DNA senza mai distaccarsi da esso. Come vediamo dall’ immagine b, a livello di forca
replicativa la sliding clamp e’ saldamente associata alla polimerasi – questo complesso si muove
molto efficientemente lungo il DNA55. Cosa fa essenzialmente la sliding clamp? Molto
banalmente, essa impedisce che la polimerasi si stacchi dal DNA obbligandola a continuare con
la polimerizzazione – in altre parola obbliga l’ enzima a legare ancora la giunzione
stampo:innesco. Durante la polimerizzazione dunque l’ affinita’ della polimerasi per la sliding
clamp e’ molto elevata. Quando la polimerasi finisce il suo lavoro (ad esempio viene alla fine di
un frammento di Okazaki), quest’ affinita’ deve diminuire: questo succede grazie al fatto che la
polimerasi si trovi ora in presenza del dsDNA, il che’ fa diminuire la sua affinita’ sia per il DNA
che per la sliding clamp. In questo modo la polimerasi si distacca dai due mentre la sliding
clamp resta ancora sulla molecola di DNA.

55
Anche se e' logico, meglio scriverlo comunque: la sliding clamp si associano solo al tipo di polimerasi che
polimerizza numerosi nucleotidi (III nei procarioti e δ e ε negli eucarioti). La primasi ad esempio non ha bisogno
dell' assistenza della sliding clamp in quanto non deve essere processiva.
55
La sliding clamp puo' poi svolgere altre importanti funzioni sul DNA.

47
Le DNA sliding clamp sono proteine molto conservate nell’ evoluzione. Anche se sono un attimo
diverse da specie a specie, la loro funzione e’ conservata anche grazie al fatto che siano formate
da subunita’ identiche fra di loro. Ecco qui l’ immagine di due sliding clamp diverse: la prima e’
dell’ E. Coli mentre la seconda del lievito:

Similmente come avviene per l’ elicasi, anche la sliding clamp deve essere aperta una volta che
si piazza attorno al DNA. L’ apertura dell’ anello e il posizionamento della proteina sul DNA sono
catalizzati da un complesso proteico chiamato caricatore delle sliding clamp (sliding clamp
loader detto anche fattore C negli eucarioti) che per farlo usa l’ idrolisi dell’ ATP. Questo
complesso rimuove inoltre le sliding clamp quando il loro compito e’ finito e se non sono legate
dunque a nessun’ altra proteina56. La polimerasi e il caricatore non possono interagire allo
stesso tempo con la sliding clamp per il semplice motivo che riconoscono lo stesso sito di
legame su di essa – se e’ dunque legata alla polimerasi non puo’ essere rimossa dal DNA. Ma
come funziona esattamente il caricatore delle sliding clamp? Segue il meccanismo a 5 passi che
lo spiega molto semplicemente:
a) Abbiamo il caricatore che e’ un complesso formato da 5 subunita’.
b) Per catalizzare l’ apertura della clamp, il caricatore ha bisogno di una molecola di ATP.
c) Caricatore+ATP+sliding clamp  apertura dell’ anello con eliminazione di interazioni
deboli fra due subunita’.
d) Il complesso si lega al DNA – il caricatore si lega preferenzialmente alla giunzione
innesco:stampo. Il foro della clamp contiene ora il DNA e il legame del complesso con il
DNA favorisce l’ idrolisi di ATP.
e) Il caricatore si stacca dalla clamp data la presenza di ADP invece che di ATP. La clamp
viene chiusa e resta sul DNA.

56
Notiamo che viene modificata solo la struttura della sliding clamp e non la sua composizione chimica.

48
4.4: SINTESI DI DNA A LIVELLO DELLA FORCA REPLICATIVA
Abbiamo finora descritto le caratteristiche della forca di replicazione e le strutture presenti.
Vediamo ora come funziona tutto cio’ in movimento (che e’ un attimino piu’ pesante). Nella
sezione 4.3 abbiamo introdotto i frammenti di Okazaki, che si creano dato il fatto che la
polimerasi possa sintetizzare solo in direzione dello stampo 3’5’. Una domanda lecita da porsi
e’: ma perche’ tutta sta complicazione se in teoria la polimerasi potrebbe sintetizzare prima un
intero filamento e poi l’ altro? Abbiamo capito pero’ che la natura non crei nulla a caso – se si
facesse cosi’ si avrebbero tratti di ssDNA molto lunghi, e l’ ssDNA e’ una struttura
particolarmente instabile. La politica della cellula e’ dunque quella di minimalizzare la
lunghezza dei tratti di ssDNA in modo da non procurare gravissimi danni al DNA57. Per questo,
le polimerasi operano a livello di forca replicativa su ambedue i filamenti in modo da non creare
lunghe regioni di DNA a sinoglo filamento. L’ azione coordinata di queste polimerasi e’ facilitata
dalla presenza da un complesso multiproteico chiamato DNA Pol III oloenzima58. Quest’
oloenzima include 3 copie di DNA Pol III ‘core’ e una copia di caricatore della sliding clamp
formato da 5 subunita’ che contiene 3 copie della proteina τ ognuna delle quali lega un’ unita’
del core della DNA Pol III (detto cosi’ sembra complicato):
La flessibilita’ della molecola di DNA e
delle proteine τ fa in modo che
molteplici DNA polimerasi possano
rimanere associate all’ altezza della
forca replicativa mentre la sintesi di DNA
avviene contemporaneamente su
ambedue i stampi.
Non appena l’ elicasi apre la doppia elica
in corrispondenza della forca, lo stampo
guida dell’ elica diventa l’ oggetto dell’
attivita’ di uno dei core della DNA
polimerasi III che sintetizza un filamento
continuo su questo stampo. Viceversa, il filamento discontinuo non viene subito esposto alla
polimerasi bensi’ viene svolto come ssDNA che e’ velocemente legato alle SSB (a). A momenti
alterni la primasi agisce con la DNA elicasi (si vedra’ dopo la loro interazione) per sintetizzare un
primer a RNA: questa giunzione innesco:stampo viene subito riconosciuta dal caricatore della
sliding clamp che assembla sul sito una sliding clamp–si associa a una DNA polimerasi III (b e c).

57
Infatti, la rottura di una regione di ssDNA crea una divisione in due parti del cromosoma – evento molto difficile
da risolvere. Inoltre, la riparazione di questo tipo di lesioni porta spesso a mutazioni nella sequenza di DNA, come
si vedra' nel capitolo 5.
58
Il termine 'oloenzima' sta a indicare un complesso in cui la proteina catalitica e' associata a ulteriori subunita' che
ne aumentano l' efficienza.

49
50
Non appena una polimerasi termina con la sintesi di un frammento di Okazaki, l’ elicasi rende
disponibile nuovo ssDNA e un nuovo primer e’ sintetizzato su questo stampo - non appena
questo accade, il caricatore posiziona la sliding clamp sul primer. La terza copia di DNA
polimerasi inizia la sintesi del nuovo frammento di Okazaki prima del completamento della
sintesi del frammento di Okazaki precedente – in altre parole, si pensa che la sintesi del nuovo
frammento di Okazaki inizi prima che il frammento precedente sia completato59 (d). Dopo
che la polimerasi finisce con la sintesi del frammento di Okazaki, essa viene rilasciata dalla
sliding clamp che resta ancora sul DNA. Il processo di distacco della polimerasi dalla sliding
clamp e’ abbastanza lento, per questo l’ attivita’ della seconda polimerasi sul filamento
discontinuo garantisce la continuita’ della sintesi di DNA (e). La polimerasi appena distaccata
rimane pero’ ancorata all’ elicasi mediante la subunita’ τ del caricatore della sliding clamp. In
questo modo potra’ essere usata per la sintesi del seguente frammento di Okazaki.
In poche parole, mentre il filamento guida e’ sintetizzato da una sola polimerasi III, il filamento
discontinuo necessita di due polimerasi III. Mentre una di queste due sta terminando un
frammento di Okazaki, l’ altra inizia la sintesi del seguente filamento. Ognuna delle tre
polimerasi e’ associata a una sliding clamp che viene posizionata dal caricatore delle sliding
clamp. Le 3 subunita’ τ del caricatore sono associate alla DNA elicasi e ognuna delle tre e’
associata a una polimerasi III.
Per schematizzare il processo, ho deciso di dividerlo in alcuni passi:
1) L’ elicasi apre la doppia elica
2) La DNA Pol III e’ pronta per la sintesi del filamento guida
3) L’ elicasi produce una regione di ssDNA che fara’ da stampo per il filamento discontinuo
mentre il filamento continuo e’ sintetizzato sempre da un’ unica Pol III
4) Quando la regione di ssDNA e’ abbastanza lunga, la primasi crea un innesco a RNA
5) Sul primer viene caricata una sliding clamp dal complesso gamma
6) La polimerasi III si associa alla sliding clamp.
7) Mentre si ha l’ inizio della sintesi del frammento di Okazaki da parte di questa
polimerasi, il frammento precedente e’ stato completato – distacco della polimerasi
dalla sliding clamp.
8) L’ elicasi continua ad aprire l’ elica creando di nuovo una regione abbastanza lunga di
ssDNA. Riparte ora il punto 4.
9) Ricordiamo che durante tutto questo tempo il filamento guida sia sintetizzato
continuamente. Notare anche che tutte e tre le polimerasi non si distacchino mai dalle
rispettive subunita’ τ.

59
Questo vuol dire che sul filamento discontinuo lavorano 2 DNA Pol III, il che aumenta l' efficienza della sintesi.
Questo e' una nuova scoperta-pensiamo solo che nell' edizione precedente del Watson il DNA Pol oloenzima era
rappresentato con solo due polimerasi III core.

51
4.4.1: IL REPLISOMA
Il replisoma e’ l’ insieme di tutte le proteine che operano all’ interno della forca replicativa.
Abbiamo gia visto come a livello della forca ci siano interazioni importanti fra gli elementi dell’
oloenzima della DNA Pol III. Vediamo ora altre due importanti interazioni:
1) DNA elicasi + DNA Pol III oloenzima: si tratta di un complesso stabile che s’ instaura fra
le subunita’ τ e l’ elicasi. Questo complesso aumenta la velocita’ dell’ elicasi di dieci
volte. Di conseguenza, l’ elicasi rallenta notevolmente la sua attivita’ quando s’ allontana
dall’ oloenzima. Questo sistema fa in modo che l’ elicasi non possa sfuggire troppo dall’
oloenzima e funziona per coordinare le loro attivita’.

2) DNA elicasi + primasi: circa una volta per secondo, la primasi si associa all’ elicasi e alle
SSB che rivestono l’ ssDNA e sintetizza il primer per il frammento di Okazaki. L’
interazione fra l’ elicasi e la primasi e’ relativamente debole il che e’ importante dato
che permette di regolare la lunghezza dei frammenti di Okazaki. Una piu’ elevata forza
di associazione causerebbe una sintesi piu’ frequente degli inneschi e
conseguentemente frammenti piu’ corti. Se invece fosse troppo debole, si avrebbero
frammenti molto lunghi dato che l’ associazione fra l’ elicasi e la primasi sarebbe rara.

Il replisoma e’, come abbiamo visto, un meccanismo incredibilmente affascinante ed efficace.


Le interazioni fra i suoi elementi influiscono sulle loro funzioni e regolano l’ attivita’ delle
singole proteine.
Ora che abbiamo visto come funziona la replicazione a livello della forca, vediamo come e dove
inizia il processo di replicazione.

52
4.5: L’ INIZIO DELLA REPLICAZIONE
La fase iniziale della replicazione prevede la separazione dei due filamenti di DNA in modo da
formare un substrato adatto per l’ attivita’ dell’ elicasi. Questo accade il piu’ delle volte nei siti
interni al DNA e non alle estremita’ dei cromosomi e spesso succede in piu’ regioni
contemporaneamente. I siti dove avviene l’ apertura del DNA vengono detti origini di
replicazione. A seconda di organismo possono essercene da uno a migliaia.
Nel 1963 venne proposto il modello per il controllo dell’ inizio di replicazione60. Si defini’
replicone tutto il DNA sintetizzato a partire da un’ unica origine. Se ci sono x origini di
replicazione, ci saranno x repliconi. Il modello di replicone ha al suo interno due importanti
fattori. Il primo e’ il replicatore che viene definito come le sequenze nucleotidiche agenti in cis
sufficienti per dirigere l’ inizio della replicazione. L’ origine di replicazione fa parte del
replicatore ma e’ spesso (specialmente negli eucarioti) solo una parte dell’ ultimo. Il secondo
componente nel modello del replicatore e’ l’ iniziatore – una proteina che riconosce in modo
sequenza specifico una zona del replicatore e che attiva l’ inizio della replicazione. L’ iniziatore
determina dunque quale sito diventera’ l’ origine della replicazione, ed e’ sempre una proteina
legante l’ ATP.

Nell’ immagine di sopra si vedono 3 modelli diversi di replicatore. In oguno abbiamo pero’ gli
elementi verdi che sono i siti di legame per l’ iniziatore, quelli blu che sono zone che facilitano l’
apertura della doppia elica (facilmente denaturabili, ricchi di sequenze AT – hanno solo 2 ponti
idrogeno) ed infine l’ elemento rosso che e’ il sito d’ inizio della sintesi. In E. Coli il replicatore
prende il nome di oriC che e’ , come vediamo, formato da 5 siti di legame per l’ iniziatore (che
nel caso di E.coli e’ la proteina DnaA) e da 3 sequenze ripetute che facilitano l’ apertura.
Negli eucarioti non sono stati ancora ben studiati i replicatori. Studi recenti suggeriscono che
una densita’ ridotta di nucleosomi ed un’ alta frequenza di trascrizione possano essere segnali
di vicinanza dei replicatori.

60
Dagli scienziati Jacob, Brenner e Cuzin.

53
Le proteine iniziatore svolgono almeno due
funzioni: in primis legano in maniera specifica i siti
del replicatore. In piu’, una volta legate, reclutano
altri fattori fondamentali per l’ inizio della
replicazione quali le DNA elicasi.
In piu’ possono svolgere una terza funzione –
piegando la regione di DNA adiacente al sito di
legame facilitano la denaturazione della doppia
elica.
Nell’ esempio di E.coli la proteina DnaA lega i siti di
OriC61 di 9 bp. Quando lega l’ ATP, interagisce
anche con la regione contenente siti di 13 bp
denaturando una sequenza di circa 20 bp. La
proteina mantiene inoltre il DNA a singolo
filamento impedendo la formazione di piu’ di 3
appaiamenti consecutivi e rendendo cosi’ il DNA
pronto per la replicazione.
Spieghiamo ora il processo di inizio della
replicazione che porta alla formazione del
replisoma descritto in precedenza. Nella figura
a vediamo come vengono assemblate alle
sequenze ripetute di 9bp presenti nell’ oriC
diverse copie della proteina DnaA∙ATP. Questo
porta alla separazione dei due filamenti nella
regione delle sequenze di 13bp. Vediamo
come la DnaA∙ATP leghi l’ ssDNA in modo che
questo non crei appaiamenti fra basi. Un
complesso formato dall’ elicasi (DnaB) e dalla
proteina di caricamento dell’ elicasi (DnaC) si
associa all’ origine legato al DnaA (c)62. Il
caricatore a questo punto catalizza l’ apertura
dell’ elicasi e l’ avvolgimento attorno al singolo
filamento di DNA (d). Questo processo non e’
ancora interamente chiaro. Ciascuna elicasi
recluta una primasi che sintetizza un primer su
ciascun filamento stampo. Questo primer

61
Negli eucarioti abbiamo invece il complesso esamerico ORC (origin recognition complex).
62
Un dominio del caricatore che riconosce il singolo filamento e un altro dominio dell' elicasi che interagisce con
DnaA mediano questa interazione.

54
provoca il distacco dell’ elicasi dal caricatore permettendo l’ attivazione dell’ elicasi. Come si
vede dala figura e, il movimento di ciascuna delle elicasi rimuove tutte le rimanenti molecole di
DnaA presenti sul DNA.
A questo punto gli inneschi neosintetizzati e le
elicasi sono riconosciuti dalle proteine caricatori
delle sliding clamp che fanno parte del
precedentemente descritto DNA Pol III
oloenzima. Le sliding clamp vengono assemblate
su ciascun primer e puo’ iniziare la sintesi del
DNA su ciascun filamento guida ad opera di uno
dei tre enzimi polimerasi presenti sull’ oloenzima
(f). Dopo che l’ elicasi si e’ spostata di circa 1000
basi, su ogni stampo del filamento discontinuo
viene caricato dalla primasi un altro innesco al
quale viene associata un’ altra sliding clamp. La
giunzione innesco:stampo viene riconosciuta
dall’ altra polimerasi dell’ oloenzima e comincia
la sintesi del primo frammento di Okazaki (g).
Infine nella figura h vediamo quello che e’ gia’
noto- e’ iniziato il lavoro anche della terza
polimerasi che sintetizza ora il secondo
frammento di Okazaki : la replicazione ha
inizio63.

4.6: REPLICAZIONE NEL CONTESTO DEL CICLO CELLULARE


La replicazione dei cromosomi eucariotici avviene nella fase S del ciclo cellulare, solo una volta
per ciclo! Questo significa che ogni coppia di basi debba essere coppiata una e una sola volta
per ciclo – gravi problemi nascono sia da un’ incompleta replicazione che da una replicazione
ripetuta. Se ci sono parti del cromosoma non replicate, queste determinano dei legami
inappropriati fra i cromosomi figli – una volta che questi vanno incontro a segregazione si
hanno perdite irreversibili. D’ altro canto, se si ha una replicazione ripetuta, la cellula cerca di
rimediare a questo problema ma durante il processo essa puo’ moltiplicare dei geni che
svolgono funzioni regolatorie importanti, il che puo’ portare a conseguenze devastanti.
Ricordiamo che i cromosomi eucariotici abbiano origini di replicazione multiple, il che’ puo’
presentare un problema data la necessita’ di replicare tutto il DNA. La cellula deve assicurare
che siano attivate abbastanza origini nel modo da replicare l’ intero cromosoma, ma allo stesso
tempo si deve assicurare che le origini gia’ replicate siano inattivate fino al prossimo ciclo!!!

63
Si nota dalle immagini che la replicazione del DNA sia un meccanismo bidirezionale!

55
Bisogna notare che non tutte le origini
debbano essere attivate per replicare l’ intero
cromosoma, ma tutte devono essere
inattivate dopo la loro replicazione
(indipendentemente se sono state replicate a
partire da se stesse o da un’ origine
adiacente). Dall’ immagine vediamo come
certe origini possano essere replicate
passivamente.
Gli eventi dell’ inizio di replicazione negli
eucarioti avvengono in due fasi distinte del
ciclo cellulare: nella fase G1 succede il
caricamento delle elicasi su tutti i replicatori,
mentre la loro attivazione e l’ assemblaggio
del replisoma avvengono nella fase S che
segue la fase G1
Notiamo che la cosa sia differente nei procarioti: non appena le elicasi vengono caricate
avviene la separazione dei due filamenti di DNA. Mentre gli eucarioti usano la ‘pausa’
temporale fra le due fasi per garantire che ogni cromosoma venga replicato una sola volta per
ciclo, le cellule procariotiche usano un sistema differente (che esula dal programma).
Il primo stadio di caricamento dell’ elicasi consiste nel riconoscimento del replicatore da parte
dell’ iniziatore eucariotico ORC legato all’ ATP. Nella fase G1, ORC, legato all’ origine, recluta 2
caricatori dell’ elicasi – Cdc664 e Cdt1 e 2 copie dell’ elicasi Mcm2-7. Il legame con l’ ATP sia di
ORC che di Cdc6 permette il legame fra ORC e DNA e la conseguente stabilizzazione del
caricamento dell’ elicasi. Cdc6 effettua l’idrolisi di ATP provocando il caricamento del dimero
appartenente a Mcm2-7 in modo che il dsDNA sia circondato dalle proteine a livello di origine di
replicazione. A questo punto Cdt1 e Cdc6 sono rilasciati dall’ origine. L’ idrolisi di ATP effettuata
da ORC azzera il processo e permette uno nuovo a patto di legare una nuova molecola di ATP.
La fase 2 consiste nell’ attivazione dell’ attivita’ elicasica. Le elicasi caricate sono attivate da CDK
e DDK, che sono due proteina chinasi65 attivate una volta la cellula entra in fase S. DDK fosforila
l’ elicasi mentre la CDK fosforila altre due proteine, Sld2 e Sld3. Questa fosforilazione causa il
legame fra l’ elicasi Mcm2-7 e le proteine GINS e Cdc45. Si costituisce il complesso Cdc45-
Mcm2-7-GINS (CMG) che stimola l’ attivita’ ATP-asica ed elicasica della Mcm2-7. Questo
complesso non e’ altro che la forma attiva dell’ elicasi. In seguito, l’ interazione fra le due teste
del dimero Mcm2-7 deve scomparire e un filamento di DNA deve essere espulso da ogni

64
Sia ORC che Cdc6 appartengono alla famiglia delle proteine AAA+ cosi' come la DnaC e le subunita' dei caricatori
delle sliding clamp.
65
Queste proteine svolgono un attacco covalente di un gruppo fosfato sui residui di Treonina, Tirosina e Serina.

56
esamero formatosi dal dimero Mcm2-7. Questo implica l’ aggiunta di un’ ulteriore coppia
Cdc45-GINS dato che ora abbiamo due elicasi distinte. Vediamo dall’ immagine a destra come ci
sia anche un ordine ben distinto di reclutamento delle tre DNA polimerasi. Infine vediamo che il
replisoma sia costituito dal complesso CMG e dalle tre polimerasi, ma non dalle altre proteine
menzionate sopra implicate nell’ assemblaggio dell’ elicasi.

Fase 2: inizio dell’ attivita’ elicasica


Fase 1: caricamento dell' elicasi

Le due fasi descritte si alternano nel modo tale da permette un solo ciclo di replicazione
durante ciascun ciclo cellulare. La fase 1 e’ possibile che accada solo nella G1 mentre la fase 2
puo’ avvenire in G2, S o M sebbene si e’ verificato che avvenga sempre nella fase S (stiamo
parlando della cellula eucariotica). Il caricamento e l’ attivazione delle elicasi non possono
avvenire contemporaneamente : descriviamo ora il perche’. Dipende tutto dalla concentrazione
di CDK nel nucleo: se le concentrazioni sono alte, si avra’ l’ attivazione dell’ elicasi seza caricare
nuove elicasi. Al contrario, con bassi livelli di CDK si avra’ il caricamento dell’ elicasi con
nessuna attivazione della stessa. Questo gioco di concentrazioni viene usato nel ciclo cellulare,
dove nella fase G1 di caricamento si avranno bassi livelli di CDK mentre nelle tre fasi rimanenti si
avra’ un’ alta concentrazione della proteina. Quando i cromosomi sono segregati, dunque alla

57
fine del ciclo cellulare, la CDK e’ soppressa e si puo’ ricominciare col ciclo. Ricordiamo che alti
livelli di CDK inibiscano la funzionalita’ di ORC, Cdc6 e Cdt1.

4.7: FINE DELLA REPLICAZIONE


Anche la fine della replicazione implica una specifica serie di eventi, diversi per cromosomi
circolari e lineari. Nel cromosoma lineare, infatti, si pone il problema di replicare le estremita’
della molecola. Il macchinario descritto in precedenza non e’ in grado di farlo, per questo
vedremo i meccanismi necessri per risolvere questo problema.
Dopo la replicazione di un cromosoma circolare, le risultanti due molecole figlie rimangono
legate assieme come due anelli di una catena. Per segregare correttamente questi cromosomi
nelle due cellule figlie bisogna separare le due catene, che e’ il compito della (a noi gia’ nota)
topoisomerasi II. Questo enzima ritaglia la doppia catena di una molecola facendo passare l’
altra attraverso quest’ apertura (pag. 8). La topoisomerasi II lavora anche a livello di cromosomi
lineari che essendo ripiegati in anse vanno incontro a problemi simili come i cromosomi
circolari.
I cromosomi lineari presentano pero’ un
altro problema molto rilevante: la
necessita’ di avere un primer per iniziare
la sintesi del DNA crea un dilemma per la
replicazione delle parti terminali dei
cromosomi – questo viene chiamato
banalmente problema della replicazione
delle estremita’. Questo problema si
presenta solo sul filamento discontinuo:
data la necessita’ di avere primer multipli,
e’ impossibile ottenere una molecola di
DNA neosintetizzata che raggiunga l’
estremita’ del suo stampo. Una volta che
viene eliminato il primer dell’ ultimo
frammento di Okazaki, resta una piccola
porzione di ssDNA (delle dimensioni del
primer) non replicato all’ estremita’.
Anche se questo accorciamento avenisse
soltanto su uno dei due filamenti delle
molecole figlie, dopo il successivo ciclo di
replicazione entrambi i filamenti delle
molecole figlie sarebbero accorciati. Si
avrebbe dunque a causa di questo
fenomeno una perdita di materiale

58
genetico dopo ogni ciclo di replicazione. Alcuni organismi, per risolvere questo problema usano
per l’ ultimo frammento di Okazaki una proteina invece di un primer. Questa proteina rende
disponibile l’ -OH di un suo amminoacido perche’ la polimerasi possa sintetizzare questo ultimo
frammento. Grazie a questa proteina non si hanno dunque perdite del materiale genetico
perche’ non si ha un primer nell’ ultimo frammento.
La maggioranza degli organismi pero’ usa un metodo completamente diverso. Abbiamo gia’
definito i telomeri come le estremita’ dei cromosomi contenenti sequenze ripetute ricche di TG.
Queste sequenze sono poste testa-coda una rispetto all’ altra. L’ estremita’ 3’ di ciascun
cromosoma si estende oltre l’ estremita’ 5’, generando un tratto di DNA a singolo filamento –
questa struttura si comporta come fosse un’ origine di replicazione pero’ invece delle solite
proteine recluta una DNA polimerasi specifica detta telomerasi.
Si tratta di un straordinario enzima che oltre alle
subunita’ proteiche contiene anche una parte di
RNA – ricordiamo i complessi ribonucleoproteici
descritti nel capitolo 2. La polimerasi allunga l’
estremita’ 3’ del suo substrato cioe’ del ssDNA alle
estremita’ dei cromosomi. Ma lo fa in una
maniera peculiare: per polimerizzare non usa lo
stampo classico bensi’ la propria parte di RNA
(detta RNA telomerasi). Si tratta dunque di un’
attivita’ di trascrizione inversa (capitolo 3): l’
enzima ha una subunita’ che fa da trascrittasi
inversa, detta subunita’ TERT. Nell’ immagine
vediamo il meccanismo di funzionamento della
telomerasi: una parte dell’ RNA telomerasi non si
appaia con l’ ssDNA: questa parte di RNA viene
usata come stampo per la sintesi di DNA a partire
dalla giunzione innesco:stampo formatasi fra il
DNA e l’ RNA. La sintesi avviene per opera della
TERT. Notiamo che venga sintetizzata una
specifica sequenza, sempre quella dei telomeri,
che non codifica per nessuna proteina. Quando ha
sintetizzato il pezzo di DNA, la telomerasi distacca
l’ RNA dal DNA neosintetizzato e si riposiziona sull’
estremita’ del telomero per ricominciare il
processo.
Deduciamo che la telomerasi serva dunque per
allungare i telomeri.

59
L’ attivita’ della telomerasi e’ dunque fondamentale
per la sopravvivenza dell’ organismo : dato che ad
ogni ciclo di replicazione viene perso un piccolo
pezzo del genoma che corrisponde a una parte del
telomero, l’ allungamento dei telomeri fa si che
questa perdita non abbia conseguenze.
Dall’ immagine notiamo che quando la telomerasi
allunga uno dei due filamenti, rende disponibile
dello stampo in piu’ all’ apparato di replicazione che
funziona sulla catena discontinua. Proprio in questo
modo la cellula riesce dunque ad allungare anche l’
estremita’ 5’, a partire dalla telomerasi che allunga
l’ estremita’ 3’.
Abbiamo gia’ detto che i telomeri contengono
lunghe sequenze ripetute non codificanti. In questo
modo anche se notevoli pezzi telomerici vengono
persi, la cellula non risente di questa perdita.

L’ attivita’ telomerasica ha delle implicazioni affascinanti nella ricerca. La morte e’ da sempre


stata un mistero per l’ umanita’, un mistero che l’ essere umano ha cercato di descrivere in
innumerevoli modi– la mortalita’ e’ pero’ una caratteristica alla quale nessun organismo
vivente puo’ sfuggire.Per molti anni, praticamente da quando si e’ giunti alla scoperta degli
acidi nucleici, i ricercatori stanno esplorando domande concernenti i limiti della mortalita’,
cercando di comprenderli e probabilmente di superarli, volendo trovare la mitica ‘fonte della
giovinezza’, l’ ‘elissir della vita eterna’. Lo scienziato Leonard Hayflick dimostro’ che una cellula,
anche se isolata, possa dividersi solo per un numero determinato di volte. Egli ipotizzo’ che
nella cellula ci sia un tipo di ‘contatore alla rovescia’ che limitava il numero di divisioni cellulari.
Con il procedere degli anni, man mano che la natura molecolare dei telomeri diventava piu’
chiara, si e’ iniziato a pensare che proprio essi rappresentino questo orologio cellulare. Infatti, il
DNA telomerico isolato da una persona giovane e’ piu’ lungo di quello isolato da una persona
anziana. Quest’ osservazione ha portato ad ipotizzare che sia la lunghezza del telomero quella a
limitare il numero di divisioni cellulari. Sebbene questo concetto sia ancora di natura
puramente empirica, si stanno accumulando sempre piu’ prove sperimentali a favore di quest’
idea. Per esempio, affinche’ l’ ipotesi sia valida, nelle cellule normali si dovrebbe avere un’
attivita’ telomerasica alquanto ridotta (se fosse elevata, la cellula allungherebbe il suo DNA in
eterno) e, viceversa, nelle cellule con un alto tasso proliferativo (cellule staminali o quelle
tumorali) l’ attivita’ telomerasica dovrebbe essere elevata. Studi sperimentali hanno
dimostrato che appunto le cellule tumorali possano dividersi un numero indefinito di volte. Un
altro importante esperimento ha dimostrato, sempre in armonia con le ipotesi sui telomeri, che
60
se in una cellula normale aumentiamo l’ espressione della telomerasi, questo porta all’
imortalizzazione della cellula stessa66. L’ invecchiamento avviene appunto perche’ i telomeri
con gli anni diventano sempre piu’ corti. Date queste conoscenze, al giorno d’ oggi si stanno
effettuando numerosi studi per verificare se gli inibitori della telomerasi possono funzionare da
chemioterapici, indebolendo la capacita’ proliferativa delle cellule tumorali. L’ aumento dell’
attivita’ telomerasica nelle cellule tumorali suggerisce pero’ come un incremento della
telomerasi non rappresenti un percorso conveniente per la ricerca dell’ immortalita’. Di nuovo
vediamo come la natura sia incredibilmente complessa e difficilmente manipolabile: un
cambiamento che introduciamo volendo fare un passo avanti (ad esempio con la cura del
cancro) puo’ facilmente implicare delle conseguenze che ci facciano tornare due passi indietro.
Per ora dunque, l’ immortalita’ resta ancora solo un mero sogno dell’ essere umano: non e’ in
realta ‘ meglio che rimanga cosi’ per sempre?.

APPROFONDIMENTO: La chimica della ligasi e dei gruppi prostetici:


In questo capitolo abbiamo analizzato vari meccanismi implicati nella replicazione del DNA. In
questa sezione dedichiamo l' attenzione alla biochimica di alcuni di questi processi:
1) Meccanismo della DNA ligasi:

66
Alla mia domanda ingenua se si potrebbe prolungare la durata della vita aumentando artificialmente l'
espressione della telomerasi , Collavin mi rispose: Molti ricercatori si sono posti questa domanda. Tutti sono pero'
giunti alla conclusione che questo, almeno per ora, non sia possibile. Pensi soltanto che imortalizzando la cellula,
lei crea in realta' una cellula tumorale! Cercando di prolungare la vita, infine la si distrugerebbe anche fin troppo
presto.'. Questa risposta mi e' rimasta fortemente impressa.

61
Vediamo che l' enzima sfrutti l' attacco dell' AMP proveniente dall' ATP o dal NAD+ per
catalizzare l' unione delle estremita' del filamento. L' AMP viene trasportato dall' enzima al
fosfato al 5': a questo punto l' ossigeno del 3'-OH esegue l' attacco nucleofilo al fosfato del 5'
con il conseguente distacco dell' AMP che si e' preso la coppia elettronica dal legame covalente
col fosfato del DNA.
2) Gruppi
prostetici:
Qui vediamo
come i due
ioni metallici
(gruppi
prostetici)
stabiliscano i
fosfati e
rendano piu'
reattivo l'
ossigeno.

Con questi approfondimenti, abbiamo concluso il capitolo riguardante la replicazione del DNA.
Nel capitolo che segue descriveremo invece i vari meccanismi di riparazione del DNA che
mantengono stabile la nostra informazione genetica.

62
CAPITOLO 5: MUTABILITA’ E RIPARAZIONE DEL DNA

La condizione fondamentale sia per la sopravvivenza della specie che per il singolo individuo e’
una relativa stabilita’ del genoma. Il genoma contiene migliaia di geni che devono funzionare
bene, e perche’ cio’ si verifichi, la loro sequenza deve rimanere inalterata. Dobbiamo dunque
capire che i geni siano responsabili del funzionamento cellulare – essi sono la base che controlla
e dirige la vita della cellula67. C’e’ pero’ anche l’ altro lato della medaglia: se da generazione a
generazione si avrebbe la trasmissione di un genoma completamente identico, non si
verificherebbe mai la variabilita’ genetica necessaria per l’ evoluzione: questo sarebbe dunque
completamente incompatibile con la comparsa delle nuove specie, compresa quella umana. La
vita e la biodiversita’ dipendono quindi da un giusto equilibrio fra l’ insorgenza delle mutazioni
e la capacita’ di ripararle.
Definiamo il termine di mutazione: essa e’ un’ alterazione casuale e permanente del DNA che
puo’ alterare sia una sequenza genica sia una porzione regolatoria del gene. Ci sono
essenzialmente tre cause principali delle mutazioni:
1) L’ inacuratezza della replicazione del DNA – principalmente dovuta alla
tautomerizzazione delle basi azotate, nonche’ allo slittamento
2) Danno chimico – il DNA e’ una molecola organica complessa e fragile che puo’ venir
aggredita da sostanze chimiche naturali e non, come anche da radiazioni che alterano la
sua struttura
3) Trasposizione – analizzata nel capitolo 3, responsabile di molte mutazioni
Ci sono inoltre sostanze che creando alterazioni chimiche bloccano i processi come la
replicazione e la trascrizione, il che’ puo’ avere conseguenze immediate e devastanti68.
Le mutazioni creano dunque lesioni del DNA che possono avere conseguenze immediate. La
cellula e’ quindi soggetta a una triplice sfida: come primo deve individuare il danno, poi deve
ripararlo con dei meccanismi spesso molto complessi, ma qualche volta deve comunque essere
in grado di tollerare le mutazioni (almeno fino a che non vengono riparate) .
Inizieremo col trattare gli errori che insorgono con la sintesi del DNA, analizzeremo poi i diversi
tipi di danno sia di tipo chimico che di tipo fisico che possono aggredire la molecola (spontanei
o quelli dovuti alle condizioni ambientali) per poi iniziare a comprendere gli affascinanti
meccanismi che lavorano per identificare e correggere questi errori. Infine revisioneremo le
conseguenze che le mutazioni hanno a livello somatico e a livello di linea germinale.

67
Basta pensare al fatto che il cancro sia una coseguenza di un' alto tasso di alterazione genica.
68
Il fungo Amanita Phalloides, nota anche come Amanita Verdognola, produce una tossina terrificante chiamata
alfa-amanitina che e' in grado di bloccare la trascrizione. Questo porta a un avvelenamento veloce e spesso letale
che distrugge il fegato e che, se non trattato immediatamente, porta sicuramente alla morte.

63
5.1: TIPI DI MUTAZIONI
Prima di iniziare faremo un breve tour attraverso i vari tipi di mutazioni. Le mutazioni piu’
semplici sono date dal cambiamento di una base con un’ altra. Ne esistono di due tipi:
transizioni (a), che consistono nel cambiamento di pirimidine con pirimidine a di purine con
purine, e transversioni (b) che sono invece determinate da sostituzione di pirimidine con purine
e viceversa.

Altre mutazioni semplici sono dette mutazioni puntiformi – esse sono a carico di un singolo
nucleotide (inserzione o delezione). Mutazioni piu' lunghe quali inserzioni o delezioni di grandi
porzioni di DNA causano cambiamenti piu' drastici. Esse sono causate dai trasposoni o da un
funzionamento anomalo della ricombinazione cellulare. In media la frequenza di una nuova
mutazione e' compresa fra 10-6 e 10-11 per ciclo cellulare. Ci sono poi delle sequenze
particolarmente suscettibili a mutazione, che vengono chiamate DNA microsatelliti. Esse sono
determinate dalla ripetizione di sequenze molto brevi, che sono difficilmente copiate in modo
accurato dal macchinario replicativo – questo causa uno slittamento che finisce nel produrre
una sequenza piu' corta o piu' lunga di quella originale. Questo puo' essere causa di diverse
malattie, come la Distrofia muscolare adulta, la Sindrome dell' X fragile (ritardo mentale) o la
malattia di Huntington.

5.2: GLI ERRORI DI REPLICAZIONE E LA LORO RIPARAZIONE


Abbiamo gia’ visto che il macchinario replicativo sia altamente accurato a causa dell’ attivita’
esonucleasica della polimerasi. Quest’ attivita’ aumenta la fedelta’ di replicazione di cca. 100
volte. L’ esonucleasi non e’ pero’ infallibile, e qualche errore le puo’ comunque sfuggire,
creando un appaiamento scorretto. In tutto ci sono 12 appaiamenti scorretti possibili (per ogni
nucleotide ci sono 3 sbagliati). Se questi errori non vengono riparati immediatamente, la
sequenza genomica subisce un cambio permanente: in un secondo ciclo di replicazione il
nucleotide scorrettamente appaiato fara’ da stampo e il filamento neosintetizzato conterra’ un
nucleotide che non dovrebbe, il che porta a una mutazione permanente della sequenza del
DNA. Nell’ immagine vediamo che questa mutazione sia la C che si forma nel secondo ciclo.

64
Per fortuna esiste il sistema di riparazione dei mismatch che
riconosce gli errori di appaiamento e aumenta la correttezza
di sintesi. Esso e' il principale responsabile della fedelta' di
replicazione. Questo meccanismo deve affrontare due
problemi: inanzitutto deve analizzare l' intero genoma a
ricerca di errori di appaiamento (deve trovarli rapidamente,
prima del prossimo ciclo di replicazione!) ma deve poter
anche riparare il mismatch (deve sostituire il nucleotide
sbagliato, non quello corretto presente sull' elica parentale!).

In E. Coli il dimero che svolge questo compito e' chiamato


MutS. Esso analizza il DNA e riconosce gli errori di
appaiamento grazie alla distorsione che essi provocano sulla
doppia elica. MutS si chiude attorno al pezzo contenente il
mismatch e induce una curvatura sul DNA (mostrata a pagina
seguente). Contemporaneamente, grazie all' aggiunta di ATP
a entrambe le subunita', si ha un cambiamento
conformazionale. Il complesso MutS/DNA recluta la proteina
MutL (blu) che a sua volta attiva MutH (giallo) con l' aiuto
dell' idrolisi di ATP. MutH produce un nick in prossimita' del
nucleotide sbagliato. In seguito a quest' interruzione del
legame fosfodiestereo interviene l' elicasi UvrD con attivita'
esonucleasica. L' elicasi svolge l' elica e l' esonucleasi
digerisce il singolo filamento fino ad arrivare al nick. Una
DNA Pol III effettua la sintesi sul filamento singolo e una
ligasi infine risalda il nick. Il risultato e' la rimozione del
mismatch e la sua sostituzione con nucleotidi corretti.

65
Quest' immagine mostra come il MutS crei una curvatura nel DNA.
Vediamo ora come fa il sistema a riconoscere quale dei due nucleotidi sia quello da rimuovere.

Un enzima, la Dam metilasi, metila i


residui di A in una sequenza palindromica
5'-GATC-3' su entrambi i filamenti. Queste
sequenze sono ampiamente
rappresentate nel genoma (una volta ogni
256 bp). Quando la forca replicativa passa
attraverso il DNA metilato, le molecole
figlie risultano emimetilate – infatti solo il
filamento parentale e' metilato. Possiamo
intuire che questo sia il modo per
riconoscere quale dei due sia il filamento
neosintetizzato (su di esso ci sara' il
nucleotide da eliminare). Questo stato di
emimetilazione perdura per alcuni minuti
– in questo tempo avverra' la riparazione.
MutH si lega ai siti emimetilati ma non
diventa attiva fino a che non arrivano
MutL e MutS. Vediamo dunque che la
metilazione sia uno strumento di
'memoria' per indicare quale dei due sia il
filamento da riparare.
Anche le cellule eucariotiche riparano i
mismatch utilizzando MSH (proteine

66
omologhe a MutS) e le MLH (proteine omologhe a MutL). Ci sono molte varianti di proteine
simili a MutS. Si e' scoperto che la predisposizione al cancro del colon sia dovuta a mutazioni di
geni che codificano per una variante di MSH, la MSH2, e per MLH – questo dimostra l'
importanza di questi enzimi nella riparazione.
Nella rimozione del DNA a singolo filamento, nel tratto fra l' incisione creata da MutH e il
mismatch, operano esonucleasi diverse a seconda se il MutH abbia tagliato al 5' o al 3' dell'
appaiamento scorretto. Se il DNA e' tagliato al 5' del mismatch, allora opera l' esonucleasi VII (o
RecJ) che degrada in direzione 5'  3'. Se invece il taglio avviene al 3' del mismatch, a lavorare
e' l' esonucleasi I che degrada in direzione 3' 5'. La seguente immagine lo raffigura molto
bene:

Le cellule eucariotiche sono inoltre prive di MutH e dell' intelligente meccanismo di


emimetilazione che e' invece conservato in E.Coli. Come allora i meccanismi eucariotici riescono
a capire quale dei due filamenti sia quello da riparare, se non c'e' l' azione della Dam metilasi?
Nel capitolo 4 abbiamo pero' visto che il lagging strand e' sintetizzato con l' aiuto dei frammenti
di Okazaki, che vengono infine uniti dalla ligasi. Prima di essere uniti, fra i frammenti e' presente
un nick che equivale all' incisione creata in E.Coli da MutH. Questo nick serve dunque non
soltanto come iniziatore dell' attivita' esonucleasica ma anche come fattore di riconoscimento
del filamento da riparare. MSH interagisce con la sliding clamp e in questo modo viene portato
sul lagging strand. Inoltre, quest' interazione si pensa recluti sul filamento discontinuo le
proteine del sistema di riparazione dei mismatch. Comunque, questo lavora per il filamento
lento, mentre evidentemente non e' ben chiaro ancora come il riconoscimento funzioni per il
filamento guida.

67
5.3: I DANNI AL DNA
Le mutazioni non insorgono solo in seguito a errori nella replicazione ma anche a causa di
fenomeni di danno al DNA. Questo danno puo’ essere di natura chimica o fisica: alcuni danni
sono dovuti a fattori ambientali, quali radiazioni e le cosi’ dette sostanze mutagene (composti
chimici che aumentano la frequenza dell’ insorgenza delle mutazioni). Le sostanze mutagene
sono molto spesso cancerogene in quanto la causa del cancro e’ appunto il danno al DNA. Lo
scienziato statunitense Bruce Ames ha messo a punto un semplice test che determina i
potenziali effetti cancerogeni di una sostanza in base alla sua capacita’ di indurre mutazioni nel
batterio Salmonella typhimurium. Il test di Ames impiega un ceppo batterico mutato sul gene
che serve per la biosintesi dell’ istidina. Come conseguenza, questo ceppo non puo’ crescere in
un terreno solido privo di istidina. Se applichiamo una sostanza potenzialmente cancerogena,
essa andra’ a influire sul gene mutato, invertendo la mutazione e riattivando il gene. La
conseguenza di cio’ e’ il fatto che si osservano colonie batteriche che iniziano a crescere sul
terreno privo di istidina. Logicamente, quanto maggiore e’ il numero di colonie osservate, tanto
piu’ forte e’ la sostanza mutagena (e dunque potenzialmente cancerogena) introdotta69.
Una cosa veramente paradossale e’ il fatto che l’ acqua possa
indurre delle mutazioni spontanee nel DNA.
Il danno idrolitico piu’ frequente consiste nella
deamminazione della citosina. In condizioni fisiologiche la
citosina va incontro a questa reazione e porta alla formazione
dell’ uracile (a), una base che non si trova normalmente nel
DNA. L’ U si appaia preferenzialmente con A e quindi, durante
la replicazione, invece della G che si appaierebbe con la C
viene introdotta A  mutazione!
La guanina va incontro a depurinazione, in seguito all’ idrolisi
del legame N-glicosidico (b): questa trasformazione porta a un
sito senza base.
Guardiamo il caso c – negli eucarioti, invece della C, prevale la
5-metilcitosina, prodotto dell’ attivita’ dell’ enzima DNA-
metiltransferasi, fondamentale per il silenziamento genico.
Vediamo che la deamminazione della 5-metilcitosina formi una
timina normale. Questa, se non eliminata prima del ciclo di
replicazione, verra’ fissata nel genoma come base ordinaria e portera’ a una mutazione
permanente. Di fatto, negli eucarioti le C metilate sono punti soggetti a frequenti mutazioni.
Abbiamo visto che, mentre nei casi a e b vengono a formarsi entita’ non tipiche del DNA, il caso

69
Alcune sostanze non sono cancerogene quando entrano nell' organismo, pero' lo diventano una volta elaborate
dal fegato. Per questo il test tratta le sostanze con una miscela di enzimi epatici.

68
c e’ particolarmente pericoloso in quanto la timina non viene riconosciuta come entita’
estranea al DNA.
Anche l’ adenina e la guanina vanno
incontro a deamminazione spontanea. L’
adenina viene convertita in ipoxantina,
che forma legami idrogeno con la
citosina e non con la timina.
La guanina invece e’ trasformata in
xantina che continua ad appaiarsi con la
citosina anche se mediante la
formazione di solo 2 legami idrogeno.
Quanto detto sugli appaiamenti che si
formano viene riassunto nell' immagine
di sotto:

Se queste entita’ non vengono eliminate prima del seguente ciclo di replicazione,
vengono inglobate nel DNA e possono causare cambiamenti permanenti.

69
Oltre a idrolisi e deamminazione spontanea, il DNA e' soggetto ad alchilazione, ossidazione e
irradiazione.
Nell' alchilazione, gruppi metilici o etilici vengono trasferiti sui siti reattivi delle basi e sui fosfati
dello scheletro del DNA.

Un esempio di agente alchilante e' l' EMS (etil-metanosolfonato) che impegna l' O del C6 della
guanina. Come vediamo, questo O non e' piu' capace di accettare il legame idrogeno – questo
porta alla formazione di un appaiamento sbagliato dell' etilguanina con la timina. Oltre alla
guanina, 'vittima' dell' EMS e' anche la timina stessa, che se etilata va ad appaiarsi erratamente
con la guanina. L' EMS e' dunque un forte mutageno e un potenziale cancerogeno.

L' ossidazione implica l' attacco del DNA da parte di forme reattive di ossigeno, quali O2- o il
radicale libero OH∙, generato da
radiazioni ionizzanti. Vediamo dall'
immagine a destra come l'
ossidazione della guanina porti alla
formazione dell' 8-oxoguanina che
puo' tautomerizzare con la forma 8-
idrossiguanina.

La forma ossidata della guanina, detta anche oxoG, e'


altamente mutagena in quanto puo' appaiarsi sia con
una citosina che con l' adenina. Questo perche' ha un
ulteriore ossigeno carbonilico che puo' fare da
accettore di legame idrogeno.

Vediamo dunque che gli effetti cancerogeni delle


radiazioni ionizzanti possano essere in parte dovuti al
fatto che queste formino i radicali liberi che poi
ossidano la guanina e creano mutazioni nella catena
del DNA.

70
L' irradiazione da parte della luce ultravioletta e' anch' essa una causa di mutazioni. La
radiazione con lunghezza d' onda di circa 260 nm e' fortemente assorbita dalle basi. Ne deriva la
fusione fotochimica di due
pirimidine che sono adiacenti una
all' altra sulla catena. Nel caso di
due timine, la fusione e' detta
dimero di timina, una forma
molecolare che consiste in un
ciclobutano generato dai legami
tra gli atomi di carbonio 5 e 6 delle
due timine.
I legami covalenti che vanno a
formarsi sono causati dal fatto che
gli elettroni vengono eccitati dalla radiazione e conseguentemente gli atomi delle timine li
condividono per formare il legame. Queste strutture non possono creare legami idrogeno con
le basi complementari e portano la DNA polimerasi ad arrestarsi durante la replicazione.

Le radiazioni ionizzanti (raggi gamma e raggi X) non solo producono le forme reattive di
ossigeno (danno indiretto) menzionate prima, bensi' sono in grado di produrre rotture del
doppio filamento del DNA (danno diretto) . Queste rotture sono estremamente difficili da
riparare e provocano conseguenze devastanti per la cellula70, quali morte cellulare. Ricordiamo
che la cellula deve avere i cromosomi intatti per replicare il proprio genoma – avendo questo in
mente, le radiazioni ionizzanti vengono usate come terapia antitumorale per uccidere le cellule
caraterizzate da elevata proliferazione. Farmaci tumorali quali la bleomicina provocano rotture
al DNA, attacando lo scheletro del DNA.

Le mutazioni sono dovute anche a composti molto simili alle basi detti analoghi delle basi.

Il 5-bromouracile rappresentato in rosso e' l' analogo della timina, e puo' appaiarsi
scorettamente con la guanina, causando la mutazione. Anche se strutturalmente simili alle vere
basi, gli analoghi si appaiano in modo non accurato e portano a frequenti errori di replicazione.
Nel caso del bromouracile, e' il tautomero enolico (a destra) quello a creare l' appaiamento.

70
Il Lodish ha descritto la rottura al DNA come la 'peggiore delle ferite', prendendo a prestito una frase di 'Giulio
Cesare' di Shakespeare.

71
Gli agenti intercalanti sono invece molecole piatte con
diversi anelli policiclici, capaci di legarsi al DNA nello
stesso modo con cui le basi si legano e s' impilano l' una
sull' altra nella doppia elica. Questi agenti,
immettendosi nella struttura del DNA, possono causare
delezioni o inserzioni le quali possono avere
conseguenze rilevanti nella trascrizione del gene.
Nell' immagine vediamo come il composto bromuro di
etidio sia intercalato fra due appaiamenti A-T.

In sintesi, abbiamo visto i seguenti tipi di danno al DNA: danno idrolitico, deaminazione
spontanea, depurinazione, alchilazione, ossidazione, irradiazione, azione intercalante, azione
degli analoghi delle basi.

5.4: RIPARAZIONE E TOLLERANZA DEL DANNO AL DNA


Ricordiamoci la triplice sfida che la cellula incontra per preservare la sua integrita’ genomica:
essa consiste nel localizzare, riparare e tollerare il danno. Abbiamo gia’ visto un metodo per
localizzare gli errori nella replicazione. Ora, esaminiamo in dettaglio il secondo punto, cioe’
quello di riparazione.
Abbiamo visto che il danno possa portare a due conseguenze: o blocca la
replicazione/trascrizione, o si insedia nella catena a formare la mutazione (danno a lungo
termine). E’ evidente che senza i meccanismi di riparazione la cellula non sopravivrebbe a
lungo. I tre principali tipi di meccanismi sono:
1) Riparazione diretta: l’ enzima di riparazione cancella il danno
2) Riparazione per escissione: due varianti: escissione della base o escissione del
nucleotide. In ambo i casi il filamento non daneggiato serve da stampo
3) Riparazione per ricombinazione o giunzione diretta : per la rottura della doppia elica

5.4.1: RIPARAZIONE DIRETTA


Un tipico esempio e’ la fotoriattivazione, un sistema che elimina direttamente i dimeri di
pirimidina descritti in precedenza. L’ enzima DNA fotoliasi cattura dal sole l’ energia necessaria
per rompere i legami covalenti che si formano fra le due basi.

72
La fotoliasi ha due cofattori: FADH2 e MTHF. Il meccanismo e' molto interessante: MTHF cattura
la luce solare e trasferisce l' energia di eccitazione al FADH- che diventa *FADH-. *FADH- dona
un elettrone al dimero di pirimidina (e diventa FADH∙) per generare un radicale instabile nel
dimero. Come vediamo dall' immagine, un riarrangiamento elettronico (dovuto al 'viaggio' di
elettroni) riforma le pirimidine monomeriche. L' elettrone viene trasferito al radicale FADH∙ che
diventa FADH- .

Un altro esempio di riparazione diretta e' dato dalla rimozione del gruppo metilico dalla base
metilata (citata nel paragrafo 5.3). Una metiltransferasi rimuove il gruppo metilico dalla guanina
e lo trasmette sul proprio residuo di cisteina.

5.4.2: RIPARAZIONE PER ESCISSIONE


Vediamo l’ escissione delle basi: questo meccanismo prevede la rimozione e la sostituzione di
basi alterate. Un enzima chiamato glicosilasi scorre lungo il DNA riconoscendo le basi
chimicamente modificate e rimuovendole idrolizzando il legame glicosidico (immagine a pag.
seguente). Lo zucchero abasico viene rimosso dallo scheletro mediante un passaggio
endonucleolitico71. Dopo la completa escissione del nucleotide, una DNA polimerasi e una ligasi
usano il filamento non danneggiato come stampo per ripristinare il nucleotide.

71
Lo stesso taglio e' responsabile dell' eliminazione di zuccheri che derivano da idrolisi spontanea.

73
La cellula possiede diversi tipi di glicosilasi, ognuna specifica per un suo substrato. Nell’ esempio
che abbiamo citato si tratta di una uracil-glicosilasi.
Come fa la glicosilasi a rilevare la presenza di una base
danneggiata se questa e’ nascosta all’ interno della
doppia elica72? Alcune ricerche suggeriscono che la
glicosilasi scorra attraverso il solco minore affinche’ non
trova la lesione. La cristallografia a raggi X ha inoltre
dimostrato che la base danneggiata viene ribaltata all’
esterno, protrudendo fuori dalla doppia elica, nel modo
da ‘sedersi’ nel sito attivo della glicosilasi. Questo crea
anche una determinata distorsione delle basi adiacenti.
Esistono anche glicosilasi di sicurezza che operano
durante la replicazione, riconoscono appaiamenti
scorretti dovuti alle mutazioni ed eliminano le basi
sbagliate per non trasmettere la mutazione nella nuova cellula. Ad esempio, riescono ad
eliminare le A che s’ appaiano alle oxoG, o le T che derivano dalla deamminazione della 5-
metilcitosina73.
Il secondo meccanismo e' quello relativo all' escissione dei nucleotidi: questo meccanismo non
identifica nessuna particolare lesione bensi' riconosce delle distorsioni della conformazione
della doppia elica, come quelle causate da un dimero di timina o dalla presenza, su una base, di
un grande addotto chimico. Riconosciuta la distorsione, il meccanismo elimina una regione

72
E' ancora in larga parte ignoto come le glicosilasi vadano in cerca delle basi danneggiate.
73
La domanda e': come la glicosilasi riesce a capire che si tratti di una T derivante dalla deamminazione??

74
polinucleotidica in prossimita' del sito da riparare, lasciando una porzione di singolo filamento
che fara' da stampo.
In E.coli la riparazione per escissione nucleotidica implica l' azione di
4 proteine della classe Uvr: UvrA, UvrB, UvrC e UvrD. Il complesso
2xUvrA + 2xUvrB scorre lungo il DNA: la parte 2xUvrA e' responsabile
del riconoscimento della distorsione. Una volta arrivato alla
distorsione, 2xUvrA viene rilasciato mentre 2xUvrB fonde il DNA
producendo una bolla di denaturazione intorno alla lesione. Ora,
2xUvrB recluta la proteina UvrC che contiene due domini. Un
dominio crea l' incisione posizionata 4 o 5 nucleotidi dal 3' della
lesione, l' altro invece taglia 8 nucleotidi al 5' della lesione. Il
filamento contenete la lesione viene eliminato dall' elicasi UvrD che
produce un' interruzione lunga 12 o 13 nucleotidi. Successivamente,
la DNA Pol I e la ligasi riempiono l' interruzione.
Nelle cellule superiori il principio del meccanismo e' lo stesso, pero' il
macchinario e' molto piu' complesso – contiene oltre 25 proteine. Fra
queste, XPC e' la proteina responsabile dell' identificazione della
distorsione. XPA e XPD sono invece equivalenti di UvrB e creano
dunque la bolla di denaturazione. C'e' inoltre una SSB chiamata RPA
che lega il singolo filamento. Al 5' dalla lesione si formano siti di taglio
per la nucleasi ERCC1-XPF mentre al 3' si formano quelli per la
nucleasi XPG (corrispondente di UvrC). Qui l' interruzione che si
forma consta di 24-32 nucleotidi. Il resto del meccanismo avviene in
maniera simile come nei procarioti.
Le proteine UVR, come implica il loro nome, servono per proteggere
dal danno causato dalle radiazioni UV (es. dimero di timina). I
mutanti nei geni uvr sono altamente sensibili alla luce e spesso
portatori della malattia xeroderma pigmentoso .
Il sistema di riparazione per escissione nucleotidica e' anche in grado di recuperare l' RNA
polimerasi che si bloacca durante la trascrizione a causa un danno sul gene attivamente
trascritto. Quando l' RNA polimerasi trascrivendo un gene arriva al punto di lesione, si ferma e
recluta le proteine di riparazione. Questo meccanismo si chiama riparazione indiretta o
riparazione accopiata alla trascrizione, ed e' molto efficiente in quanto l' RNA polimerasi svolge
il ruolo di localizzare il danno (la prima delle tre sfide). La polimerasi recluta TFIIH, un fattore
generale di trascrizione (del quale si parlera' piu' avanti) che ha come subunita' le proteine XPA
e XPD. XPG taglia invece il frammento di 24-32 nucleotidi. TFIIH ha la funzione sia di denaturare
il DNA in prossimita' della lesione che di fondere lo stampo a DNA nel processo di trascrizione.

75
5.4.3: RIPARAZIONE PER RICOMBINAZIONE E GIUNZIONE DIRETTA
Abbiamo prima citato come la rottura della doppia elica possa avere effetti catastrofici per la
cellula – puo’ bloccare la replicazione determinando la perdita di un cromosoma, il che’ puo’
portare alla morte cellulare o alla trasformazione neoplastica. La riparazione di queste rotture
implica un grande dispendio energetico da parte della cellula ma e’ fondamentale per la
sopravvivenza. Ci sono due modalita’ di riparazione:
1) Per ricombinazione omologa: verra’ trattata in dettaglio nel capitolo 9
2) Per giunzione diretta delle estremita’ non omologhe
Il sistema di riparazione delle rotture a doppio filamento, dette DSB, deve dunque poter
riparare il DNA dove entrambe le eliche sono rotte. I meccanismi che effettuano la
ricombinazione omologa usano le sequenze del cromatidio fratello. Esamineremo in dettaglio
questo meccanismo nel capitolo 9.
Il meccanismo che sfrutta la ricombinazione omologa e’ efficace, ma non e’ sempre utilizzabile.
All’ inizio del ciclo cellulare, non ci sono ancora i due cromatidi fratelli – banalmente, questo
significa che il meccanismo a ricombinazione
omologa non puo’ essere sfruttato. Per questo
motivo, le cellule sfruttano un sistema
alternativo noto come giunzione delle
estremita’ non omologhe, detto anche NHEJ
(nonhomologous end joining). Nelle cellule
superiori questo e’ il principale sistema di
riparazione delle rotture. Bisogna pero’ dire
che NHEJ sia mutageno, in quanto esso non
ripristina la sequenza persa, bensi’ unisce le
due estremita’ spezzate74.
Ecco come funziona. Le due proteine Ku70 e
Ku80 formano un eterodimero che si lega alle
estremita' del DNA e reclutano una chinasi
DNA-PKcs. Questa chinasi forma un
complesso con la proteina Artemide. Quest'
ultima ha sia attivita' esonucleasica 5'-3' sia
un' attivita' endonucleasica latente che viene
attivata in seguito a fosforilazione da parte
della DNA-PKcs. Queste attivita' di Artemide
processano le estremita' rotte e le preparano

74
Per la cellula e' comunque meno traumatico affrontare le conseguenze mutagene della NHEJ che quelle della
rottura del doppio filamento

76
per essere legate da parte di una Ligasi IV, appartenente a un complesso contenente le
proteine XRCC4 e Cernunno-XLF75. Il meccanismo NHEJ e' un processo molto veloce e succede
prevalentemente nella fase G1. E' importante notare che anche la ricombinazione V(D)J si
avvalga del meccanismo NHEJ per aumentare la variabilita' di anticorpi.

5.4.4: LA SINTESI TRANSLESIONE


Dato che i meccanismi di riparazione non sono efficienti sempre al 100%, la DNA polimerasi,
replicando, puo’ incontrare una lesione che non e’ stata riparata quale un dimero di pirimidina
o un sito apurinico. A questo punto, l’ enzima puo’ riuscire a superare la lesione oppure puo’
interrompere la propria funzione. Esiste nella cellula un sistema di sicurezza che permette all’
apparato replicativo di superare queste regioni danneggiate o almeno di tollerarle (ricordiamo il
terzo punto della triplice sfida). Un metodo di tolleranza del danno e’ noto come sintesi
translesione. Questo meccanismo e’ estremamente poco fedele e introduce quasi sicuramente
delle mutazioni, pero’ fa evitare alla cellula il peggior destino – quello di avere un cromosoma
non interamente replicato76. La sintesi translesione e’ dovuta a una classe speciale di DNA
polimerasi, chiamata famiglia Y di polimerasi: parliamo di DNA Pol IV o di DNA Pol V . Il
funzionamento e’ semplice: quando la polimerasi normale (Pol III) arriva al punto di lesione,
essa e la sua sliding clamp sono rilasciate e al suo posto viene reclutata una polimerasi
appartenente alla famiglia Y. Questa polimerasi, pur lavorando sullo stampo, aggiunge nuovi
nucleotidi non tenendo conto dello specifico appaiamento che si forma fra le basi. In altre
parole, aggiunge nucleotidi a caso, che le permette di ignorare la lesione. Certo, possiamo
dunque intuire perche’ questo tipo di polimerasi implichi la formazione di mutazioni: la
probabilita’ di aggiungere il nucleotide corretto e solo del 25%. Per questo e’ fondamentale che
questa polimerasi lavori solo su un breve tratto – una volta che supera la lesione, questa
polimerasi viene rilasciata e al suo posto ritorna la DNA Pol III con la sua sliding clamp77. Una
cosa fondamentale e’ il controllo dell’ espressione della famiglia Y delle polimerasi: se fossero
espresse troppo intensamente, il livello di mutagenesi (inserimento e mantenimento della
mutazione nel genoma) sarebbe altissimo. La sintesi della polimerasi appartenente alla famiglia
Y e’ infatti indotta solamente in risposta al danno sul DNA – i geni che codificano per la
polimerasi translesione sono quindi espressi durante la cosi’ detta risposta SOS.
Una cosa ancora piu' affascinante e' il fatto che diversi tipi di polimerasi translesione servano
per tollerare diversi tipi di danno al DNA. L' immagine a pagina seguente lo raffigura molto
bene: studi cristallografici hanno dimostrato che un tipo di polimerasi translesione faccia
entrare perfettamente nel suo sito attivo un dimero di timina. L' altro tipo invece non riesce a

75
I pazienti affetti da immunodeficienza o microcefalia presentano la mutazione sui geni che codificano per questo
complesso.
76
Le mutazioni potranno venir eliminate in seguito.
77
Due sono le domande senza risposta: Come fa l' enzima translesione a sotituirsi alla polimerasi III e come fa la
polimerasi III a ritornare al suo stampo una volta che la lesione viene superata? Quello che pero' sappiamo e' che l'
ubiquitina giochi un ruolo fondamentale nel reclutamento della polimerasi translesione (Watson pagina 341).

77
far entrare perfettamente il dimero nel suo sito attivo a causa dell' ingombro che si forma
(porzione verde):

5.5: EFFETTI DELLE MUTAZIONI


In questo capitolo abbiamo analizzato a livello molecolare il danno al DNA, le mutazioni e la loro
riparazione. In genetica verra’ invece affrontato l’ argomento sulle varie tipologie delle
mutazioni al quale abbiamo solamente accennato. Abbiamo dedotto che le mutazioni possano
portare a conseguenze veramente gravi, ma allo stesso tempo non devono essere
necessariamente di natura cosi’ negativa. Basta pensare che l’ evoluzione sia dovuta alla
variabilita’ genetica che e’ dovuta proprio alle mutazioni. Come possiamo prevedere se una
mutazione sara’ dannosa o meno? Bisogna certamente prendere in considerazione dove sia
avvenuta la mutazione: se e’ insorta in una localita’ che non contiene geni, allora (almeno si
pensa) i suoi effetti molto probabilmente non saranno visibili. Se invece la mutazione e’
avvenuta all’ interno di un gene, anche qui dobbiamo ragionarci sopra: immaginiamo un enzima
composto da un solo sito attivo. Ora, questo enzima ha il gene che lo codifica. Se la mutazione
e’ insorta in una porzione del gene codificante per una parte dell’ enzima che non e’ coinvolta
nella catalisi, i suoi effetti potranno comunque non essere visibili anche se e’ insorta all’ interno
del gene (anche qui dipende tantissimo, basta ricordare il discorso sull’ allosterismo). Se invece
la mutazione afligge proprio la parte del gene che codifica per gli amminoacidi del sito attivo,
allora si che la situazione puo’ essere grave, dato che cambiano le proprieta’ della catalisi (la
catalisi puo’ essere addirittura inibita). Certe mutazioni possono modificare le azioni delle
proteine, senza che questo sia dannoso per la cellula78. Le possibilita’ sono veramente
tantissime, ma quello che e’ sicuro e’ che la cosa piu’ sicura e’ comunque tenere sotto controllo
il tasso di mutazione presente nella cellula.

78
Quando abbronziamo, il gene che codifica per il nostro pigmento muta e il pigmento prodotto e' diverso.

78
CAPITOLO 6: I MECCANISMI DELLA TRASCRIZIONE
Nei capitoli precedenti abbiamo analizzato la struttura, la replicazione e il mantenimento del
genoma. In questo e nei prossimi due capitoli ci occuperemo della seconda parte del dogma
centrale della biologia molecolare, quella riguardante l’ espressione del genoma. Il protagonista
di questa parte del dogma centrale e’ l’ acido ribonucleico o RNA79. Il primo processo di
espressione del genoma e’ la trascrizione. Essa consiste nella formazione della molecola di RNA
messaggero, nota come mRNA, che serve a trasportare l’ informazione contenuta nel genoma
fuori dal nucleo cellulare.
La trascrizione e' chimicamente molto simile alla replicazione del DNA. Entrambi i processi
utilizzano enzimi che sintetizzano una nuova catena di acido nucleico complementare al
filamento stampo del DNA. Ci sono pero' delle fondamentali differenze: le caratteristiche della
trascrizione diverse da quelle inerenti alla replicazione sono:

1) Vengono sintetizzati ribonucleotidi, dai quali la catena di mRNA e' composta.


2) L' enzima che sintetizza e' l' RNA polimerasi: esso non ha bisogno di un primer, puo'
inizare invece la trascrizione ex novo.
3) L' RNA prodotto non rimane attaccato alla catena stampo. Al contrario, l' enzima stacca
la catena ribonucleotidica a solo pochi nucleotidi di distanza dal punto di aggiunta dei
nuovi ribonucleotidi, come rappresentato dall' immagine:

Il fatto che non rimanga attaccato e' fondamentale per la sua funzione, dato che deve
uscire dal nucleo. Il fatto che venga staccato cosi' velocemente e' anche importante
perche' permette la trascrizione simultanea di uno stesso gene da parte di molte RNA
polimerasi – in questo modo la cellula puo' sintetizzare un alto numero di trascritti di
uno stesso gene in un breve periodo di tempo80. La doppia elica si riassocia, come
vediamo, non appena l' mRNA si distacca.
4) La trascrizione, sebbene molto accurata, e' meno precisa della replicazione data l'
assenza di un meccanismo preciso di correzione per la trascrizione, nonostante esistano
due forme di correzione per la sintesi di RNA81.

79
Siamo passati dunque dall' analisi del genoma all' analisi del trascrittoma.
80
Se alla cellula in quel momento serve un alto numero di una determinata specie proteica, verranno prodotti
molti trascritti che servono a produrre tale specie.
81
Per la cellula e’ piu’ logico preoccuparsi dell’ accuratezza della replicazione dato che i suoi risultati restano poi
fissi nel genoma mentre la molecola di mRNA e’ presente solo per un breve periodo (e ci sono trascritti multipli)

79
5) La replicazione e la trascrizione hanno scopi diversi: mentre la replicazione deve copiare
tutto il genoma una volta, la trascrizione copia selettivamente solo alcune porzioni del
genoma e produce da una a cento (o mille) copie di ciascuna regione. Le regioni copiate
non sono casuali, bensi' contengono uno o piu' geni. Ci sono regioni di DNA dirigenti l'
inizio della trascrizione e ci sono quelle che la fanno terminare.
6) La trascrizione e' piu' lenta della replicazione

L' RNA polimerasi sintetizza l' mRNA in direzione 5'  3', legge dunque il DNA in senso 3'  5'.
L' appaiamento delle basi fra DNA e mRNA avviene in una bolla dove il DNA viene attivamente
trascritto. E' possibile che avvenga la trascrizione antisenso ma questo verra' visto nel capitolo
sulla regolazione.
La trascrizione viene finemente regolata, ma anche questo sara' tema degli ultimi capitoli.

6.1: LA RNA POLIMERASI E IL CICLO DELLA TRASCRIZIONE


In tutti gli organismi le RNA polimerasi svolgono la medesima funzione, pertanto le strutture
principali di questo enzima sono piuttosto conservate nella maggioranza delle specie82.
Vediamo prima la struttura cristallografica della polimerasi batterica:
Come vediamo, essa e' composta da 5 subunita' + gruppo prostetico.
La subunita' β' e' quella piu' grande, ed e'
codificata dal gene rpoC. Segue per
grandezza la subunita' β codificata dal gene
rpoB. Queste due subunita' formano il sito
attivo per la sintesi dell' mRNA. Contenono
inoltre componenti che creano interazioni
non specifiche con il DNA e l' mRNA
nascente.
Le subunita’ α’ e α’’ sono uguali fra loro e
ognuna contiene 2 domini: αNTD (N-
terminal domain) e αCTD (C-terminal
domain). NTD serve per l’ assemblaggio della
polimerasi, CTD invece reagisce col
promotore (modo non-sequenza specifico)
sul DNA e coi fattori di regolazione.
La subunita’ omega e’ la piu’ piccola: essa
stabilizza l’ RNA polimerasi assemblata.

82
Sopratutto quelle parti dell' enzima direttamente coinvolte nella catalisi.

80
Queste 5 subunita’ fanno parte del core della RNA polimerasi batterica.
Gli eucarioti hanno invece tre tipi di RNA polimerasi. Vediamo il confronto fra una polimerasi
batterica e una generica polimerasi eucariotica:

Qui sono messe a confronto le 5 subunita’ che i due tipi di polimerasi hanno in comune. Da
notare che le polimerasi eucariotiche hanno altre 9 subunita’ in piu’! Nella seguente tabella
indichiamo le corrispondenze fra le subunita’:

Subunita’ dell’ RNA polimerasi batterica Subunita’ dell’ RNA polimerasi eucariotica
α’ RBP3
α’’ RBP11
β RBP2
β’ RBP1
omega RBP6

Come possiamo dedurre, il sito attivo e’ principalmente lo stesso in procarioti ed eucarioti, che
e’ logico: infatti, in tutti gli organismi il sito attivo della polimerasi svolge essenzialmente la
stessa funzione. Le subunita’ periferiche invece sono piu’ numerose nelle polimerasi
eucariotiche dato che le polimerasi eucariotiche mediante esse sono coinvolte in interazioni
con proteine diverse. Ambedue le tipologie della polimerasi ricordano una chela (che a sua
volta ricorda la struttura ‘a mano’ della polimerasi): la zona del sito attivo viene anche detta
solco centrale attivo. Questo sito funziona con un meccanismo simile a quello descritto per la
DNA polimerasi pero’ contiene un solo ione Mg2+. L’ altro ione viene aggiunto con un nuovo
nucleotide in ogni ciclo di sintesi e rilasciato con la molecola di pirofosfato.

81
Mentre i batteri hanno un solo tipo di RNA polimerasi, negli eucarioti ce ne sono ben 3 tipi83: la
polimerasi I, II e III. La Pol II e’ il tipo piu’ studiato ed e’ coinvolta nella trascrizione di tutti i geni
che codificano per proteine. La Pol I e la Pol III sono invece coinvolte nella trascrizione dei geni
che codificano specificamente RNA. La Pol I trascrive i geni per i precursori dei grandi RNA
mentre la Pol III trascrive i geni per i tRNA, snRNA e l’ rRNA 5S.
Ora che abbiamo analizzato la struttura della polimerasi, vediamo uno schema generale della
trascrizione. I passaggi attraverso i quali avviene la trascrizione di un gene vengono suddivisi in
tre fasi: inizio, allungamento e terminazione.
INIZIO: Un promotore e' la sequenza di DNA che si lega
inizialmente all' RNA polimerasi. Il complesso promotore-
polimerasi subisce un cambiamento strutturale importante
per l' inizio: il DNA attorno al punto in cui comincia la
trascrizione si svolge, producendo una bolla di trascrizione
di DNA a singolo filamento. Diversamente dalla
replicazione, un solo filamento fa da stampo. La scelta del
promotore determina quale tratto del filamento venga
trascritto84.
ALLUNGAMENTO: Questa fase inizia quando la polimerasi
ha sintetizzato un corto frammento di RNA di cca. 10 basi.
L' enzima, oltre a catalizzare la formazione di mRNA, separa
i due filamenti di DNA e li riavvolge dopo il suo passaggio,
stacca la catena di RNA dallo stampo man mano che la
reazione prosegue e in piu' funziona da correttore di
bozze85!
TERMINAZIONE: In questa fase l’ enzima rilascia l’ mRNA
prodotto e si dissocia dal DNA. In alcune cellule vi sono
sequenze ben specifiche che innescano la terminazione, in
altre non e’ ben chiaro cosa induca l’ enzima a cessare di
trascrivere.
Dall’ immagine si vede che la fase iniziale sia divisa in 3
serie di passaggi. Il primo passaggio forma il complesso
chiuso: in questo stadio il DNA e’ a doppia elica e l’ enzima
e’ legato a una faccia dell’ elica. Questo complesso evolve

83
Recentemente nelle piante sono state identificate la Pol IV e la Pol V che trascrivonoi piccoli RNA interferenti
coinvolti nel silenziamento della trascrizione.
84
E' la fase in cui piu' facilmente viene attuata la regolazione della trascrizione.
85
L' RNA polimerasi e' davvero un enzima multitasking affascinante! Ricordiamo che durante la replicazione molte
di queste funzioni siano svolte da altre proteine.

82
poi in un complesso aperto in cui le catene del DNA si separano per cca. 13 bp formando la
bolla. Lo stampo e’ ora libero e i due nucleotidi vengono portati al sito attivo. Il complesso
iniziale della trascrizione si ha subito dopo, dove l’ enzima non e’ ancora proccessivo e dove si
formano brevi trascritti di cca. 10 bp che vengono spesso rilasciati. Una volta superati i primi 10
nucleotidi succede l’ evasione della polimerasi dal promotore. Inizia cosi’ il processo di
allungmento. Ci dedichiamo ora alla descrizione piu’ dettagliata del ciclo di trascrizione.

6.2: IL CICLO DELLA TRASCRIZIONE NEI BATTERI


In vitro puo’ essere dimostrato che il core dell’ RNA polimerasi batterica (α2ββ’ω) possa iniziare
a partire da qualsiasi regione del DNA. Nella cellula non e’ cosi’. C’e’ un fattore d’ inizio, chimato
fattore σ che si lega al core enzimatico e lo converte nella forma capace di partire solo dai
promotori. Il core enzimatico + fattore σ prende il nome di oloenzima dell’ RNA polimerasi:

E' rappresentato qui l' oloenzima di Thermus aquaticus: la parte grigia e' il core enzimatico,
mentre si possono individuare le 3 regioni del fattore d' inizio. Il fattore σ70 e’ la forma di
fattore d’ inizio predominante in E. coli.
L’ oloenzima e’ dunque in grado di fare quello che la polimerasi non puo’ da sola: riconoscere i
promotori86. Parti del fattore σ interagiscono con le sequenze del promotore. A questo punto,
descriviamo in dettaglio com’ e’ fatto un generico promotore che viene riconosciuto dalla
polimerasi contenente il fattore σ70:
- 2 sequenze conservate, composte ognuna da 6 nucleotidi, che stanno rispettivamente
35 e 10 copie di basi a monte del sito dove inizia la trascrizione (il nucleotide dove inizia
la trascrizione viene indicato con +1). Queste sequenze sono chiamate rispettivamente
regione -35 e regione -10.
- Le due sono separate da un segmento non specifico di 17-19 nucleotidi.

86
La polimerasi senza il fattore σ non fa alcuna differenza fra le sequenze del DNA.

83
- Il punto di inizio della trascrizione: 90% si tratta di una purina.

Nell' immagine e' rappresentato il promotore descritto. Confrontando le regioni nelle varie
specie, si e' dimostrato che non siano identiche. E' stata stabilita pero' una sequenza consenso:
essa rappresenta le due regioni piu' comuni: solo un esiguo numero di promotori ha quest'
esatta sequenza pero' la maggior parte differisce solo in per pochi nucleotidi. I fattori con la
sequenza piu' simile a quella consenso saranno queli piu' 'forti', cioe' quelli che legano meglio l'
oloenzima della polimerasi. I geni che devono essere trascritti maggiormente conterranno
dunque le sequenze molto simili a quelle consenso87! Abbiamo descritto un promotore
generico ma ci sono anche delle varianti sul tema:

In alcuni promotori forti (es. dei geni


per gli rRNA) si trova l' elemento UP
che lega anche lui la polimerasi,
aumentando la forza complessiva dell'
interazione. Alcuni promotori
mancano invece della regione -35 che
viene compensato cn un' estensione
della regione -10 che lega anch' essa
la polimerasi. Ci sono anche promotori
che a valle della regione -10
possiedono il discriminatore che
stabilizza il complesso polimerasi-DNA.

87
Questo e' molto probabilmente la ragione per la quale non tutti i promotori sono uguali.

84
La forza di un promotore e' dettata dall' affinita' di legare l' oloenzima e dalla capacita' dell'
oloenzima a evadere il promotore. Vediamo come i due interagiscono:

Due eliche all' interno della regione 4 creano un dominio di legame alla regione -35 detto elica-
giro-elica (helix-turn-helix): mentre un' elica interagisce con le basi attraverso il solco maggiore,
l' altra si lega all' ossatura del DNA88. Il ruolo della regione -10 e' piu' complesso: su questo
elemento avviene l' inizio della separazione dei due filamenti. Per questo l' elica che lega il
promotore in questo punto e' ricca di amminoacidi aromatici che stabilizzano ' ssDNA
formatosi che non fa da stampo89. Vediamo anche che parti della regione 2 + regione 1
interagiscano col discriminatore. Un' elica nella regione 3 riconosce l' elemento esteso.
Recenti studi strutturali hanno chiarito come avvenga la separazione dei filamenti di DNA
favorita dall' interazione fra la regione del fattore σ e il filamento singolo del DNA: due basi del
filamento che non fa da stampo vengono ribaltate all' esterno e stabilizzate nelle tasche
enzimatiche, in modo da favorire la formazione di ssDNA.
Contrariarmente agli altri
componenti del promotore, l'
elemento UP non viene legato dal
fattore σ bensi' da un dominio
carbossi-terminale della subunita'
α, detto αCTD. αCTD e' legato all'
αNTD mediante una connessione
flessibile- questo permette ad
αCTD di interagire con UP anche se questo si trova lontano dalla regione -35. Come vediamo
dall' immagine, le subunita' del fattore σ si posizionano alla distanza da poter interagire
correttamente con il promotore.
Vediamo piu' in dettaglio la transizione al complesso aperto. Questo processo implica sia l'
apertura del DNA (melting) tra le posizioni -11 e +2, sia un cambiamento strutturale dell'
enzima. Nei batteri contenenti il fattore σ70 questo cambiamento e' detto isomerizzazione e

88
In questo modo la regione -35 fornisce energia di legame necessaria per assicurare la polimerasi sul promotore.
89
Ruolo simile a quello delle SSB.

85
non necessita di idrolisi di ATP: e' un cambiamento spontaneo verso la forma piu' favorevole.
Infatti, le due basi del filamento non-stampo (A11 e T7) che si ribaltano nella tasca enzimatica
favoriscono la fusione di questa regione del promotore. L' isomerizzazione e' irreversibile-
questo garantisce che la trascrizione venga propriamente iniziata. Per capire come avvenga l'
isomerizzazione, ricordiamoci la struttura dell' RNA polimerasi. L' enzima e' composto da 4
canali: canale di uscita dell' RNA dove esce l'
RNA neosintetizzato, il canale NTP uptake
per l' ingresso di ribonucleotidi (non si vede
nell' immagine!), canale NT e canale T.
Quello che vediamo e' che il DNA che deve
essere ancora trascritto entra nel solco
attivo centrale. I due filamenti si allontanano
a partire dalla posizione 3+. Il filamento che
non funge da stampo esce dal canale NT
mentre lo stampo segue una via alternativa
ed esce dal canale T. I due filamenti si riassociano nella posizione -11 (dietro l' enzima). L'
isomerizzazione consiste in due avvenimenti:
1) Le pinze si stringono strettamente sul DNA a valle
2) La regione σ1.1 , quando inizia la trascrizione, viene rimossa piu' all' esterno per
consentire il passaggio al DNA. Quando il DNA non c'e', σ1.1 serve per imitarlo– come il
DNA, σ1.1 ha una carica molto negativa e interagisce con una regione caricata
positivamente della polimerasi.

Abbiamo gia' detto che l' RNA polimerasi non abbia bisogno di un primer per iniziare la sintesi.
Questo non e' un' impresa facile in quanto l' enzima deve fare un lavoro in piu' per stabilizzare
il primo nucleotide affinche' la polimerizzazione possa iniziare90. Qui gioca un ruolo
fondamentale il linker ¾ di σ (detto anche subdominio di σ).
In precedenza abbiamo anche sottolineato che prima di entrare nella fase di allungamento la
polimerasi sintetizzi corti trascritti (<10 nt) che vengono poi rilasciati. Questo processo prende il
nome di sintesi abortiva. Essa e' stata spiegata col modello dell' 'accartocciamento'
(scrunching): esso prevede che il DNA a valle dell' enzima che sta fisso sul promotore sia tirato
dall' enzima. Una volta accumulato in esso, il DNA viene immagazzinato in forma di
protuberanze a singolo
filamento. La bolla ha ora delle
dimensioni di 22-24 nt.
Non e' perfettamente chiaro
perche' l' RNA debba andare

90
La maggioranza dei trascritti inizia con la A che con T crea solo due legami idrogeno – appaiamento poco stabile
che deve essere stabilizzato dalla polimerasi. Sappiamo dalla chimica che pochi legami idrogeno sono deboli e
facilmente spezzabili. Affinche la loro forza diventi notevole, devono esserci tanti.

86
incontro a questa fase di sintesi abortiva, ma ci sono delle ipotesi sempre piu' giustificate:
sembra che ancora una volta sia coinvolto il fattore σ. Il linker ¾ simula l' RNA e si trova nel
mezzo del canale d' uscita per l' RNA nel complesso aperto. Se viene prodotta una molecola di
RNA lunga oltre ai 10 nucleotidi, questo linker ¾ deve essere espulso, ma questo puo'
richiedere diversi tentativi alla polimerasi. Data questa espulsione del linker ¾, e' facile spiegare
il motivo di un' associazione piu' debole del fattore σ con la polimerasi durante il processo di
allungamento. Una volta che avviene il distacco del linker ¾, lo scrunching procede in direzione
opposta: la bolla di 22-24 nt collassa e torna alla lunghezza di 12-14 nt tipica per la fase di
allungamento. Si pensa che questa rinaturazione del DNA fornisca l' energia necessaria per l'
evasione che implica due distacchi:
1) Il distacco della polimerasi dal promotore
2) Il distacco del core enzimatico dal fattore σ

Dedichiamo ora la nostra attenzione alla fase di allungamento. Il passaggio di DNA attraverso l'
enzima e' molto simile come nella fase del complesso aperto (descritto alla pagina 86). Durante
questa fase, la bolla di trascrizione rimane di dimensioni costanti. Oltre ad aggiungere nuovi
ribonucleotidi, la polimerasi svolge anche il ruolo di correttore di bozze (proof reading).
Esistono due meccanismi di correzione:
1) Editing pirofosforolitico: l' enzima catalizza la reazione di rimozione di un ribonucleotide
inserito in maniera non corretta91 tramite la reincorporazione di PPi. Si tratta di un
meccanismo immediato.
2) Editing idrolitico: L' enzima torna indietro di uno o due nucleotidi e taglia quello
appaiato in maniera scorretta con idrolisi del legame fosfodiesterico. Questo editing e'
stimolato dai fattori Gre che stimolano anche l' allungamento.
Se la polimerasi si blocca durante la trascrizione (es. a causa del danno sul DNA), viene rimossa
dall' enzima denominato TRCF.

Abbiamo analizzato l' inizio e l' allungamento, resta di vedere la terminazione del ciclo di
trascrizione. Alla fine del gene troviamo delle sequenze chiamate terminatori che segnalano
alla polimerasi di staccarsi dal DNA e di rilasciare la catena di RNA sintetizzata. Ci sono due tipi
di terminatori:
1) Rho-dipendenti: dipendono dalla proteina Rho per indurre la fine della trascrizione
2) Rho-indipendenti: non necessitano della proteina Rho
Tratteremo i due separatamente.

I terminatori Rho-dipendenti hanno degli elementi di RNA molto piccoli chiamati rut: il loro
funzionamento necessita dell' attivita' del fattore Rho.

91
In realta' puo' rimuovere anche quelli appaiati correttamente ma molto piu' spesso avviene l' eliminazione dell'
appaiamento scorretto (serve piu' tempo per analizzare l' appaiamento scorretto).

87
Ma com'e' fatta Rho? Studi cristallografici hanno
dimostrato che si tratti di un anello non planare
composto da sei subunita' diverse. La subunita' rossa e
quella viola non stanno sullo stesso piano del foglio.
Questa proteina si lega all' RNA in uscita dalla
polimerasi: inoltre ha un' attivita' ATP-asica: sfrutta l'
idrolisi di ATP per indurre la terminazione. Il preciso
meccanismo con il quale questo avviene non e' ancora
ben definito ma ci sono alcuni modelli, fra i quali il piu'
promettente e' che Rho spinga la polimerasi in avanti
causando un cambiamento conformazionale della
stessa. La Rho e' rut-sequenza-specifica: si lega in
presenza di questa sequenza ricca di C e lunga cca. 40 nt. In piu' vale dire che Rho non si associ
ad alcun trascritto in fase di traduzione92.

Ci sono poi i terminatori Rho-


indipendenti detti anche
terminatori intrinseci, che sono
costituiti da due elementi: Una
sequenza palindromica breve di
cca. 20 nt, cui segue un piccolo
segmento costituito di coppie di
basi A:T. Questo tratto entra in
funzione quando viene trascritto:
infatti, esso concede al mRNA
appena trascritto di creare una
struttura secondaria detta forcina
(capitolo 2) che in qualche modo e' in grado di indurre la fine della trascrizione (si pensa che i
meccanismi siano simili come per i terminatori Rho-dipendenti). Il tratto delle coppie di basi A:T
e' fondamentale: nell' RNA questo tratto conterra' l' appaiamento A:U, che e' l' appaiamento
piu' debole di tutti. Conseguentemente, e' anche il piu' facile da scindere – l' RNA si dissocia piu'
facilmente.

 A:U e' l' appaiamento piu' debole!

92
Ricordiamo dalle lezioni di Collavin che nei batteri la trascrizione e la traduzione siano associate – un' RNA
ancora in sintesi e' coinvolto nella traduzione sui ribosomi non appena esce dal' RNA polimerasi.

88
6.3: LA TRASCRIZIONE EUCARIOTICA
La trascrizione negli eucarioti e’ simile come meccanismo chimico a quella dei procarioti.
Ricordiamo pero’ che ci sia una differenza nel timing: mentre nei procarioti la trascrizione e’
accompagnata da un’ immediata traduzione, negli eucarioti questi due processi sono ben
distinti nel tempo (fra di loro intercorre anche lo splicing dell’ RNA).
Abbiamo gia’ visto come la polimerasi procariotica e quella eucariotica siano piuttosto simili, il
che’ e’ completamente logico dato il fatto che debbano svolgere praticamente la stessa
funzione. Ci sono pero’ delle differenze: gli eucarioti hanno 3 polimerasi diverse mentre i batteri
ne hanno una sola. In piu’, per l’ inizio della trascrizione eucariotica (promotore-specifico)
servono numerosi fattori di trascrizione chiamati fattori generali di trascrizione (GTF, general
transcription factors). Questa crescente complessita’ e’ dovuta al fatto che il DNA eucariotico
sia organizzato in cromatina: per modificarla e rendere accessibile il promotore, servono
numerosi enzimi93.
Per facilitare la cosa, veranno prima descritti i meccanismi di trascrizione osservati in vitro (cioe’
ignorando la presenza della cromatina e immaginando il DNA eucariotico come una catena
lineare, trascritto dalla RNA polimerasi II) per poi procedere con la descrizione delle strutture
coinvolte nella modificazione della cromatina.

6.3.1: MECCANISMI IN VITRO


Si definisce core del promotore il gruppo minimo di sequenze necessario per un inizio accurato
della trascrizione effettuata dal macchinario della Pol II. Esso si estende a monte o a valle del
sito d’ inizio, ed e’ rappresentato nella figura seguente:

Questo schema mostra tutti gli elementi ricorrenti del core.

93
Spesso coinvolti anche nei meccanismi di regolazione genica.

89
Le sequenze rappresentate sono le sequenze consenso di ognuno degli elementi. Spesso non
tutti gli elementi si ritrovano all’ interno di un promotore: ad esempio molti contengono o TATA
o DPE ma non entrambi. Inr e’ quello piu’ conservato.
I GTF hanno tutti assieme la funzione del fattore σ procariotico, ovvero aiutano la polimerasi a
legarsi al promotore, a separare il DNA e a lasciare il promotore ed entrare nella fase di
allungamento. Il gruppo completo dei GTF associati alla polimerasi e il tutto legato al promotore
prende il nome di complesso di preinizio. Esso inizia a formarsi sul TATA-box, che e’
riconosciuto da un GTF chiamato TFIID94. Come molti TFII, anche TFIID e’ composto da molte
subunita’. La subunita’ di TFIID che lega la TATA-box si chiama TBP (TATA-binding protein). Le
altre subunita’ di TFIID sono dette TAF (TBP-associated factors95). Alcuni TAF riconoscono l’ Inr,
il DPE e il DCE pero’ il legame piu’ forte e’ fra TBP e TATA96. Infatti, una volta legato, TBP
distorge la sequenza TATA in maniera molto marcata (vedremo piu’ avanti): il complesso TBP-
DNA risultante recluta altri GTF e la stessa polimerasi II.
Come possiamo vedere dalla figura, il reclutamento
avviene in questo ordine: TFIIA, TFIIB, TFIIF assieme alla
polimerasi, TFIIE e TFIIH. Successivamente a questa
formazione del complesso di preinizio, avviene la
dissociazione dei filamenti del promotore che a
differenza del caso procariotico richiede l’ idrolisi di ATP
ed e’ mediata da TFIIH.
La TFIIB e’ una proteina a singola catena che interagisce
con BRE (sul promotore) , TBP e polimerasi.Il legame
asimmetrico del TFIIB con il complesso TBP-DNA e’
responsabile dell’ unidirezionalita’ della trascrizione
(dovuta all’ asimmetria del complesso di preinizio). La
TFIIB sembra far anche da ponte fra polimerasi e TBP.
Il legame della TFIIF con la polimerasi stabilizza il
complesso TFIIB-TBP-DNA ed e’ necessario per reclutare
TFIIE che recluta la TFIIH che ha ben 10 subunita’ – la
subunita’ con attivita’ ATP-asica media il melting del
DNA, che scatta l’ inizio della trascrizione.
Anche qui prima dell’ evasione dal promotore c’e’ una
fase abortiva. L’ evasione negli eucarioti prevede due
passi che non c’erano nei batteri: idrolisi dell’ ATP (oltre
a quella necessaria per il melting) e a fosforilazione

94
TFII sta per transcription factor of Pol II mentre le varie lettere A,B,E,F,H... distinguono fra i vari TFII.
95
TBP si associa a circa 10 TAF diversi per legare le varie regioni del promotore.
96
Altri TAF presentano omologie strutturali con gli istoni

90
della polimerasi. Ricordiamo il dominio CTD posseduto dalla polimerasi: esso viene
comunemente chiamato ‘coda’ che contiene una serie di ripetizioni di una sequenza
eptapeptidica. Ciascuna ripetizione contiene dei siti fosforilabili – presentano un substrato
ideale per l’ attivita’ chinasica. TFIIH ha una subunita’ con l’ attivita’ chinasica – al momento che
questa fosforila la coda della polimerasi, quest’ ultima esce dalla fase iniziale ed entra in quella
di allungamento.
Come promesso, spieghiamo come TBP riesce a distorgere il DNA in prossimita’ della sequenza
TATA. TBP usa una regione estesa a foglietto beta per riconoscere il solco minore (che offre
poche informazioni di tipo chimico, ricordiamolo) della TATA-box97. Ma come si determina la
specificita’ allora?? La TBP si affida alla possibilita’ dellla sequenza TATA di subire una
distorsione strutturale specifica. Una volta legata,
la TBP fa allargare il solco minore fino ad assumere
una conformazione quasi piatta e piega il DNA di un
angolo di cca. 80 gradi. C’e’ un numero abbastanza
limitato di legami idrogeno fra la proteina e il solco
minore: la maggior parte della specificita’ e’ data da
due copie di catene laterali di fenilalanina che si
intercalano fra le basi di entrambe le estremita’
della sequenza TATA e che imponogono un forte
ripiegamento del DNA (come si capisce dall’
immagine). Tutto torna: le coppie di basi A:T sono
favorite in quanto distorte piu’ facilmente!
Quello che vediamo sotto invece e’ il complesso TFIIB-TBP-DNA descritto in precedenza:

97
Meccanismo alquanto insolito! Di solito per questi scopi vengono usate le alfa eliche. Il motivo di questo
meccanismo poco ortodosso e' la necessita' di piegare la struttura locale del DNA.

91
6.3.2: MECCANISMI IN VIVO
Finora abbiamo descritto l’ assemblaggio della polimerasi attorno alla molecola lineare del
DNA. Le cose si complicano ulteriormente (come che non siano state gia’ abbastanza
complicate...) se prendiamo in considerazione che il DNA eucariotico sia impacchettato attorno
agli istoni. Questa situazione rende piu’
difficile l’ asseblaggio della polimerasi sul
promotore, e per questo in vivo servono
anche altri elementi: il complesso del
Mediatore, le proteine trascrizionali
regolatrici dette attivatori e in molti casi
enzimi modificanti gli istoni. Tutti questi
sono ben visibili nell’ immagine a fianco.
Gli atttivatori aiutano il reclutamento della polimerasi sul promotore e ne stabilizzano il legame.
Come vediamo dall' immagine, questi attivatori sono legati da una parte al DNA e dall' altra con
il Mediatore ed enzimi di rimodellamento. Attraverso il Mediatore, riescono ad influire il
macchinario di trascrizione (polimerasi+vari fattori). Il Mediatore interagisce con la coda CTD
della subunita' β' della polimerasi mediando la sua interazione con gli attivatori. Si pensa che
diversi attivatori interagiscano con diverse subunita' del Mediatore per portare la polimerasi su
geni diversi.
Il Mediatore in se' e' una proteina composta da numerose (>20) subunita'98 delle quali poche
hanno funzioni ben definite. Basta una sola(Med 17 umano) per la trascrizione di praticamente
tutti i geni della Pol II! Si e' venuto all conclusione che vi siano varie forme del Mediatore a
seconda di come si associano le subunita' il che dipende dalle condizioni99. I studi cristallografici
condotti sulla parte del Mediatore del lievito detta 'testa' hanno dimostrato che questa formi
una struttura con 3 domini che sovrappone il fattore TFIIH alla coda CTD della polimerasi,
promuovendo la fosforilazione che serve per l'
evasione della polimerasi (che provoca la
dissociazione del Mediatore dalla polimerasi).
A fianco vediamo una mappa di densita'
elettronica e la struttura secondaria del punto di
interazione della testa del Mediatore con la coda
CTD.

98
Messi a confronto sia quello del lievito che quello umano sono molto grandi e strutturalmente simili.
99
Ci sono due ipotesi: o si tratta di artefatti oppure diverse forme sono coinvolte nella regolazione di gruppi diversi
di geni.

92
6.3.3: L’ ALLUNGAMENTO E LA TERMINAZIONE
Avendo descritto i meccanismi in vitro e in vivo concernenti l’ inizio della trascrizione, passiamo
ora all’ allungamento. In questa fase la polimerasi si libera della maggior parte dei fattori d’
inizio (e del Mediatore) e recluta altri fattori, fra cui fattori di maturazione100 e fattori di
allungamento quali TFIIS e SPT5. La fosforilazione della coda CTD provoca dunque uno scambio
fra i fattori d’ inizio e quelli neccessari per l’ allungamento e la maturazione. Dato che la CTD e’
adiacente al canale per l’ uscita dell’ mRNA neosintetizzato, i fattori di maturazione sono in
grado di modificarlo essendo legati alla coda.
E’ importante segnalare che la coda sia composta da una serie di ripetizioni della sequenza
amminoacidica YSPTSPS. Ci sono diverse proteine che stimolano l’ allungamento della Pol II: gli
attivatori trascrizionali reclutano sulla polimerasi la chinasi P-TEFb, che esegue 3 compiti:
1) Fosforila la Serina (S) alla posizione 2 della sequenza amminoacidica ripetuta
2) Fosforila e in questo modo attiva il fattore di allungamento SPT5
3) Recluta un terzo fattore di allungamento.
SPT5 si lega sulla punta della pinza, giusto sul punto d’ interazione della polimerasi con TFIIB –
questo potrebbe indicare che la funzione di SPT5 sia proprio quella di rompere il contatto della
polimerasi con il fattore di inizio.
C’e’ un’ altra classe di fattori di allungamento denominata famiglia ELL. Legandosi alla
polimerasi, queste proteine eliminano le soste temporanee dell’ enzima per garantire la
continuita’ del processo. TFIIS invece non ha effetto sull’ inizio pero’ svolge una funzione molto
simile alle proteine ELL. Esso aumenta la velocita’ di trascrizione diminuendo le soste della
polimerasi su certe sequenze (la polimerasi non trascrive tutte le sequenze con la stessa
velocita’). Un’ altra funzione di TFIIS e’ quella di contribuire all’ attivita’ piuttosto inneficiente
della correzione di errori effettuata dalla polimerasi – TFIIS stimola un’ attivita’ ribonucleasica
che non si trova nel sito attivo e che degrada localmente l’ RNA mal trascritto101.
Dobbiamo infine descrivere la terminazione della trascrizione. Prima della terminazione
avviene il processo di poliadenilazione che descriveremo a breve nel capitolo seguente. Quello
che ci interessa al momento e’ che dopo la poliadenilazione avviene la fase di terminazione
della trascrizione. Ci sono due modelli per descrivere la terminazione (non si e’ certi quale dei
due sia vero): modello a siluro e modello allosterico.
Quando il trascritto viene poliadenilato, viene rilasciato dalla polimerasi, che inizia a sintetizzare
un altro mRNA continuando con la trascrizione. Il modello a siluro prevede che ci sia un enzima
che degradi questo secondo trascritto non appena esce dal canale della polimerasi. Un’ RNasi

100
Che verra' descritta nel capitolo seguente.
101
Caratteristica simile all' editing idrolitico effettuato dai fattori Gre nei batteri.

93
denominata Rat1 nel lievito e Xrn2 nell’ uomo viene caricata dall proteina Rtt103 sull’
estremita’ dell’ acido ribonucleico. Questa RNasi e’ molto processiva e degrada il trascritto in
direzione 5’  3’ fino ad arrivare alla polimerasi. Probabilmente avviene una cosa simile come
per la terminazione Rho-dipendente nei batteri: Rat1 spinge la polimerasi e le sottrae il
trascritto. Ci serve l’ aiuto di altre proteine pero’ in quanto in vitro Rat1 e’ incapace di farlo da
solo.
Il modello allosterico invece prevede un cambiamento conformazionale della polimerasi che ne
diminuirebbe di molto la processivita’ e che indurrebbe conseguentemente la terminazione.
Questo cambiamento potrebbe essere conseguenza del rilascio di proteine che prima c’erano
sulla CTD o dall’ interazione della CTD con delle proteine. I due modelli sono raffiguratti sotto
(a-modello a torpedo ; b-modello allosterico):

6.4: LA TRASCRIZIONE DELL’ RNA POLIMERASI I E III


Finora abbiamo analizzato la trascrizione effettuata dalla Pol II che trascrive i geni codificanti
per le proteine. Ci sono numerosi geni che codificano per RNA specializzatti. Le ricerche
moderne dimostrano velocemente le numerosissime funzioni dei vari tipi di RNA che stanno
diventando i protagonisti di una serie di progetti di ricerca.
Sia la Pol I che la Pol III usano il loro grupo specifico di fattori generali di trascrizione. Uno pero’
e’ universale, il TBP! Comunque, anche parecchi altri enzimi coinvolti nella trascrizione di
queste polimerasi sono molto simili ai fattori della Pol II.

94
L’ RNA polimerasi I trascrive un solo gene, quello che codifica per il precursore dell’ RNA
ribosomale (rRNA). Nella cellula ci sono numerose copie di questo gene, e in piu’ e’ il gene
espresso a un livello molto piu’ alto di qualsiasi altro – questo potrebbe spiegare perche’ esso
ha la sua polimerasi specializzata.
Il promotore di questo gene e’
composto dall’ elemento centrale
(core) e dall’ UCE (upstream control
element). L’ inizio della trascrizione
necessita di altri due fattori chiamati
SL1 e UBF. SL1 comprende TBP e 3 TAF
specifici per la Pol I. Questo complesso
si lega al core: SL1 lega pero’ il DNA solo in presenza di UBF che si lega all’ UCE.
La RNA Pol III sintetizza tRNA, snRNA, 5S rRNA, SINE, etc. La maggioranza dei promotori della
Pol III si trova a valle del sito d' inizio (che e' insolito).
Il promotore per il gene codificante il tRNA e' ad
esempio composto da due regioni: Box A e Box B.
In questo caso i fattori di trascrizione vengono
chiamati TFIIB e TFIIC. TFIIC si posiziona sul
promotore, recluta TFIIB contenente TBP. TFIIB
recluta la polimerasi che inizia rimuovendo TFIIC
dal DNA stampo.

6.5: CONCLUSIONI SULLA TRASCRIZIONE


In questo capitolo abbiamo analizzato la prima tappa di un grande processo cellulare
denominato espressione genica. Il dogma centrale della biologia prevede che i geni conservati
nel genoma vengano trascritti nella molecola di RNA che poi converte quest' informazione in
unita' cellulari fondamentali – le proteine. Come abbiamo gia' accennato lungo il capitolo, le
nuove ricerche si concentrano sempre di piu' sui numerosissimi ruoli emergenti dell' RNA. Il
compito di messaggero e' solo una delle diverse missioni di questa straordinaria molecola. Tanti
geni che non codificano per proteine servono pero' a produrre unita' funzionali di RNA di vario
tipo, che per lo piu' (almeno per quanto si sa finora) svolgono funzioni regolative. La descrizione
di questi RNA esula pero' dall' obiettivo di questo corso, il cui fine e' di presentare il classico
dogma centrale della biologia molecolare, ovvero il flusso dell' informazione in senso DNA-RNA-
proteine.
Dopo aver delineato in dettaglio il processo molecolare della trascrizione e prima di procedere
con la maturazione e con la traduzione del messaggero, conforntiamo un attimo l' rganizzazione
procariotica e quella eucariotica dei geni.

95
Nei procarioti e' fondamentale delineare l' esistenza di operoni – insiemi di geni che codificano
per le proteine coinvolte in un determinato processo. Ad es. i geni che servono per la sintesi
degli enzimi coinvolti nella biosintesi dell' amminoacido triptofano fanno parte dell' operone
del triptofano. I geni appartenenti a un operone hanno lo stesso promotore, e sono dunque
trascritti tutti in un colpo dall' mRNA che in questo caso si chiama RNA poli-cistronico.
Ricordiamo anche che nei procarioti l' RNA, non appena viene prodotto, viene subito anche
tradotto. L' RNA poli-cistronico produce dunque piu' di una proteina!
Negli eucarioti invece tutto un' altra storia: non esistono gli operoni descritti per i procarioti,
bensi' i geni che codificano per enzimi coinvolti nello stesso processo si trovano anche a grandi
distanze. In questo caso ogni gene ha il suo promotore e l' RNA prodotto prende il nome di RNA
mono-cistronico. In piu' negli eucarioti la trascrizione e traduzione sono sfasate data la
presenza del nucleo. L' RNA mono-cistronico e' dunque in grado di produrre una proteina sola.
L' immagine schematizza quanto detto:

Piu’ tardi nel corso torneremo alla trascrizione e descriveremo in dettaglio come sia regolata l’
espressione dei geni a livello trascrizionale, sia nei procarioti che negli eucarioti.
Ora invece procediamo con il viaggio dell’ mRNA e descriviamo come l’ mRNA sintetizzato con
la trascrizione viene processato prima di venir tradotto in proteine.

96
CAPITOLO 7: LA MATURAZIONE E IL PROCESSAMENTO DELL’
RNA EUCARIOTICO: CAPPING, POLIADENILAZIONE E SPLICING
L' mRNA eucariotico, prima di essere trasportato fuori dal nucleo per essere tradotto, passa
attraverso una serie di modificazioni che lo trasformano nella sua forma matura. L' mRNA
eucariotico e' subordinato essenzialmente a tre tipi di modificazioni coinvolti nella maturazione
dell' mRNA: capping, splicing e poliadenilazione.
Il processo del capping al 5' avviene durante la fase di allungamento descritta nel capitolo
precedente. Dopo la trascrizione ,invece, avviene il processo di splicing. L' mRNA che e' passato
attraverso il processo di capping ma non e' stato ancora soggetto allo splicing viene detto pre-
mRNA (o mRNA precursore). La poliadenilazione al 3' e' invece conessa strettamente con la
terminazione della trascrizione. Dopo queste modificazioni l' mRNA maturo e' pronto per
essere tradotto.
Prima descriveremo brevemente come funzionano il capping e la poliadenilazione e poi ci
dedicheremo in dettaglio al fenomeno dello splicing descrivendone i meccanismi e le
implicazioni.

7.1: CAPPING AL 5’ E POLIADENILAZIONE


Ricordiamo dal capitolo precedente come la chinasi TFIIH fosforila la coda CTD della polimerasi
(S5). La CTD fosforilata recluta a sua volta gli enzimi necessari per il capping e lo splicing102. Il
capping consiste nel rivestimento dell’ estremita’ 5’ dell’ mRNA – gli mRNA senza questo
rivestimento verranno degradati da enzimi digestivi. Questo rivestimento e’ dunque la
condizione necessaria perche’ il messaggero arrivi a essere tradotto. Il meccanismo del capping
consiste nell’ aggiunta di una guanina metilata sull’ estremita’ 5’ dell’ mRNA, mediante un
legame insolito 5’-5’ coinvolgente 3 fosfati.

102
In realta' la SPT5 stimola il capping reclutando gli enzimi.

97
Il meccanismo coinvolge tre passaggi e tre enzimi
distinti. Nel primo passaggio l’ RNA trifosfatasi elimina il
fosfato gamma dal 5’ del trascritto (vedere a destra).
Nel passaggio successivo l’ enzima guaniltransferasi
aggiunge la componente GMP al trascritto che termina
ora col fosfato beta. Il modo in cui lo fa e’ rappresentato
sotto: a partire da GTP si forma un complesso enzima-
GMP con il rilascio di due fosfati; successivamente l’
enzima trasferisce il GMP al fosfato beta.
Il terzo passaggio e’ effettuato dalla metiltransferasi che
aggiunge un gruppo metilico alla guanina. La risultante
struttura si chiama Cap al 5’ e serve a due cose:
- Recluta il ribosoma sull’ mRNA
- Protegge l’ mRNA da enzimi digestivi

Vediamo qui il meccanismo di


catalisi effettuata dalla
guaniltransferasi. Il soggetto di
questo meccanismo e’ l’ istidina
il cui azoto dell’ anello va a
legarsi col fosfato alfa del GTP il
che causa lo stacco dei due
fosfati beta e gamma con
formazione del complesso
enzima-GMP . L’ ossigeno del
fosfato beta del trascritto (in
rosso) reagisce poi col fosforo del
fosfato e demolisce il complesso
enzima-GMP.

98
La poliadenilazione invece segue lo splicing, ma data la
sua maggiore semplicita’ rispetto allo splicing, la
descriveremo qui. Inanzitutto essa e’ strettamente
connessa con la fine della trascrizione e ancora una volta
il CTD e’ coinvolto nel reclutamento di enzimi necessari.
Una volta che la Pol ha raggiunto l’ estremita’ del gene,
trascrive delle sequenze specifiche che innescano il
traferimento sull’ RNA di enzimi della poliadenilazione il
che causa 4 eventi che si svolgono nel modo seguente: i
complessi CPSF e CSTF vengono trasportati dal CTD all’
RNA quando la Pol e’ vicino alla fine del gene. Le
sequenze che lo stimolano sono dette segnali di
poliadenilazione. A questo punto vengono reclutate altre
proteine che tagliano l’ mRNA – le regioni tagliate sono
ricche di sequenze GU. La poliadenilazione stessa e’
mediata dall’ enzima poli-A polimerasi (PAP) che aggiunge
cca. 200 adenine all’ estremita’ 3’ prodotta dopo il taglio.
Essa lavora con l’ ATP e il suo funzionamento e’ identico a
quello della polimerasi normale, ma lavora senza
stampo103! Non e’ ben chiaro che cosa determini la
lunghezza della sequenza adeninica.

7.2: LO SPLICING
Abbiamo descritto due dei tre processi di maturazione dell’ RNA. Cronologicamente, lo splicing
sta in mezzo fra la formazione del Cap 5’ e la poliadenilazione.
Per capire i meccanismi dello splicing, dobbiamo prima dire che ogni gene eucariotico sia
composto da pezzi detti esoni e altri chiamati introni. Gli esoni non sono nient’ altro che
sequenze codificanti per le proteine mentre gli introni sono le sequenze interposte fra gli esoni
che non codificano104. Trovandosi pero’ all’ interno del gene, anche gli introni vengono trascritti
in RNA. E’ facilmente intuibile dunque che gli introni debbano essere eliminati dall’ mRNA prima
che questo venga tradotto. Il meccanismo di splicing serve appunto per eliminarli e per unire
gli esoni, creando in questo modo una molecola di RNA maturo.

103
La sequenza poli-A si trova dunque solo sull' RNA e non nel DNA.
104
In realta' la definizione piu' corretta sarebbe che l' esone sia qualunque regione che si trovi all' interno dell'
mRNA maturo.

99
Quest’ immagine rappresenta un tipico gene eucariotico, in cui la regione codificante e’
interrotta da 3 introni che lo dividono cosi’ in 4 esoni. Il numero di introni presenti in un gene
puo’ variare molto, da 1 fino anche a 363 (gene umano Titin). Il numero medio di introni per
gene aumenta con l’ aumentare della complessita’ dell’ organismo105. Anche le lunghezze dei
due sono variabili ma in genere gli introni sono piu’ lunghi degli esoni che separano (gli esoni
sono in genere dell’ ordine di 150 nt, gli introni arrivano anche a 800 000nt).
La molecola di pre-mRNA viene anche detta trascritto primario e contiene sia le porzioni
esoniche che quelle introniche. Possiamo intuire che lo splicing deve essere un meccanismo
molto preciso – affinche’ si abbia una corretta traduzione, e’ fondamentale che neanche una
base esonica venga persa! E’ degno di nota anche il fatto che gli introni si possono trovare in tre
fasi diverse. Ricordiamo che la porzione codificante del genoma e’ formata da codoni o triplette
(ognuno dei quali codifica per un amminoacido). L’ introne puo’ situarsi giusto fra due codoni, e
allora si dice che si trovi nella fase 0. Se si trovano invece all’ interno di un codone, si dice che
siano nella fase 1 se dividono il primo nucleotide dagli altri due, oppure nella fase 2 se dividono
i primi due dal terzo.

105
Una possibile spiegazione e' quella che abbiamo gia' citato spiegando il genoma non codificante- gli introni sono
appunto pezzi non codificanti del genoma che potrebbero servire da 'tampone' per le mutazioni cosi' da ridurre l'
insorgimento di quest' ultime in porzioni genomiche codificanti.

100
Alcuni pre–mRNA possono essere tagliati in modi diversi. In questo modo da uno specifico pre-
mRNA possono venir prodotti mRNA maturi contenenti diverse combinazioni di esoni. Questo
meccanismo viene detto splicing alternativo: grazie ad esso un unico gene puo’ produrre
diverse forme polipeptidiche denominate isoforme. Ci occuperemo in dettaglio di questo
fenomeno nella seconda parte del capitolo.
Per capire il fenomeno dello splicing, dobbiamo spezzetare il problema in tre domande chiave:
- Come vengono distinti gli introni dagli esoni?
- Come vengono uniti gli esoni?
- In che ordine vengono uniti gli esoni?

7.2.1: LA CHIMICA DELLO SPLICING


I confini fra gli esoni e gli introni sono marcati da sequenze nucleotidiche specifiche che
determinano la posizione dove avverra’ lo splicing. Si parla di siti di splicing (5’ o 3’). Una terza
sequenza, detta punto di ramificazione, e’ anche importante per la chimica dello splicing ed e’
seguita da un segmento di polipirimidina. L’ immagine sottostante mostra inoltre le sequenze
consenso106 di ciascun elemento:

Vediamo la chimica del problema: si tratta di 2 reazioni successive di transesterificazione con


rottura e formazione di legami fosfodiesterici. La prima reazione parte dal 2' OH della A
conservata nel punto di ramificazione. Questo gruppo svolge un attacco nucleofilo sul gruppo
fosfato della G conservata nel sito di splicing 5': si tratta di una reazione SN2107 che procede
attraverso un intermedio stabilizzato dagli enzimi coinvolti, come si puo' vedere a pagina
seguente. Una volta libera, l' estremita' 5' dell' introne viene unita alla A del punto di
ramificazione: si forma qui la cosidetta giunzione a tre vie dove c'e' la presenza di 3 legami
fosfodiesterici. L' esone 5' e' il gruppo uscente di questa prima reazione. Nella seconda
reazione, il suo 3' OH diventa nucleofilo e attacca il gruppo fosfato al sito di splicing 3'. Questa
reazione non solo unisce i due esoni, bensi' libera l' introne che funge da gruppo uscente.
Vediamo che il numero di legami prima e dopo la reazione e' uguale, pertanto non c'e' bisogno
di spendere energia. Molta energia viene comunque spesa per l' assemblaggio del macchinario

106
Si tratta di sequenze altamente conservate che si trovano tutte all' interno degli introni, il che e' logico, avendo
in testa che le sequenze esoniche rispondono alla necessita' di codificare gli amminoacidi.
107
Chimica organica – si tratta della reazione a un singolo stato di transizione senza intermedi reattivi.

101
che vedremo nel prossimo paragrafo. Le immagini mostrano la chimica dello splicing appena
descritta:

Inoltre, qui sotto la reazione di transesterificazione mediante un unico stato di transizione:

7.2.2: IL MACCHINARIO DELLO SPLICEOSOMA


Le reazioni descritte sono mediate da un enorme macchinario ribo-proteico chiamato
spliceosoma. Questo macchinario idrolizza le molecole di ATP (per l’ assemblaggio, non per la
transesterificazione); inoltre, un numero cospicuo di funzioni e’ svolto dalla componente a RNA.
Questa componente e’ formata da 5 piccoli RNA nucleari (o snRNAs): U1,U2,U4,U5,U6. I
complessi fra questi RNA e proteine sono detti piccole ribonucleoproteine nucleari o snRNPs.
snRNPs diverse entrano ed escono in momenti diversi e hanno funzioni diverse nel processo.

102
Dello spliceosoma fanno parte anche altre proteine che non sono snRNPs. Le snRNPs svolgono
3 funzioni: riconoscono il sito di splicing e il punto di ramificazione, portano questi siti vicini e
catalizzano il taglio e la giunzione dell’ RNA. Per svolgere questi compiti sono fondamentali le
varie interazioni, rappresentate nell’ immagine:

Vediamo come ad esempio snRNA U1 riconosce il sito di splicing 5'. Lo stesso sito verra' poi
riconosciuto da U6. Il punto di ramificazione invece puo' essere riconosciuto da U2. Vediamo
poi come l' interazione fra U2 e U6 avvicina il sito di splicing 5' e il punto di ramificazione. In
questo modo lo spliceosoma media le diverse fasi.

7.2.3: LE VIE DELLO SPLICING


Vediamo ora un ordine canonico di eventi nel processo di splicing. Il sito di splicing 5’ viene
riconosciuto da snRNP U1. La proteina U2AF ha due subunita’, una legata al segmento
polipirimidinico e l’ altra al sito di splicing 3’. La prima aiuta la proteina BBP a legarsi al punto di
ramificazione. Questo complesso e’ chiamato complesso precoce E.
U2AF aiuta il legame di snRNP U2 al punto di ramificazione e la rimozione di BBP. Quest'
interazione con U2 spinge fuori il residuo A e crea una protuberanza: in questo modo, A diventa
non accopiata e disponibile per la reazione con il sito di splicing 5' (prima transesterificazione).
Questo si chiama complesso A.
Ora bisogna riarrangiare il complesso A: le snRNPs U4 e U6, insieme alla snRNP U5, formano la
particella a tre snRNP, dove U5 e' legata alle altre due mediante interazione proteina proteina.

103
La particella si unisce al complesso A che diventa ora
complesso B. A questo punto U1 e' rimpiazzato da U6 al sito
di splicing 5': questo implica la rottura del legame RNA-RNA
fra il pre-mRNA e U1. Questo sito viene occupato poi da U6.
Ora che l' assemblaggio e' completato, inizia la catalisi che
avviene nel modo seguente: U4 viene eliminato dal
complesso, fatto che permette l' interazione fra U6 e U2.
Quest' interazione forma il sito attivo della catalisi, ma
assicura anche che il substrato (pre-mRNA) venga posizionato
correttamente108. La formazione del sito attivo avvicina il sito
di splicing 5' e il punto di ramificazione favorendo la prima
transesterificazione. La seconda reazione e' aiutata invece
dall' snRNP U5 che avvicina i due esoni. Alla fine, il complesso
viene rilasciato.
Questo e’ un esempio canonico di splicing, ci sono poi molte
varianti. Bisogna poi commentare il fatto che questo processo
avvenga sempre in un’ unica direzione: l’ equilibrio chimico e’
spostato dunque ragionevolmente a destra. Questa
unidirezionalita’ dello splicing e’ determinata dall’ immediato
disassemblaggio del macchinario dopo la seconda reazione, il
quale e’ a sua volta mediato da un’ elicasi appartenente alla
famiglia di DEAD-box, chiamata Prp22. Essa stacca l’ RNA maturato dallo spliceosoma109.
Ci sono poi delle varianti di splicing che implicano uno spliceosoma
alternativo. Nella variante detta spliceosoma minore abbiamo U11 e
U12 che svolgono le medesime funzioni di U1 e U2 ma riconoscono
sequenze diverse. U4 e U6, anche se hanno lo stesso nome come nel
modello canonico, sono in realta’ snRNPs diverse da quelle originali. U5
e’ invece uguale in entrambe le varianti. Questo spliceosoma riconosce
introni rari con sequenze consenso diverse (sono pero’ contenuti in
cca. 800 geni umani). Anche se le sequenze sono diverse, il
meccanismo chimico e’ esattamente uguale a quello descritto per la
variante standard.
Si e’ anche scoperto che mutazioni su snRNA minori siano associate a
patologie genetiche rare nell’ uomo.

108
Il fatto che il sito attivo sia composto quasi solo dall' RNA e che si formi solo in questo determinato momento
viene definito 'abbastanza incredibile' dal Watson. E' questo uno degli esempi di come l' RNA possa essere
polivalente e di come la ricerca sui suoi ruoli possa portare a risultanti esaltanti.
109
Le mutazioni di quest' elicasi possono causare lo spostamento dell' equilibrio a sinistra.

104
La seguente tabella mostra le tre principali classi di splicing nella cellula:

Finora abbiamo analizzato lo splicing che succede grazie allo spliceosoma, ora stiamo a vedere i
cosidetti introni self-splicing del gruppo I e II che non necessitano di tutto questo
macchinario110. Questi introni sono in grado di autorimuoversi dal pre-mRNA. Si vede che gli
introni del gruppo II abbiano la stessa chimica del modello descritto prima, producendo
intermedi identici a quelli gia visti. La storia cambia con gli introni del gruppo I: essi seguono un
percorso diverso. Inanzitutto usano un residuo G invece di A. Il 3’ OH di questo G viene
presentato al sito 5’ di splicing, e avvengono le due reazioni di transesterificazione. Questi
introni contengono una sequenza di guida interna che garantisce che G agisca sul sito di splicing
5’: la maggior parte della sequenza di questi introni e’ cruciale per il giusto esito dello splicing.
In vivo, molte proteine aiutano il corretto ripiegamento intronico; in vitro invece, le alte
concentrazioni saline (che grazie a ioni positivi influiscono chimicamente sul polimero intronico)
compensano quest’ azione proteica schermando le cariche negative e favorendo un giusto
ripiegamento.

7.2.4: VARIANTI DI SPLICING


Prima di vedere lo splicing alternativo, parliamo di un modello detto splicing in trans: esso
implica che gli esoni appartenenti a molecole di RNA diverse si uniscano in un’ unica molecola
di RNA maturo. Il macchinario dello spliceosoma e’ uguale ad eccezione di U1 che non serve per
questo modello.

110
La loro esistenza e' un' ulteriore prova dell' ipotesi che all' inizio dell' evoluzione degli organismi moderni la
maggior parte delle funzioni catalitiche sia stata a carico degli RNA.

105
7.2.4.1: SPLICING ALTERNATIVO
Grazie a questo tipo di splicing, un singolo gene puo’ dare origine a prodotti diversi. Il concetto
e’ semplice: il pre-RNA viene tagliato in modi diversi per dare poi origine a proteine diverse.
Molto spesso questo e’ un processo regolato, per controllare la produzione di certi tipi di
proteine in diversi gruppi cellulari. La seguente figura mostra le varie varianti di splicing
alternativo:

Ad esempio, vediamo che un esone possa essere esteso, sciegliendo una regione di taglio
diversa, sia essa a valle del sito al 5’ o a monte del sito al 3’. A volte gli introni possono essere
mantenuti nel messaggero maturo. Abbiamo anche casi dove certi esoni vengono saltati.
Alcune volte lo splicing alternativo deriva dalla trascrizione di un gene a partire da piu’
promotori, portando il trascritto ad avere un esone al 5’
non presente nell’ altro messaggero. Allo stesso modo, siti
di poliadenilazione alternativi permettono ad alcuni
trascritti di un dato gene di avere esoni aggiuntivi al 3’.
Sotto invece vediamo un buon esempio di esone ‘allungato’. Si tratta dell’ antigene T del virus
di scimmia SV40. Il gene per l’ antigene T codifica per due prodotti diversi, perche’ esistono due
siti al 5’ dove puo’ avvenire il taglio. Nel primo caso esso avviene giusto in modo da ritagliare l’
intero introne. Nel secondo caso pero’ un pezzo di introne rimane nel trascritto. Questo introne
contiene comunque una sequenza
STOP (arancione) nel modo da
bloccare la traduzione dell’ introne.
Le due forme di trascritto hanno
funzioni diverse. Il rapporto nella
quantita’ delle due forme dipende
dal livello della proteina regolatrice

106
dello splicing SF2/ASF. Questo e’ un ottimo esempio di come un singolo gene possa codificare
proteine con funzioni diverse per addattarsi alle condizioni attuali.
La selezione degli esoni e’ mutualmente esclusiva: in altre parole, quando uno viene ‘scelto’ l’
altro viene ‘escluso’ dal trascritto maturo. Affinche’ ci sia questa esclusione, esistono alcuni
meccanismi.
Ingombro sterico: Se i siti di taglio nell’ introne sono molto vicini, i fattori dello splicing non si
possono legare a entrambi contemporaneamente. Nella
figura b si vede che il legame di U1 al sito di taglio 5’ dell’
introne fra gli esoni 2 e 3 impedisce il legame di U2 allo
stesso introne. In altre parole, se un introne e’ molto
corto, gli esoni adiacenti saranno molto probabilmente
alternativi.

Combinazione di siti di taglio primari e secondari: Se un introne contiene la combinazione di


sequenze riconosciute rispettivamente dallo spliceosoma classico e quello minore, gli esoni che
esso separa saranno automaticamente
alternativi. L’ immagine a fianco schematizza
bene questo modello: gli esoni 2 e 3 sono
alternativi (si escludono mutualmente)

Decadimento mediato da un codone nonsenso: Questo meccanismo fa si’ che siano stabili solo
gli mRNA con uno dei due esoni (mai con nessuno o con entrambi). Questo meccanismo si
verifica quando l’ unione di entrambi gli esoni porta a un mRNA con un codone di terminazione
prematuro (questi messaggeri vengono dunque distrutti).

107
Lo splicing alternativo e' regolato da
proteine che possono essere attivatori o
repressori. Queste proteine si legano a dei
siti specifici chiamati enhancer o silenziatori
esonici o intronici di splicing (ESE, ISE, ESS
O ISS). Queste proteine sono importanti per
dirigere il macchinario anche quando non si
tratta di splicing alternativo. Nello splicing
alternativo regolato queste proteine
rivestono pero' un ruolo fondamentale.Esse
portano il macchinario in diversi siti a
seconda delle condizioni. La figura
rappresenta due situazioni diverse: una in
presenza di repressore e l' altra in presenza
dell' attivatore. Un esempio di attivatore e'
la proteina SR: essa si lega a un motivo di
riconoscimento sull' RNA: un altro dominio, detto dominio RS, media le interazioni fra la
proteina SR e il macchinario dello splicing, reclutandolo su un sito di splicing vicino. La maggior
parte dei silenziatori viene riconosciuta da hnRNPs ovvero ribonucleoproteine nucleari
eterogenee: esse legano l' RNA ma non hanno il dominio RS e dunque non reclutano il
macchinario ma allo stesso tempo bloccano i siti specifici impedendo il loro utilizzo. Un esempio
di repressore dello splicing nei mammiferi e' la proteina PTB della famiglia delle hnRNP: essa si
lega all' RNA vicino all' esone e in questo modo interagisce con U1, impedendo che U1 recluti
altri componenti del macchinario: per questo motivo, lo spliceosoma non si forma e non
avviene lo splicing in quel punto.

7.2.5: VANTAGGI DEGLI ESONI


Possedere all’ interno del genoma sia introni che esoni e’ vantaggioso dal momento che lo
splicing presenta un’ ulteriore tappa possibile per la regolazione dell’ espressione genica.
Abbiamo visto come un singolo gene possa dare vita a piu’ proteine diverse grazie proprio allo
splicing. E’ inoltre osservabile un altro fenomeno, quello del rimescolamento degli esoni, che
crea nuovi geni mescolando gli esoni di altri geni. Si e’ arrivati a questa scoperta esplorando il
gene di LDL: si e’ visto che alcuni domini di questa proteina corrispondano esattamente a dei
domini di proteine completamente diverse. Questo e’ causato dal fatto che molto spesso un
esone codifica per un dominio strutturale.

108
Bisogna anche ricordare che diverse patologie sono dovute a errori nello splicing. Delle
mutazioni puntiformi possono modificare il sito di splicing e interferire col meccanismo
corretto. Un esempio di patologia di questo genere e’ la beta-talassemia: un tipo di questa
malattia e’ causato dalla mutazione sul primo introne del gene per la beta-globina: per questo
motivo, si genera un trascritto anomalo (cattiva produzione di catene proteiche beta) e
conseguentemente una proteina che non svolge bene il suo compito.
Una volta terminato lo splicing, e’ finito il processo di maturazione dell’ mRNA e si forma il
trascritto maturo. Esso verra’ esportato fuori dal nucleo attraverso pori nucleari grazie a
specifiche proteine, e verra’ tradotto in proteine nel citoplasma, attraverso il meccanismo di
traduzione.

109
CAPITOLO 8: LA TRADUZIONE E IL CODICE GENETICO
Siamo giunti all’ ultimo stadio del processo di espressione genica, quello relativo alla sintesi
proteica, denominato traduzione. Oltre ad essere uno dei processi piu’ conservati in tutti gli
organismi, e’ anche uno dei piu’ dispendiosi in termini energetici, in quanto implica l’ azione di
oltre 100 proteine e RNA. Il flusso di informazione nella traduzione e’ una sfida molto piu’
impegnativa di quanto lo sia quella tra DNA e RNA, in primis a causa del fatto che non esiste
una complementarieta’ chimica fra gli amminoacidi e le basi dell’ RNA (a differenza di quanto
intercorre fra DNA e RNA).
Il macchinario responsabile della traduzione del linguaggio dell’ mRNA in quello proteico e’
costituito da 4 componenti principali:
- mRNA
- tRNA (RNA transfer)
- amminoacil-tRNA sintetasi
- ribosoma
Questi componenti svolgono insieme un compito incredibile: traducono un codice scritto in un
‘alfabeto’ composto da solo 4 basi nel linguaggio composto dai 20 amminoacidi, che formano le
proteine. Prima di descrivere i meccanismi della traduzione, descriveremo ognuno dei 4
componenti del macchinario per poi poterli vedere in azione.

8.1: RNA MESSAGGERO


Abbiamo visto la sua sintesi e il processamento, ora bisogna descriverlo dal punto di vista della
traduzione. L’ mRNA contiene l’ informazione che deve essere interpretata dal macchinario e
costituisce lo stampo per la traduzione. La regione che codifica per la proteina e’ formata da
una serie ordinata di elementi specificanti l’ ordine degli amminoacidi chiamati codoni, ognuno
dei quali e’ composto da tre nucleotidi. Questa regione contenente codoni viene chiamata open
reading frame (ORF, o cornice di lettura aperta). Ogni ORF corrisponde a una singola proteina.
E’ importante ricordare che le estremita’ di ORF non corrispondono quasi mai alle estremita’
dell’ mRNA (ci sono pertanto pezzi del trascritto maturo che comunque non vengono usati per
la sintesi proteica). La traduzione inizia all’ estremita’ 5’ dell’ ORF e continua, codone per
codone, verso l’ estremita’ 3’. Il primo codone dell’ ORF e’ detto codone d’ inzio (start codon), l’
ultimo e’ chiamato codone di stop/di terminazione (stop codon). Il codone d’ inizio sia nei
procarioti111 che negli eucarioti e’ AUG e codifica per la metionina. Il compito del codone d’
inizio non e’ solo quello di codificare il primo amminoacido del polipeptide ma anche di definire
la cornice (fase) di lettura dei codoni successivi. Come si vede chiaramente dall’ immagine a
pagina seguente, ogni frammento di mRNA potrebbe essere tradotto in tre diverse fasi:

111
Nei procarioti viene anche usato GUG e talvolta UUG.

110
I codoni di stop sono invece 3 (tutti in direzione 5’ –> 3’):
- UAG
- UGA
- UAA
Gli mRNA eucariotici contengono quasi sempre una sola ORF e pertanto li definiamo
monocistronici (paragrafo 6.5), quelli procariotici invece sono dotati molto spesso di due o piu’
ORF e allora si usa il termine di mRNA policistronico. Vediamo ora di descrivere le differenze
che intercorrono a proposito dell’ mRNA maturo negli eucarioti e nei procarioti:
Procarioti: In primis bisogna reclutare il ribosoma sull’ mRNA, perche’ abbia luogo la
traduzione. Molte ORF procariotiche hanno una breve sequenza a monte del codone d’ inizio
detta sito di legame per il ribosoma (RBS), definita anche come sequenza di Shine-Dalgarno.
Questa sequenza s’ appaia con una complementare dell’ RNA ribosomiale 16S (uno dei
componenti del ribosoma, descriveremo in seguito). La sequenza Shine-Dalgarno e’ solitamente
composta nel modo 5’-AGGAGG-3’. L’ entita’ di complementarieta’ e la spaziatura dal codone
saranno i fattori determinanti l’ efficienza della traduzione. Nei procarioti abbiamo anche il
fenomeno della traduzione accoppiata, dove un singolo ribosoma traduce piu’ ORF, uno dopo l’
altro (data la natura policistronica).
Eucarioti: Gli mRNA eucariotici reclutano i ribosomi mediante il Cap al 5’ che abbiamo descritto
nel capitolo precedente. Una volta legato, il ribosoma si sposta in direzione 5’  3’ mediante
un processo detto scanning (ispezione della sequenza), fino ad incontrare 5’-AUG-3’. C’e’ poi la
presenza, in alcuni mRNA, di una pase purinica a monte del codone d’ inizio e di una guanina
immediatamente a valle: 5’-G/ANNAUGG-3’. Questa e’ definita come sequenza di Kozak. Si
pensa che essa interagisca con il tRNA iniziatore, favorendo la traduzione. Anche la coda poli-A,
pur essendo all’ estremita’ 3’, gioca un ruolo nella stabilizzazione dell’ mRNA.

8.2: RNA transfer


L’ RNA transfer, noto come tRNA, e’ il mediatore fra il codice nucleotidico e quello
amminoacidico: questa molecola svolge la funzione essenziale nella sintesi proteica. Il tRNA
riconosce il codone sull’ mRNA e ne associa l’ amminoacido appropriato. Esistono molte varianti
del tRNA, ma a ognuna e’ associato uno specifico amminoacido e ognuna si associa con un

111
numero definito di codoni. Nonostante questo, tutte le
varianti sono fra loro molto simili: ogni tRNA e’
composto da 75-95 ribonucleotidi, e ogni molecola
presenta al suo interno delle basi
insolite (sorprendentemente): esse
vengono prodotte post-
trascrizionalmente da enzimi che
Formazione della pseudouridina
modificano le normali basi della catena
poliribonucleotidica. Si tratta di due
derivati dell’ uridina, la pseudouridina e la diidrouridina. La prima deriva per
isomerizzazione, la seconda per riduzione enzimatica del doppio legame. La Diidrouridina

Anche se queste basi non sono fondamentali per la funzione del tRNA, si e’
notato che le cellule con tRNA non contenente queste basi hanno un tasso di crescita ridotto.
La forma del tRNA e’ molto particolare. Inanzitutto, esso presenta zone di
autocomplementarieta’ dove si formano tratti a doppia elica uniti dall’ appaiamento fra le basi.
La struttura secondaria puo’ pertanto essere paragonata a quella di un trifoglio. Descriviamone
ora le componenti piu’ importanti:
Stelo accettore: sito di aggancio dell’ amminoacido, dato dall’
accoppiamento della regione 5’ terminale e 3’ terminale. La
sequenza 5’-CCA-3’ protrude da questa struttura.
Ansa ψU: chiamata cosi’ per la presenza della base ψU
(pseudouridina) nell’ ansa. E’ frequente la sequenza 5’-T ψUCG-3’
Ansa D: presenza di diidrouridine nella sua struttura
Ansa variabile: lunghezza variabile da 3 a 21 basi
Ansa dell’ anticodone: contiene l’ anticodone, l’ elemento
decodificante di tre nucleotidi del codone.
La cristallografia a raggi X rivela pero’ una struttura
terziaria a forma di L dove l’ anticodone e il stelo accettore
si trovano sulle parti opposte della molecola. In questa
struttura, non solo si formano appaiamenti di Watson e
Crick bensi’ anche ponti idrogeno fra le basi distanti in
struttura primaria (similmente come accade fra gli
amminoacidi nelle proteine).
L’ immagine a destra mostra questa struttura e individua
le varie parti descritte in struttura bidimensionale.

112
8.3: AZIONE DELL’ AMMINOACIL-tRNA SINTETASI
La molecola di tRNA e’ carica se ad essa e’ attaccato l’ amminoacido (mediante lo stelo
accetore). L’ enzima amminoacil-tRNA sintetasi catalizza la formazione di un legame acilico112
tra il gruppo carbossile dell’ amminoacido e il gruppo ossidrile 2’ o 3’ dell’ A dello stelo
accettore.
A destra vediamo il meccanismo a due stadi: il
primo stadio e' l' adenililazione, in cui l'
amminoacido reagisce con l' ATP e diventa
adenililato, con conseguente rilascio del
pirofosfato. La forza principale che guida questo
primo stadio e' la successiva idrolisi del pirofosfato
da parte della pirofosfatasi (si e' gia' vista questa
reazione). Il risultato e' che l' amminoacido e' legato
all' acido adenilico mediante un legame estere ad
alta energia. Il secondo passaggio della reazione e' il
caricamento del tRNA in cui l' amminoacido (in
rapporto con la sintetasi) reagisce con il tRNA. Il
risultato di questo stadio e' il trasferimento dell'
amminoacido all' estremita' 3' del tRNA con il
simultaneo rilascio di AMP. Anche il legame fra il
tRNA e l' amminoacido e' un legame ad alta
energia.
La classe I di sintetasi legano l' amminoacido al
2'OH del tRNA, la classe II invece al 3'OH. Dopo lo
stacco della sintetasi l' amminoacido comunque
raggiunge l' equilibrio fra il legame con 3'OH e
2'OH.
Ciascuno dei 20 amminoacidi viene caricato da una sintetasi specifica. Una sintetasi puo’ pero’
riconoscere piu’ tRNA diversi dato che di solito piu’ codoni codificano per lo stesso
amminoacido. Questi tRNA si chiamano isoaccettori. Ma come riesce la sintetasi a riconoscere
la giusta molecola di tRNA? Il ruolo cruciale in questo hanno lo stelo accettore e l’ ansa dell’
anticodone. Basta che cambi una base dello stelo accettore e il tRNA perde la specificita’ per
quella sintetasi. Studi cristallografici hanno dimostrato come la sintetasi crei numerose
interazioni chimiche con l’ ansa dell’ anticodone e lo stelo accettore. L’ anticodone stesso non
puo’ pero’ venir usato come determinante dal momento che un amminoacido puo’ essere
codificato da piu’ codoni diversi: la serina ad esempio e’ specificata da ben 6 codoni, e la

112
Questo legame e' considerato ad alta energia perche' quando si rompe causa una variazione elevata di energia
libera (ovvero la variazione di entalpia e' abbastanza negativa).

113
sintetasi avrebbe difficolta’ nel riconoscerli tutti quanti. Percio’ i determinanti devono trovarsi
al di fuori dell’ anticodone stesso. La sintetasi ha poi un altro compito difficile: selezionare l’
amminoacido appropriato. Il problema principale e’ che gli amminoacidi sono molecole piccole
e spesso molto simili fra di loro. Certo, il problema non si pone quando mettiamo a confronto
ad esempio la cisteina e il triptofano che hanno dimensioni, forma e gruppi chimici
notevolmente diversi. Quando pero’ si ha da fare con amminoacidi simili fra di loro, in gioco
entra anche un sito della sintetasi che fa da correttore: esso risulta essere molto selettivo (ad
esempio, acetta una valina ma non una leucina perche’ e’ troppo grande). Questo correttore
contribuisce all’ alto grado di acuratezza di caricamento dell’ amminoacido113. La sintetasi ha
tutte queste responsabilita’ per il motivo che il ribosoma non e’ in grado di discriminare fra i
tRNA caricati correttamente o scorrettamente: in altre parole, esso accetta qualsiasi tRNA che
e’ in grado di fare l’ appaiamento col codone, senza controllare se e’ caricato l’ amminoacido
giusto.

8.4: IL RIBOSOMA
Il ribosoma e’ una struttura macromolecolare composta da almeno 3 (o 4) molecole di RNA e
da piu’ di 50 proteine diverse. Questa complessita’ e’ dovuta alla difficolta’ del compito affidato
al ribosoma, ovvero quello di tradurre il codice a 4 nucleotidi in uno a 20 amminoacidi. Per
questo motivo, la traduzione e’ piu’ lenta della replicazione o della trascrizione. Nei procarioti, i
ribosomi si trovano nello stesso compartimento dei macchinari trascrizionali: questo significa
che l’ mRNA, non appena trascritto, puo’ venir anche tradotto. Negli eucarioti cosi’ non e’, c’e’
dunque uno sfasamento temporale fra i due processi.
Il ribosoma e' formato da due subunita': una grande e una piccola. La subunita' maggiore
contiene il centro peptidiltransferasico, responsabile della formazione di legami peptidici,
mentre quella minore contiene il centro di
decifrazione, in cui i tRNA carichi decifrano i
codoni dell' mRNA.
Per convenzione, le due subunita’ sono state
denominate usando un numero, che indica il loro
valore della velocita’ di sedimentazione. L’ unita’
di misura usata e’ lo Svedberg (S; quanto e’
maggiore, tanto piu’ velocemente sedimenta la
molecola). Nei procarioti la maggiore e la minore
sono rispettivamente 50S e 30S mentre l’ intero
ribosoma e’ 70S. Questa discrepanza deriva dal
fatto che la velocita’ di sedimentazione non deriva
solamente dalla massa bensi’ anche dalla forma.

113
Per maggiori dettagli vedere le pagine 527 e 528 del Watson, sett. edizione.

114
I ribosomi eucariotici hanno la subunita' maggiore e minore rispettivamente 60S e 40S, mentre
l' intero ribosoma e' 80S. Anche per gli RNA ribosomali, detti rRNA, vengono usati i valori S.
Bisogna notare che quasi i 2/3 della massa del ribosoma sia quella dell' rRNA.
Durante la sintesi proteica, le due subunita' si assemblano, legano l' mRNA e lo traducono per
poi separarsi fra di loro alla fine della traduzione. Questo susseguirsi di eventi viene chiamato
ciclo ribosomiale. La traduzione inizia quando il tRNA iniziatore e l' mRNA si legano a una
subunita' minore libera. Questo complesso recluta la subunita' maggiore: ora l' mRNA sta fra le
due subunita'. A partire dal start codon, il ribosoma si sposta lungo l' mRNA e nuovi tRNA si
aggiungono nei siti di decifrazione e peptidiltransferasico. Quando si raggiunge il codone di
stop, la catena proteica viene rilasciata e il ribosoma si disassembla liberando le subunita'. Una
singola molecola di messaggero puo' essere tradotta simultaneamente da piu' ribosomi114: un
ribosoma puo' inserirsi ogni 80 nucleotidi. Questo complesso viene definito poliribosoma, e
spiega la quantita' limitata di mRNA nella cellula.
Ogni amminoacido viene aggiunto all' estremita' carbossi-terminale dell' altro amminoacido,
conseguenza della chimica della sintesi proteica. Il ribosoma catalizza la reazione di formazione
del legame peptidico. I substrati per ciascun ciclo di aggiunta di un amminoacido sono due tRNA
carichi: un amminoacil-tRNA e un peptidil-tRNA. L' amminoacil tRNA e' legato all' amminoacido
in entrata mentre il peptidil-tRNA e' legato alla catena proteica. Il legame fra l' amminoacil-
tRNA e l' amminoacido non si rompe con la formazione del
legame peptidico successivo: a rompersi e' il legame fra la
proteina e il peptidil-tRNA, nel momento che la proteina forma
col gruppo amminico dell' amminoacido entrante il nuovo
legame peptidico.
Per catalizzare questa reazione, il ribosoma avvicina le 2
estremita’ 3’ dei due tRNA. Questo posizionamento permette
al gruppo amminico dell’ amminoacido di attaccare il carbonio
carbonilico del polipeptide: avviene la reazione a destra, con il
conseguente rilascio del peptidil-tRNA. Si vede che con questa
reazione, il polipeptide nascente si e’ trasferito sul seguente
tRNA: per questo motivo, prende il nome di reazione
peptidiltransferasica.
E’ interessante notare che la formazione del legame peptidico
non necessiti dell’ idrolisi di un nucleotide trifosfato: questo
perche’ contemporaneamente si rompe il legame acilico ad
alta energia fra l’ amminoacido e il tRNA che abbiamo
menzionato nel paragrafo precedente.

114
Un ribosoma interagisce invece con cca. 30 nt alla volta.

115
Studi biochimici hanno dimostrato che l’ rRNA sia molto di piu’ di un semplice motivo
strutturale nel ribosoma: in realta’, gli rRNA sono direttamente responsabili delle funzioni
chiave del ribosoma. Basta dire che il sito peptidiltransferasico sia composto quasi
esclusivamente da rRNA (che svolge una funzione anche nel sito di decifrazione). Come si puo’
osservare dall’ immagine a pag. 114, le proteine ribosomiali sono per lo piu’ situate all’ esterno
del ribosoma. I siti principali sono dunque composti quasi esclusivamente da rRNA. I pochi
domini proteici che arrivano al centro sembrano comunque avere la funzione di stabilizzare gli
rRNA schermando le cariche.
Il ribosoma ha 3 siti di legame per il tRNA: il sito A che accoglie l’ amminoacil-tRNA, il sito P per
il peptidil-tRNA e il sito E che accoglie il tRNA che viene rilasciato. Ciascun sito di legame si
forma nell’ interfaccia tra la subunita’ maggiore e quella minore.
Il ribosoma contiene anche delle ‘gallerie’ di entrata e di uscita per l’ mRNA. La larghezza di
questi canali assicurano che l’ mRNA sia a singolo filamento (eliminano cioe’ la possibilita’ di
strutture secondarie). Nei siti A,P ed E questi canali rendono accessibile il tRNA. Si nota anche
che l’ mRNA fra due codoni si pieghi in modo da assicurare una corretta fase di lettura. La
subunita’ maggiore contiene poi un canale che serve per l’ uscita del polipeptide
neosintetizzato. Oltre ad alfa-eliche, questo peptide non puo’ creare altre strutture prima di
uscire dal ribosoma.

8.5: L’ INIZIO DELLA TRADUZIONE


Abbiamo descritto i protagonisti della traduzione, passiamo ora al meccanismo. Il processo
implica 3 tappe: l’ inizio, l’ allungamento e la terminazione. Ognuna di queste tappe sara’
caratterizzata da uno specifico set di enzimi che si chiamano rispettivamente fattori d’ inizio, di
elongazione e di rilascio (IFs, EFs, RFs). Perche’ si abbia l’ inizio della traduzione, devono
verificarsi i seguenti tre eventi:
- Il ribosoma deve essere portato sull’ mRNA
- Un tRNA carico deve essere posizionato sul sito P
- Il ribosoma deve essere posizionato sul codone d’ inizio

8.5.1: L’ INIZIO DELLA TRADUZIONE PROCARIOTICA


Si verificano differenze fra l’ inizio procariotico e quello
eucariotico per il fatto che gli mRNA maturi siano diversi.
Ricordiamo che il posizionamento del ribosoma sul start
codon sia cruciale in quanto determina la fase di lettura. La
subunita’ 30S si associa al mRNA per prima. Se i siti di
legame al ribosoma sono posizionati adeguatamente, al
momento che 30S e 50S s’ uniscono, il codone d’ inizio si
trova esattamente nel sito P. Questo pero’ avviene solo alla fine del processo d’ inizio: pertanto,

116
molte parti del meccanismo avvengono sul ribosoma non completo. Il tRNA iniziatore si associa
alla sequenza AUG (start codon): prima che questo accada, esso viene caricato con la metionina
e subito dopo l’ enzima Met-tRNA-transformilasi aggiunge un gruppo formile all’ ammino
gruppo della metionina: per questo il tRNA iniziatore risulta essere caricato con una N-formil
metionina e si chiama fMet-tRNAifMet. Gli enzimi deformilasi rimuovono il gruppo formile
durante o dopo la sintesi della catena polipeptidica.
Ci sono 3 fattori d’ inizio:
- IF1: evita il legame del tRNA iniziatore alla zona che diventera’
sito A
- IF2: una GTPasi che facilita il legame di fMet-tRNAifMet con la
subunita’ minore
- IF3: si lega alla subunita’ minore e ne impedisce l’ unione con
quella maggiore
IF1 si lega pertanto direttamente alla zona della 30S che diventera’ il
sito A. IF2 si lega a IF1, raggiunge il sito P e si lega a fMet-tRNAifMet
mentre IF3 si lega alla parte della 30S che diventera’ il sito E. Per questo
motivo, fra i tre siti, solo quello P puo’ legare l’ iniziatore. Quando i tre
fattori sono legati, la 30S e’ pronta a legare sia l’ mRNA che il tRNA
iniziatore: il legame dell’ iniziatore alla 30S e’ facilitato dal legame dell’
iniziatore con IF2 che e’ legato col GTP. L’ interazione del codone d’
inizio (mRNA) e dell’ anticodone dell’ iniziatore stabilizza ulteriormente
il legame. L’ ultimo passaggio consiste nell’ unire le subunita’ 30S e 50S
per formare il complesso d’ inizio 70S. Quando il codone d’ inizio e l’
anticodone dell’ iniziatore s’ accoppiano, la 30S cambia conformazione,
il che causa il rilascio di IF3. L’ uscita di IF3 rende possibile l’
assemblaggio di 50S e 30S: IF2 funge da sito di attacco iniziale. Questo
attacco causa l’ idrolisi del GTP: si ha la reazione IF2∙GTP  IF2∙GDP +
Pi. IF2∙GDP ha un’ affinita’ ridotta per il ribosoma, e per questo viene
rilasciato, insieme ad IF1 al quale e’ legato. Si ha ora il ribosoma 70S,
senza fattori d’ inizio, con tutto pronto per la sintesi del polipeptide.

8.5.2: L’ INIZIO DELLA TRADUZIONE EUCARIOTICA


Anche se l’ inizio della traduzione eucariotica e’ molto simile a quello della procariotica, gli
eucarioti adottano un metodo di riconoscimento dell’ mRNA e del codone d’ inizio
sostanzialmente diverso. Nel momento del reclutamento dell’ estremita’ 5’ dotata di Cap, la
subunita’ minore (qui 40S) e’ gia’ associata al tRNA iniziatore. La 40S legge la sequenza fino ad
arrivare alla sequenza di Kozak contenente l’ AUG. Negli eucarioti dunque, solo il primo AUG

117
puo’ essere usato come sito d’ inizio della traduzione. Un’ altra differenza e’ dovuta al fatto che
negli eucarioti c’e’ bisogno di piu’ proteine ausiliarie per il processo115.
Al termine di un ciclo di traduzione, il ribosoma eucariotico si dissocia in 40S e 60S con l’ ausilio
di 4 fattori: eIF1, eIF1A, eIF3 ed eIF5. eIF1, eIF1A ed eIF5 impediscono l’associazione della
subunita’ maggiore e il legame del tRNA
iniziatore al sito A. eIF2∙GTP leghera’ il tRNA
iniziatore e lo portera’ sulla 40S: questo
prende il nome di complesso ternario. Il tRNA
iniziatore e’ caricato con la metionina (non con
la formil-metionina) e si chiama Met-tRNAiMet :
esso viene posizionato da eIF2 sul futuro sito P,
dando origine al complesso di preinizio 43S. L’
assemblaggio di questo complesso e’ facilitato
da eIF3. eIF4E lega il Cap dell’ mRNA: questo
complesso viene legato da eIF4G, mentre
eIF4A lega l’ mRNA ed eIF4G116. Al complesso
si unisce eIF4B che attiva l’ elicasi di eIF4A che
svolge tutte le strutture secondarie che si
possono formare all’ estremita’ dell’ mRNA. A
questo punto, l mRNA con i suoi fattori si lega
al complesso 43S formando il complesso di
preinizio 48S.
La presenza della coda poli-A all' estremita' 3'
dell' mRNA contribuisce all' efficienza della
traduzione eucariotica: eIF4G interagisce con
le proteine di legame al poli-A: quest'
interazione mantiene l' mRNA in una forma circolare il che facilita il riciclaggio dei ribosomi una
volta che hanno terminato il loro ciclo di traduzione. Queste interazioni aumentano inoltre l'
efficienza di alcune fasi iniziali.
La subunita' minore e i fattori ad essa associati, una volta assemblati all' estremita' 5' dell'
mRNA, scorrono lungo la molecola in cerca di AUG, mediante un processo ATP-dipendente
stimolato dall' elicasi associata a eIF4A/B. AUG viene riconosciuto dall' anticodona che si
accoppia ad esso: il corretto accoppiamento delle basi porta a un cambio conformazionale di
43S che rilascia eIF1 e modifica la conformazione di eIF5, il che stimola l' idrolisi di ATP da parte
di eIF2. eIF2 legato al GDP viene rilasciato insieme ad eIF5. La perdita di eIF2 permette il legame
di eIF5B al tRNA iniziatore (anch' essa legata al GTP). eIF5B∙GTP stimola il reclutamento di 60S

115
Abbiamo visto anche in altri processi che solitamente la variante eucariotica e' piu' sofisticata e per questo
motivo contiene anche un numero maggiore di proteine coinvolte.
116
L' unione eIF4G+eIF4E e' importante perche' definisce il livello generale di traduzione.

118
sulla 40S. Succede la reazione eIF5B∙GTP  eIF5B∙GDP + Pi con conseguente rilascio di tutti i
fattori d' inizio: Met-tRNAiMet si posiziona nel sito P del risultante complesso d’ inizio 80S e il
ribosoma e’ pronto ad accettare il tRNA carico nel sito A e a formare il primo legame peptidico.
Anche se il meccanismo eucariotico coinvolge molti fattori in piu’, in realta’ si possono
osservare molte analogie col processo procariotico.

119
8.6: L’ ALLUNGAMENTO DURANTE LA TRADUZIONE
Questa fase prevede tre eventi chiave che devono avvenire affinche’
ogni amminoacido venga aggiunto correttamente. Primo, l’ amminoacil-
tRNA corretto viene caricato sul sito A, come determinato dal codone
presente nel sito. Il secondo passaggio e’ la reazione di
peptidiltransferasi che avviene fra la catena peptidica del peptidil-tRNA
nel sito P e l’ amminoacil-tRNA del sito A, con conseguente
trasferimento della catena peptidica sul tRNA nel sito A. Terzo, il
risultante peptidil-tRNA nel sito A e il codone ad esso associato devono
essere traslocati nel sito P. Qui c’e’ bisogno di precisione per mantenere
la corretta cornice di lettura. Due proteine ausiliarie note come fattori di
allungamento controllano questi eventi. Differentemente dall’ inizio, il
processo di allungamento e’ altamente conservato sia in procarioti che
in eucarioti, pertanto tratteremo il meccanismo procariotico che e’ noto
nei dettagli.
Gli amminoacil-tRNA vengono escortati al sito A del
ribosoma dal fattore EF-Tu. Esso si lega all’ estremita’
3’ del tRNA, mascherando l’ amminoacido associato.
Questo impedisce una formazione precoce del legame
peptidico. EF-Tu puo’ legare un amminoacil-tRNA solo
in presenza di GTP. La GTPasi di EF-Tu viene attivata
dalla sua associazione con un dominio di 60S che
innesca l’ attivita’ GTPasica e che si chiama centro di legame del fattore. EF-
Tu interagisce con esso solo quando il tRNA e’ stato caricato nel sito A e
quando si e’ verificato il corretto appaiamento codone-anticodone.
La traduzione e' un processo molto accurato a causa del fatto che esistono
diversi meccanismi operanti una selezione negativa contro l' accoppiamento
codone-anticodone errato.
Il primo meccanismo coinvolge due A adiacenti che si
trovano sull' rRNA 16S nel sito A della subunita'
minore. Queste basi formano nel solco minore legami
idrogeno con ciascuna coppia di basi che si e' formata
correttamente fra l' anticodone e le prime due basi del
codone. Accoppiamenti di basi mal appaiate formano
un solco minore che non puo' essere riconosciuto
dalle basi dell' rRNA che pertanto non formano legami idrogeno-
conseguenza di cio' e' che il tRNA appaiato scorrettamente avra' una
velocita' di dissociazione dal ribosoma molto piu' elevata.

120
Il secondo meccanismo influenza positivamente un appaiamento corretto fra codone e
anticodone e coinvolge l' attivita di EF-Tu-GTP. Come abbiamo visto, il rilascio di EF-Tu dal tRNA
richiede l' idrolisi di GTP. L' attivita' GTPasica e' molto sensibile al corretto accopiamento: se
almeno una coppia di basi non e' appaiata bene, la velocita della reazione EF-Tu-GTP  EF-Tu-
GDP + Pi diventa molto bassa ed EF-Tu-GTP non riesce ad interagire col sito di legame di EF-Tu.
Il terzo meccanismo avviene dopo il rilascio di EF-Tu ed e' una specie di proofreading. Per
partecipare attivamente alla reazione di peptidiltransferasi, il tRNA del sito A deve avvicinare la
sua estremita' 3' a quella del peptidil-tRNA. Per far cio', il tRNA deve ruotare in un processo
chiamato accomodamento. I tRNA non appaiati correttamente spesso si dissociano dal
ribosoma in questo processo.
Il ribosoma e' in realta' un ribozima. Quest' affermazione si basa sul straordinario fatto che la
reazione di peptidiltransferasi sia catalizzata da RNA, piu' precisamente dall' rRNA 23S della
subunita' maggiore. Esperimenti recenti hanno dimostrato che anche in assenza delle proteine
componenti della subuita' maggiore, essa possa comunque
catalizzare la peptidiltransferasi117.
Vediamo ora la traslocazione. Essa implica tre manovre: lo
spostamento del tRNA dal sito P al sito E, lo spostamento dell'
altro tRNA (legato alla catena proteica) dal sito A al sito P e lo
spostamento dell' mRNA di tre nucleotidi. Queste manovre
sono tutte coordinate fra di loro.
Dopo la peptidiltransferasi, il tRNA che e' ora legato alla catena
proteica tende ad occupare con l' estremita' 3' il sito P, mentre
l' altro tRNA, ora libero e deacetilato, tende a occupare il sito E.
Gli anticodoni restano pero' ancora fissi e appaiati coi codoni:
chiamiamo questo uno stato ibrido, in cui lo spostamento si
verifica solamente a livello della subunita' maggiore.
Il completamento della traslocazione necessita dell' azione del
fattore EF-G. Esso si lega al ribosoma solo in forma EF-G-GTP
che legandosi alla subunita' maggiore, crea dei contatti col
centro di legame del fattore, il che stimola l' idrolisi di GTP.
Questa reazione induce un cambiamento conformazionale di
EF-G con due rilevanti conseguenze: in primis, il legame fra EF-
G-GDP e ribosoma sblocca quest' ultimo, aprendo in modo
allosterico i 'cancelli' che ci sono fra i siti A,P,E. In secondo
luogo, EF-G-GDP e' in grado di legarsi al sito A, competendo per
questo sito col tRNA: dato che i 'cancelli' fra i siti sono aperti,

117
Per maggiori dettagli vedere le pagine 550 e 551 del Watson, sett. edizione

121
questo tRNA si sposta nel sito P, e come in un domino, spinge il tRNA che stava nel sito P verso
il sito E. Questo spostamento causa anche lo slittamento di tre nucleotidi dell' mRNA (dato l'
appaiamento codone-anticodone). Il completamento della traslocazione implica la rotazione
della subunita' minore che torna alla posizione di partenza118. La risultante struttura
ribosomiale ha una bassissima affinita' per EF-G-GDP
che viene, di fatto, rilasciato – conseguentemente
vengono chiusi i 'cancelli' fra i siti. La traslocazione e'
completa. L' affinita' di EF-G-GDP per il sito A e'
molto elevata perche' questa molecola ricorre al
trucco di 'mimetismo molecolare': con la sua forma,
essa simula molto fedelmente il tRNA legato a EF-
Tu-GTP e per questo riesce a competere bene col
tRNa per il sito A.
Per ogni ciclo di caricamento, vengono spese 2 molecole di GTP, una per EF-Tu e una per EF-G.
Dato che il GDP ha un' affinita' bassa per EF-G, il disassemblaggio di EF-G-GDP e' un processo
spontaneo. Al contrario, per disassemblare EF-Tu-GDP, serve l' azione di EF-Ts, un altro fattore
di allungamento, che agisce verso EF-Tu come fattore di scambio per il GTP. In seguito al rilascio
di EF-Tu-GDP dal ribosoma, EF-Ts si lega ad EF-Tu causando l' uscita di GDP. Il GTP si lega al
complesso EF-Tu-EF-Ts e ne determina il disassemblaggio con la riformazione di EF-Tu-GTP. Se
volessimo calcolare l' energia spesa dalla cellula per creare un legame peptidico, dobbiamo
prendere in considerazione non soltanto queste due molecole di GTP ma anche una di ATP che
viene usata dalla amminoacil-tRNA-sintetasi per creare il legame fra amminoacido e tRNA.

8.7: LA TERMINAZIONE DELLA TRADUZIONE


Il ciclo del ribosoma, comprendente il legame dell’ amminoacil-tRNA, la formazione del legame
peptidico e la traslocazione, continua fino a quando un codone di stop non viene a posizionarsi
nel sito A. I codoni di stop vengono riconosciuti da proteine dette fattori di rilascio (RF, release
factors) che attivano l’ idrolisi del polipeptide dal peptidil-tRNA. Esistono due classi di fattori di
rilascio:
Classe I: riconoscono i codoni di stop e innescano l’ idrolisi del polipeptide dal tRNA nel sito P.
Nei procarioti esistono RF1 (riconosce UAG) ed RF2 (riconosce UGA). UAA e’ riconosciuto sia da
RF1 che da RF2. Negli eucarioti c’e’ invece eRF1 che riconosce tutti e tre i codoni di stop.
Classe II: stimolano il rilascio dei fattori di classe I dal ribosoma in seguito al rilascio della catena
polipeptidica. Abbiamo RF3 nei procarioti ed eRF3 negli eucarioti: l’ azione di entrambi e’
dettata dal legame col GTP119.

118
Infatti, dopo la reazione di peptidiltransferasi abbiamo avuto una prima rotazione della subunita' minore.
119
Similmente come accadeva per EF-G, IF2 ed EF-Tu.

122
Come fanno i fattori di rilascio a riconoscere il codone di stop? Dato che sono composti
interamente di proteine, si verifichera’ un’ interessante interazione proteina-RNA. Si e’
identificata una regione di 3 amminoacidi cruciale per la specificita’ del fattore di rilascio,
chiamata anticodone peptidico, che interagisce coi codoni di stop dell’ mRNA. La prima
immagine mostra una struttura tridimensionale dove e’ evidente il legame di RF1 all’
anticodone nel sito A.

Si vede l' anticodone peptidico in prossimita' del codone di stop, ma ci sono probabilmente
anche altre strutture che contribuiscono alla specificita' del fattore, interagendo pero' con delle
parti del ribosoma stesso. La prossima immagine mostra un' altra forma di interazione, questa
volta fra RF1 e l' estremita' 3' del peptidil-tRNA che si trova nel sito P:

Si tratta della sequenza amminoacidica GGQ (glicina, glicina, glutammina), che promuove l'
idrolisi del polipeptide dal peptidil-tRNA del sito P. Non e' pero' ben chiaro quale sia il modo in
cui questa sequenza influisce la reazione di idrolisi.

123
Questi studi nel loro insieme hanno portato alla
conclusione che i fattori RF1 e RF2 simulino
molecolarmente un tRNA: Infatti, osservando la
struttura cristallografica, si nota una notevole
similitudine con il tRNA.
Abbiamo dunque concluso che in qualche modo i
fattori di rilascio di classe I inneschino il distacco
della catena polipeptidica neoformata dal tRNA mediante una reazione
idrolitica. A questo punto, il fattore di classe I deve essere rimosso dal
ribosoma. Questo compito e' svolto da RF3. RF3 pero' ha un' affinita'
maggiore per il GDP che per il GTP e pertanto RF3∙GDP sara' la forma
prevalente. RF3∙GDP si lega al ribosoma dipendentemente dal fattore di
classe I. Il rilascio del polipeptide fa avvenire un cambiamento
conformazionale del ribosoma e del fattore di classe I, che viene anch' esso
rilasciato: contemporaneamente, RF3 scambia il GDP per il GTP. RF3∙GTP si
lega con alta affinita' al ribosoma: si ha pertanto uno stato intermedio, nel
quale RF3∙GTP si lega al sito di legame del fattore nella subunita' maggiore.
Questo a sua volta stimola l' idrolisi del GTP: RF3∙GDP, avendo una bassa
affinita' per il ribosoma, viene rilasciato. Con questo processo dunque si ha l'
uscita di tutti i fattori di rilascio.
Lo step finale concerne il cosidetto riciclaggio del ribosoma: le due subunita'
insieme ai due tRNA deacetilati nei siti P ed E devono essere tutti
disassemblati affinche' il processo di traduzione possa ricominciare per quel
ribosoma. Nei procarioti incontriamo un fattore di riciclaggio del ribosoma
detto RRF. Esso agisce insieme a EF-G e IF3 (ricordiamo che al momento dell' inizio della
traduzione IF3 sia gia' assemblato sulla subunita' minore). RRF si lega al sito A vuoto dove
simula un tRNA. Esso recluta inoltre EF-G-GTP sul ribosoma. Avviene la reazione EF-G-GTP 
EF-G-GDP + Pi (similmente come nell' allungamento) che favorisce il rilascio dei due tRNA dai
siti P ed E: conseguentemente a cio', RRF si muove dal sito A al sito P (imitando lo spostamento
del peptidil-tRNA durante l' allungamento). A questo punto, RRF, EF-G-GDP e l' mRNA vengono
rilasciati dal ribosoma mentre IF3 opta per un legame alla subunita' minore (favorira' l' inizio del
prossimo ciclo di traduzione). Anche se RRF imita il tRNA, questo e' vero fino a un certo punto:
le interazioni fra RRF e ribosoma sono, tutto sommato, piu' deboli da quelle fra tRNA e
ribosoma, per il fatto che RRF deve essere rilasciato direttamente dal sito P (ricordiamo che il
destino del tRNA e' solitamente quello di passare al sito E prima di uscire).
Come si poteva intuire finora, l' intera traduzione e' un processo ordinato, caratterizzato da un
rigoroso susseguirsi di processi chimici. Quest' ordine assicura il giusto funzionamento della
traduzione ma e' allo stesso tempo il suo tallone d' Achille sfruttato dagli antibiotici che come
bersaglio hanno proprio la traduzione.

124
Gli antibiotici di solito hanno come bersaglio specifici componenti del macchinario traduzionale:
possono ad esempio inibire la loro funzione, bloccando la sintesi proteica e causando la morte
del batterio. Un buon esempio e' la puromicina che va a legarsi al sito A sostituendosi a un
amminoacil-tRNA nella reazione di peptidiltransferasi. Dato che la puromicina non si lega
fortemente al ribosoma, la catena proteica che e' ora legata alla puromicina viene rilasciata
insieme alla puromicina stessa, e la sintesi proteica ha fine.
Le ricerche stanno esplorando sempre di piu' la regolazione genica a livello traduzionale.
Nonostante il fatto che la maggior parte della regolazione avvenga a livello di trascrizione, il
controllo traduzionale puo' dare risultati piu' immediati in quanto puo' variare molto piu'
rapidamente la concentrazione di una data proteina. La descrizione dei meccanismi regolativi
traduzionali esula pero' dai fini di questo corso.

125
8.8: IL CODICE GENETICO
Il cuore del dogma centrale e’ il trasferimento dell’ informazione dal linguagio a 4 basi azotate a
uno di 20 amminoacidi. Il numero di codoni possibili e’ 64 (perche’ in ognuna delle tre posizioni
puo’ starci uno dei 4 nucleotidi, dunque le combinazioni sono 43): gli amminoacidi sono pero’
solo 20, il che’ ci fa intuire che piu’ codoni diversi codificheranno per lo stesso amminoacido. Il
codice genetico e’ una tabella che spiega quali amminoacidi siano codificati da quali codoni. In
questo paragrafo spiegheremo la scoperta del codice genetico, la logica su cui si basa e le
mutazioni sulla capacita’ codificante dell’ mRNA.

8.8.1: LA SCOPERTA DEL CODICE GENETICO


Il codice genetico fu decifrato con un esperimento molto elegante volto a determinare quali
triplette codificavano per quali amminoacidi. Gli scienziati Nirenberg e Matthaei dapprima
usarono un polinucleotide sintetico poli-U composto esclusivamente da U, e quello che
ottennero fu una catena polipeptidica120 composta solamente da fenilalanina. Mettendo poi in
rapporto il numero di fenilalanine e quello dei nucleotidi si e’ dimostrato anche che siano le
triplette nucleotidiche (UUU) quelle a codificare un dato amminoacido. Usando nucleotidi
sempre piu’ complessi si e’ decifrato l’ intero codice. Nel 1966 il completamento del codice
mostro’ che 61 su 64 possibili gruppi di permutazione corrispondevano ad amminoacidi, e che l
maggior parte di essi sia codificata da piu’ di una tripletta.

8.8.2: GENERALITA’ SUL CODICE GENETICO

Inanzitutto si tratta della tabella che vediamo, dove possiamo individuare quali triplette
codificano per quali amminoacidi. La colonna a sinistra rappresenta la base all’ estremita’ 5’
della tripletta. Si notano anche le tre triplette di stop.

120
Queste catene poliribonucleotidiche si sono ottenute con l' ausilio dell' enzima fosforilasi polinucleotidica.

126
Si dice che il codice sia degenerato: molti amminoacidi vengono codificati da piu’ di un codone.
I codoni che codificano per lo stesso amminoacido vengono detti sinonimi. La maggioranza
delle degenerazioni e’ dovuta al fatto che i codoni codificanti per lo stesso amminoacido
abbiano le prime due basi uguali (ma non e’ sempre cosi’). La degenerazione spiega anche il
fatto che certi organismi simili che producono proteine uguali abbiano genomi abbastanza
diversi. Esplorando il codice genetico, ci rediamo conto ancora una volta della straordinaria
natura dell’ evoluzione: infatti, sembra che esso si sia evoluto nel modo da minimizzare i danni
che le mutazioni puntiformi possono indurre. In altre parole, se la mutazione (che solitamente
convertono una pirimidina nell’ altra pirimidina o una purina in un’ altra purina) avviene su una
delle basi della tripletta, il codone neoformato codifichera’ o sempre lo stesso amminoacido di
prima o un’ altro amminoacido ma con caratteristiche chimico-
fisiche molto simili all’ originale.
Un’ altra caratteristica del codice genetico e’ che un tRNA possa
riconoscere piu’ di un codone121. Questo fenomeno avviene per
due motivi principali:
- Se U e’ la base all’ estremita’ 5’ dell’ anticodone, essa puo’
appaiarsi sia con A che con G a causa del concetto della
base tentennante che spiega come l’ ultima base dell’
anticodone non subisca le limitazioni spaziali alle cui sono
soggette le altre basi.
- La prima base dell’ anticodone puo’ essere l’ inosina: essa
deriva dalla deamminazione dell’ adenina. L’ inosina puo’
appaiarsi con U,C o A. Se I e’ presente, un singolo tRNA puo’
riconoscere 3 codoni diversi.

121
Logico, dal momento che un amminoacido sia codificato da piu' codoni diversi.

127
8.8.3: TRE REGOLE CHE DISCIPLINANO IL CODICE GENETICO
1) I codoni vengono letti in direzione 5’  3’.
2) I codoni non si sovrappongono e il messaggio non contiene interruzioni. I codoni successivi
sono dunque rappresentati da trinucleotidi in fase. Pertanto, la sequenza codificante il
tripeptide NH2-Thr-Arg-Ser-COOH e’ specificata dalla sequenza 5’-ACGCGAUCU-3’.
3) Ogni ORF viene letta e tradotta in una sola delle tre cornici di lettura che e’ determinata dal
codone d’ inizio.

8.8.4: MUTAZIONI PUNTIFORMI CHE ALTERANO IL CODICE


1) Mutazioni missenso: cambia un codone specifico per un amminoacido in un altro codone
specifico per un altro amminoacido. La conseguenza e’ la produzione di una proteina che avra’
un amminoacido sostituito (caso dell’ anemia falciforme).
2) Mutazione nonsenso/ di stop: un codone viene trasformato in un codone di stop. Questo
causa la produzione di polipeptidi minori della proteina originale, molte volte non funzionanti.
3) Mutazione frameshift: si tratta di mutazioni dovute a inserzione o delezione di una o alcune
basi, il che cambia la cornice di lettura. Queste mutazioni possono essere molto gravi, in quanto
a causa loro puo’ venir prodotta una proteina completamente diversa da quella originale.

8.8.5: MUTAZIONI DI SOPPRESSIONE


Spesso gli effetti di una mutazione dannosa possono essere alterati da un’ altra mutazione: e’
facile comprendere il fenomeno di una mutazione di reversione, che e’ l’ esatto contrario della
mutazione che e’ successa prima e che riporta la sequenza in forma originaria.
Le mutazione di soppressione invece avvengono in posizioni differenti del cromosoma e
sopprimono gli effetti di una mutazione successa nella posizione A producendo una
modificazione in una posizione B. Si dividono in 2 categorie:
- Soppressione intragenica: avvengono nello stesso gene della mutazione originaria
- Soppressione intergenica: avvengono in un gene diverso
I geni che causano la soppressione di mutazioni in altri geni vengono detti geni soppressori.
Entrambe le varianti funzionano producendo coppie corrette (o parzialmente corrette) della
proteina, altrimenti resa innattiva dalla mutazione iniziale. Come esempio di una mutazione
intragenica, si puo’ considerare una mutazione missenso, che in teoria potrebbe ripristinare la
configurazione iniziale della proteina se viene modificato il corretto amminoacido.
A pagina seguente vediamo un esempio di mutazione intragenica:

128
Con questa trattazione abbiamo finito il viaggio che e’ partito dal genoma, continuato col
trascrittoma e finito col proteoma. Torniamo ora al DNA per vedere i meccanismi di
ricombinazione omologa e sito-specifica.

129
CAPITOLO 9: LA RICOMBINAZIONE OMOLOGA E SITO-
SPECIFICA
Finora abbiamo parlato della replicazione del DNA e della sua riparazione in seguito a
mutazioni. Ora ci occupperemo di un altro fenomeno affascinante, ovvero della ricombinazione.
Ci sono due tipi di ricombinazione:
- Ricombinazione omologa
- Ricombinazione sito-specifica

9.1: RICOMBINAZIONE OMOLOGA A LIVELLO MOLECOLARE


Tutto il DNA e’ ricombinante. Lo scopo di questo scambio genetico e’ di riarrangiare in
continuazione i cromosomi e permettere cosi’ una variabilita’ genetica, nonche’ di riparare
lesioni dannose al DNA. Durante la meiosi, in una fase che precede la divisione nucleare, la
ricombinazione omologa provoca il cosidetto crossing-over che implica uno scambio di
materiale genetico fra i cromosomi. La frequenza di ricombinazione fra due geni sullo stesso
cromosoma dipende dalla distanza effettiva che c’e’ fra questi due geni: in altre parole, quanto
piu’ distanti sono i geni, tanto minore e’ la frequenza di scambio.
La ricombinazione omologa e’ un processo molecolare di fondamentale importanza, catalizzato
da enzimi sintetizzati e regolati proprio per questo scopo. Vediamo di schematizzare gli scopi di
questo fenomeno:
- Incremento di variabilita’ genetica
- Riparazione del DNA rimpiazzando la regione danneggiata con un filamento integro
ottenuto dal cromosoma omologo
- Fa ripartire le forche replicative danneggiate o bloccate (‘reinizio della replicazione’)
- Regolazione genica: grazie alla ricombinazione un gene altrimenti silente puo’ venire a
trovarsi in una regione dove viene espresso
La comprensione dei meccanismi molecolari della ricombinazione omologa ha anche permesso
lo sviluppo di tecniche per la manipolazione genica122.

9.1.1: LE RAGIONI DELL’ INIZIO DELLA RICOMBINAZIONE


La ragione principale dell’ innesco del processo di ricombinazione e’ la rottura a doppio
filamento (double-stranded breaks- DSB): e’ un fenomeno che accade spesso (puo’ essere
causato ad esempio da radiazioni ionizzanti delle quali abbiamo parlato) e se non viene riparato
ha conseguenze disastrose per la cellula.

122
Per esempio, la produzione di vvarianti transgeniche e’ al giorno d’ oggi un’ attivita’ do routine per molti
organismi modello.

130
La maggior parte delle cellule usa proprio la ricombinazione omologa per riparare le DSB.
Diversi tipi di danno portano indirettamente alla DSB perche’ ostacolano il progredire della
forca replicativa: cosi’ ad esempio la presenza di un’ interruzione in un filamento del DNA
conduce al collasso della forca replicativa che sta avanzando: in modo analogo un danno che
impedisce a un filamento di servire come stampo puo’ bloccare anch’ esso la forca:

Se si blocca la replicazione, si ferma anche il ciclo cellulare e la cellula o muore o va in


senescenza123. La forca bloccata puo’ venir processata da diversi sitemi che danno origine a un’
estremita’ con la DSB. E’ chiaro dunque che questo problema va immediatamente risolto: la
ricombinazione sfrutta una molecola di DNA omologa per riparare la rottura. Come vedremo in
seguito, anche durante la meiosi la ricombinazione viene innescata da una DSB che viene a sua
volta prodotta da specifiche proteine.

9.1.2: I MODELLI DELLA RICOMBINAZIONE OMOLOGA


Esperimenti simili a quello condotto da Meselson e Stahl che implicano l’ uso di isotopi
radioattivi sono serviti anche a capire il meccanismo della ricombinazione omologa. Essa si basa
principalmente sulla rottura del DNA e sulla sua riunione molecolare. Anche se sono stati
proposti diversi modelli, ognuno di essi e’ composto da 5 tappe fondamentali:
Allineamento di due molecole di DNA omologhe: Per omologhe s’ intende due sequenze di
DNA identiche o quasi, in una regione di almeno un centinaio di coppe di basi. Se le coppie di

123
La cellula non e’ piu’ in grado di proliferare.

131
DNA differiscono in una o alcune brevi regioni, la ricombinazione porta a delle varianti nelle
sequenze dello stesso gene, i cosidetti alleli.
Introduzione di ulteriori rotture nel DNA: La regione con il DSB che e’ avvenuta prima dell’
innesco del meccanismo viene ulteriormente processata per produrre regioni di DNA a singolo
filamento.
Invasione del filamento: Tra le due molecole di DNA che ricombinano si formano delle brevi
regioni di appaiamento fra le basi, mediante un processo chiamato invasione del filamento:
una regione di ssDNA della molecola parentale si appaia con il filamento complementare della
molecola di DNA omologa. Il risultato dell’ invasione e’ la formazione di DNA eteroduplex:
nuove molecole di DNA a doppio filamento124.
Formazione delle giunzioni di Holliday: La struttura a croce formata dall’ appaiamento fra
molecola parentale e omologa prende il nome di giunzione di Holliday. Essa puo’ scorrere
lungo il DNA mediante una continua fusione e formazione di appaiamenti: ogni movimento
implica la rottura di alcuni appaiamenti sul DNA parentale e la formazione di appaiamenti
identici sull’ intermedio di ricombinazione. Questo processo si chiama migrazione del chiasma.
Risoluzione della giunzione di Holliday: La risoluzione implica la riformazione di due molecole
di DNA separate. La risoluzione puo’ essere ottenuta o col taglio dei due filamenti coinvolti nella
giunzione di Holliday oppure negli eucarioti mediante ‘dissoluzione’. Il primo meccanismo
forma due duplex separati: la scelta della coppia dei filamenti della giunzione e’ fondamentale
per determinare la quantita’ scambiata di DNA.
Questo sono le 5 tappe fondamentali del processo di ricombinazione omologa.
L’ immagine a pagina seguente rappresenta due molecole omologhe di DNA: in blu quella
‘sana’, in grigio quella da riparare. Le due molecole sono allineate nel modo da poter notare la
presenza di alleli (tipo A/a). La figura b mostra come sia processato il filamento vicino alla DSB,
nel modo da creare una regione a ssDNA. I filamenti vicini all’ incisione possono dunque essere
staccati dai loro complementari per poter invadere il filamento parentale (c). L’ invasione,
seguita dall’ appaiamento tra i filamenti complementari delle eliche omologhe determina un
appaiamento stabile fra le molecole.
La giunzione di Holliday formata puo’ ora scorrere per migrazione del chiasma il che comporta l’
aumento della lunghezza di DNA scambiato. Il fatto che gli alleli non siano identici porta alla
formazione di mismatch, la cui riparazione avra’ conseguenze genetiche importanti.
Vediamo ora come avviene l’ invasione del filamento:

124
Che contengono spesso delle basi appaiate scorrettamente.

132
L’ immagine seguente raffigura i due modi possibili di risolvere la giunzione di Holliday: il taglio
avviene in prossimita' del chiasma. Quest’ operazione separa le due molecole di DNA. La
risoluzione puo’ avvenire in due modi diversi e pertanto puo’ dare origine a due diverse classi di
molecole figlie di DNA. Per facilitare la visione, nell’ immagine notiamo la rotazione che da’
origine a una struttura planare priva di intersezioni fra filamenti. Devono essere tagliati due
filamenti con la stessa sequenza e polarita’: come si vede, i modi di farlo sono 2, dato che ci
sono due siti possibili di taglio:
1) Il taglio 1 avviene sui due filamenti di DNA composti esclusivamente dal DNA di una
delle due molecole parentali. I prodotti che derivano vengono chiamati prodotti uniti o
prodotti del crossing over:porzioni appartenenti a molecole di DNA parentale diverse
sono unite covalentemente da una regione ibrida a doppio filamento. Come si vede, vi e’
stato lo scambio fra i geni A e C.
2) Il taglio 2 avviene sui due filamenti di DNA contenenti tratti di sequenza provenienti da
entrambe le molecole parentali. Le due molecole figlie vengono dette prodotti di toppa

133
o prodotti del non incrocio, in quanto questo tipo di taglio non porta al riassortimento
dei geni che fiancheggiano il punto del taglio.

134
Abbiamo gia’ detto che un contesto dove si puo’ osservare la
ricombinazione omologa e’ la riparazione di rotture a doppio
filamento. In questo caso, una delle due molecole di DNA
subisce il DSB125.
Una nucleasi degrada ora le regioni vicino alla rottura per
produrre segmenti di ssDNA. Questi segmenti sono noti come
code di DNA a singolo filamento che terminano con l’
estremita’ 3’. Le code a singolo filamento invadono l’ altra
molecola di DNA: l’ immagine c mostra come dapprima sia una
delle due code quella a invadere il DNA ‘sano’ mentre la d
mostra che in un secondo momento anche l’ altra coda
effettua l’ invasione. In ogni caso, le code s’ appaiano coi loro
filamenti complementari della molecola di DNA invasa. Dal
momento che i filamenti che invadono terminano col 3’, essi
possono servire da primer per la sintesi di nuovo DNA: l’
allungamento di queste estremita’, usando come stampo il
filamento complementare della molecola omologa, rigenera
quelle regioni di DNA perse a causa del DSB.
Se in prossimita’ del sito di rottura le due doppie eliche
parentali nono sono identiche in sequenza (es. Cambiamenti a
livello di una coppia di basi), con la riparazione di DSB l’
informazione di sequenza potrebbe andare perduta durante la
ricombinazione. Come vedremo piu’ avanti, questo passaggio
diseguale puo’ portare al fenomeno di conversione genica.
Avviene ora la migrazione del chiasma e la risoluzione della
giunzione di Holliday: ecco che la rottura al doppio filamento e’ stata riparata126!
Ci soffermeremo ancora un attimo per chiarire come avviene la risoluzione della giunzione di
Holliday. L’ immagine a pagina seguente mostra i due esiti possibili del taglio della giunzione. Si
vede inoltre che ognuna delle due giunzioni presenta due siti di taglio possibili. La semplice
regola che permette di stabilire i prodotti del taglio e’ la seguente: se entrambe le giunzioni (x e
y) sono tagliate nello stesso modo, ovvero entrambe in corrispondenza del sito 1 o entrambe in
corrispondenza del sito 2, allora si ha il prodotto del non crossing over. Al contrario, se le
giunzioni sono tagliate usando siti diversi, si avra’ il prodotto del crossing over.

125
L' altra molecola di DNA deve ovviamente essere intatta. Ci sono due molecole di DNA perche' ci troviamo nella
fase del ciclo cellulare dopo la replicazione del DNA.
126
Questo metodo di riparazione e’ sicuramente piu’ favorite rispetto a NHEJ dove si ha sicuramente la Perdita di
materiale genetico. Abbiamo pero’ gia’ detto che quando non ci sono due molecole omologhe di DNA, NHEJ sia l’
unica possibilita’.

135
9.1.3: GLI APPARATI PROTEICI DELLA RICOMBINAZIONE OMOLOGA
Per trattare le proteine coinvolte, analizzeremo dapprima la ricombinazione in E. Coli per poi
passare agli eucarioti. In E. Coli il sistema di riparazione del DSB si chiama RecBCD.
In primis bisogna vedere come il DNA viene degradato per creare le code a singolo filamento
che sono il substrato per la ricombinazione. L’ elicasi/nucleasi RecBCD e’ composta da tre
subunita’ (codificate da tre geni diversi):
- RecB: DNA elicasi 3’  5’ + dominio nucleasico che digerisce il DNA
- RecC: riconosce i siti Chi (elementi di sequenza che controllano l’ enzima RecBCD)
- RecD: DNA elicasi 5’  3’
RecBCD riconosce e si lega a DSB. I motori elicasici RecB e RecD si muovono ognuno su un
filamento, ma con velocita’ diverse, separando i filamenti. RecD si muove piu’ velocemente:
quando RecB si avvicina a RecD, sul filamento con l’ estremita’ 3’ libera (quello sul quale scorre
RecB) si crea un’ ansa che sporge fuori dal complesso. Quando incontra il sito Chi, il complesso
si ferma e poi prosegue con una velocita’ inferiore. Durante la pausa avvengono alcuni
cambiamenti di fondamentale importanza: inanzitutto, l’ ansa viene avvolta attorno a RecB che
ora diventa il motore principale del complesso. Si verifica poi il disaccopiamento di RecD; il
terzo cambiamento implica che dopo il sito Chi, l’ attivita’ nucleasica non idrolizzi piu’ il DNA
con polarita’ 3’  5’. Inoltre, il filamento con polarita’ 5’  3’ viene digerito piu’ velocemente
di quanto accadeva prima del raggiungimento del sito Chi. La consegunza di tutto cio’ e’ il fatto
che si crea una coda a singolo filamento che termina con la sequenza Chi (infatti, il filamento
opposto a quello contenente la sequenza Chi viene degradato)127. La presenza di siti Chi sul
DNA aumenta la frequenza di ricombinazione di circa 10 volte: inoltre, questo cambiamento e’
pronunciato sulle regioni vicine ai siti.

127
Per dettagli su come il sito Chi regoli l' attivita' di RecBCD, vedere la pagina 359 del Watson.

136
Passiamo ora alla funzione della proteina RecA, protagonista della ricombinazione omologa che
fa parte della famiglia di proteine che scambiano il filamento. Queste proteine catalizzano l’
appaiamento tra le molecole omologhe di DNA. A destra vediamo la struttura cristallografica di
RecA, composta da 6 subunita’ (la rossa e’ quella piu’ vicina a noi).
A differenza di molte altre proteine viste finora, RecA si assembla
in filamenti composti anche da 100 subunita’. Il legame di queste
catene al DNA allunga la distanza fra le basi e rende dunque piu’
lunga la catena di DNA. Per formare un filamento, le subunita’ di
RecA si legano in modo cooperativo al DNA. Questo assemblaggio
avviene molto piu’ velocemente sul ssDNA che su una doppia elica,
a dimostrazione della necessita’ della presenza di ssDNA come
substrato per lo scambio del filamento. Dato che l’ assemblaggio di RecA in direzione 5’  3’ fa
crescere il filamento, un’ elica che finisce con 3’ sara’ ricoperta di RecA molto piu’
probabilmente di una che termina con 5’128.
Il filamento RecA si formera' dunque nella
regione dove deve avvenire l' appaiamento fra i
filamenti delle due molecole parentali.
Inanzitutto, RecA si deve assemblare su una
delle due molecole parentali – ad esempio,
sulla coda ssDNA. Il complesso RecA-ssDNA e'
la forma attiva che partecipa alla ricerca della
regione di omologia: e' dunque RecA quella a 'cercare' per la coda una regione omologa nell'
altra molecola parentale. Come riesce a farlo? Ecco quello che si
sa finora: RecA ha un sito primario di legame dove va a legarsi la
coda. Il sito secondario invece puo' accogliere un' altra molecola
di DNA, indipendentemente dalla sequenza. Puo' dunque
analizzare vaste quantita' di DNA, fino a trovare la regione
omologa. Non e' ancora chiaro come riesca a farlo, ma si e'
capito che ha da fare con il legame ATP-RecA-DNA, detto
complesso pre-sinaptico. Da notare che la seconda molecola di
DNA (blu) sia a doppio filamento. Nel sito secondario, la
molecola di dsDNA viene temporaneamente aperta per valutare
se ci sono zone di omologia con la coda. Esperimenti in vitro
indicano che a RecA basti una complementarieta' fra 15 basi per
attivare lo scambio del filamento. A questo punto abbiamo una
molecola giuntata, formata da ssDNA e dsDNA dove avviene il
vero scambio fra i filamenti.

128
Tutto in concomitanza con quanto detto finora della ricombinazione omologa: ricordiamo che e' la coda con l'
estremita' 3' libera quella a invadere il filamento omologo.

137
A sinistra vediamo la tripletta
presinaptica in grigio sovrapposta al
duplex che si forma in seguito al corretto
appaiamento fra molecole omologhe. A
destra il complesso postsinaptico e'
sovrapposto al DNA in forma B (blu): si
nota che le forme siano quasi uguali fra
di loro.
In seguito al giusto appaiamento si forma la giunzione di Holliday. Le cellule codificano delle
proteine che velocizzano notevolmente la migrazione del chiasma. RuvA e' una proteina che
riconosce e lega la giunzione, indipendentemente dalla sequenza, e recluta l' esamero RuvB, un'
ATPasi simile alle elicasi. RuvB fornisce l' energia necessaria a scambiare gli appaiamenti e far
muovere il chiasma. Il complesso RuvAB e' formato da un tetramero di RuvA che lavora con
due esameri di RuvB. RuvC e' una resolvasi (endonucleasi) preposta alla risoluzione della
giunzione di Holliday. RuvC, probabilmente insieme a RuvA e RuvB, incide specificamente due
dei filamenti di DNA omologo con la stessa polarita': questo taglio129 genera delle estremita' di
DNA che possono essere unite dalla ligasi.

9.1.4: LA RICOMBINAZIONE OMOLOGA EUCARIOTICA


Negli eucarioti, oltre per la riparazione delle DSB e per lo sblocco delle forche replicative, la
ricombinazione omologa serve per la meiosi. Non solo che sia necessaria per il corretto
appaiamento dei cromosomi ma garantisce anche una certa variabilita’ nella composizione
genica tramandata alla generazione successiva permettendo il crossing over. La ricombinazione
che avviene durante la meiosi prende il nome di ricombinazione meiotica. Essa avviene prima
per unire i due cromosomi omologhi (provenienti ognuno da un genitore). In questa fase puo’
avvenire il crossing over, ovvero lo scambio di sequenze fra alleli che porta alla variabilita’. L’
assenza di ricombinazione porta spesso alla scorretta unione fra cromosomi oppure alla perdita
degli stessi, con una conseguente riduzione di fertilita’. Il crossing over puo’ essere osservato
citologicamente, colorando diversamente le due molecole omologhe di DNA, e osservando le
molecole figlie risultanti (che avranno porzioni in colori diversi).
Abbiamo detto che la ricombinazione omologa avvenga in seguito a una DSB. Durante la meiosi,
si attivano dei geni che solitamente sono completamente silenti: uno di questi e’ il gene SPO11
che codifica per una proteina che introduce un DSB nel DNA cromosomico. Essa prende il nome
di Spo11 e nel momento che i cromosomi omologhi iniziano ad appaiarsi essa introduce una
serie di tagli alla doppia elica dei cromosomi. Questi tagli non sono sequenza-specifici ma
avvengono in regioni di DNA che non sono strettamente associate ai nucleosomi.

129
Il taglio avviene con una modesta specificita' di sequenza, per assicurare che avvengano almeno alcuni eventi di
migrazione del chiasma (per aumentare la quantita' di DNA che partecipa allo scambio).

138
Vediamo il meccanismo di taglio di Spo11: la catena
laterale di una specifica tirosina di Spo11 attacca la catena
fosfodiesterica130 per tagliare il DNA e formare un
complesso covalente DNA-proteina. Due subunita’ di
Spo11 tagliano il DNA a distanza di due nucleotidi per
formare un DSB sfalsato131.
Questo meccanismo porta a due conseguenze: in primis le
estremita’ 5’ sono unite covalentemente all’ enzima. L’
energia liberata dalla rottura del legame fosfodiesterico
rimane imagazzinata in questo legame DNA-proteina: per
questo motivo, la reazione di taglio e’ facilmente
reversibile132 (ad esempio quando la cellula riceve il
segnale di
interrompere la
meiosi).
In questo modo, Spo11 marca le estremita’ che devono
essere processate per produrre le code di ssDNA,
similmente come accade nei batteri. Il complesso
enzimatico MRX media tale processamento. MRX e’
composto da Mre11, Rad50 e Xrs2. A essere processate
sono esclusivamente quelle catene legate a Spo11
(dunque quelle che terminano con 5’, uguale come nei
batteri). I due omologhi eucariotici di RecA sono Rad51
e Dmc1.
Sebbene i due omologhi abbiano piccole differenze di
sequenza e alleli diversi per i stessi geni, la maggior
parte delle sequenze di DNA e’ identica nelle 4 copie di
cromosomi (ricordiamo che nella profase I ci siano in
tutto 4 cromatidi/cromosomi). La ricombinazione
mediata da Dmc1 avviene preferenzialmente fra
cromatidi omologhi non fratelli, che ha una logica
biologica: la ricombinazione meiotica promuove l’
unione fra omologhi favorendo l’ allineamento dei
cromosomi per la divisione.

130
Ricordiamo l' alta nucleofilicita' della catena laterale della tirosina.
131
Questo meccanismo di taglio e' uguale a quello delle topoisomerasi
132
Il contributo entalpico totale della reazione dunque non e' grande, in quanto non si libera molta energia.

139
Alla ricombinazione meiotica, direttamente o indirettamente, partecipano molte altre proteine.
Gli estesi complessi proteina-DNA prendono il nome di fabbriche della ricombinazione. E’
importante sottolineare un gene in particolare, BRCA2, che svolge una funzione vitale nel
mantenimento della stabilita’ genomica. Si pensa che le mutazioni di BRCA2 siano responsabili
della meta’ dei tumori familiari al seno! Questo perche’ BRCA2 codifica per una proteina che
sembra essere fondamentale nel reclutamento di Rad51 che ripara poi il DSB. BRCA2 e Rad51
creano delle interazioni proteina-proteina che reclutano Rad51 nei siti in prossimita’ alle DSB.
Se BRCA2 non lavora bene, Rad51 non verra’ reclutato e il DSB non verra’ riparato, che puo’
portare molto facilmente o alla morte cellulare o alla traformazione neoplastica.

9.1.5: CONSEGUENZE GENETICHE DELLA RICOMBINAZIONE OMOLOGA


La ricombinazione omologa puo’ avvenire fra due regioni di DNA qualsiasi, a patto che queste
regioni siano abbastanza simili. Questo anche grazie al fatto che le sequenze ‘preferite’ dai
macchinari proteici (es. Siti Chi) siano abbastanza comuni nel DNA. Per questo, la frequenza di
ricombinazione fra due geni e’ proporzionale alla loro distanza.
Prima abbiamo menzionato la conversione genica, che e’ una causa della ricombinazione
omologa. E’ semplice capire la ragione di questo fenomeno: infatti, durante la formazione dell’
eteroduplex, si appaiano il DNA invaso e quello invadente. Bisogna pero’ tener conto che i due
filamenti non siano complementari al 100% e per questo possono formarsi dei mismatch. Gli
enzimi descritti nel capitolo 5 riparano questi mismatch, ma la scelta del filamento su cui
tagliare i nucleotidi sembra essere puramente casuale. Per questo, come vediamo sotto, puo’
cambiare il genotipo a seconda di quale filamento viene riparato.

140
9.2: LA RICOMBINAZIONE CONSERVATIVA SITO-SPECIFICA
Finora abbiamo visto due processi di ricombinazione del DNA. Nel trattamento della struttura
del genoma abbiamo incontrato gli elementi trasponibili, che vengono inseriti in regioni del
DNA senza bisogno di omologia di sequenza. Abbiamo poi visto la ricombinazione omologa che
e’ invece molto fedele e mantiene l’ identita’ del genoma. In alcuni organismi, i trasposoni sono
responsabili di molte mutazioni; al contrario, la ricombinazione omologa e’ un processo che
esclude un alto tasso di mutazione. Dobbiamo ora vedere il terzo tipo di ricombinazione, ovvero
la ricombinazione sito-specifica (o CSSR – conservative site-specific recombination). Questo
tipo di ricombinazione avviene tra due elementi definiti del DNA . Esistono delle proteine
chiamate ricombinasi133 che riconoscono le specifiche sequenze dove avverra’ la
ricombinazione ed avvicinano e uniscono questi siti in un complesso nucleoproteico detto
complesso sinaptico. In questo complesso, le ricombinasi catalizzano il taglio e l’ inserzione di
una sequenza di DNA134.
Una caratteristica essenziale della CSSR e’ che il
segmento di DNA che viene spostato porti sul sito
dello scambio genico degli specifici elementi
costituiti da corte sequenze chiamati siti di
ricombinazione. Questi siti contengono due tipi di
sequenze: quelle specificatamente legate dalla
ricombnasi e quelle dove avvengono il taglio e la
riunione del DNA. Dall’ immagine vediamo che sia
il DNA ‘entrante’ sia quello ‘accettore’ abbiano i siti di ricombinazione.
L’ immagine seguente mostra 3 possibili riarrangiamenti in seguito alla CSSR:

133
In realta' le trasposasi trattate nel capitolo 3 non sono nient' altro che ricombinasi.
134
La ricombinazione e' un processo altamente controllato nel modo da ridurre al minimo la possibilita' di
mutazione.

141
La prima mostra un’ inserzione di un segmento di DNA in uno
sito specifico. La seconda immagine mostra una delezione, altro
possibile risultato della ricombinazione e l’ esatto contrario di
quello che avviene con l’ inserzione. La terza mostra l’
inversione di un pezzo della doppia elica. Quale delle tre
avverra’ e’ determinato dall’ organizzazione dei siti di
riconoscimento. Ciascun sito e’ costituito da una coppia di
sequenze di riconoscimento della ricombinasi, organizzate
simmetricamente. Queste sequenze fiancheggiano una centrale,
detta regione dello scambio, dove avvengono il taglio e la
riunione. L’ orientamento dei due siti su una sola molecola di
DNA puo’ essere del tipo ripetizione invertita o ripetizione
diretta. La ricombinazione fra due siti invertiti da’ vita all’
inversione, mentre quella fra due siti organizzati in modo
diretto causa una delezione. L’ inserzione avviene quando due
siti presenti su due molecole diverse sono uniti per lo scambio.
L’ immagine sopra a sinistra rappresenta la composizione dei siti di ricombinazione. Parliamo
ora un po’ della ricombinasi: inanzitutto, ci sono due tipi per la CSSR: la serina ricombinasi e la
tirosina ricombinasi. Per entrambe il meccanismo fondamentale implica la formazione di un
intermedio DNA-proteina. Il residuo di una tirosina o di una serina ha il gruppo OH che agisce da
nucleofilo nei confronti di un fosfato sul sito di ricombinazione: questa reazione Sn2 porta al
legame proteina-DNA e all’ idrolisi di un legame fosfodiesterico. L’ energia di questo legame
rotto viene pero’ conservata nel legame proteina-DNA135 e per questo la reazione e’ facilmente
invertibile (da qui il nome ricombinazione conservativa), come si vede nella seguente figura:

Ongi legame del DNA che viene rotto viene dunque saldato dalla ricombinasi.
I meccanismi di ricombinazione effettuati dai due enzimi sono pero’ leggermente diversi: li
tratteremo entrambi per notare le differenze che intercorrono fra i due processi.

135
Come nel caso della topoisomerasi e della Spo11: e' infatti un meccanismo 'economico' per non spendere ATP.

142
9.2.1: LA CSSR MEDIATA DALLA SERINA RICOMBINASI
La CSSR avviene sempre fra due siti di
ricombinazione (della stessa molecola o fra due
molecole diverse). Dato che ogni sito sia
composto dalla doppia elica, la CSSR implica la
rottura di quattro legami fosfodiesterici e il loro
saldamento. Una serina ricombinasi taglia tutti e
quattro i filamenti prima dello scambio – e’
intuibile dunque che servano 4 subunita’. Questo
porta all’ esistenza di 4 segmenti a doppio
filamento (in associazione con le proteine R1, R2,
R3 e R4). Perche’ avvenga la ricombinazione, il
segmento R2 deve ricombinare con il segmento
R3, allo stesso modo R1 ricombina col segmento
R4. Una volta ottenuto questo ‘scambio’, le
estremita’ 3’-OH di ciascun filamento possono
attaccare il legame DNA-proteina come avviene
nell’ immagine a pagina precedente. Ecco che
cosi’ si sono formate due nuove molecole di DNA.

La struttura del complesso fra la serina


ricombinasi e il DNA durante il processo fornisce
un’ idea di come venga fisicamente coordinato lo
scambio tra i filamenti. Il complesso contiene 4 subunita’ proteiche e due molecole di DNA
tagliate. Fra il dimero ‘superiore’ e quello ‘inferiore’ si trova una superficie di contatto
altamente idrofobica che permette la rotazione su se’ stesse delle due meta’ poste una
sull’altra nel complesso:

143
Il meccanismo di ricombinazione consiste dunque:
- Nel taglio di DNA per formare l’ intermedio proteina-DNA
- Nella rotazione di 180 gradi dei dimeri nel complesso proteina-DNA
- Nell’ attacco delle estremita’ 3’-OH per congiungere i filamenti nella nuova
configurazione

9.2.2: LA CSSR MEDIATA DALLA TIROSINA RICOMBINASI


Le tirosina ricombinasi dapprima tagliano e
uniscono due filamenti di DNA, e solo in seguito
tagliano e uniscono gli altri due filamenti. Nell’
immagine vediamo due molecole allineate di DNA.
Le subunita’ R1 ed R3 catalizzano il taglio creando
sempre il solito intermedio proteina-DNA. Come
vediamo, il filamento grigio di sopra e quello rosso
di sotto si ‘scambiano’ i partner: questo crea una
giunzione di Holliday. Una volta terminato questo
scambio, entrano in gioco R2 ed R4 che ritagliano gli
altri due filamenti. Questi due si ‘scambiano’ i
partner: questa reazione di scambio risolve la
giunzione di Holliday creando i prodotti di DNA
riarrangiati.
Anche se il meccanismo qui e’ diverso da quello
effettuato dalla serina ricombinasi, la chimica e’ la
stessa, ed implica sempre un intermedio e poi l’
inversione della reazione di taglio.
I meccanismi della tirosina chinasi sono conosciuti
meglio di quelli per la serina ricombinasi. Un ottimo
esempio e’ dato dalla ricombinasi Cre codificata dal
fago P1, legata a due diverse configurazioni di DNA che sta ricombinando. Il compito di Cre e’
quello di circolarizzare il genoma virale lineare durante l’ infezione. Cre agisce sui cosidetti siti
lox. Il sistema Cre-lox e’ un esempio di come per la CSSR bastino la ricombinasi e i siti. Come e’
da aspettarsi, servono 4 subunita’ di Cre, ciascuna legata a un sito
di legame sul DNA. Generalmente il DNA e’ in struttura planare
cruciforme con ogni ‘braccio’ legato alla subunita’ Cre. Quello che
e’ interessante e’ il fatto che solo 2 delle 4 subunita’ si trovano
nella conformazione attiva (verde). La conformazione in viola non
puo’ effettuare il taglio. Quindi, solo una coppia di subunita’ alla
volta e’ in conformazione attiva! Con il procedere della reazione
cambia la coppia nella forma attiva. Questo cambiamento e’

144
cruciale nel controllo della progressione della ricombinazione e garantisce il modello ‘un
filamento alla volta’. Ecco l’ immagine che schematizza quanto detto:

145
9.3: UTILIZZO DEL MECCANISMO RICOMBINATIVO NELLA
MANIPOLAZIONE GENICA
Un metodo potente di transgenesi e’ la capacita’ di distruggere singoli loci genici (knock out).
Abbiamo gia visto come la ricombinazione possa appunto causare una delezione genica. Un
esempio di knock out puo’ essere dato dal gene p53 che codifica una proteina regolatrice che
attiva i geni necessari per la riparazione del DNA. Se dal genoma del topo eliminiamo il gene
p53, questa linea di topi sara’ molto suscettibile ai tumori (dato che il tumore e’ spesso
conseguenza dell’accumularsi di mutazioni sul DNA). In questo modo possiamo analizzare le
funzioni di numerosi altri geni.
I topi sono il modello animale piu’ adatto per questo tipo di studio in quanto mostrano
caratteristiche simili all’ uomo per quanto concerne i tumori. Sono stati eseguiti esperimenti di
inattivazione genica nelle cellule staminali embrionali (ES) come si vede dall’ immagine.
Queste cellule si ottengono coltivando blastocisti di
topo. Si crea un DNA ricombinante che contiene una
forma mutata del gene d’ interesse. La forma modificata
del gene bersaglio e’ associataa un gene per la resistenza
alla neomicina (gene NEO). Solo le ES contenenti il
transgene sono in grado di crescere in un terreno d
coltura contenente la neomicina. NEO e’ localizzato a
valle del gene modificato ma a monte di una regione di
omologia in modo tale che la doppia ricombinazione
dara’ luogo alla sostituzione del gene bersaglio con
quello mutato e con quello per la resistenza
all’antibiotico. Il risultato e’ la produzione di
ricombinanti ES in cui una coppia del gene bersaglio
corrisponde all’ allele mutante. Queste ES vengono
iniettate nelle blastocisti normali. Gli embrioni ibridi
vengono inseriti nel topo ospite e vengono lasciati
sviluppare fino al termine. Alcuni adulti che si formano
dagli ibridi possiedono una linea germinale trasformata e
quindi producono gameti aploidi contenenti la forma
mutante del gene bersaglio.
Vengono effettuati incroci fra topi con la linea germinale trasformata, vengono effettuati
incroci tra individui dellastessa nidata per ottenere mutanti omozigoti nei quali si puo’ quindi
studiare il gene mutato (e come le mutazioni si ripercuotono

146
9.4: FUNZIONI BIOLOGICHE DELLA RICOMBINAZIONE SITO-SPECIFICA
La CSSR viene usata per molti scopi biologici. Ad esempio, molti fagi136 usano questo
meccanismo per inserire il genoma virale in quello dell’ ospite. Altre volte la CSSR regola l’
espressione genica: l’ inversione puo’ portare all’ espressione del gene alternativo. Qualche
volta basta la sola presenza delle ricombinasi per effettuare il processo (esempio di Cre). Altre
volte pero’ serve l’ ausilio di diverse proteine: un esempio e’ dato da proteine architettoniche
che legano specifiche sequenze di DNA curvando la doppia elica per favorire la CSSR. Queste
proteine favoriscono anche il verso dell’ equilibrio nel quale avviene l’ integrazione del DNA.
Come vedremo nel prossimo capitolo, il virus denominato fago λ puo’ inserire il proprio
genoma nel batterio ospite. Questa inserzione (integrazione) viene fatta mediante la
ricombinazione sito specifica. L’ integrasi di λ, detta λInt, catalizza la ricombinazione tra due siti
specifici denominati att. Il sito attP si trova sul DNA fagico, il sito attB invece sul cromosoma
batterico. λInt e’ una tirosina ricombinasi (meccanismo analogo a quello di Cre). A differenza
del caso di Cre, qui sono necessarie diverse altre proteine per coordinare l’ integrazione.
L’ organizzazione dei due siti e’ altamente assimetrica. Entrambi hanno un core centrale con
due siti di legame per l’ integrasi e una regione di
crossing over dove avviene lo scambio. Vediamo che attP
e’ molto piu’ lungo: esso e’ composto da regioni leganti l’
integrasi e da siti per le proteine architettoniche. L’
integrazione richiede i due siti, λInt e una protena
architettonica chiamata fattore d’ integrazione dell’
ospite o IHF che piega la doppia elica. La funzione di
quest’ azione e’ di avvicinare i due siti che legano con alta
affinita’ λInt.
Come risultato della ricombinazione,
sulle giunzioni tra le sequenze del fago e
dell’ ospite si sono formati due nuovi siti
ibridi (attL e attR). Ci sono ancora le
regioni core ma i due bracci sono ora
seprati fra di loro, quindi nessuna delle
core permette l’ assemblaggio dell’
integrasi in quanto i siti importanti per l’
assemblaggio sono separati fra di loro.
Il fago codifica invece la proteina necessaria per la sua escissione dal genoma batterico,
chiamata Xis, che legando specifiche sequenze sul DNA introduce nuovamente una curvatura.
Xis riconosce le regioni X1 e X2 e insieme a λInt e IHF simola l’ escissione. Il sito che e’ ora libero

136
Un tipo di virus.

147
ricombina con l’ altro sito, riformando il cromosoma batterico circolare. Xis, oltre a stimolare l’
escissione, inibisce anche la ricombinazione (che sarebbe il verso opposto dell’ equilibrio).
Riprenderemo la nostra discussione sul batteriofago λ nel prossimo capitolo, quando useremo
questo modello per descrivere le vie complesse di regolazione genica procariotica.

148
CAPITOLO 10: REGOLAZIONE TRASCRIZIONALE DELL’
ESPRESSIONE GENICA
Finora abbiamo trattato il viaggio dell’ informazione dal genoma al proteoma, che abbiamo
definito come ‘espressione del genoma’. L’ informazione viene letta, trascritta ed
eventualmente tradotta137 in proteine. Ma qui arriviamo ad una domanda: come mai nell’
organismo animale e’ presente una varieta’ cosi’ grande di cellule anche se tutte hanno
esattamente la stessa sequenza di DNA? La risposta e’ che anche se il genoma e’ di fatto statico,
la sua espressione e’ molto variabile! La trascrizione del gene e la sua eventuale traduzione
sono sottoposte entrambe a una sofisticata regolazione che determina quanto e quando un
gene verra’ espresso. Quando viene a cambiare la richiesta del prodotto di un gene, l’
espressione di quel gene variera’ a seconda delle necessita’ cellulari. La maggior parte di questa
regolazione agisce a livello della trascrizione (cap. 6), piu’ specificamente a livello della fase di
inizio della trascrizione. Diverse proteine agiscono in vari punti per ottenere una serie di effetti
che influenzeranno su come l’ RNA Pol trascrivera’ quel dato gene. La regolazione dell’
espressione genica e’ il tema centrale della biologia molecolare: tantissime ricerche in questo
settore sono volte a identificare i profili di espressione in vari contesti fisiologici o patologici per
comprendere i meccanismi molecolari che stanno alla base di malattie, alterazioni o della
diversita’ biologica in generale. Citando di nuovo il cancro come esempio, si e’ scoperto negli
ultimi decenni che il motivo principale della sua resistenza alle terapie sia proprio la sua
capacita’ di addattare138 il profilo di espressione genica alle esigenze del tumore.
Questo capitolo e’ soltanto una mera introduzione in questo complessissimo campo. Lo scopo
e’ di fornire i concetti di base per capire le modalita’ di regolazione genica piu’ semplici. Su
questa base, i corsi piu’ avanzati costruiranno conoscenze in continua espansione. Partiremo
dal descrivere alcune modalita’ di espressione genica nei batteri, passeremo poi a descrivere il
modello del Fago Lamba che e’ un ottimo esempio di integrazione della regolazione su vari
livelli. Useremo infine i concetti introdotti per i procarioti per introdurre alcune modalita’
eucariotiche di regolazione dell’ espressione genica.

10.1: I PRINCIPI DELLA REGOLAZIONE TRASCRIZIONALE


I geni sono spesso controllati da segnali extracellulari. La cellula li percepisce e li manda nel
nucleo mediante le vie di trasduzione del segnale. Qui, questi segnali vengono comunicati ai
geni da proteine regolatrici che possono essere di due tipi: attivatori o repressori. Di solito
queste proteine legano il DNA in una porzione vicina o sul gene. Gli attivatori aumentano la
trascrizione del gene, i repressori invece la diminuiscono o la silenziano.

137
Anche se ora sappiamo che una grande quantita’ di trascritti non codifica per proteine bensi’ per gli RNA
regolatori.
138
Ricordiamo le parole di Darwin: 'sopravvive chi si addatta meglio.'

149
Come abbiamo gia’ accennato, la maggior parte di queste proteine regolatrici agisce a livello
dell’ inizio della trascrizione. Questo e’ logico, in quanto e’ favorevole dal punto di vista
energetico – ad es. non bisogna sprecare energia per la formazione di un mRNA che non verra’
utilizzato. Vedremo che qualche volta pero’ regolare l’ espressione a livello trascrizionale puo’
essere lento: in situazioni di emergenza, la cellula deve poter modificare rapidamente il suo
proteoma. Per questi motivi, sono presenti sistemi di regolazione anche a livello traduzionale.
Ma cosa fanno di concreto le proteine regolatrici? Se sono
assenti loro, l’ RNA Pol si lega debolmente a molti promotori,
perche’ uno o piu’ elementi del promotore (analizzati nel
capitolo 6, pag. 84-85) sono assenti o imperfetti. Quando la Pol
riesce a legarsi spontaneamente, si ha la transizione a
complesso aperto e inizia la trascrizione: questo porta a un
basso livello di espressione costitutiva detto livello basale. I
repressori, legandosi a una porzione del promotore detta
operatore, impediscono il legame della polimerasi al
promotore. Gli attivatori invece legano un sito di DNA vicino al
promotore: contemporaneamente con l’ altra regione
reclutano la polimerasi sul promotore e promuovono cosi’ la
trascrizione.
L’ attivatore puo’ funzionare anche in un altro modo: ci sono casi quando la polimerasi si lega al
promotore formando il complesso chiuso senza aver bisogno di altre proteine. Il compito dell’
attivatore questa volta e’ di stimolare la transizione da complesso chiuso ad aperto, inducendo
un cambiamento conformazionale nella polimerasi. Questo e’ l’ attivazione per allosteria.
Anche i repressori possono funzionare in questo modo, inibendo la transizione dal complesso
chiuso. Alcune proteine regolatrici interagiscono anche a distanza: in altre parole, anche se
sono distanti fra loro sul DNA, la creazione di un’ ansa sulla catena di DNA avvicina le due
proteine che ora possono interagire fisicamente.
Gli attivatori possono legare il DNA in modo cooperativo: due o piu’ attivatori/repressori
interagiscono sia col DNA sia tra di loro, aiutandosi a vicenda nel legare un gene che regolano
tutti insieme. Come vedremo nel caso del batteriofago lambda, questo sistema puo’ rendersi
molto efficiente nel dosare i livelli di espressione.
L’ allosteria gioca anche un ruolo importante nell’attivazione di proteine regolatrici: infatti, ci
sono proteine che sono attive in una forma e inattive nell’altra. I segnali provenienti dalle vie di
trasduzione del segnale possono indurre un
cambiamento conformazionale nelle proteine
regolatrici. Abbiamo fatto una carrelata
attraverso i fondamentali concetti – vediamo ora
degli esempi di varie modalita’ di regolazione
anticipate.
150
10.2: ESEMPI DI REGOLAZIONE ALL’ INIZIO DELLA TRASCRIZIONE
Modello 1: lac operone
Il primo modello e’ quello dell’ operone lac in Escherichia Coli. I tre geni lac – lacZ, lacY e lacA
sono adiacenti uno all’ altro sul genoma e vengono definiti nel loro insieme operone lac.

Il promotore dirige la trascrizione di tutti e tre i geni in un unico mRNA policistronico che verra’
tradotto in tre prodotti proteici. Questi prodotti nel loro insieme contribuiscono a
metabolizzare il lattosio. La fonte ‘preferita’ di energia per i batteri e’ pero’ il glucosio: l’ idea e’
quindi di spegnere questo operone quando c’e’ glucosio in modo da non sfruttare il lattosio.
Quando c’e’ invece una mancanza di glucosio, allora l’ operone viene attivato perche’ i batteri
possano degradare lattosio.
Questo e’ evidente dall’ immagine a
fianco: quando sono presenti sia glucosio
che lattosio, la polimerasi si lega
debolmente e si hanno livelli basali di
trascrizione. In assenza di lattosio e in
presenza di glucosio, viene espresso il
repressore Lac che lega l’ operatore del
promotore dell’ operone inibendo la
trascrizione. Se invece e’ presente solo
lattosio, viene espresso un attivatore
CAP che recluta la polimerasi: si hanno
quindi alti livelli di espressione, che e’
logico dato che il lattosio e’ ora l’unica
fonte di energia.
Questo e’ un meccanismo molto semplice
che schematizza pero’ la logica che sta
dietro ai modelli di espressione genica: la cellula percepisce le proprie esigenze e segnala alla
polimerasi cosa e quanto trascrivere.
Quello a destra e’ la rappresentazione dell’ operatore lac che e’
composto da due emisite, ognuno riconosciuto da una subunita’
del repressore. Esso si lega all’ operatore impedendo fisicamente il legame della polimerasi al
promotore e l’ inizio della trascrizione.

151
Come fa CAP ad attivare invece la trascrizione?
Inanzitutto diciamo che il promotre dell’ operone
lac ha un elemento -35 non ottimalmente
posizionato e manca inoltre dell’ elemento UP139.
Questo e’ il motivo perche’ la polimerasi ci si lega
debolmente. La proteina CAP ha nella sua
sequenza una regione attivatrice che prende
contatto con la polimerasi, piu’ precisamente con
il suo dominio carbossi-terminale (CTD). Sul
promotore lac, dove non c’e’ UP, alfaCTD si lega al
CAP e al DNA adiacente. Questo e’ dimostrato
anche dalla risoluzione cristallografica di un
complesso CAP, alfaCTD e un oligonucleotide di
DNA.
Come si lega CAP al DNA? Essenzalmente, queste proteine si legano al DNA come omodimeri,
con una struttura detta elica-giro-elica: un' alfa elica si lega al solco maggiore instaurando le
interazioni deboli con le basi mentre l' altra prende contatto con lo scheletro del DNA
stabilizzando la struttura. Questo e' il caso di molte altre proteine regolatrici, anche piu'
complesse delle due finora nominate.
Il repressore lac invece ha una modalita'
lievemente diversa: esso si lega come
tetramero. Ogni operatore pero' ha contatti
consolo due delle quattro subunita'. Le altre
due subunita' possono legare uno degli altri
operatori lac sul DNA, formando cosi' un'
ansa.
Resta un' ultima domanda: come fa la cellula ad attivare CAP o il repressore lac quando serve?
Quando il lattosio entra nelle cellule, viene convertito in allolattosio dalla beta-galattosidasi. L'
allolattosio controlla il repressore lac. Paradossalmente, la beta-galattosidasi e' codificata dall'
operone lac (vi e' sempre una bassa espressione dei geni lac, perche' anche in presenza del
repressore la polimerasi ogni tanto riesce a creare qualche trascritto). L' allolattosio a sua volta
si lega al repressore inducendo un cambiamento conformazionale: quest' ultimo non e' piu' in
grado di legare l' operatore e viene
rimosso.
Un meccanismo simile vale per CAP: la
presenza di glucosio stimola l’ insulina ad
abbassare i livelli cellulari del cAMP

139
Caratteristica tipica dei promotori regolati da attivatori.

152
(Adenosina Monofosfato Ciclica) che e’ l’ effettore allosterico di CAP. Solo in presenza di cAMP,
CAP lega il DNA: quindi CAP lega il DNA solo quando i livelli di glucosio sono bassi.
Abbiamo visto quindi l’ esempio di integrazione di segnale, dove l’ espressione genica e’
controllata rispettivamente da due segnali in due condizioni opposte. Bisogna anche dire che
CAP cooperi conpiu’ repressori su operatori diversi: si ha quindi il controllo combinatorio.
Questo e’ una caratteristica tipica dell’ espressione genica: un unico segnale (in questo caso il
cAMP) influenza piu’ geni diversi che sono pero’ in qualche modo legati funzionalmente.
Modello 2: Mer operone
Con questo secondo modello vedremo l’ esempio di come non sia il reclutamento della Pol l’
unico metodo degli attivatori trascrizionali. MerR e’ un attivatore che controlla l’ espressione
del gene merT che conferisce alla cellula la resistenza agli effetti tossici di Hg. In presenza di Hg,
MerR si lega a una sequenza del DNA che sta fra la regione -10 e quella -35 del promotore di
merT. MerR si lega al filamento opposto di quello dove si lega la polimerasi. Il promotore di
merT e’ pero’ anomalo e presenta una distanza non ottimale fra le due regioni. Inoltre, il
legame di MerR blocca il promotore in questa
forma sfavorevole a legare la polimerasi. Il
mercurio lega MerR e ne induce un
cambiamento conformazionale: la
conseguenza e’ che il DNA al centro del
promotore ruota, rendendo il promotore
addatto a legare la polimerasi.
L’ attivatore in nessun momento interagisce con l’ RNA polimerasi.
Modello 3: araBAD operone
Il promotore dell’ operone araBAD e’ attivo in presenza di arabinosio e assenza di glucosio: esso
induce l’ espressione dei geni necessari per il metabolismo dell’ arabinosio. In questo caso pero’
cooperano due attivatori (non c’e’ un repressore): quando e’ presente l’ arabinosio, esso si lega
all’attivatore AraC che si lega come dimero alle regioni araI1 e araI2. A monte di questi siti si
lega anche CAP, in assenza di glucosio, e promuove ulteriormente l’ espressione. Quando l’
arabinosio e’ assente, AraC ha un’ altra conformazione: un monomero si lega ancora a araI1 ma
l’ altro, invece di legare araI2, lega una regione piu’ distante detta araO2, formando un’ ansa sul
DNA e bloccando il legame del DNA con la polimerasi. Il promotore araBAD viene spesso usato
in laboratorio come vettore d’ espressione: dato che e’ facile controllare se il promotre araBAD
lavorera’ o meno (assenza o presenza di arabinosio), esso viene usato per spegnere o
accendere artificialmente dei geni quando questo e’ necessario per gli esperimenti.

153
Modello 4: Operone del Triptofano
I batteri sono in grado di sintetizzare l’amminoacido Triptofano (Trp o W) quando esso
scarseggia. L’ operone trp codifica per i cinque enzimi coinvolti nella biosintesi del Triptofano. In
presenza di questo amminoacido, il repressore si lega all’operatore e blocca la trascrizione. Qui
c’e’ pero’ una peculiarita’: anche quando non e’ presente il repressore, la sintesi di una
molecola di mRNA trp non produce sempre
un trascritto completo. Come mai?
Ricordiamo che nei batteri la trascrizione
sia accoppiata alla traduzione (i due
processi avvengono contemporaneamente)
dato che non c’e’ una compartimentalizzazione diversa dei due processi. Fra il promotore e il
primo codone di trpE (uno dei 5 geni) c’e’ una sequenza leader di 161nt. Alla fine di questa c’e’
un terminatore della trascrizione formato da una forcina fra le basi complementari delle regioni
3 e 4 della figura a destra. Quando i
livelli di Trp sono alti, la trascrizione si
ferma qui generando un RNA a 139nt.
Quando invece i livelli di Trp sono bassi,
alcune caratteristiche permettono alla
Pol di oltrepassare questo terminatore.
Inanzitutto, le forcine possono formarsi
anche fra le regioni 2/3 e 1/2, e queste
non bloccano la trascrizione di trp.
Oltre a questo, l’ RNA di 139nt ha la
sequenza con due codoni adiacenti per il Trp (che si trovano nel peptide leader mostrato a
pagina seguente)! Se il Trp manca, questo peptide leader si arresta e il ribosoma si blocca sulla
regione 1, impedendo la formazione del terminatore 3/4. Ecco perche’, se manca Trp, viene
attivata l’ espressione dell’ operone. Questa regolazione viene detta per attenuazione. Come
possiamo vedere, questo meccanismo si basa sul fatto che i due processi di trascrizione e
traduzione avvengano nellostesso compartimento allo stesso tempo. Operoni per la biosintesi
di altri amminoacidi funzionano in un modo molto simile. A pagina seguente possiamo vedere
la rappresentazione di quanto detto:

154
Con questa trattazione abbiamo finito la carrellata attraverso i meccanismi procariotici semplici
di espressione genica. Vedremo ora l’ esempio di un virus, il batteriofago lamba, che presenta
un modello dove diversi meccanismi visti finora si integrano per creare numerose sfumature di
espressione.

10.3: STRATEGIE FAGICHE: SISTEMI COMPLESSI DI ESPRESSIONE


GENICA PROCARIOTICA
Quelli visti finora sono meccanismi efficienti di regolazione che pero’ non permettono un
grande numero di livelli di espressione diversi: essenzialmente c’erano tre livelli - geni repressi,
espressi basalmente o espressi pienamente. In realta’ bisogna capire che nella maggior parte
dei casi la biologia non sia fatta cosi’, bensi’ a mille sfumature che permettono alla cellula di
addattarsi pienamente alle condizioni nelle quali si trova140. Per questo citeremo ora l’
organismo che si chiama batteriofago λ, un virus infettante E. Coli141. In seguito all’ infezione del
batterio, il fago si puo’ propagare in due modi alternativi: uno litico e uno lisogenico. Il primo
richiede la replicazione del DNA fagico e la sintesi delle proteine del capside (espressione alta di
geni per queste proteine): queste proteine si assemblano, producendo nuovi fagi e
distruggendo la cellula ospite. La via lisogenica invece consiste nell’ integrazione del genoma
fagico nel DNA nell’ ospite dove, a ogni ciclo cellulare, viene replicato passivamente, come se
fosse una parte legittima del genoma batterico. Questo lisogeno e’ definito profago. Esso e’

140
Bisogna osservare questi fatti sempre sotto la luce dell' evoluzione: milioni di anni sono serviti perche' si siano
potuti creare meccanismi cosi' sofisticati e complessi.
141
Notate che non sia la prima volta durante questo corso che usiamo i virus come esempi: pur nella loro
apparente semplicita', questi organismi (lo sono?) hanno sviluppato dei meccanismi che permettono a loro di
escogitare escamotages molecolari affascinanti e spesso unici nel mondo vivente.

155
molto stabile in condizioni normali, ma puo’ efficientemente sciegliere la crescita litica se la
cellula viene esposta ad agenti che danneggiano il DNA142. La scelta della crescita litica e’
direttamente collegata con l’ espressione dei geni per le proteine del capside. Vedremo i vari
livelli che regolano queste decisioni.
Il genoma del batteriofago contiene cca. 50 geni che codificano: proteine per la replicazione del
DNA fagico, proteine per la lisi, proteine per il capside e proteine per la ricombinazione
(ricordiamo che il genoma virale si integri nel genoma ospite mediante la ricombinazione sito-
specifica vista nel capitolo 9):

Vediamo ora piu’ in dettaglio la regione coi geni cI e cro:

Notiamo la presenza di tre promotori (viola): tutti i geni fagici che si trovano fuori da questa
piccola regione sono espressi a partire da Pl e Pr o comunque da altri promotori che sono
influenzati da geni espressi a partire da questi due. Prm trascrive invece solamente il gene cI. Pl e
Pr sono promotori forti che non necessitano di attivatori mentre Prm e’ un promotre debole che
ricorda il promotore lac.

142
E che quindi mettono in forse la sopravvivenza della cellula ospite.

156
Nella figura seguente vediamo due possibili modalita’ di espressione genica: una porta alla
crescita litica inducendo l’ espressione di geni per il capside, l’ altraquella lisogenica:

Vediamo quindi che si ha la crescita lisogenica solo quando Prm (promoter for repressor
mainteinance) e’ acceso. Vediamo ora come avviene il controllo dei promotori.
Il gene cI codifica per il repressore λ , una proteina con due
domini uniti da una regione flessibile (immagine a destra).
Come anche altri repressori, questa proteina si lega come
dimero. Ogni monomero riconosce un emisito sul DNA lungo 17
bp. La peculiarita’ di questa proteina e’ che in realta’ puo’ agire
sia da repressore che da attivatore: nel suo funzionamento e’
identico al repressore lac e a CAP.
Cro (control of repressor and other things), codificata dal gene cro, e’ dotato solo di attivita’
repressiva. Sia il repressore λ che Cro possono legarsi a uno dei 6 diversi operatori. Noi ci
concentreremo su 3 di questi, che si vedono nella figura sotto:

Questi tre operatori si trovano fra i geni cI e cro: sno quindi contenuti nei due promotori Prm e
Pr. Ognuno di questi puo’ legare sia un dimero di repressore che uno di Cro. Queste interazioni
sono pero’ dotate di diverse affinita’: il repressore lega Or1 10 volte meglio di Or2, mentre Cro
lega 10 volte meglio Or3 di Or2 e Or1. Perche’ e’ cosi’? Il legame del repressore agli operatori e’ di
tipo cooperativo! Ogni proteina ha la regione di tetramerizzazione che serve per creare un
contatto fra due dimeri: quindi, se un dimero e’ legato a Or1, esso facilitera’ il legame dell’ altro
dimero a Or2 che altrimenti non legherebbe quest’ operatore (bassa affinita’). Quindi, nella
cellula, non serve una concentrazione di repressore 10 volte maggiore per legare entrambi i siti
perche’ c’e’ la caratteristica del legame cooperativo.

157
Come si vede dalla figura, il terzo operatore non viene legato
perche’ il tetramero neoformato non puo’ prendere contatto
con un altro dimero (non facilita quindi il legame di questo all’
operatore). Il fenomeno di cooperativita’ fa si che l’ espressione
genica risenta anche di piccoli cambiamenti a livello di segnali
(come vedremo fra poco).
Come fanno il repressore e Cro a controllare le diverse
modalita’ di crescita fagica? Come mostrato nella figura di sotto, un dimero di Cro si lega a Or3,
bloccando il promotore Prm e permettendo invece l’ espressione di geni per la crescita litica a
partire dal promotore Pr (Pl svolge lo stesso ruolo ma dalla parte diversa). Quando il repressore
si lega invece a Or1 e Or2 in modo cooperativo, esso blocca il promotore Pr ma allo stesso tempo
attiva il promotore Prm, stimolando l’ espressione di geni per la via lisogenica!

E. coli rileva e risponde al danno al DNA attivando la funzione di RecA (ricordiamola dal capitolo
9). Oltre a mediare la ricombinazione, questa proteina puo’ stimolare l’ attivita’ autoproteolitica
di alcune proteine, fra cui un repressore batterico detto LexA, che inibisce i geni che codificano
gli enzimi di riparazione del DNA (risposta SOS). Il repressore λ si e’ evoluto similmente a LexA,
cosi’ che in seguito all’ attivazione di RecA effettui un’ autoproteolisi. Questo rimuove il
dominio carbossi-terminale – non c’e’ piu’ dimerizzazione – il promotore Pr non e’ piu’ inibito –
vengono espressi i geni per la crescita litica. Il fago si decide quindi per la lisi in seguito al danno
al DNA batterico. Perche’ tutto questo possa funzionare bene, i livelli di repressore devono
essere finemente controllati. Chi effettua questo controllo e’ il repressore stesso! Esso infatti
effettua sia un’ autoregolazione positiva, attivando la propria espressione, sia un’
autoregolazione negativa. Quest’ ultima si basa sul fatto che quando ce n’e’ troppo, il
repressore riesce a legare anche Or3, inibendo quindi la propria espressione e abbassando i suoi
livelli.
Finora abbiamo visto come il repressore e Cro operino in armonia per regolare il passaggio dalla
crescita lisogenica a quella litica in seguito a induzione. Vediamo ora come avviene questa
‘decisione’ nel momento dell’ infezione. In questa scelta, sono decisivi i prodotti di altri due
geni del fago, cII e cIII. A pagina seguente si vede dove stanno: cII si trova sulla destra di cI ed e’
trascritto da Pr mentre cIII si trova a sinistra di cI ed e’ trascritto da Pl. La proteina CII si lega a Pre
e stimola la trascrizione di cI da quel promotore. Il gene quindi che codifica per il repressore
puo’ essere trascritto sia da Pre che da Prm.

158
Soltanto quando il Pre ha portato alla quantita’ sufficiente di repressore, quest’ ultimo si puo’
legare a Or1 e Or2 e promuovere la propria sintesi a partire pa Prm. La sintesi del repressore e’
quindi instaurata dal promotore (stimolato a sua volta dall’ attivatore) per poi essere
mantenuta a opera della trascrizione dell’ altro promotore (autoregolazione positiva vista
prima). Riassumendo, possiamo dire che CII sia responsabile dello sviluppo lisogenico, mentre
Cro favorisce la crescita litica. In seguito all’ infezione, la trascrizione parte subito dai promotori
costitutivi Pr e Pl. Pr guida la sintesi sia di Cro che di CII, che hanno due funzioni opposte: CII
stimola la produzione del repressore che leghera’ gli operatori Or1 e Or2.

Ma se Cro e CII vengono espressi contemporaneamente, cosa determina quale dei due sara’
piu’ efficace (e determinera’ quindi ildestino del fago)? Quello che si e’ dedotto empiricamente
e’ che la crescita litica e’ favorita quando ci sono pochi fagi per batterio (in media 1 per
batterio). Quando invece piu’ di 2 fagi infettano una cellula batterica, si ha quasi sempre la
crescita lisogenica. La spiegazione molecolare e’ sensata: piu’ genomi fagici ci sono, piu’ CII e
CIII saranno prodotte e sara’stimolata la crescita lisogenica. Questo e’ logico: se ci sono poche
cellule batteriche (quindi tanti fagi per cellula), e’ rischioso effettuare la lisi e uccidere i batteri
perche’ poi c’e’ la possibilita’ di non trovare piu’ l’ ospite. Anche le condizioni giocano un ruolo
importante: se il fago infetta cellule che sono in buoni condizioni di crescita, preferisce
effettuare la lisi, mentre quando le condizioni non sono ottimali preferisce il ciclo lisogenico –
sempre perche’ in condizioni scarse c’e’ il rischio di non trovare l’ ospite (in altre parole, il fago
aspetta un momento migliore143).

143
Quanto e’ straordinaria la biologia: un essere cosi’ minuscolo , un piccolo complesso molecolare, e’ in grado di
generare risposte cosi’ raffinate..)

159
CII e' una proteina molto instabile che viene degradata da una proteasi detta FtsH codificata dal
gene hfl. Nelle cellule dove la crescita e' buona (quindi si ha un' ampia gamma di segnali di
crescita) hfl e' molto espresso il che causa una degradazione rapida di CII che non riesce a
stimolare il repressore – si ha la crescita litica. I meccanismi molecolari non sono ancora ben
noti, ma potrebbero essere dovuti a una via di segnalazione innescata da segnali di crescita che
stimolano la produzione della proteasi.
Abbiamo compreso quindi quanto sofisticata possa essere la regolazione in un organismo cosi'
semplice quanto un virus. Possiamo intuire quindi che negli eucarioti la storia sulla regolazione
debba essere notevolmente complicata, e infatti lo e'. Nei prossimi paragrafi analizzeremo
soltanto la superficie del problema, introducendo concetti di base che saranno approfonditi nei
corsi piu' avanzati sull' espressione genica eucariotica.

10.4: REGOLAZIONE DELL’ ESPRESSIONE GENICA EUCARIOTICA: UN’


INTRODUZIONE
Per comprendere bene quanto segue, consiglio di ripetere i paragrafi sulla trascrizione
eucariotica e sulla regolazione dell’ espressione procariotica. I concetti d’ ora in poi si
baseranno su queli introdotti in questi paragrafi.
Nelle cellule eucariotiche, l' espressione di un gene puo' essere regolata con tutti i meccanismi
gia' visti per i procarioti, con qualche meccanismo in piu': fra questi, abbiamo gia visto lo
splicing, che permette di generare piu' prodotti proteici diversi a partire dallo stesso gene. La
regolazione dell' inizio della trascrizione e' molto piu' complessa negli eucarioti che nei
procarioti, ma la logica di base e' la stessa. Inanzitutto, bisogna ricordare che negli eucarioti il
genoma sia avvolto attorno alle proteine istoniche formando in questo modo i nucleosomi che
compongono la cromatina. L' apparato trascrizionale si trova quindi di fronte a un substrato
parzialmente non accessibile. Questo permette di ridurre l' espressione di molti geni in assenza
di regolatori. Ci sono pero' tanti enzimi che modificano o riarrangiano gli istoni, rendendo piu'
accessibili determinati geni: i nucleosomi portano quindi a maggiori possibilita' di regolazione.
Un' altra differenza sta nel fatto che il numero dei regolatori eucariotici per un gene e' molto
piu' elevato. I siti di legame per i regolatori (siti regolatori) sono molto piu' numerosi e possono
trovarsi anche molto lontano dal punto di inizio della trascrizione. La sequenza regolatrice e' il
tratto del DNA dove risiedono tutti i siti regolatori di un gene.
Il fatto di avere piu’ regolatori riflette la necessita’ di una maggiore integrazione di segnali in
questi organismi (servono piu’ segnali per regolare un dato gene). Negli organismi pluricellulari,
le sequenze regolatrici possono essere localizzate a migliaia di nucleotidi di distanza dal
promotore, spesso ragruppate in unita’ chiamate enhancers. Questi amplificatori legano i
regolatori genici in momenti precisi per influenzare l’ espressione genica. I meccnismi con i
quali agiscono non sono sempre noti, ma piu’ avanti vedremo certi esempi che conosciamo
finora. Il fenomeno dovuto agli enhancer e’ chiamato regolazione a distanza.

160
L' immagine mostra le differenze nella
struttura delle regioni regolatrici dei tre
organismi a complessita' crescente. E' pero'
importante notare che i meccanismi che
regolano la trascrizione eucariotica sono
conservati dal lievito ai mammiferi (la
complessita' e' di certo crescente pero' un
attivatore del lievito puo' tranquillamente
attivare la trascrizione anche in un mammifero:
saggi che si fanno coi geni reporter).
Sotto sono raffigurati i vari livelli di regolazione genica negli organismi eucariotici: come
vediamo, anche il fatto che la trascrizione non sia accopiata alla traduzione e che ci sia la
compartimentalizzazione cellulare aumenta il numero dei livelli ai quali un gene puo' essere
controllato.

La maggior parte delle vie di segnalazione vanno ad influenzare il primo livello, quello del
controlo trascrizionale. Stanno pero’ emergendo sempre di piu’ problematiche legate agli altri
livelli.
Un tipico attivatore eucariotico lavora in maniera simile a quello procariotico. Una maggiore
varita’ la si incontra nei repressori, che mostrano modelli inesistenti nei procarioti, fra i quali
quello del silenziamento genico che e’ in grado di bloccare intere regioni del genoma.

10.4.1: REGOLAZIONE DELL’ ESPRESSIONE GENICA EUCARIOTICA:


INTERAZIONE FRA REGOLATORI E DNA
Gli attivatori eucarotici (come anche molti di quelli procariotici) hanno regioni ben distinte per il
legame al DNA e per l’ attivazione genica. Spesso queste attivita’ si trovano in domini proteici
separati. Gal4 e’ uno degli attivatori piu’ studiati: esso controlla l’ espressione del gene GAL1
(enzima per il metabolismo del lattosio). Sono stati fatti due esperimenti per dimostrare che le
due attivita’ siano distinte: nel primo, si e’ espresso un frammento di Gal4 che codificava solo
per la regione legante il DNA. La proteina risultante legava normalmente il DNA ma non attivava

161
l’ espressione genica. Nel secondo esperimento, si e’ prodotto un gene ibrido codificante i tre
quarti di Gal4 fusi al dominio di legame al DNA del repressore batterico LexA. Si e’ visto che
questo polipeptide ibrido, anche se aveva una regione legante il DNA alternativa, svolgeva
normalmente la funzione di attivazione. Questo dimostra quindi che non sia il dominio di
legame al DNA quello a regolare l’ attivita’ genica.

Rivolgeremo ora la nostra attenzione su come i domini leganti il DNA legano il solco maggiore e
quello minore. Nei procarioti, la maggior parte dei regolatori si legano come dimeri,
riconoscendo sequenze invertite in punti definiti. Ciascun monomero della proteina inserisce
un’ alfa elica nel solco maggiore del DNA in
corrispondenza a un emisito dove riconosce le estremita’
delle coppie di basi. Il motivo piu’ frequente e’ elica-giro-
elica144 dove un’ elica si inserisce nel solco maggiore
(specificita’) mentre l’ altra prende contatto con lo
scheletro del DNA assicurando il corretto posizionamento
della prima elica. Ogni dominio ha quindi questo motivo.
Negli eucarioti la situazione e’ molto simile: molte
proteine usano ancora il modello elica-giro-elica. Ci sono pero’ molte varianti: alcuni regolatori
usano eterodimeri (invece di omodimeri) o anche monomeri per il riconoscimento del DNA.
Descriveremo ora brevemente alcunimotivi ricorrenti negli eucarioti:
Proteine con omeodominio: si trovano in tutti gli eucarioti. Hanno una struttura molto simile ai
regolatori eucariotici. L’ omeodominio consiste in tre alfa eliche, di cui 2 formano il motivo
elica-giro-elica mentre la terza riconosce il DNA nel solco maggiore. Queste proteine spesso
formano eterodimeri.
Domini contenenti atomi di zinco: il piu’ classico fra questi e’ detto zinc finger. L’ atomo di
zinco interagisce con i residui di cisteina (zolfo) e istidina (azoto), permettendo il mantenimento
della struttura deputata al legame con il DNA. Le proteine hanno uno o piu’ di questi motivi.

144
Biochimica 1!

162
Leucine zipper: questo motivo combina in un’ unica unita’ strutturale le superfici per la
dimerizzazione e quelle per il legame al DNA. I due monomeri interagiscono mediante
interazioni idrofobiche fra leucine delle catene polipeptidiche. In basso, le eliche prendono
contatto on il DNA mediante il solco maggiore.
Proteine elica-ansa-elica: questo e’ il motivo classico incontrato nei batteri. Ci sono due alfa
eliche maggiori che interagiscono fra di loro e con il DNA, e due alfa eliche minori che mediano
le interazioni proteina-proteina.
Uncini AT: La peculiarita’ di questi motivi e’ che essi interagiscono con il solco minore. Essi
facilitano la formazione do complessi proteina-DNA altamente ordinati, come ad esempio
enhancerosomi.

Omeodominio

Zinc Finger

Leucine Zipper

Elica-ansa-elica

Unicini AT

163
Al contrario, le regioni di attvazione della trascrizione sono strutture ancora non ben definite.
Queste regioni possono essere caratterizzate ad esempio a seconda del loro contenuto
amminoacidico (che determina il meccanismo di funzionamento dell’ attivatore). Molto spesso
si tratta di catalisi acida, dove diverse regioni ripetute cariche negativamente influenzano il
legame al substrato. Le regioni attivatrici sono poco specifiche145 e possono quindi interagire
con diverse proteine bersaglio.

10.4.2: STRATEGIE DI RECLUTAMENTO SUI GENI DI COMPLESSI


PROTEICI INDOTTO DAGLI ATTIVATORI TRASCRIZIONALI EUCARIOTICI
Nei procarioti abbiamo visto che l’ attivatore influenza l’ espressione genica interagendo
direttamente con l’ RNA Pol per reclutarla sul promotore. Negli eucarioti questo non succede
quasi mai, bensi’ i meccanismi sono molto piu’ sofisticati: questo e’ dovuto principalmente all’
esistenza del complesso trascrizionale eucariotico, descritto nel capitolo 6, che ha come
obiettivo di portare la Pol sul promotore – l’ interazione fra attivatore e Pol non e’ quindi quasi
mai diretta. Gli attivatori eucariotici possono mettere in atto le seguenti strategie:
- Reclutamento dei modificatori e dei rimodellatori dei nucleosomi per rendere
accessibile il promotore
- Reclutamento del complesso dei GTF (TFIID o Mediatore, ad esempio)
- Reclutamento di stimolatori dell’ inizio e dell’allungamento della trascrizione
(pTEFb/SEC ad esempio)
Generalmente un attivatore e’ in grado di sfruttare contemporaneamente tutte e tre le
strategie, che ora vedremo in ordine.
Il complesso trascrizionale eucariotico contiene,
oltre alla Pol, numerose proteine e complessi, fra
cui il Mediatore e il complesso TFIID. Gli
attivatori interagiscono con questi complessi
posizionandoli sui geni. Altri elementi che non
interagiscono direttamente con l’ attivatore si
legano in modo cooperativo a quelli gia portati
sui geni.
Alcuni, sebbene non tutti gli attivatori sono anche in grado di indurre cambiamenti
conformazionali nelle proteine che legano, incrementando la loro efficienza nel promuovere la
trascrizione146. Il reclutamento del complesso trascrizionale sta alla base della specificita’ di
trascrizione.

145
Non funzionano con il modello chiave-serratura.
146
Ricordiamo che il Mediatore sia fatto da tantissime subunita' proteiche, molte delle quali hanno funzioni ancora
sconosciute. Una di queste potrebbe appunto essere la propagazione allosterica.

164
La seconda strategia implica l’ attivazione dei geni
mediante il reclutamento di proteine capaci di
indurre cambiamenti della cromatina. Nel capitolo 3
abbiamo visto come queste proteine siano in grado
di indurre chimicamente un cambiamento
conformazionale dei nucleosomi (ricordiamo l’
istone acetiltransferasi o HAT che aggiunge un
gruppo acetilico alle code degli istoni, o
rimodellatori SWI/SNF). Il rimodellamento e le
modificazioni chimiche possono inanzitutto rendere
accessibile una porzione del DNA che prima era
inaccessibile per la presenza del nucleosoma. L’
aggiunta di gruppi acetilici puo’ ad esempio alterare
le interazioni fra le code istoniche, ma puo’ allo stesso tempo creare specifici siti di legame per
proteine contenenti i bromodomini (capitolo 3). Un componente del complesso TFIID contiene
un bromodominio che lega in modo piu’ efficace i nucleosomi acetilati. Molto spesso questi
componenti dei complessi trascrizionali non sono indispensabili per la trascrizione, bensi’
aumentano l’ efficienza della Pol.
La terza strategia concerne quelle proteine del macchinario trascrizionale che favoriscono l’
allungamento. In alcuni geni sono presenti sequenze a valle del promotore che possono
bloccare la trascrizione in assenza di queste proteine. Nel capitolo 7 abbiamo visto che la
fosforilazione della coda CTD sulla Ser5 della sequenza ripetuta di 7 amminoacidi sia un
passaggio importante nei primi stadi della trascrizione, e la chinasi TFIIH e’ responsabile di
questa fosforilazione. La fosforilazione di Ser2 da parte di P-TEFb e’ associata invece con il
rilascio della Pol II attivata dalle sequenze del promotore. Finche’ non viene reclutato P-TEFb,
una proteina chiamata NELF associata ad altri fattori blocca la progressione della Pol II. L’
attivatore Gal4 (S. Cerevisiae) recluta P-TEFb rimuovendo NELF e stimolando la trascrizione.
Questa strategia e’ abbastanza frequente, specialmente durante lo sviluppo embrionale. Nella
Drosophila, il gene HSP70, attivato dallo
shock termico, e’ un altro esempio. Il
fattore HSF (heat shock factor) recluta P-
TEFb attivando l’ espressione di HSP70.
Questo modo di inibire la trascrizione
finche’ non e’ reclutato P-TEFb si e’
potuto evolvere anche per escludere il
metodo dei nucleosomi inibitori e quindi
rendere il promotore facilmente
attivabile dai segnali.

165
10.4.3: ATTIVITA’ A DISTANZA: ANSE E ISOLATORI
Specialmente negli eucarioti superiori, molti attivatori lavorano a distanza. Nelle cellule di
mammifero gli enhancer possono trovarsi anche centinaia di chilobasi a monte o a valle del
promotore. In Drosophila,ad esempio, la proteina Chip crea delle piccole anse che facilitano agli
enhancer di attivare il gene cut. La coesina (complesso proteico coinvolto nell’ appaiamento di
cromosomi omologhi) lega il Mediatore ma si associa anche a proteine correlate con gli
enhancer e promotori, contribuendo all’ espressione dei geni. Nonostante cioe’, resta molto da
svelare sui meccanismi a distanza.
Se un enhancer attiva un gene specifico
distante 400 kb, che cosa impedisce che attivi
anche altri geni i cui promotori si trovano sul
tratto di DNA intermedio? Specifici elementi
chiamati isolatori controllano che cio’ non
accada. Un isolatore, quando posto fra l’
enhancer e il promotore, inibisce l’
attivazione del gene da parte dell’ enhancer.
L’ isolatore non vieta pero’ all’ enhancer di
attivare un altro gene e non fa in modo che
quel promotore non possa essere attivato da
un altro enhancer. Gli isolatori legano spesso
una proteina zinc-finger chimata CTCF che si
lega alla coesina: insieme, creano un’ ansa nel cromosoma col promotore piu’ vicino
impedendo di conseguenza ad enhancer piu’ lontani di formare altre anse simili. Gli isolatori
sono anche in grado di inibire modificazioni strutturali a carico della cromatna. Essi sono, ad
esempio, in grado di ‘salvare’ determinati geni dal silenziamento trascrizionale (che vedremo
piu’ avanti). In sintesi, gli enhancer e gli isolatori lavorano in modo coordinato per dirigere l’
espressione genica in vari contesti cellulari.

10.4.4: INTEGRAZIONE DEL SEGNALE: REGIONI DI CONTROLLO DEI


LOCUS E CONTROLLO COMBINATORIO
I geni per la globina umana sono espressi nei globuli rossi di cellule di individui adulti e, durante
lo sviluppo, in vari precursori dei globuli rossi. Ci sono 5 diversi geni per la globina nell’ uomo.
Questi geni non sono pero’ espressi tutti allo stesso tempo (dipende dallo stadio di sviluppo).
Ogni gene ha un suo assetto di siti regolatori,
ma tutti hanno in comune la regione di
controllo del locus (LCR). Questa regione
ragruppa sia enhancer, che isolatori, che
promotori.

166
L' azione coordinata di proteine che legano LCR fa in modo che determinati geni associati a quel
LCR siano espressi solo in determinate fasi. Ma cosa fa di preciso LCR? Alcuni esperimenti
hanno dimostrato che nel momento che uno di questi geni viene espresso attivamente, il suo
promotore e' molto vicino a LCR: l' attivazione da parte di LCR e' associata a un' effettiva
modificazione della cromatina che avvicina questa regione al gene che deve venir espresso.
Rivolgiamo ora l' attenzione al fenomeno di integrazione dei segnali: un modello primordiale lo
abbiamo visto con l' operone lac (dove erano possibili 3 scenari diversi a seconda della
presenzao assenza di lattosio e glucosio). Negli eucarioti l' integrazione dei segnali e' usata
ampiamente. Quando molti attivatori operano assieme, lo fanno in modo sinergico e cio'
significa che il loro effetto complessivo e' molto maggiore della somma degli effetti dei singoli
attivatori presi da soli. Due attivatori possono reclutare un singolo complesso, ad esempio
quello del Mediatore, contattandolo in diversi punti. L' energia del legame dei due elementi
avra' un effetto esponenziale sul reclutamento: dalla chimica fisica e' nota la formula
RT x lnK = -ΔG
La costante di equilibrio e' correlata quindi in modo esponenziale all' energia di legame: ecco la
ragione del fenomeno di cooperativita' fra due attivatori. La cooperativita' puo' anche essere
data da un modello che abbiamo visto nei batteri, ovvero dall' interazione fra gli attivatori
stessi. Questa puo' essere diretta (a), oppure un attivatore
puo' reclutare degli elementi che facilitano il legame dell'
altro attivatore (b). La sinergia e' essenziale per l' integrazione
del segnale da parte degli attivatori: se per attivare un gene
occorrono due segnali, esso sara' attivo pienamente solo in
presenza di entrambi gli attivatori, ognuno dei quali comunica
al gene un segnale distinto. Nell' immagine a fianco vediamo
altri due modelli che garantiscono la sinergia: un attivatore
puo' reclutare sullacromatina il rimodellatore che rende
favorevole l' attacco al DNA dell'altro attivatore (c). E'
possibile anche che lo stesso attivatore crei un cambiamento
nella struttura della cromatina, 'svelando' il sito regolatore
per l' altro attivatore (d).
Vedremo ora un esempio di legame cooperativo degli
attivatori. Il gene dell' interferone beta umano viene attivato
in seguito a infezione virale. L' infezione provoca la sintesi di 3
attivatori: NF-kB, IRF e Jun/ATF. Queste proteine legano
cooperativamente un enhancer che si trova 1kb a monte del promotore. L' enhancerosoma
cosi' formato lega CBP (CREB-binding protein) o la proteina p300. Queste proteine possono
acetilare gli istoni e possono reclutare attivita' di rimodellamento in forma di SWI/SNF. Oltre ai
3 attivatori, anche la proteina HMGA1 lega l' enhancer. Questa proteina, legando il solco
minore e raddrizzando il DNA, aiuta l'assemblaggio dell' enhancerosoma.
167
Soltanto quando tutti gli attivatori sono assemblati sull' enhancerosoma, il gene INF beta e'
espresso bene. IFN a sua volta stimolera' i macrofagi e le cellule NK ad opprimersi all' infezione
virale.
Gli attivatori menzionati si legano in modo cooperativo, non solamente sfruttando le interazioni
proteina-proteina ma anche cambiando la conformazione del DNA e interagendo con il
coattivatore CBP. Sotto vediamo lo schema del legame di questi attivatori e la struttura
cristallografica dell' enhancerosoma: notiamo che il DNA legato agli attivatori sia raddrizzato e
che praticamente tutte le basi dell' enhancer siano legate dagli attivatori (ragione per cui
questo enhancer resto' conservato per milioni di anni):

10.4.5: REPRESSORI EUCARIOTICI SEMPLICI


Negli eucarioti non esiste il modello secondo il quale il repressore si lega all’ operatore per
bloccare fisicamente l’ accesso della polimerasi al promotore. Esistono pero’ diversi meccanismi
che reprimono l’ espressione:
- Il repressore puo’ legarsi al suo sito che e’ adiacente al sito dell’ attivatore, bloccando l’
attivatore stesso nellasua attivita’ di reclutamento
- Il repressore puo’ legarsi a un suo sito isolato ma puo’ prendere contatto con l’
attivatore mediante le interazioni proteina-proteina, bloccandolo.
- Il repressore puo’ legare l’ apparato trascrizionale (es. il Mediatore), bloccandolo.
- Il repressore puo’ reclutare i modificatori degli istoni influendo sulla cromatina

168
Per esempio, le istone deacetilasi reprimono la trascrizione eliminando gruppi acetilici dalle
code istoniche (i gruppi acetilici promuovono la trascrizione)147. Altri enzimi aggiungono gruppi
metilici e cio’ reprime frequentemente la trascrizione.
Qui sotto vediamo il meccanismo dell’acetilazione e della deacetilazione istonica:

Nell’ acetilazione, l’ enzima strappa un protone all’ istone usando un Glutammato. La molecola
di Acetil-Coa fa da donatore del gruppo acetile alla molecola che lega il carbonio tioestereo.
Quando l’ equilibrio e’ spostato a destra, si avra’ la deacetilazione nella quale l’ enzima fara’ da
donatore di protoni.
Consideriamo ora un esempio: il repressore Mig1 che
e’ coinvolto nella regolazione dei geni GAL del lievito.
Fra il sito di legame di GAL4 (che abbiamo visto in
precedenza) e il promotore c’e’ il sito per Mig1. In
presenza di glucosio, Mig1 lega questo sito e spegne i geni GAL: la cellula esprime soltanto gli
enzimi per metabolizzare il galattosio. Mig1 reprime i geni reclutando un complesso di
repressione contenente la proteina Tup1. Sono stati proposti due meccanismi:
- Tup1 recluta l’ istone deacetilasi -> agisce sui nucleosomi
- Tup1 agisce direttamente sull’ apparato trascriziona

10.4.6: CONTROLLO DEI REGOLATORI TRASCRIZIONALI MEDIANTE LE


VIE DI TRASDUZIONE DEL SEGNALE
Negli organismi pluricellulari, il comportamento di una singola cellula e’ fortemente influenzato
dalle presenza di altre cellule (dello stesso tessuto ma anche di tessuti diversi). Molto spesso un
gene puo’ venir espresso o meno in funzione di segnali provenienti dall’ ambiente circostante. I
segnali possono essere sia piccole molecole che proteine rilasciate da una cellula e catturate da

147
Paradossalmente, l’ istone deacetilasi Rpd3 e' reclutata anche per attivare geni che assicurino la fedelta'
trascrizionale. I nucleosomi vengono deacetilati in seguito all' allungamento da parte della Pol II per evitare l' uso di
promotori 'criptici' all' interno dell' unita' trascrizionale. Questo e' solo uno degli esempi della complessita' che
incontriamo nel mondo dell' espressione genica eucariotica.

169
un’ altra. Solitamente la membrana cellulare contiene dei recettori specifici che riconoscono il
segnale e lo propagano dentro alla cellula, attivando altri segnali che attraverso vari livelli
vanno infine ad influenzare il modello di espressione genica. Questo prende il nome di via di
trasduzione del segnale. Il segnale e’ il ligando che si lega al recettore sulla membrana. La
maggior parte dei segnali viene trasmessa ai geni mediante cascate anche molto complesse che
servono per la regolazione e per l’ amplificazione. Negli eucarioti, tantissime vie di trasduzione
si integrano per garantire una sofisticata rete di controllo e per regolare tutti gli aspetti
biochimici dell’ organismo. Proprio questo fenomeno e’ responsabile della straordinaria
complessita’ biologica degli organismi eucariotici: i geni contengono l’ informazione per la
sintesi proteica – le proteine a loro volta controllano un’ infinita’ di reazioni biochimiche. E’
chiaro qundi che il modo in cui un gene viene espresso va ad influire sull’ intera omeostasi dell’
organismo. Per questo motivo, i tipi e la natura delle vie di trasduzione saranno ampiamente
analizzati nel corso di Biologia Cellulare, mentre noi qui accenneremo soltanto a come queste
vie influenzano i regolatori trascrizionali.
Nei batteri abbiamo visto un modello semplice ma efficiente di segnalazione, dove la presenza
di due ligandi (glucosio, galattosio) puo’ modificare il profilo di espressione. Negli eucarioti le
vie sono molto piu’ complesse e numerose, ma il ragionamento e’ simile. C’e’ sempre il segnale
esterno che comunica alla cellula quali geni e in che misura deve esprimere (o reprimere).
Per citare un esempio semplice di via, vediamo il recettore JAK: esso riconosce il segnale
esterno in forma di citochina. Una volta che essa si lega, il recettore dimerizza e le due chinasi
JAK si fosforilano a vicenda in siti specifici. A questo punto a questi siti si lega la proteina STAT
che di conseguenza si autofosforila. In questa forma, essa entra nel nucleo legando particolari
siti e regolando l' espressione genica.

C'e' poi una vastita di altri meccanismi ma questo e' servito solo per dare un' idea di come
funzioni la cosa.
Come puo' un segnale, una volta che e' stato comunicato, regolare l' espressione dei geni? Nei
batteri abbiamo visto che spesso viene modificata allostericamente la capacita' dei regolatori di
legare il DNA. Anche se ci sono delle eccezioni, questo caso e' raro negli eucarioti, dove invece
abbiamo altre strategie:
- Smascheramento della regione di attivazione sul regolatore
- Trasporto verso l' interno o l' esterno del nucleo dei regolatori trascrizionali
170
10.4.7:REPRESSIONE MEDIATA DAL SILENZIAMENTO GENICO
Finora abbiamo trattato la regolazione trascrizionale dovuta ad attivatori e repressori che si
legano nelle vicinanze del gene inducendo effetti locali sull’ espressione. Il silenziamento
trascrizionale e’ un effetto di posizione e dipende dalla localizzazione fisica del gene nell’
ambito del cromosoma: non e’ una risposta al segnale proveniente dall’ ambiente. Il
silenziamento puo’ diffondersi su lunghi frammenti di DNA bloccando la trascrizione di interi
pezzi di cromosoma (parliamo anche di centinaia di geni repressi).
La forma piu’ comune di silenziamento e’ associata a una
conformazione della cromatina piu’ densa, definita
eterocromatina (capitolo 3). E’ una struttura fortemente
compattata, ileggibile dall’ apparato trascrizionale e
solitamente associata a specifiche regioni cromosomiche quali
i telomeri o centromeri. Se i geni vengono artificialmente
spostati in una regione eterocromatica, essi vengono
solitamente innattivati o espressi irregolarmente.
Abbiamo gia visto che la cromatina puo’ essere modificata
mediante la modificazione chimica degli istoni che a loro volta influenzano la struttura
nucleosomica. Le modificazioni di questo genere sono generalmente associatre a processi
molecolari su larga scala come replicazione, ricombinazione e trascrizione. Abbiamo anche visto
altre modalita’ di rimodellamento nucleosomico e proteine che si legano a nucleosomi
modificati. Il silenziamento eterocromatico puo’ essere visto come un ampliamento di tutti
questi principi e meccanismi. Il silenziamento puo’ anche essere dovuto all’ azione della DNA
metilasi che metilando il DNA puo’ inibire l’ espressione sia bloccando il legame dell’ apparato
trascrizionale sia favorendo il legame dei repressori.
Considereremo, come esempio, i telomeri del lievito S. Cerevisiae:

Le parti terminali di ciascun cromosoma si trovano sottoforma della struttura compatta che si
vede nell’ immagine. Questa porzione di cromatina e’ meno acetilata del resto del cromosoma
che e’ eucromatico. Le tre proteine della famiglia Sir (silent information regulator), Sir2, Sir3 e
Sir4 sono responsabili di questo silenziamento, formando il complesso insieme alla proteina
Rap1. Da notare che Sir2 sia un’ istone deacetilasi (HDAC).

171
Le regioni deacetilate vengono riconosciute dal complesso di silenziamento che si autopropaga
cooperativamente. Sir2 (deacetilazione) e Rap1 (specificita’) sono essenziali per il
silenziamento: se manca una di queste, l’ espressione in queste regioni non verra’ spenta. Come
e’ impedita l’ autopropagazione lungo tutto il cromosoma? Si pensa che la metilazione della
coda dell’ istone H3 (regioni colorate in blu nell’ immagine) agisca impedendo il legame di Sir2
alla cromatina e la conseguente propagazione del complesso di silenziamento. Il compito di
metilare le code istoniche e’ affidato all’ istone metiltransferasi148:

L’ enzima usa la SAM (S-Adenosil metionina) come coenzima, trasferendo l’ unita’ metilica sulla
Lys dell’ istone H3. La SAM si trasforma quindi in SAHC (S-Adenosil omocisteina)149.
Nel capitolo 3 abbiamo detto che i siti metilati siano riconosciuti dalle proteine contenenti un
cromodominio. In Drosophila, una di queste e’ la proteina HP1 che in questo organismo e’ un
componente dell’ eterocromatina silente. HP1 lega la cromatina sui siti metilati, una
modificazione dovuta all’ enzima codificato dal gene Su(Var)3-9 – soppressore della
variegazione. Questo gene e’ espresso casualmente in alcune cellule, in altre e’ spento. La
variegazione e’ evidente nel caso del gene white, responsabile del colore degli occhi di
Drosophila. Il gene white, quando espresso, porta a un colore rosso. Su(Var)3-9 silenzia white in
certe cellule portando a un fenotipo rosso-biancastro. Quando Su(Var)3-9 e’ mutato, white non
e’ piu’ silenziato e porta a un fenotipo rosso uniforme. Con meccanismi ancora ignoti, Su(Var)3-
9 viene portato sull’ eterocromatina e, metilandola, favorisce l’ attacco di HP1 che condensa
ulteriormente questa porzione cromatinica.
La metilazione istonica indotta dalla condensazione del cromosoma viene utilizzata anche da
Polycomb (Pc), un importante gruppo di repressori delle cellule animali. I repressori Pc esistono
in due complessi proteici, Polycomb 1 e Polycomb 2 (PRC1 e PRC2). PRC2 viene reclutato da
proteine che legano il DNA nel modo sequenza-specifico (nell’ immagine PHO-RC) che
interagiscono con PRE (Polycomb Response Element). PRC2 trimetila150 la Lys 27 della coda dell’

148
E' interessante notare che la metilazione qualche volta sia associata al silenziamento, qualche volta invece all'
aumento dell' attivita' trascrizionale. Essa puo' quindi sia impedire la propagazione del complesso di silenziamento,
sia l' assemblaggio di attivatori – quest' ultima azione diminuisce il rate di trascrizione.
149
E' una reazione del ciclo dei metili (Biochimica II).
150
Mediante l' istone metiltransferasi che prende il nome di Enhancer di Zeste)

172
istone H3 e in questo modo recluta PRC1 che si pensa condensi la cromatina. Si e’ scoperto che
gli elementi PRE si trovino sempre in prossimita’ del promotore del gene che viene silenziato.

Ecco invece il meccanismo della metiltransferasi associata a PRC1:

Abbiamo visto alcuni esempi di come singole modificazioni istoniche influenzano l’ espressione
genica. La storia pero’ sembra essere incredibilmente piu’ complessa: si sa ora che sulle code
istoniche siano presenti contemporaneamente piu’ modificazioni (e non una sola) e si e’
proposto il modello del ‘codice istonico’ secondo il quale diverse proteine riconoscono la
sequenza di modificazioni sulle code e in base a questa interpretazione agiscono regolando l’
espressione.
Anche il DNA puo’ venir metilato, non soltanto le code istoniche.
Ampie zone del genoma dei mammiferi sono caratterizzate da
metilazioni, come anche le porzioni eterocromatiche. Le sequenze
metilate sono spesso riconosciute da proteine che a loro volta
reclutano HDACs e le istone metilasi che mediante le loro attivita’ contribuiscono alla
condensazione della cromatina.
I profili di espressione genica possono a volte essere ereditati. Anche se un particolare segnale
che induce l’ attivazione di specifici geni nelle cellule durante lo sviluppo e’ presente per un
breve lasso di tempo, la sua conseguenza (attivazione genica) puo’ rimanere presente per molte
generazioni. Questa ereditarieta’ e’ nota come regolazione epigenetica.
173
Questo tipo di regolazione e’ in contrasto con molti modelli che abbiamo visto finora. Ad
esempio, gli attivatori indotti dal galattosio restano attivi solamente in presenza di galattosio –
quando questo segnale cessa, i geni vengono spenti a causa dell’allontanamento dell’
attivatore. Un esempio di regolazione epigenetica e’ il mantenimento dello stato lisogenico del
fago λ. Esso mantiene questo stato anche dopo la divisione cellulare dell’ ospite perche’ la
sintesi del repressore (che blocca la transizione allo stato litico) e’ mantenuta mediante
autoregolazione. Solamente un segnale quale il danno del DNA da parte dei raggi UV induce il
passaggio allo stato litico. Negli eucarioti, le modalita’ di ereditarieta’ epigenetica sono legate
alla metilazione del DNA e alle modificazioni istoniche. Anche se sono stati proposti modelli
interesssanti, resta molto da scoprire in questo campo.

10.5: GLI RNA REGOLATORI


Abbiamo analizzato finora la regolazione trascrizionale dell' espressione genica negli eucarioti e
nei procarioti e abbiamo visto come proteine di diversi tipi siano responsabili di una varieta' di
modelli regolativi. Ma gia' Jacob e Monod (i primi scienziati che studiarono la regolazione dell'
espressione genica) ipotizzarono che non siano solo le proteine quelle a svolgere il ruolo
regolativo bensi' anche molecole di RNA. Per diversi decenni queste ipotesi non sono state
molto considerate, fino agli anni '90 quando c'e stata un' incredibile serie di studi sugli RNA
regolatori, principalmente negli eucarioti, che funzionano a livello trascrizionale e sopratutto
traduzionale. Ai giorni d' oggi, la ricerca sugli RNA regolatori diventa sempre piu' importante, in
quanto si e' scoperto che essi giocano un ruolo di fondamentale importanza in diverse
patologie. Questo paragrafo e' anche interessante in quanto arricchisce il dogma centrale della
biologia molecolare: infatti, sappiamo ora che lo scopo di molti RNA non sia quello di produrre
le proteine bensi' di agire per conto proprio sulla regolazione. La trascrittomica e' quella parte
della moderna biologia molecolare che studia l' intero corredo di RNA (trascritti) all' interno di
una cellula, con lo scopo di svelare le numerose funzioni ancora in largaparte misteriose di
queste molecole. Finora abbiamo incontrato l' mRNA, il tRNA e l' rRNA. Questi trascritti
contribuiscono al classico flusso di informazione descritto dal dogma centrale. Ci occuperemo
ora del micro RNA (miRNA) ,dell' RNA interference (RNAi) e di small interfering RNA (siRNA)
che sono solo tre dei molti cosidetti non-coding RNA (ncRNA). Salteremo la descrizione della
regolazione mediata da RNA nei batteri, ampiamente descritta dal Watson (Settima edizione,
pag. 718-728).

174
10.5.1: GLI RNA REGOLATORI EUCARIOTICI: PANORAMICA
Sono stati classificati in base alla dimensione, al meccanismo di azione e in base all’ origine. Si
pensa che tra il 30% e il 70% dei geni eucariotici sia in qualche modo regolata da molecole di
RNA. Molti RNA brevi reprimono o silenziano l’ espressione dei geni omologhi ad essi: talvolta
lo fanno inibendo la traduzione dell’ mRNA, qualche volta degradano il trascritto, altre volte
ancora silenziano il promotore del gene da reprimere.
Prima di descrivere la sintesi dei piccoli RNA regolatori,
vediamo una panoramica del silenziamento genico da
loro operato. Gli RNA prodotti artificialmente o
sintetizzati in vivo a partire dai precursori dsRNA sono
denominati small interfering RNA o siRNA. Un altro
gruppo e’ costituito dai microRNA (miRNA) che derivano
da precursori a RNA codificati da specifici geni. Sia i siRNA
che i miRNA derivano da molecole di RNA piu’ lunghe
grazie all’ enzima Dicer. Questo enzima processa i dsRNA
piu’ lunghi che derivano dai precursori dei miRNA (piu’
avanti). I siRNA e miRNA generati sono di norma lunghi
21-23 nt. Questi piccoli RNA inibiscono l’ espressione di
geni bersaglio omologhi in 3 modi diversi, rappresentati
nell’ immagine:
- Degradazione dell’ mRNA
- Inibizione della traduzione del mRNA
- Modificazione della cromatina – silenziamento
Straordinariamente, qualunque sia la modalita’ di repressione, il macchinario e’ sempre lo
stesso: e’ un complesso denominato RNA-induced silencing complex o RISC che oltre al
piccolo RNA contiene diverse proteine fra cui un membro della famiglia Argonauta. Per
fornire specficita’ a RISC, i piccoli RNA devono prima essere denaturati per fornire un RNA
guida. L’ RNA passeggero e’ invece quella porzione che viene eliminata. RISC maturo viene
diretto sull’ RNA bersaglio: il modello di inibizione dipende da quanto combaciano i due
RNA151. In quei casi dove l’ mRNA bersaglio viene degradato, Argonauta e’ la subunita’
catalitica che esegue il primo taglio: per questa ragione esso e’ anche denominato Slicer.
RISC maturo puo’ anche essere diretto nel nucleo dove recluta altre proteine che
modificano la cromatina intorno al promotore, silenziando la trascrizione mediante
meccanismi visti in precedenza. La differenza fra miRNA e siRNA e’ che i miRNA vengono
codificati da una regione ma agiscono sull’ altra mentre i siRNA agiscono in cis, ovvero sulla
stessa regione che li codifica. Un’ altra caratteristica dell’ inibizione operata da questi RNA
e’ la sua estrema efficienza: piccole quantita’ di dsRNA precursore sono spesso sufficienti a
151
Solitamente nel caso dei siRNA, l' omologia e' elevata.

175
indurre un silenziamento completo dei geni bersaglio. Questo e’ merito dell’ azione di una
RNA polimerasi RNA-dipendente (RdRP). RdRP amplifica il segnale inibitorio nel seguente
modo: RdRP produce il dsRNA dopo essere stata portata sull’ mRNA dallo stesso siRNA!
Questo processo a feedback produce grandi quantita’ di siRNA.

10.5.2: SINTESI E FUNZIONE DEI miRNA


I miRNA sono codificati dal genoma come porzioni di trascritti piu’ lunghi. La forma funzionale
di miRNA puo’ variare da 19 a 25 nt. Sono prodotti mediamente da due reazioni di taglio a
partire del trascritto piu’ lungo che si chiama pri-miRNA. Il primo taglio del pri-miRNA libera
una forcina (struttura secondaria dell’ RNA) che viene definita pre-miRNA , mentre il secondo
taglio produce il miRNA maturo dal pre-miRNA. A fianco alcune strutture dei pre-miRNA
conosciuti. Recentemente, sono stati riportati
numerosi esempi dove entrambi i ‘bracci’ del pre-
miRNA producono dei miRNA funzionali
(rispettivamente segnati in rosso e in blu). Ognuno di
questi miRNA ha una propria serie di geni bersaglio. I
pre-miRNA si possono trovare sia sugli introni, che
nelle regioni codificanti e in quelle leader. In tutti i
casi, il trascritto pri-miRNA ha delle caratteristiche
regioni con sequenze secondarie che sono il fulcro
dei futuri pre-miRNA. Le due reazioni di taglio
necessarie per produrre il miRNA maturo sono
mediate da due RNasi distinte. Una e’ Dicer che
abbiamo gia menzionato. L’ altra e’ Drosha: essa e’
attiva solo nel caso specifico di miRNA.

176
Entrambi questi enzimi funzionano in base alla struttura dei loro substrati e non in base alla
sequenza specifica152!
Il primo enzima a lavorare e’ Drosha: essa separa pre-miRNA da pri-
miRNA operando due tagli. Drosha agisce insieme ad una subunita’
proteica (DGCR8) essenziale per la specificita’: nel loro insieme, queste
proteine vengono chiamate complesso del Microprocessore. Il pre-
miRNA e’ solitamente lungo 65-70 nt. L’ azione di Drosha succede
interamente nel nucleo. Lo stelo formato dall’ appaiamento di basi e’
solitamente lungo attorno a 33 nt. Sulla cima del stelo c’e’ un’ ansa che
non e’ importante per le reazioni di processamento. Ad essere
importanti sono invece due regioni di RNA a singolo filamento alla fine
dello stelo:qui avviene il taglio.

Drosha taglia approssimativamente 11bp dalla giunzione dsRNA-ssRNA, ovvero tra le porzioni
inferiore e superiore dello stelo del pri-miRNA. Il Microprocessore lascia una breve sporgenza a
ssRNA nel pre-miRNA, che e’ fondamentale per il riconoscimento da parte di Dicer. A questo
punto il pre-miRNA viene esportato dal nucleo nel citoplasma dove opera Dicer. Anche questo
enzima riconosce il substrato in base alla dimensione e non in base alla sequenza. Dicer e’
formato da tre moduli: due domini di RNasi e un dominio di legame al dsRNA chiamato dominio
PAZ (composto da proteine Piwi, Argonauta e Zwille). Il dominio PAZ si trova alla base del
‘manico’ proteico, dove forma una tasca di legame per l’ estremita’ 3’ del dsRNA substrato. I
domini superiori contengono due attivita’ catalitiche identiche che effettuano i due tagli nella
regione dell’ ansa che si trova sulla cima dello stelo. Dicer agisce quindi su qualsiasi pre-miRNA,
indipendentemente dalla sua sequenza, effettuando la sua attivita’ di taglio153.
L’ azione di Drosha non e’ necessaria per i siRNA, come neanche per i miRNA nelle piante.
Ci interessa ora vedere come i piccoli RNA riescano a silenziare l’ espressione genica. Abbiamo
gia visto come dall’ azione di Dicer si ottiene l’ RNA guida che servira’ per laspecificita’ di RISC. Il
componente centrale del complesso e’ la proteina Argonauta che taglia l’ RNA: il meccanismo di
silenziamento piu’ studiato al momento e’ appunto lo slicing dell’ mRNA. Vediamo come
avvenga la formazione di un RISC attivo. Il piccolo dsRNA prodotto da Dicer viene incorporato in

152
Ecco una conseguenza della straordinaria versatilita' dell' RNA.
153
L’ esistenza di domini PAZ di diverse dimensioni correla con l’ esistenza di diverse dimensioni dei prodotti di
Dicer.

177
RISC che lo denatura, eliminando l’ RNA passeggero. Si e’ formato quindi RISC maturo, pronto
per il riconoscimento e il taglio dell’ mRNA bersaglio. La chiave della spiegazione del
meccanismo di taglio risiede nella struttura cristallografica di Argonauta. Similmente come
Dicer, esso ha un dominio PAZ e uno
RNasico. PAZ riconosce specificamente il
3’ dell’ RNA guida. Il legame dell’ RNA
guida all’ mRNA bersaglio posiziona il
dominio del sito attivo dell’ RNasi in
modo appropriato per tagliare il bersaglio
(il taglio avviene cca. a meta’ del duplex
formato fra RNA guida e bersaglio).
RISC puo’ anche agire a livello dell’ inizio della traduzione, inibendo il caricamento del ribosoma
(capitolo 8) e il reclutamento dei fattori d’ inizio. Puo’ ad esempio avvenire l’ inibizione del
legame di eIF al 5’ del Cap (RISC effettua l’ adenilazione la coda Poly-A), oppure il blocco del
legame della 60S all’ mRNA da tradurre. C’e’ ancora tanta controversia sulla successione degli
eventi in questo tipo di regolazione: infatti, non si e’ sicuri se il taglio dell’ mRNA e il blocco
della traduzione siano mutualmente esclusivi come meccanismi.
I miRNA e i siRNA possono pero’ agire anche a livello
trascrizionale. Il meccanismo e’ stato studiato nel
lievito S. pombe dove il silenziamento centromerico
(simile aquello telomerico visto precedentemente)
richiede l’ azione di RNA regolatori. Nelle zone
centromeriche sono presenti molte sequenze ripetute
che contribuiscono al silenziamento, mentre gli istoni
in queste regioni hanno i tipici segnai repressori (bassi
livelli di acetilazione e la metilazione della Lys 9). Si e’
scoperto che la perdita di un qualsiasi componente
della via di maturazione dell’ RNAi (che comprende
miRNA e siRNA) portava alla perdita della metilazione
della Lys 9 e quindi a un mancato silenziamento delle
zone centromeriche. Come anticipato, la chiave di
questo meccanismo sono le ripetizioni centromeriche:
questi elementi di sequenza sono trascritti su
entrambi i filamenti dell’ RNA Pol II, portando alla
formazione di trascritti complementari che ibridando
possono dare origine ai dsRNA, un processo
amplificato dalla RdRP. Questi dsRNA sono processati
dal macchinario per RNAi generando i siRNA che in
qualche modo (per ora misterioso) dirigono un
complesso simile a RISC e contenente Argonauta
178
(RNA- induced transcriptional silencing o RITS) sui centromeri. Questo reclutamento porta al
silenziamento dei trascritti centromerici che a sua volta e’ necessario per la diffusione dell’
apparato di modificazione istonica lungo il centromero.

10.5.3: miRNA E LE PATOLOGIE UMANE


Il ruolo emergente degli RNA regolatori (per ora in particolare di miRNA) e’ molto importante
per le applicazioni biomediche della biologia molecolare. Nei tumori generalmente si osserva
una diminuzione nella quantita’ di molti miRNA. Per questo possiamo assumere che i miRNA
siano di fatto degli oncosoppressori. Ci sono pero’ altri miRNA il cui livello sembra essere piu’
elevato nei tumori: questi miRNA sono definiti oncogenici. I bersagli di questi miRNA sono di
solito geni coinvolti nel ciclo cellulare o nell’ apoptosi.
Per esempio, i miRNA miR-15 e miR-16 inducono l’ apoptosi
cellulare regolando negativamente il gene BCL2. E’ chiaro quindi
che una mancata azione di questi miRNA avra’ un effetto
oncogenico in quanto l’ apoptosi non sara’ correttamente svolta
(e sappiamo che una delle caratteristiche chiave del cancro sia
appunto l’ evasione dall’apoptosi). La forma piu’ comune di
leucemia adulta nell’ emisfero occidentale e’ la leucemia
linfocitica cronica (CLL), una malattia associata a delezioni nelle
regioni del genoma codificanti per i due miRNA. Al contrario, in
un’ altra regione del genoma si e’ notata l’amplificazione in molti
tumori di un gene codificante per il miR-17-92, che ha un’ attivita’
oncogenica in quanto degrada delle proteine oncosoppressori
quali PTEN e RB2.

Con questa trattazione sugli RNA abbiamo concluso il capitolo sulla regolazione dell’
espressione genica. Questo capitolo e’, come gia accennato, solo un primissimo strato di
pittura. Abbiamo dato una panoramica delle varie modalita’ di regolazione per fornire le basi
per poter affrontare i corsi piu’ avanzati sull’ argomento. Una cosa e’ sicura e cioe’ il fatto che l’
espressione genica e’ un fenomeno incredibilmente piu’ complesso di quanto descritto in
questo capitolo, sulla comprensione del quale stanno lavorando innumerevoli team di ricerca in
tutto il mondo. La comprensione della regolazione sta dando un aspetto sempre piu’ ‘logico’ e
sempre meno ‘descrittivo’ alla biologia molecolare: tutte le vie di segnalazione, i modelli di
regolazione e i modi in cui questi si integrano sono qui per una qualche ragione biologica. Il
fenotipo che noi vediamo, le reazioni biochimiche, le patologie – sono tutto fenomeni alla base
dei quali stanno le proteine, ovvero i geni, la cui espressione viene controllata in modo
razionale. Ecco che quindi la biologia molecolare potrebbe essere definita come un ramo base
della biologia, la comprensione della quale riveste sicuramente un ruolo cruciale per capire
quello che definiamo come biologia moderna.

179
180