Sei sulla pagina 1di 68

Giulia Mostini

Appunti di Biologia Molecolare


Anno 2017/2018
Scienze Biologiche

Gli acidi nucleici


Nel 1952 Rosalind Franklin scattò la Foto n. 51 in cui si osservò per la prima volta la struttura del DNA
tramite la cristallografia a raggi X.
A quel tempo gli acidi nucleici erano conosciuti per le proprie componenti, ma non si era mai vista prima di
allora la loro struttura. Rosalind Franklin capì, grazie a ciò, che alla struttura corrispondeva la funzione
svolta dai relativi composti. Ella è morta a 37 anni per le radiazioni che le hanno causato un cancro alle
ovaie. Il suo mentore era un ricercatore genovese che effettuava cristallografia dei capelli per osservare le
proteine di cheratina.
Prima della sua scoperta, Miescher nel 1869 isolò il DNA, estraendo la milza dagli animali, da cui si otteneva
una sostanza gelatinosa, definita da lui nucleina, perché aveva intuito che centrasse con il nucleo. Si
pensava che derivasse da una composizione polimerica a ruolo strutturale.
Nel 1902, Walter Sutton ipotizzò che i cromosomi portassero l'informazione genetica, mentre nel 1910
Levene identificò i componenti del DNA.
Negli anni 40 Avery e MacLeod si resero conto che, per trasformare un ceppo di batteri da meno virulento a
più virulento, si poteva trasferire il DNA, inducendo una trasformazione genetica. In quel periodo, infatti, ci
fu un interesse sempre maggiore per il DNA.
Chargraff, inoltre, si rese conto nel 1949 che la quantità delle basi era sempre uguale nella stessa specie,
ma che poteva variare in specie diverse, quindi formulò le regole della composizione del DNA.
Watson e Crick, infine, guardando di nascosto la foto 51, scrissero il lavoro in cui ipotizzarono la struttura
del DNA, aggiungendo a penna il nome di Rosalind Franklin, per evitare di citarla direttamente nel
manoscritto.

DNA e RNA
I primi esperimenti sugli acidi nucleici rivelarono due tipi di molecole: il DNA più stabile e resistente agli
acidi e l’RNA. DNA e RNA venivano trovati insieme nelle cellule procariotiche ed eucariotiche, mentre nei
virus era trovato solo uno dei due. Nelle cellule eucariotiche il DNA era recuperato dai nuclei cellulari,
mentre l’RNA si isolava dalla frazione citoplasmatica. In seguito sono stati identificati tre tipi di molecole di
RNA: RNA messaggero (mRNA), RNA ribosomiale (rRNA) e RNA transfer (tRNA).
Nel 1928 Griffith condusse un esperimento su un ceppo non contagioso di Streptococcus pneumoniae, che
si trasformava in virulento, se mescolato con un lisato inattivato dal calore del ceppo virulento. Nel 1943
Avery osservò che era il DNA la sostanza trasformante.
Importanti sono le basi azotate, che costituiscono parte del
nucleotide: uracile, citosina, timina, guanina e adenina. Esse sono
divise in purine (la prima ad essere isolata fu l'acido urico
dall'urina e si chiama così perché è urina purificata) e pirimidine.
Oltre alle basi, il nucleotide è costituito da uno zucchero pentoso,
ribosio o desossiribosio, in base a se si tratta di RNA o DNA.
E' esistito un DNA a galattosio, ma non si riusciva ad ottenere
stabilità e non serviva per le stesse funzioni.

1
Giulia Mostini

La combinazione di base e zucchero dà il nucleoside. Al C1 dello zucchero, in particolare, c'è un gruppo


sterico, ovvero che esiste in syn e anti, cioè in due conformazioni. Al C5, invece, c'è un gruppo OH libero che
viene fosforilato tramite legame fosfodiesterico con aggiunta di un gruppo fosfato, ottenendo un
nucleotide. Se si aggiungono tre gruppi fosfato abbiamo ATP, in cui la base è l’adenina.
Se si mescolano dei nucleotidi 3 fosfato, essi si polimerizzano dopo un certo periodo di tempo. Infatti, il
gruppo fosfato si lega al gruppo alcolico in C3 di un altro nucleotide. Questa proprietà era già insita nel
brodo primordiale, producendo polimeri spontanei in modo casuale. Il primo a farlo fu l'RNA perché ha una
struttura più semplice.
Il legame fosfodiesterico, che si forma tra il fosfato associato al carbonio in posizione 5 dello zucchero di un
nucleotide e il carbonio in posizione 3 dello zucchero del nucleotide successivo, produce una catena
polinucleotidica (DNA o RNA). Le catene di DNA e RNA risultanti contengono sequenze specifiche di basi e
mostrano una direzione intrinseca con un’estremità della catena dove il primo nucleotide presenta un
ossidrile libero (OH) al carbonio in posizione 3 dello zucchero (3’ – OH) e all’altra estremità l’ultimo
nucleotide presenta un gruppo fosforico (PO4) libero, legato al carbonio in posizione 5 dello zucchero (5’ –
PO4). Quando si formano le catene, si definisce struttura primaria la sequenza lineare di nucleotidi che
formano il polinucleotide.
Una proprietà delle basi del DNA è il possibile appaiamento, tramite legami a idrogeno, che da soli sono
deboli, ma in gran numero rendono stabile la molecola. Tra G e C si ha un triplo legame, mentre tra A e T ve
n’è uno doppio, quando si trovano una di fronte all'altra. Il dimero T-A è energicamente più debole
dell'altro, infatti per dissociarlo ci vuole meno energia. Il doppio filamento rimane stabile solo se vi sono
basi complementari. La struttura secondaria è qualunque struttura spaziale
stabile che assume ciascun nucleotide, mentre la struttura terziaria è il modo in
cui si avvolgono le eliche per dare strutture macromolecolari, come il
ripiegamento del DNA in un cromosoma o nel nucleotide batterico.
Il legame tra i nucleotidi avviene in direzione 5'-3', creando una polarità. Al 5'
c'è sempre un fosfato libero, mentre al 3' un OH libero. Se una catena ha
direzione 5'-3', l'altra è a direzione contraria: hanno polarità opposta, per cui
sono filamenti complementari e antiparalleli. Si tratta di un'immagine speculare
rovesciata. Il DNA, quindi è complesso e questo gli permette di svolgere varie
funzioni.
Le basi sono impaccate in pochi micron. In un uomo il DNA è contenuto in 40 g
di massa. Una parte su 2000 di noi è ciò che ci governa, tutto il resto serve a
farlo esprimere.
Importante è sapere che la distanza tra un filamento e l’altro è di 2 nm.

Struttura e topologia del DNA


La struttura secondaria tridimensionale degli acidi nucleici discende dalle proprietà chimiche dei nucleotidi.
Le basi pirimidiniche e puriniche sono molecole coniugate, quindi planari o quasi planari (purine),
idrofobiche e scarsamente solubili in acqua a pH neutro, appaiabili secondo l’orientamento A-T e C-G,
stabilizzato dai legami idrogeno specifici.
I due filamenti appaiati antiparalleli (single stranded DNA – ssDNA) sono in realtà avvolti l'uno sull'altro
perché le basi sono idrofobiche e stanno all'interno del filamento stesso. La struttura varia molto in base
alla forza ionica, cioè alla concentrazione di sali presenti in ambiente acquoso. Il DNA è negativo e la forza
ionica, in particolare, cambia i rapporti di forza tra i legami della struttura. Appaiati in direzione
antiparallela, i due filamenti assumono la configurazione della minima energia libera, cioè la doppia elica
destrorsa (dsDNA – double stranded DNA helix).

Forme differenti del DNA


L’assenza di doppi legami permette al DNA di assumere diverse conformazioni: il grado di idratazione
determina la conformazione dell’elica.
In condizione fisiologica (bassa concentrazione salina) si ha la struttura del DNA B, cioè un’elica destrorsa
perché dall'alto gira in senso orario.

2
Giulia Mostini

Nella conformazione B, la distanza tra due coppie di basi è di 0,34 nm e per fare un giro completo servono
circa 10 basi (360 gradi). Il passo dell’elica, invece, è la distanza che essa percorre per tornare al punto di
partenza (3,4 nm). Il diametro, invece, è di 2 nm.
In questa tipologia di DNA, si distinguono un solco (groove) maggiore e uno minore in base agli angoli
formati dalle basi con lo zucchero. Gruppi chimici diversi sono esposti nel solco maggiore e minore. E' una
questione di entropia perché il disordine è a carico dell'acqua, a permettere il mantenimento dell'energia.
Se si apre la molecola, l'acqua diminuisce la sua entropia e diventa più ordinata. L'esposizione delle basi di
solco maggiore e minore è fondamentale per l'interazione del DNA con le altre macromolecole.
La transizione da forma A a forma B è la più studiata ed è dovuta al differente ripiegamento dell’anello
furanosico del ribosio: quattro dei cinque atomi dell’anello sono coplanari, mentre un quinto (C2 o C3) è
sfasato. Se il C2 o il C3 si dispone dallo stesso lato di C5, la conformazione è endo, se è dal lato opposto la
conformazione è eso. Nella forma B, il C2 è in endo a causa dell'acqua, mentre nella forma A è il C3 ad
essere in endo. In condizioni saline elevate o in uno stato parzialmente disidratato, infatti il DNA esiste
sottoforma di DNA A, che è un’elica destrorsa con 11 coppie di basi per giro e un diametro di 2,3 nm.
Infine, vi è il DNA Z, ovvero un’elica sinistrorsa che si trova in doppie eliche ricche in G:C contenenti residui
alternati di purine e pirimidine. Esso presenta 12 coppie di basi per giro e un diametro di 1,8. Quando la
struttura è massima, diventa inaccessibile a ogni enzima.
Lo scheletro (back bone) fosfato-ribosio non ha doppi legami, per cui tutti i legami ruotano su se stessi,
essendo legami semplici. La rotazione avviene intorno a 7 legami principali per monomero:
1. Χ: del legame glicosidico tra base e zucchero;
2. γ: del legame C4-C5 dello zucchero;
3. δ: del legame C4-C3 dello zucchero;
4. α e β: del ponte fosfodiesterico al C5’ dello zucchero;
5. ε e ζ: del ponte fosfodiesterico al C3’ dello zucchero.
Le basi appaiate non sono perfettamente complanari, ma ruotate leggermente l’una rispetto all’altra.
Questo permette di aumentare l’impilamento delle basi (stacking) lungo un filamento. L’elica B si può
curvare senza alterazioni della struttura locale, consentendo al DNA di assumere forme circolari e di
avvolgersi in strutture terziarie. Il DNA può anche formare dei ripiegamenti bruschi dovuti a specifiche
sequenze di basi, come AAAA, o al legame ad una proteina.
Il backbone viene influenzato e può quasi formare un gomito, abbandonando la doppia elica. Questo dà
grandi potenzialità e gradi di libertà alla molecola.

Denaturazione e rinaturazione termica


Il DNA si può denaturare aumentando la
temperatura, per cui si perde la struttura a doppia
elica, ma quando si riduce la temperatura
nuovamente (annealing temperature – Ta) i due
filamenti si riappaiano. La temperatura alla quale
la doppia elica si separa nei due filamenti si
definisce melting temperature (Tm).
Il single strand ha uno spettro di assorbimento
(260 nm) più alto rispetto all'assorbimento della
doppia elica, perciò, seguendo l’aumento di A260
durante il riscaldamento del DNA riconosciamo la
denaturazione e la Tm che aumenta in relazione al
contenuto di coppie G-C/A-T.

Topologia del DNA


Quando ad una molecola di DNA è impedita la rotazione sull’asse longitudinale, fissandone le estremità o
considerando una molecola richiusa su se stessa (DNA circolare), il numero di volte in cui un filamento
ruota intorno ad un altro non può cambiare. La topologia studia come si modifica una figura, quando ne
viene deformata la struttura senza alterarne l’integrità.

3
Giulia Mostini

In una molecola di DNA circolare, la separazione dei due filamenti determina la riduzione del numero di
volte in cui i filamenti si avvolgono l’uno intorno all’altro. Questa condizione (underwound) è instabile per
la tensione a cui sono sottoposti i legami dei singoli nucleotidi e la molecola circolare si torce formando
superavvolgimenti.
Il linking number (Lk) è il numero di volte (turn) in cui un filamento si avvolge su di un altro (numero di
passi/10). E’ un numero intero che può essere positivo, se l'anello destro avvolge il sinistro, negativo, se il
sinistro avvolge il destro. E' uguale al twist number (Tw), cioè il numero complessivo di volte in cui un
filamento ruota intorno a un altro, sommato al wright number (Wr), cioè il numero di volte in cui l’asse
immaginario della molecola circolare planare ruota intorno a se stesso (superavvolgimenti).
Il numero di superavvolgimenti complessivi (∆Lk) lo si può ricavare da Lk – Lk0. Lk0 è Lk di un circolo
rilassato, cioè è uguale al numero dei passi dell’elica ovvero al numero delle coppie di basi/ 10.5 (è numero
sempre positivo perché l’elica è destrorsa). Il numero totale, normalizzando per la lunghezza del DNA,
diventa σ = ∆Lk/Lk0. Questo valore è di circa – 0,06 sia nei procarioti sia negli eucarioti ad indicare un
moderato superavvolgimento negativo complessivo del DNA nelle cellule. Questo stato di
superavvolgimento negativo è in equilibrio con tratti svolti dalla doppia elica, favorendo la dissociazione dei
filamenti.

La replicazione del DNA


Il legame fosfo-estere è un legame chimico estere che si forma tra un gruppo fosfato in posizione 5’ di un
nucleotide e un ossidrile in posizione 3’ di un altro nucleotide, in cui viene eliminata una molecola d'acqua.
Questo legame avviene tra i nucleotidi e rompe il legame beta più instabile perché risente dell'effetto delle
cariche negative. E' la reazione fondamentale dell’intera biologia molecolare. Si tratta di un attacco
nucleofilo da parte del gruppo ossidrile al 3’ sul fosforo alfa al 5’ di un nucleotide trifosfato. Si tratta di una
reazione esoergonica non rapida alle nostre temperature, ma comunque è spontanea per il fatto che se un
nucleotide incontra un altro nucleotide, se ha abbastanza energia cinetica, si forma il legame in modo
spontaneo. E' una reazione irreversibile, tramite la dissoluzione del pirofosfato a gruppo fosfato. Se si
utilizza il trifosfato, il pirofosfato si dissocia a monofosfato. E' quindi un evento energicamente favorito se
abbiamo un trifosfato.
La formazione del legame fosfodiesterico porta alla polimerizzazione dei due filamenti di DNA (5’ – 3’). La
polimerizzazione può avvenire solo al 3' perché il nucleotide si attacca solo lì. Al 5' non ci può essere
attacco perché vi è un solo fosfato e il trifosfato non riesce ad attaccare, per cui si allunga solo in direzione
5’ -> 3’. La reazione di polimerizzazione avviene lentamente a 37°, per cui intervengono degli enzimi, per
aumentare la probabilità che l'attacco nucleofilo avvenga in modo rapido e preciso. I chimici, quindi,
aumentano l'energia cinetica in laboratorio affinché gli urti avvengano in modo più probabile.

Esperimento di Meselson e Stahl


Ciascun filamento può agire da stampo per la sintesi di un filamento di neosintesi complementare al
filamento parentale. Questa ipotesi di replicazione del DNA venne definita replicazione semiconservativa e
prevedeva che i due filamenti parentali si separassero durante il processo replicativo.
Un altro potenziale meccanismo prevedeva, invece, che i due filamenti della doppia elica parentale
rimanessero appaiati e, in qualche modo, l’intera doppia elica potesse servire da stampo durante il
processo replicativo dando origine a una molecola figlia di neosintesi uguale alla molecola originale. Questa
ipotesi prendeva il nome di replicazione conservativa. Un terzo possibile meccanismo ipotizzava una
replicazione del DNA di tipo dispersivo: durante la replicazione, il DNA verrebbe frammentato e nelle due
molecole figlie finirebbero per coesistere tratti di DNA parentali insieme a segmenti di DNA neo sintetizzati.
La dimostrazione sperimentale che la replicazione del DNA avviene in modo semiconservativo è stata
ottenuta 5 anni dopo la scoperta della struttura del DNA: nel 1958 Meselson e Stahl pubblicarono il loro
esperimento. Essi fecero crescere le cellule di Escherichia Coli per molte generazioni in un terreno in cui
l’azoto normale N14 era stato sostituito con l’isotopo pesante N15. Essendo che le basi contengono azoto, il
DNA di cellule cresciute in un terreno contenente N15 avrà una densità maggiore rispetto alle cellule
cresciute in N14. Alla fine si ottennero molecole di DNA con densità ibrida e quindi si arrivò a delle
conclusioni. La replicazione conservativa non avrebbe prodotto alcuna molecola di DNA con densità ibrida;

4
Giulia Mostini

dopo una replicazione conservativa di DNA pesante in un terreno leggero, metà del DNA sarebbe stato
ancora pesante e l’altra metà sarebbe stata leggera. Se la replicazione fosse stata dispersiva, i due scienziati
avrebbero osservato uno spostamento della densità del DNA da pesante a leggera in ciascuna generazione.
Queste possibilità erano chiaramente incomparabili con i risultati degli esperimenti. Dunque, la replicazione
avviene in modo semiconservativo.

Elementi per la replicazione


Il modello della replicazione semiconservativa del DNA suggerisce immediatamente l’esistenza di enzimi in
grado di catalizzare la polimerizzazione di nucleotidi. Tale ipotesi portò all’identificazione della prima DNA
polimerasi in cellule di E. Coli. Questo enzima fu scoperto da Kornberg, che vinse il premio Nobel, mentre il
figlio ha scoperto un altro tipo di DNA polimerasi e il secondo figlio ha scoperto il ribosoma e ha vinto
anch’egli il Nobel. Esistono diversi tipi di DNA polimerasi responsabili della replicazione del DNA che
aggiungono nucleotidi uno alla volta alla catena del DNA in crescita, incorporando all’estremità 3’ solo
quelli che sono complementari al filamento parentale. L’aggiunta di nucleotidi richiede energia, che
proviene dai nucleosidi stessi che contengono tre gruppi fosfato con legami ad alta energia al 5’. Le DNA
polimerasi non possono iniziare a creare una catena di DNA dal nulla, ma richiedono una catena pre-
esistente o un breve tratto di nucleotidi, chiamato innesco (primer) a RNA. Le DNA polimerasi copiano il
DNA ad una velocità massima di circa 1.000 bp/s: E. Coli copia il proprio genoma in meno di un’ora, mentre
una cellula umana copia le sue in poche ore.
Gli elementi necessari per replicare il DNA sono il DNA stampo (template), dATP, dCTP, dGTP e dTTP, i
primer, le DNA polimerasi e un punto di inizio o origine di replicazione.
Il punto di inizio della replicazione viene oggi definito come origine di replicazione. Multiple origini di
replicazione del DNA sono presenti nei vari genomi e garantiscono una rapida e sicura duplicazione del
genoma.
Nel 1963 Jacob, Brenner e Cuzin proposero il modello del replicone come origine di replicazione, associata
alla membrana cellulare, per spiegare la regolazione dell’origine di replicazione del DNA dei fattori
trasmissibili dei batteri. Venne utilizzato il trasferimento di elementi da parte dei batteri (plasmidi), in cui ci
si rese conto che la proprietà di trasferimento tra i ceppi, tramite pili sessuali, era legata al fatto che una
mutazione genetica, che impediva la formazione del pilo, impediva anche il trasferimento e la sua
duplicazione. Ipotizzarono quindi che l'origine fosse presente sulla membrana (ipotesi del mesosoma non
dimostrata). Da questo presupposto si arrivò alla formazione di un modello, in cui si individuavano un
iniziatore e un replicatore, in cui il primo produceva la proteina che innescava la replicazione. L’inizio della
replicazione del DNA, quindi, è geneticamente controllato da sequenze specifiche in cis sul DNA
(replicatore). Queste sequenze determinano dove può partire la replicazione del DNA, interagendo con
specifiche proteine (iniziatori), che agiscono in trans e collegano il processo replicativo con la crescita e la
divisione cellulare. Attualmente, si sa che la replicazione a cerchio rotante del plasmide fattore F avviene a
seguito della rottura di un singolo filamento in OriT e della polimerizzazione di un filamento nella cellula
parentale e dell’altro filamento nella cellula figlia. Vennero identificati, nel 1972 - 1974, sei siti di
replicazione, grazie all’isolamento di frammenti di DNA contenenti origini di replicazione, effettuato da
Cohen.
Negli eucarioti, un’origine di replicazione corrisponde a una particolare sequenza di DNA da cui parte il
processo replicativo che procede, nella maggior parte dei casi, bidirezionalmente, originando due forcelle di
replicazione. Molecole di DNA relativamente semplici, come quelle dei plasmidi e della maggior parte dei
batteriofagi e dei virus, possiedono una singola origine per molecola di DNA.

Modello del sito di inizio indefinito


La sequenza delle origini di replicazioni negli eucarioti superiori non è stata ancora identificata. Il DNA
extra-cromosomico si replica con bassa efficienza anche quando contiene regioni che agirebbero da origine
di replicazione. La replicazione inizia in differenti siti contenuti in regioni estese oltre le 10 kbp.
Un modello alternativo a quello del replicone è stato proposto per le cellule del mammifero, per cui la
sintesi del DNA inizierebbe in modo casuale all’interno di regioni estese. Questo meccanismo riflette la

5
Giulia Mostini

mancanza di specificità di legame del complesso iniziatore delle cellule di mammifero, denominato ORC
(origin recognition complex), che non mostra alcuna preferenza di legame per specifiche sequenze di DNA.
Venne ipotizzato che anche per gli eucarioti la replicazione avvenisse mediante bolle. Oggi non si sanno
esattamente quali siano le origini di replicazione degli eucarioti. L'inizio della replicazione, comunque, non è
casuale e deve esserci per forza una sequenza specifica, anche perché, se qualunque sequenza funzionasse
da origine di replicazione, la ricerca mediante “deep sequencing” dei frammenti a singolo filamento,
arriverebbe a saturazione solo superando la copertura dell’intero genoma. Per capire ciò è stato effettuato
un sequenziamento, secondo cui solo il 10% delle regioni possono essere origine di replicazione.
Ovviamente, solo porzioni del genoma fungono da origine di replicazione.

DNA polimerasi, il replisoma e i suoi componenti


La replicazione è divisa in inizio, allungamento e termine per convenzione perché in realtà è un processo
continuo. L'inizio parte dalle proteine iniziatrici e dallo svolgimento dell’elica madre grazie alle elicasi, poi vi
sono le primasi che la tengono aperta e sintetizzano i primer richiesti dalle polimerasi. Dopodiché, nella
forcina di replicazione intervengono le polimerasi stesse.
L’allungamento, invece, comporta la duplicazione simultanea dei due filamenti; l’avanzamento della forcina
di replicazione e il processamento dei frammenti di DNA generati. Infine vi è la terminazione con la
dissociazione dei complessi.
Il primo evento è che ci devono essere
proteine specifiche che riconoscono
tratti specifici sul DNA (iniziatori). Nel
disegno vediamo le sequenze di E. Coli.
Il primo evento molecolare consiste nel
riconoscimento di OriC (composta da
una sequenza corta di 9 coppie di basi)
da parte della proteina DnaA, che si
avvolge come un circolo, dando un
groviglio che facilita la dissociazione delle sequenze ricche in AT, dando una prima apertura.
Il passaggio successivo consiste nel caricamento di DnaB e DnaC a livello della bolla di denaturazione,
creatasi nella regione di OriC dando origine a un complesso proteico, detto complesso di pre – innesco
(PreRC) con regioni ricche in AT. DnaB possiede un’attività elicasica, per cui consumando ATP è in grado di
separare i due filamenti di DNA. Lo svolgimento del DNA sia nella fase iniziale che nel successivo processo di
allungamento, genera una tensione torsionale che è risolta da enzimi in grado di modificare la topologia del
DNA (DNA topoisomerasi). A questo punto, Dna A viene rimosso e si legano le DNA polimerasi.
Negli eucarioti, invece, è presente ORC come sito di inizio, che è indicato in rosso nel disegno. Si tratta di un
complesso di 6 proteine che legano il DNA e assemblano sul sito di inizio altre proteine (CDC6-CDT1 e
MCM), costituendo il PreRC. Questo complesso, dopo la fosforilazione da parte di chinasi attivate durante
la fase S del ciclo cellulare e il legame con la DNA polimerasi, costituisce il pre-initiation complex (PreIC).

Elicasi e primasi
Il singolo filamento, a questo punto, viene riconosciuto dalle elicasi, fatte come un esagono, che all'esterno
è aperto e si richiude all’interno sul filamento di DNA. Esse furono scoperte nel 1976 in differenti forme per
gli eucarioti e per i procarioti. Il complesso dell’elicasi quindi circonda una porzione a filamento singolo del
DNA, si richiude e scorre lungo il filamento di DNA, separando la doppia elica, utilizzando l’energia di un
ATP idrolizzata, che ne promuove la rotazione. Infatti, per ogni ATP consumata, si ha una rotazione di 120°
(3 per farla ruotare di un giro completo). In questo modo si svolge la doppia elica in una direzione precisa,
esponendo il singolo filamento, che rimane aperto tramite le proteine SSB (single strand binding protein),
cioè proteine che hanno maggior affinità per il singolo filamento, rispetto al doppio. Il Replication Protein A
è il principale complesso SSB eucariotico.
A questo punto, le DNA polimerasi allungano un filamento polinucleotidico, legando un nucleotide
trifosfato per volta all’estremità 3’ di un filamento pre-esistente, ma non riescono ad iniziarne uno dal
nulla. Per questo, le primasi sintetizzano i primer a RNA, complementare al filamento stampo di DNA.

6
Giulia Mostini

Le primasi sono enzimi antichi e complessi e negli organismi più primitivi, a volte, sono insieme alle elicasi,
come negli archeobatteri. Alcune caratteristiche, come la tendenza ad iniziare con una base purinica e a
sintetizzare primer di RNA di 5-10 nucleotidi, sembrano essere universali. Tuttavia, primasi procariotiche ed
eucariotiche differiscono radicalmente nell’organizzazione strutturale e nel meccanismo di sintesi
dell’innesco.
La primasi batterica è un singolo polipeptide, mentre nelle cellule eucariotiche la primasi è un eterodimero
di subunità catalitica o piccola (PriS)e subunità regolatrice o grande (PriL). Inoltre, nelle cellule eucariotiche,
la primasi è normalmente associata in uno specifico complesso costitutivo con DNA polimerasi A (Pol α) e
una subunità B.
Negli eucarioti la primasi, subunità p58 e subunità p49 (Prim1), si associa
insieme alla polimerasi α per formare il DNA polimerasi α/primasi complex,
responsabile dell’inizio della sintesi del DNA.
Il dominio primasico è abbastanza conservato, come il Zn finger. Il complesso
primasico eucariotico è formato da varie proteine (CTC 45 e MCM) e lega altre
proteine, cioè polimerasi vere e proprie, dopo aver sintetizzato il primer.
L’azione del complesso DNA polimerasi α/ primasi termina rapidamente,
sostituito dall’azione della DNA polimerasi δ che subentra (polymerase switch)
nell’allungamento del filamento. Il fattore di replicazione C (RF-C) lega il filamento ibrido RNA-DNA,
provocando il distacco del complesso DNA polimerasi α/primasi. Quindi, la DNA polimerasi δ,veicolata dalla
proteina clamp PCNA (proliferating cell nuclear antigen), si lega e continua la sintesi. Questo complesso è
l’unico in grado di iniziare la sintesi di una catena di DNA, tuttavia non possiede un’attività di proof-reading,
per correggere gli errori. Al contrario, la DNA polimerasi δ è in grado di riconoscere i nucleotidi
erroneamente introdotti e di rimuoverli.

DNA polimerasi
Negli organismi avviene una rapida sequenza di accavallamento tra una polimerasi e l'altra perché è
importante avere polimerasi che commettono pochi errori e sono in grado di correggerli.
Le polimerasi sono enzimi processivi perché incorporano una grande quantità di nucleotidi prima di
staccarsi e terminare il ciclo di attività. Inoltre, importante è la velocità di sintesi e la fedeltà. La processività
è direttamente proporzionale alla velocità di sintesi.
La prima stima di processività di una DNA polimerasi in vivo fu ottenuta nel 1976, misurando la velocità di
allungamento del DNA del fago T4, che duplica il proprio genoma in E. Coli in circa 15 minuti.
L'intervento delle polimerasi lo si può schematizzare in un ciclo:
1. Associazione al DNA: la reazione inizia con il legame dell’enzima DNA polimerasi libera (E) con il
primer appaiato sul DNA stampo (DNAn), formando il complesso enzima – DNA (E * DNAn),
secondo una costante di associazione del complesso (Koff,DNA).
2. Legame con il nucleotide: il corretto nucleotide (dNTP) accede al sito della reazione.
3. Formazione del complesso: in presenza di cationi (Mg2+), si promuove la formazione del complesso
ternario polimerasi-DNA-dNTP con kd,dNTP costante di associazione nucleotide – enzima.
4. Cambiamento conformazionale: il legame del dNTP induce un cambiamento conformazionale
dell’enzima nel complesso ternario.
5. Formazione del legame fosfodiesterico: il legame fosfodiesterico viene formato tra il fosfato α del
dNTP in entrata e il 3’-OH del terminale del filamento da estendere (DNAn+1), liberando pirofosfato
(Ppi) e un H+ con acidificazione del mezzo. L'acidificazione viene misurata da alcuni strumenti per la
velocità di sintesi.
6. Secondo cambiamento conformazionale dell’enzima: consente il rilascio del gruppo in uscita PPi.
7. Distacco del nucleotide: è legato alla catena nascente, riportando la polimerasi nella conformazione
nativa, che può riniziare il nuovo ciclo. Il pirofosfato si dissocia, spostando l’equilibrio a favore della
sintesi. La polimerasi quindi accelera questa reazione.
La polimerasi I (polA) riempie i buchi, la II (polB) aggiusta gli errori, la III (polC) fa la sintesi composta da
subunità. La polimerasi γ, invece, è presente negli eucarioti e sintetizza il DNA mitocondriale, diversa dalle
altre. Le tetracicline agiscono su essa perché la polimerasi è simile a quella dei batteri.

7
Giulia Mostini

Fase di elongazione
Nella fase “elongation” della replicazione del DNA, le polimerasi aggiungono nucleotidi all’estremità 3’ del
primer. Sul filamento che ha l’estremità 3’ libera in corrispondenza della forcella, la sintesi procede in modo
continuo e questo filamento è detto filamento veloce (leading strand). La sintesi dell’altro filamento, detto
filamento lento (lagging strand), procede in modo discontinuo e a ritroso, operando su segmenti
relativamente corti di DNA a singolo filamento (1000-2000 nucleotidi in procarioti e 100-200 negli
eucarioti). Su questo filamento vengono copiati brevi segmenti discontinui, detti frammenti di Okazaki. Una
specifica DNA polimerasi rimuove il vecchio primer e lo sostituisce con frammenti di DNA. Questi ultimi,
insieme a quelli di Okazaki, vengono legati da enzimi, detti ligasi, che ne catalizzano il legame
fosfodiesterico finale.
Diversi modelli sono stati proposti per il completamento a filamento continuo della copia del filamento
lagging. La DNA polimerasi δ, all’estremità 3’ di un filamento di Okazaki si verrebbe a scontrare con
l’estremità 5’ del frammento di Okazaki immediatamente successivo, costituito dal primer RNA/DNA
sintetizzato dalla polimerasi α/primasi.
La polimerasi δ scalzerebbe il primer dal filamento di DNA stampo, che ora sarebbe esposto (flapping),
come singola elica, all’azione della giunzione fra RNA e DNA. L’ultimo ribonucleotide verrebbe rimosso
grazie all’attività esonucleasica dell’enzima Flap-1 (FEN-1), che sarebbe anche capace di rimuovere
mediante attività endonucleasica errori di incorporazione nella sequenza primer, prodotta da polimerasi
α/primasi. Eventualmente RPA potrebbe limitare il flapping del primer e mediare la rimozione di questo da
parte dell’endonucleasi Dna2.
Quindi, la polimerasi δ continuerebbe ad allungare il filamento di Okazaki che stava sintetizzando fino a
raggiungere la nuova estremità 5’ del frammento di Okazaki adiacente, privata della sequenza primer a RNA
dall’azione di RNAsi H1 e FEN-1. A questo punto i due frammenti di Okazaki possono essere legati fra loro,
tramite ligasi.
Col termine replisoma, infine, si indica il complesso proteico responsabile della sintesi del DNA, costituito
da elicasi, SSB, primasi, DNA polimerasi, proteine clamp, ribonucleasi H, ligasi e DNA girasi.

Fase di terminazione nel DNA batterico


La replicazione di E. Coli è bidirezionale a partire da un’origine e le due “forcine di replicazione” si
incontrano in siti detti Ter, a cui si associano le Ter-binding protein (TUS). A questo punto, tutti i primers
vengono rimossi e i frammenti sono sostituiti e connessi da DNA – pol I e da ligasi.
TUS, associato alle sequenze Ter, lega una citosina (flipping), impedendone l’accesso al sito della polimerasi
e inibisce l’attività delle elicasi, le quali si dissociano dal DNA, e la forcina di replicazione si ferma.

Le topoisomerasi e il loro meccanismo d’azione


La progressiva separazione dei filamenti del DNA parentale da parte della replicazione porta all’accumulo di
supercoil positivi davanti alla forcella di replicazione e di intrecci tra le eliche figlie.
Nel caso di un replisoma batterico che replica 500 bp/s, la doppia elica parentale dovrebbe ruotare 50 volte
al secondo di fronte alla forcina di replicazione. Una simile mobilità, però, è impedita dall’intrinseca
mobilità del cromosoma. Per questo, si accumula una tensione torsionale, che può essere assorbita dal
superavvolgimento del DNA a monte. Se la tensione continua ad aumentare, la forcina di replicazione si
arresta perché l’elicasi richiederebbe troppa energia per svolgere ulteriori frammenti dell’elica parentale.
La DNA girasi, ad esempio, è un enzima che nei batteri precede nella progressione della forcina il replisoma
e introduce supercoil negativi (opposti a quelli indotti dalla replicazione). In questo modo la girasi riduce la
tensione torsionale
prodotta dal procedere
delle forcine. La girasi
avvolge il DNA rilassato e,
a seguito dell’idrolisi
dell’ATP, introduce 2
supercoil negativi. Il
numero di supercoil

8
Giulia Mostini

formati dalla girasi in un DNA circolare inizialmente rilassato è pari al numero di ATP consumate.
La DNA girasi taglia entrambi i filamenti della doppia elica, incrocia nel sito di taglio due doppie eliche e si
dissocia dal DNA, che ora mostra un Wr (wright number) negativo e conseguentemente la possibilità di
aumentare il Tw (Twist number). Dunque, la girasi favorisce lo svolgimento dei due filamenti dell’elica. La
DNA girasi appartiene alla classe 2 delle topoisomerasi.
Le topoisomerasi sono gli enzimi deputati a regolare la topologia del DNA. Esistono due classi:
1. Topoisomerasi I: sono in genere dei
monomeri che tagliano un solo filamento del
DNA al 5’, creando un’apertura mediata dalla
interazioni di diversi domini dell’enzima con
la doppia elica, attraverso la quale può
passare l’altro filamento o una doppia elica.
Questo meccanismo, definito strand passage,
permette di eliminare con grande efficienza
strutture annodate sul DNA, nonché di
decatenare due filamenti di cui uno contenga
una rottura a singolo filamento e di rilassare
esclusivamente superavvolgimenti negativi.
Questo meccanismo non prevede il consumo di ATP. Nei batteri rimuove solo supercoil negativi,
mentre negli eucarioti può rimuovere anche supercoil positivi. Per effettuare il taglio, la
topoisomerasi attacca un residuo di tirosina ad un fosfato del DNA, per rompere il legame
fosfodiesterico. Così le estremità della doppia elica possono ruotare l’una rispetto all’altra,
rilasciando la tensione accumulata. L’energia del legame fosfodiestere è conservata nel legame
fosfo-tirosinico, rendendo reversibile la reazione, la riformazione spontanea del legame
fosfodiestere, che rigenera sia l’elica di DNA sia la topoisomerasi I.
2. Topoisomerasi II (girasi): sono in genere dimeri o
multimeri che introducono un taglio su entrambi i
filamenti del DNA con le due tirosine covalentemente
legate al 5’ e portano avanti le modificazioni
topologiche, facendo passare un secondo tratto a
doppia elica, attraverso la rottura. Il filamento
tagliato si chiama segmento G per gate (cancello),
mentre il segmento che passa per l’apertura si
chiama T per transport. Questo meccanismo d’azione
è chiamato di rotazione controllata o a doppio
cancello e utilizza ATP. Nei batteri questi enzimi
introducono supercoil negativi, rimuovendo i positivi
durante la replicazione del DNA e impaccano la
molecola di DNA nella cellula. Negli eucarioti, invece, possono rimuovere supercoil sia positivi sia
negativi.
Le topoisomerasi sono il bersaglio dei chemioterapici: gli inibitori sono potenti farmaci antineoplastici in
grado di indurre la morte delle cellule proliferanti del tumore che replicano il proprio DNA. Esempi di questi
farmaci sono le camptotecine e la doxorubicina.
Dopo la replicazione, un genoma circolare produce molecole figlie vincolate insieme, come anelli di una
catena. Per separarle interviene topoisomerasi II. Questi enzimi hanno la capacità di tagliare un dsDNA e
farne passare un altro attraverso il taglio operato, slegando i due genomi figli e consentendo la separazione
delle due cellule figlie. Le topoisomerasi II sono implicate anche nella risoluzione degli intrecci di lunghi
cromosomi lineari eucariotici.

I telomeri
Nella replicazione del lagging strand, la rimozione del primer terminale lascia un tratto a filamento singolo
(gap) poiché non è possibile sintetizzare DNA all’estremità 3’.

9
Giulia Mostini

Il cromosoma neosintetizzato si presenta ad entrambe le estremità 5’ con un tratto di DNA a filamento


singolo. Questo viene degradato da enzimi che rimuovono ssDNA, quindi, ad ogni divisione cellulare, il
cromosoma si accorcia. Nell’uomo, a ogni divisione cellulare, il DNA alle estremità dei cromosomi può
perdere da 50 a 200 bp che dopo 20-30 divisioni si traducono in perdita di DNA, che lede le capacità
funzionali dei cromosomi.
In molti eucarioti le estremità dei cromosomi contengono sequenze ripetitive, dette telomeri. Nei
vertebrati, la sequenza del telomero è TTAGGG ripetuta in tandem circa 2.500 volte. I telomeri sono
caratterizzati da un filamento 3’-protruding, che si ripiega all’indietro sul tratto a doppia elica a monte.
Appaiandosi al filamento complementare, il 3’-protruding forma il t – loop, che protegge le estremità del
cromosoma dalle nucleasi e dagli enzimi, di risposta al danno del DNA.
I telomeri sono stati scoperti nel protozoo Tetrahymena thermophila dallo scienziato Szostak e possono
essere visualizzati tramite la FISH (fluorescent in situ hybridization), che consente di localizzare gli acidi
nucleici in preparati istologici, tramite l’uso di un polimero organico (PNA), simile a DNA e RNA nella
componente in basi azotate, ma diverso nel backbone costituito da legami peptidici.
L’erosione progressiva dei telomeri, divisione dopo divisione, conduce alla perdita di materiale genetico,
produce alterazioni del cariotipo e attiva meccanismi che inducono la morte cellulare. Questo spiega
perché le cellule non possono replicarsi indefinitamente, ma dopo un certo numero di divisioni smettono di
proliferare. Questo limite è definito “limite di Hayflick”. Alcune cellule continuano a dividersi, come le
cellule germinali, del midollo osseo o le cellule tumorali, che mantengono i propri telomeri. In queste
cellule un enzima, la telomerasi, sintetizza di nuovo le sequenze telomeriche perse.
Alla sequenza ripetuta dei telomeri si legano specifiche proteine, che mantengono stabili le estremità del
cromosoma. Tra queste il complesso, detto sheltering, svolge un ruolo cruciale. Esso è costituito da 6
proteine: TRF1, TRF2, RAP1, TIN 2, TPP1, POT1. L’eterodimero TPP1 – POT1 regola l’accesso della
telomerasi al DNA telomerico e la formazione del t - loop.
La telomerasi (TERT) agisce come una polimerasi, allungando l’estremità 3’ del cromosoma, senza
necessitare uno stampo esterno, che ne guidi l’inserzione di nuovi nucleotidi. La componente di RNA (TERC)
funziona, invece, da auto-stampo per aggiungere nuova sequenza telomerica all’estremità 3’ del
cromosoma. La telomerasi retro-trascrive un filamento di DNA da uno stampo a RNA. La telomerasi, quindi,
si sposta al 3’ ed estende le ripetizioni in tandem del telomero. Mutare la telomerasi può produrre tumori e
progeria.
I telomeri possono essere mantenuti anche tramite un meccanismo alternativo, detto ALT. La telomerasi,
infatti, è attiva nel 75% dei tumori, mentre nel restante 25% l’immortalità delle cellule è dovuta ad ALT. La
ricombinazione omologa tra cromosomi è il meccanismo con cui i telomeri vengono preservati nelle cellule
telomerasi negative e ALT positive.

La mutabilità del DNA


Il DNA è soggetto a mutazioni ed errori. Se il materiale genetico fosse perpetuato identico da generazione a
generazione o se la struttura primaria del DNA (sequenza) non potesse subire delle modifiche (mutazioni),
infatti, non ci sarebbe stata evoluzione biologica. Nonostante ciò, un eccessivo accumulo di mutazioni
nell’individuo determina un fenotipo letale. La vita dipende dall’esistenza di un preciso livello di mutabilità
del DNA. Il tasso di mutazione è determinato dall’equilibrio tra i processi che producono le mutazioni e
quelli che le correggono, ristabilendo la sequenza originale.
I batteri hanno genomi più piccoli rispetto agli organismi superiori. Per esempio, un virus ha almeno una
mutazione per ciclo replicativo (anche i retrovirus come l'HIV). Noi riusciamo a tenere il tasso di mutazione
a 10-10, quindi molto basso: ogni due metri di DNA introduciamo solo una mutazione ad ogni ciclo
replicativo. Questo è fatto apposta per ogni specie vivente, quindi è funzionale agli RNA.
Le mutazioni possono essere somatiche, quando avvengono in una cellula somatica di un pluricellulare che
si trasmettono solo alla discendenza diretta di quella cellula (tumori), oppure germinali, quando avvengono
nelle cellule germinali (cellule uovo) e vengono trasmesse alle generazioni successive.
Inoltre, le mutazioni possono essere puntiformi, che determinano cambiamenti in siti specifici di un gene o
in una singola base, oppure cromosomiche, se interessano il numero o la struttura dei cromosomi
(sindrome di Down).

10
Giulia Mostini

Mutazioni puntiformi
• Mutazioni per sostituzione: una coppia di basi viene sostituita da un’altra. Esse possono avvenire
per transizione, quando nel DNA una purina di un filamento viene sostituita con l’altra purina e la
pirimidina con l’altra pirimidina, o per transversione, quando una purina viene sostituita con una
pirimidina e viceversa.
Le mutazioni per sostituzione possono essere senso, se la sostituzione nucleotidica causa una
sostituzione amminoacidica; non senso, se la sostituzione nucleotidica causa la formazione di un
codone di stop con terminazione prematura della traduzione della proteina; oppure silenti o
sinonime, che è un caso particolare di mutazione senso in cui il cambiamento di un codone non
causa il cambiamento dell’amminoacido perché quel “nuovo” codone codifica sempre per lo stesso
amminoacido.
• Mutazioni frameshift: avvengono quando è inserita o deleta una coppia di basi, alterando lo
schema di lettura di tutte le triplette nella porzione di gene a valle del sito in cui si è verificata la
mutazione. E’ molto probabile che si generi un fenotipo mutante.

Meccanismi che causano mutazioni


Quattro meccanismi producono mutazioni: modificazioni chimiche degli acidi nucleici, errori della
replicazione (con DNA polimerasi), inserzione di frammenti di DNA esterno o esogeno (trasposoni,
retrovirus) e ricombinazione fisiologica del DNA (meiosi).
Le modificazioni chimiche sono di vari tipi: deamminazione (eliminazione del gruppo amminico),
alchilazione (aggiunta di un gruppo alchilico – CH3), ossidazione (reazioni con specie reattive dell’ossigeno),
dimerizzazione (dimeri di pirimidine), idrolisi (rimozione di una molecola d’acqua), tautomerizzazione
(cheto-enolica o ammino-imminica). Un esempio di deamminazione è la rimozione del gruppo amminico da
una base per dare una base differente, come da C a T. La deamminazione della citosina, in particolare,
avviene spontaneamente, ma agenti chimici (mutageni) favoriscono la deamminazione delle basi, come
l’acido nitroso.
Lo stress ossidativo può avere effetto mutageno: il radicale
ossidrile (OH.), prodotto nella cellula dalla reazione del
ferro ionico con il perossido di idrogeno (razione di
Fenton) o da radiazioni ionizzanti, ossida la guanina,
dando la 7,8-diidro-8-oxo-guanina sulla catena del DNA
(8-oxo-dG). Questo mutageno può appaiare sia l’adenina
sia la citosina. Se la polimerasi, durante la replicazione,
incorpora l’adenina appaiatasi, risulta una transversione da G:C del DNA parentale a T:A di una delle eliche
figlie. Questa è una tra le mutazioni più frequenti riscontrate nei tumori umani e porta un cambio
conformazione da cis a syn. Il danno ossidativo al DNA, in particolare del DNA mitocondriale, è considerato
tra le cause dell’invecchiamento. La reazione di questo tipo avviene con l'acqua ossigenata, cioè un radicale
libero dell'ossigeno.
I raggi UV, invece, producono dimeri di pirimidine, per cui questo tipo di mutazione avviene non
spontaneamente. Un dimero di timina si forma in seguito alla reazione di due residui adiacenti di timina. Si
formano quindi legami covalenti tra C5 e C6 delle due timine (anello ciclo butano). Nel caso di una timina
adiacente a una citosina, invece, la fusione porta a un addotto timina-citosina, in cui il C6 della timina è
legato al C4 della citosina. La formazione dei dimeri è catalizzata dalle radiazioni UVC-B (fusione
fotochimica) o da agenti mutageni, come l’etilnitrosourea. Le basi dimerizzate non formano legami
idrogeno con le basi complementari e
inducono la DNA polimerasi ad
arrestarsi durante la replicazione.
Le basi possono anche staccarsi dallo
zucchero, per depurinazione o idrolisi,
generando un sito apurinico. La
depurinazione spontanea è
relativamente frequente, può essere

11
Giulia Mostini

favorita da agenti mutageni, come l’α-tossina B.


La basi inoltre possono andare incontro ad isomerizzazione (foto pag. 11). La tautomerizzazione dei
composti organici è una particolare forma di isomerizzazione per la quale una molecola cambia forma,
mantenendo la stessa composizione in atomi. La basi possono passare dalla forma chetonica alla enolica e
dalla forma amminica a quella imminica.

Test di Ames per l’identificazione dei mutageni


Bruce Ames e i suoi colleghi hanno sviluppato tecniche sensibili che permettono di analizzare la
mutagenicità di agenti chimici in gran numero, velocemente e a bassi costi. Essi hanno prodotto ceppi del
batterio Salmonella typhimurium che portano vari tipi di mutazioni in geni richiesti per la biosintesi
dell’amminoacido istidina. Gli scienziati hanno esaminato la reversione di questi mutanti ponendo un
numero conosciuto di batteri mutanti in un terreno di coltura mancante di istidina e analizzando il numero
di colonie prodotte a causa della reversione. Dato che alcune sostanze chimiche sono mutagene solo sul
DNA in replicazione, essi hanno addizionato al terreno di coltura una piccola quantità di istidina, sufficiente
per poche divisioni cellulari. Hanno poi misurato la mutagenicità della sostanza chimica, paragonando la
frequenza di reversione in sua presenza con quella spontanea. Essi hanno potuto valutare anche quali tipi
di mutazioni sono indotti da una determinata sostanza, utilizzando differenti ceppi batterici portatori delle
varie mutazioni. Dopo questo esperimento, Ames e colleghi hanno osservato una correlazione più alta del
90% tra la mutagenicità e la cancerogenicità di questi composti. Inizialmente, essi hanno trovato che molti
potenti cancerogeni non sono mutageni per il ceppo di Salmonella utilizzato. Successivamente, hanno
scoperto che molte di queste sostanze cancerogene sono metabolizzate nelle cellule eucariotiche in
derivati che sono potenti mutageni. Quindi, Ames e colleghi hanno aggiunto estratto di fegato di ratto al
proprio sistema di saggio per rilevare la mutagenicità dei derivati metabolici delle sostanze da analizzare.
L’accoppiamento del sistema di attivazione di fegato di ratto con il test microbico di mutagenicità ha
ampliato notevolmente la sua utilità. Per esempio, i nitrati di per sé non sono mutageni, ma nelle cellule
eucariotiche sono convertiti in nitrosammine, che invece lo sono altamente. Quindi, il test di Ames ha
dimostrato la presenza di mutageni frameshift in varie sostanze chimiche.

Il meccanismo di correzione delle bozze: il riparo del DNA.


Molecole alterate e mal funzionanti vengono normalmente eliminate dalla cellula. Questo non può
avvenire per molecole di DNA danneggiate in quanto ciò comporterebbe la morte stessa della cellula.
Gli errori possono fissarsi solo dopo un ciclo replicativo, come avviene per le mutazioni.
Poiché le lesioni intrinseche ed estrinseche che avvengono sul DNA sono molto diverse tra loro, le cellule
hanno sviluppato numerosi e diversificati sistemi di riparazione. Questi ultimi hanno lo scopo di permettere
la sopravvivenza della cellula.
Il legame dei dNTP allo stampo attraverso legami idrogeno orientati, l’ingombro delle basi e controlli sterici
nel sito attivo della DNA polimerasi contribuiscono al corretto appaiamento della basi. Tuttavia la frequenza
di incorporazione di nucleotidi non complementari è relativamente elevata (1 nucleotide errato ogni 104-
105 nucleotidi incorporati). Questa frequenza di errore viene ridotta di 100-1.000 volte grazie ai meccanismi
di correzione intrinseci nel complesso della DNA polimerasi, che possiede una tasca enzimatica specifica
per la rimozione degli appaiamenti incorretti. Il valore di fedeltà finale è un errore ogni 106-108 nucleotidi
incorporati. Inoltre, riparazioni successive portano la fedeltà replicativa a meno di un errore ogni 109-10
nucleotidi incorporati. Questo consente di replicare il
genoma umano con totale accuratezza.
Tutte le DNA polimerasi possiedono attività
esonucleasica 3’ -> 5’, in direzione contraria a quella di
sintesi, che consente di rimuovere un nucleotide errato
immediatamente dopo il suo inserimento. Tale attività di
proof – reading o di correttore di bozze è specifica per
gli appaiamenti scorretti e comporta il transito dell’elica
nascente dalla tasca di polimerizzazione alla tasca
esonucleasica.

12
Giulia Mostini

Meccanismi di riparazione post-sintesi


Questi possono essere vari: riparazione diretta, riparazione per escissione di basi (BER – vengono rimosse le
basi), riparazione per escissione dei nucleotidi (NER – vengono rimossi i nucleotidi), ricombinazione
omologa (HR – prevede un’altra doppia elica stampo) ed End joining (EJ).
I meccanismi di riparazione post-sintesi si occupano di riparare tutti i tipi di danni, come il danno ossidativo.
Esistono enzimi specifici che si occupano di specifici tipi di danno. In particolare, gli enzimi MMR riparano le
basi appaiate in modo errato (siti di mismatch), nonostante il passaggio della polimerasi, che devono essere
corrette prima che il DNA si replichi nuovamente, per evitare che diventino mutazioni trasmissibili. Questi
enzimi effettuano un meccanismo indipendente dalla DNA polimerasi. Ad esempio, è tipico in E. Coli con tre
proteine (MutS, MutL, MutH), definite DNA MisMatch Repair.
MutS, che è un dimero, sembra una pinza sul DNA, che, quando incontra una base sbagliata, la lega,
distorcendone la struttura. Questo porta all'intervento di MutL e MutH, che tagliano il filamento
all'estremità del sito di mismatch per eliminare la base errata. Il buco viene riempito dalla polimerasi III e
legato dalla ligasi, che colma il gap correttamente.
Nei batteri, il filamento stampo viene distinto da quello neosintetizzato mediante il gruppo metile legato
all’adenina (metilazione) della sequenza CTAG, relativamente frequente nel genoma. La metilazione di
queste A è operata dall’enzima DAM (DNA adenina metilasi). Il riconoscimento avviene perché più è
vecchio più è metilato il filamento, mentre da nuovo è più difficile che lo sia. Questo indica quale elica è lo
stampo parentale.
MutH è un endonucleasi, che si attiva solo quando è associata a una doppia elica emimetilata e taglia dal
lato non metilato, per cui lavora solo con il filamento recente al 5’ della G nella sequenza GATC,
complementare a CTAG.
Negli eucarioti, gli enzimi MMR riconoscono il filamento nuovo perché contiene i buchi lasciati tra i
frammenti di Okazaki, dovuti alla copiatura del lagging strand.

Processi di controllo
Il danno al DNA attiva dei processi di controllo (checkpoints) che modificano il fenotipo cellulare.
Inizialmente i checkpoints attivati dal DNA danneggiato venivano identificati con i processi di arresto del
ciclo cellulare allo scopo di fornire il tempo alla cellula per riparare, prima di fissare nelle cellule figlie
l’eventuale errore come mutazione. In seguito, oltre al controllo dell’arresto del ciclo cellulare, diverse
proteine coinvolte in questi meccanismi sono state dimostrare essere coinvolte nella riparazione del DNA e
nella rilocalizzazione degli enzimi di riparo. Inoltre, quando il danno persiste, i checkpoints possono attivare
un programma di morte cellulare (apoptosi) per prevenire la comparsa di cellule trasformate. Difetti nei
checkpoints del danno del DNA producono instabilità genomica.
Molteplici vie (checkpoint pathways) di interazioni e modificazioni fra proteine seguono all’iniziale
riconoscimento di siti danneggiati del DNA. Queste cascate di eventi contribuiscono all’amplificazione e
trasduzione del segnale di danno al DNA all’interno della cellula. In questo modo un singolo sito mutato
può indurre un effetto sostanziale a livello dell’intera cellula, come l’arresto della divisione. Gli enzimi
attivati, di solito, sono le chinasi. Il gene soppressore del tumore p53, per esempio, è un mediatore centrale
della risposta indotta dal danno del DNA nei mammiferi.
Il danno reale al DNA è elevato (60.000 danni al giorno), in particolare per il verificarsi di danni ossidativi,
mentre le mutazioni sono più rare. I difetti negli enzimi di riparo possono favorire il cancro.

Meccanismi di reversione ed escissione


Reversione diretta
Può avvenire per fotoriattivazione, attraverso cui vengono riparati dimeri di pirimidina, ma non è diffusa
nell’uomo, anche se lo è in altri eucarioti e nei procarioti. In dettaglio, prevede l'azione dell'enzima fotoliasi,
che ripara i dimeri di timina e i dimeri di timina – citosina. In marsupiali e placentati non è presente. Questo
enzima assorbe fotoni di luce (λ: 320-370 nm), innescando una reazione redox, che scinde il dimero.
Presenta un FADH (gruppo prostetico), per cui quando il fotone viene assorbito, trasferisce l’elettrone
all’anello del ciclobutano. Questa condizione è instabile, per cui si ripristina la condizione iniziale, con

13
Giulia Mostini

decadimento energetico immediato. A questo punto, l'enzima viene rilasciato dal DNA e il ciclo può
ripartire.
E. Coli riesce a riparare il DNA anche in assenza di luce, con un sistema di escissione, comprendente quattro
enzimi che si assemblano in un complesso: UvrA, UvrB, UvrC e UvrD riconoscono, tagliano e rimuovono un
tratto di filamento singolo intorno al dimero di timina.
L'altro meccanismo diretto è la transmetilazione, tramite rimozione di gruppi alchilici. In molti procarioti,
l’effetto degli agenti alchilanti viene rimosso dall’enzima O6-alkylguanine DNA alchiltransferasi (AGT I o ADA
o AGT II in procarioti; MGMT o AGAT in mammiferi), che trasferisce il gruppo metilico dalla guanina ad un
residuo di cisteina dell'enzima, riformando la struttura della guanina che può nuovamente appaiarsi con la
citosina. ADA è un operone, cioè un insieme di 4 geni che vengono attivati insieme (Ada, AlkA, AlkB, AidB).
Lo stress e i fattori ambientali possono regolarne l'espressione metabolica.

Riparo con escissione


Si divide in BER (riparazione per escissione di basi) e NER (riparazione per escissione di nucleotidi).
Il BER può essere short o long patch in base alla lunghezza del frammento eliminato, mentre il NER è global
genome, se comprende l'intero genoma, o transcription- coupled, se agisce su danni localizzati nelle regioni
trascritte dalle RNA polimerasi.

BER
Il primo passaggio del processo del BER è il riconoscimento del danno da riparare. Nel caso di danni causati
da specie reattive dell’ossigeno (ROS), DNA glicosilasi specifiche rompono il legame glicosidico tra lo
zucchero e la base azotata danneggiata, scorrendo lungo il solco minore. Questi enzimi, identificata la base
alterata, comprimono la doppia elica del DNA cosicché la base venga flippata all’esterno dell’elica e legata
alla tasca enzimatica specifica dell’enzima. L'enzima, ovviamente, interagisce con una porzione positiva,
dato che il DNA è negativo, e scorre in due dimensioni. La glicosilasi riconosce l’uracile e lo elimina,
producendo un sito apurinico o apirimidinico (abasico) senza la base corrispondente. Questi enzimi tagliano
anche l’adenina erroneamente appaiata alle basi ossidate. Successivamente, una endonucleasi, detta APE1,
riconosce il sito privo di base e incide il legame fosfodiesterico.
Il BER, dopo l'intervento della glicosilasi, può procedere attraverso due vie: long o short. La seconda è la
preponderante nei mammiferi e richiede l’intervento della DNA polimerasi β, che rimuove il desossiribosio
privo di base e poi riempie il buco creatosi. Successivamente, il legame fosfodiesterico è saldato da una
ligasi specializzata (DNA ligasi 3). Il long patch, invece, prevede l’azione delle DNA polimerasi δ o ε e di
PCNA che allungano il 3’-OH di 2-10 nucleotidi, attraverso una reazione di “strand displacement”,
denominata FEN 1(flap endonuclease 1), che riconosce la struttura formatasi. La discontinuità è poi saldata
dalle ligasi 1 o 3.
Per localizzare le interazioni, si utilizzano le tecniche di immunofluorescenza. In pratica si costruiscono
proteine di fusione, formando un unico gene con un'altra proteina, in modo da far esprimere le proteine da
un unico gene, per poi osservare al microscopio la porzione fluorescente che è stata fusa.

NER
Per quanto riguarda NER, esso agisce negli eucarioti e nei procarioti, riparando le lesioni che provocano una
distorsione della doppia elica del DNA e sono causate da agenti chimico-fisici. In particolare è richiesto per
la riparazione dei danni causati da radiazioni ultraviolette ((UV) che sono presenti nella normale luce solare.
Il meccanismo del NER si divide in GGR (global genome repair), se riguarda una lesione estesa a tutto il
genoma, e TCR (transcription Coupled Repair), che riguarda solo geni in fase di attiva trascrizione.
Il TCR agisce sul gene in trascrizione, per cui è presente RNA polimerasi. Se si incontra un sito danneggiato
la RNA polimerasi, che deve sintetizzare mRNA, si dissocia e intervengono altri fattori del NER che iniziano il
processo di riparo. Una lesione al DNA è riconosciuta direttamente in qualunque punto del genoma dai
complessi UV-DDB e XPC/HR23B o produce lo stallo della polimerasi, che associa CSB. Dopo il
riconoscimento del danno, il complesso TFIIH viene reclutato per svolgere il DNA attorno al danno e le
proteine strutturali XPA e RPA si legano al DNA a filamento singolo risultante. Successivamente, le
endonucleasi ERCC1/XPF e XPG rimuovono una patch di DNA, comprendente la lesione. Infine, avviene il

14
Giulia Mostini

riempimento del gap con la sintesi di nuovo DNA. Durante l’elaborazione di una lesione, altre proteine in
prossimità, compresi gli istoni, vengono modificate come parte di una cascata di segnalazione.
In GGR, invece, UVRA e UVRB scorrono ovunque nel genoma, per cui possono riconoscere siti danneggiati,
rimuovendo il sito danneggiando stesso al di fuori della trascrizione. Ci sono dei fattori che codificano per le
proteine necessarie.
Tutte le proteine che intervengono hanno un'origine particolare, derivata dal riconoscimento di malattie,
da cui si è proceduto all'indietro. Altre proteine, invece, intervengono nella rimozione del filamento e o
viene riempito il buco da ligasi oppure vengono attivati i checkpoint.
I difetti del NER possono causare gravi malattie:
• Xeroderma pigmentoso (XP): è caratterizzato da un’esposizione alla luce solare, che provoca cancro
alla pelle, lesioni oculari, anormalità neuronali, progeria. I geni mutati sono XPA, XPB, XPC, XPD, XPF
e XPG.
• Tricotiodistrofia (TTD): è caratterizzata da un disturbo fisico e mentale, con caduta dei capelli
perché vi sono difetti nel riparo del DNA, con perdita di cellule staminali nella cute. I geni mutati
sono XPB, XPD, TTDA, che costituiscono il fattore TFIIH.
• Cockayne syndrome (CS): è associata a un ritardo di sviluppo, con sintomi quali nanismo, progeria,
atrofia oculare, ritardo mentale e sensibilità alla luce solare. I geni mutati sono CSA e CSB.
I meccanismi di riparo NER, BER e delle rotture di entrambi i filamenti (DSB – Double Strand Breaks)
comportano la formazione di ssDNA che associa SSB che reclutano la chinasi ATR sul sito della lesione,
iniziando la cascata del checkpoint ATR dipendente (può essere attivata anche da riparazioni omologhe).
L’attivazione di ATR stimola le chinasi del checkpoint, che a loro volta attivano p53, prevenendo la
degradazione, e inibiscono le fosfatasi Cdc25. P53 trascrive il gene p21, un inibitore di CDK, e le Cdc25 non
riescono più ad attivare, mediante defosforilazione, il CDK. Il risultato è che le cicline non promuovono oltre
il ciclo cellulare.
Mutazioni di ATM o ATR producono gravi malattie:
• Sindrome di Seckel (nanismo): i sintomi sono ritardo nello sviluppo intrauterino e post natale,
nanismo, microcefalia, ritardo mentale e progeria. Il gene mutato è ATR.
• Atassia telangectasia (AT): i sintomi sono atrofia muscolare, difetti di coordinazione, ritardo
mentale, dilatazione dei vasi, immunodeficienza, sensibilità alle radiazioni e agli agenti mutageni,
aumentata incidenza di cancro. Il gene mutato è ATM.

Meccanismi di ricombinazione e trasposizione del DNA


Se il danno che si è verificato sul DNA non viene riparato, c'è comunque un sistema di sicurezza affinché la
polimerasi si stacchi e ne intervenga un'altra ad appaiare basi in modo casuale, invece di interrompere la
divisione in una fase che porterebbe alla morte della cellula. La pol IV e la pol V riescono quindi a inserirsi
quando la III si è staccata, procedendo nella lettura. Dopo il punto di lesione, le polimerasi III riprendono il
lavoro. Questa processo è detto translesione (TLS) e appartiene alla risposta SOS poco affidabile, ma
comunque fondamentale perché permette di completare il processo replicativo.
Vi è anche un sistema più efficiente per procedere, che si chiama repriming, cioè il filamento che si sta
creando non si continua a copiare dal filamento danneggiato stampo, ma viene copiato a partire dal
filamento non danneggiato (non stampo), in modo da essere completo. Questo processo si chiama
template switch ed è di copia incrociata, per permettere di riparare il danno.

Ricombinazione omologa (HR)


E’ utilizzata in molti processi, come la riparazione di certi tipi di DNA, se ci sono rotture in entrambi i
filamenti, oppure durante il crossing-over per ricombinare o per la produzione di immunoglobuline, le quali
danno anticorpi. Il meccanismo di ricombinazione omologa è il più importante tra i vari processi
ricombinativi e tutti gli organismi viventi, procarioti ed eucarioti, condividono alcuni passaggi:
1. Allineamento di due molecole di DNA omologhe che devono essere avere sequenze identiche o
quasi per una regione di almeno cento nucleotidi.
2. Introduzione sul DNA di rotture a singolo o a doppio filamento che generano i due modelli di
ricombinazione.
15
Giulia Mostini

3. Formazione di due molecole di DNA congiunte che si formano quando un filamento con l’estremità
3’-OH libera di una delle due molecole di DNA trova una sequenza complementare sulla molecola di
DNA omologa. Le due molecole sono ora congiunte da filamenti che si incrociano, formando nella
regione di omologia la struttura chiamata giunzione di Holliday. Il modello oggi più accreditato di
ricombinazione omologa indica che la maggior parte degli eventi di ricombinazione sono innescati
da rotture del DNA a doppio filamento (DSB). In tale modello si creano due giunzioni di Holliday.
4. Le giunzioni di Holliday possono muoversi sulle molecole di DNA, prevedendo, nel caso di DSB,
neosintesi di DNA attraverso un processo chiamato migrazione della giunzione o branch migration.
5. Le giunzioni di Holliday devono, infine, essere risolte da tagli e ricuciture del DNA, tramite l’azione
di più proteine che qui indichiamo come risolvasi. La risoluzione della giunzione di Holliday può
avvenire mediante tagli con orientazioni diverse che danno origine a diversi prodotti di
ricombinazione.
Oltre alla branch migration, esiste il by-pass di rewind: il
filamento più lungo si riappaia.
I DSB si possono originare durante i processi di riparo per il NER
e BER, se vengono tagliati altri legami fosfodiesterici, per cui le
molecole si staccano e hanno la possibilità di congiungersi da
altre parti, generando mutazioni e nuovi prodotti proteici di
trasformazione delle cellule. Questo è dato anche da raggi
gamma o UV. L'elettroforesi in agarosio consiste nel passare il
DNA puro nell'agarosio, dando un saggio comet, ovvero una
scia: più la scia è lunga più è danneggiato il DNA.
Dunque, la ricombinazione omologa interviene sia su
interruzioni nette sia su estremità protruding. DSB netti,
eventualmente, vengono processati a singoli filamenti
protruding al 3’ dal complesso MRN e altre proteine Rad.
Quindi, Rad51 sostituisce la SSB RPA e promuove l’invasione del
cromosoma omologo da parte del filamento 3’ protruding che
porta alla formazione di eteroduplex e di intermedi di Holliday.
Il rilascio di Rad51 all’estremità favorisce la neosintesi di DNA.
Infine, l’intermedio di ricombinazione è risolto dall’azione delle
resolvasi e i frammenti legati da ligasi.

HR in E.Coli
Il complesso RecBCD si lega a un DSB secondo un orientamento
preciso e srotola la doppia elica, grazie alle sue elicasi ATP-
dipendenti RecD (veloce) sul 5’ e RecB (lenta) sul 3’. Quindi lo
svolgimento in 5' -> 3' è più veloce. Questo costringe il
filamento lento a fare un loop. Quando si arriva in prossimità della sequenza 5’-GCTGGTGG-3’ (χ),
riconosciuta da RecC, l’attività nucleasica di RecB degrada il filamento opposto, rilasciando un filamento
sporgente al 3’ su cui la proteina RecA si lega, avviando il processo di ricombinazione. Il risultato è il
protruding di 3' perché 5' è sparito.
A questo punto, RecA si lega al singolo filamento in maniera cooperativa con una velocità di
polimerizzazione maggiore in direzione 5’ -> 3’. Così si genera un 3' protruding foderato da questo
materiale proteico.
Lo strand invasion è lo step di invasione dell'altro filamento. Non si capisce molto bene come avvenga il
meccanismo. C'è un modello di rotazione, uno di dissociazione e uno di ridistribuzione. Il primo (contenuto
in RecA) ingloba anche l'altra elica in una rotazione continua, facendo ruotare il singolo filamento (azione
meccanica ATP dipendente). Nel secondo, c'è un azione per cui avviene l’accoppiamento dello scambio di
DNA-filamento con la dissociazione dei monomeri RecA. Nel terzo modello, RecA avrebbe solo la funzione
di facilitare l’appaiamento con DNA, consentendo l’ immersione del single strand nell'altro filamento nudo.

16
Giulia Mostini

A questo punto c'è la risoluzione dell’intermedio con la formazione dell’ incrocio di Holliday: il complesso di
RuvA e RuvB (elicasi) riconosce la giunzione di Holliday e ne promuove la migrazione (chiasmo). RuvC,
invece, è una resolvasi che risolve il complesso tagliando in una delle sue direzioni dopo la seconda T della
sequenza 5’-A/TTTG/C-3’.
La direzione del taglio operato dalla resolvasi può determinare il rimescolamento della sequenza allelica sul
cromosoma.
Nel caso del DNA danneggiato, possono intervenire BRCA1, BRCA2 e Rad51, che interagiscono per riparare
il DNA danneggiato. BRCA1, fosforilato dalla chinasi ATM, lega Rad51. In risposta al danno al DNA, il
complesso si rilocalizza nelle regioni cromosomiche in attiva replicazione, caratterizzate dalla presenza
dell’antigene nucleare cellulare proliferante (PCNA – proteina clamp di DNA polimerasi δ). In questo modo
Rad51 può efficientemente partecipare ad eventuali processi di riparo. La perdita della funzione BRCA1 e/o
BRCA2 porta all’incapacità di riparare il DNA danneggiato. Se ad essere danneggiati sono geni critici, come
p53, essi non possono essere attivati e le cellule proliferano accumulando ulteriori mutazioni.

Ricombinazione omologa meiotica


La ricombinazione omologa della meiosi è diversa da quella della riparazione. Interviene una proteina,
Spo11, che taglia il DNA in zone libere dai nucleosomi, in cui interviene un esonucleasi (MRX), che degrada i
filamenti attaccati a Spo11, dall’estremità 5’, producendo un 3' protruding. A questo punto, intervengono
altre proteine specifiche per la meiosi (Rad51 e Dmc1 omologo di RecA) che foderano il 3' protruding e
catalizzano la ricombinazione omologa fra cromosomi omologhi. La ricombinazione è prodotta da
complessi enzimatici.
Può esserci un difetto della ricombinazione omologa, che può essere causa di mutazioni e di insorgenza di
malattie, come il cancro al seno. Per esempio, le elicasi RecQ omologhe svolgono un ruolo critico nel riparo
mediante ricombinazione omologa. Inoltre, i DSB possono essere una causa dell’invecchiamento.

Meccanismo NHEJ (non-homologous end-joining)


Il meccanismo NHEJ lega terminazioni DSB piatte con taglio netto perché
3' e 5' sono paralleli e il taglio avviene sulla stessa base. Entra in gioco
nel riparo da ricombinazione e in processi di ricombinazione fisiologica,
come la ricombinazione dei geni nelle immunoglobuline. E' riconosciuta
dal complesso costituito da KU80 e KU70, che lega una chinasi DNA-PK.
A questo punto viene reclutato il complesso MRN, composto da Mre11,
Rad50 e Nbs1, che attiva il checkpoint e mantiene la giunzione che viene
saldata dalle proteine XRCC4 con la DNA ligasi 4.

Ricombinazione sito specifica (SSR)


La ricombinazione sito specifica è limitata a specifiche sequenze di DNA che possono essere anche piuttosto
corte (20-200 nucelotidi). In questo caso, lo scambio di filamenti di DNA avviene tra segmenti che
possiedono omologia di sequenza. Questa ricombinazione richiede l’azione di enzimi specifici, detti
ricombinasi sito specifiche (SSRs) che catalizzano il taglio e l’unione delle molecole di DNA coinvolte.
Se i siti di ricombinazione che hanno omologia di sequenza e stesso orientamento si trovano su due
molecole di DNA distinte, si ha
l’integrazione di una molecola
nell’altra (inserzione del fago
lambda). Se i siti di
ricombinazione con stesso
orientamento si trovano su
un’unica molecola di DNA, può
avvenire una delezione. Se i siti
di ricombinazione hanno
orientamento opposto sulla
stessa molecola di DNA, ne

17
Giulia Mostini

risulta un’inversione.
L'esempio di SSR si trova nel ciclo biologico del fago lambda, che sopravvive grazie a E. Coli che parassita. Il
genoma del fago infatti è iniettato all'interno della cellula batterica, dando un circolo con propria origine di
replicazione oppure può esistere come profago, cioè non completa il suo ciclo vitale, ma si riproduce
integrato con il genoma batterico (ciclo lisogenico – silente). Alternativamente, il profago può essere
escisso dal genoma batterico ed andare incontro a una crescita, entrando in un ciclo litico che porta alla lisi
del batterio con liberazione delle cellule del virus. Sul DNA del fago e su quello di E. Coli sono presenti corte
sequenze altamente omologhe, chiamate attP e attB. La ricombinasi di lambda o integrasi (INT) ricombina
le sequenze, determinando l’integrazione del DNA di lambda nel cromosoma batterico. Le proteine
codificate dal batterio FIS e IHS e XIS sono coinvolte nell’escissione.

Ricombinasi sito specifiche


La ricombinasi si dividono in due famiglie: serina ricombinasi e tirosina ricombinasi. Sono due famiglie con
meccanismi diversi di funzionamento, in base al R amminoacidico dell'enzima che svolge il lavoro. La serina
realizza la reazione tramite il gruppo OH attivo nel sito attivo, che taglia contemporaneamente tutti e 4 i
filamenti, tramite fosforilazione. A questo punto le due DSB ruotano una coppia sull’altra, ligando poi
molecole di DNA diverse. La tirosina, invece, attacca il legame fosfodiesterico tramite il suo R. Esse tagliano
prima due singoli filamenti e li incrociano formando un intermedio di Holliday e tagliano gli altri due,
ligandoli.
La ricombinasi CRE, invece, sono enzimi topoisomerasi I con attività di tipo tirosina ricombinasi, codificate
dal batteriofago P1, che utilizza per linearizzare il proprio genoma. La sequenza del DNA su cui Cre agisce è
detta sito loxP, costituita da 34 nucleotidi. Quattro subunità di Cre, ciascuna della quali è legata ad un sito
di legame sulla molecola di DNA substrato, formano una struttura planare cruciforme.
Le subunità di Cre esistono in due diverse conformazioni, attive o meno. Solo una coppia di subunità alla
volta è in conformazione attiva per il taglio e la ligazione. Terminata l’azione della prima coppia di subunità
si attiva l’altra coppia. Questa sequenza di attivazione precisa consente lo scambio di un filamento alla
volta. La semplicità e l’efficienza di Cre-lox è importante in biotecnologia per introdurre mutazioni sito
specifiche.
La ricombinazione ha molti aspetti: aumenta il repertorio di Ig e TCR. Durante la maturazione dei linfociti, la
ricombinazione del DNA della linea germinale determina l’unione di un segmento del gene D e J della
catena pesante, seguito dall’unione di un segmento V al prodotto D-J, per generare il DNA che codifica la
regione variabile della catena pesante. Durante il riarrangiamento, le estremità dei segmenti genici sono
parzialmente digerite da esonucleasi e successivamente sono aggiunte nuove basi, in modo casuale. Questo
processo produce variabilità di sequenza nella regione giunzionale VDJ che codifica per la regione
responsabile del riconoscimento dell’antigene. Un processo simile di riarrangiamento avviene nel locus
della catena leggera, per produrre il gene della catena leggera riarrangiato.
Un'altra applicazione è il fenomeno dei jumping genes, cioè geni che si muovono da una parte all'altra del
genoma. Nelle piante (granturco) il 99% del genoma è così, mente nell’uomo solo il 45%.

Trasposizione e trasposoni
Un elemento trasponibile (TE o trasposone) è una sequenza di DNA che può cambiare posizione all'interno
del genoma. Questo può portare a mutazioni somatiche che risultano in caratteristici fenotipi a mosaico.
La trasposizione è il tipico processo di ricombinazione attraverso cui i trasposoni si muovono sul genoma. Le
ricombinasi coinvolte sono le trasposasi, codificate dalla stessa porzione che si muove.
Ci sono trasposoni a DNA, retrotrasposoni virali LTR e retrotrasposoni non virali (non LTR). I primi possono
essere autonomi perché sono in grado di eseguire da soli la trasposizione, dato che contengono sia le
sequenze di DNA in cis richieste per la reazione di ricombinazione sia le porzioni codificanti per la trasposasi
e/o la trascrittasi inversa, o non autonomi, che possono trasporsi solo in una cellula dotata di un trasposone
autonomo, in grado di provvedere la funzione enzimatica richiesta per la reazione di ricombinazione:
possiedono le sequenza ricombinative in cis sul DNA, ma sono privi della loro propria trasposasi.

18
Giulia Mostini

I trasposoni a DNA tagliano e incollano, nel senso che il dimero di trasposasi lega le sequenze specifiche,
formando un anello che viene escisso e integrato in sequenze bersaglio specifiche duplicate (come il fago
lambda).
Il retrotrasposone, invece, è tipico dei retrovirus in cui la porzione a RNA è cambiata in DNA, come il virus
dell'HIV.
La variegatura dell’ arancia rossa, per esempio, deriva da questi processi. Succede che le piante di arancia
normale vengono infettate da un retrotrasposone, frequente al freddo: se esso (LTR) si inserisce a monte
del gene Ruby, allora si attiva la sua espressione con un pattern variegato e più fa freddo più le arance sono
rosse. Infatti crescono ad altitudini elevate. E' stato sviluppato in agricoltura un metodo per cui è sempre
presente il trasposone, in modo da far sì che il frutto sia sempre rosso. La varietà Novellina è arancione, la
Tarocco è una via di mezzo, mentre Moro è rosso scuro.

La cromatina e il nucleosoma
Il DNA si impacchetta nel nucleo delle cellule umane, in cui sono presenti circa 2 metri di DNA.
I primi studi discendono dal fatto che vi sono coloranti basici o cationici con affinità alta per il DNA
negativo, come l’ematossilina. Per cui, ci si è accorti che vi era del materiale nelle cellule che si colorava in
modo particolare. Lo scienziato tedesco Emil Heitz nel 1930 fu considerato il fondatore della citogenetica,
ma poi è caduto in disgrazia per aver appoggiato Hitler durante la seconda guerra mondiale. Egli con una
ricetta particolare distinse regioni di cromosomi meno dense (eucromatina) e più dense (eterocromatina).
I coloranti adesso sono diversi rispetto al passato perché vi sono diverse densità di colorazione.
La cromatina, quindi, si divide in eterocromatina, che non cambia il proprio stato di condensazione durante
il ciclo cellulare, contiene pochi geni AT ed è localizzata alla periferia del nucleo. Essa è ulteriormente divisa
in costitutiva, che comprende pochi geni ed è formata principalmente da sequenze ripetute, localizzate in
grandi regioni che coincidono con centromeri e telomeri, e facoltativa, composta da regioni attive nella
sintesi di RNA che possono adottare le caratteristiche strutturali tipiche, come nel cromosoma X dei
mammiferi inattivato. L’eucromatina, invece, non è condensata durante l’interfase, ma si condensa con la
mitosi. Essa si concentra all’interno del nucleo e contiene regioni ricche di geni.
Ogni cromosoma ha un proprio bandeggio in base alle basi presenti. Fleming, in particolare, introdusse il
concetto di cromatina e fu il primo ad osservare i cromosomi a spazzola. Col tempo si è passato da
scienziati chimici a biochimici e microscopisti. Ad esempio, Chanbonn (1975) ha visto per la prima volta la
cromatina e il nucleosoma, cioè i frammenti di DNA con delle parti circolari, che sembravano spaziate in
maniera regolare (tra 150 e 250 basi). Il core elettrondenso del nucleosoma è formato da proteine,
scoperte da Kornberg, figlio di colui che aveva scoperto la polimerasi III. A poco più di trent'anni, egli ha
scoperto gli istoni (ha scoperto poi anche i ribosomi) ed è ancora in attività.

Saggio di sensibilità alla DNAsi I


La digestione di DNA cromatinico, non sottoposto a proteasi, con l’endonucleasi DNAsi I, che taglia il
legame fosfodiesterico di una pirimidina, rivela siti lasciati scoperti dal legame con le proteine. La DNAsi
“footprint” rivela i siti dove le proteine legano il DNA.
In cellule non differenziate il DNA è tutto intero ad alto PM (peso molecolare), ma se si aumenta la quantità
di DNAsi, essa agisce sempre di più con la scoperta dei siti di legame con le proteine. Mentre nelle cellule
differenziate si formano frammenti, con cromatina più aperta e accessibile.
La MNase del micrococco è meno controllabile rispetto alla DNAsi ed è usata per la separazione di istoni,
con generazione di frammenti corti, intorno alle 150 basi (147 per la precisione) che sono avvolte attorno al
rocchetto proteico istonico (core proteico).

Nucleosoma
E’ l’unità fondamentale della cromatina ed è composto da un nucleo, core, formato da una parte proteica
(istoni) e da un DNA, una regione internucleosomale adiacente ai nuclei e un tratto di DNA linker. Il core è
estremamente conservato tra le specie ed è composto da 147 paia di basi di DNA, che compiono 1,7 giri
intorno a un ottamero, il quale è costituito da due molecole di ciascuno degli istoni H3, H4, H2A, H2B. La

19
Giulia Mostini

lunghezza del linker, invece, varia tra le specie e tra i tessuti ed è legato da H1. La lunghezza totale del DNA
nel nucleosoma può variare da 160 a 241 bp.
La struttura può essere ulteriormente condensata: 30- 100 nm.
L’azione di H1, associato al linker, fa acquisire alla cromatina quattro tipiche forme a “bobine elicoidali” del
diametro di 30 nm con una lunghezza del DNA del nucleosoma variabile. Si ritiene che questa
superstruttura sia la forma tipica dell’eterocromatina non attiva trascrizionalmente. Osservazioni ulteriori
suggeriscono che la fibra a 30 nm è altamente dinamica, in modo da dispiegarsi come fibra da 10 nm
quando è percorsa da una RNA polimerasi impegnata nella trascrizione.
Le superstrutture sono anche a solenoide o a zig-zag. I processi che li regolano sono poco noti.

Territori della cromatina


La disposizione spaziale della cromatina all’interno del nucleo non è casuale. Le zone di cromatina sono
chiamate territori (CT). I territori sono, ad esempio, i domini associati alla lamina (LAD) e i domini di
associazione topologica (TAD), che sono legati insieme da complessi proteici. Attualmente, i modelli
polimerici come SBS e DL vengono utilizzati per descrivere la piegatura della cromatina nel nucleo.
All’interno della cromatina vi possono essere dei granuli, definiti bodies, di cui non si conosce ancora
l’esatta funzione.
Il modello di dominio cromatinico da 1 Mbp sferico (SCD) presuppone che i CT siano costituiti da regioni di
1 Mbp e che la frazione relativa del volume nucleare occupato da ciascuna CT sia direttamente
proporzionale al numero di questi domini, che costituiscono un cromosoma.
Per studiarli, posso associare le proteine a un colorante, che permette di capire le posizioni dei cromosomi.
Dagli studi sembra che i territori cromatinici seguano il caos come distribuzione.
Il globulo frattale è un modello che permette di sequenziare il genoma. In base alla sequenza capisco se i
frammenti sono uniti, anche se fanno parte di cromosomi diversi. E' possibile capire quali frazioni distanti
possono essere state vicine tanto da essere legate.

Gli istoni e il loro codice epigenetico


Il DNA, come espresso precedentemente, è avvolto
sull’ottamero istonico. Gli istoni sono tipici degli eucarioti,
sebbene alcuni di essi ne siano privi, ma sono presenti
anche negli Archeae. Non sono presenti, invece, sul DNA
mitocondriale.
Le proteine istoniche sono piccole proteine basiche
conservate nell’evoluzione, ricche di amminoacidi di lisina e
arginina, che interagiscono con il DNA negativo. Gli istoni
del core sono H3, H4, H2A e H2B, caratterizzati da una
regione più conservata (fold domain dell’istone), costituita
da 3 α-eliche separate da due regioni ponte. Altrettanto
tipica è la loro coda al N-terminale che protrude dal core
per circa 30 aa. Questa regione è richiesta per
l’assemblaggio della struttura della fibra di 30 nm ed è il bersaglio di numerose modifiche post-traduzionali,
che regolano l’accessibilità del DNA e le interazioni di proteine con il nucleosoma.
L’istone H2A è codificato da numerosi geni, uno dei quali è H2AFX, che produce una proteina con una coda
al C-terminale più lunga di 14 aa. L’istone H2AX è integrato in quei nucleosomi prossimi a lesioni al DNA ed
espone un caratteristico residuo di serina che, fosforilato dalle proteine del checkpoint, contribuisce a
segnalare la risposta al danno.
Il gene CENPA, invece, codifica per una proteina centromerica che contiene regioni simili all’istone H3. Si
ritiene che il gene sia un componente del nucleosoma centromerico, coinvolto nella segregazione dei
cromosomi.

20
Giulia Mostini

Formazione della cromatina


Il primo evento prevede la deposizione nel DNA di un tetramero di nuova sintesi H3-H4 per formare una
particella emi-nucleosoma e la successiva aggiunta dei due dimeri H2A-H2B. Questo determina la
formazione del core del nucleosoma su cui si avvolgono 146 bp di DNA.
Gli istoni appena sintetizzati sono specificatamente modificati. Lo scivolamento per stabilire la spaziatura
regolare richiede ATP e prevede ulteriori modifiche delle code istoniche, come de – acetilazione. Quindi,
l’incorporazione di istoni H1 produce il ripiegamento del filamento in fibre di 30 nm di diametro.
I rimodellatori della cromatina forniscono il meccanismo per modificare la cromatina e consentire ai fattori
trascrizionali di raggiungere i propri bersagli sul DNA. Si ritiene che i rimodellatori della cromatina siano
grandi complessi multi proteici divisi in 5 famiglie (SWI, SNF, Mi2, ISWI, NuRD), che usano l’energia
dell’idrolisi dell’ATP per mobilizzare e ristrutturare i nucleosomi. I complessi di rimodellamento della
famiglia SWR1 possono rimuovere i dimeri canonici H2A-H2B e sostituirli con i dimeri Htz1-H2B, formando
un nucleosoma variante con code uniche che inducono cambiamenti nel legame con le proteine regolatrici
(reg).
ChIP-Seq, inoltre, identifica i siti genomici con istoni modificati, per cui si riesce a ricostruire la distribuzione
nel genoma e l’incidenza della specifica modificazione istonica.
La vasta gamma di modificazioni post-traduzionali delle code istoniche e la loro associazione con risposte a
fattori esogeni ha portato ipotesi di un “codice istonico” che codificherebbe per un particolare tipo di
regolazione della cromatina funzionale ad una particolare risposta adattativa.
Epigenetici sono quei processi di regolazione genica che non dipendono dalla sequenza primaria del DNA.

La trascrizione del DNA e la RNA polimerasi dei procarioti


La trascrizione è il processo tramite cui il DNA fa da stampo, rilasciando molecole di RNA. E' un processo
fondamentale perché il DNA contiene l'informazione, ma non ha capacità esecutive, anzi ha solo ruolo
strutturale, tramite il complesso della cromatina. Si tratta quindi dell'espressione della potenzialità del
DNA.
L'RNA è diverso dal DNA: presenta uno zucchero pentoso, detto ribosio, con gruppi OH, e le basi sono le
stesse, tranne per la timina sostituita dall’uracile. Esso assume configurazioni secondarie strutturali
complesse perché è a singola elica, quindi può ripiegarsi. E' il mediatore dell'espressione, ma il perché è
oggetto tuttora di studio. Il RNA ha una diversa attività chimica perché la presenza dei gruppi OH conferisce
maggiore reattività.
L'RNA esiste in varie classi:
• mRNA: RNA messaggero con capacità di codificare in proteine.
• ncRNA: non codificate. Questi sono divisi in due famiglie: housekeeping, senza funzioni regolative,
ma che partecipano a reazioni chimiche come rRNA (ribosomiale) e tRNA (transfer), e regulatory,
diviso in long lncRNA(TERC - > 200 nucleotidi) e short sncRNA (MicroRNA, in base alla lunghezza
delle basi - < 200 nucetotidi).

Importanza della trascrizione


Si studiano i procarioti perché sono legati alle patologie e sono nostri predatori, quindi fondamentali per
capire come essi riescono ad essere infettivi. Inoltre E. Coli è più piccolo e facile da studiare, per cui si
possono effettuare scoperte più velocemente. Per esempio, l’RNA messaggero è stato scoperto in batteri,
così come le RNA polimerasi. Tutto ciò che riguarda la trascrizione e la regolazione infatti è cominciato nei
batteri perché possiedono un genoma semplice, un DNA esposto e una complessità proteica ridotta.
Fondamentale fu il lavoro degli scienziati degli anni in cui sono stati scoperti i batteri. In particolare, due
scienziati (Jacob e Monod) hanno scoperto il concetto di operone, cioè un insieme di geni che cooperano.
Questo è stato fatto seguendo la linea del tempo delle scoperte, in cui si possono vedere i vari esperimenti
che hanno portato alle conoscenze che si possiedono oggi.

Molecole della trascrizione


Affinché avvenga la trascrizione, è
necessario avere un tratto di DNA da

21
Giulia Mostini

trascrivere (il gene), l’enzima RNA polimerasi e i ribonucleosidi trifosfati (A, C, U, G) e Mg2+.
Il procedimento della trascrizione procede in direzione 5' -> 3', come nella duplicazione, tramite legame
fosfodiesterico tra le basi del filamento nuovo. L’RNA viene copiato sulla base del filamento stampo 3' -> 5',
che possiede una sequenza complementare all'RNA messaggero trascritto e una sequenza simile al
filamento del DNA complementare, in cui si cambia T in U. Si parla di filamento codificate o senso.

Fasi della trascrizione


1. Inizio: La trascrizione inizia nel promotore, con l'attacco della RNA polimerasi. E’ necessario che la
doppia elica del DNA sia parzialmente svolta, dando origine ad un tratto di DNA, chiamato bolla di
trascrizione. Per ciascun gene, la trascrizione procede sempre a partire dallo stesso filamento, che è
chiamato DNA stampo. Nei procarioti il promotore è il sito di legame del fattore σ, che recluta le
altre subunità della polimerasi. σ riconosce sul promotore una regione tipica (TTGAAC) detta -35
perché il primo nucleotide incorporato è sempre 35 basi a monte del primo nucleotide copiato. Chi
governa l'inizio della trascrizione è proprio questa regione. Un'altra regione importante è la TATA
box (o Pribnow box), ovvero un esamero, conservato nei procarioti con sequenza TATAAT. E' a -10
ed è ricca in TA con doppi legami tra le basi, facilitando l'apertura della doppia elica. Il +1 è
l'elemento critico, cioè il primo nucleotide copiato (TSS). Oltre alle due sequenze esiste un
elemento pre -10 molto corto in alcuni promotori che comporta la scomparsa di -35 o in altri
promotori è preceduta da una regione UP -60, ma il sistema è più o meno lo stesso.
2. Allungamento: lungo la molecola di DNA su cui si estende il filamento codificante avviene la fase di
allungamento della trascrizione. Questa fase inizia con il distacco della subunità σ dal complesso
dell’RNA polimerasi. Il complesso 2α, β, β’ può così scorrere lungo il DNA stampo, sintetizzando
RNA ad una velocità di circa 40 nucleotidi al secondo. Mano a mano che la trascrizione procede il
DNA dietro il senso della trascrizione si riavvolge.
3. Terminazione: vi sono dei segnali per la terminazione, secondo due modalità: dipendente da rho (o
da RNA) o indipendente da rho (indipendente da RNA). La caratteristica importante dei procarioti è
che la sintesi dell’RNA avviene direttamente sulla catena nascente di DNA, per cui le RNA
polimerasi rilasciano molecole di RNA lungo il filamento e alle estremità si vedono già i ribosomi
che cominciano a produrre proteine. Per cui le cose avvengono tutte compattate
contemporaneamente. La terminazione è di tipo rho dipendente quando c'è rho, un’elicasi che
lavora scorrendo sull’RNA nascente. Essa procede tramite consumo di ATP, srotolando le strutture
di RNA nascente, fino a quando rallenta per l’incontro di sequenze GC, per cui si verifica uno
scontro perché rho è più veloce delle RNA polimerasi. Questo determina lo scollamento di rho,
portando al termine della trascrizione. La terminazione indipendente non comprende rho, ma si
basa su specifiche sequenze di DNA che, quando vengono incontrate dalle polimerasi, portano al
distacco di RNA nascente. Le regioni sono tipiche, oltre a quella ricca in GC, a valle di queste esiste
uno strach di A e T, tradotte in una coda di poli U. La stabilità di U e A è bassa, per cui la polimerasi
ha difficoltà a mantenere allineate le eliche, staccandosi e terminando la trascrizione.

RNA polimerasi
L’RNA polimerasi (oloenzima) di E. Coli è costituito da 5 subunità α,β,β’,σ e ω. La RNA polimerasi lavora
essenzialmente con α e β e la struttura è conservata, con una forma a forcina basata su α che assembla il
complesso sul DNA, β, la quale forma un canale per l'ingresso dei ribonucleosidi trifosfato che sono
incorporati nella catena nascente di RNA, β’, che lega il filamento di DNA da copiare. ω è aggiuntiva e
conferisce variabilità in base alle condizioni di stress ambientale. Il centro del sistema è un canale piccolo
che consente il posizionamento di un α-elica. Il DNA viene svolto per circa 25 nucleotidi, formando la bolla
di trascrizione, perché il DNA all'uscita dalla polimerasi si richiude con l'altro filamento.
La subunità σ è associata debolmente al complesso e serve ad indirizzare il complesso dell’RNA polimerasi
sulla sequenza di DNA da trascrivere. Le subunità (tranne la ω) si assemblano ogni volta che un gene viene
trascritto e si dissociano al termine della trascrizione di quel gene. L’RNA polimerasi catalizza la formazione
del legame fosfodiesterico dal 3’ della nascente catena di mRNA al nuovo ribonucleotide.

22
Giulia Mostini

L’RNA polimerasi dispone di un solco lungo circa 5.5 nm con una larghezza di 2.5 nm. Esso accoglie un tratto
di 15 basi di doppia elica di DNA a diametro 2 nm.
La sintesi procede in maniera semplice e il DNA è quasi piegato a 90 gradi nella parte posteriore dell’enzima
(muro). Nella parte superiore, l’RNA nascente esce dal solco, mentre alla sua destra si trova il canale da
dove fuoriesce il DNA svolto, che prosegue riappaiandosi. Una struttura al centro della polimerasi (timone)
contribuisce a tenere aperta la bolla. Nella parte inferiore una struttura ad imbuto permette l’entrata dei
ribonucleosidi trifosfato. Nel canale opposto c'è un pertugio dove la molecola nascente di RNA viene
rilasciata.
L'RNA polimerasi ha due attività di editing: un’attività di correzione (idrolitico), in cui si comporta come il
proof reading nella duplicazione, capace di rimuovere uno o più nucleotidi appaiati erroneamente, e
un’attività di catalisi della reazione di escissione del ribonucleotide, inversa all’incorporazione (editing
pirofosforolitico). Queste attività di editing sono meno necessarie perché un errore di copia di RNA è meno
grave di un errore nel DNA.

Il concetto di gene
Il dogma centrale della biologia è stato proposto da Crick. Egli l'ha definito così perché voleva arrivare a una
legge universale. Di leggi universali ne esistono poche in biologia, l'unica è che tutte le forme viventi sono
costituite da cellule. Il dogma centrale afferma la direzione del flusso genetico: DNA -> RNA -> proteine.
Non si procede nella direzione opposta, ma è sempre così il flusso di informazioni. Ci sono un po' di
incrinature, per cui non si sa se rimarrà sempre dogma. Ci sono infatti RNA a funzione regolativa che hanno
la capacità di fare modificazioni intrinseche, diverse da quelle dell’RNA nel dogma centrale, ma comunque
per ora rimane solido.
In genetica il gene è l’unità determinante fondamentale, mentre in biologia molecolare il gene è la regione
specifica del genoma contente le informazioni necessarie per codificare molecole esercitanti una funzione.

Gene procariotico
Il gene procariotico è la regione di DNA che produce un RNA nei procarioti.
Esso ha una sequenza codificante, che sarà copiata nell’RNA, una sequenza promotore, che stabilisce il
legame con l’RNA polimerasi e determina l’orientamento nella trascrizione, una sequenza terminatore, che
segnala per la fine della trascrizione.
Il termine gene deriva da un botanico genetista (Hugo de Vries) che ha aperto al mondo le leggi di Mendel,
che aveva coniato il termine pangenes, da cui abbiamo tenuto genes.
La velocità di trascrizione di un gene può cambiare: la quantità di RNA prodotta da un gene, che
rappresenta il suo livello di espressione, può variare perché vi sono geni costitutivi, che di solito sono stabili
nel tempo, e geni inducibili, che possono essere spenti o attivati in base alle necessità. Ad esempio, ci sono
geni espressi quando la quantità di ossigeno cambia (70 geni se è bassa, 50 se è alta) oppure quando
cambia la temperatura (36 geni indotti in E. Coli).
Il controllo dell'espressione varia per esplorare nuovi fenotipi. Per esempio, i procarioti sono in grado di
regolare la produzione di rho.
L’mRNA dei procarioti è molto spesso policistronico, cioè porta l’informazione per più geni.
Negli eucarioti le molecole utilizzate sono un pochino diverse rispetto a quelle dei procarioti: vi sono 3 RNA
polimerasi, un promotore più complesso con varie regioni segnale, svariati fattori trascrizionali e una
maturazione, che nei procarioti non è presente.

Regolazione della trascrizione nei procarioti, il promotore e il terminatore


Nel genoma vi sono elementi che agiscono in cis o in trans. Il primo è un elemento che agisce sulla stessa
molecola di DNA. Trans, invece, è un segmento di DNA che ha la capacità di influenzare un altro segmento
di DNA di una molecola distinta.

23
Giulia Mostini

Il promotore è la sequenza di DNA posizionata all'inizio del gene, dove inizia la trascrizione. E’ costituito da
diversi cis-active elements, che dirigono la frequenza di legame, il posizionamento e l’inizio dell’attività
dell’RNA polimerasi.
Il terminatore, invece, è una sequenza di DNA posizionata alla fine del gene. E’ costituita da diversi cis-
active elements che determinano la fine della trascrizione e il distacco dell’RNA polimerasi.
RACE (rapid amplification of cDNA ends) è un metodo di biologia molecolare per ottenere una sequenza
completa di un trascritto RNA. Consiste nella produzione di una copia iniziale di cDNA (DNA complementare
- sscDNA) dalle molecole di RNA, mediante trascrizione inversa (enzima retrotrascrittasi), a partire da un
primer specifico nel caso di un gene conosciuto o, da un primer casuale degenerato, nel caso in cui si
vogliano studiare diversi RNA dalla sequenza non nota. Al 3’ delle molecole di sscDNA viene poi aggiunta
una coda di A dalla DNA nucleotidil-esotrasferasi e quindi si amplifica (library amplification) per PCR a
partire da un primer oligo-dT. Le copie amplificate del cDNA vengono quindi sequenziate, tramite un
sequenziatore, per l’identificazione di nuove unità di trascrizione. E’ possibile, in questo modo, mappare i
geni.
La trascrizione nei batteri è associata alla traduzione. Sul gene quindi ci sono tantissimi enzimi in azione:
replisoma, enzimi di riparo, RNA polimerasi, ribosomi. Un micron è la lunghezza del genoma di E. Coli
(cilindrino), per cui il processo è compattato nella cellula, in un gel con poca presenza di acqua perché la
concentrazione molecolare è molto elevata.

Fattori trascrizionali sigma σ


Il fattore σ riconosce il promotore, costituito da sequenze conservate che si trovano a monte del sito di
inizio della trascrizione, ma solo quando è parte integrante della RNA polimerasi oloenzima. Infatti σ da solo
non è in grado di riconoscere e legare il promotore. Negli eucarioti il promotore è riconosciuto, invece, da
vari fattori trascrizionali.
E. Coli ha 5 fattori σ diversi che riconoscono tipiche
sequenze: σ70 è il più utilizzato, che riconosce le sequenze
conservate -10 e -35, e partecipa alla trascrizione della
maggior parte dei geni, mentre σ32, riconoscono le
sequenze per le proteine dell’ eccesso di calore, σ28
riconosce per la formazione del flagello, σ54, per i geni del
metabolismo dell’azoto, e σ38 per i geni della risposta a
stress esogeni.
La proteina σ è formata da 4 granuli che contattano la polimerasi in diversi punti. La regione 4 di σ lega la
regione -35 del promotore, mentre la 3 lega -10, la 2 La bolla di trascrizione e la 1 la porzione a valle
dell’RNA polimerasi.
Non interviene ATP in questa fase, ma σ 2 si lega a -10 in virtù di conformazioni sterili che avvicinano sigma
al DNA. La A a -11 e la T a -7 vengono sganciate, ruotano e sono inserite nelle tasche precise di σ 2. Questa
condizione è favorita perché formano più legami a idrogeno nelle tasche piuttosto che in catena. Si tratta di
una distorsione profonda nella doppia elica che provoca un disallineamento della catena, con una prima
apertura. Si parla di isomerizzazione.

Elemento up
E' contattato non da σ, ma da α della polimerasi, che ha una coda C – terminale (αCTD) che si prolunga a
monte di -35.
Le sequenza consenso, invece, sono sequenze ideali che descrivono la più frequente interazione del DNA
con la sua proteina regolatrice. Esse derivano dallo studio di sequenze reali e dai più frequenti nucleotidi
presenti nel promotore.
Come RNA procede oltre? I modelli possibili sono tre:
1. Passaggio transiente: la polimerasi avanza per un breve tratto, sintetizzando un corto frammento
abortivo di RNA e poi indietreggia al punto di partenza sul promotore.
2. Bruco: si ha un cambiamento conformazionale della polimerasi che si allunga e si contrae sul DNA.

24
Giulia Mostini

3. Accartocciamento (scrunch): la polimerasi inizialmente sta ferma sul promotore e ingloba dentro di
sé un tratto di DNA che si accartoccia al suo interno. E’ possibile che la polimerasi proceda anche
nella fase di allungamento con questa tecnica.

Terminatori
I terminatori intrinseci sono i terminatori rho-indipendenti, in cui il segnale deriva dal DNA, che contiene
sequenze palindromiche ricche in G-C, seguite da un tratto di 8-9 nucleotidi ricco in A e T. L’RNA trascritto
forma, in questa regione, una forcina che destabilizza, insieme con il tratto di 8 U, il complesso
trascrizionale. Al termine il DNA ha una simmetria diadica, in cui C e G formano un doppio filamento perché
sono fortemente legate, per cui è difficile da aprire. A valle c'è una sequenza AT tradotta in uracile, per cui
vi è una appaiamento debole. Questa struttura distacca RNA nascente e chiude la doppia elica, con stacco
della polimerasi. Queste regioni vengono frequentemente mutate.
Nei terminatori rho dipendenti, invece, il DNA contiene le informazioni per l'attivazione di rho. Esiste una
sequenza RUT che non è netta, ma è ricca in G (41%), riconosciuta da rho, la quale inizia a scorrere come
un’elicasi ATP dipendente, che si muove in direzione 5’->3’, agendo come un terminatore, con conseguente
disassemblamento del complesso di trascrizione.

L’operone
Nel genoma dei procarioti i geni sono per lo più organizzati in operoni. Un operone è un gruppo di geni
adiacenti trascritti insieme in una singola molecola di mRNA, che per questo viene chiamato policistronico.
I livelli di espressione di un gene, garantiti dall’RNA polimerasi in assenza di fattori di attivazione della
trascrizione (attività costitutiva), sono relativamente bassi. Questo livello basale può essere ulteriormente
ridotto da specifiche proteine (repressori) che bloccano il legame della polimerasi al promotore. I livelli di
trascrizione, invece, possono essere aumentati da proteine stimolanti (attivatori).

Fattori di attivazione della trascrizione


Gli attivatori legano sequenze specifiche in prossimità delle regioni di legame della RNA polimerasi, che
viene contattata dall’attivatore. Questa interazione induce modificazioni allosteriche della RNA polimerasi,
che facilitano la transizione (isomerizzazione) a stato attivo del complesso enzimatico sul DNA.
Tratti del DNA distanti possono avvicinarsi quando intervengono questi attivatori, che possono regolare la
trascrizione con ripiegamento della porzione del DNA. Il legame cooperativo è un esempio di interazione
chimica tra proteine che prevede che i legami in successione aumentino di affinità uno verso l'altro. Una
proteina che facilita la torsione del DNA contribuisce all’espressione, favorendo l’avvicinamento
dell’attivatore al promotore legato dalla polimerasi.
I fattori, quindi, sono regolati da geni presenti sottoforma di operoni: quando c'è necessità di regolare
fenotipi complessi, i geni vengono uniti sotto controllo di unità uniche.
L’operone è costituito da uno o più geni strutturali adiacenti che codificano proteine; un’unica sequenza
promotore a monte della serie di geni capace di legare l’RNA polimerasi, una sequenza operatore
sovrapposta o adiacente al promotore che, interferendo con il legame della polimerasi al promotore, regola
l’espressione dei geni strutturali, e un gene regolatore che codifica per la proteina regolatrice, ma non è
considerato parte integrante dell’operone, in quanto può essere dislocato in un punto del genoma lontano
da esso.

L’operone lac
L’operone LAC è coinvolto nel metabolismo del lattosio in E. Coli. Esso è soggetto a due meccanismi di
regolazione: una regolazione specifica, realizzata mediante un controllo negativo da parte di un repressore
e che risponde alla disponibilità di lattosio, e una regolazione globale, realizzata da un controllo positivo da
parte di una proteina attivatrice e che risponde a cambiamenti ambientali più ampi.
Quando E. Coli cresce in presenza di sorgenti di carbonio oltre al lattosio, i livelli delle proteine prodotte
dalla trascrizione dei geni dell’operone Lac, z, che codifica per l’enzima β-galattosidasi, y, che codifica per
permeasi, a, che codifica per la tiogalattoside transacetilasi, sono mille volte inferiori rispetto a quando il
lattosio è presente.

25
Giulia Mostini

Quando è presente solo il glucosio, il repressore dell’operone Lac, che lega l’operatore in prossimità del
promotore dell’operone Lac, ne sopprime la trascrizione.
Quando, invece, il lattosio è presente, si lega al repressore e ne impedisce il legame all’operatore,
rilasciando la repressione della trascrizione che può avvenire liberamente dal promotore Lac. Il lattosio è
perciò definito come induttore di questi tre enzimi.
La piccola molecola capace di indurre la trascrizione, in particolare, non è il lattosio, ma il suo analogo
allolattosio, che va considerato il vero naturale induttore. Quando è presente nel mezzo, produce un
aumento della β-galattosidasi.
A livello di sequenze dell'operone LAC, l'operone è sovrapposto al promotore. E' formato da due sequenze
ripetute, che consentono il legame di un dimero di repressione. Le sequenze esistono anche distali, legate
da altri dimeri, dando un tetramero per cui il DNA è racchiuso e forma di forcine. Esso è curvo e
irriconoscibile da σ e polimerasi. In queste condizioni è spento, ma viene attivato quando vi è eliminazione
del tetramero, per cui vi è un allineamento e la polimerasi e σ intervengono.
L’operone lac in risposta al lattosio è un esempio di regolazione negativa della trascrizione. Quando i livelli
di glucosio sono bassi, invece, si attiva l’enzima adenilato ciclasi, che converte l’ATP in AMP ciclico, che a
sua volta lega la proteina attivatore CAP e ne stimola il legame al promotore dell’operone lac, che viene
così indotto a trascrivere attivamente. In questo caso si tratta di un circuito di regolazione positiva o da
catabolita. Questo avviene perché lo zucchero preferenzialmente usato è il glucosio e solo in sua assenza
vengono attivati gli operoni per utilizzare gli altri zuccheri, come il lattosio. Se il glucosio è presente, il cAMP
è basso, il lattosio è assente e non vi è alcun mRNA lac; se il glucosio è presente, il cAMP è basso, il lattosio
è presente e vi sono piccole molecole di mRNA lac; se il glucosio è assente, il cAMP è alto, il lattosio è
presente e vi è abbondante mRNA lac.

Operone Trp
L’operone del triptofano è costituito da un gruppo di geni contigui che codificano per una serie di enzimi
responsabili della sintesi dell’amminoacido. Si tratta di un sistema reprimibile, cioè l’espressione dei geni
viene repressa quando viene aggiunto nel mezzo di coltura il triptofano. Quindi, l’operone è regolato anche
da una regione attenuatore che blocca la trascrizione. Quando il triptofano è scarso, il ribosoma ritarda in
corrispondenza di due codoni per questo amminoacido, favorendo la formazione di una forcina alternativa
a quella che attenua la trascrizione. Il triptofano, infatti, è reprimibile, quindi senza l’operone è trascritto e
con l’operone è represso. L’operone triptofano contiene 5 geni strutturali (A-E) che codificano per specifici
enzimi necessari alla sintesi del triptofano. Nella regolazione è coinvolta la regione A5’ dell’operone (al
promotore), l’operatore, la regione leader e il sito attenuatore.
In presenza di triptofano, è coinvolta la proteina repressore trp non appartenente all’operone. Il repressore
viene attivato e si lega all’operatore per impedire la trascrizione dell’operone. Il ribosoma entra nel
segmento 2 e induce l’mRNA in fase di trascrizione ad assumere una struttura secondaria che porta alla
formazione di un segnale di terminazione: la trascrizione si arresta nelle prime 140 basi e i geni strutturali
dell’operone non sono trascritti.
In assenza di triptofano (processo di attenuazione), la RNA polimerasi può legarsi al promotore e iniziare a
trascrivere l’operone. Il trascritto è detto attenuazione. Subentra, a questo punto, il leader di 100 nucleotidi
che può essere tradotto. Il leader è formato da una regione codificante per un peptide di 14 amminoacidi, il
quale ha due codoni adiacenti che codificano per il triptofano. Sono presenti, poi, sequenze nucleotidiche
in grado di appaiarsi fra loro a formare strutture secondarie alternative. Se il triptofano è assente, il
ribosoma si arresta su UGG, inducendo l’mRNA in fase di trascrizione ad assumere una struttura secondaria
che consente alla RNA polimerasi di continuare.

Controllo trascrizionale del ciclo vitale del fago λ


Tutti i fagi più o meno grandi e complessi esprimono i propri geni durante il loro breve ciclo vitale, con una
precisa sequenza temporale: geni precoci, geni intermedi e geni tardivi. Il fago lambda è un sistema
complesso con circa 50 geni, che può seguire due vie alternative per perpetuare il proprio genoma:

26
Giulia Mostini

1. Ciclo litico: comune a tutti i batteriofagi, in cui il virus infetta la cellula entro la quale si moltiplica in
pochi minuti e che culmina con la distruzione della cellula ospite il rilascio della proteina fagica.
2. Ciclo lisogenico: avviene per i fagi temperati, in cui il genoma fagico viene integrato nel cromosoma
della cellula ospite e propagato con questo alle cellule figlie. Solo particolari condizioni di induzione
possono indurre l’escissione del genoma del fago da quello cellulare e la ripresa del ciclo litico.
La scelta tra i due cicli è regolata in maniera fine da una serie di eventi e da proteine regolatrici che
agiscono in trans su una particolare regione del genoma di lambda, detta regione di controllo.
Il fago lambda presenta al centro il gene cI che codifica per il repressore di lambda, presente durante il ciclo
lisogenico. A sinistra e a destra del gene si trovano i due geni precoci N e cro che codificano per due
regolatori della trascrizione che operano sulla terminazione e sull’inizio. Questi sono orientati in modo
divergente, per cui sono trascritti sui due diversi filamenti della doppia elica.
Quando più fagi infettano lo stesso batterio, un numero maggiore di genomi di λ sarà presente nella cellula.
Il conseguente maggior numero di copie di cII favorirà la trascrizione del repressore di cI ed il ciclo litico. Al
contrario infezioni rare determinano cicli lisogenici.
Sulla regione di controllo agiscono cI, che è costituito da due domini collegati tra loro da una regione
flessibile (linker), che permette il legame con il DNA e con una regione attivatrice che interagisce con sigma
dell’RNA polimerasi, e Cro, che ha funzione di repressore, si lega al DNA come dimero e impedisce il legame
del repressore nella regione di controllo.
Bisogna ricordare che il regulone è un sistema di controllo genico batterico, per cui più operoni sono sotto
controllo primario di un’unica proteina.

RNA polimerasi degli eucarioti


La membrana nucleare delle cellule eucariotiche isola il nucleo dal citosol, per cui alcuni processi sono
isolati, rispetto al batterio in cui molti processi avvenivano insieme nel citosol. Il prodotto della trascrizione,
infatti, non viene utilizzato direttamente per produrre le proteine, come avveniva nei procarioti, ma il
processo è più frazionato perché l’RNA deve essere processato in maniera particolare e modificato in base
alla funzione da svolgere.
Gli enzimi negli eucarioti si moltiplicano, con aumento del numero delle polimerasi. Esistono 5 polimerasi,
ma le principali sono 1,2,3 con numerose subunità, anche 12 in alcuni casi. In base alla sequenza
nucleotidica, si può affermare che gli archea sono più simili agli eucarioti, rispetto a quanto non lo siano i
batteri.
La polimerasi I è caratterizzata da subunità RPA1, fino a 20, mentre nella II ci sono RPB1 e nella III RPC1.
La struttura è simile a quella dei procarioti, ma la differenza è che si aggiungono molti altri fattori che
partecipano alla trascrizione.

Funzioni delle polimerasi


Le RNA polimerasi sono 5, di cui 3 nucleari (RNA pol I, pol II e pol III), una mitocondriale (mtRNAP) e nelle
piante esiste una RNA polimerasi nei cloroplasti. La loro composizione è multipla, cioè è un complesso che
può raggiungere dimensioni visibili al microscopio elettronico. Ad esempio le nucleari sono composte da
oltre dieci subunità, mentre quella mitocondriale è costituita da una sola catena polipeptidica.
Le polimerasi non sono in grado di legare il DNA da sole, a differenza del batterio con fattore σ. Esse hanno
bisogno di fattori trascrizionali distinti dal complesso enzimatico.
Le funzioni delle RNA polimerasi sono varie:
• Pol I: essa sta nel nucleolo, in cui vi è trascrizione dei ribosomi e produce l'rRNA, che poi verrà
processato e farà parte dei ribosomi stessi. Il gene che trascrive è ripetuto molte volte nel genoma
e la cromatina relativa si localizza nel nucleolo. In sostanza, nonostante trascriva pochi geni,
produce più RNA di tutte, ma lo produce tutto uguale.
• Pol II: si trova nel nucleoplasma e si occupa della trascrizione degli RNA messaggeri, che permette
di produrre le proteine, per cui codifica tantissimi geni, che danno mRNA diversissimi, a differenza
di pol I.

27
Giulia Mostini

• Pol III: è localizzata nel nucleoplasma e sintetizza i tRNA e i piccoli RNA ribosomiali, che lavorano
sulla traduzione delle proteine. Sono state poi identificate pol IV e pol V, che codificano per pochi
geni srRNA.
Le polimerasi sono state identificate tramite la sensibilità all'amanitina. L'amanita falloide intossica e
diventa letale per l'uomo se ingerita. Il suo meccanismo d'azione comprende l’α amanitina. Gli scienziati
effettuarono cromatografie, mettendo il materiale con la tossina su resina. In base all'assorbanza, sono
state riconosciute varie frazioni, 1,2 e 3, da cui derivano i nomi odierni delle RNA polimerasi. Non si
conoscevano gli enzimi coinvolti allora, per cui si è solo scoperto che la tossina in presenza delle frazioni
aveva comportamenti diversi: la prima frazione era insensibile alla amanitina (pol I), per cui rimaneva
elevata la sintesi proteica, mentre la frazione 2 (pol II) veniva completamente inibita, così come la frazione
3 (pol III), anche se in maniera meno intensa. Per cui effettivamente la polimerasi II ha un sito particolare
d'ingresso che viene modificato e occluso dall'amanitina, per cui i nucleotidi non vengono incorporati nel
filamento per appaiarsi al filamento stampo. L’intossicazione, quindi, avviene a livello della trascrizione, in
particolare per fegato e rene, si va in insufficienza epatica e renale e anche una lavanda gastrica è inutile
perché ormai la tossina è entrata in circolo.

Farmaci inibitori della trascrizione


La rifampicina è un inibitore della trascrizione. E' stato scoperto a Milano da due ricercatori, da campioni di
terra, trovata nella spiaggia di St. Tropaiz. E' stata chiamata così da un film che avevano visto il giorno
prima. E' stata la cura della lebbra, tubercolosi e legionellosi. Blocca la formazione dell’RNA batterico,
legandosi alla tasca della subunità della RNA pol I, all’interno del canale DNA/RNA. Non ha effetti sulle
polimerasi eucariotiche.
L’actinomicina D, invece, è un chemioterapico che agisce sul DNA: è costituita da un gruppo intercalante
che si intercala fra le basi nucleotidiche e ha due anelli peptidici ciclici che distorcono la struttura dell'α
elica, producendo un blocco totale della trascrizione, inibendo sintesi di RNA. Essa uccide cellule codificanti
come quelle tumorali, ma provoca danni anche alle altre cellule. E’ stata identificata nel batterio
Streptomyces parvulus.

RNA polimerasi mitocondriale e dei cloroplasti


L'RNA polimerasi mitocondriale è importante perché è caratteristica, primitiva, composta da un singolo
filamento che trascrive solo geni del genoma mitocondriale, codificando 13 subunità dei complessi
respiratori, 22 tRNA e 2 rRNA mitocondriali. E' simile al fago T7 e inoltre è anche una primasi, cioè sintetizza
gli inneschi per la replicazione del genoma mitocondriale.
Infine, vi sono quelle dei cloroplasti che possono essere 3: la prima (PEP) è codificata dal genoma del
cloroplasto, la seconda si trova nelle monocotiledoni (RPOTp) ed è codificata dal nucleo, mentre nelle
dicotiledoni ve n’è una aggiuntiva (RPOTmp). Anche queste sono primitive, derivanti dal cianobatterio
endosimbionte, con subunità in più rispetto alle polimerasi batteriche. Riconoscono anche sequenze simili a
-10 e -35 dei procarioti.

Biogenesi delle subunità


Tutto parte nel citoplasma dove avviene la sintesi di proteine e si assemblano i cori iniziali, che vengono poi
uniti in un processo di maturazione, tipo un’espansione progressiva. Il complesso entra quindi nel nucleo
attraverso il poro nucleare e qui alcune subunità non necessarie si staccano.

L'unità trascrizionale eucariote


Il gene eucariotico è composto dal filamento di DNA e da vari fattori.
L'inizio di trascrizione avviene dopo una regione a monte, chiamata TATA box, mentre ancora prima vi sono
sequenze regolatrici molto distanti a monte, come nel lievito.
Nei mammiferi vi sono vari geni e varie regolazioni: può esserci la TATA box e la sequenza non è tutta
codificante, ma vi sono regioni non codificanti. Vi sono poi promotori prossimali a monte o a valle della
trascrizione. Vi sono anche regioni molto distanti a monte in cui il meccanismo è di torsioni complesse del

28
Giulia Mostini

DNA. Un altro tipo di promotore ha regioni ricche in GC (CpG Island promoter gene), in cui è vario il segnale
e può essere presente a valle dell'inizio della trascrizione.
Per leggere il DNA, esistono gli istoni (nucleosomi) che avvolgono il DNA, per cui la polimerasi deve
svolgerli, rendendoli disponibili. In più, le sequenze di DNA cis-acting, riconosciute da diversi fattori
trascrizionali, devono assemblarsi in complessi plurimolecolari, mediante interazione proteina – proteina
che sono importanti per la trascrizione, per cui il DNA utilizza regioni molto estese. I segnali per la
trascrizione (enhancer), inoltre, possono essere anche molto distanti rispetto all'inizio e possono trovarsi
sia a monte sia a valle. L'RNA trascritto viene poi processato, tagliato, ricucito in base alle funzioni che deve
svolgere, per cui un complesso processamento al trascritto porta alla sua forma matura. Vi sono poi
sequenze non codificanti che devono essere rimosse.
Gli mRNA degli eucarioti non sono policistronici (ad eccezione dei trascritti mitocondriali). Ciascun mRNA
eucariotico, infatti, codifica solamente per un tipo di proteina. Inoltre, nel genoma nucleare degli eucarioti
non esistono operoni.
Il genoma mitocondriale esiste in molte copie (epatocita circa 200 genomi mitocondriali). Esso viene
trascritto a partire da tre promotori e la trascrizione produce tre messaggeri. Si possono codificare le 13
subunità dei complessi respiratori, i rRNA e i tRNA. Quindi, nel mitocondrio c'è l’operone e l’RNA
policistronico perché questo organello deriva da un’endosimbiosi. Le piante si comportano in maniera
analoga con il genoma plastidico.

Svolgimento istoni
Il fattore FACT (Facilitates chromatin transcription) è il fattore critico, cioè un enzima eterodimero, con due
subunità Spr16 e SSRP1, che scalza il dimero istonico (H2a-H2b) prima dell'arrivo della RNA polimerasi.
Questo permette alla RNA polimerasi di trascrivere il DNA associato ai restanti istoni. Il DNA trascritto,
quindi, viene riassemblato, sempre grazie a FACT, nel nucleosoma originario. Vi è solo un rimodellamento
sottile della cromatina, senza la sua distruzione totale.

Regioni regolative
I promotori eucariotici sono più complessi e variabili rispetto a quelli procariotici. Alcuni promotori negli
eucarioti possono anche essere posizionati a valle del sito di inizio della trascrizione (+1).
Numerosi fattori trascrizionali sono coinvolti nel legame dell’RNA polimerasi al DNA. A differenza del
fattore σ, i fattori di inizio della trascrizione eucariotica non fanno parte del complesso della RNA
polimerasi.
I promotori sono tre, in base al tipo della polimerasi che si lega:
1. RNA pol I: l’RNA polimerasi I
trascrive esclusivamente i geni
per gli rRNA. Il promotore è
costituito da due regioni: un
tratto che si sovrappone al sito
di inizio della trascrizione TSS
(da -45 a +20), che costituisce il
core del promotore, e una
regione più a monte, chiamata elemento UPE o UCE (Upstream promoter/control element), che si
estende da -150 a -100. La formazione del complesso di inizio richiede almeno due fattori
trascrizionali ausiliari, chiamati Upstream binding factor (UBF) e SL1. Il primo è una proteina che si
lega al DNA con domini multipli del tipo HMG e interagisce direttamente con il core del promotore
e con l’elemento UCE. La regione C-terminale di UBF è necessaria per l’attivazione della trascrizione
ed è ampiamente fosforilata. SL1 è un complesso multiproteico che comprende la TATA binding
protein (TBP), che è un componente essenziale dei complessi d’inizio di tutte e tre le polimerasi
eucariotiche, e altri fattori associati (TAF e TBP Associated factor) specifici per pol I. SL1 non si lega
al DNA, riconoscendo una sequenza specifica, ma il suo reclutamento è mediato da UBF. SL1, una
volta sul promotore, contatta il DNA e recluta pol I.

29
Giulia Mostini

2. RNA pol II: trascrive


mRNA ed ha una
struttura variabile. E'
molto complessa in
base al tipo di gene, ma
vi sono dei promotori
standard più comuni. Vi sono due gruppi di fattori di trascrizione. Il primo gruppo, costituito da una
serie di proteine chiamate fattori basali (GTF), è richiesto per reclutare l’RNA polimerasi su tutti i
promotori di pol II e formare il complesso d’inizio. Pol II associata a questi fattori costituisce
l’apparato basale della trascrizione di Pol II. Il secondo gruppo di fattori è costituito da proteine che
regolano la trascrizione. Vi è un promotore minimo (core promoter) di Pol II, costituito dal tratto di
DNA, indispensabile per permettere ai fattori basali di far iniziare la trascrizione. Tale promotore
contiene l’elemento chiamato iniziatore o INR e ha una sequenza conservata, da cui parte la
trascrizione iniziando su TSS. Un altro elemento importante è la TATA box (-26) posizionata prima
del sito di inizio. E’ preceduta, di solito, da un elemento definito BRE, che permette il legame con
TFIIB (fattore basale). A valle di TSS vi possono essere altri elementi, come DPE (+28-+34),
tipicamente presente nei promotori senza TATA box, definiti TATA-less. L’elemento DCE, invece,
può essere presente in più copie nei promotori con TATA box. Altri elementi presenti sono le isole
CpG. Oltre a questi elementi vi sono elementi a monte del sito di inizio, definiti elementi prossimali,
ed elementi più distali, chiamati enhancer. Nel lievito vi è un tipico promotore di Pol II, che
contiene sequenze chiamate UAS, su cui si legano in modo specifico proteine che influenzano la
trascrizione. Il fattore TFIID è il primo a legare la TATA-box attraverso la sua componente TATA
binding protein TBP e ne induce una marcata distorsione. Le altre componenti TBP associated
factor (TAFs) di TFIID sono, invece, in grado di associarsi alle altre regioni del promotore, come Inr e
DCE. Il complesso TFIID-TATA recluta altri TFII, come TFIIA, TFIIB e TFIIF ,che è legato a pol II.
3. RNA Pol III: trascrive i geni per i
tRNA, per rRNA 5S e per srRNA
nucleari. I primi due utilizzano
promotori interni che contengono
degli elementi (box) di controllo. Il
terzo contiene elementi di
controllo, come un tipico
elemento TATA, a monte del sito
di inizio. Oltre a questa sequenza,
che permette il legame con TBP, il
promotore per gli snRNA può
contenere anche elementi OCT e
PSE, che aumentano l’efficienza di Pol III. Nel caso dei tRNA, invece, il fattore TFIIIC si lega agli
elementi interni (box A e box B). Questo legame richiama sul promotore TFIIIB, composto da varie
subunità, come TBP. La sua formazione richiama Pol III sul TSS. Nel caso del gene per l’rRNA 5S, il
fattore specifico TFIIIA si lega a box A e permette il posizionamento di TFIIIC sul promotore, che a
sua volta richiama TFIIIB sul TSS. La funzione di TBP in TFIIIB è quella di reclutare pol III sul sito di
inizio, ripiegando il DNA di 80°. Nel caso di promotori con sequenze di controllo a monte del sito di
inizio, TFIIIB è in grado di legarsi da solo, in quanto riconosce l’elemento TATA vicino al sito di inizio.

Siti di terminazione
I siti differiscono in base alla polimerasi e vi è una maggiore imprecisione perché, dovendo lavorare molto,
l’RNA trascritto non ha evoluto un sistema complesso di terminazione.
In pol I, la terminazione avviene oltre le 1.000 basi dopo l’estremità 3’ dell’RNA maturo, che è generato con
un taglio. La terminazione richiede una sequenza di 18 basi e una DNA binding protein.
Nel caso di pol II, non vi è una sequenza netta di terminazione, per cui si pensa che tutto dipenda dai
processi di maturazione dell’mRNA e può avvenire 500-2.000 bp a valle del sito di poliadenilazione.

30
Giulia Mostini

La pol III è simile al gene procariotico che richiede sequenze AT (poli U) sul DNA, ma non richiede strutture
tipiche ad uncino secondarie e loop su mRNA (procarioti rho indipendenti). A volte contiene una regione
ricca in GC.
L'unico messaggio contenuto, quindi, è il sito di poliadenilazione AAUAA in pol II, molto frequente negli
mRNA dove avviene l’addizione della coda di poliA. Esso contiene anche sequenze accessorie non tanto
chiare, come una sequenza a valle della poliA nei mammiferi e una sequenza ricca in U a monte. Per questo
possono originarsi lunghi trascritti con regioni che isolano un blocco di un gene da un altro per evitare
interferenza tra i geni.

Regolazione dell'inizio della trascrizione negli eucarioti


L'innesco della trascrizione è quello che fa legare il fattore trascrizionale (TF) alle sequenze specifiche. Nei
procarioti è semplice, come abbiamo già visto. Negli eucarioti, invece, si parte dalla necessità di allentare il
legame con gli istoni, poi i fattori trascrizionali formano il complesso di inizio , quando si legano a specifiche
sequenze, a cui si lega ulteriormente la RNA polimerasi.
I complessi sono costituiti da molte catene polipeptidiche diverse. Non è una singola proteina, infatti, ad
innescare l'inizio, ma sono vari fattori cioè polipeptidi a cui si aggiunge il complesso di RNA polimerasi.
Nel caso della repressione, essa può essere distinta in competizione, inibizione, repressione diretta e
indiretta. Nel primo caso l'inibitore si lega in modo competitivo al posto dell’attivatore, mentre nel caso
dell'inibizione propriamente detta, l’inibitore si lega in un sito diverso rispetto all’attivatore. Se invece è
diretta, essa è mediata da un mediatore, mentre se è indiretta avviene tramite l’istone deacetilasi.
I fattori di trascrizione si dividono in generali e specifici. I primi sono detti anche basali (GTF), sono coinvolti
nella determinazione dell’inizio della trascrizione di tutti i geni letti da Pol II, con la quale formano il
complesso di inizio, in prossimità del TSS. In questo caso, la proteina che interagisce con l’iniziatore e la
TATA box è la proteina legante TATA box (TBP), che riconosce anche i promotori di Pol I ed è una subunità
del fattore di trascrizione generale TFIID.
Gli specifici, invece, sono diverse centinaia, rispetto alle poche decine degli altri, e riconoscono sequenze
molto distanti, variando da gene a gene, stimolando o inibendo la trascrizione. I fattori specifici si trovano
spesso elencati in alberi e suddivisi per funzioni e risposta chimica. Sono costitutivi, cioè sempre presenti, e
regolativi, cioè che possono essere indotti a seconda delle circostanze, come quelli per lo sviluppo
embrionale e quelli dipendenti da segnale interno, come l’interazione cellula-cellula mediata da recettori di
superficie e i recettori per gli steroli. Un esempio è quello del fattore nucleare 1 (NF1) o l’enhancer binding
protein (C/EBP).
E' possibile associare lo stimolo alle varie sequenze consenso attivate, che vanno a stimolare i fattori di
trascrizione specifici. Ad esempio, i metalli pesanti hanno dei corrispettivi geni regolati dalle stesse
sequenza consenso a cui si legano fattori trascrizionali associati a quel determinato stimolo. Quindi sono
molto complessi.
Le conoscenze rispetto a questi fattori e alle sequenze sono frutto di esperimenti tuttora oggetto di
dibattito negli ultimi 10-20 anni. Le conoscenze, quindi, non sono verità bibliche, dato che sono ancora in
corso gli esperimenti. Gli elementi chiave sono la possibilità di modellare il DNA, l’esistenza di geni artificiali
per legare le sequenze e geni reporter che siano facili da visualizzare e misurare. Si possono, infatti, far
esprimere i geni artificiali e vedere se i geni reporter si esprimono a loro volta oppure no.
Un gene reporter, in particolare, è la sequenza codificante di una proteina facilmente identificabile, usata
dai ricercatori per svelare la funzione di eventuali regioni regolative poste al suo controllo. Geni reporter
molto usati sono CAt, lacZ, GFP.

Come le proteine riconoscono il dsDNA


Due fattori principali contribuiscono al riconoscimento specifico del DNA da parte delle proteine: la
formazione di legami idrogeno con gruppi donatori e accettori nucleotidici specifici presenti nel solco
maggiore e le deformazioni dipendenti dalla sequenza nucleotidica.
Ripetizione di A, infatti, possono portare a conformazioni tortuose che avvicinano i legami a idrogeno tra le
basi nei solchi maggiori, determinando il restringimento dei solchi minori. Quantità elevate di coppie di basi
AT, dunque, sono concentrate in solchi minori stretti, mentre coppie di basi CG si trovano più

31
Giulia Mostini

frequentemente in ampie scanalature minori. I solchi minori stretti aumentano il potenziale elettrostatico
negativo del DNA, rendendo un sito più specifico e riconoscibile. Di questi segnali ne approfittano i TF,
come la TBP, che interagisce con una specifica spaziatura del solco minore, in corrispondenza della
sequenza TATA.
Per quanto riguarda l’interazione proteina-DNA, sovente il residuo amminoacidico che interagisce con il
solco minore è un’arginina, la cui catena laterale può essere sistemata in un solco minore più stretto e
negativo. Infatti, le arginine ripetute si riscontrano nei motivi dalla breve sequenza amminoacidica che
migliorano la specificità del riconoscimento della forma del DNA.
Il sito preferenziale viene riconosciuto anche se è associato ad altre proteine oppure anche se il DNA è
curvo, invece che lineare, o ha il dominio della cromatina aperto o chiuso.
NFAT è un fattore essenziale nella risposta immune, cioè è un fattore regolabile, che può traslare da
citoplasma a nucleo. Nel linfocita T, il legame con l'antigene scatena eventi a cascata di fosforilazione, fino a
NFAT, che entra nel nucleo, scorre sul DNA, fino a che arriva al promotore di interleuchina 2 e ne determina
l'espressione. NFAT nel nucleo coopera col fattore di trascrizione AP1, costituito da proteine Fos e Jun, per
trascrivere il gene dell’interleuchina 2 (IL-2) e il gene CD25 (IL-2Rα). E' una proteina importante che migliora
la risposta immune perché attiva a sua volta altri linfociti. Il fattore NFAT può diventare inibitore se si
associa ad altri fattori, quali Foxp3 o Mina, reprimendo l'espressione di interleuchina, di IL-4 e del fattore
NFAT2.

I domini di legame al DNA delle proteine


Vi sono vari domini proteici, cioè sequenze delle proteine che mantengono le funzioni delle proteine stesse.
HTH, ad esempio, è il motivo elica-giro-elica, tipico di importanti fattori di regolazione dell’espressione di
geni, che determinano il differenziamento dei vari territori durante lo sviluppo embrionale. Esso consiste di
tre α-eliche ripiegate, in cui l’elica 3 (o elica R) si posiziona nel solco maggiore del DNA. I residui
amminoacidici dell’elica R che si affacciano sul DNA interagiscono specificamente con le basi della sequenza
di riconoscimento e la sostituzione di una di queste basi abbassa notevolmente l’affinità della proteina per
quella sequenza. Queste strutture sono state riscontrate nel repressore dell’operone lac, nel repressore Cro
di lambda, nel repressore del triptofano, nelle proteine CAP, attivatori di cataboliti, nel fattore 1 di
trascrizione dell’ottamero Oct, che legano la sequenza ATGCAAAT, e fattori di risposta allo shock termico
(HSF).
HLH, invece, è il dominio elica-ansa-elica, la cui struttura monomerica è formata da due α-eliche anfipatiche
connesse da un’ansa. Un monomero è costituito da circa 40 amminoacidi e l’elica più lunga contiene in N-
terminale un domino basico che le permette di interagire con il DNA (BHLH). sono coinvolti nell'emopoiesi e
nel differenziamento delle cellule muscolari, cellule del pancreas e nei neuroni. In lievito è presente in
fattori coinvolti nella regolazione dei geni dell’ingresso dei nutrienti. TF importanti che legano il DNA
mediante questo dominio sono i fattori di proteine di determinazione del mioblasto (MyoD).
Zn finger, ovvero motivo a dito di zinco, invece, lega il DNA ed è stato individuato per la prima volta nel
fattore TFIIIA per la trascrizione di rRNA 5S. Esso è formato da un atomo di zinco coordinato a quattro
residui di cisteine o istidine, formando un’ansa che ricorda la forma di un dito. Si trova in fattori coinvolti
nel rimodellamento della cromatina o nella regolazione di forme strutturali del DNA. Lega anche proteine e
lipidi. Si distinguono tre tipi di zinc finger domains: C2H2, C4 e C6, dove C indica la cisteina e H l’istidina. Un
esempio del primo è il fattore SP1 che lega le regioni ricche in GC; un esempio del secondo è il recettore
dell’estrogeno (ER); un esempio del terzo è il fattore di lievito Gal4.
Leucine zipper, cioè motivo a cerniera di leucina, è presente in molti fattori trascrizionali che regolano la
divisione cellulare e contribuisce all’interazione fra proteine. Si tratta di dimeri formati da due lunghe
strutture ad α-elica, ciascuna contenente un dominio di dimerizzazione e un dominio basico di legame al
DNA nel solco maggiore. L’assemblaggio della struttura dimerica è dovuto ai legami idrofobici tra le leucine
che protrudono dalle due α-eliche proprio come i denti di una cerniera lampo.
Esempi importanti sono AP-1 per la proliferazione, CREB e Gcn4.

Sistemi per lo studio dei domini a DNA

32
Giulia Mostini

Le biotecnologie hanno consentito di fare swapping, cioè fondere parti di due proteine diverse a livello del
dominio: si crea una proteina artificiale che attiva la trascrizione solo in determinati siti. Dunque, si dà
origine a una regolazione ibrida, dimostrando se una regione proteica ha la funzione di legare il DNA o di
agire come attivatore o repressore.

Fattori generali della trascrizione e complesso d'inizio


Il meccanismo d’inizio della trascrizione di Pol I comincia con il suo legame al promotore, tramite UBF
(Upstream binding factor). UBF lega il DNA attraverso i suoi domini HMG (High Mobility Group). La regione
C – terminale di UBF è sottoposta a modificazioni post-traduzionali (fosforilazione) che ne inducono
l’associazione con SL1, complesso multiproteico che comprende TBP e altri TAFs. Il complesso così formato
sul promotore costituisce il sito di pre-inizio di Pol I. A questo punto, SL1 recluta Pol I sul sito TSS.
L’evento scatenante l’inizio della trascrizione dai promotori di Pol III, invece, è il legame TFIIIC con le regioni
box A e box B, che a sua volta recluta TFIIIB, che comprende la subunità TBP, formando il complesso di pre-
inizio di Pol III, che induce il distacco di TFIIIC a valle. TBP poi recluta Pol III sul TSS. C'è un passaggio in più
rispetto a Pol I. Infatti, sul promotore del rRNA 5S, il fattore specifica TFIIIA, mediante i suoi domini zinc
finger, lega box A specificamente. TFIIIA permette il posizionamento di TFIIIC sul promotore, che a sua volta
richiama TFIIIB, contenente TBP, sul sito d’inizio della trascrizione.
Pol II, invece, ha un modo di legarsi più complicato rispetto agli altri. Essa trascrive l’RNA di migliaia di geni
distinti con promotori dai segnali molto diversi, per ottemperare alla complesse esigenze funzionali del
soma. Queste sequenze diverse sui promotori di Pol II impegnano nel loro riconoscimento numerosi fattori
trascrizionali specifici e generali (GTF). Il primo fattore a legarsi alle sequenze del promotore minimo di Pol
II è TFIID, che contiene la TBP e una dozzina di specifici TAFs. TBP, in vitro, è da sola in grado di indurre la
trascrizione dal TSS, ma sono i fattori TAFs ad incrementare la frequenza di attacco di Pol II al promotore e
quindi i livelli dell’mRNA prodotto. A TFIID sul DNA si associano TFIIA, che previene il legame di repressori, e
TFIIB che determina l’esatto posizionamento di Pol II. Quindi con la Pol II vengono reclutati TFIIF e a seguire
TFIIE, che aggrega TFIIH, cioè un’elicasi ATP-dipendente, che svolge la doppia elica del DNA, dando il
complesso aperto. TFIIH è anche una chinasi che fosforila il CTD di Pol II, inducendone il distacco dal
promotore e la fase di allungamento della trascrizione.
TBP si lega come una sella sul DNA, interagendo con il solco minore e piegando il DNA di circa 80°. TBD è
divisa in due regioni simmetriche che si legano al solco minore della sequenza TATA, mediante residui di
fenilalanina. La tipica piegatura del DNA in favorisce l’interazione di altri fattori e di Pol II sul core del
promotore.
Aggiungendo i fattori di trascrizione attivatori, si vide, che non aumentava in realtà la trascrizione in modo
lineare, ma qualcosa che ne limitava l'innesco. Infatti esiste un complesso mediatore, che è stato scoperto
da Kornberg (figlio) nel 1994 tramite estratti sempre più puri di proteine. Non si sanno le funzioni esatte
delle proteine che fanno parte del mediatore, ma c'è n'è una universalmente necessaria, chiamata Med17
richiesta per la trascrizione di tutti i geni trascritti da Pol II. Infatti, sono state isolate svariate proteine
costituenti il mediatore del lievito e di mammifero. Analisi della struttura a bassa risoluzione indicano che il
mediatore umano e quello di lievito sono simili e più grandi della stessa RNA polimerasi. Si è ipotizzato che
diverse forme di mediatore siano coinvolte nella regolazione di gruppi diversi di geni e che rispondano a
differenti attivatori.
Senza di esso la trascrizione avverrebbe molto lenta. Si pensa che P53 regoli lo stato di attivazione del
mediatore.

Modifiche post-trascrizionali
Gli mRNA eucariotici trascritti all’interno del nucleo partono da un RNA precursore che deve poi subire un
processo di maturazione, che consiste in una serie di modificazioni post-trascrizionali, prima di essere
traslocato nel citoplasma, dove sarà utilizzato dall’apparato di traduzione per la sintesi della proteina da
esso codificata.
Nei procarioti ciò è molto semplice, dato che avviene un semplice taglio, mentre negli eucarioti è più
complesso perché i compartimenti in cui avvengono i processi sono fisicamente separati, per cui deve

33
Giulia Mostini

esserci un trasporto, oltre alle modifiche di capping, poliadenilazione, RNA editing e splicing. L'mRNA,
dunque, è ridotto rispetto al gene perché vengono eliminate alcune porzioni non codificanti.
Il processamento del pre-RNA porta un vantaggio perché consente di modulare l'espressione, cioè di
scambiare regioni codificanti, con cui si possono produrre più trascritti dello stesso gene. Quindi
aumentano le informazioni che un gene può portare. Le varie forme di proteine risultanti dai processi di
maturazione alternativi dell’mRNA a partire dallo stesso gene prendono il nome di isoforme.
In E. Coli, per il taglio degli rRNA, agiscono due RNasi sul precursore 30 S: la III taglia il confine tra 16S e 23S,
mentre RNasi E taglia il confine tra 16S e 5S, rimuovendo quest’ultima. Questa struttura ha sequenze
complementari oltre questo confine, tranne una G che rimane fuori, che possono appaiarsi. Quindi l'rRNA
23S viene poi rilasciato dopo l'azione degli enzimi esonucleasici.

I geni del rRNA nell’uomo


Negli eucarioti i geni che codificano per il precursore degli rRNA sono ripetuti in tandem e localizzati su
diversi cromosomi, che contengono centinaia di copie di ciascun gene. Queste regioni sono dette “nucleolar
organizer – NOR” perché presso questi gruppi di geni si forma il nucleolo, cioè una porzione densa in cui sta
avvenendo un massiccio trascritto dei geni dell’rRNA. Ogni gene per pre-rRNA è separato dal successivo da
una regione spaziatrice non trascritta (NTS). Nell’uomo ci sono cinque NOR (45S) localizzate alle estremità
di cromosomi apocentrici (hanno una regione centromerica vicino a un’estremità). Le ripetizioni dei geni
dell’rRNA variano da individuo a individuo. Infatti, frequentemente questi loci ricombinano.
Ciascun gene rRNA è costituito da NTS, ETS (External Transcribed Sequence), il gene per il 18S, ITS1
(Internal Transcribed Spacer 1), il gene per il 5,8 S, ITS2 e il gene per il 28S.
Quindi, da ogni gene rRNA, la Pol I genera una molecola di pre-rRNA 45S che contiene i geni per gli altri
rRNA maturi. Da questo viene rimossa l’estremità 5’ per formare il precursore 41S, che a sua volta viene
tagliato in due molecole: precursore 20S dell’RNA 18S e precursore 32S degli altri RNA. Viene poi rimossa
l’estremità 3’ del precursore 20S, formando l’rRNA 18S maturo, mentre il taglio del precursore 32S libera gli
rRNA maturi 5,8 S e 28S, che si appaiano.
Gli rRNA, dopo essere stati sintetizzati, subiscono nel nucleolo due tipi principali di modificazione:
1. 2’-O metilazione: il ribosio di alcuni specifici nucleotidi viene metilato in posizione 2’.
2. Pseudouridilazione: alcune uridine vengono modificate in pseudouridine, in cui il ribosio è legato
alla posizione 5 dell’uracile anziché alla posizione 1.

Maturazione dei tRNA


I geni dei tRNA sono trascritti da pol III in lunghi precursori, che dovranno poi subire un processo di
maturazione per generare tRNA funzionali. Vi sono modificazioni che ne variano l'estremità e le
endonucleasi che variano la parte interna tramite splicing. Esiste anche la possibilità di modificare le basi
specificamente, creando G e C metilate.
I tRNA subiscono altresì diverse modificazioni:
• Modificazioni nell’ansa anticodone che influenzano l’efficienza della traduzione.
• Modificazioni nel corpo del tRNA che alterano la struttura e la stabilità dei tRNA.
• Modificazioni specifiche che assegnano specificità ai diversi tRNA.

Capping dell’mRNA
Il capping consiste nell’aggiunta di uno specifico nucleotide modificato (cap) in 5' per proteggere il mRNA
dalla degradazione in questa estremità (Cap-site). Il cap inoltre aumenta l’efficienza di splicing, favorisce il
trasporto dell’mRNA dal nucleo al citoplasma e contribuisce alla traduzione.
Si realizza con una RNA trifosfatasi, che stacca un gruppo fosfato in 5' al legame γ, lasciando solo 2 gruppi
fosfato. Un altro enzima, la guanilil-transferasi, aggiunge GMP a partire da GTP, formando un legame
trifosfato 5’-5’. A questo punto, avviene un'altra modificazione perché viene aggiunto un gruppo metile
sulla guanina in posizione 7. Il trasferimento è catalizzato dalla metil-transferasi, utilizzando come substrato
S-adenosilmetionina (SAM).

34
Giulia Mostini

Questo cap è irriconoscibile dagli enzimi che possono degradare RNA,


quindi lo protegge. E' possibile avere altri tipi di cap che svolgono sempre
la stessa funzione.
Il capping avviene alle fasi iniziali della trascrizione. Il posizionamento del
complesso dei fattori proteici necessari per la formazione del cap al 5’ è
controllato dallo stato di fosforilazione (residuo di serina n°5) del dominio
C-terminale di Pol II. Un altro residuo di serina (il numero 2), qualora
fosforilato, attiva, in fase di allungamento, il macchinario di splicing.

Poliadenilazione
Quando l’RNA polimerasi II arriva al segnale di poliadenilazione, posto al
termine di un gene, viene attivata la terminazione della trascrizione,
viene tagliato il pre-mRNA e aggiunta una coda di poli A all’estremità 3’
del trascritto. La coda ha la funzione di stabilizzare l’mRNA,
proteggendolo dalla degradazione, aumentandone l’efficienza nella
traduzione, favorendo i processi di splicing e la sua traslocazione dal
nucleo al citoplasma. Questa coda non rimane nuda, ma viene legata da proteine specifiche che si
associano: CPSF (Cleavage and Polyadenylation Specificity Factor) e CstF (Cleavage stimulation Factor),
grazie al loro reclutamento sul CTD di Pol II.
Gli stretch vengono ripetuti più volte, seguiti o preceduti in zone ricche di C e G sul DNA per la ridondanza.
Se viene trovato un mRNA senza capping e coda di poli A viene degradato, scalzando pol II dal DNA, tramite
Xrn2.
L’estremità 3’ dell’mRNA maturo è il risultato del taglio prodotto dai fattori CFI e CFII, reclutati da CPSF,
legato al segnale di poliadenilazione, e CstF, legato alla regione ricca in GU immediatamente a valle del sito.
La coda di A viene quindi aggiunta al sito di taglio dalla poli A polimerasi (PAP). Un multimero di una
specifica proteina (PABPN1) lega poi la sequenza poli A dell’mRNA maturo.
Il segnale di poliadenilazione, che funge anche da segnale per il taglio, consiste più frequentemente nella
sequenza esonucleotidica AAUAAA, eventualmente ripetuta, che precede di 5-30 basi il sito di taglio e inizio
della coda poli A. Questa sequenza si può trovare preceduta e seguita da una sequenza ricca in G e U a valle
del sito di taglio. Da questi segnali multipli si possono produrre trascritti dalle differenti terminazioni.

Splicing
I geni eucarioti hanno molte sequenze non codificanti e
non tradotte, cioè introni, oltre alle sequenze
codificanti, chiamate esoni. Geni di questo tipo sono
chiamati discontinui.
Il meccanismo di splicing, in sostanza, taglia gli introni e
ricuce insieme gli esoni, tramite il complesso dello
spliceosoma. Qualsiasi errore è fatale perché può
togliere informazione genetica in modo casuale oppure
determinare il frameshift, cioè uno slittamento del
modulo di lettura che produce proteine casuali.
Gli introni contengono sequenze per regolare la
trascrizione, aumentano la variabilità dei trascritti
genetici, per esprimere un gran numero di proteine
rispetto al numero dei geni. Inoltre, i moduli funzionali
delle proteine sono spesso contenuti in esoni diversi,
per cui il riarrangiamento degli esoni è un efficace motore dell’evoluzione di nuove proteine.
La stragrande maggioranza degli introni presenti nei pre-mRNA e rimossi dallo spliceosoma iniziano al 5’
con il dinucleotide GU (sito donatore) e terminano al 3’ con il dinucleotide AG (sito accettore). Questi
dinucleotidi possono trovarsi all’interno di motivi più estesi. Negli introni vi sono altri due motivi conservati:

35
Giulia Mostini

una regione ricca in pirimidine subito a monte del sito accettore e


un sito di ramificazione, anch’esso in prossimità dell’estremità 3’
dell’introne.
Lo splicing nucleare comporta due successive reazioni di trans-
esterificazione. La prima reazione consiste nell’attacco nucleofilo
da parte del 2’OH dell’adenina presente nel sito di ramificazione
al fosfato 5’ del dinucleotide GU. In questo modo si realizza un
taglio al 5’ della giunzione esone-introne che lascia un 3’-OH
libero all’estremità dell’esone; l’introne assume una forma a
cappio (lariat). La seconda reazione consiste nell’attacco nucleofilo dell’OH libero all’estremità 3’ dell’esone
a monte sul fosfato al 5’ dell’esone a valle. Questa reazione completa lo splicing, realizzando la
concatenazione dei due esoni e il rilascio dell’introne sottoforma di struttura a forma di cappio, che verrà
linearizzato da un enzima deramificante e poi degradato.

Lo spliceosoma
Il processo di splicing richiede l’intervento di un grande complesso macromolecolare, costituito da oltre 200
proteine e 5 RNA, denominato spliceosoma. Tale complesso, la cui composizione può variare, ha dimensioni
simili a quelle del ribosoma. Le 5 molecole di RNA presenti nello spliceosoma sono piccoli RNA nucleari
ricchi di uridina denominati U1, U2, U4, U5, U6, che nella cellula si trovano sottoforma di complessi
ribonucleoproteici, denominati snRNP. Tutte le snRNP condividono sette proteine (Sm) che legano il motivo
5’-AAUUUGUGG-3’, ricorrente in tutti gli snRNA e altre specifiche proteine diverse per ogni snRNP.
L’attività di splicing segue una serie di eventi che iniziano con il legame della snRNP U1 al sito di splicing al
5’ attraverso un appaiamento complementare tra l’estremità 5’ dell’snRNA U1 e il sito di splicing al 5’.
Quindi la proteina BBP si lega al sito di ramificazione e le due subunità del fattore U2AF si legano
rispettivamente al tratto polipirimidinico e al sito di splicing al 3’. Si forma in questo modo il complesso E
(Early) che consente il riconoscimento dell’introne da rimuovere. A questo punto, si associa snRNP U2,
scalzando la proteina BBP per mezzo dell’energia fornita dall’ATP. L’snRNA U2 stabilisce un’interazione
complementare con la regione del sito di ramificazione. Si passa allo stato A del complesso dello
spliceosoma. La adenina del sito di ramificazione rimane esposta per la prima reazione di trans-
esterificazione nello stato pre-spliceosoma.
Al complesso A si aggiungono le tri-snRNP (U4/U6 e U5) che, legando snRNP U1 e U2, inducono
l’avvicinamento tra il sito di splicing al 5’ e il sito di ramificazione e il sito di splicing al 3’ a valle. Si passa,
così allo stadio B del complesso. Viene, a questo punto, rilasciata la snRNP U1, sostituita dalla snRNP U6
nell’interazione complementare con il sito di splicing al 5’. Lo scambio tra U1 e U6 richiede la proteina Prp8,
localizzata nella snRNP U5 e che consuma ATP. Viene poi rilasciata anche la snRNP U4, permettendo
l’interazione tra snRNP U2 e U6, dovuta alla complementarietà tra i rispettivi snRNA.
Lo spliceosoma ora catalizza la prima reazione di trans-esterificazione, nella quale viene idrolizzata una
molecola di ATP, formando il complesso C dello spliceosoma, nel quale l’introne forma l’intermedio lariat,
che viene poi staccato dall’esone a valle nella seconda reazione di trans-esterificazione, idrolizzando una
seconda molecola di ATP.
Gli introni rimossi verranno linearizzati e degradati mentre l’mRNA maturo viene rilasciato dallo
spliceosoma che si dissocia nelle snRNP componenti pronte per essere riutilizzate.

Splicing alternativo
Lo splicing alternativo è il meccanismo attraverso cui uno stesso pre-mRNA può subire eventi di splicing
differenti che portano alla creazioni di diversi mRNA alternativi, che a loro volta possono codificare
differenti proteine. Uno stesso gene, quindi, può generare mRNA che presentano differenze sia nelle
regioni 5’ e 3’ non tradotte che nella regione codificante.
Questo processo fu scoperto da David Baltimore e collaboratori sull’immunoglobulina. I possibili eventi che
avvengono sono esoni facoltativi, esoni esclusivi, ritenzione di introni e siti di splicing alternativi.
Una variante trascrizionale di un determinato gene è, quindi, costituita da uno specifico assortimento di
esoni e introni, prodotta dalla combinazione di uno o più degli eventi precedenti.

36
Giulia Mostini

Un esone presente in tutte le varianti trascrizionali è detto costitutivo, al contrario di un esone facoltativo
che viene o meno incorporato nella variante di splicing in funzione di specifici segnali di regolazione.
Il gene umano TRP53, per esempio, codifica 12 diverse proteine p53.
La specificità del riconoscimento dei siti di splicing dipende da sequenze attivatori (enhancer) o repressori
(silencer) del processo di splicing presenti negli esoni o negli introni: ESE, ESS, ISE, ISS. I primi sono
riconosciuti da proteine SR che facilitano l’assemblaggio dello spliceosoma e sono caratterizzate da uno o
più domini in grado di legare l’RNA e una regione (SR) ricca di serine e arginine. ESS sono legati da
repressori dello splicing hnRNP, contenenti domini RRM, anch’essi in grado di legare l’RNA. Le proteine
hnRNP presenti sulle sequenze ESS sopprimono mascherando i siti di splicing o impedendo le interazioni tra
le componenti dello spliceosoma.
Mutazioni che alterno lo splicing causano malattie: la fibrosi cistica è una malattia genetica autosomica
recessiva, causata da mutazioni del gene CF che codifica per il canale del cloro CFTR. Mutazioni che
determinano splicing aberranti tra gli esoni 3-13 portano a forme difettive della proteina e conseguente
malattia.

Splicing dei tRNA


Molti geni per tRNA in eucarioti e archeobatteri contengono introni che devono essere rimossi per
generare i tRNA maturi funzionali. Il meccanismo non comporta reazioni di trans-esterificazione, ma
l’intervento di diverse attività enzimatiche, tra cui endonucleasi e ligasi che operano in due fasi attraverso
un meccanismo ATP-dipendente. La prima fase è catalizzata da una endonucleasi specifica che riconosce
una struttura conservata denominata BHB, effettua due tagli endonucleolitici che rimuovono l’introne del
pre-tRNA e produce il tRNA frammentato in due metà. La metà 5’ termina con un fosfato ciclico 2’-3’,
lasciando un 5’-OH all’estremità della metà 3’. Lo splicing viene quindi completato fondendo le due metà
attraverso una ligasi tRNA-specifica.
Questo meccanismo può essere usato anche per la maturazione di mRNA cellulari, come nel caso del gene
XBP1, coinvolto nei meccanismi di sorveglianza attivati dalla presenza di proteine con struttura disordinata
(Unfolded Protein Response), nel quale viene effettuato uno splicing non convenzionale, che rimuove un
introne attraverso l’azione combinata di una endonucleasi sito-specifica e di una tRNA ligasi. Questo
splicing è estremamente conservato nell’evoluzione.

RNA catalitico
Ci sono splicing che avvengono senza bisogno di proteine e sono definiti autosplicing o self-splicing. Questo
avviene per la presenza di introni autocatalitici di classe I o II. I primi richiedono una G come sito di
ramificazione, mentre i secondi una A nel sito di ramificazione.
L’esperimento che portò alla luce ciò è stato condotto nel 1982 da Thomas Cech, che scoprì che un introne
dell’rRNA del protozoo ciliato Tetrahymena thermophila era capace di effettuare autosplicing senza fattori
proteici. Egli condusse un esperimento in vitro clonando, in un vettore plasmidico, una porzione del gene
per l’RNA della subunità grande del ribosoma contenente un introne. Ne effettuarono la trascrizione con
una RNA polimerasi batterica purificata e inaspettatamente osservarono che il trascritto prodotto poteva
effettuare autosplicing in presenza di ioni magnesio e sodio. Grazie a ciò, quindi, si scoprì che l’RNA
possedeva anche proprietà catalitiche, svolgendo la funzione di enzima (ribozima).
Gli introni di tipo I si trovano in una grande varietà di organismi procariotici ed eucariotici, in geni nucleari,
mitocondriali e plastidici. Sono più corti di quelli del secondo tipo (200-500 nt) e assumono una struttura
secondaria tipica, dovuta alla presenza di regioni complementari numerate da P1 a P10 che si appaiano tra
loro. La struttura tridimensionale che ne risulta avvicina i siti critici per lo splicing al 5’ e al 3’. Nel
meccanismo di autosplicing di tipo I, per la prima reazione di trans-esterificazione è sufficiente una
qualunque guanosina libera (exoG – GMP, GDP o GTP), il cui 3’-OH attacchi il fosfato al 5’ dell’introne.
Quindi avviene la seconda reazione tra il 3’-OH dell’esone al 5’ e il fosfato della guanosina (ωG)
all’estremità 3’ dell’introne che produce la fusione degli esoni e il rilascio dell’introne.
Gli introni di tipo II sono lunghi RNA (400-1000 nt) catalitici che si trovano nei genomi batterici e negli
organelli di diversi eucarioti inferiori. Sono particolarmente diffusi all’interno dei genomi mitocondriali delle

37
Giulia Mostini

piante, dove intervallano numerosi trascritti critici. La loro escissione è essenziale per la biogenesi dei
mitocondri e le funzioni respiratorie ed è facilitata in vivo da vari cofattori proteici.
Gli introni di tipo II possono essere considerati come elementi genetici mobili, costituiti dalla sequenza di
self-splicing e dalla proteina maturasi, codificata dall’introne stesso che agisce da cofattore, facilitando la
reazione auto catalitica di splicing. Tuttavia, gli introni di organelli vegetali si sono considerevolmente
discostati dai loro elementi trasponibili antenati batterici, in quanto mancano di molte regioni necessarie
per l’escissione e l’integrazione e hanno anche perso sequenze codificanti di molti enzimi necessari alla
trasposizione. Infatti, solo una singola maturasi è stata trattenuta negli introni del genoma mitocondriale di
varie angiosperme: il gene MatR, codificato nel quarto introne della subunità 1 del gene NADH
deidrogenasi. E’ interessante notare che, oltre al gene MatR, i genomi nucleari delle angiosperme ospitano
anche quattro geni (nMat 1-4), che sono strettamente correlati a MatR e contengono segnali di
localizzazione mitocondriale N-terminali. Recentemente, è stato riconosciuto che queste maturasi
codificate dal genoma nucleare contribuiscono allo splicing degli introni mitocondriali. Inoltre, studi
genetici hanno portato all’identificazione di altri geni che codificano varie proteine necessarie per lo
splicing e l’elaborazione di introni mitocondriali nelle piante.
L’introne del gruppo II rilasciato può essere inserito attraverso un meccanismo di splicing inverso, cioè la
parte che viene tolta può essere reintrodotta, come un retrotrasposone, in direzione opposta. Ciò
determina la mobilità di questi introni, che richiedono una trascrittasi inversa codificata.

Ribozimi
I ribozimi sono enzimi fatti a RNA, contenuti in particolare in funghi e batteri. Questi tagliano altre molecole
di RNA, ma non si sa l'esatto scopo. Per esempio, i ribozimi di tipo twister sono 3.000 oggi conosciuti.
La maggior parte dei ribozimi catalizzano reazioni di taglio di un filamento di RNA, la sua inversione e
rilegatura dell’RNA. In base alla loro attività, i ribozimi possono essere divisi in ribozimi di splicing e di taglio,
a sua volta suddivisi in trans-cleaving ribonuclease P e piccoli self-cleaving ribozymes.

RNA editing
Si tratta di un'alterazione post-trascrizionale di una sequenza codificante. Il trascritto quindi può essere
modificato con cambiamento delle basi. Può anche alterare lo splicing o regolare la stabilità delle proteine,
se avviene in regioni non tradotte.
Esistono due meccanismi: conversione di una base in un'altra; inserzione o delezione di nucleotidi.

Editing per conversione di basi


Per conversione, le basi che possono essere convertite sono due, C e A, dalle quali vengono rimossi gli
amminogruppi. La conversione da C in U, che avviene principalmente nei genomi mitocondriali delle piante,
cambia le caratteristiche del filamento primario. L’enzima RARE 1, della famiglia delle PPR, catalizza la
deamminazione. La reazione cambia l'informazione genetica se dà codoni di stop o di inizio.
Nelle piante esiste anche il processo contrario, chiamato reverse editing, cioè U passa a C con aggiunta di
un gruppo amminico.
Negli animali, la conversione è presente anche nei mammiferi, ed è più frequente la conversione di
adenosina in inosina che riguarda geni nucleari.Un esempio importante di RNA editing C-U, rara, nei
vertebrati è rappresentato dal gene per l’apolipoproteina B, che codifica per APOB100, per mezzo del suo
trascritto normale, e la proteina APOB48, quando il trascritto viene editato in una specifica citosina, la cui
conversione in uracile, da parte della deaminasi (APOBEC) presente solo nelle cellule dell’epitelio
intestinale, introduce un codone di stop prematuro al posto di un codone per l’introduzione
dell’amminoacido acido glutammico.
Nell'uomo, la conversione A-I avviene grazie a adenosina deaminasi, raggruppate nella famiglia di enzimi
ADAR. Esse legano le regioni a doppio filamento e convertono A in I, che viene letta come una G dai
ribosomi e dallo spliceosoma. Nel caso del gene GluR, che codifica per uno specifico recettore del neuro
mediatore glutammato nei neuroni, l’RNA editing mediato da ADAR produce la sostituzione di una
glutammina con una arginina, con effetti sulla permeabilità della membrana al Ca2+. E’ stato osservato che

38
Giulia Mostini

la disponibilità di vitamina B1 regola la frequenza di editing. La deficienza di timina potrebbe, in questo


modo, causare aumento di Ca2+ nei neuroni della corticale.
La conversione A-I espande la funzionalità di molti importanti geni neuronali. La frequenza di editing di
questi geni aumenta con il differenziamento neuronale e la maturazione cerebrale. Questa dinamica di
espressione genica indotta dell’RNA editing è essenziale per il normale sviluppo cerebrale e solo ora stiamo
iniziando a capirne il ruolo per il funzionamento del cervello umano.
Ad oggi sono noti circa 150 geni oggetto di RNA editing nell’uomo. Recentemente, queste modificazioni
sono state scoperte anche in RNA non codificanti (ncRNA), come microRNA, piccoli RNA interferenti, lunghi
RNA non codificanti. Ciò può influenzare la biogenesi, la stabilità e le proprietà di riconoscimento del
bersaglio di questi ncRNA. Il malfunzionamento del macchinario di editing viene sempre più associato
anche a varie malattie umane, come malattie neurovegetative, cardiovascolari e cancro.

RNA editing inserzionale


L’editing inserzionale è stato scoperto da Benne alla fine degli anni ’80 nei trascritti mitocondriali del
protozoo parassita Trypanosoma brucei, l’agente eziologico della malattia del sonno.
A questi RNA mitocondriali, dopo essere stati trascritti, vengono aggiunte o rimosse uridine in specifiche
posizioni anche in numero elevato.
In questo caso geni di piccole dimensioni e dalle sequenze codificanti incomplete (criptogeni) possono dare
origine a trascritti maturi significativamente diversi dalla sequenza primaria del DNA stampo originario.
L’inserzione o la delezione di uridine nell’mRNA richiede uno specifico RNA guida (gRNA), che si appaia al
trascritto, in corrispondenza dei siti da modificare. Per inserire uridine, un tratto del gRNA non si appaia per
la presenza di A che non trovano le complementari U nell’mRNA (sequenza di editing). Una endonucleasi, a
questo punto, taglia in corrispondenza del sito di editing, riconoscendo la regione non appaiata e, quindi,
l’enzima TUTasi (terminal uridil transferasi) aggiunge le U al 3’-OH del frammento di mRNA a monte. Una
ligasi, infine, unisce le estremità 3’-OH e 5’-fosfato della molecola di RNA.
Nelle delezioni, la regione di editing del gRNA non si appaia per l’assenza di A in corrispondenza di U
sull’mRNA. L’endonucleasi taglia mRNA in corrispondenza del sito di editing e le U in eccesso vengono
rimosse da una esonucleasi U specifica (ExoUasi), poi la ligasi ristabilisce la continuità della molecola di
RNA.

Controllo genico negli eucarioti


Pur condividendo la stessa sequenza nucleotidica e le medesime regioni regolative, il genoma di ogni cellula
di un organismo della stessa specie esprime in maniera diversa l’insieme di geni di cui è composto.
Senza considerare quello che accade in morfogenesi, negli organismi cellulari lo stesso DNA arriva a
determinare innumerevoli e diversissimi tipi cellulari che variano ulteriormente il proprio fenotipo a
seconda del tempo trascorso, a seguito delle varie attività del tessuto di cui fanno parte, o in risposta a
fattori endogeni e stimoli esterni. Gran parte di questa variabilità fenotipica è dovuta alla flessibilità con cui
i geni possono essere espressi.
Per espressione genica si intende la manifestazione dell’attività di un gene. Questa si estrinseca nella
trascrizione del mRNA, nella produzione della sua proteina e quindi nell’effetto sul fenotipo. Il controllo
dell’espressione genica consiste nella serie di meccanismi di regolazione che determinano i livelli di attività
di un gene.
Il controllo genico degli eucarioti raggruppa i meccanismi che hanno luogo nel nucleo e che controllano i
livelli di RNA trascritto disponibile per la sintesi delle proteine.
Il sequenziamento simultaneo degli mRNA copiati in DNA consente di quantificare l’insieme dei trascritti di
tutti i geni. Il protocollo dell’RNAseq è l’estrazione dell’RNA, la retrotrascrizione del cDNA, l’amplificazione
della library di cDNA con EST e adattatori, il sequenziamento, l’allineamento delle sequenze ottenute,
l’analisi quantitativa del numero di reads.
La maggior parte dei trascritti è condivisa da 4 tessuti (rene, testicolo, cervello e fegato).
Il contenuto dei diversi mRNA e delle proteine codificate nelle stesse cellule esposte a condizioni differenti
fornisce un ulteriore esempio di quanto sia plastica l’espressione genica ed estesa, al limite delle nostre
capacità di interazioni fra i vari fattori che la controllano.

39
Giulia Mostini

E’ possibile affermare che multiple vie di regolazione convergono su un gene. Ad esempio, guardando la
telomerasi, ci si rende conto di come i livelli di trascrizione di un singolo gene possano essere mutevoli.
In Drosophila, l’espressione della proteina eve (repressore trascrizionale omeotico contenente HTH)
nell’area corrispondente al segmento 2 dell’embrione dipende dalla concentrazione dei fattori che legano
gli elementi di controllo dell’espressione del gene even skipped (eve).
La trascrizione del gene Sex-lethal (Sxl) nel moscerino della frutta dipende dal promotore precoce (Pe) e
avviene solo nelle femmine, per effetto del doppio dosaggio degli attivatori SisA e SisB presenti sul
cromosoma X nelle femmine rispetto ai maschi, dove prevale il repressore Dpn.
Le proteine eucariotiche che regolano la trascrizione, si assemblano in complessi sul DNA. Spesso, alcuni
fattori risultano degli attivatori, quando sono presenti in un tipo di complesso, e repressori se sono
associati ad altri complessi. Va ricordato l’esempio di NFAT sui promotori delle interleuchine.
La biologia dei sistemi è lo studio dei sistemi biologici, il cui comportamento non può essere ridotto alla
somma lineare delle funzioni delle loro parti. Mediante metodi di modellazione quantitativa presi in
prestito dalla fisica, la biologia dei sistemi offre descrizioni valide dei circuiti regolativi dell’espressione
genica, come nel caso dell’auto-repressione o auto-attivazione di promotori. Un promotore forte, il cui
prodotto funge da repressore dello stesso, mostra una superiore velocità di risposta.

Meccanismi di controllo trascrizionale


Il controllo genico nei procarioti è mediato da attivatori, repressori e da specifici fattori di inizio σ. Le cellule
procariotiche, infatti, sono particolarmente sensibili alla presenza di segnali esterni, per lo più molecole
presenti nel terreno di coltura che entrano nella cellula e interagiscono con proteine regolatrici sia di tipo
positivo che negativo. Le prime sono gli attivatori, implicate nella regolazione positiva contribuendo a
incrementare il livello di trascrizione, mentre le seconde, dette repressori, sono implicate nella regolazione
negativa, inibendo la trascrizione. In genere, in assenza di proteine regolatrici, il legame dell’RNA polimerasi
al promotore è debole e risulta in un livello di espressione costitutiva basale. Questa trascrizione risulta
inibita in seguito al legame del repressore con l’operone. L’attivatore, al contrario, ha due domini di
legame, uno interagisce con la RNA polimerasi, l’altro riconosce una sequenza di DNA vicina al promotore,
promuovendo un legame della proteina al DNA e scatenando una isomerizzazione spontanea in
conformazione aperta, per favorire la trascrizione.
Alcuni esempi di Operoni sono lac, mer, arabinosio e NtrC (Nitrogen regulatory protein C).

Controllo negli eucarioti - attivatori


La struttura modulare dei promotori e delle sequenze regolatrici distali negli eucarioti (TFBS – transcription
factor binding site) consente di associare numerosi fattori di regolazione della trascrizione (TF). Ad
esempio, il promotore del gene per la metallotioneina IA umana (proteina dell’apparato del Golgi
necessaria al metabolismo di zinco e rame) contiene numerosi siti di legame per diversi TF (incluso metal
responsive element binding protein) che regolano l’espressione del gene secondo le esigenze della cellula.
Tra i numerosi TF che legano i promotori dei geni nucleari di proteine mitocondriali, NRF 1 e 2 (fattori
respiratori nucleari) svolgono un ruolo predominante fra specie vicine, come dimostra il grado di
conservazione della loro consensus di legame a promotori, come quello della deacetilasi mitocondriale
Sirt3.
La presenza dei vari TFBS all’interno dei promotori determina il reclutamento di specifici TF e quindi
l’espressione di proteine in un tipo di cellule, piuttosto che in altre, con diversi quantità e tempi, in risposta
a stimoli diversi. In altre parole, la composizione in TFBS dei promotori determina il fenotipo, cioè un tratto
sottoposto a selezione che evolve. La differenza tra i promotori del tumor necrosis factor (TNF) nei primati,
per esempio, rivela l’evoluzione dell’immunità innata.
Il saggio di immunoprecipitazione della cromatina e il successivo sequenziamento, con analisi delle regioni
arricchite, consente di determinare il sito di legame delle proteine eventualmente associate al DNA. Si
possono determinare le consensus di legame per i vari TF sulle stesse sequenze di DNA.
Uno degli attivatori trascrizionali eucariotici più studiati, che è diventato un modello per tutti gli altri, è la
proteina Gal4, richiesta per attivare la trascrizione dei geni per l’utilizzo dello zucchero galattosio in S.
cerevisiae, legandosi al promotore del gene GAL1. Gal4 si lega a 4 siti che contengono ciascuno una

40
Giulia Mostini

sequenza di 17 nt e che fanno parte della regione UAS (Upstream activating sequence), situata a circa -270
bp a monte del sito di inizio della trascrizione del gene GAL1. In presenza di Gal4 (quando vi è galattosio), la
trascrizione di tale gene aumenta di 1.000 volte.
Pol II viene reclutata sul DNA dagli attivatori. L’associazione diretta del mediatore al promotore, mediante
la fusione artificiale a un dominio proteico in grado di legare il DNA in prossimità del TSS, infatti, induce la
trascrizione.
Si possono distinguere 3 classi di complessi regolatori che includono Pol II:
1. Fattori di trascrizione generali: TFIIA, B, D, E, F, H con il complesso del mediatore,
2. Altri cofattori: CRSP, TRAP, ARC/DRIP.
3. Complessi del rimodellamento della cromatina: SWI, SNF, PBAF, ACF, NURF e RSF.
I complessi TFIID basati su TAFs differenti (come TAF105 specifico per le ovaie o TRF specifico per i geni
della replicazione) consentono la formazione di complessi di inizio della polimerasi di RNA specializzati che
dirigono la trascrizione di programmi di espressione specifici per tessuto o gene.
Alcuni TF regolano la trascrizione di un gene non solo agendo direttamente sul reclutamento della RNA
polimerasi sul promotore, ma associando sul DNA fattori in grado di regolare il grado di compattezza dei
nucleosomi (lo stato della cromatina), mediante modificazioni specifiche degli istoni, nel caso di enzimi
specifici, o mediante alterazioni dei nucleosomi, nel caso del complesso di rimodellamento della cromatina.
Alcuni gruppi, come acetili o metili, aggiunti su residui amminoacidici specifici delle code esposte degli
istoni, sono legati da GTF basali, come TFIID, che possiede una subunità caratterizzata dal bromodominio,
lungo circa 110 aa, in grado di riconoscere le lisine acetilate sugli istoni. Nell’uomo, ci sono 46 proteine
contenenti bromodomini e sono coattivatori e mediatori trascrizionali, rimodellatori della cromatina, elicasi
e modificatori di istoni.
Alcuni geni contengono sequenze (pause bottom motif) che arrestano la fase di allungamento della
trascrizione a valle di TSS e quindi, dopo che Pol II è stata reclutata e ha iniziato la sintesi di mRNA. Alcuni
attivatori promuovono l’allungamento, favorendo la rimozione del blocco, ad esempio mediante il
reclutamento di una specifica chinasi (P-TEFb), che fa parte del complesso SEC (super elongation complex)
e che scalza il fattore di pausa NELF da Pol II, consentendo di proseguire la trascrizione.
Esistono interazioni cooperative tra attivatori tramite cooperazione diretta, cooperazione indotta dallo
svolgimento del nucleosoma, cooperazione mediata da un modificatore della cromatina e cooperazione
mediata da un terzo fattore.
I repressori, invece, funzionano per competizione, inibizione, repressione diretta o indiretta. Alcuni di
questi, come HDAC, agiscono rimuovendo dagli istoni le modificazioni che favoriscono la trascrizione.
Importante è sapere che geni diversi si esprimono in maniera differente perché sono controllati da un
insieme di attivatori e repressori, che possono essere sia condivisi sia specifici dei vari promotori (mating
type di S. Cerevisiae).

Promotori ed enhancer
Gli elementi che si chiamano enhancer sono regioni di DNA
lunghe 50-1.500 bp, che possono essere legate da attivatori
della trascrizione di un particolare gene. Sono elementi cis-
acting, localizzati fino a 1.000.000 bp di distanza dal gene, a
monte o a valle del sito di inizio della trascrizione,
eventualmente in introni. Nel genoma umano ne sono stati
identificati decine di migliaia. Gli enhancer possono anche
funzionare in entrambi gli orientamenti, rispetto alla
direzione della trascrizione.
I diversi elementi regolativi sul DNA lavorano
indipendentemente l’uno dall’altro nell’orchestrare
l’espressione di un gene in cis. Ad esempio, l’espressione del
gene eve nei vari segmenti nell’embrione Drosophila,

41
Giulia Mostini

dipendente da 5 enhancers distinti. Gli enhancer funzionano in modo autonomo e sono regolati da
espressione a corto raggio. I repressori specifici legati a un silencer (sequenze di DNA distali che reclutano
repressori per l’inibizione), infatti, non interferiscono con le attività degli enhancer vicini.
Gli enhancer, inoltre, sono regolati da altri elementi, come gli isolatori. Gli insulators sono regioni del DNA
che bloccano a distanza l’effetto attivatore degli enhancer sulla trascrizione. La distribuzione particolare di
insulators ed enhancer sul cromosoma consente di restringere il campo di azione di questi ultimi a pochi
geni mirati.

Meccanismo della comunicazione enhancer-promotore


In Drosophila c'è differenza rispetto ai mammiferi. Per esempio, nell’ala
seghettata vi è un enhancer (cut wing – 81 kb a monte), che, mediante
la cooperazione del fattore CHIP, induce l’espressione del gene ct (cut)
nel margine dell’ala, determinando il fenotipo dell’ala seghettata.
L’inserimento del retrovirus gipsy in qualsiasi punto tra il gene ct e
l’enhancer influenza l’espressione di ct a causa della presenza di siti di
legame all’interno di gipsy per il fattore repressore che normalmente si
lega all’isolatore Hairy wing (SuHW). Quest’ultimo blocca l’azione ponte
di CHIP tra enhancer e promotore di ct.
In Drosophila, inoltre, sono coinvolte proteine NippedB, che svolge un
ruolo di reclutatore della coesina, e CHIP, il cui omologo nei mammiferi
è LDB1. CHIP lega i domini DNA – binding di vari TF (DBD) sull’enhancer
e sul promotore, costituendo un ponte fra i due elementi. Si ritiene che
la coesina, con una struttura ad anello, stabilizzi la struttura ad ansa,
tenendo vicino le regioni di DNA in maniera analoga ai cromatidi fratelli
durante la meiosi.
Nei mammiferi, LDB1 svolge il ruolo di ponte di CHIP tra le regioni LCR
enhancer e il promotore della β-globina. In questo caso i TF coinvolti sono GATA1, TAL1, E2A e la proteina
LMO2, contenente Lim domain.
Fattori di trascrizione strutturali, come coesina e CTCF, cooperano per suddividere il genoma in grandi anse,
che costituiscono domini topologici e funzionali isolati. A seconda della posizione dei punti di ancoraggio di
queste anse, gli enhancer possono essere esclusi dal gene bersaglio o inclusi nello stesso dominio del gene
bersaglio. I fattori di trascrizione tissutali specifici e ubiquitari a loro volta comunicano al promotore
l’attivazione della trascrizione solo quando la cromatina aperta lo consente, altrimenti rimangono in uno
stato inattivo.
L’attivazione di enhancer differenti produce differenti pattern di espressione. Riconoscere il loro stato di
attivazione rispetto a uno specifico promotore non è semplice. Gli enhancer possono trovarsi a qualunque
distanza dal loro gene bersaglio e questo rende difficile determinare col promotore di quale gene siano
coinvolti. Gli enhancer attivi sono caratterizzati dalla mancanza di nucleosomi e fiancheggiati da nucleosomi
con istoni modificati in maniera tipica (H3K4me1 e H3K27ac). Gli enhancer attivi, inoltre, sono portati in
prossimità dei promotori da “looping” mediati da coesina ed altri complessi.
Il primo esempio è quello di ChIP-Seq della coesina, visto precedentemente.
Un’altra reazione, invece, è la Chromatin Conformation Capture 3C, in cui la CHIP prevede passaggi di ligasi
e amplificazioni per polimerizzazione.
Il locus umano delle β-globine (componenti dell’emoglobina) contiene cinque geni di globine differenti. L’ε-
globina viene espressa durante lo stadio embrionale e sostituita dalla γ-globina durante la vita fetale.
Intorno alla nascita, si verifica il passaggio da γ-globina a β-globina, che quindi viene espressa nell’adulto. La
δ-globina è anche espressa nell’adulto, ma poco.
Un complesso di TF media le interazioni a lungo raggio tra le regioni regolative presenti nella LCR e quelli in
prossimità della γ-globina negli eritroblasti fetali o della β-globina in quelli adulti.

42
Giulia Mostini

Metilazione delle citosine


Le citosine sono basi particolari perché possono essere modificate e metilate in posizione C5 con una
frequenza variabile. L'enzima che agisce è DNMT (DNA metil transferasi) che utilizza il coenzima s-adenosil
metionina (SAM), cioè un distributore di gruppi metilici. Circa il 5% delle citosine è metilato. Avviene ciò nei
vertebrati in presenza di una sequenza 5’-CG-3’ (CpG). Si tratta di un piccolo palindromo, quindi
potenzialmente vi sono due citosine da metilare sui due filamenti. Le piante metilano molto più degli
animali perché la citosina può essere metilata anche in CpHpG e CpHpH (con H = A, C o T).
All’inizio, la citosine metilate venivano identificate tramite enzimi di restrizione (HpaII), tipici di batteri, per
difendersi dai fagi, che tagliavano la sequenza CCGG solo se non era metilata. I frammenti che si
ottenevano indicavano se il sito poteva essere metilato oppure no. Adesso, invece, vi è la possibilità di
avere il dettaglio esatto dei siti metilati su molte sequenze. In particolare, il bisolfito di sodio è in grado di
legare e convertire la citosina non metilata in uracile, per cui si rivela la presenza di citosine metilate, che
sono quelle non trasformate in uracile. Utilizzando questa tecnica si è scoperto che quasi l’80% di citosine
venivano metilate nel genoma umano.
La metilazione avviene grazie alle metilasi di mantenimento e de novo. Le prime si occupano del filamento
neo sintetizzato nelle regioni CpG, solo se nel filamento opposto c’è una sequenza metilata, dato che si
tratta di una sequenza palindroma. Dopo la replicazione del DNA, il filamento copiato sarà quindi metilato
ad opera di DNMT di mantenimento, mentre i siti non metilati nella doppia elica restano tali. In questo
modo, le metilasi di mantenimento replicano il pattern di 5-mC attraverso le divisioni cellulari.
Le sequenze CpG sono raggruppate in regioni lunghe circa 1-2 Kbp, chiamate isole CpG, che si presentano
più frequentemente all’estremità 5’ di alcuni geni, come nel caso del gene EEF1A1 dall’espressione
ubiquitaria.
La metilazione delle citosine interferisce con la trascrizione, impedendo al fattore di trascrizione di
riconoscere le C sulla sua sequenza di legame al DNA o poiché la sequenza metilata viene riconosciuta e
legata a proteine MBD, che a loro volta reclutano altri fattori implicati nel rimodellamento della cromatina
che viene resa inaccessibile per la trascrizione.
Un esempio di imprinting della metilazione è
fornito dai geni H19 e Igf2 che condividono
lo stesso enhancer. Sul cromosoma materno
X, infatti, c’è una sequenza insulator (ICR) a
monte di H19, che non viene metilata ed è
libera di legare la proteina CTCF, che inibisce
l’interazione dell’enhancer con il promotore
di Igf2 e quindi la sua trascrizione. Negli
spermatozoi, invece, la metilazione presente
sull’ICR non consente il legame con la
proteina CTCF, lasciando libero l’enhancer di
interagire con il promotore di Igf2.
Vi è la possibilità che il grado di metilazione di regioni di geni, vari in base alle condizioni ambientali, in
maniera anche ereditabile. Sostanzialmente quello che viene definito metiloma, cioè il segnale di
metilazione, può cambiare, ma ancora non si conoscono tutte le implicazioni. Si è iniziato a utilizzare i
segnali che cambiano per predire alcuni stati. Ad esempio, nel sangue mappato ci sono regioni che sono
differentemente metilate tra giovani e vecchi. La percentuale di metilazione di una determinata regione
scende con l’età, mentre in altre regioni aumenta con l’età. Utilizzando una serie di questi siti con
cambiamento e confrontando gli individui, vengono considerate le isole come se fossero marcatori di
invecchiamento, per vedere un’associazione tra età predetta in base alla metilazione e età reale del
soggetto. C’è una perfetta previsione sulla base della metilazione. È molto controverso questo esperimento
perché potrebbe essere uno strumento per predire rischi di malattie degenerative o cancro perché fa
capire l'invecchiamento fisiologico, non quello anagrafico. Non si sa esattamente ancora il motivo di queste
fluttuazioni tra giovani e vecchi.

43
Giulia Mostini

Epigenetica
Sostanzialmente è una visione diversa rispetto al controllo delle funzioni del genoma che siamo abituati ad
associare alla genetica. Essa si occupa delle modifiche reversibili del genoma che inducono effetti funzionali
duraturi. Per esempio la metilazione che abbiamo appena visto è un caso di epigenetica.
L’epigenoma è l’insieme dei fenomeni che regolano le modifiche del DNA.

MicroRNA
I microRNA sono corti (18-24 nt), non codificanti, con funzioni regolative dell’espressione genica, regolando
negativamente i loro bersagli di mRNA. Essi sono stati scoperti poco più di vent’anni fa in Caenorabditis e
oggi nell’uomo ne sono stati identificati più di mille, espressi in modo specifico nelle varie cellule.
Sono prodotti da precursori lunghi (pri-miRNA) che poi vengono tagliati opportunamente. Si possono
appaiare a sequenze specifiche e stabili per facilitarne la degradazione. Essi sono processati dai complessi
DROSHA nel nucleo e DICER nel citoplasma, per poi essere assemblati nel complesso RISC e regolare la
stabilità di vari mRNA bersaglio.
I livelli di mRNA prodotti da un gene possono essere modulati nel tempo, in base al tipo di interazione tra
fattore di trascrizione, promotore del gene e microRNA coinvolto. Sostanzialmente, esiste un livello di
espressione dei microRNA, come se fosse una rete parallela che tampona i livelli di trascritto messaggero
normali che abbiamo visto precedentemente. Questa regolazione avviene nel mirnoma che si sovrappone
al trascrittoma, che è a sua volta soggetto a regolazione ed è un elemento molto importante.
I microRNA sono utilizzati, inoltre, per predire stati di malattia.

Dinamica della cromatina


Lo stato di condensazione della cromatina influenza la trascrizione genica. Il 50% del genoma dei
mammiferi è presente in forma altamente condensata (eterocromatina), dove non si manifesta
trascrizione. L’eterocromatina può rimanere perennemente condensata (costitutiva) o rilassarsi e passare a
uno stato che consente trascrizione (facoltativa). L’eucromatina, invece, è meno condensata e presenta
un’intensa attività di trascrizione.
I diversi stati della cromatina sono indotti da enzimi (chromatin modifiers – writers o erasers) che
modificano gli istoni o metilano specifiche citosine, modulando la trascrizione dei geni. L’attivazione dei
geni degli enzimi che modificano la cromatina e dei loro cofattori (readers) stabilisce un ciclo di feedback
che può ulteriormente essere modulato da metaboliti (deacetilasi Sirt-NAD dipendente). Il risultato delle
modificazioni istoniche è una specifica repressione o attivazione della trascrizione o il reclutamento di
fattori che metilano il DNA o di fattori di riparo. Ad esempio, l’acetilazione degli istoni attiva la trascrizione.
Le modificazioni istoniche possono essere acetilazione, metilazione, fosforilazione, ubiquitinazione,
citrullinazione (da arginina a citrullina), sumoilazione (aggiunta covalente delle proteine SUMOs).
L’ipotesi del “barcode istonico”, inoltre, si basa sulle varianti H3 dei mammiferi (H3.1, .2, .3), che sebbene
siano simili nella sequenza amminoacidica, esibiscono distinte firme post-traduzionali. Queste modificazioni
dei nucleosomi creerebbero diversi domini o territori cromosomici, che influenzano l’espressione del
genoma durante la differenziazione e lo sviluppo cellulare.
In sostanza, l’insieme di segnali e dei microRNA, che modulano finemente l’espressione globale,
rappresentano l’informazione epigenetica.

Silenziamento nella regione telomerica di S. Cereviasiae


In prossimità del telomero dei cromosomi di lievito, Rap1, presente su specifiche regioni di eterocromatina,
associa il complesso Sir, di cui fa parte l’enzima deacetilasi Sir2, che deacetila le code degli istoni (gli
omologhi nei vertebrati sono le sirtuine - Sirt 1-13).
I nucleosomi non acetilati associano altri Sir, che espandono la deacetilazione alla regioni adiacenti,
contribuendo ad estendere le anse di DNA in stato inattivato di eterocromatina. La presenza di insulators o
di specifiche modificazioni della coda dell’istone H3 possono bloccare il legame di Sir2 e impedire la
diffusione dell’eterocromatina.

44
Giulia Mostini

Repressione mediata da polycomb


Le proteine del gruppo Polycomb sono una famiglia di proteine scoperte per la prima volta in Drosophila,
che possono rimodellare e silenziare la cromatina. Polycomb 1 e 2 (PRC1 e PRC2) sono i principali fattori di
repressione della trascrizione. Il complesso PRC2 si associa a proteine che legano specifiche sequenze del
DNA (Polycomb Response Element – PRE). Il componente critico del complesso PRC2 è la metiltransferasi
(EZH2), che aggiunge 3 gruppi CH3 alla lisina 27 della coda dell’istone H3, producendo H3K7me3. Questa
modifica induce l’ingaggio del complesso PRC1, che condensa la cromatina e media il posizionamento di un
nucleosoma in prossimità di TSS.
Le acetiltrasferasi e le specifiche metiltransferasi (bersaglio H3K4) promuovono, invece, la trascrizione. Le
deacetilasi, le ubiquitin-ligasi, le sumo-coniugasi e altre specifiche metiltransferasi (bersaglio H3K27),
invece, inibiscono la trascrizione.

Componenti della traduzione


La traduzione di mRNA in proteina è l’ultimo atto della decodifica dell’informazione genetica. Le proteine
sono polimeri dei 20 amminoacidi, la cui composizione segue la sequenza codificante del DNA.
Il legame peptidico è il legame covalente che lega tra loro gli amminoacidi. Si tratta di un legame ammidico
che si forma in seguito a una reazione di condensazione con eliminazione di una molecola d’acqua tra il
gruppo amminico di un amminoacido e il gruppo carbossilico di un altro. Un amminoacido può formare due
di questi legami e in questo modo usare una serie di amminoacidi per costituire un polimero lineare,
definito polipeptide o proteina. Ciascuna sequenza di amminoacidi, grazie alla rotazione permessa sui due
legami peptidici e la disposizione dei vari gruppi R, si struttura in una precisa forma in grado di svolgere
diverse funzioni.
Fondamentale è la reazione della peptidil transferasi, che avviene nel sito P del ribosoma (nome inventato
da R. Roberts nel 1958), in cui il gruppo amminico del nuovo amminoacido, legato al tRNA, attacca il gruppo
carbossilico dell’ultimo amminoacido della catena peptidica nascente. L’avvicinamento dei siti coinvolti
riduce l’energia di attivazione richiesta per la formazione del legame peptidico, accelerando di milioni di
volte la formazione del legame.
Il macchinario della peptidil transferasi legge l’mRNA in corrispondenza dei codoni. Un codone è una
tripletta codificante presente sull’mRNA, che svolge la funzione di segnale per l’inizio o il termine della
sintesi o per indicare quale amminoacido incorporare.

Fasi della traduzione


La sintesi proteica, analogamente a quella del DNA, si distingue in tre fasi, ognuna caratterizzata da reazioni
chimiche ed eventi molecolari specifici:
1. Inizio: la traduzione ha inizio con il legame della subunità minore del ribosoma al filamento di
mRNA presso l’estremità 5’. Questo legame nei procarioti avviene anche se il resto della molecola
di mRNA è ancora in fase di trascrizione. Quindi, un primo tRNA (di inizio) si dispone in modo da
appaiarsi con il codone d’inizio dell’mRNA, inserendo un primo amminoacido. La combinazione fra
la subunità minore del ribosoma, l’mRNA e il tRNA d’inizio è detta complesso di inizio. A
quest’ultimo partecipano anche ATP e diversi fattori proteici specifici d’inizio, che regolano la
velocità di produzione delle proteine in aggiunta alla disponibilità dei vari amminoacidi.
2. Allungamento: per l’allungamento della catena polipeptidica è necessario che altri amminoacidi,
sempre trasportati dal tRNA specifico (aminoacil-tRNA), siano portati sul sito catalitico del
ribosoma. Su questo vi sono tre siti: il sito A riceve il nuovo aminoacil-tRNA, il sito P tiene legata la
catena nascente, il sito E rilascia il tRNA libero. Nella fase di inizio il primo aminoacil-tRNA (met-
tRNA) siede in posizione P, mentre il secondo si lega in posizione A. A questo punto, avviene la
formazione del legame peptidico tra il primo amminoacido e il secondo, lasciando vuoto il tRNA,
che si stacca dal ribosoma. L’mRNA poi scorre in avanti di un codone nel ribosoma e il secondo
tRNA, al quale ora sono attaccati due amminoacidi, passa dal sito A al sito P (traslocazione del
peptidil-tRNA). Alla fine, il ciclo si ripete con un terzo complesso amminoacido-tRNA che si inserisce
nel sito A, appena liberato, e la catena polipeptidica si allunga di 5 amminoacidi al secondo.

45
Giulia Mostini

3. Terminazione: una volta aggiunti tutti gli amminoacidi specificati dalla sequenza di codoni del
mRNA, al termine di questo appare uno dei tre codoni di stop (UAA, UGA, UAG) che sono
riconosciuti da proteine, chiamate fattori di terminazione, che determinano il rilascio del complesso
proteina-tRNA. Il tRNA si dissocia dalla catena proteica, la quale va incontro eventualmente a
successivi processi di rinaturazione controllata e modificazione post-traduzionale. Quindi, l’mRNA si
distacca dal ribosoma, che si disassembla nelle sue due subunità ribosomiali, disponibili a
ricominciare il ciclo su un’altra molecola di mRNA.

Il codice genetico
Il 27 maggio 1961, alle tre di notte, Heinrich Matthaei, in visita al laboratorio NIH di Marshall Nirenber,
aggiunse un RNA sintetico, composto di solo uracile, in 20 provette contenenti, oltre a lisato batterico in
grado di tradurre in vitro, i 20 diversi amminoacidi. Si formarono così polipeptidi.
Negli esperimenti successivi, aggiungendo altri RNA dalla composizione variabile, Nirenber scoprì il
linguaggio che il DNA usa per determinare il codice genetico.
George Gamow, per primo, agli inizi degli anni ’50, ipotizzò che tre basi dovevano essere impiegate per
codificare i 20 amminoacidi usati dalle cellule per fabbricare le proteine. Con sole 4 basi diverse, un codice
basato su parole di due lettere (nucleotidi) consentirebbe di specificare al massimo 16 amminoacidi (42
permutazioni con ripetizioni). Un codice con tre nucleotidi sarebbe, invece, più che sufficiente, arrivando a
poter identificare fino a 64 monomeri diversi. Infatti, il codice genetico è costituito da 64 codoni.

Il codice genetico è nato dalle interazioni amminoacido – tripletta specifiche che garantiscono una
preferenza tripletta – amminoacido. La selezione naturale, inoltre, ha portato alle assegnazioni del codone
del codice genetico tali da minimizzare gli effetti delle mutazioni. Eventualmente, il codice tripletta sarebbe
derivato da altri codici più lunghi, che avrebbero consentito una traduzione più accurata nelle prime forme
cellulari ancora prive di sistemi, come il ribosoma. Il codice genetico standard moderno sarebbe, quindi, il
risultato dell’evoluzione di un codice precedente più semplice, grazie ad un processo di espansione
biosintetica. Inoltre, i modelli mutuati dalla teoria dell’informazione, secondo l’ipotesi rate-distortion,
suggeriscono che il codice genetico sia il prodotto dell’interazione di tre forze evolutive in conflitto: i
bisogni di molti amminoacidi, tolleranza a errori e minimo dispendio di energia.
In sostanza, il codice genetico è letto di tre basi in tre basi non sovrapponibili. La sequenza delle triplette
segue un ordine o modulo di lettura o frame che consegue dalla posizione del codone di inizio. Cambiare il
frame, porta al cambiamento anche della sequenza amminoacidica.
Nella maggior parte dei casi, più codoni corrispondono allo stesso amminoacido; in altre parole, il codice
genetico è ridondante ovvero “dice la stessa cosa con parole diverse”. Questo fenomeno prende anche il
nome di degenerazione del codice genetico. I codoni che codificano per lo stesso amminoacido possono
differire in una delle loro tre posizioni. Ad esempio, la serina è specificata da codoni che hanno lettere
differenti in ciascuna delle tre posizioni della tripletta: UCA, UCG, UCC, UCU, AGU o AGC. Un codone che
codifica lo stesso amminoacido, qualunque sia la base in terza posizione viene detto degenere.

Codoni di inizio e codoni di stop


La sintesi di una proteina parte da un codone di inizio, AUG, che codifica per la metionina, o nei batteri per
la formil-metionina. Inoltre, sequenze specifiche intorno a questo primo codone aumentano l’efficienza di
legame dell’mRNA al ribosoma e altre sequenze sono richieste per avviare la traduzione. In alcuni
organismi, possono essere utilizzati codoni di inizio alternativi, GUG e UUG, che codificano per valina e
leucina, ma se letti all’inizio inducono l’incorporazione comunque di metionina o formil-metionina. Altri
codoni di inizio utilizzati più raramente sono CUG, UGG, mentre nei procarioti AUU.
46
Giulia Mostini

I tre codoni di stop, UAG, UAA, UGA, invece, determinano la fine della sintesi della proteina sono detti
anche codoni non sense. Il codone UAG è anche chiamato amber in onore dello scopritore Bernstein
(significa ambra). I codoni di stop sono riconosciuti da tRNA senza amminoacidi e questo determina il
distacco del polipeptide nascente dal ribosoma, mediato dal fattore di rilascio.

Codoni per amminoacidi rari


Il codice genetico è universale, cioè è lo stesso in tutte le specie, dai batteri all’uomo. Con rare eccezioni,
alcuni organismi possono interpretare alcuni codoni in maniera diversa. I lieviti del clade CTG (Candida
albicans), per esempio, utilizzano CUG per codificare serina, invece di leucina. Inoltre, in micoplasma UCA
sta per il triptofano, mentre nei protozoi ciliati e qualche alga verde UAG e UAA codificano per la
glutammina e UGA codifica la cisteina.
In alcuni batteri e archeobatteri i codoni di stop inducono l’incorporazione di amminoacidi non comuni
(UGA codifica la selenocisteina e UAG la pirrolisina). Nel caso della pirrolisina, UAG viene riconosciuto da un
pirrolisina-amminoacil tRNA prodotto mediante l’intervento di una specifica tRNA sintetasi.
L’archeobatterio Acetohalobium arabaticum può addirittura modificare il proprio codice a seconda della
disponibilità di pirrolisina che lo porta a espandere da 20 a 21 i codoni codificanti amminoacidi.
Il codice genetico dei mitocondri è diverso nei vari organismi. La variabilità del sistema mitocondriale può
essere dovuta alla maggiore velocità di evoluzione del suo genoma non protetto da efficienti meccanismi di
riparazione del DNA ed esposto direttamente ai sottoprodotti del metabolismo dell’ossigeno.

RNA ribosomiale
Il ribosoma è composto da proteine e RNA.
Gli rRNA sono i primi RNA a essere stati purificati e analizzati in virtù della loro abbondanza (80% dell’RNA
totale della cellula). Le loro sequenze nucleotidiche, e le loro strutture secondarie, sono molto conservate
fra le diverse specie. Il fatto che la struttura secondaria degli rRNA sia molto conservata, più di quanto non
lo sia la sequenza nucleotidica, indica che è la struttura secondaria ad essere funzionalmente rilevante e
quindi sotto pressione selettiva.
Una mutazione della sequenza che eliminasse un appaiamento di basi, e quindi un sito di appaiamento di
un loop, può ristabilirsi o con una retromutazione, ma anche mutando il nucleotide sull’altro filamento, in
modo da ripristinare la complementarietà delle basi. In questo modo, le sequenze nucleotidiche cambiano
progressivamente, mantenendo invariata la struttura secondaria.
Gli rRNA, come i tRNA e gli altri RNA, contengono nucleotidi modificati (uridina – pseudouridina e la
metilazione della posizione C2 del ribosio) prodotti da sistemi enzimatici post-traduzionali. Queste
modificazioni si trovano in regioni evolutivamente conservate e critiche per la funzione.
Per DNA ribosomiale (rDNA), invece, si intendono le sequenze di DNA codificanti per l’RNA ribosomiale.
L’rDNA degli eucarioti consiste in ripetizioni in tandem di un segmento unitario, composto dalle regioni
NTS, ETS, 18S, ITS1, 5.8S, ITS2 e 28S.
Fa parte dell’rDNA anche un altro gene, che codifica per l’rRNA 5S. Nel nucleo, le regioni di rDNA presenti
sui diversi cromosomi si strutturano a formare il nucleolo. Nel genoma umano ci sono circa 5 cromosomi
con regioni rDNA che formano il nucleolo: i cromosomi 13 (RNR1), 14 (RNR2), 15 (RNR3), 21 (RNR4) e 22
(RNR5).
La descrizione ad alta risoluzione delle diverse strutture tridimensionali del ribosoma sta svelando tutta
l’importanza dell’rRNA. Più che semplici componenti strutturali, questi sono direttamente coinvolti nei
processi chiave del ribosoma. La maggior parte delle proteine ribosomiali si trova ai margini del ribosoma,
mentre al suo interno predomina la componente RNA. Nel caso delle proteine che parzialmente
compongono il core ribosomiale la loro funzione sembra essere quella di stabilizzare l’alta densità di rRNA,
schermandone la carica negativa tramite il backbone di fosfati.
Alcuni geni e proteine, in particolare l’rRNA, possono servire come orologio evolutivo o come misura dei
cambiamenti avvenuti durante l’evoluzione. I metodi per ottenere sequenze dell’rRNA e costruire alberi
filogenetici sono ora di routine e questo grazie all’analisi combinata di biologia molecolare e calcolo
computerizzato. Il processo inizia con l’uso della reazione di PCR su campioni di DNA del microrganismo in
coltura pura per amplificare i geni del DNA genomico che codificano per l’rRNA 16S. Successivamente, i

47
Giulia Mostini

prodotti della PCR vengono sequenziati. Diversi algoritmi di analisi bioinformatica comparativa dell’rRNA
sono poi impiegati per determinare le divergenze evolutive e gli alberi filogenetici.
I vantaggi del tracciamento filogenetico tramite rRNA sono vari: i geni dell’rRNA sono presenti in tutti gli
organismi e in tutte le cellule; svolgono la stessa funzione in tutte le specie; sono abbastanza conservati e
facili da allineare; contengono regioni altamente variabili meno soggette a cambiamenti, così da consentire
comparazioni per scale temporali diverse; il transfer orizzontale dei geni dell’rRNA è infrequente; ne esiste
un vasto database di quelle già sequenziate.

Ribosoma e nucleolo
Il ribosoma eucariotico maturo 80S è composto da una subunità 40S, contenente RNA ribosomiale 18S e 33
proteine ribosomiali, e una subunità 60S, contenente rRNA 5S, 5,8S e 28S e 47 diverse proteine ribosomiali.
La maggior parte del processo di formazione del ribosoma avviene nel nucleolo, dove la Pol I trascrive gli
rRNA precursori 47S dai geni del DNA ribosomiale. Il pre-rRNA 47S viene assemblato nel pre-ribosoma di
90S con il 5S rRNA, che viene trascritto da Pol III nel nucleoplasma, e varie proteine i cui mRNA sono
trascritti da Pol II nel nucleo ed esportati nel citoplasma per la traduzione in proteine, che vengono
successivamente importare di nuovo nel nucleolo.
Durante la maturazione del pre-ribosoma 90 S in subunità ribosomiali pre-40S e pre-60S, il pre-rRNA viene
modificato ed elaborato attraverso meccanismi che coinvolgono circa 200 piccoli snoRNA (nucleolari), che
sono principalmente trascritti da Pol II da introni di altri geni nel nucleoplasma.
La produzione dei ribosomi è vitale e le cellule eucariotiche hanno sviluppato un compartimento
specializzato, il nucleolo, dove vengono trascritti i geni dell’rRNA, viene elaborato l’RNA pre-ribosomiale e
vengono assemblati i pre-ribosomi.
L’rRNA è presente nei siti attivi del ribosoma, come il sito P. Inoltre, le anse degli anticodoni dei tRNA
carichi e i codoni dell’mRNA entrano in contatto con l’rRNA 16S e non con le proteine ribosomiali.
Le cellule dei mammiferi contengono tipicamente alcuni nucleoli che scompaiono durante la mitosi per
riformarsi de novo nella fase G1 intorno ai geni ribosomiali (rDNA). Nell’uomo, lunghi tratti di DNA situati su
cinque distinti cromosomi si uniscono per formare da uno a tre nucleoli. I geni dell’rDNA associati dal
legame della proteina UBF sono sufficienti per dirigere la formazione di un nucleolo e costituiscono le NOR
(regioni di organizzazione del nucleolo). Si pensa che RNA non codificanti attecchiti nelle regioni di
sequenze ripetute Alu possano spingere i geni dell’rDNA a raggrupparsi in pochi nucleoli per nucleo.
Si ipotizza che il macchinario di sintesi proteica alle origini fosse costituito interamente da RNA e che le
proteine ribosomiali siano state aggiunte con l’evoluzione per aumentare l’attività di questo primitivo
ribosoma a RNA.
Sono stati effettuati degli studi di microscopia crioelettronica (Cryo-EM) per confrontare le strutture dei
codoni di stop, riuscendo a dimostrare come il fattore di terminazione eRF1 rimodelli il mRNA in modo da
leggerne il codone.

Struttura del ribosoma


Il confronto tra i geni codificanti per le proteine ribosomiali (RPs) tra uomo, Drosophila melanogaster,
Caenorhabditis elegans e S. cerevisiae ha rivelato che le sequenze codificanti sono altamente conservate
(omologia media del 63%), sebbene la dimensione del gene e il numero di esoni vari. Indipendentemente
dal ruolo cruciale dell’rRNA nella funzione del ribosoma, ciascuna RP è essenziale per la cellula (la mancanza
anche di una sola di esse risulta letale).
Saccharomyces contiene 78 distinte RP codificate da 137 geni (RPG): 19 singoli geni e 59 coppie di geni
paraloghi, cioè geni che codificano proteine diverse, ma originano da un unico gene ancestrale. Gli RPG
sono i geni più altamente espressi nella cellula e quindi sono ideali per comprendere i meccanismi della co
– regolazione. La loro espressione è attivata in modo coordinato dalla velocità di crescita e dalla
disponibilità di nutrienti.
La biogenesi dei ribosomi è regolata da vie di segnalazione (mediate da AKT, AMPK e TOR) sensibili alla
disponibilità di amminoacidi e calorie, che seguono il ritmo cardiaco.

48
Giulia Mostini

Il ribosoma contiene tre siti di legame per il tRNA il sito A,


che lega l’amminoacil-tRNA in entrata recante
l’amminoacido da incorporare, il sito P (peptidilico) che
lega l’ultimo tRNA entrato e lega la catena peptidica
nascente, e il sito E (uscita), che lega il tRNA scarico che
deve essere rilasciato. I siti A e P sono strutturati in due
emisisti, uno formato dalla subunità minore e uno dalla
maggiore.
Nella subunità maggiore si trova il canale di uscita della
catena peptidica nascente che fuoriesce dal centro
peptidiltransferasico. Questo canale permette al peptide di assumere esclusivamente strutture lineari (tipo
α-elica) e non globulari. La proteina assume la sua struttura definitiva solo al termine della sintesi dopo il
rilascio dal ribosoma. Nella subunità minore sono presenti i canali d’ingresso e d’uscita dell’mRNA. Il canale
di entrata è stretto e consente lo scorrimento attraverso di esso di mRNA solo in forma distesa, priva di
eventuali strutture secondarie. Il canale forma un angolo nel passaggio al centro di decodificazione che
induce una piegatura del mRNA che facilita gli appaiamenti codone-anticodone nei siti A e P.
I tRNA vengono alloggiati nell’emisito della subunità grande in modo che gli anticodoni, che si trovano
all’estremo del braccio lungo della struttura a L dei tRNA si ritrovano in prossimità dei codoni dell’mRNA nel
centro di decodificazione presente nella subunità minore. Le estremità del braccio corto della struttura a L
dei tRNA che portano l’amminoacido e il peptide nascente, si ritrovano nel centro peptidiltransferasico
formato degli emisiti A-P presenti nella subunità maggiore.
Il canale d’uscita ha dimensioni contenute. L’rRNA occupa la maggior parte del volume della struttura.
La molecole di tRNA si dispongono nei siti P e A in modo da appaiare i propri anticodoni con due codoni
adiacenti sull’mRNA. Affinché ciò avvenga il filamento di mRNA si piega con un angolo di circa 45° fra i due
codoni coinvolti nel centro di decodificazione.
Una cellula di E. Coli contiene circa 20.000 ribosomi che costituiscono circa un quarto di tutta la massa del
batterio. Nelle cellule eucariotiche i ribosomi possono essere molti di più (una cellula di mammifero ne può
arrivare a contenere 10 milioni), diffusi galleggianti nel citoplasma o associati ad organelli o alla membrana
plasmatica. Il reticolo endoplasmatico (ER) con ribosomi è chiamato rugoso. I ribosomi attaccati all’ER
producono proteine che verranno utilizzate all’interno della cellula e proteine fatte per l’esportazione fuori
dalla cellula. In questo caso i ribosomi sono associati a specifiche proteine sulle membrane del reticolo e la
proteina nascente presenta un segnale riconosciuto da canali di import transmembrana.

tRNA
Francis Crick assunse che gli amminoacidi non possono legarsi specificamente agli acidi nucleici e che, se un
singolo amminoacido fosse direttamente codificato da una tripletta di nucleotidi, vi sarebbe una
significativa discrepanza di dimensioni tra il templato di mRNA e la nascente catena polipeptidica. Crick
ipotizzò, quindi, che il meccanismo di sintesi proteica avrebbe dovuto comprendere molecole in grado di
adattare il codone a un’estremità e l’amminoacido all’altra
estremità.
Hoagland e colleghi proprio in quel periodo (1957)
dimostrarono che le cellule contengono grandi quantità di RNA
solubile, di peso molecolare basso, legato ad amminoacidi, in
maniera ATP dipendente, che possano essere eventualmente
rilasciati nella frazione proteica.
I tRNA sono le molecole presenti in tutte le specie, che
funzionano da adattatori specifici per gli amminoacidi nella
biosintesi delle proteine. Le loro dimensioni sono quasi
uniformi, circa 80 nt, di cui una vasta gamma di modificati (il
10% con 43 nucleosidi rari diversi) per deamminazione,
sostituzione tiolica, n-alchilazione dell’anello e saturazione dei
doppi legami C5-C6 della pirimidina.

49
Giulia Mostini

I tRNA adottano strutture terziarie a forma di L funzionali per le funzioni di riconoscimento degli
amminoacidi e del riconoscimento dei codoni. In questo ruolo bifunzionale i tRNA interagiscono con due
sistemi principali: la aminoacil-tRNA sintetasi (o ligasi) e i siti di sintesi proteica dei ribosomi. I tRNA
composti da nucleosidi interamente non modificati, ottenuti con trascrizioni in vitro, funzionano come
substrati per le sintesi dell’aminoacil-tRNA. Ciò suggerisce che le caratteristiche strutturali del tRNA
riconosciuto dall’enzima non dipendono in modo critico dalla presenza dei nucleosidi modificati.
I tRNA sono costituiti da differenti porzioni:
• Braccio accettore: è formato dall’appaiamento delle due
estremità della molecola, con la protrusione al 3’ di due C e una A
a cui si lega l’amminoacido. La tripletta al 3’ CCA è tipica di tutti i
tRNA e nei procarioti è codificata dal gene stesso dei tRNA,
mentre negli eucarioti viene aggiunta dall’enzima tRNA
nucelotidil-transferasi.
• Braccio TΨC: include una T e una pseudouridina Ψ nell’ansa a
singolo filamento.
• Braccio D: contiene una diidrouridina.
• Braccio dell’anticodone: comprende la tripletta di nucleotidi
(fiancheggiata al 3’ da una purina e al 5’ da U), che riconosce il
codone sull’mRNA.
• Braccio variabile: dalle 3 alle 21 basi, a seconda dei diversi tRNA.
Si trova tra il braccio TΨC e il braccio dell’anticodone.
Il tRNA ha tre modelli di struttura: primaria, secondaria e terziaria (space fill).

Amminoacil-tRNA sintetasi
Le molecole di tRNA legate ad un amminoacido (tRNAaa) sono dette cariche. Il
caricamento dei tRNA comporta la formazione di un legame acilico tra il gruppo
carbossilico dell’amminoacido e il gruppo OH al 3’ dell’adenosina che protrude
dallo stelo accettore del tRNA. La formazione di questo legame viene catalizzata
dall’enzima amminoacil-tRNA sintetasi, utilizzando l’energia derivata dall’idrolisi di
una molecola di ATP. Il legame tra tRNA e l’amminoacido conserva un’elevata
energia libera, che verrà poi impiegata nella formazione del legame peptidico
durante la traduzione del ribosoma.
Il caricamento degli amminoacidi sui corrispondenti tRNA viene catalizzato dalle
amminoacil-tRNA sintetasi. A questi enzimi compete di fatto il ruolo di adattatori
dei vari tRNA con lo specifico amminoacido, secondo il codice genetico.
Nella cellula ci sono 20 differenti tipi di amminoacil-tRNA
sintetasi, una per ciascun tipo di amminoacido. Ciascun
amminoacil-tRNA sintetasi riconosce un solo amminoacido
e tutti i tRNA sui quali questo può essere caricato, cioè i
cosiddetti tRNA isoaccettori.
Le 20 amminoacil-tRNA sintetasi differiscono ampiamente
per dimensioni e stato oligomerico e hanno bassa omologia
di sequenza. Vengono divise in due classi:
1. Classe I: contengono un dominio catalitico
caratteristico e sono prevalentemente
monomeriche. Nella reazione della classe I, il
gruppo amminoacilico è accoppiato al 2’-idrossile
del tRNA.
2. Classe II: condividono una tipica piega β-shet
affiancata da α-eliche e sono per lo più dimeriche o
multimeriche. Nelle reazioni di accoppiamento

50
Giulia Mostini

amminoacilico di classe II è preferito il sito 3’-idrossile.


Il legame al tRNA è simile per le due classi e coinvolge una struttura α-elica conservata in entrambe.
La reazione di acilazione tra il gruppo carbossilico dell’amminoacido e il gruppo idrossilico in posizione 2’ o
3’ dell’adenosina, che costituisce l’estremità 3’ del tRNA, mediata da amminoacil-tRNA trasferasi, avviene in
due passaggi. Nel passaggio 1, l’amminoacido reagisce con una molecola di ATP, formando un ammino-
aciladenilato e rilasciando pirofosfato. Nel passaggio 2, l’amminoacido adenilato viene trasferito dall’AMP
all’adenina 3’ terminale del tRNA con rilascio di AMP.
Le 20 amminoacil-tRNA sintetasi selezionano l’amminoacido appropriato sulla base anche di minime
differenze. Gli errori di caricamento sono molto bassi (1 ogni 1.000). Alcune amminoacil-tRNA sintetasi
sono in grado di rimuovere eventuali amminoacidi non appropriati, caricati erroneamente sui tRNA. Un
esempio di questi meccanismi di correzione, è quello dell’isoleucil-tRNA sintetasi, che presenta, in
prossimità del sito catalitico per l’adenilazione, una tasca di controllo, formata da un profondo solco
nell’enzima, che consente di verificare il prodotto della reazione di adenilazione. L’AMP-valina o le forme
adenilate degli altri amminoacidi più piccoli dell’isoleucina possono essere accomodate in questo sito, nel
quale avviene l’idrolisi del legame con l’AMP e il rilascio dell’amminoacido “troppo piccolo”. L’ingombro
sterico del gruppo R dell’isoleucina, invece, impedisce l’entrata nel sito di controllo e conduce l’isoleucina al
processamento nel sito di sintesi.
Mutazioni del mt-tRNA possono, invece, causare serie malattia, come la MELAS (tRNA leucina), cioè
un’encefalomiopatia mitocondriale, con acidosi lattica ed episodi tipo ictus, o MiMyCa (tRNA lisina), cioè
un disordine durante la maternità, con miopatia e cardiomiopatia.

Riconoscimento codone-anticodone
L’orientamento della trascrizione produce mRNA diversi. Durante il processo di replicazione del DNA, si
possono verificare degli errori di polimerizzazione del secondo filamento. Questi errori (mutazioni),
possono avere un impatto sul fenotipo degli organismi, specialmente se esse si verificano all’interno della
sequenza del gene codificante di una proteina. I tassi di errore sono comunque molto bassi (1 errore ogni
10-100 milioni di basi), grazie alla capacità di correzione della DNA polimerasi. Il DNA mutato produce un
trascritto anch’esso mutato, con varie conseguenze che caratterizzano il tipo di mutazione: missenso, se
viene sostituito l’amminoacido codificato, o non senso, se si forma un codone di stop. Entrambe sono a
carico di singoli nucleotidi (mutazioni puntiformi) e possono condurre a importanti patologie ereditarie,
come la talassemia.

Mutazioni dei codoni


Le mutazioni frameshift sono dovute a delezioni (indel) o a inserzioni di un numero di nucleotidi non
divisibile per 3, comportando lo spostamento del modulo di lettura (frame) a valle della mutazione, quindi
si ha una codificazione di una sequenza amminoacidica non corrispondente a quella del trascritto
originario. La conseguenza è la produzione di proteine anomale o la mancata esportazione o traduzione
dell’mRNA mutato. Una grave malattia di questo tipo è la malattia di Tay-Sachs.
Sebbene la maggior parte delle mutazioni che comportano il cambiamento nelle sequenze proteiche siano
dannose o, al limite, neutre, alcune possono comportare un vantaggio all’organismo, consentendogli di
resistere a particolari stress ambientali meglio degli organismi wild-type. In questi casi, la mutazione
tenderà a diventare sempre più comune nella popolazione, attraverso la selezione naturale. I virus a RNA
hanno tassi di mutazione molto alti, consentendogli di evolvere rapidamente, permettendogli di poter
eludere le risposte difensive del sistema immunitario.
Un altro aspetto è l’interferenza clonale, che si determina quando in popolazioni con numerosi organismi a
riproduzione asessuata coesistono sottopopolazioni, ciascuna portante diverse mutazioni utili, che possono
competere fra loro.
Per soppressione intergenica, invece, si intende una mutazione che avviene a carico della sequenza di un
gene (soppressore) che reverte l’effetto di un’altra mutazione presente un altro gene. Nel caso di queste
mutazione sui tRNA, si verificano tipicamente nell’anticodone, in modo tale che il risultante tRNA traduca il
codone mutato in una proteina comunque funzionale. Un esempio di soppressione non senso è il
soppressore di su2 tRNA in E. Coli. Questa variante di tRNA2Gln mostra una sostituzione da G ad A nel suo

51
Giulia Mostini

anticodone così da riconoscere il codone di arresto UAG invece che il codone CAG normale, evitando un
arresto prematuro della sintesi proteica. I tRNA soppressori per mutazioni missenso sono, invece,
misacilati, cioè legati ad un amminoacido diverso da quello di riferimento dello specifico anticodone.
Mentre la soppressione missenso e non senso si verifica principalmente attraverso le sostituzioni di singoli
nucleotidi nell’anticodone, i tRNA che sopprimono i frameshift +1 contengono una base aggiuntiva
nell’anticodone. Questi soppressori leggono un codone a quattro nucleotidi, ripristinando la corretta
traslazione. Un altro tipo di tRNA soppressore è rappresentato da su9 di E. Coli, cioè una variante di tRNAtrp,
che conserva il suo anticodone CCA di tipo selvaggio, ma ha una variazione da G ad A nel suo braccio D.
Questa sostituzione porta a un tRNA con una maggiore flessibilità, che riconosce il suo codone UGG e,
attraverso un’insolita coppia AC nella terza posizione di anticodone, il codone di arresto UGA.
Diversi meccanismi si combinano per limitare l’inserimento dell’amminoacido mediato dalla soppressione,
che si verifica con una frequenza tra il 5 e il 50%, rispetto all’uso di codoni normali. I tRNA soppressori sono
tipicamente derivati da isoaccettori meno frequenti. Questo garantisce che la traduzione della maggior
parte dei codoni di senso non sia modificata significativamente. Per quanto riguarda i codoni di stop
soppressori, gli mRNA di tipo selvaggio contengono spesso codoni di stop in tandem, quindi anche se uno è
soppresso, l’altro porterà alla terminazione. Inoltre, i tRNA soppressori devono competere con i fattori di
terminazione per legare i codoni.

Accoppiamento vacillante (wobble pairing)


La regola vorrebbe che ogni anticodone si appaiasse
con il codone complementare, ma alcuni tRNA
riconoscono diversi codoni. Nel 1966, Crick propose il
concetto di appaiamento vacillante (wobble), per
spiegare questo fenomeno. Crick ipotizzò che la base
dell’estremità 5’ dell’anticodone non avesse requisiti di
appaiamento rigorosi come le altre basi adiacenti,
permettendo di formare legami idrogeni con basi in
contrasto con Chargaff. La base all’estremità 5’
dell’anticodone non subisce le stesse limitazioni
spaziali delle altre due, il che permette di formare
legami idrogeno con qualsiasi base posizionata all’estremità 3’ del codone.
Una coppia di basi di wobble è un accoppiamento tra due nucleotidi in molecole di RNA che non seguono le
regole delle coppie di basi di Watson e Crick. Le quattro principali coppie di basi wobble anticodone-codone
sono ipoxantina-citosina (I-C), ipoxantina-uracile (I-U), ipoxantina-adenina (I-A) e guanina-uracile (G-U), che
si ritrova a basi invertite sia sul codone sia sull’anticodone.
La stabilità termodinamica di una coppia di basi di wobble è paragonabile a quella di una coppia di basi di
Watson e Crick di cui mantengono la distanza e sono fondamentali anche nella stabilizzazione della
struttura secondaria dell’RNA, oltre che per la traduzione del codice genetico.
Nei tRNA, le tre basi dell’anticodone e quelle adiacenti nell’ansa dell’anticodone sono tutte orientate nella
stessa direzione stabilizzante da interazioni tra le superfici piatte delle basi impilate. In questa struttura, la
prima base dell’anticodone si trova all’estremità della pila e risulta meno limitata nei movimenti di quanto
non lo siano le altre due basi dell’anticodone, consentendo il suo vacillamento. Al contrario, la terza base
dell’anticodone (la prima del codone) si trova nella parte mediana della pila ed è sempre affiancata da una
voluminosa purina modificata, che ne fissa la posizione, evitando il tentennamento nella prima posizione
del codice.
Altri meccanismi che aumentano l’accuratezza della traduzione avvengono a carico dell’amminoacil-tRNA
inserito nel sito A. Nel caso di appaiamenti incorretti codone-anticodone si determina il rilascio
dell’amminoacil-tRNA non corretto. Inoltre, per catalizzare la reazione peptidiltransferasica, l’amminoacil-
tRNA, una volta caricato sul sito A, deve ruotare all’interno del centro peptidiltransferasico della subunità
maggiore, spostando l’estremità 3’ dell’amminoacil-tRNA (accomodamento). I tRNA che non sono appaiati
correttamente non riescono a mantenere il legame col codone durante la torsione e si dissociano dal
ribosoma.

52
Giulia Mostini

Formazione del complesso di inizio della traduzione


Nei procarioti, le sequenze dell’mRNA dei siti di legame al ribosoma, rivelate dal saggio di protezione da
digestione con endonucleasi dopo l’aggiunta dei ribosomi, dei tRNA di inizio e del GTP, mostrano una
sequenza consenso 5’-AGGAG-3’, sette nucleotidi a monte di AUG, chiamata sequenza Shine-Dalgarno, dai
nomi dei suoi scopritori. Questa sequenza è complementare all’estremità 3’ dell’rRNA 16S, costituente
della subunità 30S del ribosoma. Gli altri AUG che si possono trovare eventualmente seguendo altri reading
frames non presentano questa sequenza e non sono utilizzati per iniziare la sintesi proteica. Gli mRNA
policistronici contengono più sequenze Shine-Dalgarno in grado di indurre multipli inizi di traduzione.

Fattori d’inizio
Diverse proteine, dette fattori d’inizio, sono richieste per l’inizio della traduzione. Nei procarioti ce ne sono
tre: IF1, IF2 e IF3. Questi fattori interagiscono con la subunità minore del ribosoma e sono richiesti per
formare il complesso di inizio 30S. IF1 si lega alla subunità 30 S, contribuendo a formare il sito A del
ribosoma e determina, insieme a IF3, la dissociazione del ribosoma 70S. IF2, invece, è una GTPasi che
interagisce con la subunità 30S, favorendo l’associazione del tRNA di inizio (fMet-tRNAi) all’emisito P e
impedendo l’inserzione di altri tRNA carichi. IF3 contribuisce a determinare la specificità di legame della
subunità 30S al sito di inizio sull’mRNA e partecipa, con IF1, alla dissociazione del ribosoma 70S e mantiene
in forma isolata la subunità minore.
Per quanto riguarda l’inizio della traduzione procariotica, IF1 e IF3 spostano l’equilibrio verso la forma
dissociata delle due subunità. IF2 si lega alla subunità 30S in prossimità dell’emisito P, dove promuove
l’ingresso del tRNA di inizio. Quindi, l’mRNA si associa alla subunità 30S coadiuvata da IF3, grazie agli
appaiamenti tra la sequenza Shine-Dalgarno e l’rRNA 16S e tra il codone AUG e l’anticodone del tRNA di
inizio. Infine, i fattori IF1 e IF3 si distaccano e la subunità ribosomiale 50S si associa al complesso d’inizio
30S che rilascia IF2, generando il complesso di inizio 70S.
Negli eucarioti, i fattori proteici richiesti per l’inizio della traduzione eIF sono almeno 9, ma diventano 14 se
si considerano i fattori ausiliari. Essi sono costituiti principalmente da 30 subunità proteiche:
1. eIF1: lega la subunità 40S, controlla l’accuratezza del riconoscimento del codone AUG di inizio e
contribuisce, con eIF3, a impedire l’associazione prematura con la 60S.
2. eIF1A: promuove il legame di Met-tRNAmet alla subunità 40S e contribuisce con eIF3 all’interazione
di questa con l’mRNA.
3. eIF2: interagisce con Met-tRNAmet, formando il complesso ternetio Met-tRNAmet/eIF2/GTP.
4. eIF2B: catalizza lo scambio GTP/GDP per il riciclo di eIF2.
5. eIF3: lega la subunità 40S e ne promuove il legame con Met-tRNAmet e mRNA e impedisce
l’associazione della 60S prima che si formato il complesso di inizio 43S.
6. eIF4E: riconosce e lega il 5’cap.
7. eIF4F/eIF4G: costituisce un’impalcatura per l’assemblaggio di eIF4F, interagendo con eIF4E ed
eIF4A.
8. eIF4A: ha attività RNA elicasica ATP-dipendente.
9. eIF4B: stimola l’elicasi e lega simultaneamente eIF4F.
10. eIF5: Interagisce con il complesso di pre-inizio 43S (40S/Met-tRNAmet/eIF3/eIF2-GTP) e promuove
l’idrolisi del GTP, associato a eIF2.
11. eIF5B: Legato a GTP, recluta il complesso ternario Met-tRNAmet/eIF2/GTP sulla subunità 40S.
12. eIF6: lega la subunità 60S libera e impedisce la sua associazione con la 40S.
Negli eucarioti, la subunità minore del ribosoma interagisce inizialmente con l’estremità 5’CAP dell’mRNA
per procedere ad una scansione lungo la regione del mRNA (tra TSS e AUG) trascritta ma non tradotta
(UTR), fino a trovare il primo AUG, che verrà utilizzato come codone di inizio della traduzione. Negli
eucarioti sono presenti due tRNA per la metionina, uno utilizzato all’inizio (tRNAimet) e un altro (tRNAmet) che
incorpora metionina nella fase di allungamento della catena proteica. In alcuni virus e mRNA eucariotici si
ha un inizio indipendente dal CAP, in cui la subunità minore lega una sequenza IRES interna da cui procede
per scansionare fino al primo AUG.

53
Giulia Mostini

Complesso di pre-inizio e d’inizio negli eucarioti


Nella formazione del complesso di pre-inizio 43S, i fattori eIF3 e eIF1 favoriscono la dissociazione del
ribosoma intero 80S nelle due subunità e stabilizzano il complesso d’inizio, in maniera analoga ai fattori IF3
e IF1 dei procarioti. I due fattori eIF2 ed eIF5 sono necessari per il reclutamento del tRNA d’inizio sulla
subunità 40S. In particolare, eIF2 interagisce direttamente con Met-tRNAi insieme al GTP.
Contemporaneamente, l’mRNA è associato dal fattore eIF4 composto dalle subunità eIF4A, B, E, G. eIF4A, E,
G costituiscono l’intermedio eIF4F, che lega l’mRNA in prossimità del CAP (E è chiamato CAP binding
protein). L’associazione tra il complesso di pre inizio 43S e il complesso eiF4F/mRNA costituisce il
complesso d’inizio 48S che incomincia la scansione dell’mRNA per il codone d’inizio.
A causa della lunghezza variabile del 5’-UTR, la scansione richiede l’assistenza di meccanismi volti ad
eliminare le strutture secondarie dell’mRNA che si possono formare per appaiamento tra basi
complementari. A questo scopo agiscono come elicasi i fattori eIF4A e B. Il primo è una RNA elicasi della
famiglia delle proteine DEAD, mentre il secondo agisce da attivatore dell’attività eIF4A. Raggiunto il primo
AUG, non necessariamente si inizia a tradurre da questo. Nel 5% dei casi, la subunità 48S continua la
scansione eventualmente saltando più AUG per iniziare più a valle. Elemento importante nel
riconoscimento dell’AUG di inizio è la presenza di una sequenza tipica (RNNAUGG), chiamata sequenza di
Kozak (R è una purina). Alla subunità 48S, associata al corretto AUG e liberata dai fattori eIF2 e 3, si lega la
60S liberata a sua volta del fattore di blocco eIF6. Segue il rilascio dei rimanenti fattori di inizio con l’idrolisi
di GTP da parte di eIF5B analogo del fattore procariotico IF2.
Almeno 6.000 geni umani esprimono mRNA con esoni 5’-UTR alternativi e TSS alternativi.
Il controllo dell’inizio della traduzione, inoltre, è mediato da TOR.

Meccanismi di re-innesco
Il fattore eIF4F, associato alla subunità 40S, rimane connesso al CAP al 5’ mRNA durante la scansione,
formando un’ansa che arriva fino al codone d’inizio. Così, quando la subunità 40S lega la 60S e rilascia eIf4F,
questo è già in sede per legare una nuova subunità 40S.
PABP è una proteina che associa, come multimero, la coda di poli(A) all’estremità 3’ degli mRNA. PABP
interagisce anche con il fattore di inizio eIF4G reclutato all’estremità 5’ dello stesso mRNA. Questa
interazione porta a contatto le due estremità dell’mRNA, che assume una configurazione circolare. In
questo modo i ribosomi che terminano la traduzione e si staccano al 3’ dell’mRNA si ritrovano in prossimità
del 5’ per un nuovo ciclo.

Allungamento e terminazione della sintesi proteica


Iniziata la traduzione, il ribosoma incorpora amminoacidi, seguendo la sequenza di codoni presenti
sull’mRNA. L’allungamento della catena si svolge in tre passaggi:
1. L’amminoacil-tRNA corretto viene caricato nel sito A, seguendo le regole dell’appaiamento codone-
anticodone.
2. Il centro peptidiltransferasico catalizza la formazione
del legame peptidico tra l’amminoacil-tRNA presente
nel sito A e la catena peptidica legata al peptidil-tRNA
nel sito P. La catena polipeptidica nascente del sito P si
trasferisce sul tRNA del sito A.
3. Il peptidil-tRNA presente nel sito A viene trasferito al
sito P, scorrendo di una tripletta sull’mRNA e così,
disponendo il codone successivo nel sito A, pronto per
incorporare un altro amminoacido.
Nei batteri, il ribosoma legge 50 nt di mRNA al secondo (18
amminoacidi), mentre nei mammiferi la traduzione procede a
10 amminoacidi al secondo.

54
Giulia Mostini

Fattori di allungamento
Due fattori proteici (Tu e G), conservati dai procarioti, negli eucarioti sono necessari per il compimento dei
processi di allungamento. L’amminoacil-tRNA viene legato all’estremità 3’ dal fattore EF-Tu (eEF-1 negli
eucarioti), che accompagna l’aatRNA.
EF-Tu previene l’attacco dell’amminoacido legato al tRNA al peptide sul sito P e riconosce un amminoacil-
tRNA solo quando è legato al GTP. Una volta alloggiato sul ribosoma, il contatto con una tasca specifica
della subunità maggiore induce l’attività GTPasica di EF-Tu, che idrolizza il GTP a GDP. Legato a GDP, EF-Tu
si distacca dall’amminoacil-tRNA, che rimane sul sito A con l’amminoacido ora disponibile alla formazione
del legame peptidico. Solo un appaiamento corretto codone-anticodone permette a EF-Tu, legato
all’amminoacil-tRNA, di interagire con il sito di legame del fattore sul ribosoma e di attivare l’idrolisi di GTP
col conseguente distacco del fattore del tRNA. Al contrario, appaiamenti scorretti comportano
l’allontanamento del complesso amminoacil-tRNA EF-Tu del sito A.
L’ingombro di EF-Tu è ragguardevole e maschera completamente l’amminoacido legato al tRNA. La ricina
interferisce col legame tra il ribosoma e EF-Tu in un sito chiamato sarcin-ricin loop.

Catalisi del legame peptidico e traslocazione


Il meccanismo di catalisi del sito peptidiltransferasico non è certo. E’ probabile un meccanismo di catalisi
entropica, in cui il ruolo fondamentale dell’enzima consiste nell’avvicinare opportunamente i siti reattivi dei
substrati. L’interazione tra le basi dell’rRNA 23S e le estremità CCA dei tRNA presenti nei siti A e P
contribuisce ad avvicinare il gruppo amminico dell’amminoacil-tRNA al gruppo carbossilico del polipeptide
legato al peptidil-tRNA. E’ stato anche ipotizzato che un processo di catalisi favorita dal substrato
contribuisca ad accelerare la reazione. In particolare, potrebbe avvenire un proton shuttle, cioè la molecola
protona un sito di un’altra molecola, mentre si deprotona in un altro gruppo.
Il gruppo OH al 2’ del tRNA del sito P funzionerebbe con questo sistema, donando un idrogeno al 3’-OH del
peptidil-tRNA e accettando un protone dal gruppo amminico dell’amminoacido legato al tRNA nel sito A.
Dopo il trasferimento della catena polipeptidica al tRNA nel sito, il tRNA nel sito P si sposta nel sito E ed il
tRNA nel sito A, a sua volta, va nel sito P. Quindi, l’mRNA procede nel
solco di tre nucleotidi, esponendo il codone successivo. Questi processi
compongono la fase di traslocazione dell’allungamento della traduzione
e comportano cambiamenti coordinati della struttura del ribosoma.
La traslocazione, infatti, comporta una rotazione antioraria della
subunità minore, rispetto alla maggiore, che porta ad una struttura
transitoria, detta stato ibrido, in cui le estremità 3’ dei tRNA si sono
spostate in una nuova posizione, mentre gli anticodoni sono rimasti sui
codoni nelle posizioni precedenti.
Per completare la fase di allungamento, un secondo fattore (EFG nei procarioti, EF2 negli eucarioti), nella
forma legata al GTP, si associa al ribosoma. Questa interazione stabilizza lo stato ibrido del ribosoma,
caratterizzato dai siti A, E, P comunicanti, stimolando l’idrolisi del GTP da parte di EFG. Quest’ultimo, ora
legato a GDP, induce un cambiamento nella struttura dei siti A e P e arriva a contattare il centro di
decifrazione del sito A. Il tRNA precedentemente posizionato nel sito A viene così scalzato nel sito P, che, a
sua volta, sposta il tRNA dal sito P al sito E. Questi scorrimenti dei tRNA in sequenza, trascinano l’mRNA che
avanza di un codone. Quindi, con una rotazione in senso orario della subunità minore, il ribosoma torna alla
struttura dalla bassa affinità per EF-G legato al GDP. L’EF-G rilasciato riporta il ribosoma allo stato “classico”
o “chiuso”, in cui tRNA e mRNA sono strettamente associati alla subunità minore. i siti A, P ed E si sono
separati.

Fattori di rilascio e terminazione


Il ciclo di allungamento si ripete fino a quando l’mRNA non presenta un codone di stop. Alloggiati sul sito A,
i codoni di stop vengono riconosciuti da fattori proteici di rilascio, RF, tutti dipendenti da GTP, che attivano
la scissione del polipeptide dal peptidil-tRNA. Esistono due classi di RF:
1. Classe I: riconoscono i codoni di stop mediante una regione definita codone peptidico e inducono il
distacco della catena polipeptidica dal tRNA nel sito P. I procarioti possiedono due fattori di rilascio

55
Giulia Mostini

di classe I, detti RF1 e RF2. Il fattore RF1 riconosce il codone di stop UAG, mentre RF2 riconosce
UGA. Il terzo codone di stop, UAA,viene riconosciuto da entrambi. Negli eucarioti è presente solo il
fattore eRF1, che li riconosce tutti e tre.
2. Classe II: stimolano la dissociazione dei fattori di classe I dal ribosoma dopo il rilascio della catena
polipeptidica. Questo fattore è RF3 nei procarioti ed eRF3 negli eucarioti.
Dopo che il polipeptide e RF3 si sono dissociati, il ribosoma è ancora legato all’mRNA e ai due tRNA nei siti P
ed E. Nelle cellule procariotiche interviene un fattore, chiamato fattore di riciclaggio del ribosoma (RRF),
che agisce insieme a EF-G e IF3 per riciclare il ribosoma. RRF si lega al sito A vuoto del ribosoma, grazie alla
sua struttura simile a un tRNA. RRF, inoltre, recluta EF-G-GTP, che stimola il rilascio di tRNA non carichi dai
siti P ed E. Infine, l’associazione del fattore d’inizio IF3 contribuisce a separare le due subunità del
ribosoma, che sono disponibili per un nuovo ciclo di traduzione.
Per quanto riguarda il bilancio energetico, nella fase iniziale si consuma una molecola energetica per
assemblare il ribosoma e due per l’attivazione del tRNA. Nell’allungamento se ne consumano 2 per il
caricamento di ogni tRNA e altre due per l’incorporazione di ogni amminoacido. Nella terminazione, infine,
si consumano due molecole per la dissociazione delle subunità ribosomiali.

Antibiotici che bloccano la traduzione


La puromicina è una molecola, la cui struttura è simile all’estremità del braccio accettore del tirosil-tRNA.
Questa somiglianza permette alla puromicina di entrare nel sito A della subunità maggiore. Questa catalizza
il trasferimento della catena polipeptidica nascente sulla puromicina, che, mancando della restante parte
strutturale dell’interno tRNA, non mantiene il contatto con il ribosoma e viene rilasciata, causando una
terminazione prematura della traduzione. Essa inibisce sia gli eucarioti sia i procarioti.
La streptomicina, invece, interagisce con la subunità minore del ribosoma procariotico, bloccando la sintesi
proteica in elevate quantità, essendo che inibisce la transizione del complesso di inizio a fase di
allungamento.
Il cloramfenicolo, inoltre, lega la subunità maggiore procariotica, bloccando l’attività peptidil transferasica e
quindi il trasferimento del peptide nascente all’amminoacil-tRNA. Infine, la tetraciclina inibisce nei
procarioti il legame dell’amminoacil-tRNA al sito A.

Modifiche post-traduzionali delle proteine


La catena polipeptidica appena sintetizzata dal ribosoma assume la conformazione corretta, ripiegandosi a
formare le strutture necessarie alla propria funzione. Eventualmente, in questo processo, la proteina viene
associata da vari cofattori, coenzimi o gruppi prostetici, tagliata in frammenti, spostata in specifici
compartimenti cellulari o complessata con interattori specifici di un sistema multiproteico. Molte proteine
vanno anche incontro a modificazioni covalenti di residui amminoacidici specifici, le cosiddette
modificazioni post-traduzionali.
Alcune proteine raggiungono la struttura definitiva dopo la sintesi in modo autonomo. Per molte altre,
invece, è necessario l’intervento di proteine accessorie, chiamate chaperoni, che guidano il corretto
avvolgimento della catena polipeptidica fuoriuscente dal ribosoma nella struttura ottimale.
La famiglia di chaperoni (heat shock protein) Hsp70 agisce in più cicli di interazione, fino a foldare
correttamente la proteina neosintetizzata. Hsp70 riconosce un tratto di amminoacidi idrofobici sulla
superficie della catena polipeptidica nascente sul ribosoma. Aiutate da una serie di chaperoni più piccoli
(Hsp40), grazie all’idrolisi di ATP, multimeri di Hsp70 si legano a regioni più estese della proteina bersaglio,
forzandone la struttura, quindi il legame è rilassato dopo che Hsp40 si dissocia con rilascio di ADP. Cicli
ripetuti di attacco e rilascio delle proteine HSP aiutano il ripiegamento della proteina bersaglio.
MtHSP70 è la forma mitocondriale di Hsp70, coinvolta nel folding delle proteine importate dal macchinario
TOM/TIM dal citoplasma all’interno della matrice mitocondriale.
Proteine rilasciate dal ribosoma, ripiegate in modo scorretto o parzialmente denaturate vengono catturate
dal complesso della chaperonina, tramite interazioni idrofobiche con il canale di ingresso al core della
chaperonina. Segue il legame di ATP e di una proteina coperchio (GroES), che costringe la proteina a
strutturarsi in un spazio chiuso, eventualmente ripristinando la conformazione corretta. Dopo pochi
secondi, l’idrolisi dell’ATP indebolisce il legame del coperchio, che viene rilasciato con la proteina bersaglio

56
Giulia Mostini

rinaturata. Questo tipo di chaperone molecolare è noto anche come GroEL nei batteri, Hsp60 nei
mitocondri e TCP1 nel citoplasma delle cellule dei vertebrati.
Proteine non foldate correttamente e che non vengono degradate formano aggregati che disturbano le
funzioni cellulari e causano patologie.

Processo di ubiquitinazione
L’ubiquitina è una piccola proteina (76 residui amminoacidici), espressa in tutte le
cellule eucariotiche, il cui nome deriva dalla distribuzione ubiquitaria. Essa viene
coniugata covalentemente a specifiche proteine cellulari, mediante una reazione ATP
dipendente, che porta alla condensazione del residuo carbossi-terminale
dell’ubiquitina con specifici gruppi amminici di residui di lisina della proteina
bersaglio, formando un legame isopeptidico. Questo meccanismo consiste
nell’effettuare una modifica covalente delle proteine, che vengono legate con un
enzima e modificate con l'aggiunta di ubiquitina per essere etichettate e indirizzate
verso la degradazione nel citosol. Si tratta quindi di una modifica post-traduzionale
con significato negativo.
L’ubiquitina ha una sequenza e un ripiegamento conservati, con la lisina in posizione
48 e l'estremità carbossi-terminale molto accessibile perché è separata dal resto della proteina globulare.
Per realizzare questo processo è necessario avere un meccanismo selettivo per le differenti proteine
cellulari, per cui non vi è un solo enzima che svolge la reazione, dato che se no esso dovrebbe ospitare nel
sito attivo tutte le proteine della cellula e perderebbe la caratteristica
di essere specifico.
E1 è il primo enzima che catalizza la prima reazione e che ospita
l’ubiquitina nel suo sito attivo. E1 ha un gruppo SH legato, cioè un
residuo di cisteina che si lega al gruppo carbossi-terminale
dell'ubiquitina. In questo caso, deve essere sintetizzato un legame con
consumo di ATP. Dopo ciò, l'ubiquitina è legata all’enzima E1.
Il secondo passaggio è il trasferimento dell'ubiquitina dal sito attivo di
E1 al sito attivo di E2, in modo da generare un’amplificazione della
diversità di E2 che la cellula si trova a disposizione. Non viene
consumata energia perché il legame formato è sempre lo stesso di
prima, cioè un legame tioestere (come per acetil CoA).
L'enzima E3 riconosce la proteina da degradare, quindi è in grado di
ospitarla nel suo sito attivo, oltre ad entrare a contatto con E2 che
porta l’ubiquitina, la quale viene trasferita su un residuo di lisina della
proteina da eliminare, che ha un gruppo N libero.
Viene quindi a formarsi un legame isopeptidico tra il carbossi-
terminale di ubiquitina e la lisina inserita nella sequenza
amminoacidica.
Le cellule in questa maniera controllata riescono ad etichettare le
proteine non ancora degradate. A questo punto, però, non si ha
ancora l'intero segnale di degradazione perché la proteina, per essere
riconosciuta, deve possedere almeno 4 molecole di ubiquitina: si
legano covalentemente in una coda di poliubiquitine, che può essere
anche più lunga. Il legame covalente che viene sintetizzato lega
un'ubiquitina con il gruppo carbossilico attivato con il residuo di lisina
48 di un’altra ubiquitina. Questa catena è il segnale di riconoscimento
per la proteina, la quale viene riconosciuta da un grosso assemblaggio,
detto proteasoma. Il proteasoma è una struttura cilindrica proteica
con un cappuccio superiore e uno inferiore (lid) che ne chiudono
l'ingresso (19S) e un core centrale (26S). Non è un organello, ma
semplicemente un grande assemblaggio di proteine.

57
Giulia Mostini

Il processo è ATP dipendente, in quanto le subunità del proteasoma hanno siti di interazioni per l’ATP in cui
avvengono variazioni conformazionali che aiutano la degradazione. A questo punto, la coda di
poliubiquitina viene demolita in singole ubiquitine che ritornano a svolgere il loro lavoro di etichettatura,
mentre la proteina da degradare viene frammentata. I frammenti di proteina dovranno subire un’ulteriore
degradazione tramite le peptidasi per avere singoli amminoacidi.

La sumoilazione
Negli eucarioti possono essere aggiunti a residui di lisina diversi tipi di piccoli peptidi (10 differenti),
chiamati UbI. Uno di questi peptidi è il SUMO (Small Ubiquitin like Modifier), la cui aggiunta a proteine
bersaglio svolge un ruolo rilevante in diversi processi cellulari.
Nei mammiferi sono noti 4 tipi di SUMO di circa 100 amminoacidi di lunghezza. La coniugazione di SUMO
alle proteine segue passaggi simili a quelli dell’ubiquitinazione e coinvolgono gli enzimi E1, E2, E3. La lisina
sumoilata si riscontra frequentemente inserita nella sequenza yKxE, con y residuo idrofobico, K lisina, x
amminoacido qualsiasi, E acido glutammico.

Metilazione e acetilazione
L’acetilazione è un processo in cui vengono aggiunti gruppi acetili, grazie all’acetil-CoA. La sorgente di acetili
nel citosol è il citrato, che esce dai mitocondri ed è convertito dalla ATP citrato liasi. Il sito in cui avviene il
legame è il residuo di lisina o in generale l’estremità N-terminale degli amminoacidi. L’enzima che effettua
ciò è il NAT, la reazione inversa è la deacetilazione.
La metilazione, invece, è l’aggiunta di gruppi metilici, in cui il donatore è il SAM o la S-adenosilmetionina.
L’enzima che catalizza la reazione è la metil-transferasi e la reazione inversa è la demetilazione a carico
delle demetilasi.
Altri due eventi possibili sono la fosforilazione, cioè l’aggiunta di gruppi fosfato, e l’idrossilazione, cioè
l’aggiunta di gruppi OH.

Domini di riconoscimento e regolazione


L’istone H3 ha una coda N-terminale flessibile che contiene diversi siti che possono essere fosforilati,
metilati o acetilati. Una volta modificati, essi vengono riconosciuti da diversi domini proteici, come proteine
14-3-3, cromodomini, domini TUDOR, WD40 e bromodomini.
Il dominio C-terminale (CTD) della RNA Pol II umana contiene 52 ripetizioni di una sequenza di heptad
(YSPTSPS). Questa sequenza ha diversi potenziali siti di fosforilazione, di cui la serie 2 e 5 sono i più
conosciuti. La loro fosforilazione permette al CTD di reclutare fattori che contengono WW, BRCT, CID, FF o il
dominio della guaniltransferasi della subunità Cgt1 dell’enzima mRNA-capping.
In condizioni di normale disponibilità di ossigeno (normossia), il fattore trascrizionale HIF1α viene
idrossilato nelle proline 402 e 546 dall’enzima PHD e per queste modificazioni viene riconosciuto e
ubiquitinato da VHL, quindi degradato nel proteasoma. L’idrossilazione dell’aspargina 806 da parte di FIH-1,
inoltre, compromette l’interazione del fattore con i coattivatori dell’espressione genica CBP/P300.
L’ipossia, invece, blocca l’idrossilazione e la degradazione proteasomica di HIF1α, inducendone l’accumulo e
la traslocazione nucleare. All’interno del nucleo, esso forma l’eterodimero con HIF1β e attiva l’espressione
dei geni in risposta all’ipossia, interagendo con i cofattori trascrizionali CBP/P300, CDK8, TIP60 e Pol II.

Fosforilazione e trasduzione del segnale


La fosforilazione è una modificazione frequentemente usata per la regolazione della funzione proteica nelle
cellule eucariotiche, che avviene a carico solo di serina, treonina e tirosina. Questi amminoacidi hanno un
gruppo nucleofilo (-OH), che attacca il gruppo fosfato terminale (γ-PO32-) sul donatore universale di fosfato
ATP, con conseguente trasferimento del gruppo fosfato alla catena laterale dell’amminoacido.
Questo trasferimento è facilitato dal magnesio (Mg2+), che chela i gruppi fosfato γ e β, abbassando la soglia
energetica per il trasferimento del fosfato al gruppo OH. Questa reazione è unidirezionale, a causa della
grande quantità di energia libera che viene rilasciata quando il legame fosfato in ATP si rompe a formare
ADP.

58
Giulia Mostini

La pathway della chinasi ciclina dipendente CDK coinvolge una serie di complessi formati dalle cicline e
chinasi ad esse associate e controlla il ciclo cellulare. Questa via coinvolge anche repressori, come le
proteine 16 e 21, a sua volta indotta da p53, e attivatori. Tra quest’ultimi ci sono le CDK, alcune delle quali
sono state identificate in cellule di mammifero, ciascuna associata a specifiche cicline. CDK 4, in particolare,
fosforila la proteina RB inibitoria di E2F, inducendo la trascrizione di geni coinvolti nella fase S del ciclo
cellulare.
Nella via di Ras per la trasduzione del segnale, il ligando extracellulare (fattore di crescita) si lega al TRK.
Questo si autofosforila in specifici residui di tirosina, riconosciuti da SOS. Quest’ultimo induce Ras (piccola
proteina ancorata sotto la membrana cellulare, a seguito di una miristilazione) a scambiare il proprio GDP
con GTP. RAS-GTP attiva Raf, che attiva MEK, che attiva MAPK, che infine arriva un fattore di trascrizione,
come Myc.
Diversi recettori utilizzano gli stessi componenti della cascata di segnalazione intracellulare. La specificità di
risposta ai diversi stimoli e tra le diverse cellule è generata dalla complessità del network di trasduzione e
dall’espressione quantitativa, tessuto specifica dei diversi componenti, inclusi adattatori come Shc, che
svolgono la funzione di centri di aggregazione per varie vie.

Tecniche di biotecnologia
DNA ricombinante
Le molecole di DNA ricombinante (rDNA) sono molecole di DNA create in laboratorio attraverso metodi di
ricombinazione genetica, come il clonaggio molecolare, per comporre materiale genetico di origine diversa,
creando sequenze artificiali che non sono presenti nei genomi naturali. Il DNA ricombinante in un
organismo vivente fu ottenuto per la prima volta nel 1973 da Boyer, dell’università della California a San
Francisco, e Cohen, dell’università di Stanford, usando enzimi di restrizione di E. Coli, per inserire DNA
estraneo nei plasmidi.
Il clonaggio molecolare (molecular cloning) è il processo mediante cui le molecole di DNA ricombinate
vengono prodotte, trasformate e replicate in un organismo ospite. Un protocollo di molecular cloning ha
due componenti fondamentali: il frammento di DNA di interesse da moltiplicare e un vettore/plasmide che
contenga tutti i componenti per la replicazione in un ospite. Il DNA di interesse, come un gene, uno o più
elementi regolatori o un operone è preparato per la clonazione, asportandolo dal DNA sorgente, usando
enzimi di restrizione, o copiandolo, usando la PCR (Polymerase Chain Reaction), o assemblandolo da singoli
oligonucleotidi (DNA sintetico). Anche il vettore plasmidico viene preparato a interagire con il DNA da
clonare in forma lineare, usando enzimi di restrizione o PCR. Unendo fisicamente il DNA di interesse al
vettore plasmidico, mediante ligasi, il DNA da clonare diventa parte del nuovo plasmide ricombinante ed è
replicato nell’ospite.

Enzimi di restrizione
Il primo enzima di restrizione fu isolato 50 anni fa, dal microbiologo svizzero Werner Arber, che vinse il
premio Nobel nel 1978 in Fisiologia e Medicina. Egli scoprì gli enzimi di restrizione, mentre studiava un
fenomeno noto come “restrizione dei batteriofagi controllata dall’ospite”. Prima del lavoro di Arber, Luria e
Human avevano dimostrato che i vari fagi sopravvivono ciascuno in uno specifico ceppo batterio e non in
altri. Si diceva che quei fagi negli altri ceppi fossero “ristretti” dal loro ospite. Per spiegare questo
fenomeno, Arber propose che le cellule batteriche fossero in grado di proteggersi contro il DNA estraneo
attraverso un meccanismo di difesa genetica, catalizzato da enzimi. Questi enzimi riconoscevano i fagi come
estranei, scindendo il loro DNA e limitandone la crescita. Arber e Linn si riferivano all’enzima responsabile
di questa scissione endonucleolitica, come endonucleasi R, successivamente EcoB.
Fin dalle prime ricerche, gli scienziati hanno isolato più di 800 diversi enzimi di restrizione dai batteri, che
complessivamente riconoscono e tagliano più di 100 diversi siti di restrizione. La maggior parte dei siti di
restrizione è lunga da 4 a 6 basi e la maggior parte è palindroma.
Le prime tre lettere del nome di un enzima di restrizione sono le abbreviazioni della specie batterica da cui
l’enzima è stato isolato (Eco- per E. Coli), e la quarta lettera rappresenta il particolare ceppo batterico.
Anche i numeri romani sono usati come parte del nome quando più di un enzima di restrizione è stato
isolato dallo stesso ceppo batterico. Oggi gli scienziati riconoscono tre categorie di enzimi di restrizione:

59
Giulia Mostini

1. Tipo I: riconosce specifiche sequenze di DNA, ma lo taglia in siti apparentemente casuali che
possono essere lontani fino a 1.000 paia di basi dal sito di riconoscimento.
2. Tipo II: riconosce e taglia direttamente all’interno del sito di riconoscimento.
3. Tipo III: riconosce sequenze specifiche, ma fa il taglio in una posizione specifica diversa che si trova
a 25 paia di basi dal sito di riconoscimento.
Come postulato da Arber, tutti gli enzimi di restrizione servono allo scopo di difesa contro virus invasori. I
batteri proteggono il DNA, modificando le proprie sequenze di riconoscimento, di solito aggiungendo metili
ai nucleotidi e facendo affidamento sulla capacità degli enzimi di restrizione di riconoscere e tagliare solo
sequenze di riconoscimento non metilate. Come sospettato da Arber, i batteriofagi che sono stati
precedentemente replicati in un particolare ceppo batterico ospite e sopravvissuti sono similmente
modificati con nucleotidi marcati con metili e quindi protetti dalla scissione all’interno dello stesso ceppo.
L’analisi del DNA per elettroforesi su gel d’agarosio è fondamentale: per prima cosa si prepara il gel e i
campioni da analizzare, che vengono poi caricati nei pozzetti del gel. A questo punto si determina la curva
standard per le dimensioni dei frammenti di DNA, che vengono successivamente colorati con bromuro di
etidio. Ne viene misurata la distanza percorsa dal pozzetto e la separazione dei frammenti di DNA tramite
elettroforesi.

Vettori di espressione
Il passaggio finale nella ricostruzione di un DNA
ricombinante è il collegamento del DNA dell’inserto
(gene o frammento di interesse) al backbone
fosfodiesterico di un plasmide/vettore ricevente.
Questa reazione, chiamata ligazione, viene eseguita
utilizzando l’enzima ligasi del DNA. La maggior parte
degli enzimi di restrizione digerisce il DNA in modo
asimmetrico attraverso la sequenza di riconoscimento, il che si traduce in una sporgenza a singolo
filamento all’estremità digerita del frammento di DNA. Le sporgenze, chiamate “sticky ends” consentono al
vettore e all’inserto di legarsi l’un l’altro. Quando le estremità adesive sono compatibili, cioè le coppie di
basi sovrastanti sul vettore e sull’inserto sono complementari, le due molecole di DNA si connettono e
vengono fuse dalla ligasi.
La ligasi del DNA del batteriofago T4 è la ligasi più comunemente usata. Essa può legare estremità sticky o
blunt del DNA, oligonucleotidi e ibridi di RNA ed RNA-DNA, ma non acidi nucleici a singolo filamento. Con le
estremità blunt-end ha un’efficienza maggiore della ligasi del DNA di E. Coli. A differenza di quest’ultima, la
ligasi del T4 non può usare il NAD, ma dipende da ATP come cofattore.
Un vettore di clonaggio deve avere determinate caratteristiche: l’origine di replicazione, che gli permetta di
replicarsi autonomamente una volta introdotto nella cellula ospite; selection marker, che permetta di
individuare le cellule che contengono il vettore; siti di restrizione unici, per poter inserire all’interno del
vettore diversi frammenti di restrizione.

Trasformazione
La trasformazione è il processo mediante cui un organismo acquisisce il DNA esogeno. Può avvenire in due
modi. La trasformazione naturale descrive
l’assorbimento e l’incorporazione del DNA nudo
nell’ambiente naturale della cellule, mentre la
trasformazione artificiale comprende una vasta
gamma di metodi per indurre l’assorbimento di DNA
esogeno. Nei protocolli di clonazione, quest’ultima
viene usata per introdurre il DNA ricombinante nei
batteri ospiti (E. Coli). Il metodo più comune di
trasformazione artificiale di batteri comporta l’uso di
cationi bivalenti (CaCl2) per aumentare la permeabilità
della membrana del batterio, rendendoli

60
Giulia Mostini

chimicamente competenti, aumentando così la probabilità di acquisizione del DNA.


Un altro metodo di trasformazione artificiale è l’elettroporazione, in cui le cellule sono scioccate con una
corrente elettrica, per creare fori nella membrana batterica. Con una membrana cellulare compromessa, il
DNA trasformante è libero di passare nel citosol del batterio. Quando avviene lo shock elettrico, i
componenti della membrana cellulare diventano polarizzati, sviluppando una differenza di potenziale
attraverso la membrana. Se questa supera il livello di soglia (4.000-8.000 Volt per cm), la membrana
cellulare si rompe in aree localizzate, diventando permeabile. La permeabilità indotta è reversibile se le
condizioni elettriche sono entro un limite, altrimenti si verificano cambiamenti irreversibili nella membrana
cellulare, letali per la cellula.
I trasformanti possono essere selezionati tramite antibiotici, come nel caso dell’ampicillina, cioè un
citostatico che interferisce con la sintesi della parete cellulare.

Clonaggio nel gene LacZ e selezione dei suoi trasformanti


La serie pBluescript fa parte della classe di vettori Phagemid o Phasmid con duplici origini di replicazioni
(batteriche e fagiche) che rendono il vettori in grado di replicarsi sia nei batteri come plasmide sia di essere
impaccato come singolo filamento nei capsidi virali. Questo vettore ha un’altra importante caratteristica:
contiene siti degli enzimi di restrizione utili per inserirvi frammenti di DNA, localizzati in una regione
(multiple cloning site – MCS o polylinker) all’interno della sequenza codificante del gene LacZ.
I batteri trasformati con vettori contenenti il gene della β-galattosidasi (lacZ) vengono piastrati in presenza
di X-gal e IPTG. Il primo viene scisso dall’enzima, producendo galattosio e 5-bromo-4-cloro-3-idrossindolo,
che è ossidato in un composto blu insolubile. L’IPTG inibisce il repressore del promotore di lacZ e ne induce
l’espressione. Quindi, i batteri che conterranno il vettore ricombinante con il frammento esogeno inserito
all’interno della sequenza codificante lacZ risulteranno lacZ difettivi e formeranno colonie bianche che
possono essere isolate e amplificate.

Vettori di sostituzione e di espressione


Le molecole di DNA possono essere impacchettate nel capside del fago lambda solo se si raggiunge una
distanza di 45-50 kpb tra le due sequenze terminali cos. Sono stati costruiti dei plasmidi che, oltre ai tipici
marcatori selettivi e alle regioni di clonaggio con i siti degli enzimi di restrizione, contengono una parte del
DNA di lambda con il sito cos. Questi vettori di clonaggio sono chiamati cosmidi perché, grazie ai siti cos,
possono essere impacchettati all’interno di un capside fagico e, dopo l’infezione con E. Coli, possono essere
selezionati e mantenuti all’interno delle cellule infettate, come dei plasmidi.
Per produrre specifiche proteine in sistemi di coltura batteriche, invece, si rende necessario utilizzare
vettori di espressione specializzati, che garantiscono un’elevata espressione di un gene clonato. I vettori di
espressione batterici, tipicamente, possiedono due elementi necessari per l’espressione genica: un
promotore forte, in quanto più mRNA viene prodotto più prodotto proteico verrà sintetizzato, e un sito di
legame per i ribosomi vicino a un codone di inizio ATG.
E’ vantaggioso mantenere il gene clonato represso fino al momento in cui deve essere espresso, per cui
promotori inducibili sono posti a monte della cassetta di inserzione della sequenza codificante che si vuole
far esprimere. Infatti,le proteine eucariotiche prodotte in grandi quantità possono risultare tossiche per i
batteri. Anche se esse non sono tossiche di per sé, possono accumularsi fino a raggiungere livelli tali da
interferire con la crescita delle cellule batteriche. Un’altra caratteristiche è la sintesi di proteine di fusione: i
vettori di espressione contengono utili sequenze codificanti a monte o a valle del sito di restrizione di
clonaggio che aiuta la purificazione (siti di legame a reagenti) o il riconoscimento Tag della proteina da
produrre.
Vettori di espressione specifici sono stati sviluppati per poter esprimere proteine ricombinanti in diversi
sistemi:
• E. Coli: l’espressione delle proteine in E. Coli è il metodo più semplice, rapido ed economico per
produrre centinaia di μg di proteina per ml di coltura.
• Lievito: S. cerevisiae e Pichia pastoris sono solitamente usati, possono essere coltivati a densità
molto elevate, il che li rende utili per la produzione di proteine marcate con isotopi, come studi
NMR. Ad esempio, I classici vettori plasmidici per il lievito sono Ylp, YRp, YEp, YCp. Tutti e 4

61
Giulia Mostini

contengono un marcatore di selezione, ma i primi non hanno un’origine di replicazione, mentre gli
altri tra hanno un’origine che corrisponde a un’origine cromosomica. Questi permettono il
clonaggio dei frammenti di DNA da poche centinaia di basi fino a un massimo di 10-20 kpb, mentre i
vettori Yeast Artificial Chromosome permettono il clonaggio di frammenti grandi fino a 500-1.000
kpb.
• Cellule di insetto infettate da baculovirus: le cellule di insetto sono in grado di effettuare modifiche
post-traduzionali più complesse rispetto a batteri e lieviti. Hanno anche migliori macchinari di
folding delle proteine dei mammiferi, quindi offrono migliori possibilità di ottenere proteine solubili
di origine mammifera. Gli svantaggi sono i costi elevati e i tempi più lunghi per ottenere le proteine
(2 settimane).
• Cellule dei mammiferi: la maggior parte dei laboratori utilizza linee cellulari HEK (rene embrionale
umano) o CHO (ovaio di criceto cinese) per l’espressione di proteine che necessitano di opportune
modifiche post-traduzionali. Entrambe le linee cellulari possono essere utilizzate per l’espressione
della linea cellulare transitoria e stabile, che richiede più tempo a causa della generazione di linee
cellulari stabili, ma offre maggiore produttività. Queste cellule hanno solitamente un’elevata
capacità di produrre proteine secrete, mentre i livelli di espressione per le proteine intracellulari
sono solitamente più bassi. Alcuni vettori sono in grado di replicarsi in alcuni tipi di cellule di
mammifero in coltura, dato che nel plasmide è contenuta l’origine di replicazione del virus SV40. Il
vettore contiene altri elementi genetici richiesti per l’espressione del gene clonato nel vettore e per
la selezione di cellule contenente il DNA ricombinante. Spesso tali vettori contengono altri elementi
genetici per la propagazione in cellule batteriche, quindi sono vettori navetta. Altri tipi di vettori
per le cellule di mammiferi sono basati sull’uso di vettori retrovirali. Questi derivano
dall’oncoretrovirus MolV e sono in grado trasfettare solo cellule in attiva proliferazione,
limitandone l’uso. Per ovviare a questo problema sono stati costruiti vettori derivanti da lentivirus,
come HIV, che hanno sviluppato l’abilità di integrarsi anche nel genoma di cellule non proliferanti,
grazie alla capacità di attraversare la membrana nucleare.

Costruzione e screening di genoteche


Una genomic library (genoteca) è una collezione di frammenti del DNA genomico totale di un organismo. Al
fine di costruire una libreria genomica, il DNA dell’organismo viene estratto dalle cellule e quindi digerito
con un enzima di restrizione per tagliare il DNA in frammenti di varie dimensioni. L’allineamento di questi
frammenti sovrapposti (contigs) rappresenta una percentuale, che può arrivare fino al 100%, del contenuto
del genoma (rappresentatività di una library o coverage).
Una libreria di cDNA è una collezione di frammenti di cDNA (complementare) inseriti in una popolazione di
molecole di un vettore di clonaggio. Il cDNA è DNA sintetizzato da un RNA a filamento singolo, come mRNA
o microRNA, mediante una reazione catalizzata dall’enzima trascrittasi inversa.

Clonaggio e screening di una libreria


I frammenti di DNA genomici o di cDNA vengono
inseriti in una popolazione di vettori identici mediante
ligasi. Ciascuna molecola di vettore conterrà un
frammento del genoma o del trascrittoma.
Successivamente, il DNA del vettore può essere inserito
in un organismo ospite, comunemente E. coli, con ogni
cellula contenente solo una molecola di vettore, ovvero
un frammento della library. Il titolo, concentrazioni di
organismi ospiti, sta ad indicare la complessità della
library, cioè la rappresentatività.
Il momento critico dell’isolamento di un gene o di parte
di esso è la selezione dei batteri contenenti il
frammento di DNA d’interesse, mediante ibridazione su
colonia, con una sonda di DNA radioattiva.

62
Giulia Mostini

Un numero di cellule di E. Coli (diverse migliaia), tale da generare colonie distinte su piastre Petri, viene
piastrato su più piastre con terreno solido.
Dopo la formazione delle colonie, sulle piastre sono stesi dei filtri di nitrocellulosa a cui si attaccano parte
dei batteri formanti colonie. Dopo avere lisato le cellule trasferite sui filtri e denaturato il DNA, i filtri sono
ibridati con una sonda di DNA radioattiva, corrispondente a un tratto del gene che si vuole individuare nella
libreria. La sonda si lega sul filtro in corrispondenza del suo DNA complementare e una volta rivelata,
esponendo la membrana ad una lastra radiografica, permetterà il riconoscimento delle colonie contenente
il gene d’interesse.
Se si dispone di un anticorpo in grado di legare la proteina il cui gene è stato inserito in library di vettori
d’espressione, questo permette il riconoscimento delle colonie contenenti l’inserto desiderato.
L’integrazione della sequenza codificante nel vettore d’espressione determina la produzione di proteine di
fusione nelle colonie o placche, se si tratta di fagi. Le proteine sono raccolte su membrane, come visto per
le DNA library, e analizzate con specifici protocolli, che permettono la reazione di riconoscimento antigene-
anticorpo. Questo è lo screening per espressione.
Importante è la tecnica del Southern blot. Il taglio con un enzima di restrizione di DNA genomico di ampie
dimensioni genera frammenti di DNA che non sono visibili singolarmente dopo elettroforesi su gel e
successiva colorazione dei frammenti di DNA. Specifici frammenti possono, però, essere individuati dopo
separazione dei frammenti stessi tramite elettroforesi, successivo trasferimento delle molecole di DNA su
filtri di nitrocellulosa e ibridazione del filtro con una specifica sonda di DNA marcata in grado di ibridare con
sequenze di DNA complementari. La stessa cosa può essere fatta con RNA, prendendo il nome di Northern
blot.

Organismi transgenici
Un organismo il cui genoma sia stato modificato mediante tecniche di ingegneria genetica viene definito
geneticamente modificato (OGM). Nel caso in cui la modificazione genetica implichi il trasferimento di un
gene proveniente da altri organismi si parla di organismi transgenici.
Topi da laboratorio transgenici sono utilizzati in studi di genetica inversa, come modelli di malattie umane,
per lo studio delle cause di malattie, per la comprensione della funzione dei geni, per lo studio dei
meccanismi di processi fisiologici. In essi può avvenire la microiniezione nel pronucleo: zigoti a singola
cellula sono prelevati da femmine donatrici dodici ore dopo l’accoppiamento. Il DNA del transgene è
iniettato in uno dei due pronuclei. Gli zigoti vengono lasciati in incubatrice a dividersi e allo stadio a due
cellule vengono impiantati nell’infundibolo dell’utero di una femmina recipiente. Una percentuale tra il 5 e
il 20% dei nati avrà integrato in un punto del genoma il transgene che, se posizionato favorevolmente, può
esprimere il transgene e così quell’individuo (fondatore) darà origine ad una linea di topi transgenici.
Il gene targeting (ricombinazione omologa nelle cellule staminali – ES), invece, è una tecnica di ingegneria
genetica che usa la ricombinazione omologa nelle cellule embrionali totipotenti, che consente di modificare
o rimuovere un gene endogeno. L’efficienza del metodo si basa sulla selezione che avviene in cellule ES in
coltura, che può essere sia positiva sia negativa. Le cellule ES selezionate vengono poi iniettate nella
blastocisti ricevente, per dare vita a un topo “mosaico”, che incrociato con un WT produrrà individui
eterozigoti per la mutazione, che, a loro volta, possono essere incrociati per produrre mutanti omozigoti.
Per knock out condizionale, invece, si intende la tecnica utilizzata per eliminare un gene specifico in un
determinato tessuto. Knock in, invece, si riferisce alla sostituzione della sequenza del DNA in un locus con
l’inserimento di un’altra. Questi mutanti possono a loro volta essere inducibili, se regolati da specifici
stimoli, come gli estrogeni.
Studi genetici in S. cerevisiae, inoltre, sono facilitati dall’esistenza nell’organismo di cellule aploidi che
svelano fenotipi recessivi. E’ possibile nel lievito modificare singoli geni in pochi giorni, sfruttando i
meccanismi di ricombinazione omologa. E’ sufficiente introdurre un DNA lineare con alle estremità
sequenze omologhe a una qualsiasi regione del genoma che si intende modificare. La forte attività di
ricombinazione omologa induce la sostituzione della sequenza cromosomica, compresa tra le due sequenze
omologhe, con quella del DNA interrotto. In questo modo, si può rimuovere l’intera regione codificante di
un gene o cambiare un singolo codone o modificare una particolare coppia di basi nella consensus di una
regione regolativa.

63
Giulia Mostini

Piante transgeniche sono utilizzate per scopi di ricerca e applicazioni industriali nel settore agroalimentare
e delle biotecnologie. Ad esempio, l’infezione da parte del batterio Agrobacterium tumefaciens produce
tumori (galle). La crescita incontrollata delle cellule vegetali è dovuta all’inserzione nei cromosomi della
pianta dei geni presenti nel plasmide Ti (tumor inducing) del batterio, che codificano enzimi per la
biosintesi di ormoni stimolanti la proliferazione cellulare. Sfruttando questo fenomeno, è possibile
introdurre nelle piante sequenze di interesse, sostituendole a quelle che inducono i tumori nel plasmide Ti.
Arabidopsis thaliana può essere trasformata spruzzando le piante con una sospensione di Agrobacterium.
L’infezione del gametofito femminile prima della fecondazione può dare origine a semi del genoma
modificato stabilmente che produrranno organismi selezionabili, se si è avuta l’accortezza di includere nel
vettore, per esempio, la resistenza ad un erbicida.
Esistono anche moscerini transgenici: quando si incrociano individui di Drosophila melanogaster portatori
di trasposoni (elementi P) con individui permissivi, questi trasposoni sono mobilizzati nei nuclei delle cellule
del polo e possono integrarsi in geni critici per la formazione delle cellule germinali. In questo caso, si
determina la sterilità della progenie di questi incroci (disgenesi dell’ibrido). Gli elementi P vengono usati
come vettori per introdurre DNA esogeno in Drosophila. La trasposasi dell’elemento P viene rimossa ed
inserita in un altro vettore che viene coiniettato insieme all’elemento P ricombinante che, al posto della
traslocasi, contiene la sequenza da inserire nel genoma tra le regioni di inserzione.

Sequenziamento del DNA


Il metodo chimico, ideato da Gilbert e Maxam, si basa sul taglio del frammento di DNA a singolo filamento
mediante reazioni chimiche. Queste permettono di modificare una delle quattro basi e di tagliare il
filamento dove si trova la base modificata. Questa frammentazione viene fatta in maniera parziale, in modo
che ciascuna molecola subisca un singolo taglio in corrispondenza di una delle G. I frammenti tronchi
ottenuti sono molti e non permettono di decifrare la sequenza, ma se il singolo filamento da sequenziare
viene marcato in 5’ con un atomo di fosforo radioattivo, dopo l’elettroforesi, si vedranno solo i frammenti
tronchi radioattivi, cioè quelli che vanno dal 5’ a una delle G interne, individuando così tutte le posizioni
lungo il filamento dove si trovano le G. La stessa procedura viene fatta in provette separate per le altre basi.
Il metodo enzimatico, proposto da Sanger, invece, implica la sintesi dei frammenti tronchi da parte di una
DNA polimerasi che utilizza come stampo il DNA di cui si vuole determinare la sequenza. Il frammento di
DNA è prima clonato in un vettore, all’interno di un MCS, a singolo filamento. L’innesco per DNA Pol è un
oligonucleotide complementare alla sequenza già nota e adiacente alla regione da sequenziare. A questo
punto, si aggiunge alla miscela di reazione, oltre ai 4 deossinucleosidi trifosfato, anche un nucleotide con
zucchero dideossiribosio. Questo, quando viene incorporato, interrompe la catena, formando frammenti
tronchi, che iniziano in 5’ con l’innesco e terminano con un nucleotide interno, come G. Questo viene fatto
separatamente per tutte le basi.

Piattaforme di sequenziamento di nuova generazione


Le piattaforme NGS sono delle nuove tecniche di biotecnologia in cui il DNA viene direttamente
sequenziato e non è necessario clonarne i frammenti, in cui si possono sequenziare contemporaneamente
molti campioni per mezzo di microscopici pozzetti (reattori) su supporto solido, in cui la sequenza viene
letta durante la reazione d’incorporazione e non è necessaria l’elettroforesi.
Diverse tecnologie in continuo aggiornamento sono disponibili: Roche/454, Applied Biosystems SOLID,
Illumina/Solexa.
Il pre-requisito per qualunque tipo di sequenziamento è la preparazione di DNA di buona qualità, ovvero
integro e non contaminato. Il DNA viene frammentato con metodi in porzioni di dimensioni intorno alle
100-800 bp. E’ richiesta una frammentazione omogenea e, per questo, il grado di frammentazione del DNA
viene controllato accuratamente con strumenti, quali bioanalyzer, che effettuano elettrocromatogrammi
precisi rapidamente. Questi frammenti vengono poi amplificati tramite reazioni a catena per generare
librerie di frammenti. L’amplificazione è necessaria per aumentare il segnale proveniente da ciascun
frammento in fase di sequenziamento raccolto dai sistemi di rilevazione. Comunque negli strumenti più
recenti si evita questo passaggio, potendo rilevare il comportamento della singola molecola. Infine, alle

64
Giulia Mostini

estremità dei frammenti vengono legati covalentemente delle corte sequenze tipiche (adattatori) che sono
utilizzati sia per l’amplificazione che per le reazioni di sequenziamento vero e proprio.
Il pirosequenziamento (454) è uno dei primi metodi implementati per determinare l’ordine dei nucleotidi
nel DNA durante la sintesi, ovvero rilevando il nucleotide incorporato dalla DNA polimerasi, grazie alla luce
emessa quando il pirofosfato viene rilasciato. A ogni ciclo della reazione vengono aggiunti uno dopo l’altro i
quattro desossinucleotidi. Ogni volta che la polimerasi incorpora un nucleotide, si rilascia pirofosfato (Ppi)
in quantità equimolare a quella del nucleotide incorporato. La solforilasi con l’adenosina 5’ fosfosolfato
(APS) converte poi il Ppi ad ATP. Quest’ultimo è utilizzato dalla luciferasi per convertire la luciferina in
ossiluciferina con rilascio di fotoni, che sono rivelati da una CCD camera.
Il processo della tecnologia 454 avviene in tre fasi: la prima fase consiste nella preparazione della libreria di
DNA, a partire da frammenti generati attraverso nebulizzazione del campione di DNA in esame. Viene
generata una libreria di frammenti a singolo filamento, a cui sono legati due adattatori. La seconda fase
prevede l’amplificazione clonale in emulsione dei frammenti legati a microbiglie di agarosio. Nella terza
fase viene prodotta la sequenza delle basi, assegnando un indice di qualità a ciascuna posizione.
Importante è la tecnologia a nanopore: l’adattatore indirizza la singola molecola di DNA sul poro canale
nanomolecolare proteico. Il passaggio del filamento singolo determina un cambiamento della conduttività
dipendente dalla sequenza. Alla NGS di terza generazione appartiene anche la tecnologia PacBio a singola
molecola, in cui ogni nano-pozzetto contiene una DNA polimerasi.

Tecniche di PCR
PCR (polymerase chain reaction o reazione a catena della polimerasi) è una tecnologia che permette
l’amplificazione in vitro di un frammento di DNA, la cui sequenza in genere è nota o si trova tra due regioni
dalla sequenza nota. Prima della PCR, il DNA di interesse poteva essere prodotto solo attraverso
l’amplificazione delle cellule che lo contenevano con rese relativamente limitate, tempi lunghi e dispendio
di risorse. Questa tecnica è una scoperta industriale, ideata nel 1983 da Mullis.
I reagenti necessari per la PCR sono il DNA da amplificare o templato (10-100 ng di genoma eucariotico),
una coppia di primers,una DNA polimerasi (Taq) di Thermus acquaticus, che resiste a 95°, ma performa con
una frequenza di errore superiore, dNTPs, Mg2+, buffer di reazione (tampone di tris e sali), acqua per un
volume totale di reazione di 10-200 μl.
La PCR avviene in un ciclo di tre passaggi:
1. Denaturazione termica del DNA, per cui i due filamenti si separano (95°C per 3 minuti).
2. Associazione (annealing) degli inneschi (primers) ai filamenti di DNA denaturato complementari.
3. Sintesi del DNA, tramite DNA polimerasi,a partire dai due primer appaiati sui filamenti del DNA
(estenzione). La tecnica si esegue alla temperatura di 72°C.
Cicli ripetuti di PCR amplificano il DNA e prendono il nome di termocicli.
Per eseguire una PCR sono necessari due set di primer, forward e reverse. Essi sono oligonucleotidi prodotti
sinteticamente e lunghi circa 20-30 nt. I primer sono disegnati in modo da avere una sequenza nucleotidica
complementare all’estremità 3’ del DNA da amplificare. I primer, inoltre, non devono contenere sequenze
ripetute e invertite (palindromi), per evitare la formazione di ripiegamenti e dovrebbero avere un
contenuto di GC del 40-60% per garantire una reattività ottimale.
La sintesi chimica di DNA basata su fosforamidite è il metodo di elezione per la produzione di
oligonucleotidi di DNA. Fu sviluppata negli anni ’80 e successivamente migliorata con l’apporto della
tecnologia in fase solida e l’automazione dei cicli. A differenza della biosintesi, la sintesi chimica procede
nella direzione 3’->5’. Questo processo è composto da tre fasi: la detritilazione, in cui il gruppo protettivo
5’-DMT viene rimosso dal primo nucleoside legato al supporto solido; il coupling, in cui il 5’-OH libero del
primo nucleoside attacca il fosforo del secondo nucleoside in entrata spostando il suo gruppo
diisopropilamino; l’ossidazione, in cui il fosfito triestere instabile viene convertito in un fosfato triestere che
consente al ciclo successivo di procedere alla detritilazione del secondo nucleotide. Tuttavia, prima di
passare al ciclo successivo, i nucleosidi sul supporto solido che non hanno reagito sono acetilati, impedendo
in tal modo l’allungamento delle sequenze con mutazioni di delezione.
La temperatura di melting (Tm - scioglimento) dei primer dipende dalla lunghezza dei primer stessi, dal loro
contenuto in GC/AT e dalla concentrazione saline di NaCl e dal pH di reazione. Si approssima con la formula

65
Giulia Mostini

Tm = 4 (G+C)+2(A+T) °C. La Ta, invece, è la temperatura di annealing e si imposta 2-5°C al di sotto della più
bassa Tm dei due primer usati.
Esiste anche una PCR quantitativa. E’ possibile, infatti, seguire in tempo reale, durante il susseguirsi dei cicli
della PCR, l’accumulo del DNA prodotto mediante fluorocromi (coloranti intercalanti o marcatori di
nucleotidi). La PCR (real – time) può essere utilizzata per quantificare la quantità di DNA templato presente
in un campione (QPCR).Eventualmente, nel caso di un RNA retrotrascritto in cDNA si possono misurare le
quantità relative di mRNA espresso di un gene in diverse condizioni (RT-QPCR).
Per ogni campione si ottiene una curva di amplificazione e si definisce una soglia (threshold). Il numero di
cicli di PCR necessari per arrivare a quel quantitativo di soglia di DNA viene indicato come Ct (threshold
cycle) relativo al campione. Il Ct è inversamente proporzionale alla quantità di DNA templato iniziale. Per
conoscere il rapporto quantitativo del DNA di partenza di due campioni se ne sottraggono i Ct (∆Ct) e si
calcola pari a 2-∆ct

RNA interference
Gli RNA non codificanti
(ncRNA) sono molecole di RNA
trascritti da geni specifici che
non vengono tradotti in
proteine. I tRNA e gli rRNA
sono i più abbondanti ncRNA
prodotti dalla cellula. Vi sono
altri piccoli ncRNA, come i
microRNA (miRNA), piccoli RNA
interferenti (siRNA) ed RNA del
sistema Piwi (piRNA), che
svolgono la funzione di
regolazione dell’espressione
genica o di difesa da virus e
trasposoni.
I miRNA e i siRNA fanno parte del meccanismo dell’interferenza con RNA (RNAi), che causa il silenziamento
dell’espressione genica essenzialmente a seguito della formazione di ibridi di RNA senso-antisenso. RNAi
viene anche detto silenziamento genico mediato da double-stranded RNA. Furono scoperti nel 1988 nella
piante e in C. elegans, pochi anni dopo che fosse osservato il fenomeno del silenziamento del transgene.
Nel tentativo di alterare i colori dei fiori nelle petunie, infatti, i ricercatori vi introducevano un gene che
codifica un enzima chiave per la pigmentazione dei fiori, detto calcone sintasi. Si aspettavano che l’enzima
producesse fiori più scuri, invece risultavano fiori bianchi, indicando che l’attività sia dei geni endogeni sia
dei transgeni dell’enzima venivano repressi. Poco dopo, un evento collegato chiamato quelling fu notato
nel fungo Neurospora crassa. Successive indagini chiarirono che la soppressione era dovuta all’aumento del
tasso di degradazione dell’mRNA. Questo fenomeno venne chiamato co-soppressione dell’espressione
genica.
I siRNA e i miRNA derivano da molecole più lunghe di RNA a doppio filamento che vengono tagliate
dall’enzima Dicer (Rnasi III). I piRNA sono prodotti, invece, col processamento di lunghi trascritti a singolo
filamento, originati dai cluster di piRNA presenti nei genomi. I tre ncRNA inibiscono l’espressione genica in
tre modi: inducono la distruzione di mRNA; inibiscono la traduzione; modificano la cromatina del gene
bersaglio, silenziando la trascrizione. Il macchinario dell’RNAi comprende il complesso RISC contenente
diverse proteine, tra cui argonaute (Ago) che srotola il doppio filamento e, come ribonucleasi, taglia la
sequenza a 10-11 nt dall’estremità terminale 5’.
I siRNA possono moltiplicarsi attraverso un meccanismo di sintesi a partire da siRNA che agiscono da
primer. Questa amplificazione è mediata dalla RNA polimerasi RNA dipendente (RdRP) reclutata dal
complesso siRNA-RISC. Il singolo filamento legato da siRNA viene così copiato in un dsRNA che viene poi
tagliato e attivato da Dicer. RdRP si trova nelle piante, nei vermi e nel S. pombe.

66
Giulia Mostini

I microRNA, invece, regolano l’espressione genica e negli animali i geni di miRNA sono trascritti in miRNA
primari (pri-miRNA) ed elaborati da due RNAsi (Drosha e Dicer). Drosha agisce nel nucleo, scindendo il pri-
miRNA vicino alla base del gambo di una tipica struttura a forcina, rilasciando pre-miRNA da circa 70 a 90
nt. Il pre-miRNA viene poi esportato nel citoplasma, dove l’ansa terminale viene tagliata da Dicer per
produrre un miRNA duplex. Un filamento di questo duplex viene rapidamente degradato e rimane solo la
sequenza matura di miRNA di circa 22 nt. Il riconoscimento e il taglio dell’RNA da parte dei due enzimi è
dovuto alla struttura dell’RNA substrato piuttosto che alla loro sequenza specifica.
Il miRNA maturo si associa al complesso RISC in cui è presente Ago e insieme miRNA-RISC legano l’RNA
bersaglio. La specificità per il bersaglio è determinata dalla complementarietà con una breve sequenza
(sequenza seed), in genere presente nella regione 3’-non tradotta (UTR) dell’mRNA. L’effetto tipico è quello
di indurre il blocco della traduzione o la degradazione dell’RNA mediante il dominio RNasi di Ago. Un
miRNA può silenziare in modo post-trascrizionale diverse migliaia di trascritti di un gene, mentre un singolo
gene può essere silenziato da più di un miRNA. In alcuni casi i miRNA possono promuovere la traduzione.
Esistono diverse centinaia di miRNA. Alcuni sembrano derivare dall’elaborazione di geni codificanti dopo lo
splicing, attraverso l’azione di enzimi di de-branching del lariat. Questi miRNA sono definiti Mirton. In
questo caso, la biogenesi del miRNA sarebbe un processo parallelo a quello dell’espressione genica
codificante. La degenerazione di molti miRNA nell’uomo è associata a importanti patologie: i livelli di alcuni
miRNA nel sangue periferico sono utilizzati come marker di malattia.
E’ possibile far esprimere un opportuno siRNA in cellule per indurre il silenziamento di uno specifico gene a
scopo di ricerca o per applicazioni industriali. La sequenza del siRNA deve avere alcune caratteristiche:
formare un RNA a doppia elica di 21-23 nt; avere un terminale 3’ più lungo di 2 nt con OH libero; avere un
5’ del senso stabile (ricco in GC) e un antisenso ricco in UA; essere complementare a una porzione di RNA a
non più di 75 basi da codone di inizio traduzione, ma non complementare a sequenze di introni. Questi
siRNA artificiali possono essere clonati in vettori d’espressione e introdotti in cellule in coltura o veicolati in
tessuti. Sono disponibili anche library di RNAi, cioè contenenti diversi centinaia di migliaia di sequenze per
silenziare altrettanti geni bersaglio in esperimenti di screening fenotipici.

Modificazione del genoma mediante CRISPR/Cas9


CRISPR/Cas è un sistema di difesa batterico contro virus e plasmidi, scoperto sul finire degli anni ’80.
Funziona come un’immunità che si acquisisce con l’integrazione nel genoma di frammenti di DNA (20 bp)
dei vari agenti che possono infettarli. Questi frammenti di DNA estraneo (protospacers) costituiscono sul
DNA batterico una regione denominata CRISPR. Nella regione si trova anche la sequenza di DNA codificante
per delle DNA nucleasi, chiamate Cas (CRISPR associated).
Durante un’infezione batteriofaga vengono prodotti gli enzimi cas, un piccolo tracrRNA (transactivating
crRNA) e l’RNA della regione CRISPR (crRNA). Il sistema Cas taglia il DNA estraneo del batteriofago nel sito
NGG in prossimità della sequenza PAM.
Nel 2012, nei laboratori di Doudna e Charpentier, è stato sviluppato un sistema semplificato a due
componenti, combinando tracrRNA e crRNA in un singolo RNA guida (sgRNA). Guidato da sgRNA, Cas9 ha
dimostrato di essere efficace quanto Cas9 associato con trRNA e crRNA separati nel guidare alterazioni
geniche mirate, rendendo questo sistema particolarmente adatto per modificare i genomi. Ad oggi, diverse
varianti della nucleasi Cas9 sono state adottate nei protocolli di genome editing. Il primo è basato su Cas9
wild-type, che può tagliare specificamente il DNA a doppio filamento, attivando i meccanismi di riparazione
del double strand break (DSB). I DSB possono essere riparati tramite il percorso NHEJ, che provoca
inserimenti e/o delezione, distruggendo il locus bersaglio. In alternativa, se viene introdotto anche un DNA
con bracci omologhi alla regione bersaglio, il DSB può essere riparato dal meccanismo di riparazione per
ricombinazione omologa HDR. In questo caso, è possibile sostituire, in prossimità del sito riconosciuto da
CRISPR/Cas9, precise mutazioni selettive.
Oltre alla versione Cas9 wild-type, è stata sviluppata la versione di Cas9 che crea un nick single-strand
specifico su ogni filamento. In questo caso, due sgRNA possono essere utilizzati per introdurre una rottura a
doppio filamento sfalsata che facilita la riparazione per ricombinazione omologa. Sono anche state
ingegnerizzate Cas9 prive di attività nucleasica e fuse con vari domini effettori che consentono a Cas9 di
funzionare come attivatore trascrizionale, repressore o marcatore di localizzazione fluorescente.

67
Giulia Mostini

Omics: genomica, epigenomica, trascrittomica, proteomica e metabolomica


La genomica è lo studio della sequenza primaria dei genomi interi. Essa utilizza una combinazione di DNA
ricombinante, metodi di sequenziamento del DNA e bioinformatica per sequenziare, assemblare e
analizzare la struttura e la funzione dei genomi. Incorpora elementi di genetica, ma si differenzia, in quanto
considera il corredo completo del materiale ereditario di un organismo, piuttosto che un gene o un
prodotto genico alla volta. La genomica si concentra sulle interazioni tra loci e alleli all’interno del genoma e
altre interazioni, come l’epistasi, la pleiotropia e l’eterosi (interazione fra alleli).
L’epigenomica, invece, è lo studio delle modificazioni epigenetiche “genome-wide”, cioè in una visione che
comprende l’intero genoma. Essa utilizza metodi di rivelazioni di modificazioni del DNA e della cromatina,
associati al sequenziamento e algoritmi di bioinformatica per catalogare, assemblare e analizzare i segnali
epigenetici. Caratteristica dell’epigenomica è la reversibilità dei segnali raccolti e la loro transitorietà
relativa dipendente da fattori circostanti la cellula. Ci si riferisce a diversi stati dell’epigenoma di una cellula
come a landscapes.
La trascrittomica è lo studio comparativo dei trascrittomi (profili di espressione), cioè dell’insieme completo
delle molecole di RNA prodotte dal genoma. Essa utilizza metodi mutuati dal sequenziamento e applicati a
templati di RNA. Recentemente, ha raggiunto una risoluzione in grado di determinare il profilo di
espressione del genoma di una singola cellula. Si concentra, in particolare, su come i modelli di trascrizione
sono influenzati dallo sviluppo, da condizioni patologiche o da fattori esogeni come farmaci.
La proteomica è l’analisi dell’intero insieme delle proteine e peptidi presenti in un sistema biologico
(proteoma). In particolare, la proteomica si caratterizza per l’alta risoluzione quantitativa e per la possibilità
di descrivere tutta la serie di modifiche post-traduzionali. Ad esempio, è possibile mappare tutto il set delle
proteine fosforilate (fosfoproteoma). Essa utilizza strumenti specifici di spettrometria di massa e tecniche
di frazionamento e marcatura dei campioni. Tipicamente questi sistemi sperimentali producono data sets
molto grandi che richiedono strumenti dedicati di bioinformatica. La proteomica è determinante
nell’osservazione dei network fra proteine e fra specifiche condizioni e le varie modificazioni post-
traduzionali.
La metabolomica, infine, è lo studio su larga scala di piccole molecole, note come metaboliti, all’interno di
cellule, fluidi biologici, tessuti od organismi interi. Collettivamente, queste molecole e le loro interazioni
all’interno di un sistema biologico sono conosciute come metaboloma. La metabolomica si avvale di una
serie di tecnologie dalle cromatografie alla spettrometria di massa e all’NMR per distinguere e quantificare
substrati e prodotti del metabolismo. Essa è, più degli altri livelli omici, vicina al fenotipo molecolare delle
cellule perché i tipi di metaboliti e le loro concentrazioni manifestano le capacità funzionali delle cellule e il
metaboloma riflette dinamicamente l’attività biochimica sottostante.
L’integrazione dei dati del fosfoproteoma e del metaboloma, ottenuti da cellule di epatoma di ratto dopo
stimolazione con insulina, rivela che il flusso di segnale scorre attraverso una rete di vie di segnalazione che
coinvolgono 13 proteine chinasi, 26 enzimi metabolici fosforilati e 35 effettori allosterici che orchestrano
cambiamenti quantitativi in 44 metaboliti.
Infine esiste il Trans-OWAS (dinamica e studi di associazione), che esplora la relazione tra fenotipo e più
livelli omici.

68

Potrebbero piacerti anche