Sei sulla pagina 1di 71

Struttura del DNA

Da un punto di vista chimico il DNA è un “acido nucleico”, cioè una molecola


polimerica costituita da “nucleotidi”. Ogni nucleotide è formato a sua volta da tre
parti: uno zucchero pentoso (a 5 atomi di carbonio), una base azotata ed un
gruppo fosfato. Gli acidi nucleici prendono il nome dal tipo di zucchero: il DNA
contiene il “2’-deossiribosio”, mentre l’RNA il “ribosio”. Entrambi sono
“aldopentosi” e differiscono per un gruppo chimico legato al carbonio 2’: un
gruppo ossidrilico (OH) nel ribosio ed un idrogeno (H) nel deossiribosio.

Le basi azotate che costituiscono i nucleotidi si dividono in due classi: le “purine”,


che sono strutture a doppio anello formate da 9 atomi di carbonio, e le
“pirimidine”, a singolo anello, formate invece da 6 atomi di carbonio. Nel DNA le
purine sono 2: “adenina” (A) e “guanina” (G), mentre le pirimidine sono 3: “timina”
(T), “citosina” (C) ed “uracile” (U). Sia il DNA che l’RNA contengono adenina,
guanina e citosina, mentre la timina è presente solo nel DNA e l’uracile è presente
solo nell’RNA.

Le basi azotate sono sempre legate al carbonio in posizione 1’ dello zucchero


pentoso mediante un “legame glicosidico”, che coinvolge l’atomo di azoto in
posizione 1’ delle pirimidine o l’atomo di azoto in posizione 9’ delle purine. La
combinazione di uno zucchero e di una base è chiamata “nucleoside”; tuttavia se si
aggiunge un gruppo fosfato al carbonio 5’ del pentosio l’insieme base-zucchero-
fosfato prende il nome di “nucleotide”. I nucleotidi sono uniti tra di loro,
formando catene polinucleotidiche, mediante legami covalenti noti come “legami
fosfodiesterici”. Tale legame si forma tra l’ossidrile presente in posizione 3’ di un
nucleotide e il gruppo fosfato del carbonio 5’ del secondo nucleotide. I legami
fosfodiesterici sono relativamente forti e creano un’impalcatura ripetitiva
zucchero-fosfato-zucchero-fosfato che conferisce stabilità alla struttura.

Per generare il legame fosfodiestere c’è bisogno di energia (in quanto è un legame
forte). L’energia per la formazione di questo legame è fornita dai
“deossiribonucleosidi 5’-trifosfato”, ossia dai substrati della DNA polimerasi. Un
deossiribonucleoside 5’-trifosfato è formato da una base azotata che si lega allo
zucchero più tre gruppi fosfato che si legano al carbonio 5’. L’ATP (adenosina
trifosfato) è formata proprio in questo modo: la base azotata è l’adenina, lo
zucchero è il ribosio e tre sono i gruppi fosfato.

Quattro sono i deossiribonucleosidi 5’-trifosfato: “deossiATP” (dATP),


“deossiTTP” (dTTP), “deossiGTP” (dGTP) e “deossiCTP” (dCTP). Quest’ultimi
intervengono perché, essendo molecole ad alta energia, forniscono loro l’energia
necessaria per la formazione del legame fosfodiestere. Non c’è bisogno dunque di
energia derivate dall’ATP, ma sono gli stessi ribonucleosidi 5’ trifosfato che
entrano nella reazione di sintesi, in cui vengono idrolizzati liberando pirofosfato.
La reazione, tuttavia, è una reazione che è ancora in equilibrio: è l’idrolisi del
pirofosfato, catalizzata dall’enzima pirofosfatasi in due gruppi fosfato, a
rendere irreversibile la reazione (vedi replicazione del DNA).
La doppia elica del DNA
Nel 1953 Watson e Crick proposero un modello tridimensionale della struttura
del DNA. Il modello da loro proposto in accordo con tutti i dati noti sulla
struttura del DNA, è la famosa “doppia elica”. Le principali scoperte sulle quali si
basavano Watson e Crick per proporre il loro modello erano fondamentalmente
due: gli studi sulla composizione in basi azotate condotti da Chargaff e quelli sulla
diffrazione a raggi X condotti da Franklin e Wilkins. I dati prodotti dalla
diffrazione a raggi X dimostravano che la forma B del DNA (più idratata della
forma A) è un’elica regolare che compie un giro completo ogni 34 A (3,4 nm), ha
un diametro di circa 20 A (2 nm) e la distanza tra i nucleotidi adiacenti è di 3,4
A (0,34 nm); pertanto ci sono 10 nucleotidi per giro. Chargaff, invece, aveva
notato che in tutte le molecole di DNA, indipendentemente dalla specie a cui
appartiene, il numero dei residui di adenina è uguale al numero di residui di timina
(cioè, A=T) e il numero di residui di guanina è uguale al numero di residui di
citosina (G=C). Da queste relazioni deriva che la somma dei residui purinici è
uguale alla somma dei residui pirimidinici, cioè A + G = T + C. Dal modello proposto
da Watson e Crick si può dedurre che il DNA è costituito da due catene
polipeptidiche elicoidali avvolto intorno allo stesso asse per formare una doppia
elica destrorsa, e che le due catene polipeptidiche si associano grazie a legami
idrogeno tra le basi azotate. Normalmente, la G può formare un legame idrogeno
specifico solo con la C e la A solo con la T. Questa formazione di legami idrogeno
tra le basi è denominata “appaiamento delle basi” e le basi appaiate sono dette
“complementari”. E’ importante notare che si possono formare tre legami
idrogeno tra le basi G e C, e soltanto due tra le basi A e T. Secondo il modello di
Watson e Crick le due catene polinucleotidiche corrono in direzione opposta e
pertanto sono dette “antiparallele”. Se si guarda l’elica da una direzione, un
filamento si sviluppa con andamento 5’-3’, mentre il suo complementare va dal 3’
al 5’. L’avvolgimento dei due filamenti uno sull’altro forma una doppia elica dotata
di un “solco minore” di circa 12 A (1,2 nm) di diametro ed un “solco maggiore” di
circa 22 A (2,2 nm) di diametro. Gli scheletri di zucchero-fosfato si trovano
all’esterno della doppia elica, mentre le basi azotate sono orientate verso l’asse
centrale, dove tendono ad impilarsi l’una sull’altra perpendicolarmente all’asse
longitudinale della doppia elica conferendo al DNA una maggiore stabilità.

Strutture alternative a doppia elica


I primi studi di diffrazione ai raggi X, eseguiti su soluzioni concentrate di DNA,
rivelavano due tipi differenti di strutture: le forme B e A (entrambe destrorse).
La struttura proposta da Watson e Crick viene anche detta forma B del DNA. La
forma B è quella più stabile ed è quella che più si avvicina alla struttura
fisiologica: contiene 10 coppie di basi per giro d’elica, un ampio solco maggiore e
un solco minore più chiuso. La forma A, invece, che si ottiene da una soluzione a
più basso contenuto di acqua, ha 11 coppie di basi per giro d’elica, il suo solco
maggiore è più stretto e profondo rispetto alla forma B, mentre quello minore è
più aperto. La maggior parte del DNA presente nella cellula è nella forma B,
mentre la forma A si trova specialmente in corrispondenza di complessi con
proteine. Il DNA, tuttavia, a volte può formare anche un’elica sinistrorsa. Si
tratta della forma Z del DNA, la quale è radicalmente diversa dalla forma B. La
differenza più evidente è la rotazione dell’elica in senso sinistrorso. Rispetto alle
altre conformazioni il DNA Z possiede 12 coppie di basi per giro d’elica, per cui la
struttura è meno spiralizzata. La sua forma è perciò più sottile, meno ispessita, e
il suo nome deriva dal percorso a zigzag che l’ossatura di zucchero-fosfato
descrive lungo l’elica. In questa conformazione il solco maggiore è piatto, mentre
il solco minore è più stretto e profondo. La forma Z si riscontra soprattutto nei
polinucleotidi la cui sequenza consiste in purine alternate a pirimidine.

Denaturazione e rinaturazione del DNA


Per comprendere come funzionano gli acidi nucleici dobbiamo prima capire le loro
proprietà chimiche e le loro strutture. Una delle caratteristiche che rende il
DNA il depositario dell’informazione genetica è la sua “stabilità intrinseca” che
consente la conservazione per lunghi periodi di tempo dell’informazione senza
alterazioni. Processi come cancerogenesi e l’invecchiamento possono essere
correlati ad alterazioni irreversibili che si accumulano sulla molecola di DNA. Le
stesse caratteristiche che consentono al DNA di svolgere il suo ruolo biologico
rendono possibile anche manipolare in vitro l’acido nucleico ed isolare il segmento
di DNA che codifica per una particolare proteina. Le soluzioni di DNA nativo,
isolato con molte precauzioni, sono altamente viscose a pH 7,0 e a temperatura
ambiente (25°C). Quando una di queste soluzioni viene portata a pH estremi,
oppure a temperature sopra gli 80°C, o ancora sottoposta ad una bassa forza
ionica o vi si aggiungono sostanze come l’urea, le sua viscosità diminuisce
drasticamente, indicando che il DNA ha subito una trasformazione fisica. Il
calore ed i pH estremi causano la “denaturazione” del DNA a doppia elica: il
processo avviene mediante la rottura dei legami idrogeno tra le basi appaiate, o la
rottura delle interazioni idrofobiche tra le basi impilate. Come risultato la doppia
elica si apre liberando le due catene singole, completamente separate per tutta la
loro lunghezza, tuttavia però i legami covalenti del DNA non vengono rotti. La
denaturazione del DNA produce straordinari cambiamenti in molte proprietà
fisiche della molecola. Particolarmente interessante è il cambiamento della
“densità ottica”. In generale, le basi azotate dei nucleotidi assorbono la luce
soprattutto nella gamma degli ultravioletti con un massimo di assorbimento
intorno ai 260 nm. Tuttavia l’interazione tra le basi azotate impilate le une sulle
altre, ha l’effetto di ridurre la quantità di luce assorbita. Questo decadimento
dell’assorbimento aumenta ulteriormente quando due acidi nucleici complementari
si appaiono, in quanto, in questa conformazione, le basi azotate vengono a trovarsi
all’interno della struttura: questo effetto è detto “ipocromico”. La denaturazione
del DNA a doppio filamento, invece, produce l’effetto opposto, cioè vi è un
aumento dell’assorbimento chiamato “effetto ipercromico”. Pertanto la
transizione del DNA a doppia elica a DNA denaturato può essere monitorata
misurando l’assorbimento della luce UV, poiché qualsiasi spostamento dallo stato
duplex si manifesta con un aumento della densità ottica. A tale scopo è possibile
costruire un grafico riportando in un sistema di riferimento cartesiano il
cambiamento di densità ottica in funzione della temperatura. A questo grafico si
dà il nome di “curva di fusione”. Il punto medio di questa curva è la “temperatura
di fusione” o Tm della molecola, in cui i due filamenti di DNA si separano. La
temperatura di fusione è caratteristica per ciascun DNA ed è determinata dal
contenuto in G-C della doppia elica. In ogni accoppiamento G-C ci sono tre legami
idrogeno; pertanto, è più stabile di un appaiamento A-T in cui vi sono solamente
due legami idrogeno. In una molecola di DNA, quindi, maggiore è il numero di
appaiamenti G-C, maggiore è l’energia necessaria per separare i due filamenti, per
cui maggiore sarà la temperatura di fusione. In condizioni fisiologiche, la Tm è in
genere compresa tra 85°C/95°C; per esempio, nei mammiferi in cui il DNA
contiene il 40% di coppie di G-C, la Tm è di circa 87°C, mentre a parità di
condizioni la Tm di un DNA con un 60% di G-C è di circa 95°C.
Il DNA, tuttavia, può essere anche “rinaturato”. La rinaturazione del DNA è un
processo rapido, a una sola tappa, se le due catene di DNA sono ancora unite da
un segmento a doppia elica di una decina o più di residui. Quando la temperatura o
il pH vengono portati a valori vicino a quelli fisiologici, i segmenti srotolati delle
due catene si riavvolgono spontaneamente rigenerando il duplex intatto. Se
invece le due catene sono completamente separate, il processo avviene in due
tappe: la prima tappa è relativamente lenta in quanto le due catene si urtano
casualmente per “trovarsi” e formare un breve segmento di doppia elica
complementare; la seconda tappa, invece, è molto più rapida, infatti le coppie di
basi rimaste non appaiate entrano facilmente in contatto tra loro e le due catene
si uniscono a “cerniera” formando la doppia elica completa.

Ibridazione
Le sequenze degli acidi nucleici possono essere valutate in termini di
“somiglianza” oppure di “complementarietà”:
1. La somiglianza è data dalla percentuale di basi (per singolo filamento) o di
coppie di basi (per doppio filamento) identiche;
2. La complementarietà, invece, è determinata dalle regole per l’appaiamento
delle basi e può essere misurata direttamente valutando la capacità di due
acidi nucleici o filamento singolo di appaiarsi.
Come detto in precedenza, se una molecole di DNA duplex viene denaturata, i due
filamenti che si separano, essendo complementari, sono in grado di riformare una
doppia elica nel processo della rinaturazione. Tuttavia anche sequenze
complementari appartenenti a due acidi nucleici qualsiasi possono appaiarsi tra
loro, in determinate condizioni, con conseguente formazione di un duplex. Questa
reazione, però, è detta “ibridazione” in quanto coinvolge acidi nucleici provenienti
da fonti diverse. Sono stati elaborati dei test per valutare la complementarietà
tra due qualsiasi filamenti. Tali test consistono nel mescolare due proporzioni di
acido nucleico a singolo filamento per poi misurare la quantità di materiale a
doppio filamento che si è formata. I metodi più utilizzati sono: l’ibridazione in
soluzione (o in liquido) e l’ibridazione su filtro. Nell’ibridazione in soluzione le due
proporzioni di DNA a singolo filamento vengono mescolate in soluzione. Se si
usano grandi quantità di materiale, la reazione può essere seguita mediante il
cambiamento della densità ottica. Se si lavora con quantità più piccole, invece,
una delle due proporzioni può essere marcata con un tracciante radioattivo per
poi rilevarne l’incorporazione in un duplex. Il DNA duplex può essere valutato
utilizzando la cromatografia per separare il DNA a doppia elica da quello a
filamento singolo, oppure degradando tutti i filamenti singoli che non hanno
reagito per poi misurare la quantità di materiale che resta. Quando uno o
entrambi i preparati consistono in DNA duplex, l’indagine non può essere
condotta con l’ibridazione in soluzione. Questa impossibilità nasce dal fatto che,
quando si denaturano due DNA duplex e poi si mescolano tra loro i preparati di
filamenti singoli, possono avvenire due tipi di reazioni: possono rinaturare i
filamenti singoli complementari originali, oppure ciascun filamento singolo può
ibridare con una sequenza complementare dell’altro DNA. La competizione tra
queste due reazioni rende, tuttavia, difficile valutare l’entità dell’ibridazione. Il
problema può essere risolto ricorrendo all’ibridazione su filtro: in questa
procedura le soluzione di DNA vengono immobilizzate su filtri di nitrocellulosa,
cosicché non possono rinaturare. I filtri di nitrocellulosa sono dotati della
proprietà di adsorbire (assorbire) i filamenti singoli di DNA, ma non quelli di
RNA. Dopo che è stato utilizzato per assorbire DNA, un filtro può essere
trattato in modo da impedire ogni ulteriore assorbimento di filamenti singoli. La
procedura sperimentale seguita per questa reazione prevede l’uso di DNA o di
RNA marcato con una sostanza radioattiva; ciò rende possibile misurare l’entità
dell’ibridazione in base alla quantità di tracciante radioattivo che resta
depositato sul filtro. Il grado di ibridazione fra due acidi nucleici a filamento
singolo può essere considerato un indice del grado di complementarietà tra le
loro sequenze. Due sequenze infatti non possono perfettamente ibridare se non
sono complementari. Se sono strettamente correlate ma non identiche, danno
origine ad un duplex imperfetto in cui l’appaiamento tra le basi si interrompe a
livello delle sequenze che non sono complementari.

Il superavvolgimento del DNA


I due filamenti del DNA, come sappiamo, sono avvolti uno sull’altro formando una
struttura a doppie elica. La doppie elica, però, può anche avvolgersi su se stessa e
cambiare la conformazione generale della molecola di DNA nello spazio, ovvero la
topologia. Questo fenomeno è detto “superavvolgimento” e lo si può facilmente
comprendere pensando ad un elastico attorcigliato su se stesso. Il
superavvolgimento crea della tensione nel DNA e, pertanto, può avvenire solo se
la molecola di DNA non ha estremità libere (in quanto le estremità libere ruotano
su se stesse per rilasciare la tensione) o se è una molecola di DNA lineare
ancorata ad una struttura portante proteica. L’esempio più semplice di una
molecola di DNA priva di estremità libere è una molecola circolare. Le
conseguenze del superavvolgimento cambiano a seconda del verso di
attorcigliamento del DNA, ovvero se si attorciglia su se stesso nello stesso senso
dei due filamenti della doppia elica (in senso orario) o nel senso opposto.
L’attorcigliamento nello stesso verso porta ad un “superavvolgimento positivo”,
aumentando l’avvolgimento del DNA così da avere più basi per giro d’elica.
L’attorcigliamento nel verso opposto, invece, porta ad un “superavvolgimento
negativo”, o “svolgimento”, e ci sono meno basi per giro d’elica. Il
superavvolgimento adottato dal DNA in natura, cioè quello fisiologico nella cellula,
è il superavvolgimento negativo, sul quale poi andranno ad agire le topoisomerasi.
Una molecola di DNA chiusa è caratterizzata da un suo “numero di legame” (L)
che corrisponde al numero di volte che un filamento si incrocia con l’altro. Il
numero di legame è dato dalla somma di due componenti: il numero di
superavvolgimenti, o “writhing” (W), e il numero dei giri completi, o “twisting” (T).
Il numero di twisting, T, consiste nel numero di volte che un filamento passa
sull’altro, mentre il numero di superavvolgimenti, W, rappresenta l’avvolgimento
dell’asse della doppia elica nello spazio. Spesso si parla di cambiamento del
numero di legame, il ΔL, che è dato dall’equazione: ΔL = ΔW + ΔT. Questa
equazione stabilisce che ogni cambiamento nel numero di avvolgimenti di un
filamento sull’altro può essere espresso come la somma dei cambiamenti
nell’avvolgimento dell’asse della doppia elica nello spazio (ΔW) e dei cambiamenti
nella periodicità della doppia elica stessa (ΔT).

Le topoisomerasi
Le topoisomerasi sono un gruppo di enzimi presenti in tutte le cellule, i quali
svolgono un ruolo importante specialmente in processi quali la replicazione e la
trascrizione del DNA, in quanto sono coinvolti nella modificazione del grado di
superavvolgimento della doppia elica. Il loro compito è quello di rimuovere i
superavvolgimenti mediante una rottura temporanea del singolo o del doppio
filamento, a cui seguono immediatamente risaldature senza la formazione di
estremità libere dei filamenti. Le topoisomerasi si dividono in due classi
principali:
 La “topoisomerasi I” rompe transitoriamente una sola delle catene del DNA,
facendola ruotare sull’altra rimasta integra, ed infine unisce le estremità
interrotte; il numero di legame, in questo caso, viene aumentato di 1 unità,
ossia ΔL=+1. In questo modo la topoisomerasi I introduce un
superavvolgimento positivo eliminandone uno negativo. L’energia rilasciata
dalla rottura del legame fosfodiestere, che tiene unite le basi a livello della
rottura, viene accumulata dall’enzima e rilasciata per la formazione del
nuovo legame subito dopo il passaggio del filamenti integro. L’enzima, quindi,
per riformare il legame fosfodiestere non richiede ATP.
 La “topoisomerasi II”, invece, rompe entrambe le catene del DNA e
modifica il valore di ΔL con incremento negativo di 2 unità, quindi ΔL=-2. La
topoisomerasi II interviene quando nella molecola di DNA sono presenti
molti superavvolgimenti positivi. Questo enzima avvolge il DNA su se stesso,
rompe entrambi i filamenti e le estremità si legano ai residui amminoacidi
dell’enzima per creare un passaggio per il DNA; quindi fa passare la seconda
doppia elica attraverso la rottura, successivamente risalda la rottura
creata ed infine si dissocia dal DNA. In questo modo si ricongiungono i DNA
interrotti e si rigenerano i legami fosfodiestere di entrambi i filamenti. Il
fatto che l’energia viene conservata dall’enzima indica che esso è in grado di
compiere la reazione senza energia esterna. Osservando però il bilancio
netto di energia notiamo che vi è la conservazione di 2 molecole di ATP.
Questo è dovuto al fatto che la topoisomerasi II per poter tornare a
funzionare è come se dovesse ricaricarsi, per cui l’idrolisi di 2 molecole di
ATP serve per la rigenerazione dell’enzima e non per lo svolgimento della
sua azione.
Anche nei procarioti esistono due differenti topoisomerasi: la “dna girasi” e la
“girasi inversa”. La “DNA girasi” è una particolare topoisomerasi II la quale
introduce superavvolgimenti negativi in una molecola chiusa rilassata. Essa si lega
ad un DNA duplex circolare e lo superavvolge progressivamente. La forma
superavvolta ha un’energia libera maggiore di quella della forma rilassata e
l’energia necessaria per compiere la conversione è fornita dall’idrolisi di ATP. La
girasi è stata caratterizzata meglio in E.coli come un tetramero formato da due
subunità α e β (2α e 2β). Ognuna delle subunità del dimero è costituita da un
dominio ATPasico, da un dominio centrale contenente la “tirosina catalitica” ed un
dominio C-terminale. La “girasi inversa”, invece, è una topoisomerasi I in grado di
introdurre superavvolgimenti positivi.

Organizzazione dei cromosomi


Il DNA è lungo circa 3,3 x 109 coppie di basi, quindi è una molecola molto grande,
per cui se non si ripiegasse e non si compattasse su se stesso, non riuscirebbe ad
entrare all’interno della cellula e del nucleo. E’ in questo spazio ristretto che
avvengono numerose attività, come la replicazione e la trascrizione, ed è qui che
l’organizzazione del DNA deve modificarsi per consentire continue transizione
tra stati attivi e inattivi. Nei batteri il materiale genetico costituisce il
“nucleoide”, un ammasso compatto che occupa 1/3 del volume cellulare. Nei nuclei
eucariotici, non in divisione (interfase), invece, il materiale genetico è presente
sottoforma di “fibre di cromatina” costituita da proteine, DNA e da una piccola
quantità di RNA fortemente dispersa nel nucleo. Quando poi la cellula si prepara
a dividersi, la cromatina si condensa e si organizza in un numero di “cromosomi”
che è specie-specifica. Il DNA organizzato nel cromosoma è molto stabile, a
differenza di molecole di DNA completamente nude, le quali invece sono
relativamente instabili; inoltre soltanto il DNA compattato nel cromosoma può
essere trasmesso efficientemente ad entrambe le cellule figlie ad ogni evento di
divisione cellulare. La cromatina quindi presenta diversi livelli di organizzazione
strutturale, l’ultimo dei quali è rappresentato appunto dai cromosomi. Il primo
livello di organizzazione della cromatina è dato dai “nucleosomi”. Il nucleosoma
riduce la lunghezza del DNA nudo di circa sei volte, portando così alla formazione
di una fibre di circa 10 nm di diametro, detta anche struttura a “collana di perle”.
Tale struttura può essere visualizzata sottoponendo i nuclei interfasici in
soluzione a debole forza ionica. Ciascun nucleosoma è costituito da un core
centrale di otto proteine istoniche e il DNA è avvolto attorno a tali proteine. I
singoli nucleosomi si uniscono tra di loro mediante un DNA non direttamente
complessato con l’ottamero di istoni, detto “DNA linker”. Il DNA associato
all’ottamero di istoni, invece, è detto “DNA core”, il quale è avvolto 1,65 volte
attorno all’ottamero istonico, come un filo attorno ad un rocchetto. Nella
cromatina sono presenti due tipi di proteine associate al DNA: gli “istoni” e le
“proteine non istoniche”. Gli istoni sono di gran lunga le proteine più abbondanti
associate con il DNA eucariotico; esse sono basiche, relativamente piccole, con
una carica netta positiva che facilita e stabilizza il loro legame con le molecole di
DNA cariche negativamente. Gli istoni associati al DNA eucariotico sono
principalmente di cinque tipi: H1, H2A, H2B, H3 e H4. Gli istoni H2A, H2B, H3 e
H4 sono gli “istoni del core” e due copie di ciascuno di questi istoni formano il
complesso proteico (core) attorno al quale si avvolge il DNA nucleosomico.
L’istone H1, invece, non fa parte del core nucleosomico, ma lega il DNA linker che
unisce due nucleosomi adiacenti (definito “istone liker”). Gli istoni contengono un
grande numero di amminoacidi carichi positivamente, infatti almeno il 20% dei
residui amminoacidici contenuti negli istoni sono di lisina o arginina. Il core
nucleosomico ha una struttura discoidale che si assembla soltanto in presenza di
DNA, infatti in assenza dell’acido nucleico gli istoni formano in soluzione dei
complessi intermedi. Gli istoni sono formati da una regione conservata che viene
chiamata “dominio histone-fold”. Tale dominio è importante per la formazione di
questi complessi intermedi. L’histone-fold è formato da tre regioni α elica e
media la formazione testa-coda di specifiche coppie eterodimeriche. Gli istoni
H3 e H4 formano degli eterodimeri che poi si associano dando origine a un
tetramero in cui sono presenti due H3 e due H4. H2A e H2B, invece, formano
eterodimeri che però non tatramerizzano. L’assemblaggio di un nucleosoma,
quindi, prevede l’associazione ordinata di questi complessi proteici con il DNA.
Prima il tetramero H3●H4 lega il DNA, successivamente due dimeri H2A●H2B si
uniscono al tetramero per formare il nucleosoma completo. Ciascun istone del
core possiede un’estensione ammino-terminale chiamata “coda”. Essa è priva di
una struttura definita e sporge all’esterno del nucleosoma rendendosi accessibile.
Tali code non sono necessarie per l’associazione del DNA con l’ottamero istonico,
ma invece sono sedi di consistenti modificazioni in grado di cambiare la funzione
del singolo nucleosoma. Queste modificazioni includono la fosforilazione,
l’acetilazione e la metilazione dei residui di serina, lisina ed arginina. Una volta
che i nucleosomi si sono formati, il passaggio successivo che permette di
determinare un ulteriore impacchettamento del DNA è il legame dell'istone H1.
Come gli istoni del core, H1 è una piccola proteina con carica netta positiva. Esso
interagisce con il DNA linker costringendo il DNA ad una maggiore adesione
all'ottamero istonico. Il legame di H1 stabilizza, quindi, una struttura cromatinica
di ordine superiore, la “fibra da 30 nm”. Questa struttura rappresenta il
successivo livello strutturale necessario per condensare il DNA e può essere
visualizzato sottoponendo in questo caso i nuclei interfasici ad una maggiore
forza ionica. Esistono due modelli strutturali che possono spiegare la fibra di 30
nm: nel primo, detto a solenoide, il DNA è organizzato in nucleosomi a formare
una superelica contenente approssimativamente sei nucleosomi per giro; nel
secondo, invece, detto a zig-zag, i nucleosomi si dispongono appunto a zig-zag,
sempre in aggiunta dell'istone H1. Gli istoni mancanti delle code ammino-terminali
sono incapaci di formare la fibra da 30 nm. Il ruolo più verosimile delle code è
quello di stabilizzare tale fibra interagendo con i nucleosomi adiacenti. La
condensazione del DNA nei nucleosomi e la formazione della fibra da 30 nm
durante l’interfase, tuttavia, permettono una compattazione del DNA
approssimativamente di 40 volte. Questo grado di compattazione è, però, ancora
insufficiente, per cui durante la mitosi il DNA deve essere condensato
ulteriormente per poter formare i cromosomi. A tale scopo, la fibra da 30 nm si
ripiega a formare una struttura costituita da 6 anse disposte attorno ad
un’impalcatura proteica detta “scafflod nucleare”; nell’insieme tale struttura è
definita “struttura a rosetta”. Un insieme di 30 rosette va a costituire un
“avvolgimento” e, infine, 10 avvolgimenti costituiscono ognuno dei due cromatidi
fratelli. Le proteine che fanno parte dello scafflod nucleare sono principalmente
la “topoisomerasi II” e le “proteine SMC” (proteine del mantenimento della
struttura del cromosoma). La presenza della topoisomerasi II alla base di ciascun
ansa dovrebbe far sì che le anse siano topologicamente isolate le une dalle altre,
mentre le proteine SMC sono coinvolte nella condensazione e nel tenere uniti i
cromosomi eucariotici.

Eterocromatina e Eucromatina
Esistono due forme di cromatina: l’ “eucromatina” e l’ “eterocromatina”.
L’eucromatina contiene un’elevata quantità di proteine non istoniche ed è
costituita da DNA scarsamente colorabile e altamente ripetuto. Essa
rappresenta la maggior parte del genoma e durante l’interfase appare
estremamente decondensata occupando gran parte del volume nucleare. In tale
fase, è scarsamente colorabile con i coloranti basici (è più chiara). Durante la
mitosi, invece, essa va incontro ad una fase di condensazione, diventando ben
colorabile con i coloranti basici (diventa più scura). E’ questa, dunque, la
componente della cromatina che subisce l’alternanza tra stati di condensazione e
decondensazione durante le varie fasi del ciclo cellulare. L’eterocromatina,
invece, contiene una minore quantità di proteine non istoniche ed è costituita da
DNA altamente ripetuto che non viene mai trascritto. Essa è sempre presente in
uno stato di elevata condensazione durante tutto il ciclo cellulare, per cui di
conseguenza ha una colorazione più intensa dell’eucromatina, sia durante
l’interfase che durante la mitosi. Nelle stesse fibre si alternano, senza
interruzione, eucromatina ed eterocromatina che, come sappiamo, rappresentano
gradi diversi di condensazione del materiale genetico e ciò è direttamente
correlato con la loro attività trascrizionale. Infatti i geni all’interno
dell’eterocromatina sono trascrizionalmente inattivi, al contrario di quelli
dell’eucromatina che invece sono trascrizionalmente attivi. L’eterocromatina può
essere distinta a sua volta in: “eterocromatina costitutiva” ed “eterocromatina
facoltativa”. L’eterocromatina costitutiva è costituita da regioni di DNA
altamente ripetitivo, concentrata principalmente a livello del centromero e dei
telomeri. L’eterocromatina facoltativa, invece, corrisponde a specifiche regioni o
anche ad interi cromosomi che sono altamente condensati e, quindi
trascrizionalmente inattivi in una linea cellulare, mentre in un’altra linea cellulare
le stesse sequenze possono essere meno condensate e costituite da eucromatina
e, quindi essere trascrizionalmente attive. Un esempio di eterocromatina
facoltativa è quella che costituisce il “corpo di Barr”, un cromosoma X inattivo
nelle cellule somatiche di femmine (XX) di mammifero.

Acetilazione, Metilazione e Fosforilazione: come sappiamo, in vivo il DNA è


complessato con la cromatina. L’eucromatina è aperta, più accessibile, mentre
l’eterocromatina è chiusa, non trascrivibile. Tuttavia una parte
dell’eterocromatina è facoltativa, cioè la sua trascrizione è attivata solo in alcuni
momenti. Poiché la cromatina è capace di variare il suo livello di compattamento
questa subisce una serie di modificazioni, rendendo così disponibile il DNA al
macchinario di trascrizione. Le modificazioni che interessano la cromatina
avvengono a livello delle code degli istoni in corrispondenza della loro estremità
N-terminale, formata da residui basici carichi positivamente. Queste estremità
fuoriescono dal nucleosoma, rendendosi disponibili alle modificazioni post-
traduzionali che influenzano il grado di compattamento del DNA nella cromatina,
attraverso reazioni che implicano l’aggiunta di gruppi chimici (mediante legami
covalenti) su gruppi liberi di determinati amminoacidi. Tra queste modificazioni vi
sono la fosforilazione, l’acetilazione e la metilazione di amminoacidi quali arginina,
istidina, lisina e serina. L’acetilazione consiste nell’aggiunta di CH3COOH (acido
acetico) a residui di lisina carichi positivamente presenti negli istoni.
L’acetilazione delle lisine sulle code N-terminali tendono ad allentare la struttura
della cromatina (diminuisce quindi il grado di compattamento del DNA), in parte
perché l’aggiunta di un gruppo acetile alle lisine rimuove la loro carica positiva,
riducendo così l’affinità delle code per i nucleosomi adiacenti. La reazione di
acetilazione è catalizzata da enzimi “istone acetiltransferasi” (HAT), i quali
acetilano gli istoni favorendo la trascrizione, mentre la reazione di deacetilazione
è catalizzata da altri enzimi detti “istone deacetilasi” (HDAC), i quali comportano
la rimozione dei gruppi acetilici, aumentano il compattamento della cromatina e
riducono la velocità di trascrizione. Le code istoniche deacetilate, infatti,
interagiscono con quelle adiacenti, causando un ripiegamento e quindi una
maggiore condensazione della cromatina. La metilazione, invece, consiste
nell’aggiunta di un gruppo metile –CH3 su residui di lisina e arginina, e tale
reazione è catalizzata dall’enzima “istone metil-transferasi”. La metilazione causa
un aumento del grado di compattamento della cromatina e quindi fa da repressore
della trascrizione. I gruppi metilici sono rimossi dagli enzimi “istone demetilasi”,
che provocano una diminuzione del grado di compattamento stimolando la
trascrizione. La fosforilazione, infine, consiste nell’aggiunta di gruppi fosfato su
residui di serina, treonina e tirosina, i quali sono amminoacidi che possiedono un
gruppo –OH libero, non su H3 o H4 ma su H1. Essa è mediata da enzimi chinasi
fosfatasi che operano durante la divisione (fase M del ciclo cellulare) della
cellula, conferendo ad H1 particolari caratteristiche che consentono di rallentare
o velocizzare il ciclo cellulare.
I cromosomi eucariotici
Il numero di cromosomi, salvo rare eccezioni, è caratteristico per ciascuna
specie. Molti eucarioti hanno due copie di ciascun cromosoma presente nel nucleo
e, per questo motivo, il loro assetto genetico è definito “diploide”. Gli eucarioti
diploidi sono generati in seguito alla fusione di due “gamenti”, ciascun dei quali
possiede una sola serie di cromosomi, ed è quindi definito assetto “aploide”. Negli
organismi diploidi i componenti di ciascuna coppia cromosomica, che contengono
gli stessi geni e che si appaiono alla meiosi, sono detti “cromosomi omologhi”,
mentre i cromosomi che contengono geni diversi e che, quindi, non si appaiono alla
meiosi, sono detti “cromosomi non omologhi”. Negli animali e in alcune piante le
cellule maschili e femminili si distinguono in base ai cosiddetti “cromosomi
sessuali” (X e Y). I cromosomi non sessuali sono detti, invece, “autosomi”.
Esistono tecniche attraverso cui si può determinare il “cariotipo”, ossia il numero
e il tipo di cromosomi presenti in una cellula eucariotica. Una di queste è la
tecnica del “bandeggio G”, la quale si attua quando i cromosomi raggiungono il
massimo grado di compattamento, cioè durante la metafase, in cui si dispongono
all’equatore del fuso mitotico a formare la “piastra metafasica”. Trattando la
cellula con “colchicina”, una sostanza chimica che impedisce la polimerizzazione
dei microtubuli del fuso e la formazione del fuso stesso, si avrà come risultato
che i cromosomi non possono migrare verso i poli della cellula e proseguire con la
divisione, per cui resteranno bloccati a livello dell’equatore del fuso. Segue poi
una colorazione con il colorante “giemsa”, il quale si lega ai cromosomi, e un
successivo lavaggio per rimuovere il colorante in eccesso (il colorante legate
invece permane). Dopo questo lavaggio i cromosomi appariranno come una
successione di bande chiare e bande scure: le bande scure sono quelle in cui il
colorante ha attecchito e sono ricche di adenina e timina, hanno pochi geni
espressi e presentano sequenze di DNA ripetuto; le bande chiare, invece, sono
quelle dove il colorante non ha attecchito, sono ricche di guanina e citosina,
contengono sequenze Alu e presentano geni espressi. Dall’osservazione del
cariotipo è possibile rilevare anomalie nei cromosomi: queste alterazioni possono
essere di tipo “qualitativo”, quando le traslocazioni sono bilanciate e non si ha
perdita di materiale genetico, ma si ha mescolamento delle informazioni
genetiche, oppure di tipo “quantitativo”, quando vi è una variazione del numero di
cromosomi. Un esempio può essere costituito dalla “sindrome di Down”, la quale è
un’alterazione di tipo quantitativo che colpisce il cromosoma 21, dove al posto di 2
copie autosomiche ce ne sono 3. Un esame importante che viene utilizzato per
scovare la presenza di eventuali anomalie è l’ “amniocentesi”, che serve appunto
ad osservare se il numero di cromosomi è corretto e se vi sono alterazioni.
Centromeri
Un’altra tecnica di bandeggio cromosomico è quella del “bandeggio C”, che mette
in evidenza le regioni centromeriche. Anche in questo caso la colorazione è
effettuata su piastra metafasica e ritroviamo regioni più colorate e regioni meno
colorate. Le più colorate sono ricche di DNA ripetuto e corrispondono alle regioni
centromeriche. Ogni cromosoma, infatti, presenta una zona di restrizione
chiamata “centromero”: si tratta di una struttura importante per la segregazione
dei cromosomi (nei due cromatidi fratelli) durante la mitosi. Il centromero è
composto da DNA altamente ripetuto ed è coperto da eterocromatina, per cui
non contiene nessuna sequenza codificante. Esso non occupa la stessa posizione in
tutti i cromosomi e divide ogni cromatidio in due parti, i “bracci” (lungo “q”, e
corto “p”), la cui lunghezza dipende dalla posizione del centromero stesso. In
base alla posizione del centromero i cromosomi si possono dividere in:
 “Cromosomi acrocentrici”: centromero in posizione subterminale (in
prossimità di una delle estremità);
 “Cromosomi submetacentrici”: centromero in posizione submediana
(spostato verso una delle due estremità);
 “Cromosomi metacentrici”: centromero in posizione mediana;
 “Cromosomi telocentrici”: centromero in posizione terminale.
I cromosomi acrocentrici sono caratterizzati da strutture particolari presenti
all’estremità del braccio corto, i “satelliti”. Essi sono connessi all’estremità del
braccio corto attraverso una strozzatura detta “costrizione secondaria”.

Possiamo considerare come esempio di centromero eucariotico il centromero di


lievito. In tale organismo sono stati condotti una serie di esperimenti per cercare
di individuare la lunghezza minima della sequenza in grado di svolgere una
funzione centromerica. Dopo delezioni successive, si è accertato che le sequenze
necessarie per la funzione centromerica sono comprese in un tratto di DNA lungo
120 bp: quest’ultime formano la “regione CEN”. In essa si distinguono tre regioni
conservate in tutti gli eucarioti:
 CDE 1: localizzata nella regione terminale sinistra di tutti i centromeri e
costituita da una sequenza di 9 bp;
 CDE 2: localizzata nella regione centrale del centromero lunga 80-90 bp e
costituita per oltre il 90% da A-T;
 CDE 3: localizzata nella regione terminale destra e costituita da una
sequenza di 11 bp altamente conservate.
In seguito le sequenze della regione CEN sono state mutagenizzate, cambiando
un nucleotide. Quando le mutazioni colpiscono le regioni CDE 1 e CDE 2, la
funzione del centromero si riduce, ma non si perde; mutazione che invece
interessano la regione CDE 3 annullano completamente la funzione del
centromero. Alcuni esperimenti hanno, inoltre, dimostrato che è possibile
sostituire l’elemento CEN di un cromosoma di lievito con quello di un altro
cromosoma senza alcuna conseguenza. Ciò dipende dal fatto che queste regioni
del DNA, pur non avendo potere codificante, sono altamente conservate in quanto
hanno un importante ruolo strutturale: quello di mediare le interazioni tra il
cromosoma e le fibre di actina del fuso mitotico. Più precisamente è la regione
del CDE 3 che media questa interazione, in quanto essa si lega ad un complesso
proteico detto “CBF 3” che, a sua volta, interagisce con una proteina linker che
prende contatto con i microtubuli del fuso. Questa struttura costituisce
nell’insieme il “cinetocore” ed all’interno di esso il complesso proteico CBF 3 è
dotato di attività motoria in quanto è capace di muoversi lungo i microtubuli
usando l’energia che deriva dall’idrolisi di ATP. Negli eucarioti superiori, tuttavia,
la lunghezza minima richiesta per svolgere la funzione centromerica è maggiore.
Si parla di centinaia o forse migliaia di basi, anche se non è stato possibile
determinare con certezza la lunghezza.

Telomeri
Un altro elemento strutturale presente in tutti i cromosomi è il telomero,
costituito da una lunga serie di brevi sequenze ricche di G e T ripetute molte
volte in tandem, e sono localizzati alle due estremità dei cromosomi lineari. Il
DNA dei telomeri appartiene alla stessa categoria del DNA dei centromeri: è
composto da DNA satellite che ha una funzione strutturale e non codificante. I
telomeri svolgono quattro funzioni principali:
 Evitano che le estremità generate da rotture cromosomiche possano
fondersi formando un cromosoma anomalo;
 Proteggono le regioni codificanti dalla degradazione delle esonucleasi, cioè
evitano che nei cromosomi termini la sequenza codificante;
 Contribuiscono alla localizzazione dei cromosomi nel nucleo tramite
l’associazione con la membrana nucleare;
 Svolgono un ruolo importante nella replicazione, facendo sì che tra una
replicazione e l’altra non venga persa alcuna informazione presente nei
cromosomi.
Le estremità di ciascun cromosoma lineare non vengono facilmente replicate dalla
DNA polimerasi e, di conseguenza, ad ogni duplicazione il cromosoma tenderebbe
ad accorciarsi perdendo così materiale genetico e, dunque, la sua funzionalità. Il
problema viene risolto quindi dalla presenza dei telomeri, che aggiunti alle
estremità dei cromosomi proteggono le regioni codificanti, subendo essi un
accorciamento ad ogni duplicazione. Infatti, in tal caso, ciascun filamento
perderà DNA telomerico e non sequenze codificanti. Successivamente tale DNA
telomerico viene sintetizzato da un enzima detto “telomerasi”, per cui la
lunghezza si mantiene costante impedendo che le sequenze codificanti siano
aggredite dalle esonucleasi. La presenza di un limite al numero di divisioni
cellulari, dovuto all'accorciamento dei telomeri, fu individuato per la prima volta
da Leonard Hayflick. Hayflick ha scoperto che, anche quando isolate, le cellule
possono dividersi solo un numero limitato di volte, dimostrando che ogni cellula ha
un meccanismo intrinseco che limita il numero di divisioni cui può partecipare la
cellula stessa, e quindi stabilire la durata della sua vita. I suoi studi hanno
portato ad ipotizzare che è la lunghezza del telomero a limitare il numero di volte
che una cellula si può dividere: esso è quindi indice della “senescenza della
cellula”. In accordo con queste ipotesi, è stato osservato che il DNA telomerico
isolato da una persona giovane è più lungo di quello isolato da una persona più
anziana. A conferma di ciò si è visto come le cellule staminali e quelle tumorali non
rispondano a tale legge, in quanto in esse la vita è più lunga grazie al
mantenimento dell’attività della telomerasi. Gli studi sulle cellule tumorali in
coltura, infatti, dimostrano come queste si possono dividere un numero infinito di
volte, tant’è che vengono dette “immortalizzate”. Uno studio sui telomeri è stato
compiuto anche sulla pecora Dolly, il primo mammifero clonato nel 1997. In questo
caso è stato osservato che i telomeri di Dolly erano lunghi quanto quelli della
“madre”, e ciò era in disaccordo rispetto alla sua età. Dolly, infatti, invecchiava
più velocemente rispetto a quanto ci si aspettasse, e questo provava
ulteriormente come la lunghezza dei telomeri sia un indice dell’età di una cellula.

I genomi
La quantità di DNA presente in un genoma aploide è caratteristica per ogni
specie vivente ed è indicata dal “valore C”: C presenta un ambito di variabilità
enorme. Le cellule degli animali e delle piante più evolute possiedono più DNA
rispetto ad E.coli e ciò dipende dal fatto che passando da organismi unicellulari
ad organismi pluricellulari, non solo aumentano le funzioni svolte da tali organismi,
ma esse divengono anche più differenziate e complesse. A ciò deve corrispondere
una maggiore complessità del DNA che codifica per le proteine che svolgono tali
funzioni. Tuttavia, non tutto il DNA presente nelle cellule viene utilizzato per
codificare proteine; in realtà è stato osservato che solo una parte di DNA è
trasformato in proteine, per cui non c’è corrispondenza tra la quantità di DNA
presente nel genoma ed il numero delle proteine codificate: questo fenomeno è
noto come “paradosso del valore C”. Si è cercato di dare una spiegazione a tale
fenomeno e per questo sono stati condotti degli esperimenti basati sulla cinetica
di riassociazione del DNA denaturato di un genoma. Come sappiamo, se si
sottopone il DNA ad un aumento della temperatura o a variazioni di pH, esso si
denatura dissociandosi nei due filamenti che lo compongono. Tale denaturazione è
reversibile perché, rimuovendo l’agente denaturante, il DNA si rinatura e questa
riassociazione è dovuta all’appaiamento tra le basi complementari. Per
determinare la cinetica di riassociazione si utilizza la tecnica dell’ibridazione:
questa tecnica consiste nella formazione di molecole ibride quando DNA
denaturati, ma omologhi, provenienti da due fonti diverse vengono mescolati nelle
condizioni appropriate di temperatura e forza ionica. Alternativamente si può
porre in soluzione, in una stessa provetta, il DNA denaturato ed un singolo
filamento di DNA a sequenza nota. In entrambi i casi, la rinaturazione del DNA
dipenderà dall’interazione dei due filamenti complementari e seguirà le leggi della
reazione di secondo ordine. Quindi:

-KC2 = dC / dT
dove:
K = costante di riassociazione
C = concentrazione di DNA a singolo filamento
T = tempo

Integrando l’equazione con la concentrazione iniziale di DNA Co al to, e la


concentrazione C del DNA che rimane a singolo filamento al tempo t, si ha:

C / Co = 1 / 1 + K Cot

da cui ricaviamo che la reazione di dissociazione dipende dalla concentrazione di


DNA. Tuttavia, invece di fare riferimento al tempo necessario perché si abbia la
completa rinaturazione del DNA, si considera il tempo necessario perché si
riassoci il 50% del DNA. Tale tempo è detto Cot ½ ed è espresso dalla relazione:

1 / 1 + K Cot ½ quindi Co t ½ = 1/K

dove Cot ½ è il prodotto della concentrazione iniziale del DNA per il tempo in cui
si ha una riassociazione del 50%. Da questa equazione ricaviamo che il tempo t ½
è direttamente proporzionale alla concentrazione iniziale del DNA ed è
inversamente proporzionale alla costante di velocità K. Questo significa che
all’aumentare della lunghezza del genoma (Co), diminuisce K e quindi aumenta t ½.
Più precisamente Cot ½ dipende dalla complessità del genoma: più è lungo
quest’ultimo, e dunque più complesso il DNA, più è lungo il tempo di riassociazione.
Questa cinetica di riassociazione può essere rappresentata graficamente
mediante la “curva del Cot” in cui la frazione di DNA che si riassocia è riportata
in funzione del log Cot. Se analizziamo il fenomeno di denaturazione e
rinaturazione del DNA di tre organismi procariotici, il grafico mostra che
nonostante si tratti di tipi di procarioti diversi, l’andamento della curva del Cot è
sempre uguale; ciò che varia è solo la complessità degli organismi.

I genomi eucariotici
Gli stessi esperimenti di riassociazione eseguiti con il DNA procariotico sono
stati effettuati con DNA eucariotico, ottenendo una curva più complessa in
quanto in essa si osservano tre regioni ad andamento sigmoidale sovrapposte. Ciò
significa che nel DNA eucariotico si possono identificare tre diverse componenti,
che differiscono tra loro per la velocità di riassociazione:
1. Una “componente veloce” (corrispondente al 25% del genoma), così definita
in quanto rappresenta la prima frazione che si riassocia. Infatti essa ha una
complessità molto bassa, cioè contiene una sequenza do 300 bp che si ripete
500.000 volte nel genoma. A questa bassa complessità dunque corrisponde
un basso valore del Co t ½ .
2. Una “componente intermedia” (corrispondente al 30% del genoma), la quale
si riassocia un po’ più lentamente rispetto alla componente veloce in quanto
ha una complessità maggiore, essendo costituita da una sequenza di 6 x 105
bp che si ripete 350 volte nel genoma. A questa maggiore complessità
corrisponde un valore maggiore di Co t ½.
3. Una “componente lenta” (corrispondente al 45% del genoma), che è l’ultima a
rinaturare in quanto ha una complessità molto alta, essendo costituita da
una sequenza di 3 x 108 bp che è presente una sola volta nel genoma.
La componente veloce rappresenta il “DNA altamente ripetuto”, la componente
intermedia invece rappresenta il “DNA mediamente ripetuto”, la componente
lenta infine rappresenta il “DNA a sequenza unica o non ripetuto”. Quest’ultima
componente corrisponde alla porzione di DNA che codifica per la maggior parte
delle proteine e corrisponde all’unica componente del DNA procariotico.

E’ necessario sottolineare la differenza tra la componente lenta del DNA


eucariotico e quella del DNA procariotico. Il DNA procariotico possiede due
importanti caratteristiche:
1) E’ “colineare” con l’RNA, quindi c’è una perfetta corrispondenza tra le
sequenze nucleotidiche del DNA e quelle dell’mRNA. Di conseguenza, la
sequenza di nucleotidi nel gene corrisponde esattamente alla sequenza di
amminoacidi nella proteina.
2) Gli mRNA sono “policistronici”, cioè portano sequenza codificanti per più
proteine.
Negli eucarioti, invece:
1) Gli mRNA sono “monocistronici”, cioè ognuno di essi porta l’informazione
per una singola proteina.
2) Non c’è “colinearità” tra DNA e mRNA, perché il DNA contiene una serie
addizionale di sequenze che non si riscontrano nell’mRNA maturo. Ciò
significa che il DNA contiene anche sequenze non codificanti. Tale
mancanza di colinearità è stata spiegata tenendo conto del fatto che i geni
eucariotici sono
3) “Discontinui”, in quanto sono costituiti da sequenze codificanti e sequenze
non codificanti. Le sequenze codificanti sono dette “esoni”, le quali vengono
conservate nell’mRNA maturo e tradotte in proteine, mentre le sequenze
non codificanti sono dette “introni”, le quali invece vengono eliminate dal
pre-mRNA, con un processo chiamato “splicing dell’RNA”, per costruire
l’mRNA maturo. Lo splicing comporta quindi l’eliminazione di un introne dal
trascritto primario e la successiva unione covalente degli esoni separati dal
precedente introne per formare l’mRNA maturo (considereremo in
dettaglio lo splicing più avanti).
All’inizio di questa scoperta, non si aveva la concezione che introni ed esoni
potessero essere intervallati gli uni dagli altri, ma si credeva che vi fossero esoni
tutti da una parte e introni dall’altra. In seguito si è capito che gli esoni sono
“isole in un mare di introni”, infatti circa il 5% del DNA di un gene è
rappresentato dalla parte codificante la proteina, il rimanente 95% è costituito
invece da sequenze non codificanti.

Pseudogeni
Un altro fattore che contribuisce a spiegare il paradosso C è rappresentato
dall’esistenza nel genoma di “pseudogeni”. Essi sono delle regioni presenti nel
DNA eucariotico che possiedono un’organizzazione simile ai geni funzionali, cioè
sono costituiti dall’alternanza di esoni e di intoni, ma non possono essere tradotti
in una proteina funzionante a causa di diverse mutazioni.
1. Se la mutazione avviene a livello della regione che controlla la trascrizione
del gene, esso non sarà più trascritto e dunque non sarà più espresso (cioè
sarà un gene silente). Tale mutazione porta quindi all’abolizione del segnale
per l’inizio della trascrizione.
2. La mutazione può avvenire durante il processo di maturazione dell’mRNA
che porta appunto alla formazione dell’mRNA maturo (processo di splicing).
La maturazione dell’mRNA dovrebbe avvenire in modo tale da consentire la
formazione di un codone in seguito al corretto ricongiungimento degli esoni
adiacenti. Tale mutazione tuttavia porta l’inibizione dello splicing e quindi
alla formazione di una proteina non funzionante.
3. Si possono avere anche mutazioni che cambiano la cornice di lettura per cui
si crea un codone di stop che determina la formazione di una proteina
tronca. Tale mutazione porta alla terminazione prematura della traduzione.
4. Infine si possono avere mutazioni nel corso della sintesi proteica.
Dunque gli pseudogeni rientrano nel “pool” di DNA che non codifica per alcuna
proteina. Essi sono anche definiti “i rami secchi dell’evoluzione”, in quanto
durante l’evoluzione ad un certo punto si è avuta una mutazione che ha reso il
gene inattivo.

DNA altamente ripetuto


Il “DNA altamente ripetuto” consiste di sequenze molto piccole (4-7 nucleotidi)
ripetute in tandem migliaia di volte e organizzate in blocchi. E’ per la brevità di
queste sequenze che tale DNA è detto anche a “sequenza semplice”. Il DNA
altamente ripetuto comprende: il “DNA satellite”, i “minisatelliti” e i
“microsatelliti”.

DNA satellite: il DNA satellite ha una composizione in basi differente rispetto al


resto del genoma, che gli conferisce proprietà fisiche differenti come, ad
esempio, la “densità di flottazione”, che
può essere sfruttata per isolare tale
componente dal resto del genoma. La
densità di flottazione di un DNA dipende
dal suo contenuto in coppie G-C e può
essere determinata centrifugando il DNA
in un gradiente di densità di cloruro di
cesio (CsCl). Il tal caso il DNA forma una
banda nel punto della soluzione in cui la
sua densità di flottazione è uguale a quella
della soluzione. Questa modalità di
centrifugazione è perciò definita “isopicnica” (isodensità). Applicando tale
tecnica al DNA eucariotico si ottengono due bande: una più grande, che
rappresenta la maggior parte del genoma (92%), ed una banda più piccola, che
invece rappresenta il DNA satellite (8%). E’ stato osservato che il DNA satellite
si trova nell’eterocromatina che è situata all’interno dei centromeri, per cui la
presenza del DNA satellite a livello di queste strutture indica che esso ha un
ruolo strutturale e non codificante. In accordo con la semplicità della loro
sequenza i DNA satelliti non vengono né trascritti né tradotti. In Drosophila,
invece, si osservano tre bande di DNA satellite, ognuna con una propria densità di
flottazione che, insieme ad un “satellite criptico”, costituiscono più del 40% del
genoma. I “satelliti criptici” sono delle sequenze ripetute in tandem che, in
seguito a centrifugazione isopicnica, non si visualizzano come bande separate
(satelliti), ma restano compresi entro la banda principale. Il motivo per cui il DNA
satellite accumula mutazioni è rappresentato dal fatto che, dal momento che esso
non codifica per nessun prodotto, su di esso non si esercita alcuna pressione
selettiva. Proprio per tale motivo queste sequenze di DNA sono quelle che
permettono l’identificazione di un individuo rispetto all’altro e, dunque, possono
essere utilizzate sia per l’analisi individuale che per l’analisi di paternità. Infatti
questa è l’unica porzione del DNA a differenziare un individuo da un altro; al
contrario i geni che codificano per i prodotti proteici sono uguali in tutti gli
individui in quanto devono codificare per gli stessi prodotti proteici. Dal momento
che il DNA satellite non codifica per alcuna proteina, è stato definito come “DNA
egoista” (selfish) perché interessato unicamente alla replicazione di sé stesso.

DNA minisatellite e microsatellite: nei genomi dei mammiferi sono presenti delle
regioni molto simili ai satelliti in quanto anch’esse costituite da brevi sequenze in
tandem, ma non possono essere considerate dei veri e propri satelliti, in primo
luogo perché l’unità ripetitiva è più piccola rispetto a quella dei satelliti, e in
secondo luogo perché tale unità si ripete un numero minore di volte. Infatti,
mentre il DNA satellite è costituito da un’unità lunga che si ripete in tandem
milioni di volte, il “DNA minisatellite” è formato da un’unità di lunghezza
intermedia che si ripete migliaia di volte, mentre il “DNA microsatellite” è
costituito da una piccola unità che si ripete 100 volte nel genoma. Così come i
satelliti, anche questi DNA possono essere localizzati a livello dei centromeri, dei
telomeri o sparsi in regioni cromosomiche differenti. Il DNA minisatellite e il
DNA microsatellite sono caratterizzati da un intenso “polimorfismo”: si parla di
polimorfismo in quanto tali sequenze sono coinvolte in modificazioni di vario tipo
(es. delezioni, inserzioni) che ne modificano la sequenza, variandone nel contempo
anche la lunghezza. Tuttavia, dal momento che questi tratti di DNA non
codificano per alcun prodotto genico, queste variazioni non comportano
alterazioni fenotipiche. Quando l’unità ripetuta contiene da 2 a 46 bp si parla di
“STR” (short tandem repeats), ovvero di una breve sequenza ripetuta in tandem e
la regione che la contiene è detta anche “regione microsatellite”; quando, invece,
l’unità ripetuta è lunga da qualche decina di bp a 200 bp è chiamata “VNTR”
(variable number tandem repeat) e la regione genomica che la contiene è detta
“regione minisatellite”. Sia che si tratti di STR che di VNTR queste sequenze, nei
vari individui, si ripetono nella stessa regione un numero differente di volte e ciò
fa si che i loci in cui tali ripetizioni sono contenute abbiano dimensioni differenti.
Proprio la grande variabilità dei microsatelliti e dei minisatelliti li rende
particolarmente utili come marcatori nelle tecniche di “tipizzazione del DNA”, o
“DNA finger printing”, cioè nelle tecniche usate in medicina legale per
l’identificazione di un individuo o nei test di paternità o maternità. Un altro tipo
di marcatore che si può utilizzare per la mappatura del genoma umano è la
sequenza “SNP” di singoli nucleotidi: si tratta di sequenze che nei vari individui
differiscono per un singolo nucleotide. E’ stato osservato che nel genoma umano
ci sono 3 milioni di SNP, molti di più degli altri tipi di marcatori descritti in
precedenza.

DNA mediamente ripetuto


Un esempio di DNA mediamente ripetuto è rappresentato dai “geni per le
globine”. I geni delle globine codificano per la componente proteica
dell’emoglobina, la “ferroproteina”, deputata al trasporto dell’ossigeno nel circolo
sanguigno. La componente proteica dell’emoglobina è formata da quattro catene
polipeptidiche simili: due di tipo α, di 141 residui amminoacidici, e due di tipo β, di
146 residui amminoacidici. Esistono diversi tipi di polipeptidi globinici di tipo α o β
che si associano in combinazioni specifiche per formare diversi tipi di emoglobine
in differenti momenti dello sviluppo. In particolare, le catene globiniche di tipo α
sono ζ (zeta) e α, mentre quelle di tipo β sono ε, γ, δ e β. Nell’embrione umano
inferiore a 8 settimane l’emoglobina è prodotta inizialmente nel “sacco vitellino”:
si tratta di un tetramero formato da due polipeptidi ζ e da due polipeptidi ε
(ζ2ε2) ed è detta “emoglobina embrionale”. Dopo circa 3 mesi di sviluppo i geni per
i polipeptidi ζ e ε non sono più trascrizionalmente attivi; in tale fase la sintesi di
catene globiniche si sposta al “fegato fetale” e alla milza: qui viene sintetizzata l’
“emoglobina fetale” (Hb-F) costituita da due polipeptidi α e due γ (α2γ2).
L’emoglobina fetale (1%) viene prodotta fino a prima della nascita, quando la
sintesi dei due tipi di catene γ si ferma ed il sito di sintesi dell’emoglobina si
sposta al midollo osseo. In questo sito viene sintetizzata l’HbA, propria
dell’individuo dopo la nascita, che da sola costituisce circa il 96% di tutta
l’emoglobina ed è composta da due catene globiniche α e due β (α2β2). L’HbA2,
invece, anch’essa presente solo dopo la nascita, è composta da due catene α e due
δ, ma rappresenta solo una piccolissima parte dell’emoglobina totale (3%). Le
catene di tipo α (ζ e α) vengono codificate da un insieme di geni che formano un
raggruppamento (o “cluster”) che si estende per 40 Kb sul “cromosoma 16”,
mentre le catene di tipo β (ε, γ, δ e β) vengono codificate da un insieme di geni
che formano un raggruppamento che si estende per 50 Kb sul “cromosoma 11”.

Analizzando il raggruppamento dei geni di tipo α si può osservare che qualunque


gene si consideri, sia esso embrionale, fetale o adulto, la struttura è conservata e
consiste di 3 esoni e 2 introni: l’esone 1 codifica per i primi 30 amminoacidi della
catena polipeptidica; l’esone 2 codifica per gli amminoacidi compresi tra 31 e 100;
l’esone 3 codifica per gli amminoacidi compresi tra 100 e 141. Tutti gli esoni
hanno una lunghezza identica e sequenze simili tra loro; in questo caso anche la
lunghezza degli introni è simile tra i vari geni di tipo α. All’interno del cluster α è
possibile osservare che tra i geni ζ e α ci sono tre regioni (ψζ, ψα2, ψα1), di cui una
ha una sequenza molto simile a ζ, mentre le altre due somigliano molto ad α. Si
tratta di sequenze le quali non possono dare un prodotto funzionale e che,
pertanto, fungono da “pseudogeni”. Analizzando il cluster dei geni di tipo β,
invece, si può osservare che anche in tal caso tutti i geni del raggruppamento
hanno un’organizzazione simile al cluster α, con 3 esoni e 2 introni: l’esone 1
codifica per i primi 30 amminoacidi della catena polipeptidica; l’esone 3 codifica
per gli amminoacidi da 105 a 146; l’esone 2 codifica per la parte della catena
polipeptidica che va a formare la tasca che accoglie il gruppo eme e, quindi,
l’ossigeno. Anche la lunghezza degli introni è simile nei vari geni del
raggruppamento β, e i due introni di ogni gene si differenziano perché, in genere,
il secondo è molto più lungo del primo. Infine, anche nel cluster β è presente uno
pseudogene: esso è localizzato tra i geni γ e δ (ψβ). In ogni raggruppamento i
diversi geni sono disposti sul cromosoma secondo un ordine che corrisponde
esattamente a quello con cui sono trascritti durante le varie fasi dello sviluppo.
Infatti, poiché l’emoglobina embrionale è formata dai polipeptidi ζ ed ε, questi
sono i primi geni che si trovano al 5’ del rispettivo cluster; seguono poi i geni delle
catene α e γ che formano l’emoglobina fetale, ed infine i geni che codificano per i
polipeptidi δ e β. Quindi, poiché la disposizione dei geni all’interno del cluster è
esattamente quella con cui essi vengono attivati, si parla di “corrispondenza
spazio-temporale”. Tale meccanismo, inoltre, prevede che il primo gene venga
attivato da un opportuno segnale e si disattivi quando viene attivato il gene
successivo: si parla, pertanto, di “co-regolazione”, cioè di regolazioni coordinate
dall’espressione genica.

Di solito la ricombinazione genetica coinvolge sequenze di DNA corrispondenti e


perfettamente appaiate, localizzate su due cromosomi omologhi. Questo tipo di
ricombinazione è detta “omologa” e l’evento di crossing over che lo genera è
detto “crossing over normale”. Il “crossing over ineguale”, invece, si genera tra
sequenze di DNA simili ma diseguali, in seguito al cattivo allineamento dei
cromosomi. Ciò porta alla formazione di “cromosomi non reciproci”, uno dei quali
porta una “duplicazione”, mentre l’altro ha una “delezione”. Nel primo cromosoma
ricombinante quindi il numero di copie del gene aumenta, mentre nel secondo
diminuisce. Il crossing over ineguale è molto frequente tra i geni globinici, infatti
esso è alla base di alcune patologie note come “talassemie”. La talassemia è una
malattia degenerativa ereditaria che comporta “anemia”, cioè un difetto di
trasporto dell’ossigeno nel sangue. Si distinguono due tipi di talassemie: l’ “α-
talassemia” e la “β-talassemia”. L’α-talassemia è dovuta a delezioni a carico dei
geni che codificano per le catene α dell’emoglobina. Dal momento che nell’uomo vi
sono quattro geni che codificano per le catene α sui due cromosomi 16, si possono
avere quadri talassemici differenti, a seconda che i geni mutati siano 1,2,3 o 4:
 La presenza di 1 gene mutato e di 3 geni selvatici determina lo stato di
“portatore silente”; in tal caso la sintesi delle catene α si riduce
leggermente a causa della mutazione del gene, ma gli altri geni selvatici
compensano ampiamente tale riduzione.
 Se ci sono 2 geni selvatici e 2 mutati, invece, si riduce la sintesi delle
catene α in modo notevole, mentre le catene β vengono sintetizzate in
eccesso. Esse formano un tetramero β detto “emoglobina H”, la quale è
meno efficace rispetto all’HBA nel trasportare l’ossigeno. I globuli rossi
che contengono tale emoglobina vanno incontro ad “emolisi”, determinando
l’insorgenza di anemia.
 Se tutti i geni di tipo α sono mutati, infine, si ha una condizione
incompatibile con la vita, infatti in tal caso la sintesi delle catene α è
completamente inibita. In loro assenza non vengono prodotte emoglobine
fisiologiche; nel feto, ad esempio, si ha un accumulo di catene γ che
polimerizzano formando un tetramero γ4 che costituisce l’ “emoglobina di
Bart”. I globuli rossi che contengono questa emoglobina vanno incontro ad
emolisi e ciò provoca la morte del feto: questa patologia è nota come
“idrope fetale”.
E’ stato osservato che il crossing over ineguale tra i geni di tipo α è un evento
abbastanza comune, mentre è più raro tra i geni di tipo β. Ciò dipende dal fatto
che nei geni di tipo α gli introni sono più brevi e, quindi, meno efficienti
nell’ostacolare l’appaiamento tra i geni non omologhi. La β-talassemia, invece, è
causata da delezioni all’interno dei geni globinici di tipo β. Poiché le catene β sono
codificate da 2 geni, ciascuno dei quali si trova su uno dei cromosomi 11, si
possono avere due forme di β-talassemia, a seconda che la mutazione interessi
uno o entrambi i geni β. La mutazione di entrambi i geni determina la “talassemia
major”, in cui la sintesi delle catene β è fortemente o completamente inibita,
provocando una grave forma di anemia; la presenza di un unico gene mutato,
invece, determina la “talassemia minor”, che è asintomatica.

I trasposoni
Nell’ambito del DNA mediamente ripetuto si riscontrano altre sequenze molto
importanti: gli “elementi trasponibili” o “trasposoni”. Si tratta di sequenze mobili
di DNA che possono migrare in regioni diverse del genoma. Nei procarioti gli
elementi trasponibili possono spostarsi in posizioni nuove sullo stesso cromosoma,
mentre negli eucarioti tali elementi possono muoversi sia sullo stesso cromosoma
sia su cromosomi diversi. Sia nei procarioti che negli eucarioti, quindi, gli elementi
trasponibili si inseriscono in nuove posizioni sul cromosoma con le quali non hanno
omologia di sequenza; la trasposizione è, dunque, un processo diverso dalla
ricombinazione omologa, ed è chiamata “ricombinazione non omologa”. Gli elementi
trasponibili possono produrre mutazioni, ad esempio, possono aumentare o
diminuire l’espressione genica inserendosi nelle sequenze regolative di un gene.

Elementi trasponibili dei procarioti: gli elementi trasponibili dei procarioti si


dividono in: “sequenze di inserzione” (IS) e “trasposoni”. Per quanto riguarda le
“sequenze di inserzione”, si tratta degli elementi trasponibili più semplici che si
possono trovare in un procariote sia nei cromosomi che nei plasmidi batterici.
Sono unità autonome e ognuna di essa contiene solo l’informazione per le proteine
necessarie alla loro trasposizione, cioè per l’inserzione dell’elemento nel
cromosoma. L’evento di trasposizione richiede la replicazione dell’elemento IS
originale attraverso l’apparato replicativo della cellula ospite. Ogni elemento IS
differisce nella sequenza ma presenta caratteristiche di organizzazione comuni.
Generalmente hanno tutti una lunghezza compresa tra 768 e 5000 bp ed hanno
alle estremità terminali delle “sequenze ripetute invertite” (IR), che sono
correlate ma non perfettamente identiche e che hanno dimensioni comprese tra
le 9 e le 41 bp. La regione centrale, invece, codifica per la “trasposasi”, la
proteina responsabile della trasposizione, in quanto essa opera un taglio
asimmetrico in specifici siti del cromosoma, detti “siti bersaglio”; ciò permette
l’inserimento dell’elemento IS.

Le sequenze a singola elica sono, poi, completate dalla DNA polimerasi e dalla
DNA ligasi (apparato replicativo della cellula ospite), con la conseguente
produzione di un elemento IS integrato con 2 ripetizioni dirette (DR) del sito
bersaglio che lo fiancheggiano. Si parla di sequenze ripetute dirette perché le
due sequenze hanno lo stesso orientamento. Ad esse si dà anche il nome di
“duplicazioni del sito bersaglio”.

La trasposizione può avvenire in tre modi differenti:


1. Nella “trasposizione replicativa” l’elemento si duplica nel corso del processo
per cui l’entità che viene effettivamente trasposta consiste in una copia
dell’elemento originale. Al termine, una copia dell’elemento continua ad
essere nel sito originale, mentre l’altra si inserisce nella nuova
localizzazione. Quindi, in questo caso, la trasposizione comporta un aumento
del numero di copie del trasposone. La trasposizione replicativa implica due
tipi di attività enzimatiche: una “trasposasi” che agisce a livello delle
estremità del trasposone originale, ed una “resolvasi” che agisce sulle copie
duplicate.
2. Nella “trasposizione non replicativa”, invece, l’elemento si traspone
direttamente come entità fisica da un sito ad un altro e come tale si
conserva. Un tipo di evento non replicativo è rappresentato dalla
3. “Trasposizione conservativa”, nella quale l’elemento viene scisso dal sito
donatore e inserito nel sito bersaglio mediante una serie di eventi in cui
ogni legame nucleotidico resta conservato. Gli elementi che utilizzano
questo meccanismo di trasposizione sono di grandi dimensioni, e possono
trasferire da un batterio all’altro non soltanto l’elemento in quanto tale ma
anche sequenze di DNA donatore.
I “trasposoni”, invece, sono segmenti mobili di DNA che, come gli elementi IS,
contengono i geni necessari per la loro inserzione nel cromosoma e per la loro
mobilità in altri siti cromosomici. A differenza degli elementi IS, i trasposoni
sono più complessi in quanto contengono altri geni. Ci sono, tuttavia, due tipi di
trasposoni procariotici: i “trasposoni compositi” e i “trasposoni non compositi”. I
“trasposoni compositi” sono trasposoni complessi, con una regione centrale,
contenente i geni, fiancheggiata su entrambi i lati da elementi IS (detti anche
“moduli IS”) che, come sappiamo, presentano sequenze ripetute ed invertite di
coppie di basi alle estremità. La trasposizione dei trasposoni compositi è resa
possibile proprio da tali elementi; essi infatti producono l'enzima “trasposasi”,
necessaria per lo spostamento. Questi elementi IS sono dello stesso tipo e sono
chiamati “ISL” (left, sinistra) e “ISR” (right, destra). Il “trasposone Tn10”, ad
esempio, è lungo 9300 bp, con una sequenza centrale unica di 6500 bp contenente
il gene per la resistenza alla tetraciclina, fiancheggiata ad entrambe le estremità
da un elemento IS di 1400 bp. I due elementi IS sono chiamati “IS10L” ed “IS10R”
e presentano un orientamento invertito (le cellule che contengono il Tn10 sono
resistenti alla tetraciclina). I “trasposoni non compositi”, invece, come il “Tn3“,
possono contenere geni per la resistenza a determinanti farmaci, ma non
presentano elementi IS alle loro estremità. Possiedono invece essi stessi delle
sequenze ripetute alle estremità, che sono necessarie per la trasposizione. Nei
trasposoni non compositi inoltre l'enzima trasposasi viene sintetizzato a partire
dai geni della parte centrale del trasposone stesso.
Elementi trasponibili degli eucarioti: elementi trasponibili sono stati individuati
anche in molti eucarioti (lievito, Drosophila, uomo). Le loro strutture e le loro
funzioni sono generalmente molto simili a quelle viste per gli elementi trasponibili
dei procarioti. Anche in questo caso, infatti, i trasposoni si integrano in un sito
bersaglio mediante un meccanismo il quale fa si che gli elementi integrati siano
fiancheggiati da una breve duplicazione del DNA del sito bersaglio, di lunghezza
caratteristica per ciascuna famiglia di trasposoni. Una forma di trasposizione
presente unicamente negli eucarioti è operata da elementi trasponibili detti
“retrotrasposoni”, sequenze di DNA cosiddette perché si muovono nel genoma
mediante gli stessi meccanismi che determinano l’integrazione dei retrovirus
(virus a RNA) nel genoma della cellula ospitante. In pratica questi elementi,
invece di trasporre da DNA a DNA, traspongono da una copia di RNA prodotto a
partire da DNA. Questo RNA è poi trasformato, mediante “trascrizione inversa”,
operata da una “trascrittasi inversa”, nuovamente in DNA che si va ad inserire in
una nuova posizione cromosomica. Nei mammiferi una porzione di DNA
mediamente ripetuto è costituito dai retrotrasposoni. Essi possono essere
raggruppati in due grandi famiglie:
1. “Superfamiglia virale”, a cui appartengono: “Ty” del lievito, copia di
Drosophila e “Line L1” dei mammiferi;
2. “Superfamiglia non virale”, a cui invece appartengono: “Sines B1/Alu” dei
mammiferi e “pseudogeni maturati”.
I retrotrasposoni della famiglia virale sono così chiamati perché ricordano i
“retrovirus” nella struttura, nelle proprietà trascrizionali e nel meccanismo di
trasposizione. Il loro DNA contiene un segmento centrale che codifica, tra le
altre proteine necessarie alla trasposizione, una “trascrittasi inversa”. Tale
segmento è circondato da lunghe ripetizioni dirette di una stessa sequenza ad
entrambe le estremità; tali ripetizioni sono dette “ripetizioni terminali lunghe”
(LTR), la cui lunghezza è estremamente variabile (da 100 a 1000 bp). Una
caratteristica dei retrotrasposoni della famiglia virale è quella di essere
attivamente trascritti e tradotti. Appartiene alla superfamiglia virale la famiglia
“Line”, che consiste di lunghe sequenze disperse nel genoma. Un tipico esempio di
elemento Line nell’uomo è rappresentato da “L1”, una sequenza che si ripete nel
genoma dalle 20 alle 50.000 volte. In genere un elemento L1 è lungo 6500 bp e
termina ad un’estremità con un tratto ricco di coppie A-T. Al contrario degli altri
retrotrasposoni della superfamiglia virale, tuttavia, L1 non possiede alle
estremità le LTR. Le Line codificano per 2 geni, uno dei quali presenta attività di
trascrittasi inversa e di integrasi, permettendo la copia e la trasposizione sia di
loro stessi, sia di altre sequenze non codificanti (come le Sine). I retrotrasposoni
della famiglia non virale, invece, vengono così definiti perché presentano
caratteristiche differenti rispetto ai retrovirus e, quindi, rispetto ai
retrotrasposoni della famiglia virale. Infatti: 1) non presentano alle estremità le
2 LTR, mentre all’estremità 3’ presentano una serie di coppie di basi A-T; 2) sono
privi di introni; 3) non codificano per alcuna proteina di tipo retrovirale
necessaria per la trasposizione. Appartiene alla superfamiglia non virale la
famiglia “Sine” dei mammiferi, la quale è costituita da corte sequenze (di 100-
300 bp) disperse nel genoma. Le Sines raramente sono trascritte, e non
codificano per la trascrittasi inversa; hanno perciò bisogno delle proteine
codificate da altre sequenze (come le Line) per trasporre. Nel genoma umano
circa la metà delle sequenze Sines è digeribile con l’enzima di restrizione “Alu 1”,
ed è per questo che vengono indicate anche come “sequenze Alu”. Ognuna di
queste sequenze si ripete nel genoma dalle 300.000 alle 500.000 volte ed ha una
lunghezza di 300 bp.

La replicazione del DNA


Una caratteristica del DNA è la sua capacità di generare molecole identiche a se
stesso. Il meccanismo mediante il quale il DNA produce una copia di se stesso è
definito “replicazione”. Quest’ultima avviene nella fase S del ciclo cellulare,
quando la cellula si prepara a dividersi: ogni volta che la cellula si divide, quindi,
l'intero genoma deve essere duplicato per poter essere trasmesso alle cellule
figlie. Prima di scoprire la reale natura di questo processo, erano stati proposti
altri modelli di replicazione del DNA. Ad esempio, il modello della duplicazione
“conservativa” prevedeva che da una molecola di DNA si sarebbero dovute
formare due molecole: la prima costituita da entrambi i filamenti originari e la
seconda da due filamenti di nuova sintesi. L'esperimento di Meselson e Stahl del
1958, tuttavia, è stato fondamentale per determinare il meccanismo
semiconservativo di replicazione del DNA. Secondo questo modello, la doppia elica
parentale viene srotolata e ciascun filamento viene utilizzato come stampo per la
sintesi del nuovo filamento, che sarà complementare al filamento parentale con il
quale si appaia. Come risultato si avranno due molecole di DNA, ognuna delle quali
è costituita quindi da un filamento parentale e da un filamento di nuova sintesi,
che poi andranno a segregarsi nelle due cellule figlie. L’unità di DNA coinvolta in
un singolo evento di replicazione viene detta “replicone”, ed ogni replicone si
attiva una sola volta per ciclo cellulare. Esso contiene degli elementi di controllo
necessari per la replicazione: in particolare è dotato di un’origine, a livello della
quale la replicazione ha inizio, ed un termine su cui il processo replicativo finisce.
In un cromosoma batterico c'è una sola origine di replicazione, quindi un solo
replicone, mentre negli eucarioti vi sono più
origini di replicazione e quindi più repliconi, i
quali devono essere attivati nel corso di un ciclo
cellulare non simultaneamente ma in un arco di
tempo abbastanza prolungato. Il punto in cui
avviene la replicazione si chiama “forca di
replicazione” (o “forcella”), la quale si sposta in
modo sequenziale sul DNA a partire dall’origine.
La replicazione può essere “unidirezionale” o
“bidirezionale”: nel primo caso una sola forca si
allontana dall’origine avanzando lungo il DNA;
nel secondo caso, invece, le forche che si
allontanano sono due e procedono in direzione
opposte. Quando si osserva al microscopio
elettronico il DNA in attiva replicazione, la regione replicata appare come una
bolla, detta “bolla di replicazione”, circondata da DNA replicato. Essa si allarga
man mano che la replicazione procede, finché alla fine si estende per tutta la
lunghezza del replicone. Le origini di replicazione sono già state identificate nei
batteri, nel lievito, nei cloroplasti e nei mitocondri, ma non ancora negli eucarioti
superiori. Una caratteristica comune è che si tratta di sequenze ricche di A e T;
ciò dipende dalla necessità di separare i filamenti del DNA per dare inizio alla
replicazione. Ricordiamo, infatti, che A e T sono unite solo da due legami idrogeno
e tali legami possono essere rotti più facilmente rispetto a quelli che uniscono G e
C che, come sappiamo, sono tenute insieme da tre legami idrogeno. Da un punto di
vista biochimico il processo di replicazione consiste in una reazione enzimatica
catalizzata dalla “DNA polimerasi”, in cui il substrato è rappresentato dal dNTP
(deossinucleotide trifosfato), dal Mg2+ e dal filamento stampo, permettendo
l’allungamento di una catena polinucleotidica (il filamento primer) mediante
l’aggiunta di un deossinucleotide all’estremità 3’-OH (figura). Ciascun nucleotide
viene selezionato in base alla complementarietà con le basi della catena stampo
(C/G – A/T). La reazione enzimatica è la seguente:

(dNMP)n + dNTP  (dNMP)n+1 + PPi


DNA DNA polimerasi + Mg2+ DNA allungato
di un nucleotide

dove:
 dNMP rappresenta il deossinucleotide 5’-monofosfato (filamento
preesistente di DNA che funge da stampo);
 dNTP rappresenta il deossinucleotide 5’-trifosfato (è il prodotto della
biosintesi dei nucleotidi);
 “n” rappresenta il numero di nucleotidi.
La sintesi della catena avviene sempre in direzione 5’-3’ e non può avvenire in
direzione contraria altrimenti non sarebbe possibile la formazione del “legame
fosfodiesterico” tra il 3’-OH terminale ed il nuovo nucleotide. Il doppio senso
delle frecce indica che la reazione è reversibile. A spingere la reazione verso
destra (in direzione della biosintesi), tuttavia, è l’idrolisi del pirofosfato (PPi),
catalizzata dall’enzima “pirofosfatasi”, in due gruppi fosfato. L’idrolisi del
pirofosfato, che rende quindi irreversibile la reazione, permette la produzione di
energia necessaria alla polimerizzazione.

DNA polimerasi
La DNA polimerasi per poter funzionare ha bisogno di:
 Magnesio;
 Una catena stampo già preformata, in quanto l’enzima sintetizza a partire
dalle informazioni presenti su un altro filamento di DNA che fa da stampo e
pertanto viene definito DNA-dipendente;
 Un innesco o “primer”, poiché non è capace di iniziare una sintesi ex-novo.
Tale primer è rappresentato da un piccolo filamento di RNA sintetizzato
dall’enzima “primasi”. Esso deve essere per forza un filamento di RNA
poiché la primasi è un enzima RNA polimerasi e, a differenza della DNA
polimerasi, non ha bisogno di un primer per iniziare la sintesi che avviene
dunque ex-novo. Generalmente il primer è costituito da una sequenza di
nucleotidi non molto lunga (15-20 nucleotidi).
 Dei substrati, rappresentati dai “deossiribonucleosidi 5’-trifosfato”, i quali
forniscono l’energia necessaria per la formazione del legame
fosfodiesterico.
La struttura della DNA polimerasi assomiglia ad una mano destra parzialmente
chiusa nella quale si colloca il complesso innesco-stampo. Il “palmo”, costituito da
un foglietto β, contiene gli elementi principali del sito catalitico e controlla la
correttezza dell’appaiamento delle basi. Le “dita”, invece, svolgono la funzione di
trattenere il dNTP (deossinucleotide 5’-trifosfato) nella corretta posizione per
la reazione catalitica. Il pollice, infine, non è direttamente coinvolto nella catalisi,
ma piuttosto interagisce con il DNA neosintetizzato. Oltre all’attività di
polimerizzazione, la DNA polimerasi svolge anche l’attività di correzione e di
riparazione. Vi sono infatti due attività “esonucleasiche”: innanzitutto abbiamo
un’attività esonucleasica 3’-5’, detta anche attività di “correzione delle bozze”, o
“proof-reading”, capace di degradare il DNA in direzione opposta alla sua sintesi.
Questa attività consiste nel controllo e nella correzione di errori che possono
verificarsi durante la replicazione. Uno di questi errori è l’appaiamento di un
nucleotide sbagliato, che se non fosse rimosso provocherebbe un
malfunzionamento della proteina risultante. L’attività dell’esonucleasi 3’-5’, quindi,
è quella di scindere il nucleotide sbagliato distruggendo il legame fosfodiestere.
Sperimentalmente venne utilizzata una DNA polimerasi priva di questa attività, e
la frequenza di errori in questo caso era aumentata di 1 x 106 nucleotidi. L’altra
attività esonucleasica, invece, è rappresentata dall’esonucleasi 5’-3’. Questa
attività è in grado di degradare una catena di DNA o RNA legata allo stampo, la
quale poi viene sostituita simultaneamente mediante l’attività polimerasica 5’-3’
dello stesso enzima. La DNA polimerasi è un enzima “processivo”. Un enzima si
dice “processivo”, o “progressivo”, quando si lega al suo substrato e non lo lascia
fino a quando non ha terminato la sua reazione. Un enzima si dice invece
“distributivo”quando si lega a più substrati contemporaneamente e partecipa a più
reazioni, lavorando solo parzialmente su tutti e generando quindi diversi prodotti.
Il grado di processività è definito come il numero medio di nucleotidi
polimerizzati dall’enzima nell’unità di tempo (ogni polimerasi ha un proprio grado
di processività).

DNA polimerasi procariotiche: in E.coli sono state individuate tre forme di DNA
polimerasi: Pol I, Pol II e Pol III.
1. La DNA polimerasi I è codificata dal gene “Pol A” ed è specializzata nella
rimozione dei primer a RNA che vengono utilizzati per iniziare la sintesi di
DNA. L'enzima consiste in una singola catena polipeptidica che, mediante
trattamento proteolitico, può essere suddivisa in due frammenti: il
maggiore (parte C-terminale), chiamato “frammento di Klenow”, è dotato
dell'attività polimerasica 5'-3' (sintesi) e dell'attività esonucleasica 3'-5'
(proof-reading), mentre il frammento più piccolo (parte N-terminale)
possiede soltanto l'attività esonucleasica 5'-3'.
2. La DNA polimerasi II, invece, è codificata dal gene “Pol B” e consiste
anch’essa di una singola catena polipeptidica. La sua funzione è tutt’ora poco
chiara, tuttavia si pensa che possa avere una funzione specializzata
nell’ambito della riparazione del DNA.
3. La DNA polimerasi III, infine, è l’enzima con l’attività di “replicasi” ed è
responsabile dell’allungamento della catena di DNA durante la replicazione.
Tale enzima è costituito dai seguenti componenti:
 Due nuclei di polimerizzazione, o “core”, costituiti: dalla subunità α
(alpha), che compie l’attività di polimerizzazione 5'-3', la subunità ε
(epsilon), che compie l’attività di proof-reading, e la subunità θ (theta),
che invece è necessaria per l’assemblaggio del nucleo enzimatico;
 Due unità τ (tau) che connettono i due core enzimatici;
 Un complesso γ (gamma) costituito da cinque subunità: la subunità γ,
che lega ATP; la subunità δ (delta), che lega β; la subunità δ', che lega γ e
δ; la subunità χ (chì), che lega le proteine SSB; infine la subunità ψ (psì),
che lega χ e γ.

La DNA polimerasi III è connessa anche alla subunità β, o “sliding clamp”, che
aumenta la processività dell’enzima. Vi sono due copie della subunità β (dimero),
che insieme formano la cosiddetta “pinza”, la quale svolge il compito di far
scivolare l’enzima sul DNA: questa pinza si apre, avvolge il DNA, e si chiude
tenendo il DNA al suo interno. Per potersi aprire e avvolgere il DNA, tuttavia, ha
bisogno di ATP che viene fornita dal “complesso γ-δ”, detto anche “caricatore
della sliding clamp” (sliding clamp loader). Quest’ultimo svolge anche la funzione
di rimuovere la pinza dal DNA nel momento in cui la reazione di sintesi del DNA è
terminata. Nel loro insieme tutte queste subunità formano il complesso
enzimatico formalmente definito “DNA polimerasi III oloenzima”, che sintetizza
il DNA con elevata processività, mentre in assenza della subunità β parliamo
semplicemente di “DNA polimerasi III core”.

Replicazione nei procarioti


La replicazione del DNA nei procarioti avviene in tre fasi: “inizio”, “allungamento”
e “terminazione”.

INIZIO: i procarioti hanno una molecola di DNA circolare a doppio filamento che
viene replicata a partire da un’unica origine di replicazione , detta “oriC”. In E.coli
oriC è lungo circa 245 bp ed è formato da brevi sequenze ripetute
particolarmente ricche di adenina e timina, le quali contengono solo due legami
idrogeno: questo permette loro di separarsi più facilmente e più velocemente.
Tali sequenze consistono in tre ripetizioni da 13 bp e quattro da 9 bp.

Si tratta di regioni in cui il DNA deve iniziare a denaturarsi. Tali regioni sono
riconosciute da specifiche proteine: in particolare 4 molecole di DNA A, ciascuna
associata ad una molecola di ATP, si legano alla sequenza consenso di 9 bp;
successivamente altre proteine DNA A si legano cooperativamente finché 20-40
molecole (monomeri) arrivano a formare un agglomerato centrale sul quale si
avvolge DNA Oric, formando una struttura simile ad un nucleosoma con le
proteine all’interno ed il DNA avvolto all’esterno. Dopo che il DNA si è avvolto
attorno alle proteine DNA A, a livello delle tre ripetizioni da 13 bp (ricche di A e
T) inizia la denaturazione della doppia elica: questa è un’operazione mediata dalla
proteina “HU”, simile agli istoni. Successivamente due esameri della proteina
“DNA B” si legano al complesso con l’aiuto della proteina “DNA C”: la DNA B
funziona come un’ “elicasi” che svolge ulteriormente il DNA in entrambe le
direzioni, creando due “forche di replicazione” (occorrono due elicasi perché la
duplicazione si muove in maniera bidirezionale).

La forca di replicazione rappresenta il punto in cui attivamente vengono


sintetizzate le due nuove catene di DNA. Essa si sposta continuamente verso la
parte del DNA non ancora denaturato e quindi non ancora replicato, lasciandosi
dietro due catene a singolo filamento su cui verranno sintetizzate le due nuove
catene di DNA grazie ad un complesso multienzimatico che contiene la DNA
polimerasi. Successivamente bisogna considerare che altre due proteine sono
necessarie per sostenere la reazione di svolgimento della doppia elica: le
“proteine SSB” e la “girasi”. La “girasi” (o “DNA topoisomerasi II”) elimina lo
stress torsionale creato dalla rotazione dell’elicasi introducendo
superavvolgimenti negativi, e la sua attività dipende dall’idrolisi di ATP. Per
quanto riguarda, invece, la proteina “SSB”, si tratta di un tetramero che si lega al
DNA per un tratto di circa 32 nucleotidi. In questo caso il legame è cooperativo:
il legame del primo tetramero, infatti, facilita il legame del secondo e così via. La
presenza di varie proteine SSB su ogni filamento di DNA stabilizza le due catene
di DNA separato e ne impedisce la rinaturazione, facendo si che ogni filamento
abbia una conformazione estesa relativamente rigida in modo tale che essa sia un
substrato ideale per la DNA polimerasi III.

ALLUNGAMENTO: una volta avvenuta la separazione dei due filamenti ad opera


delle elicasi ed una volta che ad essi si sono legate le proteine SSB, ciascuno dei
due filamenti potrà essere usato come stampo per la sintesi di un nuovo filamento
di DNA, ad opera della DNA polimerasi III. Tuttavia, nessuna DNA polimerasi
può cominciare la polimerizzazione ex novo, ma richiede la presenza di un gruppo –
OH all’estremità 3’ di un primer a RNA. Tale primer viene sintetizzato dalla
“primasi”, un enzima codificato dal gene “DNA G”. La primasi si associa
transitoriamente al “complesso di preinnesco”, precedentemente formato,
portando alla formazione del “primosoma”, costituito da DNA B, DNA C, 4
proteine iniziatrici e la primasi. Quest’ultima è attivata dalla DNA B, così da dare
inizio alla sintesi del primer di RNA. Una volta sintetizzato l’innesco, la DNA
polimerasi III oloenzima si lega al primosoma e catalizza, a partire da esso, la
sintesi del DNA in direzione 5’-3’. Come sappiamo uno dei due filamenti decorre in
direzione 5’-3’ e l’altro in direzione 3’-5’, per cui si dice che decorrono in
direzione “antiparallela”, e la sintesi avviene simultaneamente su entrambi i
filamenti. La sintesi del filamento veloce, o “guida”, procede in modo continuo,
avanzando di pari passo con la forca di replicazione. In questo caso è necessario
un solo primer di RNA per iniziare la sintesi. La sintesi del filamento lento, o
“discontinuo”, invece, avviene attraverso la sintesi di una serie di frammenti
lunghi da 1000 a 2000 nucleotidi, chiamati “frammenti di Okazaki”, nel senso
opposto alla forca di replicazione. In questo caso, invece, è necessario un primer
a RNA ogni frammento di Okazaki.
Siccome entrambi i filamenti sono sintetizzati simultaneamente da una DNA
polimerasi dimerica situata in corrispondenza della forcella di replicazione, il
filamento parentale 5’-3’ deve avvolgersi formando un’ansa (modello a trombone)
così che l’unità dimerica della DNA polimerasi che lo replica possa muoversi lungo
il filamento in direzione 3’-5’. Per cui la sintesi del frammento di Okazaki avviene
in direzione 5’-3’, in modo da mantenere l’antiparallelicità (le DNA polimerasi
polimerizzano nucleotidi solamente nella direzione 5’-3’). Questo filamento
parentale è copiato in maniera discontinua perché la DNA polimerasi deve ad
intervalli regolari dissociarsi da esso e successivamente riassociarsi.

Una volta formata l’ansa vi è l’assemblaggio della sliding clamp, caricata mediante
il “caricatore della sliding clamp” appartenente al complesso γ della polimerasi.
Praticamente succede che ogni qual volta si sintetizza un frammento di Okazaki,
la pinza β si carica, sintetizza, finisce, si scarica e si rilascia. Vi è quindi una
continua sintesi di frammenti di Okazaki con la pinza che si carica e si scarica.
I primers a RNA vengono rimossi ad opera della “DNA polimerasi I”, i quali
vengono sostituiti da catene di DNA sintetizzate dallo stesso enzima.
L’interruzione che rimane, infine, viene risaldata ad opera dalla “DNA ligasi”, che
catalizza la formazione di un legame fosfodiesterico 5’-3’. Questo legame si
sintetizza in una maniera diversa da quello della polimerasi. Esso si forma tra
l’ultimo nucleotide di un frammento di Okazaki e il primo del frammento di
Okazaki sintetizzato successivamente. A differenza della DNA polimerasi, che
utilizza come substrati i ribonucleosidi trifosfato, qua i ribonucleosidi già si
trovano nella catena, quindi non possiamo aggiungere ribonucleosidi trifosfato per
formare tale legame. In questo caso c’è bisogno di una fonte di energia fornita
dall’ATP; quindi si scinde l’ATP per formare il legame fosfodiesterico. Dapprima
un gruppo AMP (che deriva dall’ATP) viene legato ad un residuo di lisina nel sito
attivo dell’enzima formando il complesso “enzima-AMP”. Poi il gruppo 5’P che si
trova a livello dell’interruzione si lega all’AMP sostituendosi con l’enzima.
Successivamente, il gruppo 3’-OH a livello della discontinuità si lega al 5’P
rimuovendo l’AMP e fornendo un legame fosfodiesterico 5’-3’ che sigilla
l’interruzione.

TERMINAZIONE: le due forche di replicazione del cromosoma circolare di E.coli


si arrestano in una regione terminale (situata a 180° rispetto ad oriC) contenente
copie multiple di una sequenza di 20 bp dette “TER”. Le sequenze TER
funzionano come sito di legame per una specifica proteina chiamata “Tus”,
determinando la formazione del “complesso Tus-TER”. Queste proteine svolgono
un’azione controelicasica, bloccando lo svolgimento del DNA da parte della DNA
B. Il complesso Tus-TER è presente su
entrambi i lati del punto di terminazione: si
formano così due siti, da un lato e dall’altro,
denominati “trappole per forcine”, dove ognuno
blocca la forca di replicazione in arrivo dalla
direzione opposta. Ci sono due sequenze TER
per lato: TER A e TER D da una parte, TER B e
TER C dall’altra. Le due forche di replicazione
si muovono alla stessa velocità è arrivano nel punto di termine nello stesso
momento: nel caso in cui questo non avviene, la forca che arriva per prima viene
bloccata dal suo sito TER per evitare che invada l’altro lato e completi la
replicazione di quella lenta. La terminazione dà vita a due cromosomi circolari
interconnessi, chiamati “catenanes”, e la loro separazione richiede la presenza
dell’enzima “Topoisomerasi IV” che agisce rompendo temporaneamente entrambe
le catene di uno dei due cromosomi e permettendo all’altro di passare attraverso
l’interruzione.
Regolazione della replicazione: la replicazione del DNA deve essere regolata con
precisione in modo tale che avvenga una sola volta per ogni ciclo cellulare. L’inizio
della replicazione è l’unica fase che viene regolata, e studi hanno messo in
evidenza l’esistenza di particolari strutture all’interno delle origini di
replicazione, le quali fanno in modo che ciascuna origine venga utilizzata una sola
volta per ciclo cellulare. La fase di inizio è regolata dalla “metilazione” dell’origine
oriC. La regione oriC del cromosoma di E.coli è molto ricca di sequenze
palindromiche GATC: ne contiene 11 all’interno delle sue 245 coppie di basi. Tali
sequenze costituiscono il bersaglio di un particolare enzima, la “Dam metilasi”,
che catalizza l’aggiunta di un gruppo metilico (-CH3) sull’atomo di azoto N6
dell’adenina. Solo quando il DNA è completamente metilato, cioè quando la
metilazione è presente su entrambi i filamenti, esso è suscettibile ad essere
replicato: si dice quindi che è “competente” per la replicazione. Durante la
replicazione, tuttavia, nei filamenti figli vengono inserite basi non metilate, per
cui alla fine avremo un DNA “emimetilato”: ogni molecola di DNA avrà un
filamento parentale metilato ed un filamento di nuova sintesi non metilato, poiché
la metilazione è un processo che si verifica post biosintesi. Le origini emimetilate
non posso dare inizio ad un nuovo ciclo di replicazione finché la Dam metilasi non
le riconverte in sequenze completamente metilate. Ciò dipende dal fatto che
quando il DNA si trova nella forma emimetilata è in grado di legarsi alle
membrane. Tali membrane conterrebbero un inibitore che si lega al DNA
emimetilato impedendo il legame della proteina DNA A (riconosce e si lega
soltanto al DNA metilato). Tuttavia, quando poi il DNA viene rimetilato, esso
rilascia l’inibitore e, a questo punto, la DNA A è libera di dare inizio ad una nuova
replicazione.

Replicazione negli eucarioti


In un cromosoma batterico (DNA circolare) c'è una sola origine di replicazione e
quindi un solo replicone, mentre negli eucarioti (DNA lineare) i repliconi sono
presenti in diverse centinaia su ogni cromosoma. A differenza dei procarioti, il
replicone degli eucarioti è molto più piccolo e la forca di replicazione avanza
molto più lentamente. La replicazione del DNA non avviene simultaneamente in
tutti i repliconi del genoma. Vi è, invece, un ordine temporale: pertanto una parte
del DNA viene replicato in una fase precoce della fase S (repliconi precoci), una
parte a metà della fase S (repliconi intermedi) ed infine una parte di esso si
replica alla fine della fase S (repliconi tardivi). Questo vuol dire che in un
momento qualsiasi della fase S solo alcuni repliconi sono attivamente impegnati
nella replicazione. Per poter studiare i meccanismi di replicazione degli eucarioti
si è ricorso a organismi semplici come il lievito, un eucariote unicellulare. Nel
lievito le origini della replicazione sono chiamate “replicatori”, o “ARS” (sequenze
che si replicano autonomamente). Ci sono circa 400 elementi ARS distribuiti tra i
17 cromosomi del genoma di un lievito, ma sembra che non tutti vengano utilizzati
per l’inizio della replicazione (alcuni sono silenti). L’origine è costituita da una
regione centrale (core) di 146 bp contenente una sequenza consenso di 11 bp
ricca di A e T, detta “ARS sequenza consenso”, o “ACS”, in grado di reclutare le
proteine necessarie alla replicazione. L’inizio della replicazione in tutti gli
eucarioti richiede un complesso proteico, detto “ORC”, il quale si lega a numerose
sequenze contenute nel replicatore (il legame con l’origine necessita della
presenza di ATP). A differenza della DNA A dei procarioti, il legame di ORC al
replicatore di lievito non determina la separazione dei filamenti, ma
ciononostante è necessario per reclutare le restanti proteine che servono per la
replicazione. Nei replicatori, oltre alla sequenza consenso, possiamo notare anche
la presenza di altre sequenze contenenti copie imperfette del consenso, e un sito
di legame per un fattore di trascrizione, detto “sito ABF1”, il quale non ha la
funzione di attivare la trascrizione ma interagisce con le altre proteine che si
legano al sito contribuendo alla stabilizzazione del complesso multimerico ORC. Le
mutazioni nel sito ABF1 e nelle copie imperfette del consenso riducono la
funzionalità dell’origine, mentre solo le mutazioni che si verificano nella sequenza
consenso ne aboliscono completamente la funzione. Anche nelle cellule
eucariotiche, comunque, la replicazione del DNA, dopo la separazione dei due
filamenti ad opera di una elicasi chiamata “antigene T”, avviene grazie
all’intervento di specifiche polimerasi.

DNA polimerasi eucariotiche: nelle cellule eucariotiche sono state identificate


cinque diverse DNA polimerasi, indicate con le lettere greche α, β, γ, δ ed ε. Di
queste α, β, δ ed ε sono localizzate nel nucleo, mentre γ nel mitocondrio ed è
responsabile della replicazione del DNA mitocondriale. In realtà le vere replicasi
nucleari sono α e δ mentre gli altri due enzimi nucleari, ε e β, sono probabilmente
coinvolti nei processi di riparazione. La DNA polimerasi α è un enzima multimerico
contenente una subunità catalitica con attività polimerasica 5’-3’, associata con
altre subunità con attività primasica. Tuttavia tale enzima non possiede attività
3’-5’ di correzione delle bozze per cui è poco adatto alla replicazione ad alta
fedeltà del DNA, ed è per questo usato solo per la sintesi degli inneschi su
entrambi i filamenti di DNA. Tale reazione di innesco è piuttosto insolita, infatti
l’enzima sintetizza un corto primer di RNA che poi viene esteso dall’attività
polimerasica dello stesso enzima, producendo una breve sequenza di 3/4 bp detta
“iDNA”. Successivamente il “fattore di replicazione C” si lega all’estremo 3’
dell’iDNA ed effettua il caricamento della DNA polimerasi δ, la quale può
effettuare l’allungamento, e del “PCNA”. Quest’ultimo è un trimero con una
struttura ed una funzione analoghe a quelle della subunità β della DNA polimerasi
III di E.coli, per cui forma una sorta di pinza circolare che aumenta
notevolmente la processività della polimerasi δ. Quest’ultimo enzima, oltre ad
avere attività polimerasica 5’-3’, possiede anche attività di correzione delle
bozze ed è responsabile sia della replicazione del filamento lento che di quello
veloce. Per quanto riguarda il filamento lento, una volta terminata la sintesi dei
frammenti di Okazaki, interviene l’enzima “MF1”, che analogamente alla DNA
polimerasi I dei procarioti, possiede attività esonucleasica 5’-3’ che provvede alla
rimozione dei primers di RNA; successivamente, la DNA polimerasi δ, con la sua
attività polimerasica inserisce le catene di DNA al posto dei primers di RNA. A
questo punto restano delle brevi interruzioni tra i singoli filamenti, che poi
verranno sigillate dalla “DNA ligasi I”. Infine è importante ricordare anche
un’altra proteina utile alla replicazione del DNA, il “fattore di replicazione A”,
una proteina che legandosi a singoli filamenti di DNA svolge una funzione analoga
alle proteine SSB di E.coli.

Telomerasi: come sappiamo, mentre i genomi di quasi tutti i procarioti sono


circolari, i cromosomi degli eucarioti sono lineari. La necessità di avere un primer
per iniziare la sintesi di DNA crea un problema per la replicazione delle parti
terminali dei cromosomi lineari. Questo problema non esiste nella replicazione dei
terminali della catena guida. In questo caso, un singolo primer fornisce l’innesco
per la sintesi di un tratto di DNA, il quale può estendersi fino all’estremità 5’
dello stampo. Al contrario, la necessità di avere primers multipli per replicare la
catena discontinua determina l’impossibilità di ottenere una molecola di DNA che
raggiunge l’estremità del cromosoma. Infatti anche se l’estremità finale
dell’ultimo primer di un frammento di Okazaki fosse posizionata in
corrispondenza dell’ultimo nucleotide dello stampo, una volta rimosso il primer
rimarrebbe una corta regione di DNA a doppio filamento non replicato. Ciò
porterebbe durante ciascun ciclo di replicazione, ad un accorciamento di una delle
due molecole figlie. Ovviamente questo fenomeno causerebbe una perdita di
materiale genetico di generazione in generazione; ciò tuttavia non avviene. Le
estremità dei cromosomi eucariotici, ossia i “telomeri”, sono generalmente
formate da sequenze ricche di T e G disposte testa-coda una rispetto all’altra.
Per esempio, i telomeri umani consistono di molte ripetizioni della sequenza 5’-
TTAGGG-3’. Sebbene molte di queste ripetizioni siano a doppio filamento, il 3’ di
ciascun cromosoma si estende oltre il 5’, formando un tratto di DNA a singolo
filamento. Questa particolare struttura funziona come se fosse un’origine di
replicazione in grado di risolvere il problema della replicazione delle estremità
terminali. Questa origine non interagisce con le proteine che riconoscono le
classiche origini, ma invece recluta una DNA polimerasi specifica chiamata
“telomerasi”. La telomerasi, come tutte le altre
polimerasi, agisce allungando il terminale 3’ del suo
substrato. Ma, a differenza della maggior parte
delle DNA polimerasi, la telomerasi è una “DNA
polimerasi-RNA dipendente” (trascrittasi inversa),
ossia un enzima che sintetizza DNA utilizzando uno
stampo ad RNA. La chiave di questo strano
funzionamento della telomerasi è data dalla sua
componente a RNA, denominata “RNA telomerasi” o
“TER”. A seconda dell’organismo la lunghezza di TER
varia da 150 a 1300 bp: questa regione può appaiarsi
al DNA a singolo filamento all’estremità 3’ del
telomero. L’appaiamento avviene in modo tale che
una parte dell’RNA stampo rimanga a singolo
filamento, creando così una giunzione innesco-stampo che può essere utilizzata
dall’attività telomerasica. Una delle subunità della telomerasi, come sappiamo,
appartiene ad un classe di DNA polimerasi denominata “trascrittasi inversa” che
appunto utilizza come stampo l’RNA per la sintesi di DNA: questa subunità è
chiamata “TERT”. Avvalendosi dell’associato stampo a RNA, TERT sintetizza DNA
fino alla fine dello stampo TER, ma non può continuare a copiare l’RNA oltre
questo punto. Una volta sintetizzato il DNA, l’RNA si distacca da questo per poi
riappaiarsi con gli ultimi quattro nucleotidi del telomero; inizia così un nuovo ciclo.
Quando la telomerasi agisce sul terminale 3’ del telomero, allunga solamente uno
dei due filamenti del cromosoma. Ciò è realizzato dal meccanismo di replicazione
che funziona sulla catena discontinua. La telomerasi, fornendo un’estremità 3’ più
lunga, procura all’apparato di replicazione del filamento discontinuo dello stampo
in più. Grazie alla sintesi e all’estensione degli inneschi a RNA prodotti dalla
telomerasi, usando come stampo l’estremità 3’ estesa, la cellula quindi può anche
aumentare la lunghezza dell’estremità 5’. L’azione della telomerasi garantisce
dunque al telomero il mantenimento di una lunghezza sufficiente a proteggere
dall’accorciamento l’estremità del cromosoma.
Trascrizione nei procarioti
La trascrizione è quel processo che prevede la sintesi di molecole di RNA a
partire da molecole di DNA, le quali avranno una sequenza di basi complementare
ad uno dei due filamenti del DNA. Tale processo, quindi, costituisce il passaggio
dell’informazione genetica dal DNA all’RNA e da questo alle proteine. L’RNA è un
acido nucleico che differisce dal DNA per tre specifiche caratteristiche: primo,
l’impalcatura fondamentalmente contiene il ribosio invece del 2’-deossiribosio (il
ribosio ha un gruppo ossidrilico in posizione 2’); secondo, l’RNA contiene l’uracile
al posto della timina; terzo, l’RNA presenta una singola elica. La sintesi dell’RNA
nei procarioti è catalizzata dall’enzima “RNA polimerasi”, la quale si lega ad una
regione specifica del DNA, chiamata “promotore”, localizzata a monte della
sequenza codificante. Il promotore, più precisamente, è situato nei pressi della
prima coppia di basi trascritta in RNA, formante il cosiddetto “sito di inizio”
della trascrizione ed è indicato con la posizione “+1”. Le sequenze precedenti al
punto di inizio sono definite “sequenze a monte”, le quali sono indicate con un
segno negativo, mentre quelle dopo il sito di inizio (cioè all’interno della sequenza
trascritta) sono definite “sequenze a valle” e sono indicate con un segno positivo.
A partire dal sito di inizio, l’RNA polimerasi si sposta lungo lo stampo
sintetizzando l’RNA, fino a che non raggiunge una “sequenza di terminazione”.

La trascrizione avviene mediante il normale processo di appaiamento delle basi


complementari e si svolge all’interno di una “bolla di trascrizione”, nella quale i
due filamenti di DNA sono separati in maniera transitoria: uno dei due filamento
è usato come stampo per la sintesi della catena di RNA, ed è indicato come
“filamento stampo” o “non-codificante”. Esso decorre in direzione 3’-5’ in quanto
la sintesi di RNA, così come quella di tutti gli acidi nucleici, in genere avviene in
direzione 5’-3’. L’RNA prodotto sarà, quindi, complementare al filamento stampo
e, pertanto, identico all’altro filamento di DNA, quello “codificante”. Il prodotto
della trascrizione nei procarioti è chiamato “trascritto primario”, e consiste in
una molecola di RNA che si estende dal sito di inizio al terminatore, e possiede le
estremità 5’ e 3’ originali, perché a differenza degli eucarioti non subisce
modificazioni alle estremità. La trascrizione può essere suddivisa in tre fasi:
inizio, allungamento e terminazione.

Fase di inizio: abbiamo detto che la trascrizione dell’RNA inizia in punti specifici
sul DNA, detti “promotori”, a livello dei quali avvengono: l’attacco della RNA
polimerasi, la separazione dei due filamenti e la scelta dell’elica da copiare.
Affinché tale processo abbia inizio, tuttavia, una forma dell’RNA polimerasi,
detta “oloenzima”, deve necessariamente legarsi al promotore. L’oloenzima è
formato da un “nucleo enzimatico” (o core) costituito da quattro polipeptidi (2α, β
e β’), legato ad un altro polipeptide detto σ. Le subunità β e β’ costituiscono
insieme il centro catalitico dell’enzima; la subunità α, invece, non ha un ruolo
diretto nella trascrizione ma è necessaria per l’assemblaggio del nucleo
dell’enzima, ed interviene nell’interazione dell’RNA polimerasi con alcuni fattori di
regolazione; il “fattore σ”, infine, è essenziale per il riconoscimento della
sequenza del promotore. Il suo compito, infatti, è quello di garantire che l’RNA
polimerasi batterica si leghi stabilmente al DNA soltanto a livello del promotore
e non su altri siti. I promotori possiedono due sequenze critiche per l’inizio della
trascrizione:
1. “Tata box”, che consiste in una sequenza consenso di 6 bp ricca di T e A,
mappata a -10 (5’-TATAAT-3’);
2. “Gaca box”, mappata a -35 (5’-TTGACA-3’).
La distanza che separa i due siti è sempre compresa tra 16 e 18 bp.

L’oloenzima della RNA polimerasi si lega al promotore in due fasi distinte:


all’inizio si lega in modo lasso alla regione -35 (GACA box) del promotore mentre
il DNA è ancora nella forma a doppia elica; si forma in tal modo un “complesso
binario chiuso”: “binario”, perché formato dalla RNA polimerasi e dal DNA, e
“chiuso” perché il DNA conserva l’organizzazione a doppia elica. Successivamente,
quando l’enzima si lega alla regione -10 (TATA box) del promotore, il DNA si
denatura, portando alla formazione della bolla di trascrizione. Ciò dipende dal
fatto che in questa regione troviamo solo A e T, unite da due legami idrogeno (la
rottura dei legami è facilitata). A partire dalla TATA box, dunque, il DNA si
srotola per cui si viene a formare un “complesso binario aperto”, che comincia ad
estendersi verso destra, cioè verso i nucleotidi indicati con segno positivo
(raggiunge +2 o +3). Questa reazione di svolgimento necessita di energia
derivante dall’idrolisi di ATP. A questo punto interviene l’attività polimerasica
dell’enzima che sintetizza l’RNA usando come stampo un filamento di DNA. A
differenza della DNA polimerasi, l’RNA polimerasi non ha bisogno di un primer di
RNA sintetizzato dalla primasi, ma può iniziare direttamente la trascrizione dal
primo nucleotide. In tal modo si viene a formare un “complesso ternario”, perché
formato dall’RNA polimerasi, dal DNA e dall’RNA. In particolare, il primo
passaggio del processo che porta alla formazione di questo complesso ternario è
l’incorporazione dei primi due nucleotidi dell’RNA, che si legano mediante legami
idrogeno con i deossinucleotidi +1 e +2 del filamento stampo. E’ importante
sottolineare che la fase d’inizio della trascrizione può protrarsi per il verificarsi
di “eventi abortivi”, in cui vengono sintetizzati e rilasciati corti trascritti di RNA,
di nove nucleotidi o anche meno, dopo i quali l’enzima ricomincia di nuovo a
sintetizzare. La polimerasi riesce a distaccarsi dal promotore e a entrare nella
fase di allungamento solo quando è riuscita a produrre una molecola lunga almeno
dieci nucleotidi. Una volta raggiunta questa lunghezza soglia, l’inizio della
trascrizione si completa: il trascritto non può più essere alloggiato nella regione
in cui si appaia con il DNA e deve iniziare ad infilarsi nel “canale di uscita
dell’RNA”.

Fase di allungamento: al termine della fase di inizio l’RNA polimerasi, che fino ad
ora era rimasta sul promotore, si allontana da quest’ultimo muovendosi lungo lo
stampo di DNA. La transizione dallo stato di inizio a quello di allungamento è
associato ad un cambiamento nella conformazione dell’oloenzima che libera il
fattore σ. Infatti finché il fattore σ rimane legato al nucleo enzimatico, esso non
può dissociarsi dal promotore perché il legame tra σ e il DNA è molto forte. In
assenza di σ, invece, l’enzima non si lega in modo specifico al promotore ed è in
grado di allontanarsi dal sito di inizio: questo processo è definito “liberazione del
promotore”. A questo punto, poiché l’oloenzima da solo non è perfettamente
funzionale, altre proteine accessorie si legano al nucleo e danno origine alla
“macchina proteica” della trascrizione. Una di queste proteine è “NUS A”
(fattore di allungamento), la quale si lega alla polimerasi, impedisce a σ di
riassociarsi ad essa e permette l’allungamento della catena di RNA. Durante la
fase di allungamento man mano che l’RNA polimerasi si sposta lungo il DNA, anche
la bolla di trascrizione si sposta con l’enzima, e la catena dell’RNA nascente si
allunga. In pratica, man mano che si sposta, l’enzima srotola la doppia elica del
DNA nella regione anteriore alla bolla, esponendo una nuova porzione dello stampo
a singolo filamento. I nucleotidi vengono poi aggiunti all’estremità 3’ della catena
nascente di RNA, formando un ibrido DNA-RNA nella regione srotolata. Alle
spalle della regione srotolata, il filamento stampo si riappaia con il filamento
codificante, riformando la doppia elica. L’RNA infine emerge in forma di
filamento singolo.

La reazione di allungamento dell’RNA in fase di sintesi è:

(RNA)n + rNTP → (RNA)n+1 + PPi


2
RNA polimerasi + Mg +

L’RNA polimerasi allunga la catena di RNA aggiungendo un ribonucleotide 5’-


trifosfato al terminale 3’-OH della catena di RNA in direzione 5’-3’. L’enzima,
inoltre, catalizza la formazione del legame fosfodiesterico utilizzando ioni Mg2+
quali cofattori, liberando pirofosfato (PPi), il quale poi viene scisso dell’enzima
“pirofosfatasi”.

Fase di terminazione: una volta che l’RNA polimerasi ha iniziato la trascrizione,


l’enzima scorre sullo stampo, sintetizzando l’RNA fino a quando non incontra
alcune sequenze, chiamate “terminatori” le quali segnalano alla polimerasi in fase
di allungamento di staccarsi dal DNA e di rilasciare la catena di RNA
sintetizzata. Nei batteri, i terminatori sono di due tipi: “Rho-dipendenti” e “Rho-
indipendenti”. Il primo tipo, come suggerisce il nome, ha bisogna di una proteina
chiamato “Rho” per indurre la terminazione; il secondo tipo invece fa terminare la
polimerasi senza il coinvolgimento di altri fattori. I terminatori rho-indipendenti,
detti anche “terminatori intrinseci”, sono costituiti da due elementi: una
ripetizione invertita (palindromica) corta (circa 20 nucleotidi) ricca di G e C, a cui
segue un piccolo segmento di circa otto coppie di basi A-T (le A si trovano sul
filamento stampo). Quando la polimerasi trascrive una ripetizione invertita, l’RNA
risultante avrà una struttura secondaria a cappio (stem-loop), detta anche
“forcina”, che provoca una pausa nell’avanzamento della RNA polimerasi. Nella
struttura a forcina, l’appaiamento tra le ripetizioni invertite ricche di G e C va a
costituire lo “stelo”, mentre la sequenza interposta tra le ripetizioni invertite
genera l’ “ansa”; all’estremità di tale struttura, infine, sono presenti sei residui di
U. Sia la struttura a forcina che la regione ricca di U sono necessarie per la
terminazione, anche se non è chiaro il meccanismo con cui esse operano. E’
possibile, però, che la rapida formazione della struttura a forcina non solo arresti
l’avanzamento della RNA polimerasi, ma destabilizza anche gli ibridi DNA-RNA
che in tal caso sono tenuti insieme soltanto da deboli legami A-U. Ciò
favorirebbe, quindi, la dissociazione tra il DNA e l’RNA, con la rottura dei legami
idrogeno nella coppia di basi A-U, nonché il rilascio della polimerasi, ponendo fine
alla trascrizione.

I terminatori Rho-dipendenti, invece, sono quelli che necessitano dell’aggiunta del


“fattore Rho”. Alcune molecole di DNA possiedono all’estremità del filamento
stampo delle sequenze ripetute e invertite povere di G e C non terminanti con
residui di A. Di conseguenza il trascritto di RNA formerà un terminatore
costituito da una struttura a forcina con poche G e C nello stelo e sarà privo di
residui di U all’estremità 3’. Questo terminatore sarà, dunque, diverso da quello
della terminazione Rho-indipendente e non sarà in grado di arrestare la
trascrizione. In tal caso la terminazione della trascrizione richiede una proteina
regolatrice specifica, detta appunto “fattore Rho”. Quest’ultimo innanzitutto si
lega ad una sequenza del trascritto lunga 50-90 bp, la quale si trova a monte del
sito di terminazione, detta “sito rut”. Dopo aver legato il sito rut, il fattore Rho
scorre lungo l’RNA verso l’estremità 3’ in modo da poter raggiunge l’ibrido DNA-
RNA all’interno dell’RNA polimerasi. Quando l’RNA polimerasi incontra la
struttura a forcina, l’enzima si ferma momentaneamente in tale regione. A questo
punto interviene Rho che si lega al 5’ dell’RNA neosintetizzato e migra lungo di
esso in direzione 5’-3’, sfruttando l’energia derivata dall’idrolisi dell’ATP. In
pratica Rho insegue l’RNA polimerasi lungo l’RNA e se raggiunge l’enzima mentre è
ancora fermo sul terminatore provoca la terminazione della trascrizione, in
quanto rompe i legami idrogeno tra il DNA stampo e l’RNA grazie alla sua attività
elicasica 5’-3’. Si ha, così, il rilascio dell’RNA polimerasi, di Rho e dell’RNA.

Trascrizione negli eucarioti


Gli eucarioti, al contrario dei batteri in cui troviamo una sola polimerasi, durante
la trascrizione utilizzano tre diverse polimerasi, che trascrivono ciascuna una
classe diversa di geni:
 La RNA polimerasi I è localizzata nel nucleolo ed è responsabile della
trascrizione dei geni che codificano per gli rRNA 18S e 28S. Da questa
polimerasi dipende la sintesi della maggior parte dell’RNA cellulare (50-
70%).
 La RNA polimerasi II, invece, è localizzata nel nucleoplasma ed è
responsabile della trascrizione in mRNA dei geni che codificano per le
proteine, oltre ad alcuni geni coinvolti nel processo di maturazione
dell’mRNA.
 La RNA polimerasi III, infine, localizzata anch’essa nel nucleoplasma,
trascrive i geni per i tRNA e l’rRNA 5S, e i geni per gli mRNA non trascritti
dalla RNA polimerasi II.
Una caratteristica che consente di distinguere i tre diversi enzimi eucariotici è
data dalla loro risposta all’octopeptide “α-amanitina”, una tossina prodotta da un
fungo velenoso. L’attività della RNA polimerasi I non risulta essere inibita dall’ α-
amanitina, al contrario della RNA polimerasi II, la quale, invece, subisce una forte
inibizione da parte della tossina, già a basse concentrazioni. L’RNA polimerasi
III, al contrario delle altre polimerasi, invece è specie-specifica: infatti nelle
cellule animali la sua attività è inibita da alti livelli del composto, mentre nei
lieviti e negli insetti non viene inibita. A differenza dei procarioti in cui l'RNA
polimerasi riconosce direttamente il promotore mediante il fattore σ, una
subunità che fa parte dell’enzima stesso, le RNA polimerasi eucariotiche per
poter riconoscere il promotore devono avvalersi di una serie di proteine
regolatrici, note come “fattori generali di trascrizione” (GTF).

RNA polimerasi II
L’RNA polimerasi II è l’enzima che trascrive tutti i geni i cui prodotti sono
destinati ad essere tradotti in proteine, come pure alcuni geni che codificano per
piccole molecole di RNA interessate nel processo di maturazione dell’mRNA.
L’analisi di un tipico promotore dei geni trascritti dall’RNA polimerasi II ha
permesso di dimostrare che esso è formato da tre brevi sequenze localizzate
intorno a -25, -75 e -90. La regione localizzata a circa 25 bp a monte del punto di
inizio ha una sequenza consenso simile alla sequenza TATA dei procarioti tranne
che per la localizzazione. La TATA box tende ad essere circondata da sequenze
ricche in A e T ed anche negli eucarioti, così come nei procarioti, rappresenta il
sito a livello del quale avviene la separazione dei due filamenti. La minoranza dei
promotori che non contiene un elemento TATA prende il nome di “promotori
TATA-less”. Esperimenti condotti per analizzare il ruolo della Tata box nella
trascrizione dei geni di tipo II hanno permesso di dimostrare che se la Tata box
si trova nella sua solita localizzazione, cioè a -25, la sintesi dell’RNA comincia da
+1. Se essa viene spostata nella regione -15 l’RNA viene trascritto non più a
partire dal punto +1 ma da +10. Ponendo la Tata box a -5, invece, l’RNA si viene a
formare a partire dalla regione +20. Sommando queste distanze, il totale è
sempre 25, pertanto è come se la Tata box fosse una specie di “spaziatore” che
stabilisce il punto d’inizio della trascrizione. Oltre alla TATA box in un promotore
dell’RNA polimerasi II è presente un’altra sequenza necessaria per l’inizio della
trascrizione: si tratta della sequenza “CAAT” posizionata a -75 bp a monte del
sito di inizio. Mentre la TATA box definisce la corretta posizione del sito di
inizio della trascrizione, la CAAT box invece è necessaria per garantire che
l’efficienza della trascrizione sia elevata. I promotori della classe II contengono
frequentemente anche un altro elemento comune, la cui sequenza consenso è
GGGCGG, da cui “GC-box”, che è posta a -90 bp a monte del sito d’inizio della
trascrizione. Dunque il promotore dei geni di tipo II è costituito da una serie di
elementi: quello più vicino al sito d’inizio della trascrizione è detto “elemento
prossimale” ed è rappresentato dalla TATA box, mentre gli altri elementi posti a
maggior distanza sono detti “elementi distali”. Confrontando queste sequenze
con quelle dei procarioti possiamo trarre un importante conclusione. La superficie
di DNA su cui si inseriscono gli elementi di regolazione è molto più estesa di
quella occupata dai promotori dei procarioti. Nei batteri, infatti, le sequenze che
prendono contatto con l’RNA polimerasi sono localizzate fino a -50 bp dal punto
di inizio. Nelle cellule eucariotiche, invece, le sequenze di regolazione coprono un
tratto molto esteso, che può raggiungere anche i 200-300 nucleotidi (enhancer).

L’RNA polimerasi II non può iniziare la trascrizione da sola ma necessita


dell’intervento dei fattori di trascrizione ausiliari. Insieme a questi fattori
l’enzima costituisce l’ “apparato basale” necessario per trascrivere il gene. I
fattori di trascrizione associati all’RNA polimerasi II sono indicati come
“TFIIX”, in cui “X” indica il fattore coinvolto. Il primo passaggio necessario
perché avvenga la trascrizione è il legame del fattore di trascrizione “TFIID”
alla Tata box. TFIID è costituito da due tipi di componenti:
1. “TBP”, una piccola proteina responsabile del riconoscimento della Tata
box;
2. Proteine dette “TAF” (fattori associati a TBP) le quali si legano a elementi
diversi del promotore.
TBP si lega al DNA in modo insolito, non solo si posiziona nel solco minore ma
piega il DNA di circa 80°. Questa deformazione non implica la denaturazione del
DNA, infatti i 2 filamenti mantengono l’appaiamento delle basi. Essa, invece,
permette ai fattori di trascrizione e alla polimerasi II di formare un’associazione
più stretta di quanto sarebbe possibile sul DNA lineare. L’inizio della trascrizione
richiede, tuttavia, che anche altri fattori di trascrizione si assemblino
nell’ordine, nel modo e nella quantità giusta per costituire un complesso a cui si
lega la RNA polimerasi II, detto “complesso di preinizio”. Dopo che TFIID si è
assemblato alla Tata box, interviene il fattore di trascrizione “TFIIA” che si
posiziona leggermente più a monte di Tata box, cioè tra le posizioni -40 e -50:
TFIIA attiva la TBP rimuovendo una repressione causata dai TAF. A questo punto
si aggiunge un ulteriore fattore di trascrizione, “TFIIB”, una piccola proteina che
si posiziona nel tratto a valle di TFIID, coprendo un tratto di DNA che si
estende fino a +10. TFIIB si lega vicino a TBP e fornisce la superficie che è, a sua
volta, riconosciuta dalla RNA polimerasi II. A questo punto si è completato
l’assemblaggio del complesso di preinizio, costituito dai fattori TFIIA, TFIIB e
TFIID (essi insieme al DNA formano il “complesso binario chiuso”). Il
reclutamento della RNA polimerasi II, tuttavia, porta con sé altri fattori di
trascrizione, quali: “TFIIF”, TFIIE”, “TFIIH” e “TFIIJ”. Si viene a formare in
questo modo l’ “apparato di trascrizione basale”. La formazione del complesso di
preinizio è seguita poi dalla dissociazione dei due filamenti del promotore. Il
fattore di trascrizione TFIIF è costituita da due subunità, una più grande ed una
più piccola: la subunità più grande presenta attività elicasica dipendente dall’ATP,
mentre la subunità più piccola ha una certa analogia con le regioni del fattore σ
dei procarioti e, dunque, si lega strettamente all’RNA polimerasi II. Grazie alla
sua attività elicasica l’enzima denatura il DNA a livello della Tata box fino alla
regione +1, determinando la formazione del “complesso binario aperto”. A questo
punto interviene l’attività polimerasica dell’RNA polimerasi II che inizia la sintesi
dell’mRNA. Tuttavia, affinché la polimerasi II possa sintetizzare l’RNA è
necessario che si dissoci dai fattori di trascrizione TFIID, TFIIA e TFIIB in
modo da abbandonare il promotore e muoversi lungo lo stampo di DNA. Ciò è reso
possibile dalla fosforilazione della sua estremità C-terminale operata dall’attività
chinasica di TFIIH. Infatti, l’RNA polimerasi possiede, in corrispondenza di tale
estremità (coda), un dominio detto “CTD”, costituito da una sequenza di 7
amminoacidi che si ripete fino a 50 volte. Questi amminoacidi possono essere
fosforilati perché hanno gruppi –OH che possono interagire con il gruppo
fosforico dell’ATP. Quando questi amminoacidi vengono fosforilati, quindi, la
polimerasi II si stacca dal promotore e inizia la sintesi di RNA. Dopo che l’RNA
polimerasi II ha sintetizzato i primi 60/70 nucleotidi inizia la “fase di
allungamento”. Questa fase prevede che la polimerasi II si liberi di alcuni fattori
di trascrizione, come TFIIE e TFIIH, mentre TFIIF rimane ancora associato.
Durante questa fase l’attività dell’RNA polimerasi II viene fortemente
incrementata da alcune proteine chiamate “fattori di allungamento”. Una volta
che la trascrizione è stata completata la polimerasi II viene defosforilata e
riciclata per iniziare un nuovo ciclo. A questo punto, però, occorre fare una
precisazione riguardo al meccanismo con cui avviene la trascrizione. Dopo che
sono stati sintetizzati i primi 10 nucleotidi dell’RNA interviene un processo detto
“controllo di qualità”. Se tale controllo rileva degli errori la trascrizione viene
interrotta e l’mRNA neosintetizzato, detto “mRNA di prova”, viene degradato,
per cui si dice che la trascrizione viene “abortita”.

RNA Polimerasi I
Abbiamo già detto che gli eucarioti, oltre alla Pol II, hanno altre due polimerasi:
Pol I e Pol III. Questi enzimi sono correlati alla Pol II e ne condividono persino
alcune subunità, ma iniziano la trascrizione da promotori distinti e trascrivono
geni differenti. L'RNA polimerasi I trascrive soltanto i geni per l'RNA
ribosomiale a partire da un singolo tipo di promotore. Quest'ultimo è composto da
due parti:
1. L’elemento centrale (o core) che si trova intorno al sito di inizio della
trascrizione, da -45 a +20.
2. L’elemento di controllo a monte (UCE), il quale si estende da -180 a -107 e
svolge la funzione di aumentare l’efficienza dell’elemento centrale.
Entrambe le regioni hanno una composizione insolita per un promotore essendo
ricche in coppie di basi G-C. L’RNA polimerasi I richiede due fattori
trascrizionali per poter iniziare la trascrizione: SL1 e UBF. Il fattore che si lega
al core del promotore è SL1, ed è costituito da quattro subunità proteiche. Uno
dei costituenti di SL1 è TBP, un fattore richiesto nella fase di inizio anche
dall’RNA polimerasi II e III. TBP non si lega direttamente al DNA ricco di G-C,
ma il legame al DNA è dovuto ad altri componenti di SL1. Quest’ultimo ha un ruolo
importante nell’assicurare che l’RNA polimerasi I si posizioni correttamente a
livello del punto di inizio. All’elemento UCE, invece, si lega il fattore di
trascrizione UBF, il quale svolge due funzioni: 1) stimola il rilascio del promotore
da parte dell’RNA polimerasi, e 2) stimola SL1. UBF si lega al solco minore del
DNA e avvolge il DNA in un’ansa avvolta per circa 360° sulla superficie proteica,
con il risultato che il core del promotore e UCE si avvicinano, permettendo così a
UBF di stimolare il legame di SL1 al promotore.
RNA polimerasi III
I promotori della Pol III sono di forme diverse e la maggioranza di essi ha la
caratteristica insolita di essere posizionata a valle del sito d’inizio della
trascrizione. Alcuni promotori della Pol III, ad esempio quelli per i geni per il
tRNA, sono composti da due regioni, chiamate Box A e Box B, separate da un
elemento corto; altri invece, come quelli per il gene per l’rRNA 5S, contengono la
Box A e la Box C, separate anche loro da un elemento intermedio.

Proprio come per la Pol II e Pol I, la trascrizione della Pol III necessita di
fattori trascrizionali aggiuntivi alla polimerasi. In questo caso i fattori vengono
chiamati TFIIIB e TFIIIC per i geni per i tRNA, con in più TFIIIA per il gene
dell’rRNA 5S. I promotori dei geni per i tRNA inizialmente richiedono il legame di
TFIIIC su Box A e Box B. Questo permette a TFIIIB di legarsi al sito di inizio e,
in seguito, di reclutare la RNA polimerasi III. Come accade per le altre due classi
di polimerasi, anche la Pol III utilizza TBP; in questo caso il fattore si trova
all’interno del complesso TFIIIB. I promotori per il gene per l’rRNA 5S, invece,
inizialmente richiedono il legame di TFIIIA su Box A, il quale aiuta TFIIIC a
legare Box C. La contemporanea presenza di TFIIIA e di TFIIIC permette a
TFIIIB di legarsi al sito di inizio. Una volta che TFIIIB si è legato, TFIIIA e
TFIIIC possono anche essere rimossi, e la sola presenza di TFIIIB è sufficiente
per permettere alla RNA polimerasi III di legarsi.
Enhancer
Non sempre i promotori funzionano da soli. Infatti in questi casi la loro attività
può essere enormemente incrementata dalla presenza di un gruppo di sequenze
poste a distanza variabile dal promotore e che nell’insieme costituiscono un
“enhancer”, cioè un intensificatore. Il motivo per cui un enhancer si distingue dal
promotore risiede nel fatto che il promotore è formato da sequenze di DNA che
devono trovarsi in una posizione relativamente fissa rispetto al punto d’inizio,
mentre la posizione dell’enhancer rispetto al promotore, e quindi rispetto al punto
d’inizio, non è fissa, ma può variare di molto. Uno dei primi enhancer ad essere
stato caratterizzato è quello del virus SV40. Questa sequenze presenta
importanti caratteristiche: essa può essere rimossa dal genoma e posta in
prossimità del promotore di un altro gene, e nonostante ciò essere ancora
funzionante. Essa, inoltre, funziona sia in direzione 5’-3’ che in direzione 3’-5’.
Cosa ancora più sorprendente agisce sia in prossimità che a migliaia coppie di basi
a monte del promotore e persino se posta all’interno del gene (in un introne) o
oltre la sua estremità 3’. Benché il primo enhancer sia stato scoperto nel genoma
di un virus, questi elementi di regolazione sono molto comuni anche negli
eucarioti, sia a livello dei geni trascritti dalla Pol I sia dalla Pol II. Essi sono detti
“enhancer cellulari”, sono generalmente lunghi 50-150 bp ad hanno le medesime
caratteristiche degli enhancer procariotici. Il ruolo essenziale dell’enhancer,
quindi, è quello di aumentare la concentrazione dei fattori di trascrizione in
vicinanza del promotore.
Maturazione dell’mRNA
Una volta trascritto, l'mRNA eucariotico prima di essere esportato dal nucleo e
poi tradotto, deve subire un processo di maturazione che prevede:
 L’aggiunta di un cap dell'estremità 5’ dell'RNA;
 L’aggiunta di una coda di polyA all'estremità 3';
 La rimozione degli introni, mediante il processo di “splicing”.
Il primo evento della maturazione dell’RNA è quindi il capping. Questo processo
prevede l'aggiunta di una base guanina metilata all'estremità 5' dell'RNA. Di
fatto si tratta di un residuo di 7-metilguanosina legato al residuo 5’-terminale
dell’mRNA attraverso un insolito legame 5’,5’-trifosfato.

Il cap al 5’ svolge diverse funzioni: 1) protegge gli mRNA dalla degradazione,


infatti l’insolito legame 5-’5’ protegge l’RNA dall’attacco di RNasi che agiscono a
partire dal 5’; 2) aumenta la traducibilità degli mRNA; 3) facilita la traslocazione
degli mRNA dal nucleo al citoplasma; 4) aumenta l’efficienza di splicing. Il cap al
5’ è realizzato in tre diversi passaggi:
1. Nel primo passaggio, l’RNA trifosfatasi rimuove il fosfato γ dall’estremità
5’ dell’mRNA;
2. Nel secondo passaggio, la guaniltrasferasi aggiunge il GMP, usando come
substrato il GTP e liberando pirofosfato, per formare il legame 5’-5’
trifosfato;
3. Nel terzo passaggio, infine, la metil-transferasi aggiunge un gruppo metilico
sulla guanina in posizione 7, utilizzando come substrato una molecola di
Sadenosilmetionina (AdoMet).
Al termine del processo la defosforilazione della Serina-5 all’interno dei
segmenti ripetuti della coda (CTD) causa la dissociazione del macchinario del
capping.

Il secondo evento della maturazione dell’mRNA, invece, è rappresentato


dell’aggiunta della coda di polyA all’estremità 3’. Quando la polimerasi trascrive il
“segnale di poliadenilazione”, in prossimità della fine del gene, vengono reclutati
dal CTD due fattori proteici, “CPSF” e “CstF”, che a loro volta reclutano altre
proteine che effettuano il taglio dell’RNA e l’aggiunta della coda di polyA.
L’mRNA viene tagliato in una posizione da 11 a 30 nucleotidi a valle della sequenza
consenso AAUAAA, nella regione non tradotta in 3’. La poliadenilazione, invece, è
mediata da un enzima chiamato “poli-A-polimerasi”, il quale aggiunge circa 200
adenine all’estremità 3’ dell’RNA prodotto dopo il taglio. L’mRNA così maturo
viene rilasciato dalla polimerasi, che per un tratto continua la sintesi di RNA sullo
stampo, e quindi trasferito dal nucleo al citoplasma dove sarà tradotto.

Splicing dell’RNA
Il DNA eucariotico presenta “geni interrotti”, cioè costituiti da regioni
codificanti, dette “esoni”, e regioni non codificanti, dette “introni”. Gli introni
devono essere eliminati dal trascritto primario prima che l’informazione genetica
venga portata fuori dal nucleo, per poi essere letta e convertita in proteina. Gli
introni vengono rimossi dai pre-mRNA attraverso un processo chiamato “splicing
dell’RNA” (è la fosforilazione della Serina-2 a livello delle ripetizioni della coda
CTD che porta al reclutamento del macchinario necessario per lo splicing).
Questo processo, quindi, converte il pre-mRNA in RNA maturo e deve essere
molto preciso per evitare la perdita o l’aggiunta anche di un singolo nucleotide nei
punti in cui gli esoni vengono uniti. I confini tra gli esoni e gli introni sono marcati
da sequenze nucleotidiche specifiche all’interno del pre-mRNA. Queste sequenze
specificano dove avverrà lo splicing. Il confine esone-introne all’estremità 5’
dell’introne è marcato da una sequenza chiamata “sito di splicing 5’“, mentre il
confine esone-introne all’estremità 3’ dell’introne è marcato dal “sito di splicing
3’“ (questi siti vengono anche chiamati rispettivamente sito donatore e sito
accettore). Per lo splicing, tuttavia, è necessaria una terza sequenza chiamata
“sequenza di ramificazione”, la quale si trova all'interno dell'introne, di solito
vicino alla sua estremità 3', ed è seguita da un segmento di polipirimidina. Le
sequenze consenso di ciascun elemento sono: GU al sito di splicing 5’, AG al sito di
splicing 3’ e A al punto di ramificazione. Queste sequenze conservate si trovano
tutte all’interno degli introni.

Chimicamente, il meccanismo di splicing avviene tramite due reazioni successive


di transesterificazione, in cui alcuni legami fosfodiesterici all'interno del pre-
mRNA vengono rotti ed altri nuovi vengono formati. Il primo passaggio del
processo è l’idrolisi del legame fosfodiesterico tra l’ultimo nucleotide dell’esone 1
e il primo nucleotide dell’introne, cioè quello che si trova all’estremità donatrice
(5’). Successivamente deve verificarsi una seconda reazione di idrolisi, che
separa l’ultimo nucleotide dell’introne, quello che si trova all’estremità
accettatrice (3’), da primo nucleotide dell’esone 2. Avvenute le due reazione di
idrolisi, i due esoni vengono ricompattati grazie alla formazione di un legame
fosfodiesterico con conseguente ripristino della continuità dell’RNA. Tuttavia il
processo, così come è stato descritto, è incompleto in quanto nella prima fase
sono stati idrolizzati due legami fosfodiesterici, mentre nella fase successiva ne
è stato sintetizzato solo uno. Per far si
che il processo sia in equilibrio è
necessaria la formazione di un secondo
legame fosfodiesterico. Ma teoricamente
tutti i nucleotidi formano già legami
fosfodiesterici tra di loro, e quindi
nessuno potrebbe formare altri legami.
Tuttavia, nella molecola di RNA il ribosio
possiede due gruppi –OH di cui uno in
posizione 3’ e l’altro in 2’. Il gruppo –OH in
posizione 2’ è appunto quello che consente
la formazione del legame fosfodiesterico
aggiuntivo. Tale legame si forma dopo che
la prima reazione di idrolisi ha liberato l’estremità 5’ dell’introne. Questa
estremità si ripiega su se stessa, formando così una struttura detta “laccio” (o
“cappio”), che deriva dalla formazione di un legame inconsueto detto 2’-5’, perché
si forma tra il 2’-OH dell’adenina della sequenza di ramificazione ed il fosfato 5’
della guanina dell’estremità 5’ dell’introne. Successivamente la seconda reazione
di idrolisi al 3’ provoca l’escissione dell’introne. La formazione di un legame
fosfodiesterico tra il 3’-OH dell’esone 1 e il 5’-P dell’esone 2 porta, infine,
all’unione dei due esoni (l’introne viene rapidamente degradato assicurando
l’irreversibilità della reazione di splicing). L’intero processo è energeticamente in
equilibrio, in quanto l’energia liberata dall’idrolisi dei due legami fosfodiesterici
viene impiegata per la formazione dei due nuovi legami dello stesso tipo. Per
questo motivo lo splicing non richiede ATP.

Spliceosoma:

Lo spliceosoma è una grande particella


RIBONUCLEOPROTEICA
costituito da 5 RNA e circa 150 proteine

Gli RNA componenti lo spliceosoma, detti “small nuclear RNAs” (snRNA), sono gli
RNA U1, U2, U4, U5 e U6, hanno lunghezza compresa tra 100 e 300 nt, e
formano complessi con diverse proteine costituendo le cosiddette “small nuclear
ribonucleoprotein” (snRNP). Il ruolo delle snRNP è:
1. Riconoscere il sito di splicing al 5’ e il punto di ramificazione;
2. Avvicinare tra loro questi siti;
3. Catalizzare le reazioni di transesterificazione.

Lo splicing avviene soltanto dopo l’assemblaggio di tutti i componenti:


 L’assemblaggio inizia con il legame di U1 al sito di splicing al 5’;
 U2 è la seconda molecola ad unirsi al complesso sulla A conservata
(questo legame richiede ATP);

 U4,U5, U6 si uniscono al complesso;


 U6 interagisce con il sito di splicing al 5’;

 U1 è rilasciato
 U4 si allontana;
 U6 e U2 interagiscono e formano il sito catalitico attivo e la giunzione
al 5’ è tagliata;

 1° reazione di transesterificazione;
 U5 interviene per avvicinare i due esoni ed è tagliata la giunzione al 3’;
 2° reazione di transesterificazione.

RNA transfer
La traduzione dell’informazione contenuta nella sequenza di nucleotidi (sotto
forma di codoni) in amminoacidi è l’essenza della sintesi proteica. Questa
operazione viene svolta da molecole di tRNA che agiscono da “adattatori” tra i
codoni e gli amminoacidi che essi stessi individuano. Esistono molte varianti di
molecole di tRNA, ma a ciascuna è legato un amminoacido specifico e ciascuna
riconosce un particolare codone, o codoni, dell’mRNA.

I tRNA sono lunghi da 75 a 95 ribonucleotidi. Tutti i tRNA hanno caratteristiche


comuni: essi possiedono un’estremità 3’ che termina con la sequenza 5’-CCA-3’, la
quale rappresenta il sito che viene legato all’amminoacido affine. Tutti i tRNA
presentano una caratteristica struttura secondaria a trifoglio risultante
dall’appaiamento di basi complementari tra diverse regioni della molecola. La
struttura a trifoglio comprende uno stelo accettore, formato dalle due estremità
della molecola, su cui si legherà l’amminoacido specifico, tre strutture stelo-ansa
(o bracci) ed una quarta ansa variabile. Ora vediamo le caratteristiche di queste
strutture:
 Lo stelo accettore, così denominato perché è il sito di aggancio
dell’amminoacido, è formato dall’appaiamento della regione 5’ terminale e
di quella 3’ terminale della molecola di tRNA. La sequenza 5’-CCA-3’,
all’estremità 3’ della molecola, si trova in una regione a singolo filamento
che protrude da questa struttura a doppio filamento.
 L’ansa TψC contiene ribotimidina (T), di solito assenza negli RNA, e
pseudouridina (ψ).
 L’ansa D deve il suo nome alla presenza inusuale di diidrouridine nella
struttura.
 L’ansa dell’anticodone si trova in posizione opposta rispetto allo stelo
accettore. Essa contiene, come dice il nome stesso, l’anticodone, il quale
interagisce con il codone dell’mRNA durante la traduzione. Questo
appaiamento codone-anticodone è fondamentale per l’inserimento
dell’amminoacido corretto nella catena polipeptidica in crescita.
 L’ansa variabile, infine, si trova tra l’ansa dell’anticodone e quella TψC ed
ha una lunghezza compresa tra le 3 e le 21 basi. La componente
strutturale soggetta alla maggior variazione nei tRNA è proprio questa
ansa variabile. A seconda della natura di tale ansa i tRNA si possono
suddividere in due classi: tRNA della classe 1, che hanno un’ansa variabile
piccola composta da sole 3-5 basi, e tRNA della classe 2, che hanno invece
un’ansa variabile molto grande composta da 13-21 basi.
In tutti i tRNA la struttura secondaria si ripiega in una struttura terziaria
compatta a forma di L rovesciata, in cui l’estremità 3’ che porta l’amminoacido si
trova all’estremità opposta rispetto all’ansa dell’anticodone. In questo caso si
vengono a stabilire delle nuove interazioni intramolecolari dette “legami H
terziari”, i quali determinano la formazione di due regioni a doppia elica disposte
ad angolo retto tra loro, cioè a forma di L. Ciò fa apparire la molecola di tRNA
come se fosse formata da due componenti perpendicolari, di cui una costituita
dallo stelo accettore e dall’ansa TψC, mentre l’altra è costituita dall’ansa D e
dall’ansa dell’anticodone. La formazione di questa struttura terziaria porta la
regione D e TψC ad essere molto vicine tra loro, e questo fa si che l’amminoacido
legato venga a trovarsi ad un’estremità della L e l’ansa dell’anticodone all’altra
estremità.

Le molecole di tRNA cui è attaccato un amminoacido sono dette “cariche”, mentre


i tRNA privi di amminoacido sono detti “scarichi”. Il caricamento del tRNA
avviene mediante una reazione catalizzata da enzimi specifici, le “amminoacil-
tRNA-sintetasi”. Tale reazione può essere suddivisa in due tappe:
1. Nella prima tappa il gruppo carbossilico (-COOH) dell’amminoacido è
addizionato sul fosfato α dell’ATP con la conseguente eliminazione di una
molecola di pirofosfato inorganico (PPi) e la formazione di un intermedio
detto “amminoacil-adenililato”, una molecola ad elevato contenuto
energetico, ed AMP (il termine “adenililazione” si riferisce al
trasferimento di AMP, mentre il termine “adenilazione” indica il
trasferimento di adenina).
2. Nella seconda tappa, l’amminoacido adenililato, che rimane strettamente
legato alla sintetasi, reagisce con il tRNA. Il risultato netto di questa
reazione è il trasferimento dell’amminoacido all’estremità 3’ del tRNA
attraverso il gruppo ossidrilico in posizione 2’ o 3’, e il simultaneo
rilascio di AMP.
La reazione complessiva catalizzata da un’amminoacil-tRNA-sintetasi è la
seguente:
Mg2+
Amminoacido + tRNA + ATP   Amminoacil-tRNA + AMP + PPi
amminoacil-tRNA-sintetasi

Introduzione alla sintesi proteica: il ribosoma


Il ribosoma è l’apparato macromolecolare che dirige la sintesi proteica. Nei
procarioti, i macchinari per la trascrizione e la traduzione sono localizzati nello
stesso compartimento cellulare. Il ribosoma, quindi, può iniziare la traduzione non
appena l’RNA spunta dall’RNA polimerasi. Negli eucarioti, invece, la traduzione è
completamente separata dalla trascrizione. Questi eventi si verificano in
compartimenti separati della cellula: la trascrizione
avviene nel nucleo, mentre la traduzione avviene nel
citoplasma. Il ribosoma è composto da RNA e proteine,
assemblati a formare due subunità distinte, una grande
ed una piccola: la subunità maggiore è responsabile della
formazione dei legami peptidici, mentre la subunità minore contiene il centro di
“decifrazione”, in cui i tRNA carichi leggono o decifrano i codoni dell’mRNA. I
ribosomi procariotici, chiamati anche “particelle 70S”, sono composti da una
subunità piccola di 30S e da una subunità grande di 50S: la subunità piccola
contiene 2 molecole di rRNA 16S e 21 proteine differenti, mentre la subunità
grande contiene 2 molecole, una di rRNA 23S ed una di rRNA 5S, associate con
34 proteine differenti. Negli eucarioti, invece, i ribosomi, detti anche “particelle
80S”, sono costituiti da una subunità piccola di 40S, che contiene l’rRNA di 18S
insieme a 33 proteine dette “small”, e da una subunità grande di 60S, che
contiene gli rRNA 28S, 5,8S e 5S insieme a 49 proteine dette “large”. Durante la
traduzione le due subunità sono tra loro unite, ma la caratteristica di maggiore
rilievo è l’esistenza di un solco tra esse il quale serve ad accogliere l’mRNA
tradotto in direzione 5’-3’, e la proteina viene sintetizzata dall’estremità N-
terminale verso quella C-terminale. Il ribosoma contiene tre siti di legame per il
tRNA, chiamati siti A, P ed E. Il sito A è il sito di legame per il tRNA
amminoacilato, il sito P è quello di legame del peptidil-tRNA, mentre il sito E è il
sito di legame per il tRNA scarico che viene rilasciato in seguito al trasferimento
della catena polipeptidica nascente all’amminoacil-tRNA (E sta per exit, uscita).
Ciascun sito di legame per il tRNA si forma dall’associazione tra la subunità
maggiore e quella minore del ribosoma. Affinché la traduzione possa avvenire
devono accadere tre cose: 1) il ribosoma deve essere portato sull’mRNA; 2) un
tRNA carico deve essere posizionato nel sito P del ribosoma; 3) il ribosoma deve
essere posizionato esattamente sul codone di inizio.

Traduzione: sintesi proteica nei procarioti


Nei procarioti la sintesi proteica può essere suddivisa in tre fasi: inizio,
allungamento e termine.

INIZIO: all’inizio della traduzione un tRNA carico entra nel sito P del ribosoma.
Questo evento necessita di un tRNA speciale, noto come “tRNA iniziatore”, che
accoppia le proprie basi con quelle del codone di inizio AUG che codifica per la
metionina (quindi l’amminoacido inizialmente inserito in ogni proteina è una
metionina). Nei batteri questa metionina iniziale viene modificata in N-
formilmetionina mediante l’aggiunta di un gruppo formilico alla porzione ammino-
terminale. In questo caso il tRNA iniziatore carico con questo amminoacido è
detto “tRNA-N-formilmetionina”. L’N-formilmetionina rappresenta il primo
amminoacido a partire dal quale inizia la sintesi di tutte le proteine batteriche.
L’aggiunta del gruppo formilico è importante in quanto se ciò non dovesse avvenire
l’NH2 libero potrebbe essere coinvolto in altre reazioni o attaccato dalle
“esopeptidasi”, enzimi che degradano le proteine a partire dall’estremità N-
terminale. Il tRNA iniziatore (tRNA-N-formilmetionina) sarà in grado di avviare
la sintesi proteica legandosi al sito P del ribosoma, formato dall’mRNA e dalla
subunità minore. Dopo il caricamento del tRNA, quindi, bisogna che nel complesso
ci sia anche la subunità ribosomiale minore 30S. Ciò richiede l’intervento di tre
fattori d’inizio: “IF1”, “IF2” e “IF3”, nonché di una molecola di GTP. Il primo
fattore che agisce è IF3 che si lega alla subunità 30S libera, impedendo che
questa si possa riassociare alla subunità 50S prima che si sia completata la
formazione del complesso d’inizio. Per questa sua capacità IF3 è un “fattore
antiassociativo”. Anche gli altri fattori d’inizio, IF1 e IF2, si legano alla subunità
30S. Di questi, IF2, che porta legato il GTP, è in grado di distinguere il tRNA-N-
formilmetionina dagli altri amminoacil-tRNA normali, garantendo così che all’inizio
solo il tRNA iniziatore si posizioni nel sito P. IF1, invece, si lega alla subunità 30S
solo successivamente per stabilizzare il complesso d’inizio. Dopo che i tre fattori
si sono legati alla subunità 30S del ribosoma, quest’ultimo va, a sua volta, ad
interagire con la regione dell’mRNA che porta il codone d’inizio AUG. Questo
codone, tuttavia, non è sufficiente come segnale di legame tra il ribosoma e
l’mRNA, ma è richiesta anche la presenza di una sequenza localizzata
approssimativamente 10 nucleotidi a monte dell’estremità 5’ del codone d’inizio.
Si tratta di una sequenza ricca di purine, lunga dalle 5 alle 8 bp, detta “sequenza
di “Shine-Dalgarno”, la quale interagisce mediante l’appaiamento complementare
delle basi con un segmento ricco di pirimidine situato presso l’estremità 3’
dell’rRNA 16S della subunità ribosomiale 30S. Con ciò il ribosoma si localizza
sull’mRNA. Il passo successivo consiste nella formazione di un legame tra il tRNA
iniziatore ed il codone di inizio AUG per completare il complesso. Infine,
interviene la subunità 50S del ribosoma la quale si unisce alla subunità più piccola
formando un ribosoma completo. Quando ciò accade i fattori d’inizio vengono
rilasciati, grazie all’attività GTPasica di IF2 che idrolizza il GTP solo quando la
subunità grande si unisce a quella piccola, formando così un ribosoma 70S attivo.
ALLUNGAMENTO: al termine della fase d’inizio il sito P è occupato dal tRNA-N-
formilmetionina, mentre il sito A è vuoto. Perché possa formarsi il primo legame
peptidico è necessario che nel sito A venga posizionato l’amminoacil-tRNA
contenente l’amminoacido specificato dal codone dell’mRNA che si trova nel sito
A. Due proteine, chiamate fattori di allungamento “EF-TU” e “EF-TS”, sono
necessarie per portare al ribosoma, che sta eseguendo la traduzione, gli
amminoacil-tRNA appropriati. In particolare EF-TU è un monomero con un sito di
legame per il GTP. Nelle cellule procariotiche il complesso EF-TU/GTP si associa
all’amminoacil-tRNA, formando un complesso ternario che si lega al ribosoma e
deposita l’amminoacil-tRNA nel sito A. La deposizione nel sito A richiede l’idrolisi
del GTP che provoca la formazione del complesso EF-TU/GDP che è rilasciato nel
ribosoma. A questo punto, però, EF-TU non può legare altre molecole di
amminoacil-tRNA fino a quando il GDP non si dissocia. A tale scopo entra in azione
il fattore di allungamento EF-TS, il quale catalizza lo scambio nucleotidico tra il
GDP e il GTP. Dopo che l’amminoacil-tRNA si è inserito nel sito A si ha la
formazione di un legame peptidico tra il gruppo carbossilico (-COOH)
dell’amminoacido N-formilmetionina, legato al tRNA nel sito P, e il gruppo
amminico (-NH2) del secondo amminoacido che è legato al tRNA nel sito A. La
formazione del legame peptidico è catalizzata dall’enzima “peptidiltransferasi”
della subunità maggiore del ribosoma. In seguito alla formazione di tale legame la
N-formilmetionina viene trasferita sul sito A, formando un “peptidil-tRNA”,
mentre nel sito P rimane un tRNA scarico che viene rilasciato. Per poter tradurre
il codone successivo, il ribosoma avanza di tre nucleotidi in direzione 3’
sull’mRNA: questo movimento è definito “traslocazione”. Ciò fa si che il peptidil-
tRNA si sposti dal sito A al sito P. Avvenuta la traslocazione, il ribosoma presenta
il sito A ancora vuoto, pronto per ricevere l’amminoacil-tRNA che corrisponde al
codone successivo. La fase di traslocazione richiede la partecipazione di un altro
fattore di allungamento , detto “EF-G”, una proteina monometrica con un sito di
legame per il GTP. EF-G si lega al ribosoma per facilitare la traslocazione e viene,
poi, rilasciato in seguito all’idrolisi del GTP. Una volta che il ribosoma si è
spostato dal sito d’inizio sull’mRNA, avviene un altro evento di inizio.

TERMINE: man mano che il ribosoma si muove lungo l’mRNA in direzione 5’-3’, il
sito A viene occupato da diversi codoni. Quando in tale posizione si viene a
trovare uno dei tre codoni di terminazione (UAA, UAG, UGA), dal momento che
essi non specificano per nessun amminoacido, non c’è alcun tRNA che possa
legarsi ad essi, per cui il peptidil-tRNA resta bloccato sul sito P. A questo punto
intervengono specifici fattori di rilascio: “RF1”, “RF2” ed “RF3”. Di questi RF1
riconosce i codoni di stop UAA e UAG; RF2 riconosce i codoni UAA e UGA; RF3
non è in grado di riconoscere nessuno dei codoni di stop. Tuttavia esso lega il GTP
ed ha il compito di stimolare gli eventi di terminazione. Nel corso di tali eventi
questi fattori alterano l’attività della peptidil-transferasi, facendole idrolizzare
il legame estere del peptidil-tRNA e provocando così il rilascio della catena
polipeptidica dal ribosoma e la dissociazione di quest’ultimo dall’mRNA. La sintesi
proteica è, dunque, completa.

Sintesi proteica

Legame peptidico
Traduzione: sintesi proteica negli eucarioti
Negli eucarioti le varie fasi della sintesi proteica sono simili a quelle dei
procarioti. Esistono, comunque, delle differenze che derivano da alcune
caratteristiche intrinseche alla cellula eucariotica:
1. Negli eucarioti il meccanismo della trascrizione è fisicamente separato da
quello della traduzione;
2. Le estremità 5’ e 3’ dell’mRNA eucariotico sono dotate di strutture
particolari, quali la coda di poli A al 3’ ed il cappuccio al 5’;
3. Gli mRNA eucariotici sono monocistronici, cioè la loro sequenza codifica per
una sola proteina.
Malgrado queste differenze negli eucarioti le fasi di allungamento e di
terminazione della catena differiscono solo leggermente da quelle dei procarioti,
mentre è nella fase di inizio che esistono le differenze più marcate. Esse
riguardano il modo in cui le subunità minori dei ribosomi riconoscono i siti di inizio
sull’mRNA.
INIZIO: nei batteri la subunità 30S si lega ad una sequenza consenso dell’mRNA
che comprende sia il codone di inizio AUG sia la sequenza di Shine-Dalgarno.
Negli eucarioti, invece, la subunità 40S riconosce due caratteristiche strutturali
dell’mRNA: 1) il cappuccio metilato, e 2) una sequenza consenso situata circa 40
bp a valle e contenente il sito di inizio AUG. In particolare, negli eucarioti, la
subunità minore prima riconosce l’estremità 5’ dell’mRNA (cioè il cappuccio) e poi
si sposta sul sito di inizio dove viene raggiunta dalla subunità maggiore. Tuttavia il
legame della subunità 40S al 5’ dell’mRNA può essere ostacolato dalla
formazione, in tale regione, di strutture secondarie ad anse o forcine. Per questo
motivo questa regione deve essere “linearizzata”, e a ciò provvedono vari fattori
di inizio. Il fattore “IF-4F” riconosce la struttura del cappuccio al 5’ alla quale si
lega e svolge ogni struttura secondaria eventualmente presente nelle prime 15
basi dell’mRNA. L’energia necessaria è fornita dall’idrolisi di ATP. Lo svolgimento
della struttura secondaria nella parte resta dell’mRNA prosegue ad opera di “IF-
4A” e di un ulteriore fattore detto “IF-4B”. A questo punto può intervenire la
subunità 40S che porta a sé legato un complesso ternario, formato da tRNA-
metionina, “IF-2B” e il GTP. Questo complesso si forma, in realtà, in due fasi:
dapprima il GTP si lega a IF-2B con conseguente aumento dell’affinità di questo
fattore per il tRNA-metionina che, a sua volta, viene legato. Ciò porta alla
formazione del complesso ternario che si associa direttamente con la subunità
40S libera. A questo punto è importante l’intervento di “IF3”, che permette alla
subunità 40S, unita al complesso ternario, di legarsi all’estremo 5’ dell’mRNA.
Dopo essersi legata al 5’ la subunità minore migra fino al codone di inizio AUG
situato all’interno di una sequenza consenso detta “sequenza di Kozak
GCGACCAUGG”. In essa la purina (A o G) localizzata 3 basi prima di AUG, e la G
situato subito dopo il codone, sono gli elementi più importanti di questa sequenza
e possono far aumentare l’efficienza della traduzione. Quando la subunità 40S
raggiunge il sito di inizio si ferma, ma l’associazione della subunità 60S non può
avvenire finché IF-2B e IF3 non sono stati rilasciati dal complesso.

ALLUNGAMENTO: i tre fattori che collaborano con il ribosoma durante la fase


di allungamento sono: “EF-1α”, “EF-1β” e “EF2”. Di questi, EF-1α lega l’amminoacil-
tRNA nel sito A, EF-1β ricicla EF-1α, ed infine EF2 agisce durante la
traslocazione del ribosoma sull’mRNA.

TERMINE: nella fase di terminazione è, invece, necessario un solo fattore di


rilascio, detto “RF”, che per funzionare richiede ATP.