Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
DNA e RNA
I primi esperimenti sugli acidi nucleici rivelarono due tipi di molecole: il DNA più stabile e resistente agli
acidi e l’RNA. DNA e RNA venivano trovati insieme nelle cellule procariotiche ed eucariotiche, mentre nei
virus era trovato solo uno dei due. Nelle cellule eucariotiche il DNA era recuperato dai nuclei cellulari,
mentre l’RNA si isolava dalla frazione citoplasmatica. In seguito sono stati identificati tre tipi di molecole di
RNA: RNA messaggero (mRNA), RNA ribosomiale (rRNA) e RNA transfer (tRNA).
Nel 1928 Griffith condusse un esperimento su un ceppo non contagioso di Streptococcus pneumoniae, che
si trasformava in virulento, se mescolato con un lisato inattivato dal calore del ceppo virulento. Nel 1943
Avery osservò che era il DNA la sostanza trasformante.
Importanti sono le basi azotate, che costituiscono parte del
nucleotide: uracile, citosina, timina, guanina e adenina. Esse sono
divise in purine (la prima ad essere isolata fu l'acido urico
dall'urina e si chiama così perché è urina purificata) e pirimidine.
Oltre alle basi, il nucleotide è costituito da uno zucchero pentoso,
ribosio o desossiribosio, in base a se si tratta di RNA o DNA.
E' esistito un DNA a galattosio, ma non si riusciva ad ottenere
stabilità e non serviva per le stesse funzioni.
1
Giulia Mostini
2
Giulia Mostini
Nella conformazione B, la distanza tra due coppie di basi è di 0,34 nm e per fare un giro completo servono
circa 10 basi (360 gradi). Il passo dell’elica, invece, è la distanza che essa percorre per tornare al punto di
partenza (3,4 nm). Il diametro, invece, è di 2 nm.
In questa tipologia di DNA, si distinguono un solco (groove) maggiore e uno minore in base agli angoli
formati dalle basi con lo zucchero. Gruppi chimici diversi sono esposti nel solco maggiore e minore. E' una
questione di entropia perché il disordine è a carico dell'acqua, a permettere il mantenimento dell'energia.
Se si apre la molecola, l'acqua diminuisce la sua entropia e diventa più ordinata. L'esposizione delle basi di
solco maggiore e minore è fondamentale per l'interazione del DNA con le altre macromolecole.
La transizione da forma A a forma B è la più studiata ed è dovuta al differente ripiegamento dell’anello
furanosico del ribosio: quattro dei cinque atomi dell’anello sono coplanari, mentre un quinto (C2 o C3) è
sfasato. Se il C2 o il C3 si dispone dallo stesso lato di C5, la conformazione è endo, se è dal lato opposto la
conformazione è eso. Nella forma B, il C2 è in endo a causa dell'acqua, mentre nella forma A è il C3 ad
essere in endo. In condizioni saline elevate o in uno stato parzialmente disidratato, infatti il DNA esiste
sottoforma di DNA A, che è un’elica destrorsa con 11 coppie di basi per giro e un diametro di 2,3 nm.
Infine, vi è il DNA Z, ovvero un’elica sinistrorsa che si trova in doppie eliche ricche in G:C contenenti residui
alternati di purine e pirimidine. Esso presenta 12 coppie di basi per giro e un diametro di 1,8. Quando la
struttura è massima, diventa inaccessibile a ogni enzima.
Lo scheletro (back bone) fosfato-ribosio non ha doppi legami, per cui tutti i legami ruotano su se stessi,
essendo legami semplici. La rotazione avviene intorno a 7 legami principali per monomero:
1. Χ: del legame glicosidico tra base e zucchero;
2. γ: del legame C4-C5 dello zucchero;
3. δ: del legame C4-C3 dello zucchero;
4. α e β: del ponte fosfodiesterico al C5’ dello zucchero;
5. ε e ζ: del ponte fosfodiesterico al C3’ dello zucchero.
Le basi appaiate non sono perfettamente complanari, ma ruotate leggermente l’una rispetto all’altra.
Questo permette di aumentare l’impilamento delle basi (stacking) lungo un filamento. L’elica B si può
curvare senza alterazioni della struttura locale, consentendo al DNA di assumere forme circolari e di
avvolgersi in strutture terziarie. Il DNA può anche formare dei ripiegamenti bruschi dovuti a specifiche
sequenze di basi, come AAAA, o al legame ad una proteina.
Il backbone viene influenzato e può quasi formare un gomito, abbandonando la doppia elica. Questo dà
grandi potenzialità e gradi di libertà alla molecola.
3
Giulia Mostini
In una molecola di DNA circolare, la separazione dei due filamenti determina la riduzione del numero di
volte in cui i filamenti si avvolgono l’uno intorno all’altro. Questa condizione (underwound) è instabile per
la tensione a cui sono sottoposti i legami dei singoli nucleotidi e la molecola circolare si torce formando
superavvolgimenti.
Il linking number (Lk) è il numero di volte (turn) in cui un filamento si avvolge su di un altro (numero di
passi/10). E’ un numero intero che può essere positivo, se l'anello destro avvolge il sinistro, negativo, se il
sinistro avvolge il destro. E' uguale al twist number (Tw), cioè il numero complessivo di volte in cui un
filamento ruota intorno a un altro, sommato al wright number (Wr), cioè il numero di volte in cui l’asse
immaginario della molecola circolare planare ruota intorno a se stesso (superavvolgimenti).
Il numero di superavvolgimenti complessivi (∆Lk) lo si può ricavare da Lk – Lk0. Lk0 è Lk di un circolo
rilassato, cioè è uguale al numero dei passi dell’elica ovvero al numero delle coppie di basi/ 10.5 (è numero
sempre positivo perché l’elica è destrorsa). Il numero totale, normalizzando per la lunghezza del DNA,
diventa σ = ∆Lk/Lk0. Questo valore è di circa – 0,06 sia nei procarioti sia negli eucarioti ad indicare un
moderato superavvolgimento negativo complessivo del DNA nelle cellule. Questo stato di
superavvolgimento negativo è in equilibrio con tratti svolti dalla doppia elica, favorendo la dissociazione dei
filamenti.
4
Giulia Mostini
dopo una replicazione conservativa di DNA pesante in un terreno leggero, metà del DNA sarebbe stato
ancora pesante e l’altra metà sarebbe stata leggera. Se la replicazione fosse stata dispersiva, i due scienziati
avrebbero osservato uno spostamento della densità del DNA da pesante a leggera in ciascuna generazione.
Queste possibilità erano chiaramente incomparabili con i risultati degli esperimenti. Dunque, la replicazione
avviene in modo semiconservativo.
5
Giulia Mostini
mancanza di specificità di legame del complesso iniziatore delle cellule di mammifero, denominato ORC
(origin recognition complex), che non mostra alcuna preferenza di legame per specifiche sequenze di DNA.
Venne ipotizzato che anche per gli eucarioti la replicazione avvenisse mediante bolle. Oggi non si sanno
esattamente quali siano le origini di replicazione degli eucarioti. L'inizio della replicazione, comunque, non è
casuale e deve esserci per forza una sequenza specifica, anche perché, se qualunque sequenza funzionasse
da origine di replicazione, la ricerca mediante “deep sequencing” dei frammenti a singolo filamento,
arriverebbe a saturazione solo superando la copertura dell’intero genoma. Per capire ciò è stato effettuato
un sequenziamento, secondo cui solo il 10% delle regioni possono essere origine di replicazione.
Ovviamente, solo porzioni del genoma fungono da origine di replicazione.
Elicasi e primasi
Il singolo filamento, a questo punto, viene riconosciuto dalle elicasi, fatte come un esagono, che all'esterno
è aperto e si richiude all’interno sul filamento di DNA. Esse furono scoperte nel 1976 in differenti forme per
gli eucarioti e per i procarioti. Il complesso dell’elicasi quindi circonda una porzione a filamento singolo del
DNA, si richiude e scorre lungo il filamento di DNA, separando la doppia elica, utilizzando l’energia di un
ATP idrolizzata, che ne promuove la rotazione. Infatti, per ogni ATP consumata, si ha una rotazione di 120°
(3 per farla ruotare di un giro completo). In questo modo si svolge la doppia elica in una direzione precisa,
esponendo il singolo filamento, che rimane aperto tramite le proteine SSB (single strand binding protein),
cioè proteine che hanno maggior affinità per il singolo filamento, rispetto al doppio. Il Replication Protein A
è il principale complesso SSB eucariotico.
A questo punto, le DNA polimerasi allungano un filamento polinucleotidico, legando un nucleotide
trifosfato per volta all’estremità 3’ di un filamento pre-esistente, ma non riescono ad iniziarne uno dal
nulla. Per questo, le primasi sintetizzano i primer a RNA, complementare al filamento stampo di DNA.
6
Giulia Mostini
Le primasi sono enzimi antichi e complessi e negli organismi più primitivi, a volte, sono insieme alle elicasi,
come negli archeobatteri. Alcune caratteristiche, come la tendenza ad iniziare con una base purinica e a
sintetizzare primer di RNA di 5-10 nucleotidi, sembrano essere universali. Tuttavia, primasi procariotiche ed
eucariotiche differiscono radicalmente nell’organizzazione strutturale e nel meccanismo di sintesi
dell’innesco.
La primasi batterica è un singolo polipeptide, mentre nelle cellule eucariotiche la primasi è un eterodimero
di subunità catalitica o piccola (PriS)e subunità regolatrice o grande (PriL). Inoltre, nelle cellule eucariotiche,
la primasi è normalmente associata in uno specifico complesso costitutivo con DNA polimerasi A (Pol α) e
una subunità B.
Negli eucarioti la primasi, subunità p58 e subunità p49 (Prim1), si associa
insieme alla polimerasi α per formare il DNA polimerasi α/primasi complex,
responsabile dell’inizio della sintesi del DNA.
Il dominio primasico è abbastanza conservato, come il Zn finger. Il complesso
primasico eucariotico è formato da varie proteine (CTC 45 e MCM) e lega altre
proteine, cioè polimerasi vere e proprie, dopo aver sintetizzato il primer.
L’azione del complesso DNA polimerasi α/ primasi termina rapidamente,
sostituito dall’azione della DNA polimerasi δ che subentra (polymerase switch)
nell’allungamento del filamento. Il fattore di replicazione C (RF-C) lega il filamento ibrido RNA-DNA,
provocando il distacco del complesso DNA polimerasi α/primasi. Quindi, la DNA polimerasi δ,veicolata dalla
proteina clamp PCNA (proliferating cell nuclear antigen), si lega e continua la sintesi. Questo complesso è
l’unico in grado di iniziare la sintesi di una catena di DNA, tuttavia non possiede un’attività di proof-reading,
per correggere gli errori. Al contrario, la DNA polimerasi δ è in grado di riconoscere i nucleotidi
erroneamente introdotti e di rimuoverli.
DNA polimerasi
Negli organismi avviene una rapida sequenza di accavallamento tra una polimerasi e l'altra perché è
importante avere polimerasi che commettono pochi errori e sono in grado di correggerli.
Le polimerasi sono enzimi processivi perché incorporano una grande quantità di nucleotidi prima di
staccarsi e terminare il ciclo di attività. Inoltre, importante è la velocità di sintesi e la fedeltà. La processività
è direttamente proporzionale alla velocità di sintesi.
La prima stima di processività di una DNA polimerasi in vivo fu ottenuta nel 1976, misurando la velocità di
allungamento del DNA del fago T4, che duplica il proprio genoma in E. Coli in circa 15 minuti.
L'intervento delle polimerasi lo si può schematizzare in un ciclo:
1. Associazione al DNA: la reazione inizia con il legame dell’enzima DNA polimerasi libera (E) con il
primer appaiato sul DNA stampo (DNAn), formando il complesso enzima – DNA (E * DNAn),
secondo una costante di associazione del complesso (Koff,DNA).
2. Legame con il nucleotide: il corretto nucleotide (dNTP) accede al sito della reazione.
3. Formazione del complesso: in presenza di cationi (Mg2+), si promuove la formazione del complesso
ternario polimerasi-DNA-dNTP con kd,dNTP costante di associazione nucleotide – enzima.
4. Cambiamento conformazionale: il legame del dNTP induce un cambiamento conformazionale
dell’enzima nel complesso ternario.
5. Formazione del legame fosfodiesterico: il legame fosfodiesterico viene formato tra il fosfato α del
dNTP in entrata e il 3’-OH del terminale del filamento da estendere (DNAn+1), liberando pirofosfato
(Ppi) e un H+ con acidificazione del mezzo. L'acidificazione viene misurata da alcuni strumenti per la
velocità di sintesi.
6. Secondo cambiamento conformazionale dell’enzima: consente il rilascio del gruppo in uscita PPi.
7. Distacco del nucleotide: è legato alla catena nascente, riportando la polimerasi nella conformazione
nativa, che può riniziare il nuovo ciclo. Il pirofosfato si dissocia, spostando l’equilibrio a favore della
sintesi. La polimerasi quindi accelera questa reazione.
La polimerasi I (polA) riempie i buchi, la II (polB) aggiusta gli errori, la III (polC) fa la sintesi composta da
subunità. La polimerasi γ, invece, è presente negli eucarioti e sintetizza il DNA mitocondriale, diversa dalle
altre. Le tetracicline agiscono su essa perché la polimerasi è simile a quella dei batteri.
7
Giulia Mostini
Fase di elongazione
Nella fase “elongation” della replicazione del DNA, le polimerasi aggiungono nucleotidi all’estremità 3’ del
primer. Sul filamento che ha l’estremità 3’ libera in corrispondenza della forcella, la sintesi procede in modo
continuo e questo filamento è detto filamento veloce (leading strand). La sintesi dell’altro filamento, detto
filamento lento (lagging strand), procede in modo discontinuo e a ritroso, operando su segmenti
relativamente corti di DNA a singolo filamento (1000-2000 nucleotidi in procarioti e 100-200 negli
eucarioti). Su questo filamento vengono copiati brevi segmenti discontinui, detti frammenti di Okazaki. Una
specifica DNA polimerasi rimuove il vecchio primer e lo sostituisce con frammenti di DNA. Questi ultimi,
insieme a quelli di Okazaki, vengono legati da enzimi, detti ligasi, che ne catalizzano il legame
fosfodiesterico finale.
Diversi modelli sono stati proposti per il completamento a filamento continuo della copia del filamento
lagging. La DNA polimerasi δ, all’estremità 3’ di un filamento di Okazaki si verrebbe a scontrare con
l’estremità 5’ del frammento di Okazaki immediatamente successivo, costituito dal primer RNA/DNA
sintetizzato dalla polimerasi α/primasi.
La polimerasi δ scalzerebbe il primer dal filamento di DNA stampo, che ora sarebbe esposto (flapping),
come singola elica, all’azione della giunzione fra RNA e DNA. L’ultimo ribonucleotide verrebbe rimosso
grazie all’attività esonucleasica dell’enzima Flap-1 (FEN-1), che sarebbe anche capace di rimuovere
mediante attività endonucleasica errori di incorporazione nella sequenza primer, prodotta da polimerasi
α/primasi. Eventualmente RPA potrebbe limitare il flapping del primer e mediare la rimozione di questo da
parte dell’endonucleasi Dna2.
Quindi, la polimerasi δ continuerebbe ad allungare il filamento di Okazaki che stava sintetizzando fino a
raggiungere la nuova estremità 5’ del frammento di Okazaki adiacente, privata della sequenza primer a RNA
dall’azione di RNAsi H1 e FEN-1. A questo punto i due frammenti di Okazaki possono essere legati fra loro,
tramite ligasi.
Col termine replisoma, infine, si indica il complesso proteico responsabile della sintesi del DNA, costituito
da elicasi, SSB, primasi, DNA polimerasi, proteine clamp, ribonucleasi H, ligasi e DNA girasi.
8
Giulia Mostini
formati dalla girasi in un DNA circolare inizialmente rilassato è pari al numero di ATP consumate.
La DNA girasi taglia entrambi i filamenti della doppia elica, incrocia nel sito di taglio due doppie eliche e si
dissocia dal DNA, che ora mostra un Wr (wright number) negativo e conseguentemente la possibilità di
aumentare il Tw (Twist number). Dunque, la girasi favorisce lo svolgimento dei due filamenti dell’elica. La
DNA girasi appartiene alla classe 2 delle topoisomerasi.
Le topoisomerasi sono gli enzimi deputati a regolare la topologia del DNA. Esistono due classi:
1. Topoisomerasi I: sono in genere dei
monomeri che tagliano un solo filamento del
DNA al 5’, creando un’apertura mediata dalla
interazioni di diversi domini dell’enzima con
la doppia elica, attraverso la quale può
passare l’altro filamento o una doppia elica.
Questo meccanismo, definito strand passage,
permette di eliminare con grande efficienza
strutture annodate sul DNA, nonché di
decatenare due filamenti di cui uno contenga
una rottura a singolo filamento e di rilassare
esclusivamente superavvolgimenti negativi.
Questo meccanismo non prevede il consumo di ATP. Nei batteri rimuove solo supercoil negativi,
mentre negli eucarioti può rimuovere anche supercoil positivi. Per effettuare il taglio, la
topoisomerasi attacca un residuo di tirosina ad un fosfato del DNA, per rompere il legame
fosfodiesterico. Così le estremità della doppia elica possono ruotare l’una rispetto all’altra,
rilasciando la tensione accumulata. L’energia del legame fosfodiestere è conservata nel legame
fosfo-tirosinico, rendendo reversibile la reazione, la riformazione spontanea del legame
fosfodiestere, che rigenera sia l’elica di DNA sia la topoisomerasi I.
2. Topoisomerasi II (girasi): sono in genere dimeri o
multimeri che introducono un taglio su entrambi i
filamenti del DNA con le due tirosine covalentemente
legate al 5’ e portano avanti le modificazioni
topologiche, facendo passare un secondo tratto a
doppia elica, attraverso la rottura. Il filamento
tagliato si chiama segmento G per gate (cancello),
mentre il segmento che passa per l’apertura si
chiama T per transport. Questo meccanismo d’azione
è chiamato di rotazione controllata o a doppio
cancello e utilizza ATP. Nei batteri questi enzimi
introducono supercoil negativi, rimuovendo i positivi
durante la replicazione del DNA e impaccano la
molecola di DNA nella cellula. Negli eucarioti, invece, possono rimuovere supercoil sia positivi sia
negativi.
Le topoisomerasi sono il bersaglio dei chemioterapici: gli inibitori sono potenti farmaci antineoplastici in
grado di indurre la morte delle cellule proliferanti del tumore che replicano il proprio DNA. Esempi di questi
farmaci sono le camptotecine e la doxorubicina.
Dopo la replicazione, un genoma circolare produce molecole figlie vincolate insieme, come anelli di una
catena. Per separarle interviene topoisomerasi II. Questi enzimi hanno la capacità di tagliare un dsDNA e
farne passare un altro attraverso il taglio operato, slegando i due genomi figli e consentendo la separazione
delle due cellule figlie. Le topoisomerasi II sono implicate anche nella risoluzione degli intrecci di lunghi
cromosomi lineari eucariotici.
I telomeri
Nella replicazione del lagging strand, la rimozione del primer terminale lascia un tratto a filamento singolo
(gap) poiché non è possibile sintetizzare DNA all’estremità 3’.
9
Giulia Mostini
10
Giulia Mostini
Mutazioni puntiformi
• Mutazioni per sostituzione: una coppia di basi viene sostituita da un’altra. Esse possono avvenire
per transizione, quando nel DNA una purina di un filamento viene sostituita con l’altra purina e la
pirimidina con l’altra pirimidina, o per transversione, quando una purina viene sostituita con una
pirimidina e viceversa.
Le mutazioni per sostituzione possono essere senso, se la sostituzione nucleotidica causa una
sostituzione amminoacidica; non senso, se la sostituzione nucleotidica causa la formazione di un
codone di stop con terminazione prematura della traduzione della proteina; oppure silenti o
sinonime, che è un caso particolare di mutazione senso in cui il cambiamento di un codone non
causa il cambiamento dell’amminoacido perché quel “nuovo” codone codifica sempre per lo stesso
amminoacido.
• Mutazioni frameshift: avvengono quando è inserita o deleta una coppia di basi, alterando lo
schema di lettura di tutte le triplette nella porzione di gene a valle del sito in cui si è verificata la
mutazione. E’ molto probabile che si generi un fenotipo mutante.
11
Giulia Mostini
12
Giulia Mostini
Processi di controllo
Il danno al DNA attiva dei processi di controllo (checkpoints) che modificano il fenotipo cellulare.
Inizialmente i checkpoints attivati dal DNA danneggiato venivano identificati con i processi di arresto del
ciclo cellulare allo scopo di fornire il tempo alla cellula per riparare, prima di fissare nelle cellule figlie
l’eventuale errore come mutazione. In seguito, oltre al controllo dell’arresto del ciclo cellulare, diverse
proteine coinvolte in questi meccanismi sono state dimostrare essere coinvolte nella riparazione del DNA e
nella rilocalizzazione degli enzimi di riparo. Inoltre, quando il danno persiste, i checkpoints possono attivare
un programma di morte cellulare (apoptosi) per prevenire la comparsa di cellule trasformate. Difetti nei
checkpoints del danno del DNA producono instabilità genomica.
Molteplici vie (checkpoint pathways) di interazioni e modificazioni fra proteine seguono all’iniziale
riconoscimento di siti danneggiati del DNA. Queste cascate di eventi contribuiscono all’amplificazione e
trasduzione del segnale di danno al DNA all’interno della cellula. In questo modo un singolo sito mutato
può indurre un effetto sostanziale a livello dell’intera cellula, come l’arresto della divisione. Gli enzimi
attivati, di solito, sono le chinasi. Il gene soppressore del tumore p53, per esempio, è un mediatore centrale
della risposta indotta dal danno del DNA nei mammiferi.
Il danno reale al DNA è elevato (60.000 danni al giorno), in particolare per il verificarsi di danni ossidativi,
mentre le mutazioni sono più rare. I difetti negli enzimi di riparo possono favorire il cancro.
13
Giulia Mostini
decadimento energetico immediato. A questo punto, l'enzima viene rilasciato dal DNA e il ciclo può
ripartire.
E. Coli riesce a riparare il DNA anche in assenza di luce, con un sistema di escissione, comprendente quattro
enzimi che si assemblano in un complesso: UvrA, UvrB, UvrC e UvrD riconoscono, tagliano e rimuovono un
tratto di filamento singolo intorno al dimero di timina.
L'altro meccanismo diretto è la transmetilazione, tramite rimozione di gruppi alchilici. In molti procarioti,
l’effetto degli agenti alchilanti viene rimosso dall’enzima O6-alkylguanine DNA alchiltransferasi (AGT I o ADA
o AGT II in procarioti; MGMT o AGAT in mammiferi), che trasferisce il gruppo metilico dalla guanina ad un
residuo di cisteina dell'enzima, riformando la struttura della guanina che può nuovamente appaiarsi con la
citosina. ADA è un operone, cioè un insieme di 4 geni che vengono attivati insieme (Ada, AlkA, AlkB, AidB).
Lo stress e i fattori ambientali possono regolarne l'espressione metabolica.
BER
Il primo passaggio del processo del BER è il riconoscimento del danno da riparare. Nel caso di danni causati
da specie reattive dell’ossigeno (ROS), DNA glicosilasi specifiche rompono il legame glicosidico tra lo
zucchero e la base azotata danneggiata, scorrendo lungo il solco minore. Questi enzimi, identificata la base
alterata, comprimono la doppia elica del DNA cosicché la base venga flippata all’esterno dell’elica e legata
alla tasca enzimatica specifica dell’enzima. L'enzima, ovviamente, interagisce con una porzione positiva,
dato che il DNA è negativo, e scorre in due dimensioni. La glicosilasi riconosce l’uracile e lo elimina,
producendo un sito apurinico o apirimidinico (abasico) senza la base corrispondente. Questi enzimi tagliano
anche l’adenina erroneamente appaiata alle basi ossidate. Successivamente, una endonucleasi, detta APE1,
riconosce il sito privo di base e incide il legame fosfodiesterico.
Il BER, dopo l'intervento della glicosilasi, può procedere attraverso due vie: long o short. La seconda è la
preponderante nei mammiferi e richiede l’intervento della DNA polimerasi β, che rimuove il desossiribosio
privo di base e poi riempie il buco creatosi. Successivamente, il legame fosfodiesterico è saldato da una
ligasi specializzata (DNA ligasi 3). Il long patch, invece, prevede l’azione delle DNA polimerasi δ o ε e di
PCNA che allungano il 3’-OH di 2-10 nucleotidi, attraverso una reazione di “strand displacement”,
denominata FEN 1(flap endonuclease 1), che riconosce la struttura formatasi. La discontinuità è poi saldata
dalle ligasi 1 o 3.
Per localizzare le interazioni, si utilizzano le tecniche di immunofluorescenza. In pratica si costruiscono
proteine di fusione, formando un unico gene con un'altra proteina, in modo da far esprimere le proteine da
un unico gene, per poi osservare al microscopio la porzione fluorescente che è stata fusa.
NER
Per quanto riguarda NER, esso agisce negli eucarioti e nei procarioti, riparando le lesioni che provocano una
distorsione della doppia elica del DNA e sono causate da agenti chimico-fisici. In particolare è richiesto per
la riparazione dei danni causati da radiazioni ultraviolette ((UV) che sono presenti nella normale luce solare.
Il meccanismo del NER si divide in GGR (global genome repair), se riguarda una lesione estesa a tutto il
genoma, e TCR (transcription Coupled Repair), che riguarda solo geni in fase di attiva trascrizione.
Il TCR agisce sul gene in trascrizione, per cui è presente RNA polimerasi. Se si incontra un sito danneggiato
la RNA polimerasi, che deve sintetizzare mRNA, si dissocia e intervengono altri fattori del NER che iniziano il
processo di riparo. Una lesione al DNA è riconosciuta direttamente in qualunque punto del genoma dai
complessi UV-DDB e XPC/HR23B o produce lo stallo della polimerasi, che associa CSB. Dopo il
riconoscimento del danno, il complesso TFIIH viene reclutato per svolgere il DNA attorno al danno e le
proteine strutturali XPA e RPA si legano al DNA a filamento singolo risultante. Successivamente, le
endonucleasi ERCC1/XPF e XPG rimuovono una patch di DNA, comprendente la lesione. Infine, avviene il
14
Giulia Mostini
riempimento del gap con la sintesi di nuovo DNA. Durante l’elaborazione di una lesione, altre proteine in
prossimità, compresi gli istoni, vengono modificate come parte di una cascata di segnalazione.
In GGR, invece, UVRA e UVRB scorrono ovunque nel genoma, per cui possono riconoscere siti danneggiati,
rimuovendo il sito danneggiando stesso al di fuori della trascrizione. Ci sono dei fattori che codificano per le
proteine necessarie.
Tutte le proteine che intervengono hanno un'origine particolare, derivata dal riconoscimento di malattie,
da cui si è proceduto all'indietro. Altre proteine, invece, intervengono nella rimozione del filamento e o
viene riempito il buco da ligasi oppure vengono attivati i checkpoint.
I difetti del NER possono causare gravi malattie:
• Xeroderma pigmentoso (XP): è caratterizzato da un’esposizione alla luce solare, che provoca cancro
alla pelle, lesioni oculari, anormalità neuronali, progeria. I geni mutati sono XPA, XPB, XPC, XPD, XPF
e XPG.
• Tricotiodistrofia (TTD): è caratterizzata da un disturbo fisico e mentale, con caduta dei capelli
perché vi sono difetti nel riparo del DNA, con perdita di cellule staminali nella cute. I geni mutati
sono XPB, XPD, TTDA, che costituiscono il fattore TFIIH.
• Cockayne syndrome (CS): è associata a un ritardo di sviluppo, con sintomi quali nanismo, progeria,
atrofia oculare, ritardo mentale e sensibilità alla luce solare. I geni mutati sono CSA e CSB.
I meccanismi di riparo NER, BER e delle rotture di entrambi i filamenti (DSB – Double Strand Breaks)
comportano la formazione di ssDNA che associa SSB che reclutano la chinasi ATR sul sito della lesione,
iniziando la cascata del checkpoint ATR dipendente (può essere attivata anche da riparazioni omologhe).
L’attivazione di ATR stimola le chinasi del checkpoint, che a loro volta attivano p53, prevenendo la
degradazione, e inibiscono le fosfatasi Cdc25. P53 trascrive il gene p21, un inibitore di CDK, e le Cdc25 non
riescono più ad attivare, mediante defosforilazione, il CDK. Il risultato è che le cicline non promuovono oltre
il ciclo cellulare.
Mutazioni di ATM o ATR producono gravi malattie:
• Sindrome di Seckel (nanismo): i sintomi sono ritardo nello sviluppo intrauterino e post natale,
nanismo, microcefalia, ritardo mentale e progeria. Il gene mutato è ATR.
• Atassia telangectasia (AT): i sintomi sono atrofia muscolare, difetti di coordinazione, ritardo
mentale, dilatazione dei vasi, immunodeficienza, sensibilità alle radiazioni e agli agenti mutageni,
aumentata incidenza di cancro. Il gene mutato è ATM.
3. Formazione di due molecole di DNA congiunte che si formano quando un filamento con l’estremità
3’-OH libera di una delle due molecole di DNA trova una sequenza complementare sulla molecola di
DNA omologa. Le due molecole sono ora congiunte da filamenti che si incrociano, formando nella
regione di omologia la struttura chiamata giunzione di Holliday. Il modello oggi più accreditato di
ricombinazione omologa indica che la maggior parte degli eventi di ricombinazione sono innescati
da rotture del DNA a doppio filamento (DSB). In tale modello si creano due giunzioni di Holliday.
4. Le giunzioni di Holliday possono muoversi sulle molecole di DNA, prevedendo, nel caso di DSB,
neosintesi di DNA attraverso un processo chiamato migrazione della giunzione o branch migration.
5. Le giunzioni di Holliday devono, infine, essere risolte da tagli e ricuciture del DNA, tramite l’azione
di più proteine che qui indichiamo come risolvasi. La risoluzione della giunzione di Holliday può
avvenire mediante tagli con orientazioni diverse che danno origine a diversi prodotti di
ricombinazione.
Oltre alla branch migration, esiste il by-pass di rewind: il
filamento più lungo si riappaia.
I DSB si possono originare durante i processi di riparo per il NER
e BER, se vengono tagliati altri legami fosfodiesterici, per cui le
molecole si staccano e hanno la possibilità di congiungersi da
altre parti, generando mutazioni e nuovi prodotti proteici di
trasformazione delle cellule. Questo è dato anche da raggi
gamma o UV. L'elettroforesi in agarosio consiste nel passare il
DNA puro nell'agarosio, dando un saggio comet, ovvero una
scia: più la scia è lunga più è danneggiato il DNA.
Dunque, la ricombinazione omologa interviene sia su
interruzioni nette sia su estremità protruding. DSB netti,
eventualmente, vengono processati a singoli filamenti
protruding al 3’ dal complesso MRN e altre proteine Rad.
Quindi, Rad51 sostituisce la SSB RPA e promuove l’invasione del
cromosoma omologo da parte del filamento 3’ protruding che
porta alla formazione di eteroduplex e di intermedi di Holliday.
Il rilascio di Rad51 all’estremità favorisce la neosintesi di DNA.
Infine, l’intermedio di ricombinazione è risolto dall’azione delle
resolvasi e i frammenti legati da ligasi.
HR in E.Coli
Il complesso RecBCD si lega a un DSB secondo un orientamento
preciso e srotola la doppia elica, grazie alle sue elicasi ATP-
dipendenti RecD (veloce) sul 5’ e RecB (lenta) sul 3’. Quindi lo
svolgimento in 5' -> 3' è più veloce. Questo costringe il
filamento lento a fare un loop. Quando si arriva in prossimità della sequenza 5’-GCTGGTGG-3’ (χ),
riconosciuta da RecC, l’attività nucleasica di RecB degrada il filamento opposto, rilasciando un filamento
sporgente al 3’ su cui la proteina RecA si lega, avviando il processo di ricombinazione. Il risultato è il
protruding di 3' perché 5' è sparito.
A questo punto, RecA si lega al singolo filamento in maniera cooperativa con una velocità di
polimerizzazione maggiore in direzione 5’ -> 3’. Così si genera un 3' protruding foderato da questo
materiale proteico.
Lo strand invasion è lo step di invasione dell'altro filamento. Non si capisce molto bene come avvenga il
meccanismo. C'è un modello di rotazione, uno di dissociazione e uno di ridistribuzione. Il primo (contenuto
in RecA) ingloba anche l'altra elica in una rotazione continua, facendo ruotare il singolo filamento (azione
meccanica ATP dipendente). Nel secondo, c'è un azione per cui avviene l’accoppiamento dello scambio di
DNA-filamento con la dissociazione dei monomeri RecA. Nel terzo modello, RecA avrebbe solo la funzione
di facilitare l’appaiamento con DNA, consentendo l’ immersione del single strand nell'altro filamento nudo.
16
Giulia Mostini
A questo punto c'è la risoluzione dell’intermedio con la formazione dell’ incrocio di Holliday: il complesso di
RuvA e RuvB (elicasi) riconosce la giunzione di Holliday e ne promuove la migrazione (chiasmo). RuvC,
invece, è una resolvasi che risolve il complesso tagliando in una delle sue direzioni dopo la seconda T della
sequenza 5’-A/TTTG/C-3’.
La direzione del taglio operato dalla resolvasi può determinare il rimescolamento della sequenza allelica sul
cromosoma.
Nel caso del DNA danneggiato, possono intervenire BRCA1, BRCA2 e Rad51, che interagiscono per riparare
il DNA danneggiato. BRCA1, fosforilato dalla chinasi ATM, lega Rad51. In risposta al danno al DNA, il
complesso si rilocalizza nelle regioni cromosomiche in attiva replicazione, caratterizzate dalla presenza
dell’antigene nucleare cellulare proliferante (PCNA – proteina clamp di DNA polimerasi δ). In questo modo
Rad51 può efficientemente partecipare ad eventuali processi di riparo. La perdita della funzione BRCA1 e/o
BRCA2 porta all’incapacità di riparare il DNA danneggiato. Se ad essere danneggiati sono geni critici, come
p53, essi non possono essere attivati e le cellule proliferano accumulando ulteriori mutazioni.
17
Giulia Mostini
risulta un’inversione.
L'esempio di SSR si trova nel ciclo biologico del fago lambda, che sopravvive grazie a E. Coli che parassita. Il
genoma del fago infatti è iniettato all'interno della cellula batterica, dando un circolo con propria origine di
replicazione oppure può esistere come profago, cioè non completa il suo ciclo vitale, ma si riproduce
integrato con il genoma batterico (ciclo lisogenico – silente). Alternativamente, il profago può essere
escisso dal genoma batterico ed andare incontro a una crescita, entrando in un ciclo litico che porta alla lisi
del batterio con liberazione delle cellule del virus. Sul DNA del fago e su quello di E. Coli sono presenti corte
sequenze altamente omologhe, chiamate attP e attB. La ricombinasi di lambda o integrasi (INT) ricombina
le sequenze, determinando l’integrazione del DNA di lambda nel cromosoma batterico. Le proteine
codificate dal batterio FIS e IHS e XIS sono coinvolte nell’escissione.
Trasposizione e trasposoni
Un elemento trasponibile (TE o trasposone) è una sequenza di DNA che può cambiare posizione all'interno
del genoma. Questo può portare a mutazioni somatiche che risultano in caratteristici fenotipi a mosaico.
La trasposizione è il tipico processo di ricombinazione attraverso cui i trasposoni si muovono sul genoma. Le
ricombinasi coinvolte sono le trasposasi, codificate dalla stessa porzione che si muove.
Ci sono trasposoni a DNA, retrotrasposoni virali LTR e retrotrasposoni non virali (non LTR). I primi possono
essere autonomi perché sono in grado di eseguire da soli la trasposizione, dato che contengono sia le
sequenze di DNA in cis richieste per la reazione di ricombinazione sia le porzioni codificanti per la trasposasi
e/o la trascrittasi inversa, o non autonomi, che possono trasporsi solo in una cellula dotata di un trasposone
autonomo, in grado di provvedere la funzione enzimatica richiesta per la reazione di ricombinazione:
possiedono le sequenza ricombinative in cis sul DNA, ma sono privi della loro propria trasposasi.
18
Giulia Mostini
I trasposoni a DNA tagliano e incollano, nel senso che il dimero di trasposasi lega le sequenze specifiche,
formando un anello che viene escisso e integrato in sequenze bersaglio specifiche duplicate (come il fago
lambda).
Il retrotrasposone, invece, è tipico dei retrovirus in cui la porzione a RNA è cambiata in DNA, come il virus
dell'HIV.
La variegatura dell’ arancia rossa, per esempio, deriva da questi processi. Succede che le piante di arancia
normale vengono infettate da un retrotrasposone, frequente al freddo: se esso (LTR) si inserisce a monte
del gene Ruby, allora si attiva la sua espressione con un pattern variegato e più fa freddo più le arance sono
rosse. Infatti crescono ad altitudini elevate. E' stato sviluppato in agricoltura un metodo per cui è sempre
presente il trasposone, in modo da far sì che il frutto sia sempre rosso. La varietà Novellina è arancione, la
Tarocco è una via di mezzo, mentre Moro è rosso scuro.
La cromatina e il nucleosoma
Il DNA si impacchetta nel nucleo delle cellule umane, in cui sono presenti circa 2 metri di DNA.
I primi studi discendono dal fatto che vi sono coloranti basici o cationici con affinità alta per il DNA
negativo, come l’ematossilina. Per cui, ci si è accorti che vi era del materiale nelle cellule che si colorava in
modo particolare. Lo scienziato tedesco Emil Heitz nel 1930 fu considerato il fondatore della citogenetica,
ma poi è caduto in disgrazia per aver appoggiato Hitler durante la seconda guerra mondiale. Egli con una
ricetta particolare distinse regioni di cromosomi meno dense (eucromatina) e più dense (eterocromatina).
I coloranti adesso sono diversi rispetto al passato perché vi sono diverse densità di colorazione.
La cromatina, quindi, si divide in eterocromatina, che non cambia il proprio stato di condensazione durante
il ciclo cellulare, contiene pochi geni AT ed è localizzata alla periferia del nucleo. Essa è ulteriormente divisa
in costitutiva, che comprende pochi geni ed è formata principalmente da sequenze ripetute, localizzate in
grandi regioni che coincidono con centromeri e telomeri, e facoltativa, composta da regioni attive nella
sintesi di RNA che possono adottare le caratteristiche strutturali tipiche, come nel cromosoma X dei
mammiferi inattivato. L’eucromatina, invece, non è condensata durante l’interfase, ma si condensa con la
mitosi. Essa si concentra all’interno del nucleo e contiene regioni ricche di geni.
Ogni cromosoma ha un proprio bandeggio in base alle basi presenti. Fleming, in particolare, introdusse il
concetto di cromatina e fu il primo ad osservare i cromosomi a spazzola. Col tempo si è passato da
scienziati chimici a biochimici e microscopisti. Ad esempio, Chanbonn (1975) ha visto per la prima volta la
cromatina e il nucleosoma, cioè i frammenti di DNA con delle parti circolari, che sembravano spaziate in
maniera regolare (tra 150 e 250 basi). Il core elettrondenso del nucleosoma è formato da proteine,
scoperte da Kornberg, figlio di colui che aveva scoperto la polimerasi III. A poco più di trent'anni, egli ha
scoperto gli istoni (ha scoperto poi anche i ribosomi) ed è ancora in attività.
Nucleosoma
E’ l’unità fondamentale della cromatina ed è composto da un nucleo, core, formato da una parte proteica
(istoni) e da un DNA, una regione internucleosomale adiacente ai nuclei e un tratto di DNA linker. Il core è
estremamente conservato tra le specie ed è composto da 147 paia di basi di DNA, che compiono 1,7 giri
intorno a un ottamero, il quale è costituito da due molecole di ciascuno degli istoni H3, H4, H2A, H2B. La
19
Giulia Mostini
lunghezza del linker, invece, varia tra le specie e tra i tessuti ed è legato da H1. La lunghezza totale del DNA
nel nucleosoma può variare da 160 a 241 bp.
La struttura può essere ulteriormente condensata: 30- 100 nm.
L’azione di H1, associato al linker, fa acquisire alla cromatina quattro tipiche forme a “bobine elicoidali” del
diametro di 30 nm con una lunghezza del DNA del nucleosoma variabile. Si ritiene che questa
superstruttura sia la forma tipica dell’eterocromatina non attiva trascrizionalmente. Osservazioni ulteriori
suggeriscono che la fibra a 30 nm è altamente dinamica, in modo da dispiegarsi come fibra da 10 nm
quando è percorsa da una RNA polimerasi impegnata nella trascrizione.
Le superstrutture sono anche a solenoide o a zig-zag. I processi che li regolano sono poco noti.
20
Giulia Mostini
21
Giulia Mostini
trascrivere (il gene), l’enzima RNA polimerasi e i ribonucleosidi trifosfati (A, C, U, G) e Mg2+.
Il procedimento della trascrizione procede in direzione 5' -> 3', come nella duplicazione, tramite legame
fosfodiesterico tra le basi del filamento nuovo. L’RNA viene copiato sulla base del filamento stampo 3' -> 5',
che possiede una sequenza complementare all'RNA messaggero trascritto e una sequenza simile al
filamento del DNA complementare, in cui si cambia T in U. Si parla di filamento codificate o senso.
RNA polimerasi
L’RNA polimerasi (oloenzima) di E. Coli è costituito da 5 subunità α,β,β’,σ e ω. La RNA polimerasi lavora
essenzialmente con α e β e la struttura è conservata, con una forma a forcina basata su α che assembla il
complesso sul DNA, β, la quale forma un canale per l'ingresso dei ribonucleosidi trifosfato che sono
incorporati nella catena nascente di RNA, β’, che lega il filamento di DNA da copiare. ω è aggiuntiva e
conferisce variabilità in base alle condizioni di stress ambientale. Il centro del sistema è un canale piccolo
che consente il posizionamento di un α-elica. Il DNA viene svolto per circa 25 nucleotidi, formando la bolla
di trascrizione, perché il DNA all'uscita dalla polimerasi si richiude con l'altro filamento.
La subunità σ è associata debolmente al complesso e serve ad indirizzare il complesso dell’RNA polimerasi
sulla sequenza di DNA da trascrivere. Le subunità (tranne la ω) si assemblano ogni volta che un gene viene
trascritto e si dissociano al termine della trascrizione di quel gene. L’RNA polimerasi catalizza la formazione
del legame fosfodiesterico dal 3’ della nascente catena di mRNA al nuovo ribonucleotide.
22
Giulia Mostini
L’RNA polimerasi dispone di un solco lungo circa 5.5 nm con una larghezza di 2.5 nm. Esso accoglie un tratto
di 15 basi di doppia elica di DNA a diametro 2 nm.
La sintesi procede in maniera semplice e il DNA è quasi piegato a 90 gradi nella parte posteriore dell’enzima
(muro). Nella parte superiore, l’RNA nascente esce dal solco, mentre alla sua destra si trova il canale da
dove fuoriesce il DNA svolto, che prosegue riappaiandosi. Una struttura al centro della polimerasi (timone)
contribuisce a tenere aperta la bolla. Nella parte inferiore una struttura ad imbuto permette l’entrata dei
ribonucleosidi trifosfato. Nel canale opposto c'è un pertugio dove la molecola nascente di RNA viene
rilasciata.
L'RNA polimerasi ha due attività di editing: un’attività di correzione (idrolitico), in cui si comporta come il
proof reading nella duplicazione, capace di rimuovere uno o più nucleotidi appaiati erroneamente, e
un’attività di catalisi della reazione di escissione del ribonucleotide, inversa all’incorporazione (editing
pirofosforolitico). Queste attività di editing sono meno necessarie perché un errore di copia di RNA è meno
grave di un errore nel DNA.
Il concetto di gene
Il dogma centrale della biologia è stato proposto da Crick. Egli l'ha definito così perché voleva arrivare a una
legge universale. Di leggi universali ne esistono poche in biologia, l'unica è che tutte le forme viventi sono
costituite da cellule. Il dogma centrale afferma la direzione del flusso genetico: DNA -> RNA -> proteine.
Non si procede nella direzione opposta, ma è sempre così il flusso di informazioni. Ci sono un po' di
incrinature, per cui non si sa se rimarrà sempre dogma. Ci sono infatti RNA a funzione regolativa che hanno
la capacità di fare modificazioni intrinseche, diverse da quelle dell’RNA nel dogma centrale, ma comunque
per ora rimane solido.
In genetica il gene è l’unità determinante fondamentale, mentre in biologia molecolare il gene è la regione
specifica del genoma contente le informazioni necessarie per codificare molecole esercitanti una funzione.
Gene procariotico
Il gene procariotico è la regione di DNA che produce un RNA nei procarioti.
Esso ha una sequenza codificante, che sarà copiata nell’RNA, una sequenza promotore, che stabilisce il
legame con l’RNA polimerasi e determina l’orientamento nella trascrizione, una sequenza terminatore, che
segnala per la fine della trascrizione.
Il termine gene deriva da un botanico genetista (Hugo de Vries) che ha aperto al mondo le leggi di Mendel,
che aveva coniato il termine pangenes, da cui abbiamo tenuto genes.
La velocità di trascrizione di un gene può cambiare: la quantità di RNA prodotta da un gene, che
rappresenta il suo livello di espressione, può variare perché vi sono geni costitutivi, che di solito sono stabili
nel tempo, e geni inducibili, che possono essere spenti o attivati in base alle necessità. Ad esempio, ci sono
geni espressi quando la quantità di ossigeno cambia (70 geni se è bassa, 50 se è alta) oppure quando
cambia la temperatura (36 geni indotti in E. Coli).
Il controllo dell'espressione varia per esplorare nuovi fenotipi. Per esempio, i procarioti sono in grado di
regolare la produzione di rho.
L’mRNA dei procarioti è molto spesso policistronico, cioè porta l’informazione per più geni.
Negli eucarioti le molecole utilizzate sono un pochino diverse rispetto a quelle dei procarioti: vi sono 3 RNA
polimerasi, un promotore più complesso con varie regioni segnale, svariati fattori trascrizionali e una
maturazione, che nei procarioti non è presente.
23
Giulia Mostini
Il promotore è la sequenza di DNA posizionata all'inizio del gene, dove inizia la trascrizione. E’ costituito da
diversi cis-active elements, che dirigono la frequenza di legame, il posizionamento e l’inizio dell’attività
dell’RNA polimerasi.
Il terminatore, invece, è una sequenza di DNA posizionata alla fine del gene. E’ costituita da diversi cis-
active elements che determinano la fine della trascrizione e il distacco dell’RNA polimerasi.
RACE (rapid amplification of cDNA ends) è un metodo di biologia molecolare per ottenere una sequenza
completa di un trascritto RNA. Consiste nella produzione di una copia iniziale di cDNA (DNA complementare
- sscDNA) dalle molecole di RNA, mediante trascrizione inversa (enzima retrotrascrittasi), a partire da un
primer specifico nel caso di un gene conosciuto o, da un primer casuale degenerato, nel caso in cui si
vogliano studiare diversi RNA dalla sequenza non nota. Al 3’ delle molecole di sscDNA viene poi aggiunta
una coda di A dalla DNA nucleotidil-esotrasferasi e quindi si amplifica (library amplification) per PCR a
partire da un primer oligo-dT. Le copie amplificate del cDNA vengono quindi sequenziate, tramite un
sequenziatore, per l’identificazione di nuove unità di trascrizione. E’ possibile, in questo modo, mappare i
geni.
La trascrizione nei batteri è associata alla traduzione. Sul gene quindi ci sono tantissimi enzimi in azione:
replisoma, enzimi di riparo, RNA polimerasi, ribosomi. Un micron è la lunghezza del genoma di E. Coli
(cilindrino), per cui il processo è compattato nella cellula, in un gel con poca presenza di acqua perché la
concentrazione molecolare è molto elevata.
Elemento up
E' contattato non da σ, ma da α della polimerasi, che ha una coda C – terminale (αCTD) che si prolunga a
monte di -35.
Le sequenza consenso, invece, sono sequenze ideali che descrivono la più frequente interazione del DNA
con la sua proteina regolatrice. Esse derivano dallo studio di sequenze reali e dai più frequenti nucleotidi
presenti nel promotore.
Come RNA procede oltre? I modelli possibili sono tre:
1. Passaggio transiente: la polimerasi avanza per un breve tratto, sintetizzando un corto frammento
abortivo di RNA e poi indietreggia al punto di partenza sul promotore.
2. Bruco: si ha un cambiamento conformazionale della polimerasi che si allunga e si contrae sul DNA.
24
Giulia Mostini
3. Accartocciamento (scrunch): la polimerasi inizialmente sta ferma sul promotore e ingloba dentro di
sé un tratto di DNA che si accartoccia al suo interno. E’ possibile che la polimerasi proceda anche
nella fase di allungamento con questa tecnica.
Terminatori
I terminatori intrinseci sono i terminatori rho-indipendenti, in cui il segnale deriva dal DNA, che contiene
sequenze palindromiche ricche in G-C, seguite da un tratto di 8-9 nucleotidi ricco in A e T. L’RNA trascritto
forma, in questa regione, una forcina che destabilizza, insieme con il tratto di 8 U, il complesso
trascrizionale. Al termine il DNA ha una simmetria diadica, in cui C e G formano un doppio filamento perché
sono fortemente legate, per cui è difficile da aprire. A valle c'è una sequenza AT tradotta in uracile, per cui
vi è una appaiamento debole. Questa struttura distacca RNA nascente e chiude la doppia elica, con stacco
della polimerasi. Queste regioni vengono frequentemente mutate.
Nei terminatori rho dipendenti, invece, il DNA contiene le informazioni per l'attivazione di rho. Esiste una
sequenza RUT che non è netta, ma è ricca in G (41%), riconosciuta da rho, la quale inizia a scorrere come
un’elicasi ATP dipendente, che si muove in direzione 5’->3’, agendo come un terminatore, con conseguente
disassemblamento del complesso di trascrizione.
L’operone
Nel genoma dei procarioti i geni sono per lo più organizzati in operoni. Un operone è un gruppo di geni
adiacenti trascritti insieme in una singola molecola di mRNA, che per questo viene chiamato policistronico.
I livelli di espressione di un gene, garantiti dall’RNA polimerasi in assenza di fattori di attivazione della
trascrizione (attività costitutiva), sono relativamente bassi. Questo livello basale può essere ulteriormente
ridotto da specifiche proteine (repressori) che bloccano il legame della polimerasi al promotore. I livelli di
trascrizione, invece, possono essere aumentati da proteine stimolanti (attivatori).
L’operone lac
L’operone LAC è coinvolto nel metabolismo del lattosio in E. Coli. Esso è soggetto a due meccanismi di
regolazione: una regolazione specifica, realizzata mediante un controllo negativo da parte di un repressore
e che risponde alla disponibilità di lattosio, e una regolazione globale, realizzata da un controllo positivo da
parte di una proteina attivatrice e che risponde a cambiamenti ambientali più ampi.
Quando E. Coli cresce in presenza di sorgenti di carbonio oltre al lattosio, i livelli delle proteine prodotte
dalla trascrizione dei geni dell’operone Lac, z, che codifica per l’enzima β-galattosidasi, y, che codifica per
permeasi, a, che codifica per la tiogalattoside transacetilasi, sono mille volte inferiori rispetto a quando il
lattosio è presente.
25
Giulia Mostini
Quando è presente solo il glucosio, il repressore dell’operone Lac, che lega l’operatore in prossimità del
promotore dell’operone Lac, ne sopprime la trascrizione.
Quando, invece, il lattosio è presente, si lega al repressore e ne impedisce il legame all’operatore,
rilasciando la repressione della trascrizione che può avvenire liberamente dal promotore Lac. Il lattosio è
perciò definito come induttore di questi tre enzimi.
La piccola molecola capace di indurre la trascrizione, in particolare, non è il lattosio, ma il suo analogo
allolattosio, che va considerato il vero naturale induttore. Quando è presente nel mezzo, produce un
aumento della β-galattosidasi.
A livello di sequenze dell'operone LAC, l'operone è sovrapposto al promotore. E' formato da due sequenze
ripetute, che consentono il legame di un dimero di repressione. Le sequenze esistono anche distali, legate
da altri dimeri, dando un tetramero per cui il DNA è racchiuso e forma di forcine. Esso è curvo e
irriconoscibile da σ e polimerasi. In queste condizioni è spento, ma viene attivato quando vi è eliminazione
del tetramero, per cui vi è un allineamento e la polimerasi e σ intervengono.
L’operone lac in risposta al lattosio è un esempio di regolazione negativa della trascrizione. Quando i livelli
di glucosio sono bassi, invece, si attiva l’enzima adenilato ciclasi, che converte l’ATP in AMP ciclico, che a
sua volta lega la proteina attivatore CAP e ne stimola il legame al promotore dell’operone lac, che viene
così indotto a trascrivere attivamente. In questo caso si tratta di un circuito di regolazione positiva o da
catabolita. Questo avviene perché lo zucchero preferenzialmente usato è il glucosio e solo in sua assenza
vengono attivati gli operoni per utilizzare gli altri zuccheri, come il lattosio. Se il glucosio è presente, il cAMP
è basso, il lattosio è assente e non vi è alcun mRNA lac; se il glucosio è presente, il cAMP è basso, il lattosio
è presente e vi sono piccole molecole di mRNA lac; se il glucosio è assente, il cAMP è alto, il lattosio è
presente e vi è abbondante mRNA lac.
Operone Trp
L’operone del triptofano è costituito da un gruppo di geni contigui che codificano per una serie di enzimi
responsabili della sintesi dell’amminoacido. Si tratta di un sistema reprimibile, cioè l’espressione dei geni
viene repressa quando viene aggiunto nel mezzo di coltura il triptofano. Quindi, l’operone è regolato anche
da una regione attenuatore che blocca la trascrizione. Quando il triptofano è scarso, il ribosoma ritarda in
corrispondenza di due codoni per questo amminoacido, favorendo la formazione di una forcina alternativa
a quella che attenua la trascrizione. Il triptofano, infatti, è reprimibile, quindi senza l’operone è trascritto e
con l’operone è represso. L’operone triptofano contiene 5 geni strutturali (A-E) che codificano per specifici
enzimi necessari alla sintesi del triptofano. Nella regolazione è coinvolta la regione A5’ dell’operone (al
promotore), l’operatore, la regione leader e il sito attenuatore.
In presenza di triptofano, è coinvolta la proteina repressore trp non appartenente all’operone. Il repressore
viene attivato e si lega all’operatore per impedire la trascrizione dell’operone. Il ribosoma entra nel
segmento 2 e induce l’mRNA in fase di trascrizione ad assumere una struttura secondaria che porta alla
formazione di un segnale di terminazione: la trascrizione si arresta nelle prime 140 basi e i geni strutturali
dell’operone non sono trascritti.
In assenza di triptofano (processo di attenuazione), la RNA polimerasi può legarsi al promotore e iniziare a
trascrivere l’operone. Il trascritto è detto attenuazione. Subentra, a questo punto, il leader di 100 nucleotidi
che può essere tradotto. Il leader è formato da una regione codificante per un peptide di 14 amminoacidi, il
quale ha due codoni adiacenti che codificano per il triptofano. Sono presenti, poi, sequenze nucleotidiche
in grado di appaiarsi fra loro a formare strutture secondarie alternative. Se il triptofano è assente, il
ribosoma si arresta su UGG, inducendo l’mRNA in fase di trascrizione ad assumere una struttura secondaria
che consente alla RNA polimerasi di continuare.
26
Giulia Mostini
1. Ciclo litico: comune a tutti i batteriofagi, in cui il virus infetta la cellula entro la quale si moltiplica in
pochi minuti e che culmina con la distruzione della cellula ospite il rilascio della proteina fagica.
2. Ciclo lisogenico: avviene per i fagi temperati, in cui il genoma fagico viene integrato nel cromosoma
della cellula ospite e propagato con questo alle cellule figlie. Solo particolari condizioni di induzione
possono indurre l’escissione del genoma del fago da quello cellulare e la ripresa del ciclo litico.
La scelta tra i due cicli è regolata in maniera fine da una serie di eventi e da proteine regolatrici che
agiscono in trans su una particolare regione del genoma di lambda, detta regione di controllo.
Il fago lambda presenta al centro il gene cI che codifica per il repressore di lambda, presente durante il ciclo
lisogenico. A sinistra e a destra del gene si trovano i due geni precoci N e cro che codificano per due
regolatori della trascrizione che operano sulla terminazione e sull’inizio. Questi sono orientati in modo
divergente, per cui sono trascritti sui due diversi filamenti della doppia elica.
Quando più fagi infettano lo stesso batterio, un numero maggiore di genomi di λ sarà presente nella cellula.
Il conseguente maggior numero di copie di cII favorirà la trascrizione del repressore di cI ed il ciclo litico. Al
contrario infezioni rare determinano cicli lisogenici.
Sulla regione di controllo agiscono cI, che è costituito da due domini collegati tra loro da una regione
flessibile (linker), che permette il legame con il DNA e con una regione attivatrice che interagisce con sigma
dell’RNA polimerasi, e Cro, che ha funzione di repressore, si lega al DNA come dimero e impedisce il legame
del repressore nella regione di controllo.
Bisogna ricordare che il regulone è un sistema di controllo genico batterico, per cui più operoni sono sotto
controllo primario di un’unica proteina.
27
Giulia Mostini
• Pol III: è localizzata nel nucleoplasma e sintetizza i tRNA e i piccoli RNA ribosomiali, che lavorano
sulla traduzione delle proteine. Sono state poi identificate pol IV e pol V, che codificano per pochi
geni srRNA.
Le polimerasi sono state identificate tramite la sensibilità all'amanitina. L'amanita falloide intossica e
diventa letale per l'uomo se ingerita. Il suo meccanismo d'azione comprende l’α amanitina. Gli scienziati
effettuarono cromatografie, mettendo il materiale con la tossina su resina. In base all'assorbanza, sono
state riconosciute varie frazioni, 1,2 e 3, da cui derivano i nomi odierni delle RNA polimerasi. Non si
conoscevano gli enzimi coinvolti allora, per cui si è solo scoperto che la tossina in presenza delle frazioni
aveva comportamenti diversi: la prima frazione era insensibile alla amanitina (pol I), per cui rimaneva
elevata la sintesi proteica, mentre la frazione 2 (pol II) veniva completamente inibita, così come la frazione
3 (pol III), anche se in maniera meno intensa. Per cui effettivamente la polimerasi II ha un sito particolare
d'ingresso che viene modificato e occluso dall'amanitina, per cui i nucleotidi non vengono incorporati nel
filamento per appaiarsi al filamento stampo. L’intossicazione, quindi, avviene a livello della trascrizione, in
particolare per fegato e rene, si va in insufficienza epatica e renale e anche una lavanda gastrica è inutile
perché ormai la tossina è entrata in circolo.
28
Giulia Mostini
DNA. Un altro tipo di promotore ha regioni ricche in GC (CpG Island promoter gene), in cui è vario il segnale
e può essere presente a valle dell'inizio della trascrizione.
Per leggere il DNA, esistono gli istoni (nucleosomi) che avvolgono il DNA, per cui la polimerasi deve
svolgerli, rendendoli disponibili. In più, le sequenze di DNA cis-acting, riconosciute da diversi fattori
trascrizionali, devono assemblarsi in complessi plurimolecolari, mediante interazione proteina – proteina
che sono importanti per la trascrizione, per cui il DNA utilizza regioni molto estese. I segnali per la
trascrizione (enhancer), inoltre, possono essere anche molto distanti rispetto all'inizio e possono trovarsi
sia a monte sia a valle. L'RNA trascritto viene poi processato, tagliato, ricucito in base alle funzioni che deve
svolgere, per cui un complesso processamento al trascritto porta alla sua forma matura. Vi sono poi
sequenze non codificanti che devono essere rimosse.
Gli mRNA degli eucarioti non sono policistronici (ad eccezione dei trascritti mitocondriali). Ciascun mRNA
eucariotico, infatti, codifica solamente per un tipo di proteina. Inoltre, nel genoma nucleare degli eucarioti
non esistono operoni.
Il genoma mitocondriale esiste in molte copie (epatocita circa 200 genomi mitocondriali). Esso viene
trascritto a partire da tre promotori e la trascrizione produce tre messaggeri. Si possono codificare le 13
subunità dei complessi respiratori, i rRNA e i tRNA. Quindi, nel mitocondrio c'è l’operone e l’RNA
policistronico perché questo organello deriva da un’endosimbiosi. Le piante si comportano in maniera
analoga con il genoma plastidico.
Svolgimento istoni
Il fattore FACT (Facilitates chromatin transcription) è il fattore critico, cioè un enzima eterodimero, con due
subunità Spr16 e SSRP1, che scalza il dimero istonico (H2a-H2b) prima dell'arrivo della RNA polimerasi.
Questo permette alla RNA polimerasi di trascrivere il DNA associato ai restanti istoni. Il DNA trascritto,
quindi, viene riassemblato, sempre grazie a FACT, nel nucleosoma originario. Vi è solo un rimodellamento
sottile della cromatina, senza la sua distruzione totale.
Regioni regolative
I promotori eucariotici sono più complessi e variabili rispetto a quelli procariotici. Alcuni promotori negli
eucarioti possono anche essere posizionati a valle del sito di inizio della trascrizione (+1).
Numerosi fattori trascrizionali sono coinvolti nel legame dell’RNA polimerasi al DNA. A differenza del
fattore σ, i fattori di inizio della trascrizione eucariotica non fanno parte del complesso della RNA
polimerasi.
I promotori sono tre, in base al tipo della polimerasi che si lega:
1. RNA pol I: l’RNA polimerasi I
trascrive esclusivamente i geni
per gli rRNA. Il promotore è
costituito da due regioni: un
tratto che si sovrappone al sito
di inizio della trascrizione TSS
(da -45 a +20), che costituisce il
core del promotore, e una
regione più a monte, chiamata elemento UPE o UCE (Upstream promoter/control element), che si
estende da -150 a -100. La formazione del complesso di inizio richiede almeno due fattori
trascrizionali ausiliari, chiamati Upstream binding factor (UBF) e SL1. Il primo è una proteina che si
lega al DNA con domini multipli del tipo HMG e interagisce direttamente con il core del promotore
e con l’elemento UCE. La regione C-terminale di UBF è necessaria per l’attivazione della trascrizione
ed è ampiamente fosforilata. SL1 è un complesso multiproteico che comprende la TATA binding
protein (TBP), che è un componente essenziale dei complessi d’inizio di tutte e tre le polimerasi
eucariotiche, e altri fattori associati (TAF e TBP Associated factor) specifici per pol I. SL1 non si lega
al DNA, riconoscendo una sequenza specifica, ma il suo reclutamento è mediato da UBF. SL1, una
volta sul promotore, contatta il DNA e recluta pol I.
29
Giulia Mostini
Siti di terminazione
I siti differiscono in base alla polimerasi e vi è una maggiore imprecisione perché, dovendo lavorare molto,
l’RNA trascritto non ha evoluto un sistema complesso di terminazione.
In pol I, la terminazione avviene oltre le 1.000 basi dopo l’estremità 3’ dell’RNA maturo, che è generato con
un taglio. La terminazione richiede una sequenza di 18 basi e una DNA binding protein.
Nel caso di pol II, non vi è una sequenza netta di terminazione, per cui si pensa che tutto dipenda dai
processi di maturazione dell’mRNA e può avvenire 500-2.000 bp a valle del sito di poliadenilazione.
30
Giulia Mostini
La pol III è simile al gene procariotico che richiede sequenze AT (poli U) sul DNA, ma non richiede strutture
tipiche ad uncino secondarie e loop su mRNA (procarioti rho indipendenti). A volte contiene una regione
ricca in GC.
L'unico messaggio contenuto, quindi, è il sito di poliadenilazione AAUAA in pol II, molto frequente negli
mRNA dove avviene l’addizione della coda di poliA. Esso contiene anche sequenze accessorie non tanto
chiare, come una sequenza a valle della poliA nei mammiferi e una sequenza ricca in U a monte. Per questo
possono originarsi lunghi trascritti con regioni che isolano un blocco di un gene da un altro per evitare
interferenza tra i geni.
31
Giulia Mostini
frequentemente in ampie scanalature minori. I solchi minori stretti aumentano il potenziale elettrostatico
negativo del DNA, rendendo un sito più specifico e riconoscibile. Di questi segnali ne approfittano i TF,
come la TBP, che interagisce con una specifica spaziatura del solco minore, in corrispondenza della
sequenza TATA.
Per quanto riguarda l’interazione proteina-DNA, sovente il residuo amminoacidico che interagisce con il
solco minore è un’arginina, la cui catena laterale può essere sistemata in un solco minore più stretto e
negativo. Infatti, le arginine ripetute si riscontrano nei motivi dalla breve sequenza amminoacidica che
migliorano la specificità del riconoscimento della forma del DNA.
Il sito preferenziale viene riconosciuto anche se è associato ad altre proteine oppure anche se il DNA è
curvo, invece che lineare, o ha il dominio della cromatina aperto o chiuso.
NFAT è un fattore essenziale nella risposta immune, cioè è un fattore regolabile, che può traslare da
citoplasma a nucleo. Nel linfocita T, il legame con l'antigene scatena eventi a cascata di fosforilazione, fino a
NFAT, che entra nel nucleo, scorre sul DNA, fino a che arriva al promotore di interleuchina 2 e ne determina
l'espressione. NFAT nel nucleo coopera col fattore di trascrizione AP1, costituito da proteine Fos e Jun, per
trascrivere il gene dell’interleuchina 2 (IL-2) e il gene CD25 (IL-2Rα). E' una proteina importante che migliora
la risposta immune perché attiva a sua volta altri linfociti. Il fattore NFAT può diventare inibitore se si
associa ad altri fattori, quali Foxp3 o Mina, reprimendo l'espressione di interleuchina, di IL-4 e del fattore
NFAT2.
32
Giulia Mostini
Le biotecnologie hanno consentito di fare swapping, cioè fondere parti di due proteine diverse a livello del
dominio: si crea una proteina artificiale che attiva la trascrizione solo in determinati siti. Dunque, si dà
origine a una regolazione ibrida, dimostrando se una regione proteica ha la funzione di legare il DNA o di
agire come attivatore o repressore.
Modifiche post-trascrizionali
Gli mRNA eucariotici trascritti all’interno del nucleo partono da un RNA precursore che deve poi subire un
processo di maturazione, che consiste in una serie di modificazioni post-trascrizionali, prima di essere
traslocato nel citoplasma, dove sarà utilizzato dall’apparato di traduzione per la sintesi della proteina da
esso codificata.
Nei procarioti ciò è molto semplice, dato che avviene un semplice taglio, mentre negli eucarioti è più
complesso perché i compartimenti in cui avvengono i processi sono fisicamente separati, per cui deve
33
Giulia Mostini
esserci un trasporto, oltre alle modifiche di capping, poliadenilazione, RNA editing e splicing. L'mRNA,
dunque, è ridotto rispetto al gene perché vengono eliminate alcune porzioni non codificanti.
Il processamento del pre-RNA porta un vantaggio perché consente di modulare l'espressione, cioè di
scambiare regioni codificanti, con cui si possono produrre più trascritti dello stesso gene. Quindi
aumentano le informazioni che un gene può portare. Le varie forme di proteine risultanti dai processi di
maturazione alternativi dell’mRNA a partire dallo stesso gene prendono il nome di isoforme.
In E. Coli, per il taglio degli rRNA, agiscono due RNasi sul precursore 30 S: la III taglia il confine tra 16S e 23S,
mentre RNasi E taglia il confine tra 16S e 5S, rimuovendo quest’ultima. Questa struttura ha sequenze
complementari oltre questo confine, tranne una G che rimane fuori, che possono appaiarsi. Quindi l'rRNA
23S viene poi rilasciato dopo l'azione degli enzimi esonucleasici.
Capping dell’mRNA
Il capping consiste nell’aggiunta di uno specifico nucleotide modificato (cap) in 5' per proteggere il mRNA
dalla degradazione in questa estremità (Cap-site). Il cap inoltre aumenta l’efficienza di splicing, favorisce il
trasporto dell’mRNA dal nucleo al citoplasma e contribuisce alla traduzione.
Si realizza con una RNA trifosfatasi, che stacca un gruppo fosfato in 5' al legame γ, lasciando solo 2 gruppi
fosfato. Un altro enzima, la guanilil-transferasi, aggiunge GMP a partire da GTP, formando un legame
trifosfato 5’-5’. A questo punto, avviene un'altra modificazione perché viene aggiunto un gruppo metile
sulla guanina in posizione 7. Il trasferimento è catalizzato dalla metil-transferasi, utilizzando come substrato
S-adenosilmetionina (SAM).
34
Giulia Mostini
Poliadenilazione
Quando l’RNA polimerasi II arriva al segnale di poliadenilazione, posto al
termine di un gene, viene attivata la terminazione della trascrizione,
viene tagliato il pre-mRNA e aggiunta una coda di poli A all’estremità 3’
del trascritto. La coda ha la funzione di stabilizzare l’mRNA,
proteggendolo dalla degradazione, aumentandone l’efficienza nella
traduzione, favorendo i processi di splicing e la sua traslocazione dal
nucleo al citoplasma. Questa coda non rimane nuda, ma viene legata da proteine specifiche che si
associano: CPSF (Cleavage and Polyadenylation Specificity Factor) e CstF (Cleavage stimulation Factor),
grazie al loro reclutamento sul CTD di Pol II.
Gli stretch vengono ripetuti più volte, seguiti o preceduti in zone ricche di C e G sul DNA per la ridondanza.
Se viene trovato un mRNA senza capping e coda di poli A viene degradato, scalzando pol II dal DNA, tramite
Xrn2.
L’estremità 3’ dell’mRNA maturo è il risultato del taglio prodotto dai fattori CFI e CFII, reclutati da CPSF,
legato al segnale di poliadenilazione, e CstF, legato alla regione ricca in GU immediatamente a valle del sito.
La coda di A viene quindi aggiunta al sito di taglio dalla poli A polimerasi (PAP). Un multimero di una
specifica proteina (PABPN1) lega poi la sequenza poli A dell’mRNA maturo.
Il segnale di poliadenilazione, che funge anche da segnale per il taglio, consiste più frequentemente nella
sequenza esonucleotidica AAUAAA, eventualmente ripetuta, che precede di 5-30 basi il sito di taglio e inizio
della coda poli A. Questa sequenza si può trovare preceduta e seguita da una sequenza ricca in G e U a valle
del sito di taglio. Da questi segnali multipli si possono produrre trascritti dalle differenti terminazioni.
Splicing
I geni eucarioti hanno molte sequenze non codificanti e
non tradotte, cioè introni, oltre alle sequenze
codificanti, chiamate esoni. Geni di questo tipo sono
chiamati discontinui.
Il meccanismo di splicing, in sostanza, taglia gli introni e
ricuce insieme gli esoni, tramite il complesso dello
spliceosoma. Qualsiasi errore è fatale perché può
togliere informazione genetica in modo casuale oppure
determinare il frameshift, cioè uno slittamento del
modulo di lettura che produce proteine casuali.
Gli introni contengono sequenze per regolare la
trascrizione, aumentano la variabilità dei trascritti
genetici, per esprimere un gran numero di proteine
rispetto al numero dei geni. Inoltre, i moduli funzionali
delle proteine sono spesso contenuti in esoni diversi,
per cui il riarrangiamento degli esoni è un efficace motore dell’evoluzione di nuove proteine.
La stragrande maggioranza degli introni presenti nei pre-mRNA e rimossi dallo spliceosoma iniziano al 5’
con il dinucleotide GU (sito donatore) e terminano al 3’ con il dinucleotide AG (sito accettore). Questi
dinucleotidi possono trovarsi all’interno di motivi più estesi. Negli introni vi sono altri due motivi conservati:
35
Giulia Mostini
Lo spliceosoma
Il processo di splicing richiede l’intervento di un grande complesso macromolecolare, costituito da oltre 200
proteine e 5 RNA, denominato spliceosoma. Tale complesso, la cui composizione può variare, ha dimensioni
simili a quelle del ribosoma. Le 5 molecole di RNA presenti nello spliceosoma sono piccoli RNA nucleari
ricchi di uridina denominati U1, U2, U4, U5, U6, che nella cellula si trovano sottoforma di complessi
ribonucleoproteici, denominati snRNP. Tutte le snRNP condividono sette proteine (Sm) che legano il motivo
5’-AAUUUGUGG-3’, ricorrente in tutti gli snRNA e altre specifiche proteine diverse per ogni snRNP.
L’attività di splicing segue una serie di eventi che iniziano con il legame della snRNP U1 al sito di splicing al
5’ attraverso un appaiamento complementare tra l’estremità 5’ dell’snRNA U1 e il sito di splicing al 5’.
Quindi la proteina BBP si lega al sito di ramificazione e le due subunità del fattore U2AF si legano
rispettivamente al tratto polipirimidinico e al sito di splicing al 3’. Si forma in questo modo il complesso E
(Early) che consente il riconoscimento dell’introne da rimuovere. A questo punto, si associa snRNP U2,
scalzando la proteina BBP per mezzo dell’energia fornita dall’ATP. L’snRNA U2 stabilisce un’interazione
complementare con la regione del sito di ramificazione. Si passa allo stato A del complesso dello
spliceosoma. La adenina del sito di ramificazione rimane esposta per la prima reazione di trans-
esterificazione nello stato pre-spliceosoma.
Al complesso A si aggiungono le tri-snRNP (U4/U6 e U5) che, legando snRNP U1 e U2, inducono
l’avvicinamento tra il sito di splicing al 5’ e il sito di ramificazione e il sito di splicing al 3’ a valle. Si passa,
così allo stadio B del complesso. Viene, a questo punto, rilasciata la snRNP U1, sostituita dalla snRNP U6
nell’interazione complementare con il sito di splicing al 5’. Lo scambio tra U1 e U6 richiede la proteina Prp8,
localizzata nella snRNP U5 e che consuma ATP. Viene poi rilasciata anche la snRNP U4, permettendo
l’interazione tra snRNP U2 e U6, dovuta alla complementarietà tra i rispettivi snRNA.
Lo spliceosoma ora catalizza la prima reazione di trans-esterificazione, nella quale viene idrolizzata una
molecola di ATP, formando il complesso C dello spliceosoma, nel quale l’introne forma l’intermedio lariat,
che viene poi staccato dall’esone a valle nella seconda reazione di trans-esterificazione, idrolizzando una
seconda molecola di ATP.
Gli introni rimossi verranno linearizzati e degradati mentre l’mRNA maturo viene rilasciato dallo
spliceosoma che si dissocia nelle snRNP componenti pronte per essere riutilizzate.
Splicing alternativo
Lo splicing alternativo è il meccanismo attraverso cui uno stesso pre-mRNA può subire eventi di splicing
differenti che portano alla creazioni di diversi mRNA alternativi, che a loro volta possono codificare
differenti proteine. Uno stesso gene, quindi, può generare mRNA che presentano differenze sia nelle
regioni 5’ e 3’ non tradotte che nella regione codificante.
Questo processo fu scoperto da David Baltimore e collaboratori sull’immunoglobulina. I possibili eventi che
avvengono sono esoni facoltativi, esoni esclusivi, ritenzione di introni e siti di splicing alternativi.
Una variante trascrizionale di un determinato gene è, quindi, costituita da uno specifico assortimento di
esoni e introni, prodotta dalla combinazione di uno o più degli eventi precedenti.
36
Giulia Mostini
Un esone presente in tutte le varianti trascrizionali è detto costitutivo, al contrario di un esone facoltativo
che viene o meno incorporato nella variante di splicing in funzione di specifici segnali di regolazione.
Il gene umano TRP53, per esempio, codifica 12 diverse proteine p53.
La specificità del riconoscimento dei siti di splicing dipende da sequenze attivatori (enhancer) o repressori
(silencer) del processo di splicing presenti negli esoni o negli introni: ESE, ESS, ISE, ISS. I primi sono
riconosciuti da proteine SR che facilitano l’assemblaggio dello spliceosoma e sono caratterizzate da uno o
più domini in grado di legare l’RNA e una regione (SR) ricca di serine e arginine. ESS sono legati da
repressori dello splicing hnRNP, contenenti domini RRM, anch’essi in grado di legare l’RNA. Le proteine
hnRNP presenti sulle sequenze ESS sopprimono mascherando i siti di splicing o impedendo le interazioni tra
le componenti dello spliceosoma.
Mutazioni che alterno lo splicing causano malattie: la fibrosi cistica è una malattia genetica autosomica
recessiva, causata da mutazioni del gene CF che codifica per il canale del cloro CFTR. Mutazioni che
determinano splicing aberranti tra gli esoni 3-13 portano a forme difettive della proteina e conseguente
malattia.
RNA catalitico
Ci sono splicing che avvengono senza bisogno di proteine e sono definiti autosplicing o self-splicing. Questo
avviene per la presenza di introni autocatalitici di classe I o II. I primi richiedono una G come sito di
ramificazione, mentre i secondi una A nel sito di ramificazione.
L’esperimento che portò alla luce ciò è stato condotto nel 1982 da Thomas Cech, che scoprì che un introne
dell’rRNA del protozoo ciliato Tetrahymena thermophila era capace di effettuare autosplicing senza fattori
proteici. Egli condusse un esperimento in vitro clonando, in un vettore plasmidico, una porzione del gene
per l’RNA della subunità grande del ribosoma contenente un introne. Ne effettuarono la trascrizione con
una RNA polimerasi batterica purificata e inaspettatamente osservarono che il trascritto prodotto poteva
effettuare autosplicing in presenza di ioni magnesio e sodio. Grazie a ciò, quindi, si scoprì che l’RNA
possedeva anche proprietà catalitiche, svolgendo la funzione di enzima (ribozima).
Gli introni di tipo I si trovano in una grande varietà di organismi procariotici ed eucariotici, in geni nucleari,
mitocondriali e plastidici. Sono più corti di quelli del secondo tipo (200-500 nt) e assumono una struttura
secondaria tipica, dovuta alla presenza di regioni complementari numerate da P1 a P10 che si appaiano tra
loro. La struttura tridimensionale che ne risulta avvicina i siti critici per lo splicing al 5’ e al 3’. Nel
meccanismo di autosplicing di tipo I, per la prima reazione di trans-esterificazione è sufficiente una
qualunque guanosina libera (exoG – GMP, GDP o GTP), il cui 3’-OH attacchi il fosfato al 5’ dell’introne.
Quindi avviene la seconda reazione tra il 3’-OH dell’esone al 5’ e il fosfato della guanosina (ωG)
all’estremità 3’ dell’introne che produce la fusione degli esoni e il rilascio dell’introne.
Gli introni di tipo II sono lunghi RNA (400-1000 nt) catalitici che si trovano nei genomi batterici e negli
organelli di diversi eucarioti inferiori. Sono particolarmente diffusi all’interno dei genomi mitocondriali delle
37
Giulia Mostini
piante, dove intervallano numerosi trascritti critici. La loro escissione è essenziale per la biogenesi dei
mitocondri e le funzioni respiratorie ed è facilitata in vivo da vari cofattori proteici.
Gli introni di tipo II possono essere considerati come elementi genetici mobili, costituiti dalla sequenza di
self-splicing e dalla proteina maturasi, codificata dall’introne stesso che agisce da cofattore, facilitando la
reazione auto catalitica di splicing. Tuttavia, gli introni di organelli vegetali si sono considerevolmente
discostati dai loro elementi trasponibili antenati batterici, in quanto mancano di molte regioni necessarie
per l’escissione e l’integrazione e hanno anche perso sequenze codificanti di molti enzimi necessari alla
trasposizione. Infatti, solo una singola maturasi è stata trattenuta negli introni del genoma mitocondriale di
varie angiosperme: il gene MatR, codificato nel quarto introne della subunità 1 del gene NADH
deidrogenasi. E’ interessante notare che, oltre al gene MatR, i genomi nucleari delle angiosperme ospitano
anche quattro geni (nMat 1-4), che sono strettamente correlati a MatR e contengono segnali di
localizzazione mitocondriale N-terminali. Recentemente, è stato riconosciuto che queste maturasi
codificate dal genoma nucleare contribuiscono allo splicing degli introni mitocondriali. Inoltre, studi
genetici hanno portato all’identificazione di altri geni che codificano varie proteine necessarie per lo
splicing e l’elaborazione di introni mitocondriali nelle piante.
L’introne del gruppo II rilasciato può essere inserito attraverso un meccanismo di splicing inverso, cioè la
parte che viene tolta può essere reintrodotta, come un retrotrasposone, in direzione opposta. Ciò
determina la mobilità di questi introni, che richiedono una trascrittasi inversa codificata.
Ribozimi
I ribozimi sono enzimi fatti a RNA, contenuti in particolare in funghi e batteri. Questi tagliano altre molecole
di RNA, ma non si sa l'esatto scopo. Per esempio, i ribozimi di tipo twister sono 3.000 oggi conosciuti.
La maggior parte dei ribozimi catalizzano reazioni di taglio di un filamento di RNA, la sua inversione e
rilegatura dell’RNA. In base alla loro attività, i ribozimi possono essere divisi in ribozimi di splicing e di taglio,
a sua volta suddivisi in trans-cleaving ribonuclease P e piccoli self-cleaving ribozymes.
RNA editing
Si tratta di un'alterazione post-trascrizionale di una sequenza codificante. Il trascritto quindi può essere
modificato con cambiamento delle basi. Può anche alterare lo splicing o regolare la stabilità delle proteine,
se avviene in regioni non tradotte.
Esistono due meccanismi: conversione di una base in un'altra; inserzione o delezione di nucleotidi.
38
Giulia Mostini
39
Giulia Mostini
E’ possibile affermare che multiple vie di regolazione convergono su un gene. Ad esempio, guardando la
telomerasi, ci si rende conto di come i livelli di trascrizione di un singolo gene possano essere mutevoli.
In Drosophila, l’espressione della proteina eve (repressore trascrizionale omeotico contenente HTH)
nell’area corrispondente al segmento 2 dell’embrione dipende dalla concentrazione dei fattori che legano
gli elementi di controllo dell’espressione del gene even skipped (eve).
La trascrizione del gene Sex-lethal (Sxl) nel moscerino della frutta dipende dal promotore precoce (Pe) e
avviene solo nelle femmine, per effetto del doppio dosaggio degli attivatori SisA e SisB presenti sul
cromosoma X nelle femmine rispetto ai maschi, dove prevale il repressore Dpn.
Le proteine eucariotiche che regolano la trascrizione, si assemblano in complessi sul DNA. Spesso, alcuni
fattori risultano degli attivatori, quando sono presenti in un tipo di complesso, e repressori se sono
associati ad altri complessi. Va ricordato l’esempio di NFAT sui promotori delle interleuchine.
La biologia dei sistemi è lo studio dei sistemi biologici, il cui comportamento non può essere ridotto alla
somma lineare delle funzioni delle loro parti. Mediante metodi di modellazione quantitativa presi in
prestito dalla fisica, la biologia dei sistemi offre descrizioni valide dei circuiti regolativi dell’espressione
genica, come nel caso dell’auto-repressione o auto-attivazione di promotori. Un promotore forte, il cui
prodotto funge da repressore dello stesso, mostra una superiore velocità di risposta.
40
Giulia Mostini
sequenza di 17 nt e che fanno parte della regione UAS (Upstream activating sequence), situata a circa -270
bp a monte del sito di inizio della trascrizione del gene GAL1. In presenza di Gal4 (quando vi è galattosio), la
trascrizione di tale gene aumenta di 1.000 volte.
Pol II viene reclutata sul DNA dagli attivatori. L’associazione diretta del mediatore al promotore, mediante
la fusione artificiale a un dominio proteico in grado di legare il DNA in prossimità del TSS, infatti, induce la
trascrizione.
Si possono distinguere 3 classi di complessi regolatori che includono Pol II:
1. Fattori di trascrizione generali: TFIIA, B, D, E, F, H con il complesso del mediatore,
2. Altri cofattori: CRSP, TRAP, ARC/DRIP.
3. Complessi del rimodellamento della cromatina: SWI, SNF, PBAF, ACF, NURF e RSF.
I complessi TFIID basati su TAFs differenti (come TAF105 specifico per le ovaie o TRF specifico per i geni
della replicazione) consentono la formazione di complessi di inizio della polimerasi di RNA specializzati che
dirigono la trascrizione di programmi di espressione specifici per tessuto o gene.
Alcuni TF regolano la trascrizione di un gene non solo agendo direttamente sul reclutamento della RNA
polimerasi sul promotore, ma associando sul DNA fattori in grado di regolare il grado di compattezza dei
nucleosomi (lo stato della cromatina), mediante modificazioni specifiche degli istoni, nel caso di enzimi
specifici, o mediante alterazioni dei nucleosomi, nel caso del complesso di rimodellamento della cromatina.
Alcuni gruppi, come acetili o metili, aggiunti su residui amminoacidici specifici delle code esposte degli
istoni, sono legati da GTF basali, come TFIID, che possiede una subunità caratterizzata dal bromodominio,
lungo circa 110 aa, in grado di riconoscere le lisine acetilate sugli istoni. Nell’uomo, ci sono 46 proteine
contenenti bromodomini e sono coattivatori e mediatori trascrizionali, rimodellatori della cromatina, elicasi
e modificatori di istoni.
Alcuni geni contengono sequenze (pause bottom motif) che arrestano la fase di allungamento della
trascrizione a valle di TSS e quindi, dopo che Pol II è stata reclutata e ha iniziato la sintesi di mRNA. Alcuni
attivatori promuovono l’allungamento, favorendo la rimozione del blocco, ad esempio mediante il
reclutamento di una specifica chinasi (P-TEFb), che fa parte del complesso SEC (super elongation complex)
e che scalza il fattore di pausa NELF da Pol II, consentendo di proseguire la trascrizione.
Esistono interazioni cooperative tra attivatori tramite cooperazione diretta, cooperazione indotta dallo
svolgimento del nucleosoma, cooperazione mediata da un modificatore della cromatina e cooperazione
mediata da un terzo fattore.
I repressori, invece, funzionano per competizione, inibizione, repressione diretta o indiretta. Alcuni di
questi, come HDAC, agiscono rimuovendo dagli istoni le modificazioni che favoriscono la trascrizione.
Importante è sapere che geni diversi si esprimono in maniera differente perché sono controllati da un
insieme di attivatori e repressori, che possono essere sia condivisi sia specifici dei vari promotori (mating
type di S. Cerevisiae).
Promotori ed enhancer
Gli elementi che si chiamano enhancer sono regioni di DNA
lunghe 50-1.500 bp, che possono essere legate da attivatori
della trascrizione di un particolare gene. Sono elementi cis-
acting, localizzati fino a 1.000.000 bp di distanza dal gene, a
monte o a valle del sito di inizio della trascrizione,
eventualmente in introni. Nel genoma umano ne sono stati
identificati decine di migliaia. Gli enhancer possono anche
funzionare in entrambi gli orientamenti, rispetto alla
direzione della trascrizione.
I diversi elementi regolativi sul DNA lavorano
indipendentemente l’uno dall’altro nell’orchestrare
l’espressione di un gene in cis. Ad esempio, l’espressione del
gene eve nei vari segmenti nell’embrione Drosophila,
41
Giulia Mostini
dipendente da 5 enhancers distinti. Gli enhancer funzionano in modo autonomo e sono regolati da
espressione a corto raggio. I repressori specifici legati a un silencer (sequenze di DNA distali che reclutano
repressori per l’inibizione), infatti, non interferiscono con le attività degli enhancer vicini.
Gli enhancer, inoltre, sono regolati da altri elementi, come gli isolatori. Gli insulators sono regioni del DNA
che bloccano a distanza l’effetto attivatore degli enhancer sulla trascrizione. La distribuzione particolare di
insulators ed enhancer sul cromosoma consente di restringere il campo di azione di questi ultimi a pochi
geni mirati.
42
Giulia Mostini
43
Giulia Mostini
Epigenetica
Sostanzialmente è una visione diversa rispetto al controllo delle funzioni del genoma che siamo abituati ad
associare alla genetica. Essa si occupa delle modifiche reversibili del genoma che inducono effetti funzionali
duraturi. Per esempio la metilazione che abbiamo appena visto è un caso di epigenetica.
L’epigenoma è l’insieme dei fenomeni che regolano le modifiche del DNA.
MicroRNA
I microRNA sono corti (18-24 nt), non codificanti, con funzioni regolative dell’espressione genica, regolando
negativamente i loro bersagli di mRNA. Essi sono stati scoperti poco più di vent’anni fa in Caenorabditis e
oggi nell’uomo ne sono stati identificati più di mille, espressi in modo specifico nelle varie cellule.
Sono prodotti da precursori lunghi (pri-miRNA) che poi vengono tagliati opportunamente. Si possono
appaiare a sequenze specifiche e stabili per facilitarne la degradazione. Essi sono processati dai complessi
DROSHA nel nucleo e DICER nel citoplasma, per poi essere assemblati nel complesso RISC e regolare la
stabilità di vari mRNA bersaglio.
I livelli di mRNA prodotti da un gene possono essere modulati nel tempo, in base al tipo di interazione tra
fattore di trascrizione, promotore del gene e microRNA coinvolto. Sostanzialmente, esiste un livello di
espressione dei microRNA, come se fosse una rete parallela che tampona i livelli di trascritto messaggero
normali che abbiamo visto precedentemente. Questa regolazione avviene nel mirnoma che si sovrappone
al trascrittoma, che è a sua volta soggetto a regolazione ed è un elemento molto importante.
I microRNA sono utilizzati, inoltre, per predire stati di malattia.
44
Giulia Mostini
45
Giulia Mostini
3. Terminazione: una volta aggiunti tutti gli amminoacidi specificati dalla sequenza di codoni del
mRNA, al termine di questo appare uno dei tre codoni di stop (UAA, UGA, UAG) che sono
riconosciuti da proteine, chiamate fattori di terminazione, che determinano il rilascio del complesso
proteina-tRNA. Il tRNA si dissocia dalla catena proteica, la quale va incontro eventualmente a
successivi processi di rinaturazione controllata e modificazione post-traduzionale. Quindi, l’mRNA si
distacca dal ribosoma, che si disassembla nelle sue due subunità ribosomiali, disponibili a
ricominciare il ciclo su un’altra molecola di mRNA.
Il codice genetico
Il 27 maggio 1961, alle tre di notte, Heinrich Matthaei, in visita al laboratorio NIH di Marshall Nirenber,
aggiunse un RNA sintetico, composto di solo uracile, in 20 provette contenenti, oltre a lisato batterico in
grado di tradurre in vitro, i 20 diversi amminoacidi. Si formarono così polipeptidi.
Negli esperimenti successivi, aggiungendo altri RNA dalla composizione variabile, Nirenber scoprì il
linguaggio che il DNA usa per determinare il codice genetico.
George Gamow, per primo, agli inizi degli anni ’50, ipotizzò che tre basi dovevano essere impiegate per
codificare i 20 amminoacidi usati dalle cellule per fabbricare le proteine. Con sole 4 basi diverse, un codice
basato su parole di due lettere (nucleotidi) consentirebbe di specificare al massimo 16 amminoacidi (42
permutazioni con ripetizioni). Un codice con tre nucleotidi sarebbe, invece, più che sufficiente, arrivando a
poter identificare fino a 64 monomeri diversi. Infatti, il codice genetico è costituito da 64 codoni.
Il codice genetico è nato dalle interazioni amminoacido – tripletta specifiche che garantiscono una
preferenza tripletta – amminoacido. La selezione naturale, inoltre, ha portato alle assegnazioni del codone
del codice genetico tali da minimizzare gli effetti delle mutazioni. Eventualmente, il codice tripletta sarebbe
derivato da altri codici più lunghi, che avrebbero consentito una traduzione più accurata nelle prime forme
cellulari ancora prive di sistemi, come il ribosoma. Il codice genetico standard moderno sarebbe, quindi, il
risultato dell’evoluzione di un codice precedente più semplice, grazie ad un processo di espansione
biosintetica. Inoltre, i modelli mutuati dalla teoria dell’informazione, secondo l’ipotesi rate-distortion,
suggeriscono che il codice genetico sia il prodotto dell’interazione di tre forze evolutive in conflitto: i
bisogni di molti amminoacidi, tolleranza a errori e minimo dispendio di energia.
In sostanza, il codice genetico è letto di tre basi in tre basi non sovrapponibili. La sequenza delle triplette
segue un ordine o modulo di lettura o frame che consegue dalla posizione del codone di inizio. Cambiare il
frame, porta al cambiamento anche della sequenza amminoacidica.
Nella maggior parte dei casi, più codoni corrispondono allo stesso amminoacido; in altre parole, il codice
genetico è ridondante ovvero “dice la stessa cosa con parole diverse”. Questo fenomeno prende anche il
nome di degenerazione del codice genetico. I codoni che codificano per lo stesso amminoacido possono
differire in una delle loro tre posizioni. Ad esempio, la serina è specificata da codoni che hanno lettere
differenti in ciascuna delle tre posizioni della tripletta: UCA, UCG, UCC, UCU, AGU o AGC. Un codone che
codifica lo stesso amminoacido, qualunque sia la base in terza posizione viene detto degenere.
I tre codoni di stop, UAG, UAA, UGA, invece, determinano la fine della sintesi della proteina sono detti
anche codoni non sense. Il codone UAG è anche chiamato amber in onore dello scopritore Bernstein
(significa ambra). I codoni di stop sono riconosciuti da tRNA senza amminoacidi e questo determina il
distacco del polipeptide nascente dal ribosoma, mediato dal fattore di rilascio.
RNA ribosomiale
Il ribosoma è composto da proteine e RNA.
Gli rRNA sono i primi RNA a essere stati purificati e analizzati in virtù della loro abbondanza (80% dell’RNA
totale della cellula). Le loro sequenze nucleotidiche, e le loro strutture secondarie, sono molto conservate
fra le diverse specie. Il fatto che la struttura secondaria degli rRNA sia molto conservata, più di quanto non
lo sia la sequenza nucleotidica, indica che è la struttura secondaria ad essere funzionalmente rilevante e
quindi sotto pressione selettiva.
Una mutazione della sequenza che eliminasse un appaiamento di basi, e quindi un sito di appaiamento di
un loop, può ristabilirsi o con una retromutazione, ma anche mutando il nucleotide sull’altro filamento, in
modo da ripristinare la complementarietà delle basi. In questo modo, le sequenze nucleotidiche cambiano
progressivamente, mantenendo invariata la struttura secondaria.
Gli rRNA, come i tRNA e gli altri RNA, contengono nucleotidi modificati (uridina – pseudouridina e la
metilazione della posizione C2 del ribosio) prodotti da sistemi enzimatici post-traduzionali. Queste
modificazioni si trovano in regioni evolutivamente conservate e critiche per la funzione.
Per DNA ribosomiale (rDNA), invece, si intendono le sequenze di DNA codificanti per l’RNA ribosomiale.
L’rDNA degli eucarioti consiste in ripetizioni in tandem di un segmento unitario, composto dalle regioni
NTS, ETS, 18S, ITS1, 5.8S, ITS2 e 28S.
Fa parte dell’rDNA anche un altro gene, che codifica per l’rRNA 5S. Nel nucleo, le regioni di rDNA presenti
sui diversi cromosomi si strutturano a formare il nucleolo. Nel genoma umano ci sono circa 5 cromosomi
con regioni rDNA che formano il nucleolo: i cromosomi 13 (RNR1), 14 (RNR2), 15 (RNR3), 21 (RNR4) e 22
(RNR5).
La descrizione ad alta risoluzione delle diverse strutture tridimensionali del ribosoma sta svelando tutta
l’importanza dell’rRNA. Più che semplici componenti strutturali, questi sono direttamente coinvolti nei
processi chiave del ribosoma. La maggior parte delle proteine ribosomiali si trova ai margini del ribosoma,
mentre al suo interno predomina la componente RNA. Nel caso delle proteine che parzialmente
compongono il core ribosomiale la loro funzione sembra essere quella di stabilizzare l’alta densità di rRNA,
schermandone la carica negativa tramite il backbone di fosfati.
Alcuni geni e proteine, in particolare l’rRNA, possono servire come orologio evolutivo o come misura dei
cambiamenti avvenuti durante l’evoluzione. I metodi per ottenere sequenze dell’rRNA e costruire alberi
filogenetici sono ora di routine e questo grazie all’analisi combinata di biologia molecolare e calcolo
computerizzato. Il processo inizia con l’uso della reazione di PCR su campioni di DNA del microrganismo in
coltura pura per amplificare i geni del DNA genomico che codificano per l’rRNA 16S. Successivamente, i
47
Giulia Mostini
prodotti della PCR vengono sequenziati. Diversi algoritmi di analisi bioinformatica comparativa dell’rRNA
sono poi impiegati per determinare le divergenze evolutive e gli alberi filogenetici.
I vantaggi del tracciamento filogenetico tramite rRNA sono vari: i geni dell’rRNA sono presenti in tutti gli
organismi e in tutte le cellule; svolgono la stessa funzione in tutte le specie; sono abbastanza conservati e
facili da allineare; contengono regioni altamente variabili meno soggette a cambiamenti, così da consentire
comparazioni per scale temporali diverse; il transfer orizzontale dei geni dell’rRNA è infrequente; ne esiste
un vasto database di quelle già sequenziate.
Ribosoma e nucleolo
Il ribosoma eucariotico maturo 80S è composto da una subunità 40S, contenente RNA ribosomiale 18S e 33
proteine ribosomiali, e una subunità 60S, contenente rRNA 5S, 5,8S e 28S e 47 diverse proteine ribosomiali.
La maggior parte del processo di formazione del ribosoma avviene nel nucleolo, dove la Pol I trascrive gli
rRNA precursori 47S dai geni del DNA ribosomiale. Il pre-rRNA 47S viene assemblato nel pre-ribosoma di
90S con il 5S rRNA, che viene trascritto da Pol III nel nucleoplasma, e varie proteine i cui mRNA sono
trascritti da Pol II nel nucleo ed esportati nel citoplasma per la traduzione in proteine, che vengono
successivamente importare di nuovo nel nucleolo.
Durante la maturazione del pre-ribosoma 90 S in subunità ribosomiali pre-40S e pre-60S, il pre-rRNA viene
modificato ed elaborato attraverso meccanismi che coinvolgono circa 200 piccoli snoRNA (nucleolari), che
sono principalmente trascritti da Pol II da introni di altri geni nel nucleoplasma.
La produzione dei ribosomi è vitale e le cellule eucariotiche hanno sviluppato un compartimento
specializzato, il nucleolo, dove vengono trascritti i geni dell’rRNA, viene elaborato l’RNA pre-ribosomiale e
vengono assemblati i pre-ribosomi.
L’rRNA è presente nei siti attivi del ribosoma, come il sito P. Inoltre, le anse degli anticodoni dei tRNA
carichi e i codoni dell’mRNA entrano in contatto con l’rRNA 16S e non con le proteine ribosomiali.
Le cellule dei mammiferi contengono tipicamente alcuni nucleoli che scompaiono durante la mitosi per
riformarsi de novo nella fase G1 intorno ai geni ribosomiali (rDNA). Nell’uomo, lunghi tratti di DNA situati su
cinque distinti cromosomi si uniscono per formare da uno a tre nucleoli. I geni dell’rDNA associati dal
legame della proteina UBF sono sufficienti per dirigere la formazione di un nucleolo e costituiscono le NOR
(regioni di organizzazione del nucleolo). Si pensa che RNA non codificanti attecchiti nelle regioni di
sequenze ripetute Alu possano spingere i geni dell’rDNA a raggrupparsi in pochi nucleoli per nucleo.
Si ipotizza che il macchinario di sintesi proteica alle origini fosse costituito interamente da RNA e che le
proteine ribosomiali siano state aggiunte con l’evoluzione per aumentare l’attività di questo primitivo
ribosoma a RNA.
Sono stati effettuati degli studi di microscopia crioelettronica (Cryo-EM) per confrontare le strutture dei
codoni di stop, riuscendo a dimostrare come il fattore di terminazione eRF1 rimodelli il mRNA in modo da
leggerne il codone.
48
Giulia Mostini
tRNA
Francis Crick assunse che gli amminoacidi non possono legarsi specificamente agli acidi nucleici e che, se un
singolo amminoacido fosse direttamente codificato da una tripletta di nucleotidi, vi sarebbe una
significativa discrepanza di dimensioni tra il templato di mRNA e la nascente catena polipeptidica. Crick
ipotizzò, quindi, che il meccanismo di sintesi proteica avrebbe dovuto comprendere molecole in grado di
adattare il codone a un’estremità e l’amminoacido all’altra
estremità.
Hoagland e colleghi proprio in quel periodo (1957)
dimostrarono che le cellule contengono grandi quantità di RNA
solubile, di peso molecolare basso, legato ad amminoacidi, in
maniera ATP dipendente, che possano essere eventualmente
rilasciati nella frazione proteica.
I tRNA sono le molecole presenti in tutte le specie, che
funzionano da adattatori specifici per gli amminoacidi nella
biosintesi delle proteine. Le loro dimensioni sono quasi
uniformi, circa 80 nt, di cui una vasta gamma di modificati (il
10% con 43 nucleosidi rari diversi) per deamminazione,
sostituzione tiolica, n-alchilazione dell’anello e saturazione dei
doppi legami C5-C6 della pirimidina.
49
Giulia Mostini
I tRNA adottano strutture terziarie a forma di L funzionali per le funzioni di riconoscimento degli
amminoacidi e del riconoscimento dei codoni. In questo ruolo bifunzionale i tRNA interagiscono con due
sistemi principali: la aminoacil-tRNA sintetasi (o ligasi) e i siti di sintesi proteica dei ribosomi. I tRNA
composti da nucleosidi interamente non modificati, ottenuti con trascrizioni in vitro, funzionano come
substrati per le sintesi dell’aminoacil-tRNA. Ciò suggerisce che le caratteristiche strutturali del tRNA
riconosciuto dall’enzima non dipendono in modo critico dalla presenza dei nucleosidi modificati.
I tRNA sono costituiti da differenti porzioni:
• Braccio accettore: è formato dall’appaiamento delle due
estremità della molecola, con la protrusione al 3’ di due C e una A
a cui si lega l’amminoacido. La tripletta al 3’ CCA è tipica di tutti i
tRNA e nei procarioti è codificata dal gene stesso dei tRNA,
mentre negli eucarioti viene aggiunta dall’enzima tRNA
nucelotidil-transferasi.
• Braccio TΨC: include una T e una pseudouridina Ψ nell’ansa a
singolo filamento.
• Braccio D: contiene una diidrouridina.
• Braccio dell’anticodone: comprende la tripletta di nucleotidi
(fiancheggiata al 3’ da una purina e al 5’ da U), che riconosce il
codone sull’mRNA.
• Braccio variabile: dalle 3 alle 21 basi, a seconda dei diversi tRNA.
Si trova tra il braccio TΨC e il braccio dell’anticodone.
Il tRNA ha tre modelli di struttura: primaria, secondaria e terziaria (space fill).
Amminoacil-tRNA sintetasi
Le molecole di tRNA legate ad un amminoacido (tRNAaa) sono dette cariche. Il
caricamento dei tRNA comporta la formazione di un legame acilico tra il gruppo
carbossilico dell’amminoacido e il gruppo OH al 3’ dell’adenosina che protrude
dallo stelo accettore del tRNA. La formazione di questo legame viene catalizzata
dall’enzima amminoacil-tRNA sintetasi, utilizzando l’energia derivata dall’idrolisi di
una molecola di ATP. Il legame tra tRNA e l’amminoacido conserva un’elevata
energia libera, che verrà poi impiegata nella formazione del legame peptidico
durante la traduzione del ribosoma.
Il caricamento degli amminoacidi sui corrispondenti tRNA viene catalizzato dalle
amminoacil-tRNA sintetasi. A questi enzimi compete di fatto il ruolo di adattatori
dei vari tRNA con lo specifico amminoacido, secondo il codice genetico.
Nella cellula ci sono 20 differenti tipi di amminoacil-tRNA
sintetasi, una per ciascun tipo di amminoacido. Ciascun
amminoacil-tRNA sintetasi riconosce un solo amminoacido
e tutti i tRNA sui quali questo può essere caricato, cioè i
cosiddetti tRNA isoaccettori.
Le 20 amminoacil-tRNA sintetasi differiscono ampiamente
per dimensioni e stato oligomerico e hanno bassa omologia
di sequenza. Vengono divise in due classi:
1. Classe I: contengono un dominio catalitico
caratteristico e sono prevalentemente
monomeriche. Nella reazione della classe I, il
gruppo amminoacilico è accoppiato al 2’-idrossile
del tRNA.
2. Classe II: condividono una tipica piega β-shet
affiancata da α-eliche e sono per lo più dimeriche o
multimeriche. Nelle reazioni di accoppiamento
50
Giulia Mostini
Riconoscimento codone-anticodone
L’orientamento della trascrizione produce mRNA diversi. Durante il processo di replicazione del DNA, si
possono verificare degli errori di polimerizzazione del secondo filamento. Questi errori (mutazioni),
possono avere un impatto sul fenotipo degli organismi, specialmente se esse si verificano all’interno della
sequenza del gene codificante di una proteina. I tassi di errore sono comunque molto bassi (1 errore ogni
10-100 milioni di basi), grazie alla capacità di correzione della DNA polimerasi. Il DNA mutato produce un
trascritto anch’esso mutato, con varie conseguenze che caratterizzano il tipo di mutazione: missenso, se
viene sostituito l’amminoacido codificato, o non senso, se si forma un codone di stop. Entrambe sono a
carico di singoli nucleotidi (mutazioni puntiformi) e possono condurre a importanti patologie ereditarie,
come la talassemia.
51
Giulia Mostini
anticodone così da riconoscere il codone di arresto UAG invece che il codone CAG normale, evitando un
arresto prematuro della sintesi proteica. I tRNA soppressori per mutazioni missenso sono, invece,
misacilati, cioè legati ad un amminoacido diverso da quello di riferimento dello specifico anticodone.
Mentre la soppressione missenso e non senso si verifica principalmente attraverso le sostituzioni di singoli
nucleotidi nell’anticodone, i tRNA che sopprimono i frameshift +1 contengono una base aggiuntiva
nell’anticodone. Questi soppressori leggono un codone a quattro nucleotidi, ripristinando la corretta
traslazione. Un altro tipo di tRNA soppressore è rappresentato da su9 di E. Coli, cioè una variante di tRNAtrp,
che conserva il suo anticodone CCA di tipo selvaggio, ma ha una variazione da G ad A nel suo braccio D.
Questa sostituzione porta a un tRNA con una maggiore flessibilità, che riconosce il suo codone UGG e,
attraverso un’insolita coppia AC nella terza posizione di anticodone, il codone di arresto UGA.
Diversi meccanismi si combinano per limitare l’inserimento dell’amminoacido mediato dalla soppressione,
che si verifica con una frequenza tra il 5 e il 50%, rispetto all’uso di codoni normali. I tRNA soppressori sono
tipicamente derivati da isoaccettori meno frequenti. Questo garantisce che la traduzione della maggior
parte dei codoni di senso non sia modificata significativamente. Per quanto riguarda i codoni di stop
soppressori, gli mRNA di tipo selvaggio contengono spesso codoni di stop in tandem, quindi anche se uno è
soppresso, l’altro porterà alla terminazione. Inoltre, i tRNA soppressori devono competere con i fattori di
terminazione per legare i codoni.
52
Giulia Mostini
Fattori d’inizio
Diverse proteine, dette fattori d’inizio, sono richieste per l’inizio della traduzione. Nei procarioti ce ne sono
tre: IF1, IF2 e IF3. Questi fattori interagiscono con la subunità minore del ribosoma e sono richiesti per
formare il complesso di inizio 30S. IF1 si lega alla subunità 30 S, contribuendo a formare il sito A del
ribosoma e determina, insieme a IF3, la dissociazione del ribosoma 70S. IF2, invece, è una GTPasi che
interagisce con la subunità 30S, favorendo l’associazione del tRNA di inizio (fMet-tRNAi) all’emisito P e
impedendo l’inserzione di altri tRNA carichi. IF3 contribuisce a determinare la specificità di legame della
subunità 30S al sito di inizio sull’mRNA e partecipa, con IF1, alla dissociazione del ribosoma 70S e mantiene
in forma isolata la subunità minore.
Per quanto riguarda l’inizio della traduzione procariotica, IF1 e IF3 spostano l’equilibrio verso la forma
dissociata delle due subunità. IF2 si lega alla subunità 30S in prossimità dell’emisito P, dove promuove
l’ingresso del tRNA di inizio. Quindi, l’mRNA si associa alla subunità 30S coadiuvata da IF3, grazie agli
appaiamenti tra la sequenza Shine-Dalgarno e l’rRNA 16S e tra il codone AUG e l’anticodone del tRNA di
inizio. Infine, i fattori IF1 e IF3 si distaccano e la subunità ribosomiale 50S si associa al complesso d’inizio
30S che rilascia IF2, generando il complesso di inizio 70S.
Negli eucarioti, i fattori proteici richiesti per l’inizio della traduzione eIF sono almeno 9, ma diventano 14 se
si considerano i fattori ausiliari. Essi sono costituiti principalmente da 30 subunità proteiche:
1. eIF1: lega la subunità 40S, controlla l’accuratezza del riconoscimento del codone AUG di inizio e
contribuisce, con eIF3, a impedire l’associazione prematura con la 60S.
2. eIF1A: promuove il legame di Met-tRNAmet alla subunità 40S e contribuisce con eIF3 all’interazione
di questa con l’mRNA.
3. eIF2: interagisce con Met-tRNAmet, formando il complesso ternetio Met-tRNAmet/eIF2/GTP.
4. eIF2B: catalizza lo scambio GTP/GDP per il riciclo di eIF2.
5. eIF3: lega la subunità 40S e ne promuove il legame con Met-tRNAmet e mRNA e impedisce
l’associazione della 60S prima che si formato il complesso di inizio 43S.
6. eIF4E: riconosce e lega il 5’cap.
7. eIF4F/eIF4G: costituisce un’impalcatura per l’assemblaggio di eIF4F, interagendo con eIF4E ed
eIF4A.
8. eIF4A: ha attività RNA elicasica ATP-dipendente.
9. eIF4B: stimola l’elicasi e lega simultaneamente eIF4F.
10. eIF5: Interagisce con il complesso di pre-inizio 43S (40S/Met-tRNAmet/eIF3/eIF2-GTP) e promuove
l’idrolisi del GTP, associato a eIF2.
11. eIF5B: Legato a GTP, recluta il complesso ternario Met-tRNAmet/eIF2/GTP sulla subunità 40S.
12. eIF6: lega la subunità 60S libera e impedisce la sua associazione con la 40S.
Negli eucarioti, la subunità minore del ribosoma interagisce inizialmente con l’estremità 5’CAP dell’mRNA
per procedere ad una scansione lungo la regione del mRNA (tra TSS e AUG) trascritta ma non tradotta
(UTR), fino a trovare il primo AUG, che verrà utilizzato come codone di inizio della traduzione. Negli
eucarioti sono presenti due tRNA per la metionina, uno utilizzato all’inizio (tRNAimet) e un altro (tRNAmet) che
incorpora metionina nella fase di allungamento della catena proteica. In alcuni virus e mRNA eucariotici si
ha un inizio indipendente dal CAP, in cui la subunità minore lega una sequenza IRES interna da cui procede
per scansionare fino al primo AUG.
53
Giulia Mostini
Meccanismi di re-innesco
Il fattore eIF4F, associato alla subunità 40S, rimane connesso al CAP al 5’ mRNA durante la scansione,
formando un’ansa che arriva fino al codone d’inizio. Così, quando la subunità 40S lega la 60S e rilascia eIf4F,
questo è già in sede per legare una nuova subunità 40S.
PABP è una proteina che associa, come multimero, la coda di poli(A) all’estremità 3’ degli mRNA. PABP
interagisce anche con il fattore di inizio eIF4G reclutato all’estremità 5’ dello stesso mRNA. Questa
interazione porta a contatto le due estremità dell’mRNA, che assume una configurazione circolare. In
questo modo i ribosomi che terminano la traduzione e si staccano al 3’ dell’mRNA si ritrovano in prossimità
del 5’ per un nuovo ciclo.
54
Giulia Mostini
Fattori di allungamento
Due fattori proteici (Tu e G), conservati dai procarioti, negli eucarioti sono necessari per il compimento dei
processi di allungamento. L’amminoacil-tRNA viene legato all’estremità 3’ dal fattore EF-Tu (eEF-1 negli
eucarioti), che accompagna l’aatRNA.
EF-Tu previene l’attacco dell’amminoacido legato al tRNA al peptide sul sito P e riconosce un amminoacil-
tRNA solo quando è legato al GTP. Una volta alloggiato sul ribosoma, il contatto con una tasca specifica
della subunità maggiore induce l’attività GTPasica di EF-Tu, che idrolizza il GTP a GDP. Legato a GDP, EF-Tu
si distacca dall’amminoacil-tRNA, che rimane sul sito A con l’amminoacido ora disponibile alla formazione
del legame peptidico. Solo un appaiamento corretto codone-anticodone permette a EF-Tu, legato
all’amminoacil-tRNA, di interagire con il sito di legame del fattore sul ribosoma e di attivare l’idrolisi di GTP
col conseguente distacco del fattore del tRNA. Al contrario, appaiamenti scorretti comportano
l’allontanamento del complesso amminoacil-tRNA EF-Tu del sito A.
L’ingombro di EF-Tu è ragguardevole e maschera completamente l’amminoacido legato al tRNA. La ricina
interferisce col legame tra il ribosoma e EF-Tu in un sito chiamato sarcin-ricin loop.
55
Giulia Mostini
di classe I, detti RF1 e RF2. Il fattore RF1 riconosce il codone di stop UAG, mentre RF2 riconosce
UGA. Il terzo codone di stop, UAA,viene riconosciuto da entrambi. Negli eucarioti è presente solo il
fattore eRF1, che li riconosce tutti e tre.
2. Classe II: stimolano la dissociazione dei fattori di classe I dal ribosoma dopo il rilascio della catena
polipeptidica. Questo fattore è RF3 nei procarioti ed eRF3 negli eucarioti.
Dopo che il polipeptide e RF3 si sono dissociati, il ribosoma è ancora legato all’mRNA e ai due tRNA nei siti P
ed E. Nelle cellule procariotiche interviene un fattore, chiamato fattore di riciclaggio del ribosoma (RRF),
che agisce insieme a EF-G e IF3 per riciclare il ribosoma. RRF si lega al sito A vuoto del ribosoma, grazie alla
sua struttura simile a un tRNA. RRF, inoltre, recluta EF-G-GTP, che stimola il rilascio di tRNA non carichi dai
siti P ed E. Infine, l’associazione del fattore d’inizio IF3 contribuisce a separare le due subunità del
ribosoma, che sono disponibili per un nuovo ciclo di traduzione.
Per quanto riguarda il bilancio energetico, nella fase iniziale si consuma una molecola energetica per
assemblare il ribosoma e due per l’attivazione del tRNA. Nell’allungamento se ne consumano 2 per il
caricamento di ogni tRNA e altre due per l’incorporazione di ogni amminoacido. Nella terminazione, infine,
si consumano due molecole per la dissociazione delle subunità ribosomiali.
56
Giulia Mostini
rinaturata. Questo tipo di chaperone molecolare è noto anche come GroEL nei batteri, Hsp60 nei
mitocondri e TCP1 nel citoplasma delle cellule dei vertebrati.
Proteine non foldate correttamente e che non vengono degradate formano aggregati che disturbano le
funzioni cellulari e causano patologie.
Processo di ubiquitinazione
L’ubiquitina è una piccola proteina (76 residui amminoacidici), espressa in tutte le
cellule eucariotiche, il cui nome deriva dalla distribuzione ubiquitaria. Essa viene
coniugata covalentemente a specifiche proteine cellulari, mediante una reazione ATP
dipendente, che porta alla condensazione del residuo carbossi-terminale
dell’ubiquitina con specifici gruppi amminici di residui di lisina della proteina
bersaglio, formando un legame isopeptidico. Questo meccanismo consiste
nell’effettuare una modifica covalente delle proteine, che vengono legate con un
enzima e modificate con l'aggiunta di ubiquitina per essere etichettate e indirizzate
verso la degradazione nel citosol. Si tratta quindi di una modifica post-traduzionale
con significato negativo.
L’ubiquitina ha una sequenza e un ripiegamento conservati, con la lisina in posizione
48 e l'estremità carbossi-terminale molto accessibile perché è separata dal resto della proteina globulare.
Per realizzare questo processo è necessario avere un meccanismo selettivo per le differenti proteine
cellulari, per cui non vi è un solo enzima che svolge la reazione, dato che se no esso dovrebbe ospitare nel
sito attivo tutte le proteine della cellula e perderebbe la caratteristica
di essere specifico.
E1 è il primo enzima che catalizza la prima reazione e che ospita
l’ubiquitina nel suo sito attivo. E1 ha un gruppo SH legato, cioè un
residuo di cisteina che si lega al gruppo carbossi-terminale
dell'ubiquitina. In questo caso, deve essere sintetizzato un legame con
consumo di ATP. Dopo ciò, l'ubiquitina è legata all’enzima E1.
Il secondo passaggio è il trasferimento dell'ubiquitina dal sito attivo di
E1 al sito attivo di E2, in modo da generare un’amplificazione della
diversità di E2 che la cellula si trova a disposizione. Non viene
consumata energia perché il legame formato è sempre lo stesso di
prima, cioè un legame tioestere (come per acetil CoA).
L'enzima E3 riconosce la proteina da degradare, quindi è in grado di
ospitarla nel suo sito attivo, oltre ad entrare a contatto con E2 che
porta l’ubiquitina, la quale viene trasferita su un residuo di lisina della
proteina da eliminare, che ha un gruppo N libero.
Viene quindi a formarsi un legame isopeptidico tra il carbossi-
terminale di ubiquitina e la lisina inserita nella sequenza
amminoacidica.
Le cellule in questa maniera controllata riescono ad etichettare le
proteine non ancora degradate. A questo punto, però, non si ha
ancora l'intero segnale di degradazione perché la proteina, per essere
riconosciuta, deve possedere almeno 4 molecole di ubiquitina: si
legano covalentemente in una coda di poliubiquitine, che può essere
anche più lunga. Il legame covalente che viene sintetizzato lega
un'ubiquitina con il gruppo carbossilico attivato con il residuo di lisina
48 di un’altra ubiquitina. Questa catena è il segnale di riconoscimento
per la proteina, la quale viene riconosciuta da un grosso assemblaggio,
detto proteasoma. Il proteasoma è una struttura cilindrica proteica
con un cappuccio superiore e uno inferiore (lid) che ne chiudono
l'ingresso (19S) e un core centrale (26S). Non è un organello, ma
semplicemente un grande assemblaggio di proteine.
57
Giulia Mostini
Il processo è ATP dipendente, in quanto le subunità del proteasoma hanno siti di interazioni per l’ATP in cui
avvengono variazioni conformazionali che aiutano la degradazione. A questo punto, la coda di
poliubiquitina viene demolita in singole ubiquitine che ritornano a svolgere il loro lavoro di etichettatura,
mentre la proteina da degradare viene frammentata. I frammenti di proteina dovranno subire un’ulteriore
degradazione tramite le peptidasi per avere singoli amminoacidi.
La sumoilazione
Negli eucarioti possono essere aggiunti a residui di lisina diversi tipi di piccoli peptidi (10 differenti),
chiamati UbI. Uno di questi peptidi è il SUMO (Small Ubiquitin like Modifier), la cui aggiunta a proteine
bersaglio svolge un ruolo rilevante in diversi processi cellulari.
Nei mammiferi sono noti 4 tipi di SUMO di circa 100 amminoacidi di lunghezza. La coniugazione di SUMO
alle proteine segue passaggi simili a quelli dell’ubiquitinazione e coinvolgono gli enzimi E1, E2, E3. La lisina
sumoilata si riscontra frequentemente inserita nella sequenza yKxE, con y residuo idrofobico, K lisina, x
amminoacido qualsiasi, E acido glutammico.
Metilazione e acetilazione
L’acetilazione è un processo in cui vengono aggiunti gruppi acetili, grazie all’acetil-CoA. La sorgente di acetili
nel citosol è il citrato, che esce dai mitocondri ed è convertito dalla ATP citrato liasi. Il sito in cui avviene il
legame è il residuo di lisina o in generale l’estremità N-terminale degli amminoacidi. L’enzima che effettua
ciò è il NAT, la reazione inversa è la deacetilazione.
La metilazione, invece, è l’aggiunta di gruppi metilici, in cui il donatore è il SAM o la S-adenosilmetionina.
L’enzima che catalizza la reazione è la metil-transferasi e la reazione inversa è la demetilazione a carico
delle demetilasi.
Altri due eventi possibili sono la fosforilazione, cioè l’aggiunta di gruppi fosfato, e l’idrossilazione, cioè
l’aggiunta di gruppi OH.
58
Giulia Mostini
La pathway della chinasi ciclina dipendente CDK coinvolge una serie di complessi formati dalle cicline e
chinasi ad esse associate e controlla il ciclo cellulare. Questa via coinvolge anche repressori, come le
proteine 16 e 21, a sua volta indotta da p53, e attivatori. Tra quest’ultimi ci sono le CDK, alcune delle quali
sono state identificate in cellule di mammifero, ciascuna associata a specifiche cicline. CDK 4, in particolare,
fosforila la proteina RB inibitoria di E2F, inducendo la trascrizione di geni coinvolti nella fase S del ciclo
cellulare.
Nella via di Ras per la trasduzione del segnale, il ligando extracellulare (fattore di crescita) si lega al TRK.
Questo si autofosforila in specifici residui di tirosina, riconosciuti da SOS. Quest’ultimo induce Ras (piccola
proteina ancorata sotto la membrana cellulare, a seguito di una miristilazione) a scambiare il proprio GDP
con GTP. RAS-GTP attiva Raf, che attiva MEK, che attiva MAPK, che infine arriva un fattore di trascrizione,
come Myc.
Diversi recettori utilizzano gli stessi componenti della cascata di segnalazione intracellulare. La specificità di
risposta ai diversi stimoli e tra le diverse cellule è generata dalla complessità del network di trasduzione e
dall’espressione quantitativa, tessuto specifica dei diversi componenti, inclusi adattatori come Shc, che
svolgono la funzione di centri di aggregazione per varie vie.
Tecniche di biotecnologia
DNA ricombinante
Le molecole di DNA ricombinante (rDNA) sono molecole di DNA create in laboratorio attraverso metodi di
ricombinazione genetica, come il clonaggio molecolare, per comporre materiale genetico di origine diversa,
creando sequenze artificiali che non sono presenti nei genomi naturali. Il DNA ricombinante in un
organismo vivente fu ottenuto per la prima volta nel 1973 da Boyer, dell’università della California a San
Francisco, e Cohen, dell’università di Stanford, usando enzimi di restrizione di E. Coli, per inserire DNA
estraneo nei plasmidi.
Il clonaggio molecolare (molecular cloning) è il processo mediante cui le molecole di DNA ricombinate
vengono prodotte, trasformate e replicate in un organismo ospite. Un protocollo di molecular cloning ha
due componenti fondamentali: il frammento di DNA di interesse da moltiplicare e un vettore/plasmide che
contenga tutti i componenti per la replicazione in un ospite. Il DNA di interesse, come un gene, uno o più
elementi regolatori o un operone è preparato per la clonazione, asportandolo dal DNA sorgente, usando
enzimi di restrizione, o copiandolo, usando la PCR (Polymerase Chain Reaction), o assemblandolo da singoli
oligonucleotidi (DNA sintetico). Anche il vettore plasmidico viene preparato a interagire con il DNA da
clonare in forma lineare, usando enzimi di restrizione o PCR. Unendo fisicamente il DNA di interesse al
vettore plasmidico, mediante ligasi, il DNA da clonare diventa parte del nuovo plasmide ricombinante ed è
replicato nell’ospite.
Enzimi di restrizione
Il primo enzima di restrizione fu isolato 50 anni fa, dal microbiologo svizzero Werner Arber, che vinse il
premio Nobel nel 1978 in Fisiologia e Medicina. Egli scoprì gli enzimi di restrizione, mentre studiava un
fenomeno noto come “restrizione dei batteriofagi controllata dall’ospite”. Prima del lavoro di Arber, Luria e
Human avevano dimostrato che i vari fagi sopravvivono ciascuno in uno specifico ceppo batterio e non in
altri. Si diceva che quei fagi negli altri ceppi fossero “ristretti” dal loro ospite. Per spiegare questo
fenomeno, Arber propose che le cellule batteriche fossero in grado di proteggersi contro il DNA estraneo
attraverso un meccanismo di difesa genetica, catalizzato da enzimi. Questi enzimi riconoscevano i fagi come
estranei, scindendo il loro DNA e limitandone la crescita. Arber e Linn si riferivano all’enzima responsabile
di questa scissione endonucleolitica, come endonucleasi R, successivamente EcoB.
Fin dalle prime ricerche, gli scienziati hanno isolato più di 800 diversi enzimi di restrizione dai batteri, che
complessivamente riconoscono e tagliano più di 100 diversi siti di restrizione. La maggior parte dei siti di
restrizione è lunga da 4 a 6 basi e la maggior parte è palindroma.
Le prime tre lettere del nome di un enzima di restrizione sono le abbreviazioni della specie batterica da cui
l’enzima è stato isolato (Eco- per E. Coli), e la quarta lettera rappresenta il particolare ceppo batterico.
Anche i numeri romani sono usati come parte del nome quando più di un enzima di restrizione è stato
isolato dallo stesso ceppo batterico. Oggi gli scienziati riconoscono tre categorie di enzimi di restrizione:
59
Giulia Mostini
1. Tipo I: riconosce specifiche sequenze di DNA, ma lo taglia in siti apparentemente casuali che
possono essere lontani fino a 1.000 paia di basi dal sito di riconoscimento.
2. Tipo II: riconosce e taglia direttamente all’interno del sito di riconoscimento.
3. Tipo III: riconosce sequenze specifiche, ma fa il taglio in una posizione specifica diversa che si trova
a 25 paia di basi dal sito di riconoscimento.
Come postulato da Arber, tutti gli enzimi di restrizione servono allo scopo di difesa contro virus invasori. I
batteri proteggono il DNA, modificando le proprie sequenze di riconoscimento, di solito aggiungendo metili
ai nucleotidi e facendo affidamento sulla capacità degli enzimi di restrizione di riconoscere e tagliare solo
sequenze di riconoscimento non metilate. Come sospettato da Arber, i batteriofagi che sono stati
precedentemente replicati in un particolare ceppo batterico ospite e sopravvissuti sono similmente
modificati con nucleotidi marcati con metili e quindi protetti dalla scissione all’interno dello stesso ceppo.
L’analisi del DNA per elettroforesi su gel d’agarosio è fondamentale: per prima cosa si prepara il gel e i
campioni da analizzare, che vengono poi caricati nei pozzetti del gel. A questo punto si determina la curva
standard per le dimensioni dei frammenti di DNA, che vengono successivamente colorati con bromuro di
etidio. Ne viene misurata la distanza percorsa dal pozzetto e la separazione dei frammenti di DNA tramite
elettroforesi.
Vettori di espressione
Il passaggio finale nella ricostruzione di un DNA
ricombinante è il collegamento del DNA dell’inserto
(gene o frammento di interesse) al backbone
fosfodiesterico di un plasmide/vettore ricevente.
Questa reazione, chiamata ligazione, viene eseguita
utilizzando l’enzima ligasi del DNA. La maggior parte
degli enzimi di restrizione digerisce il DNA in modo
asimmetrico attraverso la sequenza di riconoscimento, il che si traduce in una sporgenza a singolo
filamento all’estremità digerita del frammento di DNA. Le sporgenze, chiamate “sticky ends” consentono al
vettore e all’inserto di legarsi l’un l’altro. Quando le estremità adesive sono compatibili, cioè le coppie di
basi sovrastanti sul vettore e sull’inserto sono complementari, le due molecole di DNA si connettono e
vengono fuse dalla ligasi.
La ligasi del DNA del batteriofago T4 è la ligasi più comunemente usata. Essa può legare estremità sticky o
blunt del DNA, oligonucleotidi e ibridi di RNA ed RNA-DNA, ma non acidi nucleici a singolo filamento. Con le
estremità blunt-end ha un’efficienza maggiore della ligasi del DNA di E. Coli. A differenza di quest’ultima, la
ligasi del T4 non può usare il NAD, ma dipende da ATP come cofattore.
Un vettore di clonaggio deve avere determinate caratteristiche: l’origine di replicazione, che gli permetta di
replicarsi autonomamente una volta introdotto nella cellula ospite; selection marker, che permetta di
individuare le cellule che contengono il vettore; siti di restrizione unici, per poter inserire all’interno del
vettore diversi frammenti di restrizione.
Trasformazione
La trasformazione è il processo mediante cui un organismo acquisisce il DNA esogeno. Può avvenire in due
modi. La trasformazione naturale descrive
l’assorbimento e l’incorporazione del DNA nudo
nell’ambiente naturale della cellule, mentre la
trasformazione artificiale comprende una vasta
gamma di metodi per indurre l’assorbimento di DNA
esogeno. Nei protocolli di clonazione, quest’ultima
viene usata per introdurre il DNA ricombinante nei
batteri ospiti (E. Coli). Il metodo più comune di
trasformazione artificiale di batteri comporta l’uso di
cationi bivalenti (CaCl2) per aumentare la permeabilità
della membrana del batterio, rendendoli
60
Giulia Mostini
61
Giulia Mostini
contengono un marcatore di selezione, ma i primi non hanno un’origine di replicazione, mentre gli
altri tra hanno un’origine che corrisponde a un’origine cromosomica. Questi permettono il
clonaggio dei frammenti di DNA da poche centinaia di basi fino a un massimo di 10-20 kpb, mentre i
vettori Yeast Artificial Chromosome permettono il clonaggio di frammenti grandi fino a 500-1.000
kpb.
• Cellule di insetto infettate da baculovirus: le cellule di insetto sono in grado di effettuare modifiche
post-traduzionali più complesse rispetto a batteri e lieviti. Hanno anche migliori macchinari di
folding delle proteine dei mammiferi, quindi offrono migliori possibilità di ottenere proteine solubili
di origine mammifera. Gli svantaggi sono i costi elevati e i tempi più lunghi per ottenere le proteine
(2 settimane).
• Cellule dei mammiferi: la maggior parte dei laboratori utilizza linee cellulari HEK (rene embrionale
umano) o CHO (ovaio di criceto cinese) per l’espressione di proteine che necessitano di opportune
modifiche post-traduzionali. Entrambe le linee cellulari possono essere utilizzate per l’espressione
della linea cellulare transitoria e stabile, che richiede più tempo a causa della generazione di linee
cellulari stabili, ma offre maggiore produttività. Queste cellule hanno solitamente un’elevata
capacità di produrre proteine secrete, mentre i livelli di espressione per le proteine intracellulari
sono solitamente più bassi. Alcuni vettori sono in grado di replicarsi in alcuni tipi di cellule di
mammifero in coltura, dato che nel plasmide è contenuta l’origine di replicazione del virus SV40. Il
vettore contiene altri elementi genetici richiesti per l’espressione del gene clonato nel vettore e per
la selezione di cellule contenente il DNA ricombinante. Spesso tali vettori contengono altri elementi
genetici per la propagazione in cellule batteriche, quindi sono vettori navetta. Altri tipi di vettori
per le cellule di mammiferi sono basati sull’uso di vettori retrovirali. Questi derivano
dall’oncoretrovirus MolV e sono in grado trasfettare solo cellule in attiva proliferazione,
limitandone l’uso. Per ovviare a questo problema sono stati costruiti vettori derivanti da lentivirus,
come HIV, che hanno sviluppato l’abilità di integrarsi anche nel genoma di cellule non proliferanti,
grazie alla capacità di attraversare la membrana nucleare.
62
Giulia Mostini
Un numero di cellule di E. Coli (diverse migliaia), tale da generare colonie distinte su piastre Petri, viene
piastrato su più piastre con terreno solido.
Dopo la formazione delle colonie, sulle piastre sono stesi dei filtri di nitrocellulosa a cui si attaccano parte
dei batteri formanti colonie. Dopo avere lisato le cellule trasferite sui filtri e denaturato il DNA, i filtri sono
ibridati con una sonda di DNA radioattiva, corrispondente a un tratto del gene che si vuole individuare nella
libreria. La sonda si lega sul filtro in corrispondenza del suo DNA complementare e una volta rivelata,
esponendo la membrana ad una lastra radiografica, permetterà il riconoscimento delle colonie contenente
il gene d’interesse.
Se si dispone di un anticorpo in grado di legare la proteina il cui gene è stato inserito in library di vettori
d’espressione, questo permette il riconoscimento delle colonie contenenti l’inserto desiderato.
L’integrazione della sequenza codificante nel vettore d’espressione determina la produzione di proteine di
fusione nelle colonie o placche, se si tratta di fagi. Le proteine sono raccolte su membrane, come visto per
le DNA library, e analizzate con specifici protocolli, che permettono la reazione di riconoscimento antigene-
anticorpo. Questo è lo screening per espressione.
Importante è la tecnica del Southern blot. Il taglio con un enzima di restrizione di DNA genomico di ampie
dimensioni genera frammenti di DNA che non sono visibili singolarmente dopo elettroforesi su gel e
successiva colorazione dei frammenti di DNA. Specifici frammenti possono, però, essere individuati dopo
separazione dei frammenti stessi tramite elettroforesi, successivo trasferimento delle molecole di DNA su
filtri di nitrocellulosa e ibridazione del filtro con una specifica sonda di DNA marcata in grado di ibridare con
sequenze di DNA complementari. La stessa cosa può essere fatta con RNA, prendendo il nome di Northern
blot.
Organismi transgenici
Un organismo il cui genoma sia stato modificato mediante tecniche di ingegneria genetica viene definito
geneticamente modificato (OGM). Nel caso in cui la modificazione genetica implichi il trasferimento di un
gene proveniente da altri organismi si parla di organismi transgenici.
Topi da laboratorio transgenici sono utilizzati in studi di genetica inversa, come modelli di malattie umane,
per lo studio delle cause di malattie, per la comprensione della funzione dei geni, per lo studio dei
meccanismi di processi fisiologici. In essi può avvenire la microiniezione nel pronucleo: zigoti a singola
cellula sono prelevati da femmine donatrici dodici ore dopo l’accoppiamento. Il DNA del transgene è
iniettato in uno dei due pronuclei. Gli zigoti vengono lasciati in incubatrice a dividersi e allo stadio a due
cellule vengono impiantati nell’infundibolo dell’utero di una femmina recipiente. Una percentuale tra il 5 e
il 20% dei nati avrà integrato in un punto del genoma il transgene che, se posizionato favorevolmente, può
esprimere il transgene e così quell’individuo (fondatore) darà origine ad una linea di topi transgenici.
Il gene targeting (ricombinazione omologa nelle cellule staminali – ES), invece, è una tecnica di ingegneria
genetica che usa la ricombinazione omologa nelle cellule embrionali totipotenti, che consente di modificare
o rimuovere un gene endogeno. L’efficienza del metodo si basa sulla selezione che avviene in cellule ES in
coltura, che può essere sia positiva sia negativa. Le cellule ES selezionate vengono poi iniettate nella
blastocisti ricevente, per dare vita a un topo “mosaico”, che incrociato con un WT produrrà individui
eterozigoti per la mutazione, che, a loro volta, possono essere incrociati per produrre mutanti omozigoti.
Per knock out condizionale, invece, si intende la tecnica utilizzata per eliminare un gene specifico in un
determinato tessuto. Knock in, invece, si riferisce alla sostituzione della sequenza del DNA in un locus con
l’inserimento di un’altra. Questi mutanti possono a loro volta essere inducibili, se regolati da specifici
stimoli, come gli estrogeni.
Studi genetici in S. cerevisiae, inoltre, sono facilitati dall’esistenza nell’organismo di cellule aploidi che
svelano fenotipi recessivi. E’ possibile nel lievito modificare singoli geni in pochi giorni, sfruttando i
meccanismi di ricombinazione omologa. E’ sufficiente introdurre un DNA lineare con alle estremità
sequenze omologhe a una qualsiasi regione del genoma che si intende modificare. La forte attività di
ricombinazione omologa induce la sostituzione della sequenza cromosomica, compresa tra le due sequenze
omologhe, con quella del DNA interrotto. In questo modo, si può rimuovere l’intera regione codificante di
un gene o cambiare un singolo codone o modificare una particolare coppia di basi nella consensus di una
regione regolativa.
63
Giulia Mostini
Piante transgeniche sono utilizzate per scopi di ricerca e applicazioni industriali nel settore agroalimentare
e delle biotecnologie. Ad esempio, l’infezione da parte del batterio Agrobacterium tumefaciens produce
tumori (galle). La crescita incontrollata delle cellule vegetali è dovuta all’inserzione nei cromosomi della
pianta dei geni presenti nel plasmide Ti (tumor inducing) del batterio, che codificano enzimi per la
biosintesi di ormoni stimolanti la proliferazione cellulare. Sfruttando questo fenomeno, è possibile
introdurre nelle piante sequenze di interesse, sostituendole a quelle che inducono i tumori nel plasmide Ti.
Arabidopsis thaliana può essere trasformata spruzzando le piante con una sospensione di Agrobacterium.
L’infezione del gametofito femminile prima della fecondazione può dare origine a semi del genoma
modificato stabilmente che produrranno organismi selezionabili, se si è avuta l’accortezza di includere nel
vettore, per esempio, la resistenza ad un erbicida.
Esistono anche moscerini transgenici: quando si incrociano individui di Drosophila melanogaster portatori
di trasposoni (elementi P) con individui permissivi, questi trasposoni sono mobilizzati nei nuclei delle cellule
del polo e possono integrarsi in geni critici per la formazione delle cellule germinali. In questo caso, si
determina la sterilità della progenie di questi incroci (disgenesi dell’ibrido). Gli elementi P vengono usati
come vettori per introdurre DNA esogeno in Drosophila. La trasposasi dell’elemento P viene rimossa ed
inserita in un altro vettore che viene coiniettato insieme all’elemento P ricombinante che, al posto della
traslocasi, contiene la sequenza da inserire nel genoma tra le regioni di inserzione.
64
Giulia Mostini
estremità dei frammenti vengono legati covalentemente delle corte sequenze tipiche (adattatori) che sono
utilizzati sia per l’amplificazione che per le reazioni di sequenziamento vero e proprio.
Il pirosequenziamento (454) è uno dei primi metodi implementati per determinare l’ordine dei nucleotidi
nel DNA durante la sintesi, ovvero rilevando il nucleotide incorporato dalla DNA polimerasi, grazie alla luce
emessa quando il pirofosfato viene rilasciato. A ogni ciclo della reazione vengono aggiunti uno dopo l’altro i
quattro desossinucleotidi. Ogni volta che la polimerasi incorpora un nucleotide, si rilascia pirofosfato (Ppi)
in quantità equimolare a quella del nucleotide incorporato. La solforilasi con l’adenosina 5’ fosfosolfato
(APS) converte poi il Ppi ad ATP. Quest’ultimo è utilizzato dalla luciferasi per convertire la luciferina in
ossiluciferina con rilascio di fotoni, che sono rivelati da una CCD camera.
Il processo della tecnologia 454 avviene in tre fasi: la prima fase consiste nella preparazione della libreria di
DNA, a partire da frammenti generati attraverso nebulizzazione del campione di DNA in esame. Viene
generata una libreria di frammenti a singolo filamento, a cui sono legati due adattatori. La seconda fase
prevede l’amplificazione clonale in emulsione dei frammenti legati a microbiglie di agarosio. Nella terza
fase viene prodotta la sequenza delle basi, assegnando un indice di qualità a ciascuna posizione.
Importante è la tecnologia a nanopore: l’adattatore indirizza la singola molecola di DNA sul poro canale
nanomolecolare proteico. Il passaggio del filamento singolo determina un cambiamento della conduttività
dipendente dalla sequenza. Alla NGS di terza generazione appartiene anche la tecnologia PacBio a singola
molecola, in cui ogni nano-pozzetto contiene una DNA polimerasi.
Tecniche di PCR
PCR (polymerase chain reaction o reazione a catena della polimerasi) è una tecnologia che permette
l’amplificazione in vitro di un frammento di DNA, la cui sequenza in genere è nota o si trova tra due regioni
dalla sequenza nota. Prima della PCR, il DNA di interesse poteva essere prodotto solo attraverso
l’amplificazione delle cellule che lo contenevano con rese relativamente limitate, tempi lunghi e dispendio
di risorse. Questa tecnica è una scoperta industriale, ideata nel 1983 da Mullis.
I reagenti necessari per la PCR sono il DNA da amplificare o templato (10-100 ng di genoma eucariotico),
una coppia di primers,una DNA polimerasi (Taq) di Thermus acquaticus, che resiste a 95°, ma performa con
una frequenza di errore superiore, dNTPs, Mg2+, buffer di reazione (tampone di tris e sali), acqua per un
volume totale di reazione di 10-200 μl.
La PCR avviene in un ciclo di tre passaggi:
1. Denaturazione termica del DNA, per cui i due filamenti si separano (95°C per 3 minuti).
2. Associazione (annealing) degli inneschi (primers) ai filamenti di DNA denaturato complementari.
3. Sintesi del DNA, tramite DNA polimerasi,a partire dai due primer appaiati sui filamenti del DNA
(estenzione). La tecnica si esegue alla temperatura di 72°C.
Cicli ripetuti di PCR amplificano il DNA e prendono il nome di termocicli.
Per eseguire una PCR sono necessari due set di primer, forward e reverse. Essi sono oligonucleotidi prodotti
sinteticamente e lunghi circa 20-30 nt. I primer sono disegnati in modo da avere una sequenza nucleotidica
complementare all’estremità 3’ del DNA da amplificare. I primer, inoltre, non devono contenere sequenze
ripetute e invertite (palindromi), per evitare la formazione di ripiegamenti e dovrebbero avere un
contenuto di GC del 40-60% per garantire una reattività ottimale.
La sintesi chimica di DNA basata su fosforamidite è il metodo di elezione per la produzione di
oligonucleotidi di DNA. Fu sviluppata negli anni ’80 e successivamente migliorata con l’apporto della
tecnologia in fase solida e l’automazione dei cicli. A differenza della biosintesi, la sintesi chimica procede
nella direzione 3’->5’. Questo processo è composto da tre fasi: la detritilazione, in cui il gruppo protettivo
5’-DMT viene rimosso dal primo nucleoside legato al supporto solido; il coupling, in cui il 5’-OH libero del
primo nucleoside attacca il fosforo del secondo nucleoside in entrata spostando il suo gruppo
diisopropilamino; l’ossidazione, in cui il fosfito triestere instabile viene convertito in un fosfato triestere che
consente al ciclo successivo di procedere alla detritilazione del secondo nucleotide. Tuttavia, prima di
passare al ciclo successivo, i nucleosidi sul supporto solido che non hanno reagito sono acetilati, impedendo
in tal modo l’allungamento delle sequenze con mutazioni di delezione.
La temperatura di melting (Tm - scioglimento) dei primer dipende dalla lunghezza dei primer stessi, dal loro
contenuto in GC/AT e dalla concentrazione saline di NaCl e dal pH di reazione. Si approssima con la formula
65
Giulia Mostini
Tm = 4 (G+C)+2(A+T) °C. La Ta, invece, è la temperatura di annealing e si imposta 2-5°C al di sotto della più
bassa Tm dei due primer usati.
Esiste anche una PCR quantitativa. E’ possibile, infatti, seguire in tempo reale, durante il susseguirsi dei cicli
della PCR, l’accumulo del DNA prodotto mediante fluorocromi (coloranti intercalanti o marcatori di
nucleotidi). La PCR (real – time) può essere utilizzata per quantificare la quantità di DNA templato presente
in un campione (QPCR).Eventualmente, nel caso di un RNA retrotrascritto in cDNA si possono misurare le
quantità relative di mRNA espresso di un gene in diverse condizioni (RT-QPCR).
Per ogni campione si ottiene una curva di amplificazione e si definisce una soglia (threshold). Il numero di
cicli di PCR necessari per arrivare a quel quantitativo di soglia di DNA viene indicato come Ct (threshold
cycle) relativo al campione. Il Ct è inversamente proporzionale alla quantità di DNA templato iniziale. Per
conoscere il rapporto quantitativo del DNA di partenza di due campioni se ne sottraggono i Ct (∆Ct) e si
calcola pari a 2-∆ct
RNA interference
Gli RNA non codificanti
(ncRNA) sono molecole di RNA
trascritti da geni specifici che
non vengono tradotti in
proteine. I tRNA e gli rRNA
sono i più abbondanti ncRNA
prodotti dalla cellula. Vi sono
altri piccoli ncRNA, come i
microRNA (miRNA), piccoli RNA
interferenti (siRNA) ed RNA del
sistema Piwi (piRNA), che
svolgono la funzione di
regolazione dell’espressione
genica o di difesa da virus e
trasposoni.
I miRNA e i siRNA fanno parte del meccanismo dell’interferenza con RNA (RNAi), che causa il silenziamento
dell’espressione genica essenzialmente a seguito della formazione di ibridi di RNA senso-antisenso. RNAi
viene anche detto silenziamento genico mediato da double-stranded RNA. Furono scoperti nel 1988 nella
piante e in C. elegans, pochi anni dopo che fosse osservato il fenomeno del silenziamento del transgene.
Nel tentativo di alterare i colori dei fiori nelle petunie, infatti, i ricercatori vi introducevano un gene che
codifica un enzima chiave per la pigmentazione dei fiori, detto calcone sintasi. Si aspettavano che l’enzima
producesse fiori più scuri, invece risultavano fiori bianchi, indicando che l’attività sia dei geni endogeni sia
dei transgeni dell’enzima venivano repressi. Poco dopo, un evento collegato chiamato quelling fu notato
nel fungo Neurospora crassa. Successive indagini chiarirono che la soppressione era dovuta all’aumento del
tasso di degradazione dell’mRNA. Questo fenomeno venne chiamato co-soppressione dell’espressione
genica.
I siRNA e i miRNA derivano da molecole più lunghe di RNA a doppio filamento che vengono tagliate
dall’enzima Dicer (Rnasi III). I piRNA sono prodotti, invece, col processamento di lunghi trascritti a singolo
filamento, originati dai cluster di piRNA presenti nei genomi. I tre ncRNA inibiscono l’espressione genica in
tre modi: inducono la distruzione di mRNA; inibiscono la traduzione; modificano la cromatina del gene
bersaglio, silenziando la trascrizione. Il macchinario dell’RNAi comprende il complesso RISC contenente
diverse proteine, tra cui argonaute (Ago) che srotola il doppio filamento e, come ribonucleasi, taglia la
sequenza a 10-11 nt dall’estremità terminale 5’.
I siRNA possono moltiplicarsi attraverso un meccanismo di sintesi a partire da siRNA che agiscono da
primer. Questa amplificazione è mediata dalla RNA polimerasi RNA dipendente (RdRP) reclutata dal
complesso siRNA-RISC. Il singolo filamento legato da siRNA viene così copiato in un dsRNA che viene poi
tagliato e attivato da Dicer. RdRP si trova nelle piante, nei vermi e nel S. pombe.
66
Giulia Mostini
I microRNA, invece, regolano l’espressione genica e negli animali i geni di miRNA sono trascritti in miRNA
primari (pri-miRNA) ed elaborati da due RNAsi (Drosha e Dicer). Drosha agisce nel nucleo, scindendo il pri-
miRNA vicino alla base del gambo di una tipica struttura a forcina, rilasciando pre-miRNA da circa 70 a 90
nt. Il pre-miRNA viene poi esportato nel citoplasma, dove l’ansa terminale viene tagliata da Dicer per
produrre un miRNA duplex. Un filamento di questo duplex viene rapidamente degradato e rimane solo la
sequenza matura di miRNA di circa 22 nt. Il riconoscimento e il taglio dell’RNA da parte dei due enzimi è
dovuto alla struttura dell’RNA substrato piuttosto che alla loro sequenza specifica.
Il miRNA maturo si associa al complesso RISC in cui è presente Ago e insieme miRNA-RISC legano l’RNA
bersaglio. La specificità per il bersaglio è determinata dalla complementarietà con una breve sequenza
(sequenza seed), in genere presente nella regione 3’-non tradotta (UTR) dell’mRNA. L’effetto tipico è quello
di indurre il blocco della traduzione o la degradazione dell’RNA mediante il dominio RNasi di Ago. Un
miRNA può silenziare in modo post-trascrizionale diverse migliaia di trascritti di un gene, mentre un singolo
gene può essere silenziato da più di un miRNA. In alcuni casi i miRNA possono promuovere la traduzione.
Esistono diverse centinaia di miRNA. Alcuni sembrano derivare dall’elaborazione di geni codificanti dopo lo
splicing, attraverso l’azione di enzimi di de-branching del lariat. Questi miRNA sono definiti Mirton. In
questo caso, la biogenesi del miRNA sarebbe un processo parallelo a quello dell’espressione genica
codificante. La degenerazione di molti miRNA nell’uomo è associata a importanti patologie: i livelli di alcuni
miRNA nel sangue periferico sono utilizzati come marker di malattia.
E’ possibile far esprimere un opportuno siRNA in cellule per indurre il silenziamento di uno specifico gene a
scopo di ricerca o per applicazioni industriali. La sequenza del siRNA deve avere alcune caratteristiche:
formare un RNA a doppia elica di 21-23 nt; avere un terminale 3’ più lungo di 2 nt con OH libero; avere un
5’ del senso stabile (ricco in GC) e un antisenso ricco in UA; essere complementare a una porzione di RNA a
non più di 75 basi da codone di inizio traduzione, ma non complementare a sequenze di introni. Questi
siRNA artificiali possono essere clonati in vettori d’espressione e introdotti in cellule in coltura o veicolati in
tessuti. Sono disponibili anche library di RNAi, cioè contenenti diversi centinaia di migliaia di sequenze per
silenziare altrettanti geni bersaglio in esperimenti di screening fenotipici.
67
Giulia Mostini
68