BIOLOGIA MOLECOLARE
1. INTRODUZIONE
La biologia molecolare una disciplina che va soprattutto a studiare le interazioni tra le
macromolecole, soprattutto quelle tra proteine e acidi nucleici (DNA e RNA); molto spesso quando
si parla di biologia molecolare ci si riferisce alle metodiche che fanno parte della biologia
molecolare cio come si possono studiare le interazioni, in realt le metodiche sono solo un mezzo
per studiare come le proteine agiscono ed esplicano le loro funzioni; lobiettivo capire come gli
acidi nucleici esplicano la propria funzione interagendo con una serie di fattori.
1
La biologia molecolare il punto di unione tra geni e proteine e studia come le informazione si
traducono in processi attivi che mantengono la struttura delle cellule e ne consentono lattivit
quotidiana.
La maggior parte delle conoscenze sono nate da studi su batteri, organismi unicellulari con una
struttura estremamente semplice che consentivano un sistema di ricerca semplificato; per molti
aspetti la similitudine tra cellula umana e batterio elevata, in tal modo possibile associare
processi studiati nei batteri alla cellula animale, qualche volta i processi hanno subito anche
sviluppi.
[Lapproccio alle lezioni di tipo sperimentale e il docente sottolinea che non sempre riuscir a
svolgere per intero i processi dal batterio alla cellula umana, ci significa che ci che non viene
affrontato in classe rimarr parte del nostro studio.]
Pensiamo alla cellula come la commistione di struttura, energia, azione e informazione; di
questultima ci interessiamo con la biologia molecolare.
2. CENNI STORICI
Il corso di biologia molecolare pu essere ridotto a quello che il dogma centrale che il flusso
delle informazioni dal DNA come molecola nella quale depositata linformazione genetica che poi
fluisce verso lRNA e finalmente verso le proteina, questo il flusso fondamentale delle
informazioni che sta allinterno della nostra cellula.
Il dogma non pi valido perch dallRNA si pu tornare al DNA grazie allaiuto delle trascrittasi
inverse, il dogma non cos assoluto per comunque ancora il cuore di quello che questa
disciplina.
Si iniziato a capire che era questo il modo con cui funzionava una cellula quasi cento anni fa.
2
2.2 Esperimento di Avery 1944
Avery ha ripetuto lesperimento suddividendo in componenti il prodotto trattato con il calore, ha
trattato un determinato estratto con le proteasi in modo da essere sicuro che le proteine vengano
eliminate per verificare se le cellule diventavano patogene anche senza proteine oppure con Rnasi
che distruggono lRNA per verificare se lRNA che ha trasferito le caratteristiche patogene e
fenotipiche, solo il trattamento con Dnasi ha portato ad eliminare completamente la trasformazione
delle cellule non patogene in cellule patogene.
stato dunque questo lesperimento cardine che ha stravolto il mondo di allora e ha consentito di
dire che linformazione genetica contenuta nel DNA e non nelle proteine.
Da allora ci si concentrati di pi sulla struttura e sulle caratteristiche di questa molecola.
Il passo ulteriore per capire come poteva funzionare e dove era collocata questa informazione
genetica stato il lavoro condotto da R. Franklin nel 1952 e poi da Watson e colleghi, che hanno
interpretato la fotografia della diffrazione ai raggi X di una molecola
di DNA e, analizzando questa diffrazione, hanno capito che si
trattava di una struttura elicoidale; quindi lelemento cardine stato
quello di poter interpretare nel miglior modo possibile la fotografia e
di capire che era la diffrazione di una struttura elicoidale; da qui
3
hanno sviluppato il modello che prevede che ciascun DNA sia costituito da due filamenti di basi che
sono abbinate tra loro in modo complementare e questa struttura una volta descritta ha aperto un
nuovo mondo su come linformazione potesse essere duplicata, trasmessa, trasformata in qualcosa
di diverso e portare alla sintesi proteica.
Ci sono voluti poi parecchi altri anni per dimostrare che la duplicazione del DNA avveniva in modo
semiconservativo (esperimento di Meselson Stahl) [Lo vedremo pi avanti.] ovvero che partendo da
una cellula madre, le due cellule figlie avevano una met del DNA parentale e una met di nuova
sintesi; si dimostrava anche che la complementariet delle basi era un dato strutturale e funzionale,
perch consentiva di avere uno stampo su cui creare molecole nuove.
Da qui si arrivati a scoprire come linformazione trasferita nelle proteine (tRNA, prima ancora
lRNA e lrRNA).
La prima parte del corso si interesser di mantenimento del genoma, quindi come fatto il DNA,
come viene modificato e riparato. Questo ha spesso implicazioni con patologie molto importanti.
Nei batteri il DNA non localizzato nel nucleo (non esiste) e rende cos molto diversa la gestione
del materiale allinterno della cellula, vuol dire che nello stesso compartimento avvengono
duplicazione, trascrizione e traduzione degli acidi nucleici mentre nei procarioti c una
compartimentazione molto rigida di alcune di queste funzioni (nucleo, citosol); le strutture
eucariotiche sono arricchite di organelli (alcuni dei quali presentano un proprio DNA, come i
mitocondri); i procarioti hanno dimensioni nellordine di 1-10 micron mentre gli eucarioti fino a
100 micron; con gli eucarioti si ha a che fare con organismi multicellulari.
4
Ci che pi evidente la variazione della densit genica; se prendiamo in considerazione il gene
per la DNA polimerasi di un batterio, di un lievito (eucariote unicellulare), di Drosophila e
delluomo, notiamo che nel batterio c un estrema compattazione dei pacchetti genici allinterno
del genoma, in alcuni casi la stessa sequenza pu essere utilizzata in due sensi per produrre proteine
diverse, cosa che non succede nelluomo, nel quale possibile visualizzare sequenze non
appartenenti alla componente genica, moltissimi sono gli introni e molte le sequenze ripetute e le
sequenze intergeniche, la cui funzione poco nota.
La complessit degli organismi si trasmette direttamente in una densit genica molto minore.
La porzione codificante dei geni, cio che vengono trascritti in messaggero e tradotti in proteina,
sono solo 1-2% del genoma, questa percentuale lunica che porta informazioni per la sintesi
proteica; tutto il resto sono regioni con funzioni diverse o con funzioni non ancora note; circa il
50% del nostro genoma caratterizzato da sequenze uniche, cio che non ci sono ripetizioni della
stessa sequenza pi volte.
Nel genoma umano ci sono anche gli introni, porzioni di DNA che interrompono gli esoni e che
fanno parte della struttura genica ed hanno una sequenza costante e non ripetuta; a fianco agli
introni ci sono regioni intergeniche spesso a funzione regolativa, intervengono nel modulare
lefficacia della trascrizione ed eventuale traduzione dei geni; nelle sequenze non ripetute esistono
una serie di geni che codificano esclusivamente per RNA e questi RNA (a parte tRNA e rRNA)
non danno luogo a proteine ma svolgono un ruolo molto importante a livello della cellula e sono per
esempio miRNA ma anche long non-coding RNA, i quali tendono a svolgere funzioni regolatrici
molto importanti.
Larga parte del genoma caratterizzata da sequenze che si ripetono in numero variabile, la funzione
di queste porzioni non sempre chiara; una parte di queste sequenze sono le ripetizioni in tandem,
oppure parti dovute a fenomeni di trasposizione, ovvero che porzioni di DNA vengono trasferiti da
una parte allaltra, qualche volta in forma duplicativa, cio il segmento iniziale viene duplicato e
inserito nel genoma in unaltra sede, e se il fenomeno viene ripetuto pi volte le duplicazioni
diventano di numero elevato; altre volte dovuto al fenomeno di cut and copy quindi viene tagliato
via un pezzo di DNA e trasferito in altra sede.
Qualche volta la presenza di un gene pu apparire duplicata o moltiplicata, appaiono cos gli
pseudogeni, in questi casi possibile che il gene viene trascritto, viene creato il messaggero e per
azione di una trascrittasi inversa si crea di nuovo un DNA che pu essere inserito nel genoma di
partenza; questo fenomeno estremamente limitato e collegato ai virus.
5
Nella porzione del DNA altamente ripetuto si possono distinguere porzioni che sono altamente
ripetuto o mediamente ripetute, come il DNA satellite, brevi sequenze che vengono ripetute in
tandem migliaia di volte, sono tipiche dellorganismo che si prende in considerazione; il motivo
dellaccumulo da parte del genoma di queste migliaia di sequenze ripetute non ancora chiaro.
I microsatelliti sono importanti e pongono un problema estremamente importante perch si trovano
a fronteggiare sequenze uguali e ripetute molte volte e un fenomeno che avviene frequentemente
lo scivolamento della polimerasi che salta sequenze oppure ne crea una ex novo e porta ad una
notevole variet di copie di microsatelliti che ciascuno di noi ha nel proprio genoma, perch sono
sequenze piuttosto difficili da duplicare e predisposta allerrore, quindi facilmente ci possono essere
fenomeni di questo tipo, e allora questo diverso numero di duplicazioni nei diversi individui
diventano impronte genetiche con caratteristiche proprie a ciascuno di noi.
Lanalisi della lunghezza dei microsatelliti rende possibile il riconoscimento dellappartenenza di un
certo DNA ad un determinato individuo (tecniche utilizzate in medicina legale e per il
riconoscimento della paternit).
Il meccanismo iniziale di formazione della collana di perle si basa sul coinvolgimento delle proteine
istoniche o istoni, in numero di otto formano la struttura fondamentale del nucleosoma, cio il
cilindro proteico attorno al quale il DNA viene avvolto quasi due volte e in questo modo si riduce la
lunghezza di circa 6 volte.
Questo meccanismo di avvolgimento stato scoperto tramite esperimenti in cui il DNA trattato
con nucleasi che taglia e digerisce il DNA quando non incollato da proteine; se prendo il DNA
genomico trattato con nucleasi e lo analizzo, si nota che si ottengono bande di DNA di dimensioni
6
di circa 200 paia di basi oppure multipli di queste; se si ripete lo stesso esperimento allungando i
tempi di esposizione alla nucleasi, si ottengono frammenti di DNA tutti di circa 140-150 paia di
basi, ci significa che la struttura che sto studiando prevede interazioni tra proteine e DNA e la coda
di DNA che interagisce con le proteine che non attaccabile da nucleasi di circa 140 paia di basi e
quindi il modello che si sviluppato una struttura con il nucleo di istoni con avvolto attorno a s
una quantit di DNA di 140-150 paia di basi avvolto attorno al core istonico circa due volte.
4.1 ISTONI
Gli istoni sono tra le proteine pi conservate, per questo sono mantenute inalterate, hanno struttura e
caratteristiche molto particolari; sono fortemente basiche, hanno almeno il 20% di arginina e lisina,
perch cos interagiscono con grande efficacia con il DNA e la sua negativit conferitagli dallacido
fosforico; gli istoni hanno almeno tre eliche che costituiscono il dominio-fold che porta a formare
determinate strutture che consentono lappaiamento tra un istone ed un altro; gli istoni sono
chiamati H2A, H2B, H3, H4 e nella cellula in vivo si appaiano sempre a formare dimeri di H2A e
H2B e poi tetrameri di H3 e H4; si assemblano poi a formare una sorta di cilindro.
Alcuni esperimenti in vitro di ricostruzione del nucleosoma fanno vedere in realt che H3 e H4
formano i dimeri, poi due dimeri formano il tetramero che per primo interagisce con il DNA e ne
induce una curvatura e successivamente si aggiungono i dimeri H2A e H2B; esiste una connessione
nello sviluppo del nucleosoma, gli istoni non esistono in strutture cilindriche ma sono singole
proteine (o dimeri) e quando serve formare un nucleosoma portano alla formazione della struttura
proteica.
Il tetramero si lega in porzioni ben specifiche di DNA, riconosce la porzione centrale e le due
porzioni terminali e in questo modo inizia a piegarlo e a vincolarlo in quella posizione legandosi
alle estremit dette link che escono dal nucleosoma; poi viene richiamato il tetrametro H2A e H2B
che si lega alla porzione pi interna della struttura circolare.
Gli istoni hanno il core detto histone-fold formato da tre alfa-eliche al cui fianco ci sono le code
della proteina che protrudono dal nucleosoma, si fanno spazio tra il DNA ed escono allesterno del
nucleosoma in posizioni ben precise.
Il DNA avvolto in andamento sinistrorso, che viene determinato dalla struttura stessa del
nucleosoma, questo significa che acquista un superavvolgimento negativo. (Sar spiegato pi
avanti)
7
Dati sperimentali ci dicono che le code sono utili ma non necessarie per formare il nucleosoma
perch se trattato con nucleasi, il nucleosoma si mantiene mentre le code vengono eliminate; le code
hanno funzioni importanti per la dinamicit dei nucleosomi.
Esiste un altro istone, H1, che se aggiunto alla collana di perle ne cambia la conformazione; listone
H1 si unisce alla collana di perle e si piazza a livello del DNA linker, che la porzione di DNA che
esce dal nucleosoma e collega un nucleosoma a quello vicino, inducendo un ulteriore
compattamento della collana di perle, modificando langolo di uscita del DNA, facendo disporre i
nucleosomi a zig zag uno a fianco allaltro e accorciando ulteriormente la lunghezza del DNA;
questo spiega il fatto che se insistiamo con la digestione da parte della nucleasi, listone H1 non
cos stabile e si stacca e la nucleasi pu cos digerire il DNA libero (cio il DNA linker non protetto
dagli istoni).
Per passare dalla collana di perle alla fibra di 30 nm
devono intervenire altri fenomeni che portano alla
formazione di due strutture, sperimentalmente entrambi
esistenti nel genoma probabilmente a seconda della
struttura del DNA, i due modelli sono:
Solenoide: i nucleosomi si avvolgono creando un
foro centrale di una dimensione ben precisa
Zig zag
Grazie ad un ulteriore compattamento, la lunghezza si
riduce di circa 40 volete, e si giunge ad una fibra di
dimensioni maggiori.
Il passaggio successivo, che chiaro dal punto di vista strutturale ma meno chiaro dal punto di vista
di come avviene, la formazione di anse e da una struttura in cui molte proteine si associano al
DNA (sulla tipologia delle proteine non si sa molto tranne per la topoisomerasi e le proteine per il
mantenimento del cromosoma), le quali sono localizzate in una determinata porzione da cui
dipartono delle anse formate da fibre di 30 nm che possono avere dimensioni variabili.
Il cromosoma avr alla fine una struttura formata da un nucleo centrale in cui DNA e proteine sono
molto compattate e anse che si distaccano a formare una sorta di struttura semicircolare; ciascuna di
queste strutture semicircolari indipendente dalle altre, una struttura circolare che difficile da
distaccare a causa degli avvolgimenti, diversamente da una struttura lineare, pi facile da distaccare.
Solo quando abbiamo leterocromatina si ha il completamento finale dei cromosomi; il maggior
grado di compattamento correla inversamente con il grado di funzionalit, zone pi rilassate sono
zone pi ampiamente utilizzabili durante il corso della vita cellulare.
I nucleosomi si collocano nel DNA in maniera casuale, non in siti specifici.
Lassociazione del nucleosoma con il DNA non del tutto libera da vincoli strutturali, si osservato
che interagisce con zone ricche di A-T, perch pi facile ripiegare il DNA in queste porzioni; il
nucleosoma pu essere rimodellato e in queste circostanze hanno un ruolo importante le code
istoniche, perch sono portatrici di segnali di rimodellamento e di utilizzo del DNA; le proteine
sono ricche di aminoacidi basici e in corrispondenza delle code presente anche serina e treonina,
questi aminoacidi vengono modificati con laggiunta di gruppi fosfato oppure metilati oppure
acetilati oppure possono essere legate piccole proteine (come lubiquitina) o gruppi chimici; tutte
queste aggiunte creano una sorta di codice di lettura degli istoni, fanno s che queste code istoniche
chiamino proteine di tipo diverso allinterno della cellula che vanno a svolgere una serie di funzioni
diverse.
Queste modifiche alle code comportano che alcune cariche positive nelle catene laterali vengano
soppresse, in questo modo il legame tra DNA e proteine diventa pi blando ed un evento
fondamentale per concedere pi dinamicit alla struttura; laspetto importante che i bromodomini
8
possono riconoscere le code acetilate degli istoni mentre le proteine che hanno cromodomini
interagiscono con le porzioni metilate, a questo punto i nucleosomi richiamano proteine che
contengono bromodomini e cromodomini in corrispondenza di determinate porzioni di DNA e
questo innesca una serie di fenomeni diversi.
Le porzioni di DNA trascritte in modo efficace per trascrivere geni presentano un grado elevato di
acetilazione delle code istoniche; la metilazione del DNA spesso si associa ad una soppressione
trascrizionale.
Esiste un codice istonico a seconda del tipo di modificazione e dellaminoacido modificato, ci si
traduce in un comportamento diverso del DNA.