Sei sulla pagina 1di 69

GenΩ

1
P UBBLICATO DA C RISTIAN T ACCIOLI©
UNIVERSITÀ DI P ADOVA

La distribuzione e la copia di questo materiale con qualsiasi mezzo non è permessa, se non con il consenso
esplicito dell’autore. Le immagini presenti in questo testo sono state scaricate dal “Repository Immagini di
Google ©” che non dispongono di copyright. Nel caso le suddette immagini dispongano di copyright, l’esatta
provenienza delle stesse è stata indicata. Per qualsiasi domanda scrivere a: cristian.taccioli@unipd.it

II versione, 15 Ottobre 2021


PREFAZIONE

Questo testo vuole essere un valido strumento come introduzione alla Biologia Molecolare,
pertanto ho cercato di scrivere nel modo più semplice e sintetico possibile.

Il libro è diviso in tre parti. La prima parte riguarda lo studio degli argomenti fondamentali della
Biologia Cellulare, la seconda tratta le nozioni principali della Genomica mentre la terza descrive
le basi della Biologia Molecolare propriamente detta.

Purtroppo, l’insegnamento della Biologia Molecolare, per alcuni corsi di studio, è ridotto a
pochissime ore e non vi è il tempo di introdurre capitoli importanti. In molti casi la Genomica non
è neanche menzionata. Per questo motivo, credo che questo materiale didattico, così sintetico, sia
particolarmente indicato a coloro che vogliano studiare le basi della Biologia Molecolare in modo
veloce e sufficientemente dettagliato sia che essi siano studenti sia che siano persone interessate a
questo argomento. Per coloro che volessero utilizzare questo testo in corsi universitari, lo consiglio
solo nei casi in cui i suddetti corsi non superino i 4 crediti formativi (32 ore). Per approfondire i
temi trattati e non trattati in questo volume suggerisco libri più completi.

Voglio comunque sottolineare che anche nei testi universitari più moderni, il capitolo riguardante
la Genomica viene ridotto al minimo o addirittura tralasciato. La Genomica è, invece, la disciplina
del futuro da quando, nel 2001, il sequenziamento del genoma umano ha aperto le porte alla
lettura completa del nostro DNA. Darò quindi particolare enfasi ai paragrafi che riguardano le
simmetrie, la composizione strutturale ed i vincoli energetici delle molecole biologiche, in
particolare, il DNA.

La maggior parte delle malattie umane ed animali ha, infatti, una relazione con il DNA e, pertanto,
invito i lettori e gli studenti a leggere con particolare attenzione i capitoli II e III di questo testo.

Come ultima nota vorrei sottolineare il fatto che ho riportato al minimo il numero di monografie
e pubblicazioni scientifiche nella bibliografia, in modo da stimolare lo studente a leggerle poiché
rappresentano la descrizione di quelle scoperte che hanno cambiato non solo la storia della
Biologia Molecolare e della Genomica ma anche della storia dell’umanità.

L’autore

3
Contenuti

Biologia Cellulare
1.1 Introduzione 11
1.2 La vita 11
1.3 La cellula 11
1.3.1 Due tipi di organismi: Procarioti ed Eucarioti ................................................... 11
1.4 L’albero della vita 21
1.5 L’evoluzione 21
1.5.1 Lamarck e l’evoluzione per ereditarietà dei caratteri acquisiti....................................... 21
1.5.2 Darwin e l’evoluzione per selezione naturale ............................................................... 21
1.6 Cenni sull’epigenetica 22
1.6.1 Definizione moderna di Epigenetica ...................................................................................... 22
1.6.2 L’epigenetica come causa del cancro.............................................................................. 23
1.6.3 L’epigenetica come causa del ritardo mentale ............................................................. 23
1.6.4 L’epigenetica e l’evoluzione degli organismi viventi ...................................................... 23

Seconda Parte
Genomica
2.1 Un po’ di storia 27
2.2 Il DNA 29
2.3 Vari tipi di strutture di DNA 29

2.4 L’RNA 29
2.5 Il valore C ed il suo paradosso 31
2.5.1 Meccanismi che aumentano o diminuiscono le dimensioni di un genoma ....................... 32

2.6 Il contenuto di GC nei genomi 33


2.7 La seconda legge di Chargaff, la regola di Szybalski e Sinclair 33
2.8 La composizione del genoma umano 33
2.8.1 Trasposoni ............................................................................................................... 34

5
2.8.2 I microRNA ............................................................................................................... 34
2.8.3 Gli altri RNA non-codificanti................................................................................................... 35
2.8.4 Gli elementi ripetuti ............................................................................................................... 35
2.8.5 Eterocromatina ed Eucromatina .................................................................................. 35
2.8.6 Sequenze ultraconservate...................................................................................................... 35
2.8.7 Introni ............................................................................................................... 35
2.8.8 Esoni ............................................................................................................... 36

Terza Parte

Biologia Molecolare
3.1 Introduzione 39
3.2 Replicazione nei Procarioti 39
3.2.1 Differenze tra la replicazione nei procarioti e negli eucarioti .......................................... 40
3.2.2 Fase di inizio della replicazione nei Procarioti ................................................................ 40
3.2.3 Fase di allungamento durante la replicazione nei Procarioti .......................................... 40
3.2.4 Fase di terminazione della replicazione nei Procarioti ......................................................... 41
3.3 Replicazione negli Eucarioti 42
3.3.1 Fase di inizio della replicazione negli eucarioti .............................................................. 42
3.3.2 Allungamento durante la replicazione negli Eucarioti.................................................... 44
3.3.3 Terminazione della replicazione negli Eucarioti....................................................................44
3.4 Trascrizione nei Procarioti 45
3.4.1 Inizio della sintesi ed allungamento dell’RNA durante la Trascrizione nei procarioti……….. 45
3.4.2 Terminazione della Trascrizione nei Procarioti ......................................................................46
3.5 Trascrizione negli Eucarioti 46
3.5.1 Inizio della Trascrizione negli Eucarioti ..................................................................................46
3.5.2 Stop della Trascrizione negli Eucarioti ................................................................................... 47
3.5.3 Lo Splicing.............................................................................................................................. 47
3.5.4 Lo Splicing Alternativo ........................................................................................................... 49
3.6 Regolazione della trascrizione 49
3.7 Traduzione nei procarioti 50
3.7.1 Traduzione nei procarioti nel dettaglio .................................................................................51
3.8 Il codice universale 52
3.9 Traduzione negli eucarioti 53
3.10 Tecnologie usate nei laboratori di biologia molecolare 55

IV Bibliografia e Indice
Bibliografia
Libri 61
Articoli 61

Indice ........................................................................................ 64
7
I
Prima Parte

1 Biologia Cellulare ............................... 11


1.1 Introduzione
1.2 La vita
1.3 La cellula
1.4 Differenze tra cellule procariotiche ed eucariotiche
1.5 La riproduzione nei procarioti e negli eucarioti
1.6 L’albero della vita
1.7 L’evoluzione
1.8 Cenni sull’epigenetica
9
1. Biologia Cellulare

1.1 Introduzione
La biologia cellulare è una disciplina che studia la struttura e la funzione della cellula. In questa capitolo si
tratterà questa materia in modo molto sintetico, tale da fornire uno strumento di base o un ripasso prima di
approfondire i temi dei capitoli successivi. Verranno spiegate, inoltre, le teorie evolutive più famose, alla
luce delle nuove scoperte scientifiche.

1.2 La vita
Non è facile stabilire che cosa sia la vita. Basti pensare che la maggior parte degli scienziati non considera i
virus esseri viventi poiché non sono in grado di interagire con l’ambiente esterno, mentre una percentuale,
seppur minima, di scienziati considera come viventi tutti quegli algoritmi creati in ambienti artificiali
(computer). In molti testi si dà la seguente definizione di vita: “Un ente si definisce vivente quando è in
grado di nascere, crescere, interagire con l’interno e l’esterno, è in grado di auto ripararsi, di evolversi, di
riprodursi e morire”. A mio parere, invece, è molto difficile creare uno spartiacque tra sistemi fisici viventi
e non viventi. La vita ha a che fare con i concetti di entropia, complessità ed informazione. Essa rappresenta
un sistema fisico aperto e non all’equilibrio ed in termini matematici è difficile calcolarne quantitativamente
le proprietà. In alcune situazioni ambientali, se si fornisce una sufficiente energia a specifiche molecole o
sistemi molecolari, è possibile creare dei “semi-replicatori” ossia sistemi fisici capaci di proprietà semi-
replicative. Il problema non è quindi di facile soluzione ma in questo testo utilizzerò il cosiddetto “rasoio
di Occam” cioè sceglierò la via più semplice. Si definisce vita (sul nostro pianeta) tutto ciò che è fornito di
acidi nucleici (DNA e RNA) che gli permettono di replicarsi. Per maggiori informazioni su questo tema
rimando ai lavori di Erwin Schrödinger (Schrödinger, 1944), Arieh Ben-Naim (Ben-Naim, 2015), Addy
Pross (Pross, 2017), Jeremi England (England, 2020), Sean Carrol (Carrol, 2017), John Campbell
(Campbell, 1982), e Paul Davies (Devis, 2019).

1.3 La cellula
La cellula è l’unità fondamentale di tutti gli organismi viventi presenti sulla terra. Non sappiamo se esistano
altre di forme di vita nel nostro sistema solare ma sul nostro pianeta la cellula ha, con caratteristiche diverse,
una struttura generale omogenea. É formata da un involucro esterno, mentre al suo interno si trovano strutture
che sono in grado di mantenerla integra e vivente. Alcuni organismi sono formati da una sola cellula come
i batteri e i protozoi, mentre altri sono riusciti ad evolversi grazie ad un meccanismo in grado di far interagire
milioni (a volte trilioni) di cellule contemporaneamente (organismi pluricellulari).

1.3.1 Due tipi di organismi: Procarioti ed Eucarioti


Ci sono essenzialmente due tipi di cellule e quindi di organismi che dalle cellule derivano: le cellule procari-
otiche e le cellule eucariotiche. Le cellule procariotiche (batteri e archea) sono sempre unicellulari mentre
le cellule eucariotiche possono essere sia unicellulari (protozoi) sia pluricellulari (alghe, spugne, piante,
funghi, anfibi, rettili, uccelli e mammiferi).

• le cellule procariotiche o organismi procariotici (Fig. 1.1) sono strutture apparentemente molto
semplici e sono comparse circa 3.5-3.8 miliardi di anni fa. I batteri e gli archeobatteri sono gli
unici gruppi di organismi procariotici oggi esistenti. I virus non sono organismi procariotici perché
sono solo acidi nucleici (DNA o RNA) ricoperti di proteine.

Figura 1.1: Cellula procariotica.

I procarioti hanno una dimensione che varia da 1 a 5 micron R, con una forma che può variare
notevolmente. Il DNA è circolare e si trova all’interno del citoplasma. Il citoplasma è quella zona della
cellula che si trova all’interno della membrana. Nel citoplasma delle cellule procariotiche non ci sono
strutture complesse che trasformano energia o immagazzinano sostanze chimiche e non esiste
neanche una vera e propria compartimentazione. Ci sono, però, i ribosomi che sono strutture deputate
alla creazione di proteine ed i plasmidi che sono piccoli DNA circolari accessori, distinti dal DNA
cromosomico che è molto più grande. I procarioti, inoltre, sono spesso dotati di ciglia (pili) o flagelli
che sono strutture che permettono la motilità sia in ambiente liquido che terrestre. Come abbiamo già
detto nei procarioti c’è una membrana esterna che separa il citoplasma. Questa membrana è
estremamente complessa se la confrontiamo con l’apparente semplicità dei procarioti. Essa è formata
da una capsula, da una parete cellulare e da una membrana plasmatica:

1. la capsula è una struttura polisaccaridica (polimero di zuccheri). È la struttura più esterna dei
cosiddetti batteri Gram negativi, anche se alcuni Gram positivi ne sono provvisti (Streptococ-
chi). Un modo semplice per ricordare quali organismi siano dotati di capsula è quello di imparare
a memoria la seguente filastrocca inglese: "Even Some Super Killers Have Pretty Nice Big
Capsules". Ogni iniziale di parola di questa frase rappresenta un batterio diverso (Escherichia
coli, Streptococcus pneumoniae, Salmonella, Klebsiella pneumoniae, Haemophilus influenzae,
Pseudomonas aeruginosa, Neisseria meningitidis, Bacteroides fragilis, Cryptococcus neofor-
mans). La capsula, quando è presente, ha poi svariate funzioni: unisce saldamente la parete
cellulare, protegge dai patogeni, promuove l’aderenza alle superfici, previene l’essiccamento e
facilita lo scambio di nutrienti dall’esterno;

2. la parete cellulare è più interna alla capsula. È presente sia nei batteri Gram negativi sia in
quelli positivi ma con alcune differenze (Fig. 1.2). La parete cellulare nei Gram negativi è
formata da un sottile strato di peptidoglicano (polimero di proteine e zucchero) e circondata da
una membrana esterna lipopolisaccaridica (LPS).
1
(1µm = 1/1,000,000 di metro)

11
Capitolo 1. Biologia Cellulare

Figura 1.2: Parete cellulare nei Gram positivi e negativi.

La parete cellulare nei Gram positivi, invece, manca di una membrana esterna ma, in compenso,
presenta numerosi strati di peptidoglicano. I Gram positivi e Gram negativi prendono il
loro nome proprio dal fatto che uno scienziato di nome Christian Gram (1853 - 1938) riuscì
a colorare in modo differente i batteri che stava studiando. Alcuni di questi batteri, a causa
dello strato spesso di peptidoglicano, trattenevano infatti il colore viola scuro di una molecola
chiamata Fucsina mentre gli altri lo legavano più blandamente. Questi ultimi, però, potevano
essere colorati con un colorante rosa chiaro e quindi anch’essi potevano essere visualizzati al
microscopio ottico (Fig. 1.3).

Figura 1.3: Colorazione dei batteri Gram positivi (viola) e negativi (rosa).

3. la membrana plasmatica è formata, invece, da un doppio strato fosfolipidico sul quale si


muovono proteine che hanno diverse funzioni. Le “teste” dei fosfolipidi (idrofiliche, cioè si
legano all’acqua) si trovano a contatto con l’ambiente acquoso dell’esterno ed interno della
cellula, mentre le code (idrofobiche, cioè non si legano all’acqua) si toccano l’una con l’altra
all’interno della membrana stessa che non contiene sostanze acquose. In realtà, tra i procarioti,
non ci sono solo i batteri ma anche un altro gruppo di esseri viventi unicellulari che si chiama
archea. Probabilmente la classe tassonomica degli organismi archea sono i primi procarioti
ad essere comparsi (o arrivati) sulla terra, anche se questo argomento è tutt’ora dibattuto tra gli
scienziati. Un’analisi filogenetica appropriata sul DNA di archeobatteri, batteri ed eucarioti
può facilmente mostrare come questi ultimi siano più simili agli archeobatteri rispetto ad ogni
altra classe di procarioti. Gli archeobatteri vivono in ambienti estremi, sia per quanto riguarda
la temperatura sia dal punto di vista della salinità, pH, etc. La membrana plasmatica degli
archeobatteri è formata anch’essa da fosfolipidi ma i legami chimici tra questi sono più forti,
forse per mantenere una struttura più solida all’interno di ambienti che possiamo considerare
estremi.

• le cellule eucariotiche (Fig. 1.4) sono invece più complesse. Sono dotate di un’alta
compartimentazione del citoplasma dovuta ad una struttura proteica chiamata citoscheletro in cui
sono contenuti numerosi organelli (piccole strutture dotate anch’esse di una membrana esterna).
Presentano unicamente una membrana plasmatica che circonda il citoplasma anche se alcuni di essi
sono dotati di una parete formata da polisaccaridi (specie appartenenti al regno delle piante).

Figura 1.4: Struttura della cellula eucariotica.

Iniziamo col vedere quali sono gli organelli (Fig. 1.5) presenti nel citoplasma delle cellule eucariotiche:

1. Il nucleo è l’organello che contiene il DNA cromosomico. È il più grande della cellula
eucariotica e, come vedremo più avanti, è il parametro che più di ogni altro determina la
grandezza di una cellula. Ha una membrana permeabile che lo separa dal citoplasma. La sua
forma varia da cellula a cellula e da specie a specie. All’interno del nucleo si trova il DNA
raggruppato in un numero di cromosomi specifico per ogni gruppo tassonomico. Il DNA
cromosomico è legato a proteine chiamate istoni che sono coinvolti nella regolazione della
struttura del DNA, dell’attività replicativa e trascrizionale (vedi il capitolo che riguarda la
“Biologia Molecolare”). La membrana nucleare è costituita da una membrana interna ed una
esterna. La membrana interna è legata al DNA cromosomico attraverso una ricca rete di proteine
chiamate proteine della lamina (vedi paragrafo successivo), mentre quella esterna è a diretto
contatto con il citoplasma;

2. Il citoscheletro è un sistema di filamenti citoplasmatici composti da proteine ed è presente in


ogni cellula eucariotica. La sua funziona è quella di sostenere e dare forma alla cellula. Inoltre,
ha la funzione di creare compartimenti specifici nel citoplasma e di agevolare il trasporto di
molecole e macromolecole. Il citoscheletro è formato da microfilamenti, filamenti intermedi
e microtubuli. I microfilamenti sono i filamenti più sottili del citoscheletro, sono formati da
actina ed hanno un diametro che va dai 5 ai 7nmR. Queste strutture, così sottili, hanno
un’attività polare nel senso che sono negativi ad un’estremità e positivi nell’altra. Essi hanno

13
Capitolo 1. Biologia Cellulare

inoltre attività “ATPasica” (legano ATP che è una molecola capace di fornire energia chimica) e
possono legarsi ad altri tipi di proteine allo scopo di ottenere una maggiore capacità di
trasporto.

Figura 1.5: Lista degli organelli nelle cellule eucariotiche

I filamenti intermedi, invece, sono lunghi all’incirca 10 nm e sono molto più resistenti dei
microfilamenti anche se non hanno un’attività polare (cioè non sono carichi a livello
elettrostatico). Essi sono composti da vimentina, desmina, cheratina e lamina. In particolare,
la lamina è una proteina fibrosa che forma la lamina nucleare o nucleoscheletro che ha la stessa
funzione del citoscheletro nel citoplasma ma è presente all’interno del nucleo. I microtubuli
sono, invece, formati dalle proteine alfa e beta tubulina e, oltre a far parte del citoscheletro,
formano anche cilia e flagelli (Fig. 1.6);

(1nm = 1/1,000,000,000 di metro)

Figura 1.6: Struttura dei flagelli nei procarioti Gram negativi (sinistra) ed eucarioti (destra)
3. I flagelli sono strutture che vengono utilizzate dalle cellule per il movimento. Negli eucarioti essi
sono formati da microtubuli ed utilizzano ATP come fonte di energia. Sono ancorati alla
membrana attraverso i corpi basali. Nei procarioti, invece, i flagelli sono composti di flagellina
e presentano uno (nei batteri Gram positivi) o due dischi basali (nei batteri Gram negativi);

4. I mitocondri sono strutture citoplasmatiche deputate alla trasformazione di energia attraverso


la formazione di molecole chiamate ATP. Molte delle funzioni cellulari non avverrebbero senza
l’utilizzo di ATP. L’ATP, infatti, dona un gruppo fosfato ad alcune proteine che vengono così
attivate. L’ATP durante questo processo perde un gruppo fosfato e si trasforma in ADP. È proprio
a livello mitocondriale che l’ADP viene ricaricato e ritrasformato in ATP. All’interno della
cellula si trovano numerosi mitocondri e ciascuno di essi contiene il proprio DNA che viene
chiamato DNA mitocondriale, deputato alla codifica di vari RNA messaggeri che porteranno
alla codifica di varie proteine mitocondriali. A livello di struttura, il mitocondrio si trova nel
citoplasma ed ha la forma di un fagiolo. Esso è circondato da una membrana interna ed una
esterna (Fig. 1.7). Essi sono presenti nelle cellule eucariotiche ma non in quelle
procariotiche.

Figura 1.7: Struttura del mitocondrio

Queste membrane formano le creste mitocondriali e la matrice. La fosforilazione ossidativa,


che è il processo biochimico che porta alla produzione di ATP, avviene nelle creste mitocondriali
dopo che sono avvenuti i processi chiamati glicolisi e ciclo di Krebs. La fosforilazione
ossidativa è, quindi, la fase finale della respirazione cellulare ed esiste anche nei procarioti
ma avviene solo a livello della membrana esterna. Da studi evolutivi sembra che, circa 1.5
miliardi di anni fa, un procariote (probabilmente un alfaproteobatterio) abbia inglobato un
batterio più piccolo (Thrash, 2011). Quest’ultimo si sarebbe poi trasformato in quello che oggi
noi chiamiamo mitocondrio. Per questo motivo ci sono somiglianze tra il DNA mitocondriale e
quello procariotico. Il corrispettivo del mitocondrio nelle piante è il cloroplasto, dove avviene la
fotosintesi clorofilliana. Nel cloroplasto l’energia luminosa viene catturata dalla clorofilla che
permette la trasformazione di CO2 (anidride carbonica) più H2O (acqua) in glucosio (C6H12O6).
Il mitocondrio è comunque contenuto nella cellula vegetale anche se la sua funzione sembra
esulare da quella dal compito che svolge nelle cellule animali. Sembra, infatti, che il DNA del
cloroplasto, di dimensioni maggiori rispetto a quello animale (più di dieci volte), contenga
informazioni importanti per lo sviluppo e differenziamento della pianta (Liberatore, 2016);

5. I ribosomi (Fig. 1.8) sono organuli formati da RNA ribosomiale (rRNA) e da due subunità
proteiche che si trovano nel citoplasma. Ciò significa che questa proteina è, in realtà, un
complesso proteico e nucleotidico, formato da due subunità. Nei procarioti il coefficiente di
sedimentazione (unità di misura che identifica il volume di una proteina) dei propri ribosomi
è 70 perciò il ribosoma si chiama 70S ed è formato da una subunità piccola 30S e da una
più grande 50S. I coefficienti di sedimentazione non sono calcolati algebricamente, infatti

15
Capitolo 1. Biologia Cellulare

le subunità maggiore e minore dei ribosomi eucariotici, rispettivamente 40S e 60S, formano
un complesso proteico che si chiama 80S. Nei ribosomi avviene la traduzione, cioè l’mRNA
(RNA messaggero) che viene trascritto dal DNA è trasformato in proteine. Questa funzione
di lettura dell’mRNA e successivo assemblamento degli amminoacidi cellulari al fine di
formare le proteine è espletata sia dai ribosomi eucariotici sia dai ribosomi delle cellule
procariotiche;

Figura 1.8: Struttura del ribosoma.

6. Il reticolo endoplasmatico (Fig. 1.9) è una struttura proteica che si trova nel citoplasma. È
molto complessa ed è strutturalmente divisa in Reticolo Endoplasmatico Ruvido o RER e
Reticolo Endoplasmatico Liscio o REL. Nel primo si trovano i ribosomi che formano le
proteine, nel secondo avviene la sintesi di lipidi, fosfolipidi e steroidi. La presenza dei ribosomi
sul RER non implica che questi non possano svolgere la loro funzione anche in altri siti
cellulari;

Figura 1.9: Struttura del Reticolo Endoplasmatico.

7. L’apparato del Golgi (Fig. 1.10) è un organello citoplasmatico che ha la funzione di


determinare la struttura tridimensionale delle proteine e dirigerle, anche attraverso delle
vescicole, nei compartimenti specifici;

8. I lisosomi sono piccoli organelli citoplasmatici che contengono enzimi responsabili della
digestione di numerose molecole inutili o dannose per la cellula;

9. I perossisomi sono vescicole che si trovano nel citoplasma e hanno la funzione di demolire
molecole dannose quali i composti analoghi del perossido di idrogeno;

10. I vacuoli sono organelli che si trovano, solitamente, in tutte le cellule vegetali e fungine, così
come in alcuni protozoi. Tipicamente, la loro funzione è quella di immagazzinare acqua e
prodotti di scarto, bilanciare il pH (acidità e basicità) e contribuire a mantenere la pressione
all’interno della cellula stessa;

11. I centrioli (Fig. 1.11) sono complessi proteici presenti nella maggior parte delle cellule animali
e vegetali. Essi hanno lo scopo di creare il fuso mitotico. Il fuso mitotico è una struttura
citoplasmatica composta da microtubuli che serve a legare i cromosomi, permettendo così
un’equa distribuzione dei suddetti cromosomi nelle due cellule figlie durante la divisione
cellulare delle cellule somatiche (mitosi) o delle cellule sessuali (meiosi). Durante la mitosi e
meiosi sono presenti in doppia coppia agli estremi dei poli della cellula e ciascuna coppia
presenta due strutture una ortogonale all’altra da cui si dipanano i microtubuli del fuso
mitotico;

12. I proteosomi sono complessi proteici che sono coinvolti nella scissione di molecole più semplici
(catabolismo) a partire da peptidi. Differisce dai lisosomi per il fatto che questi ultimi hanno
una parete esterna che li separa dall’ambiente circostante in modo tale da poter utilizzare enzimi
litici (enzimi di degradazione) per degradare una grande varietà di molecole organiche.

13.
Figura 1.10: Struttura dell’apparato del Golgi.

Figura 1.11: Struttura del centrosoma e dei centrioli.

17
Capitolo 1. Biologia Cellulare

In conclusione, le maggiori differenze, riassunte anche in Figura 1.12, tra le cellule eucariotiche e procariotiche sono
principalmente queste:
• I procarioti hanno dimensioni che vanno da 0.3 a 2 micrometri, mentre negli eucarioti le dimensioni
vanno da 5 a 100 micrometri, ad eccezione degli spermatozoi;
• Il DNA procariote è circolare, invece quello eucariote è lineare;
• Nei procarioti la trascrizione avviene nel citoplasma (appunto perché non hanno nucleo), invece
negli eucarioti avviene nel nucleo;
• I procarioti hanno ribosomi di dimensioni più piccole rispetto agli eucarioti;
• I procarioti mancano dei numerosi organelli presenti invece negli eucarioti;
• I procarioti si muovono tramite flagelli composti di flagellina mentre gli eucarioti si muovono
tramite flagelli e ciglia formati da tubulina;
• I procarioti si dividono per scissione binaria, gli eucarioti per mitosi (nelle cellule somatiche)
e meiosi (nelle cellule sessuali).
In particolare, la riproduzione nei procarioti corrisponde, generalmente, ad una semplice divisione cellulare
che porta ad avere due cellule figlie identiche alla cellula madre di partenza. Si chiama fissione binaria o
scissione ed è preceduta dalla replicazione del DNA e dalla duplicazione degli organelli e delle strutture
che compongono la cellula procariotica (plasmidi e ribosomi). Ci sono altre forme di riproduzione nei
procarioti quali la gemmazione (dalla cellula madre si forma una gemma che si stacca formando la cellula
figlia), la sporulazione (la cellula madre si divide in un gran numero di cellule figlie) ed altri tipi di divisioni
cellulare meno comuni. La riproduzione degli eucarioti è, invece, più complessa. Negli eucarioti unicellulari
(protozoi) la riproduzione può essere sia asessuata che sessuata. Nel primo caso si chiama mitosi ed è più
complessa della divisione cellulare dei procarioti. Nel secondo caso (riproduzione sessuata) si chiama
meiosi e prevede la formazione di gameti, cioè, di cellule sessuali che hanno la metà del corredo
cromosomico. Dall’incontro di due gameti della stessa specie si viene a formare lo zigote che rappresenta il
nuovo organismo. Negli eucarioti superiori (spugne, funghi, animali e piante) si ha sia la mitosi nelle cellule
somatiche (sangue, muscolo, cuore, etc.) sia la meiosi nelle cellule sessuali (ovuli e spermatozoi). Le varie
fasi della mitosi e della meiosi sono descritte dettagliatamente nella Figura 1.13 e 1.14. Le varie fasi del
ciclo cellulare sono riportate invece in Figura 1.15.

Figura 1.12: Differenze tra procarioti ed eucarioti.


Figura 1.13: Mitosi. Profase: Il DNA si condensa in cromosomi (duplicati); Prometafase: i microtubuli del
centrosoma si uniscono ai cromosomi; Metafase: i cromosomi si allineano al centro della cellula; Anafase: i
cromosomi si separano; Telofase: le due membrane nucleari appaiono attorno al nuovo assetto cromosomico.
Durante la mitosi, quindi, da una cellula con corredo cromosomico 2n se ne ottengono altre due con corredo
cromosomico 2n.

Figura 1.14: Meiosi. Profase I: i cromosomi (duplicati) omologhi (paterni e materni) si appaiano, la membrana
del nucleo scompare e si ha ricombinazione tramite crossing-over (scambio reciproco di DNA tra cromosomi
omologhi) e i microtubuli dei centrosomi si uniscono successivamente ai cromosomi; Metafase I: i cromosomi
si allineano lungo la piastra equatoriale; Anafase I: i cromosomi si muovono verso il proprio polo; Telofase I: i
cromosomi si de-condensano, si riforma il nucleo e gli organelli si duplicano per raggiungere ciascuno le due
cellule che si stanno formando; Profase II: i cromosomi sono visibili ed il nucleo scompare mentre i centromeri
si uniscono ai cromosomi; Metafase II: i cromosomi si allineano sulla piastra equatoriale; Anafase II: i
cromosomi si dividono in cromatidi e si muovono su poli opposti; Telofase II: i cromosomi si de-condensano ed

19
Capitolo 1. Biologia Cellulare

il nucleo riappare. Durante la meiosi, quindi, da una cellula con un corredo cromosomico 2n si arriva a quattro
cellule con corredo cromosomico n.

Figura 1.15: Ciclo cellulare. G1 = crescita cellulare; S = replicazione del DNA; G2 = termine crescita cellulare;
I = Interfase (G1+S+G2); M = mitosi; G0 = stato di quiescenza.

1.4 L’albero della vita


Come abbiamo visto ci sono due tipi cellulari che danno il nome anche a due gruppi di organismi: i
procarioti e gli eucarioti. I procarioti sono unicellulari e formati ovviamente da cellule procariotiche. Sono
gli organismi più semplici e più numerosi sulla terra e si dividono in batteri (Gram positive e Gram negativi)
e archea. Gli organismi eucarioti invece possono essere sia unicellulari (protozoi) sia multicellulari (alghe,
funghi, piante, pesci, anfibi, rettili, uccelli e mammiferi). Studiando il genoma degli organismi viventi è
oggi possibile dimostrare che deriviamo tutti dai procarioti seguendo una linea evolutiva che ancora non si è
fermata (Fig. 1.16).

Figura 1.16: Albero della vita.

1.5 L’evoluzione
La prima idea di evoluzione si ebbe con Anassimandro di Mileto (Censorino, ~3rd AC), un filosofo
presocratico greco che visse intorno al VI secolo AC. Anassimandro elaborò una teoria secondo la quale tutti
i vertebrati derivano dai pesci che, abbandonando il loro ambiente naturale, si sono poi spostati sulla terra
ferma durante il susseguirsi delle ere geologiche. La teoria dell’evoluzione fu però dimenticata per tutta la
durata del periodo classico e del Medioevo. Ci volle l’Illuminismo Francese per riportare in auge l’idea di
evoluzione, con naturalisti come Georges-Louis Leclerc de Buffon (Buffon, 1749 - 1767) e Geoffroy Jean-
Baptiste Lamarck (Lamarck, 1809) e Saint-Hilaire (1829) fino a quando Charles Darwin (Darwin, 1859)
non teorizzò nel 1859 un’ipotesi più chiara e convincente.

1.5.1 Lamarck e l’evoluzione per ereditarietà dei caratteri acquisiti


Jean-Baptiste Lamarck era un botanico ma vinse la cattedra di Zoologia al Museo Nazionale di Storia
Naturale di Parigi. Fu il primo a coniare il termine “biologia” e ad ipotizzare una teoria solida dell’evoluzione.
Questa sua ipotesi venne pubblicata nel 1809 con il nome di “Philosophie Zoologique” (Lamarck, 1809).
Questa teoria prevedeva che le caratteristiche acquisite durante la vita di un organismo (es. il tono muscolare,
il peso, etc.) potessero essere ereditate dalla prole e trasmesse alle generazioni successive. Snobbato e deriso
durante tutto l’arco della propria esistenza fu sepolto in una fossa comune ed i suoi resti sono andati perduti.
La sua teoria non ebbe successo neanche nei periodi a venire ma recentemente è stata rivalutata dopo
l’avvento di una nuova disciplina: l’epigenetica (vedi paragrafi successivi).

1.5.2 Darwin e l’evoluzione per selezione naturale


Charles Darwin era il rampollo di una famiglia di medici Inglesi. Lasciò gli studi per imbarcarsi su di un
battello di nome “Beagle” e viaggiò fino a raggiungere le isole Galapagos (arcipelago di tredici isole
vulcaniche situate nell’Oceano Pacifico, a circa 1.000 chilometri dalla costa occidentale dell’America del
Sud) dove, osservando fringuelli e altri animali, elaborò una teoria evolutiva, secondo la quale tutti gli
individui che presentano caratteri che meglio li predispongono a vivere nel proprio ambiente, trasmetteranno
questi caratteri alla prole, altrimenti soccomberanno alla selezione che la natura attua su ogni organismo
vivente. Il suo famoso libro "L’origine delle specie" (Darwin 1859), pubblicato nel 1859, fu, fin da subito,
quello che oggi chiameremo un “best-seller”. La sua teoria è tuttora accettata anche se l’avvento
dell’epigenetica pone domande sempre più frequenti ed insistenti. La storia dell’evoluzione nel pensiero
umano è molto articolata e ci sono interi volumi su questo argomento. Un libro molto interessante e completo
sull’evoluzione è “La struttura dell’evoluzione” pubblicato nel 2003 da Stephen Jay Gould (Gould, 2002).

1.6 Cenni sull’epigenetica


L’ambiente esterno può influire sulla funzionalità dei geni e queste caratteristiche, così acquisite, possono
essere ereditate. Purtroppo, gli studi che indagano su come i fattori ambientali possano influenzare la genetica
di un individuo sono difficili da pianificare in laboratorio. Tuttavia, numerose ricerche sono state eseguite
in questo ambito. Per esempio, alcuni scienziati Svedesi hanno recentemente condotto indagini atte ad
esaminare se la nutrizione possa influenzare il tasso di mortalità associata a malattie cardiovascolari e
diabete e se questi effetti possano essere trasmessi dai genitori ai loro figli e nipoti (Kaat, 2002; Bastian
2008). Attraverso i dati ottenuti su tre generazioni di famiglie a partire dal 1890, questi ricercatori hanno
evidenziato come la mancanza di cibo nei genitori durante un periodo critico dello sviluppo, cioè appena
prima della pubertà, fosse stata in grado di prevenire la possibilità di sviluppare malattie cardiovascolari
nella prole ma aumentarne altre come il diabete. Questi risultati evidenziano come la dieta possa causare
cambiamenti nell’espressione genica ereditabili nelle successive generazioni e, in generale, come
l’epigenetica sia in grado di modificare gli organismi adattandoli all’ambiente circostante nel breve periodo.
Solitamente queste trasformazioni sono ereditabili per poche generazioni.

1.6.1 Definizione moderna di Epigenetica

Sotto il nome di epigenetica, quindi, si intendono tutte quelle modificazioni chimiche del DNA che non ne
cambiano la sequenza. L’epigenetica si attua attraverso la metilazione diretta di alcune basi specifiche del
DNA (C e G) o attraverso le modificazioni istoniche (metilazione, acetilazione, ubiquitinizzazione, etc.).
Gli istoni sono proteine che sono legate costantemente al DNA ed hanno una funzione sia strutturale, sia
regolatoria (vedi paragrafi successivi “Metilazione diretta del DNA” e “Modificazioni Istoniche”).

Metilazione diretta del DNA


La metilazione del DNA è un processo chimico attraverso il quale un gruppo metile viene legato ad alcune
basi azotate, o nucleotidi, del DNA. Il DNA è composto di quattro nucleotidi Adenina (A), Timina (T),
Citosina (C) e Guanina (G). La metilazione è altamente specifica ed avviene in regioni in cui il nucleotide
Citosina si trova vicino al nucleotide Guanina (4-6). Questi siti, detti CpG islands (isole di CpG), sono

21
Capitolo 1. Biologia Cellulare

metilati da uno dei tre enzimi chiamati DNA metiltransferasi (DNMTs). L’inserimento di gruppi metilici
cambia la struttura del DNA, modificando le interazioni di un gene con la macchina trascrizionale. La
metilazione del DNA può essere usata per distinguere quale copia del gene è ereditato dal padre e quale
dalla madre. Questo fenomeno biologico, noto come imprinting, viene utilizzato dalle cellule per silenziare
alcuni geni o intere regioni cromosomiche. In generale la metilazione inibisce l’espressione dei geni
presenti all’interno della molecola di DNA (Lewin, 2012).

Modificazioni istoniche
Le modificazioni istoniche sono modificazioni chimiche che intervengono non direttamente sul DNA ma sulle
proteine che lo circondano (istoni). A seconda del tipo istoni modificati, il DNA può essere piò o meno
espresso durante il ciclo cellulare e lo sviluppo.

1.6.2 L’epigenetica come causa del cancro


La prima malattia umana identificata come correlata all’epigenetica è stata il cancro. I primi studi
evidenziarono come il DNA dei tessuti malati, ottenuto da pazienti con tumore del colon-retto, avesse un
grado di metilazione minore se confrontato con il DNA dei tessuti normali degli stessi pazienti (Feinberg,
1983; Jones, 2002; Grønbaek, 2007). Poiché i geni metilati sono in genere disattivati, la perdita di
metilazione del DNA può causare un’attivazione di alcuni geni. D’altra parte, un’eccessiva metilazione può
annullare l’espressione di quei geni protettivi chiamati oncosoppressori.

1.6.3 L’epigenetica come causa del ritardo mentale


La Sindrome dell’X fragile è la disabilità mentale più frequentemente ereditata soprattutto nei maschi.
Entrambi i sessi possono essere colpiti da questa condizione, ma poiché i maschi hanno un solo cromosoma
X, un disturbo epigenetico su questo cromosoma nel sesso maschile risulta essere più grave. In effetti, la
sindrome dell’X fragile si verifica su un maschio ogni 4.000, mentre nelle femmine si verifica una volta su
8.000. Le persone con questa sindrome hanno gravi disabilità intellettive, sviluppo verbale ritardato ed il
caratteristico comportamento autistico (Raspa, 2017). Nei pazienti affetti da questa patologia, il cromosoma
X appare ristretto nella zona in cui avviene la mutazione epigenetica. Di norma il gene FMR1 contiene tra
sei e 53 ripetizioni del codone CGG. Negli individui affetti dalla sindrome dell’X fragile, il gene FMR1
contiene circa 230 ripetizioni della tripletta CGG. Questo provoca la metilazione e conseguente inibizione
a livello di espressione genica a livello di questa zona ed il silenziamento dell’espressione del gene FMR1.
La Sindrome dell’X Fragile non è l’unico disturbo associato a ritardo mentale che coinvolge modificazioni
epigenetiche. Altre condizioni includono: il disordine di Rubenstein-Taybi, Coffin-Lowry, Prader-Willi,
Angelman, Beckwith-Wiedemann, ATR-X, e le sindromi chiamate di Rett.

1.6.4 L’epigenetica e l’evoluzione degli organismi viventi


I Neo-Darwinisti considerano come unità fondamentale dell’eredità il gene che è il bersaglio del
meccanismo dell’evoluzione attraverso la selezione naturale. Essi uniscono in un’unica teoria le idee di
Charles Darwin con quelle di un suo contemporaneo Gregor Mendel (il padre della genetica) e di altri
autori contemporanei. Secondo questa ipotesi l’evoluzione avviene a causa di mutazioni che portano a
cambiamenti nella frequenza degli alleli (stesso gene rappresentato o dal cromosoma materno o da quello
paterno) a causa della deriva genetica (variazione delle frequenze geniche di una popolazione dovuta
unicamente al caso) o della selezione naturale. Richard Dawkins è uno degli scienziati più prolifici nel
campo delle teorie Neo-Darwiniste ed una delle sue teorie più famose afferma che l’unica vera entità su cui
agisce la selezione naturale è il gene come fulcro dell’evoluzione e non il fenotipo. Richard Dawkins non
tenne però conto del fatto, nel periodo storico durante il quale scrisse il suo lavoro principale (Dawkins,
2003), che i geni sono solo il 2% del nostro DNA mentre il resto del genoma svolge un’attività regolatoria
molto importante (microRNA, enhancers, insulators, long non-coding RNA, etc.). Pertanto oggi non
possiamo ritenere i soli geni come gli attori principali dell’evoluzione; pensiamo per esempio
dell’importanza che i trasposoni rivestono (vedere capitolo successivo) nell’ambito evolutivo. Inoltre,
sempre più articoli scientifici mostrano come l’ambiente possa agire sul DNA attivandolo o silenziandolo
attraverso l’epigenetica e che queste modificazioni sono ereditabili, almeno per alcune generazioni.
23
II
Seconda Parte

2 Genomica.................................... 27
2.1 Un po’ di storia
2.2 Il DNA
2.3 Vari tipi di strutture di DNA
2.4 L’RNA
2.5 Il valore C ed il suo paradosso
2.6 Il contenuto di GC nei genomi
2.7 La seconda legge di Chargaff e le regole di
Szybalski e Sinclair
2.8 La composizione del genoma umano
25
2. Genomica

2.1 Un po’ di storia


Johann Gregor Mendel (Mendel, 1865), era un monaco Agostiniano vissuto al tempo dell’Impero
Asburgico ed è oggi considerato il padre della Genetica. Per Genetica, oggi intendiamo l’insieme di tutte
quelle leggi che descrivono l’ereditarietà mentre la Biologia Molecolare è considerata quella branca delle
scienze della vita che si sofferma sui meccanismi molecolari che sottintendono a tutti i processi cellulari.
Mendel, però, non fu il primo a notare che i caratteri fenotipici (caratteristiche morfologiche) dei genitori si
trasmettevano ai figli, ne abbiamo già una prova nel “De Rerum Naturae” scritto da Lucrezio scritto nel I
secolo AC (Lucrezio, first century BC). Quello che fa di Mendel un genio è il fatto che fu il primo uomo a
creare un modello matematico che riusciva a descrivere la trasmissione ereditaria. Ovviamente, utilizzò dei
caratteri genetici sui cui era possibile effettuare semplici calcoli probabilistici come, per esempio, il colore
dei piselli e la loro rugosità. In realtà, i caratteri genetici che oggi chiamiamo “Mendeliani”, e su cui si
applicano le famose “leggi di Mendel” (Mendel, 1865), non sono molti ed infatti il buon Gregor scelse quelle
caratteristiche che più si adattavano al calcolo matematico. Purtroppo, nessuno capì la portata del suo lavoro
e, nell’oscurità della sua cella monastica, morì di nefrite acuta nel 1884. Neppure Charles Darwin, il
naturalista ideatore dell’ipotesi dell’evoluzione per selezione naturale (Darwin, 1859) aveva, probabilmente,
mai letto il lavoro di Mendel seppure fossero vissuti entrambi nello stesso periodo storico. Trentacinque
anni dopo la morte del monaco, l’olandese Hugo de Vries, il tedesco Carl Correns, l’americano William
Jasper Spillman e l’austriaco Erich von Tschermak giunsero alle stesse conclusioni di Mendel e portarono
alla luce i suoi scritti. Da quel momento in poi fu chiaro che, all’interno di ogni organismo vivente, c’era
una sostanza che trasmetteva i caratteri genetici in modo metodico ed organizzato. Nel 1909 il botanico
Wilhelm Johannsen (Johannsen, 1909) chiamò questa sostanza gene. In effetti, oggi sappiamo che ogni unità
vivente (la cellula) è come un piccolo universo autosufficiente capace di crescere, auto-ripararsi, scambiare
informazioni con l’ambiente, evolvere, replicarsi e morire. All’interno di quasi ogni cellula (alcune non
hanno queste caratteristiche) c’è una molecola chiamata DNA che porta l’informazione genetica, utile a
trasmettere i caratteri genetici alle generazioni future in maniera quasi perfetta (le mutazioni, a volte positive
ed altre volte negative, hanno una frequenza che varia da specie a specie). Inoltre, il DNA porta alla
formazione di una molecola chiamata RNA, che a sua volta crea le proteine, che sono le strutture principali
che formano la cellula. Il termine genoma fu coniato per la prima volta da Hans Winkler nel 1920 per
motivi che non conosciamo. Lederberg e McCray nel 2001 hanno proposto l’ipotesi che Winkler unì la
parola gene con quella di cromosoma o con il suffisso greco “ome” che significa unità (Stencel & Crespi,
2013). Oggi per genoma intendiamo il DNA aploide (cioè il corredo cromosomico delle cellule sessuali)
che risiede in un comparto cellulare che si chiama nucleo e che è impacchettato in strutture a sé stanti
chiamate cromosomi. Negli organismi superiori, metà dei cromosomi vengono dalla madre e l’altra metà
dal padre. Nell’uomo, per esempio, ci sono 46 cromosomi nel nucleo di ogni cellula, di cui 23 vengono dal
padre e 23 dalla madre (Fig. 2.1). Ogni cellula di un organismo, quindi, ha lo stesso contenuto di DNA.
In particolare, in ciascun tessuto (es. il muscolo) si ha l’attivazione selettiva di un gruppo di geni, cosicché
questi ultimi possono essere attivati in un tipo cellulare ma non in un altro. I meccanismi che sottintendono
all’attivazione e disattivazione degli elementi genomici, che vanno sotto il nome di regolazione genica, sono
in realtà molto complessi ed ancora molto rimane da chiarire. Tornando alla storia delle scienze della vita, ci
sono alcune tappe fondamentali che occorre ricordare per capire meglio come si è arrivati a comprendere la
struttura del genoma. Nel 1869 Friedrich Miescher scoprì che nel nucleo esistesse una sostanza ricca di
fosforo che non poteva essere una proteina a causa delle sue dimensioni e la chiamò nucleina (Gregory,
2002). Nel 1879 Walther Flemming riuscì a colorarla e la chiamò cromatina (Gregory, 2002). Nel 1888
Wilhelm Waldeyer riuscì a colorare alcune strutture nucleari che si presentavano a bande e le chiamò
cromosomi (Gregory, 2002). Nel 1915 Thomas Hunt Morgan pubblicò un libro (Morgan, 1905) dove
dimostrò la presenza dei geni all’interno dei cromosomi attraverso uno studio sugli incroci nella specie
Drosophyla Melanogaster (moscerino della frutta). Questo lavoro gli valse il premio Nobel per la medicina
nel 1933. Altri studi genetici, portati avanti da altrettanti scienziati, si susseguirono fino a quando, nel 1930,
il nome nucleina diventò acido desossiribonucleico (DNA). Negli anni successivi Erwin Chargaff
(Chargaff, 1950) scoprì che il numero di basi azotate che formano il DNA avevano una proporzione del tipo:
numero Adenine (A) = numero Timine (T) e numero Citosine (C) = numero Guanine (G). Questa legge va
sotto il nome di I legge di Chargaff. Il famoso biochimico britannico non capì che questa regolarità era
causata dalla struttura a doppia elica del DNA (Fig. 2.2). Questa molecola è formata come un binario di un
treno, in cui i binari sono fatti di zucchero fosfato, mentre le barre interne sono le basi azotate che si
accoppiano reciprocamente a due, a due (A con T e C con G). Per questo motivo non ricevette il premio
Nobel. Oswarld Avery, Maclyn McCarty, and Colin MacLeod nel 1944 e Alfred Hershey and Martha
Chase (1952) dimostrarono, invece, che era il DNA a trasmettere l’informazione genetica (Gregory, 2002).
Ora, rimaneva da capire che struttura avesse il DNA che, negli organismi superiori, era impacchettato con
varie proteine e formava i cromosomi nucleari. Le proteine sono strutture che derivano dalla traduzione del
RNA (che deriva dalla trascrizione del DNA) e sono formate da amminoacidi. Esse sono le unità costitutive
della cellula.

Figura 2.1: Corredo cromosomico umano. Ogni cromosoma consta di due copie: una copia paterna ed una copia materna.
Queste copie sono simili ma non perfettamente identiche. I cromosomi sessuali nell’essere umano si chiamano X ed Y.
Il corredo cromosomico femminile presenta due cromosomi X (di cui uno è parzialmente inattivo), mentre il cromosoma
maschile possiede i cromosomi sessuali X e Y.

27
Capitolo 2. Genomica

Figura 2.2: Struttura chimica del DNA. La molecola di DNA è un filamento a doppia elica. Se ipoteticamente
svolgessimo il DNA in forma lineare otterremmo una forma costituita da due binari paralleli di zucchero (desossiribosio)
collegati tra loro da basi azotate o nucleotidi chiamati Adenina (A), Timina (T), Citosina (C) e Guanina (G). La Timina
è sempre legata all’Adenina mentre la Citosina è sempre legata alla Guanina.

2.2 Il DNA
La struttura del DNA venne compresa da tre giovani inglesi James Watson, Francis Crick e Maurice
Wilkins. Nel 1953, pubblicarono un articolo (Watson & Crick, 1953; Wilkins, 1953; Franklin, 1953) sulla
rivista “Nature” che cambiò il corso della storia della biologia e della medicina. Il loro contributo fu
supportato dai dati ottenuti della ricercatrice Rosalind Franklin che aveva analizzato il DNA con i raggi X
(Franklin, 1953). Purtroppo, Rosalind Franklin non ricevette il Nobel al contrario di Watson, Crick e
Wilkins (Watson & Crick, 1953; Wilkins, 1953). Morì, infatti, di cancro nel 1958 all’età di 37 anni
(Maddox, 2003) qualche anno prima del conferimento del Nobel (1962). I suoi meriti vennero compresi
solo più tardi (Fig. 2.3).

2.3 Vari tipi di strutture di DNA


Ci sono vari tipi di molecole di DNA classificate in base alla loro struttura (Fig. 2.4):
• B-DNA è la forma destrorsa più tipica e comune;
• A-DNA ha una struttura a forma di spirale destrorsa ed è presente in condizioni non fisiologiche,
come per esempio in situazioni di disidratazione;
• Z-DNA ha una struttura a spirale sinistrorsa che si forma quando si hanno modificazioni chimiche
come la metilazione. La presenza della forma Z è stata dimostrata quasi esclusivamente in vitro.

Altre forme ottenute in vitro sono il DNA di tipo C, D, E, H, L, e P.

2.4 L’RNA
L’RNA è una molecola (acido ribonucleico) molto simile al DNA ma si distingue da esso perché è a singolo
filamento e la Timina (T) è sostituita dall’Uracile (U). L’RNA viene sintetizzato a partire dal DNA
(trascrizione). L’RNA serve, poi, da stampo per la sintesi delle proteine (traduzione). L’RNA può essere
di vari tipi: mRNA o RNA messaggero, rRNA o RNA ribosomiale, e tRNA o RNA transfer. L’mRNA è
l’RNA che farà da stampo a tutte le proteine, l’rRNA è l’RNA che compone i ribosomi, mentre il tRNA è
l’RNA che trasporta gli amminoacidi che serviranno per la sintesi delle proteine (vedi il paragrafo
“Traduzione” nel capitolo sulla “Biologia Molecolare”).
Figura 2.3: Rosalind Franklin e la struttura del DNA ai raggi X. In alto, metodo di diffrazione ai raggi X per determinare
la struttura del DNA. In basse a sinistra, foto di Rosalind. In basso a sinistra, prima foto della struttura del DNA pubblicata
sulla rivista “Nature” nel 1953 da Watson e Crick.

Figura 2.4: Vari tipi di strutture di DNA. Un Angstrom è pari a un decimiliardesimo di metro.

L’rRNA è sintetizzato dalla proteina RNA polimerasi I, l’mRNA è sintetizzato dalla proteina RNA
polimerasi II, mentre il tRNA è sintetizzato dalla proteina RNA polimerasi III. Parleremo in dettaglio
dell’RNA nel capitolo sulla “Biologia Molecolare”.

29
Capitolo 2. Genomica

2.5 Il valore C ed il suo paradosso


Se analizzassimo le dimensioni dei genomi dei mammiferi potremmo notare che, in generale, esse non variano
significativamente tra le specie. Negli anfibi e pesci, invece, la situazione è differente. Il DNA nucleare della
rana Limnodynastes ornatus, per esempio, è 120 volte più piccolo di quello della salamandra Necturus
lewisii, mentre il pesce Africano Protopterus aethiopicus possiede un genoma che è 350 più grande di
quello del pesce palla Tetraodon nigroviridis. Ci sono altri esempi di questo tipo anche all’interno dello
stesso gruppo tassonomico. Un meccanismo molto molto efficace attraverso cui una specie amplifica il
proprio corredo cromosomico è la poliploidia. In pratica, l’intero genoma può essere duplicato, triplicato,
etc. Può, addirittura, accadere che un genoma di una specie diversa venga incluso nel proprio (specie vegetali).
Per esempio, due specie vegetali selvatiche diploidi Aegilops speltoides e Triticum urartu hanno formato,
nel corso dell’evoluzione, un ibrido tetraploide (Triticum durum) la cui sottospecie si sarebbe
successivamente unita ad un’altra pianta selvatica (Aegilops tauschii), diventando così il frumento tenero
esaploide (sei copie per ogni cromosoma). Tra gli animali, la poliploidia è comune solo nei pesci ed anfibi,
mentre è rara in altri gruppi tassonomici. Altri meccanismi biologici che possono trasformare le dimensioni
di un genoma sono le duplicazioni segmentali di sequenze ripetute, le duplicazioni geniche e l’attività dei
retrotrasposoni LTR. Questi ultimi sono elementi genomici che sono in grado di copiare se stessi
spostandosi all’interno dei cromosomi. I primi studi relativi alla quantità di DNA presenti in una cellula
risalgono ai primi anni ’50. Hewson Swift (Gregory, 2002), nel tentativo di dimostrare che tutte le cellule
avevano la stessa quantità di DNA, trovò, infatti, che la quantità di materiale genetico delle cellule somatiche
era il doppio di quelle sessuali. Il valore che chiamò C, che esprimeva la quantità di DNA aploide (DNA delle
cellule sessuali), è ora utilizzato per descrivere le dimensioni di un genoma di un particolare organismo. Per
esempio, il valore di C nell’uomo è di 3.3. Questo significa che il numero di basi (bp) del genoma umano
aploide è di 3.3 miliardi di basi azotate, circa. Nel 1951, quando la struttura del DNA non era stata ancora
compresa, i ricercatori Alfred Mirsky e Hans Ris (Gregory, 2002) scoprirono che qualcosa di strano era
accaduto durante l’evoluzione. Osservarono, infatti, che la quantità di DNA presente nel nucleo delle cellule
della salamandra (anfibio) era 70 volte maggiore di quella di organismi molto più evoluti. Come era
possibile? La salamandra aveva 70 volte il numero dei geni rispetto all’uomo? La complessità biologica di
un organismo non era quindi proporzionale al numero di geni? Il paradosso non venne compreso fino al
1990 quando si iniziò a sequenziare i genomi degli organismi. In realtà, la situazione è stata compresa meglio
solo dopo il 2001, anno del sequenziamento del genoma umano attraverso le moderne tecniche di “Next
Generation Sequencing” (Sequenziamento di Nuova Generazione). La percentuale di geni in un genoma
è, infatti, molto bassa (1.5% circa) e più o meno tutti i mammiferi, se raggruppati per taxa (unità
tassonomiche), hanno lo stesso numero di geni (20-30,000). Tutto il resto del genoma ha probabilmente
un’attività regolatoria e, anche se la maggior parte del DNA è trascritto in RNA (non-coding RNA), solo
una piccola percentuale di esso dà luogo alla sintesi di proteine. Nel 2013 Ganqiang Liu, John S. Mattick,
e Ryan J. Taft (Liu, 2013) hanno mostrato che il rapporto tra non-coding RNA e la dimensione totale del
genoma correla positivamente con la complessità biologica di un organismo o gruppo tassonomico (Fig.
2.5). Quindi, nella scala evolutiva costruita su questo rapporto vediamo prima comparire archea e batteri
(entrambi procarioti), poi gli eucarioti unicellulari, le piante, i rettili, gli uccelli ed i mammiferi. I dati del C
value per ogni specie possono essere scaricati dal sito web “Animal Genome Size Database” e “Plant DNA
C-values Database”. Le dimensioni di un genoma, per motivi storici, sono sempre state calcolate nelle cellule
eucariotiche (cellule che dispongono di vari organelli e di nucleo che contiene il DNA) come massa in
picogrammi (pg)R. Un motivo per cui alcune specie aumentano di volume il proprio genoma è probabilmente
per resistere alle mutazioni quando l’ambiente diventa mutageno. Questa teoria fu ipotizzata per la prima
volta da Patrushev e Minkevich nel 2009 (Gregory, 2002). Richard Dawkins (Dawkins, 2003) alla fine
degli anni ’70 ipotizzò, invece, che i geni vengono trasmessi da una generazione all’altra solamente per
continuare ad essere replicati e non necessariamente per fare sopravvivere l’organismo che li ospita (teoria
del gene egoista). Questo processo biologico porterebbe, quindi, ad un aumento della dimensione del
genoma. Un picogrammo è uguale ad un millimiliardesimo di grammo (1 pg = 10−12 g) e corrisponde,
approssimativamente, ad un miliardo di basi. Dolozel et al. nel 2003 (Gregory, 2002) hanno calcolato che
il numero di basi è uguale alla massa in picogrammi moltiplicata per 0.978 e 109.
9
( n.basi = massa in pg x 0.978 x 10
Figura 2.5: Percentuale di non-coding DNA (NC/TG) per ogni gruppo tassonomico. NC = DNA non codificante
(non-coding DNA), TG = Genoma Totale.

2.5.1 Meccanismi che aumentano o diminuiscono le dimensioni di un genoma


Solo ultimamente è stato possibile capire i meccanismi che hanno portato il DNA ad accumularsi o a diminuire
all’interno del genoma. Il primo genoma venne sequenziato nel 1977 (Batteriofago MS2) con una tecnica
chiamata Sanger (dal nome del suo inventore e duplice premio Nobel), mentre il primo genoma procariote
fu sequenziato nel 1995 (Haemophilus influenzae). Nel 1997 fu la volta dell’eucariote Saccharomyces
cerevisiae (lievito) e nel 1998 si sequenziò il primo organismo multicellulare Caenorhabditis elegans
(nematode). Dal 2001, anno del sequenziamento del genoma umano, migliaia di genomi batterici e virali e
qualche centinaio di eucarioti, compresi i mammiferi, sono stati sequenziati. Tornando ai meccanismi che
permettono la variazione del valore C, i primi elementi cromosomici scoperti in grado di trasformare la
grandezza di una molecola di DNA sono alcune sequenze mobili presenti nei genomi eucariotici che si
chiamano trasposoni (TEs). I trasposoni conferiscono ai cromosomi una certa plasticità. La loro presenza
nei procarioti, invece, non è del tutto chiarita. Come abbiamo già detto, nel 1976 Richard Dawkins
(Dawkins, 2003) ipotizzò che nel genoma ci fosse del DNA parassita che si trasmetteva di generazione in
generazione, da specie a specie, aumentandone la dimensione dei cromosomi. Nel 1980 Doolittle, Sapienza
e, successivamente Orgel e Crick (Gregory, 2002), elaborarono una teoria sostenendo che i principali
responsabili delle variazioni genomiche fossero gli eventi di duplicazione. Questa teoria ipotizzava che tutti
i genomi tendessero ad aumentare il numero di paia di basi azotate fino a quando la pressione selettiva glielo
permetteva. Non bisogna, poi, dimenticare i pseudogeni ed il loro ruolo nella variazione del valore C. Essi
erano considerati, fino a poco tempo fa, DNA spazzatura (junk DNA). Questo termine fu coniato da Ohmo
e Yomo nel 1992 che immaginavano i pseudogeni come le vestigia di antichi geni (garbage DNA)
codificanti per proteine oramai inutilizzate dalla cellula eucariotica. Purtroppo, per molto tempo, il termine
“junk or garbage DNA” è stato associato a tutte quelle regioni del genoma non codificante, con il tentativo
di sminuirne il ruolo. Shalabina e Spiridonov nel 2004 hanno, però, scoperto che almeno il 45% del DNA
è trascritto in RNA anche se non codifica per proteine. Ora sappiamo che queste sequenze hanno un’attività
regolatoria (microRNA o miRNA, piRNA, long non-coding RNA, circRNA, etc.). Nel 2012, il consorzio
ENCODE ha affermato che almeno l’80% del DNA umano è trascritto in RNA ed ha un’attività
funzionale nella cellula. Anche gli introni contribuiscono alle variazioni di dimensioni del genoma. Gli
introni sono quelle sequenze di DNA che, dopo la trascrizione (formazione dell’RNA), vengono eliminate
dall’mRNA che è il prodotto finale che fa da stampo alle proteine. Nell’uomo gli introni costituiscono il
26% del genoma totale (vedi il sito dell’International Human Genome Sequencing Consortium, 2001). Ci
sono poi meccanismi a livello di interi cromosomi che possono aumentare o diminuire la dimensione di un
genoma. In particolare, la duplicazione o la perdita di singoli cromosomi si chiama aneuploidia ed è spesso
associata ad effetti fenotipici dannosi. Inoltre, segmenti di cromosomi possono unirsi ad altri e durante la
31
Capitolo 2. Genomica
successiva divisione cellulare, alcune zone possono essere incluse o eliminate dal genoma. Anche la fusione
di interi cromosomi è possibile ma questo non porta di per sé ad un aumento nel genoma a meno che non si
verifichino eventi di duplicazione o riarrangiamenti cromosomici vari. Un classico esempio è la fusione
di due cromosomi ancestrali nel cromosoma 2 umano avvenuta durante l’evoluzione dei primati. Questa
ipotesi è nata dall’osservazione che genoma dello scimpanzé presenta 48 cromosomi (come molti primati)
rispetto ai 46 umani (Yunis & Prakash, 1982). Altre differenze tra i genomi umani e quello dello scimpanzé
sono la presenza, nell’uomo, di un maggior numero di elementi trasponibili, anche se il genoma dello
scimpanzé ha un genoma più grande (C=3.75). Durante la divisione cellulare delle cellule sessuali e delle
cellule somatiche o asessuali ci possono essere scambi di DNA tra cromosomi fratelli (es: il cromosoma 2
materno con il cromosoma 2 materno, etc.). Questo meccanismo, chiamato “crossing-over” o
“ricombinazione”, può essere ineguale tra i cromosomi, portando ad aumentare o diminuire le dimensioni
del genoma. Può capitare, infatti, che il “crossing-over” coinvolga le regioni terminali ripetute di alcuni
trasposoni chiamati LTRs, che, di solito, vengono eliminate. Anche gli eventi di riparo del DNA, di solito,
portano a perdite di materiale genomico.

2.6 Il contenuto di GC nei genomi


Vinogradov e colleghi hanno studiato alla fine degli anni ’90 il genoma di 154 tra pesci, anfibi, rettili, uccelli
e mammiferi trovando che il contenuto totale delle Guanine e delle Citosine correlava positivamente con la
dimensione totale del genoma (Gregory, 2002). Con il termine GC si intende la percentuale delle Guanine
e Citosine. Nei rettili e anfibi il contenuto di GC è maggiore rispetto a quello dei mammiferi, mentre nei
pesci ossei la correlazione con le dimensioni del genoma risulta addirittura negativa. Nei genomi dei batteri
la percentuale di GC è molto variabile ma è in media il 46%. Nel genoma umano, invece, è del 42%.

2.7 La seconda legge di Chargaff, la regola di Szybalski e Sinclair


Come abbiamo visto, la prima legge di Chargaff (Chargaff, 1950) dimostra che le Adenine si appaiano con
le Timine e che le Citosine si appaiano con le Guanine sul filamento opposto di una molecola di DNA.
Quindi, il numero di Adenine su un filamento di DNA è uguale al numero di Timine sul filamento opposto
e lo stesso vale per Citosine e Guanine. Chargaff, però, scoprì che anche sui singoli filamenti il numero di
Adenine è pressoché identico al numero di Timine (A =˜ T) ed il numero di Citosine è quasi uguale a quello
delle Guanine (C =˜ G). Questa corrispondenza è chiamata la seconda regola di Chargaff (Rudner_a, 1968;
Rudner_b, 1968; Karkas, 1968). Recentemente (Fariselli & Taccioli, 2020), alcuni ricercatori hanno
suggerito che questa conformazione nucleotidica sia la più probabile (massima entropia) e quella che
permette una maggiore stabilità strutturale al DNA, in quanto caratterizzata da un’energia più bassa (energia
libera di Gibbs). I loro modello matematico predice, infatti, perfettamente le osservazioni riscontrate sui
genomi di tutti organismi viventi. La seconda legge di Chargaff estende la sua validità sia su singoli
cromosomi, sia su interi genomi ma non vale per i mitocondri animali e per alcuni virus a singolo filamento
di DNA o RNA. Ci sono altre regole che potrebbe derivare o essere in qualche modo correlate alla seconda
legge di Chargaff. Il chimico Szybalski (Szybalski, 1966), nel 1966, per esempio, notò che nei virus le
regioni genomiche “codificanti” contenevano, sul singolo filamento, più purine che pirimidine e questa
regola biologica sembra essere valida per tutti gli organismi viventi. Bisogna, però, considerare il fatto che
ci sono proprietà matematiche intrinseche nelle sequenze genomiche che non dipendono da processi
evolutivi o mutazionali. Per esempio, il numero totale di di-nucleotidi in una sequenza genomica circolare
è uguale alla somma totale dei singoli tipi di di-nucleotidi (che sono 16) ed è indipendente da ogni evento
evolutivo, ma intrinseco nelle regole matematiche che riguardano le sequenze circolari. Queste regole, e
molte altre, sono state esposte nel 2015 da Sinclair (Sinclair, 2015) che ha dimostrato, inoltre, come nei
genomi circolari le frequenze di di-, tri- e tetra-nucleotidi possano essere calcolate come somme e differenze
semplici.

2.8 La composizione del genoma umano


Il genoma umano è senza dubbio il genoma più studiato ed è molto simile alla maggior parte dei mammiferi
per quanto riguarda la sua composizione. In Figura 2.6 si può notare che la percentuale del DNA che codifica
per le proteine è molto basso (circa 1.5%) mentre il 45% è composto da trasposoni (LINEs, SINEs,
trasposoni LTR e trasposoni a DNA). I trasposoni sono elementi mobili del DNA e sono la possibile causa di
malattie ma anche il motore dell’evoluzione. Recentemente i trasposoni sono stati associati a speciali funzioni
a livello del sistema nervoso centrale e dello sviluppo embrionale (Robertson, 2002; Egger, 2004).

Figura 2.6: Composizione del Genoma Umano.

2.8.1 Trasposoni
I trasposoni sono sequenze di DNA che si muovono all’interno del genoma. Furono scoperti da Barbara
McClintock ( McClintock, 1950) negli anni ’50 che ricevette il premio Nobel per la Fisiologia e la Medicina
solo nel 1983 proprio per l’identificazione degli elementi trasponibili. I trasposoni vengono classificati a
seconda del metodo con cui si spostano lungo i genomi:
• Classe 1 o retrotrasposoni: i retrotrasposoni vengono copiati in una nuova di regione del genoma
attraverso la retrotrascrizione da RNA a DNA e conseguente copia del DNA in una nuova sede
cromosomica (es.: LINE e SINE). I LINE possiedono l’informazione per la trascrizione e traduzione
di una propria retrotrascrittasi mentre i SINE utilizzano l’enzima dei LINE per replicarsi o, in alcuni,
casi l’RNA polimerasi III cellulare.
• Classe 2 o trasposoni a DNA: i trasposoni a DNA non vengono copiati in un’altra sede, ma tagliati
ed incollati in una nuova regione genomica. Gli enzimi che intervengono sono le trasposasi (proteine
che tagliano sequenze nucleotidiche). È necessario, comunque, sottolineare che alcuni trasposoni a
DNA vengono anch’essi copiati ed incollati come i retrotrasposoni.

2.8.2 I microRNA
I microRNA (miRNA) sono RNA che non codificano per nessuna proteina ma hanno un’attività regolatoria.
Questa attività si esplica nel blocco della traduzione di determinati mRNA target specifici. I miRNA vengono
trascritti nel nucleo in pri-miRNA (migliaia di basi) e poi vengono tagliati in pre-miRNA (centinaia di
basi) dal complesso proteico Drosha/Pasha. Si ripiegano, poi, venendo a formare una struttura a forcina.
Attraverso una proteina chiamata Esportina 5 i pre-miRNA arrivano nel citosol e qui vengono trasformati
dalla proteina Dicer nella forma matura (struttura lineare, non più a forcina di lunghezza pari ad una ventina
di basi). Ogni microRNA può bloccare intere famiglie di mRNA (fino a qualche decina) attraverso due
processi: il taglio del mRNA o il semplice blocco della sua traduzione (Fig. 2.7). Per questi motivi i miRNA
sono molto importanti nel controllo dell’espressione genica e sono correlati a numerose malattie, nel caso in
cui non funzionino normalmente (Visione & Croce, 2009).

33
Capitolo 2. Genomica

Figura 2.7: Genesi dei microRNA

2.8.3 Gli altri RNA non-codificanti


Ci sono altri RNA non-codificanti. Essi sono i piRNA, long non-coding RNA e molte altre classi di RNA
che svolgono un’attività di regolazione sull’espressione genica.

2.8.4 Gli elementi ripetuti


Ci sono moltissime sequenze in un genoma eucariotica che sono ripetute. Questi elementi possono essere
ripetuti in tandem cioè con sequenze ripetute una di seguito all’altra (DNA satellite di lunghezza media,
DNA minisatellite di lunghezza che va da 10 a 100bp, DNA microsatellite che non supera le 5bp) oppure le
ripetizioni possono essere localizzate casualmente nel genoma.

2.8.5 Eterocromatina ed Eucromatina


L’eterocromatina è l’insieme di quelle zone del DNA che sono altamente addensate. Le zone
eterocromatiniche non vengono trascritte, tranne in alcuni casi specifici (eterocromatina facoltativa)
quando la regolazione a livello di modificazioni istoniche lo permettano. L’insieme delle regioni del
genoma, invece, che vengono trascritte, si chiama eucromatina. La distinzione tra eterocromatina ed
eucromatina, in realtà, non è così netta poiché gran parte del genoma può essere trascritto e le vie molecolari
che convertono l’eterocromatina facoltativa in eucromatina sono regolati da meccanismi epigenetici
(modificazioni istoniche e metilazione diretta sul DNA).

2.8.6 Sequenze ultraconservate


Le sequenze ultraconservate (UCRs) sono zone altamente conservate quando si confrontano i genomi di
uomo, topo e ratto (Bejerano, 2004). Queste sequenze possono arrivare anche a lunghezze notevoli (700 bp)
e nella maggior parte dei casi sono trascritte. Non è ancora chiaro quale sia la loro funzione anche se molte di
esse sembrano appartenere alla classe degli enhancers, che sono sequenze che attivano la trascrizione di
regioni cromosomiche più o meno distanti.

2.8.7 Introni
Gli introni (vedi anche la sezione sullo “Splicing” nel capitolo dedicato alla “Biologia Molecolare”) sono
regioni nucleotidiche che vengono tagliate ed espulse dall’mRNA. Le regioni genomiche che corrispondono
agli introni sull’mRNA sono anche sequenze che svolgono attività regolatorie, contenenti in alcuni casi
miRNA, long non-coding, etc.
2.8.8 Esoni
Gli esoni (vedi anche la sezione sullo “Splicing” nel capitolo dedicato alla “Biologia Molecolare”) sono
quelle sequenze di mRNA che vengono unite attraverso lo “splicing” e codificate successivamente in
proteine. Gli esoni rappresentano una minima percentuale del genoma eucariotico (circa 1.5% - 3%).

35
Capitolo 2. Genomica
III
Terza Parte

3 Biologia Molecolare ........................ 39


3.1 Introduzione
3.2 Replicazione nei Procarioti
3.3 Replicazione negli Eucarioti
3.4 Trascrizione nei Procarioti
3.5 Trascrizione negli Eucarioti
3.6 Regolazione della trascrizione
3.7 Traduzione nei procarioti
3.8 Il codice universale
3.9 Traduzione negli eucarioti
3.10 Tecnologie usate nei laboratori di biologia moleco-
lare

37
3. Biologia Molecolare
3.1 Introduzione
La Biologia Molecolare è nata nel 1953 con la scoperta della struttura del DNA (Watson & Crick, 1953;
Wilkins, 1953; Franklin, 2003) e riguarda lo studio dei meccanismi molecolari che regolano la cellula. La
differenza tra genetica e biologia molecolare sta nel fatto che la biologia molecolare entra nei dettagli dei
meccanismi che regolano la funzione del DNA, RNA e proteine. Si può, quindi, affermare che la Biologia
Molecolare è alla base di tutte le discipline biologiche e mediche.

3.2 Replicazione nei Procarioti


La replicazione nei procarioti è quel meccanismo con il quale un batterio o archea duplica il proprio DNA
prima che l’organismo si divida e crei due cellule figlie identiche. La maggior parte degli studi sulla
replicazione procariotica è stata compiuta sul batterio E. coli (Escherichia coli) che è l’organismo modello
nel campo della ricerca biologica di base per quanto riguarda lo studio dei procarioti. In generale, in E. coli
l’inizio della replicazione del DNA avviene a partire da una regione genomica specifica chiamata “oriC’’.
OriC è una sequenza di DNA di circa 245 paia di basi che contiene due sequenze ripetute rispettivamente
di 9bp e 13bp. Il primo passo nell’inizio della replicazione è il legame della proteina DnaA-ATP con oriC.
Questa proteina è attiva solo in presenza di ATP e solo quando è associata alla membrana interna del
batterio. Il secondo passo è il legame con il complesso proteico DnaB-DnaC. La DnaB è una proteina
chiamata elicasi perché svolge il DNA a doppia elica mentre la proteina DnaC è una chaperonina che ha
la funzione di inibire l’attività elicasica di DnaB fino a quando questa non è pronta per attivarsi. Si noti che
la DnaB può svolgere la sua funzione sole se la DnaA ha denaturato il DNA a livello dell’origine. La
denaturazione viene coadiuvata anche da una variante della topoisomerasi II chiamata DNA girasi. A
differenza delle topoisomerasi di classe I procariotiche e delle topoisomerasi di classe II eucariotiche,
che rimuovono i superavvolgimenti rilassando e stabilizzando la molecola di DNA, la DNA girasi agisce
come un perno girevole permettendo al DNA di ruotare sul proprio asse. In assenza della DNA girasi, l’elicasi
non riuscirebbe a svolgere il DNA che diventerebbe resistente alla sua azione. La lunghezza della doppia elica
in E. coli è generalmente inferiore alle 60 bp ed una proteina HU sembra essere implicata nella formazione
della bolla in E. coli sebbene in esperimenti “in-vitro” la su attività non sia assolutamente richiesta. La
proteina DnaB attiva, poi, una primasi (DnaG) che sintetizza piccoli frammenti di RNA che serviranno da
innesco per la sintesi dei nuovi filamenti.

L’utilizzo della molecola ATP è necessario nello srotolamento del DNA da parte della DnaB ed anche nei
processi di funzionamento delle primasi. Inoltre, si utilizza ATP per l’assemblaggio del DNA su
sottocomplessi legati alla DNA polimerasi III che è l’enzima che sintetizza i nuovi filamenti. Quando
queste polimerasi, che avanzano in direzioni opposte, si incontrano in un punto di terminazione, i due nuovi
DNA circolari vengono separati da proteine topoisomerasi specifiche.

3.2.1 Differenze tra la replicazione nei procarioti e negli eucarioti

Le differenze nella replicazione dei procarioti, rispetto a quella degli eucarioti, risiedono nel fatto che:
1. nei procarioti la replicazione avviene nel citoplasma;
2. nei procarioti c’è una sola origine da dove parte la replicazione;
3. nei procarioti si forma un’unica bolla di replicazione che si muove bidirezionalmente;
39
Capitolo 3. Biologia Molecolare

4. nei procarioti c’è un solo replicone (unità di replicazione compreso tra l’origine e le due
terminazioni della replicazione che sono i punti in cui le forche di replicazione adiacenti si
fondono);
5. nei procarioti la replicazione inizia con l’intervento delle proteine DnaA e DnaB;
6. nei procarioti la presenza della proteina girasi interviene durante la replicazione;
7. nei procarioti i frammenti di Okazaki (li vedremo più avanti) sono molto lunghi (1000-2000 basi);
8. nei procarioti la replicazione è molto veloce (2000 bp al secondo), cioè 10 volte più veloce degli eucarioti.

3.2.2 Fase di inizio della replicazione nei Procarioti

Nel dettaglio, le fasi della replicazione nei procarioti sono le seguenti:


1. Una proteina chiamata DnaA si posiziona sul DNA procariotico in una zona chiamata oriC ed apre i
due filamenti di DNA, preparando l’arrivo di un’altra proteina chiamata DnaB, sovente associata ad
una chaperonina (DnaC). La proteina DnaB per funzionare deve essere rilasciata da questa
chaperonina che normalmente che ne inibisce l’attivazione. Il rilascio della proteina DnaC
promuove, infatti, l’innesco della proteina DnaB ed il conseguente avvio della replicazione;

2. La proteina DnaB, che appartiene alla famiglia delle elicasi, si lega al DNA ed inizia a scorrere verso
destra. Contemporaneamente un’altra DnaB lega nello stesso punto del DNA ma inizia a scorrere
verso sinistra. Inizia così a formarsi quella che si chiama bolla di replicazione che si allarga sempre
più. Questi meccanismi replicativi avvengono in ciascun filamento;

3. Ai due filamenti di DNA si legano alcune delle proteine che si chiamano SSB che ne prevengono
il riappaiamento (vengono rilasciate solo a fine replicazione);

4. A questo punto a ciascuna elica di DNA si lega la proteina DNA polimerasi III che inizia a
sintetizzare un nuovo filamento sullo stampo di quello gia’ esistente. Si legano due polimerasi sulla
destra della bolla (complesso proteico Tau) e due sulla sinistra. La replicazione è chiamata
semiconservativa poiché’ porta sempre alla formazione di un’elica di DNA nuovo dallo stampo di
un vecchio filamento. C’è però un problema. Le polimerasi si muovono solo in direzione 5’ —->
3’ del nuovo filamento. Infatti, ogni filamento di DNA ha una direzione. Ogni estremità è chiamata
o 3’ o 5’. Questa nomenclatura deriva dall’orientamento del desossiribosio all’interno della molecola
di DNA. Muovendosi solo in una direzione accadrà che, mentre una polimerasi seguirà
tranquillamente la bolla che si apre, l’altra polimerasi si sposterà nella direzione contraria all’apertura
della bolla. Per questo motivo la DNA polimerasi III che si muove nella direzione contraria alla
bolla formerà un’ansa ad un uncino in modo da muoversi anch’essa nella direzione 5’ —-> 3’ ma il
suo movimento sarà più lento e discontinuo. Formerà, quindi, dei frammenti di DNA (frammenti di
Okazaki) che dovranno essere legati insieme da una proteina chiamata ligasi. C’è poi da sottolineare
il fatto che per partire, le polimerasi (sia quelle che si muovono verso destra e sia quelle che si
muovono verso sinistra) hanno bisogno di un frammento di RNA (primer) che viene sintetizzato da
una proteina chiamata DnaG primasi (Fig. 3.1).

3.2.3 Fase di allungamento durante la replicazione nei Procarioti

La bolla di replicazione continua a spostarsi, sia a destra, che a sinistra, con le due polimerasi che seguono
la bolla. Il filamento non formato dai frammenti di Okazaki si chiamerà “leading” mentre l’altro si chiamerà
“lagging” (Fig. 3.2). Un errore comune tra gli studenti è il pensare che un filamento venga chiamato leading
mentre l’altro sia lagging. Questo non è corretto. Ciascun filamento del DNA è sia leading che lagging a
seconda che si trovi a destra o sinistra dell’inizio della replicazione. Il filamento leading si trova nella zona
in cui la polimerasi segue il movimento della bolla di replicazione, mentre il filamento lagging si trova nella
zona in cui la polimerasi si muove al contrario rispetto al movimento della bolla e per questo si forma
un’ansa in questa zona cromosomica e per lo stesso motivo si formano i frammenti di Okazaki.
Figura 3.1: Replicazione nei procarioti. L’ansa ad uncino nel filamento lagging non è mostrato.

Figura 3.2: Fase di allungamento durante la replicazione nei procarioti.

3.2.4 Fase di terminazione della replicazione nei Procarioti


Durante la replicazione le bolle avanzano in direzione opposte fino ad incontrarsi nel punto di terminazione.
A questo punto, intervengono alcune topoisomerasi che separano i genomi circolari che risultano concatenati
nel momento della terminazione della replicazione. In E. Coli è la Topoisomerasi IV che svolge questa
funzione, attraverso un processo di “taglia e cuci” liberando, così, i due DNA circolari appena duplicati (Fig.
3.3).

41
Capitolo 3. Biologia Molecolare

Figura 3.3: Fase di terminazione della replicazione nei procarioti. I genomi circolari concatenati richiedono l’azione di
alcune topoisomerasi per separarli. In E. Coli la Topoisomerasi IV gioca il ruolo più importante in questo processo.
Spesso nei batteri, più geni diversi vengono trascritti insieme. Questa regione di DNA, che fa da stampo ad un RNA di
questo tipo, si chiama operone mentre la regione regolatoria che sta a monte dell’operone è chiamata operatore.

3.3 Replicazione negli Eucarioti


3.3.1 Fase di inizio della replicazione negli eucarioti
La replicazione negli eucarioti è simile a quella dei procarioti ma intervengono, in questo caso, molti più
enzimi diversi, alcune dei quali sono descritti in Figura 3.4. Ecco una descrizione dettagliata delle le fasi
della replicazione negli eucarioti (Fig. 3.5):

1. L’origine della replicazione si localizza in numerose e differenti regioni del DNA eucariotico, che
non è circolare ma suddiviso in cromosomi; si osservano, quindi, numerose bolle di replicazione su
ciascun cromosoma. Queste zone di origine vengono chiamate “ORI”. Le polimerasi si muoveranno
sulla destra e sulla sinistra di ciascun filamento, fino a quando troveranno un’altra bolla e si
fermeranno. I “gap” che si verranno a formare, saranno poi uniti dalle proteine ligasi;

2. sulla sequenza ORI si lega la proteina ORC. Alcuni esperimenti hanno evidenziato come la proteina
ORC possa rimanere legata sull’ORI durante tutta la fase di replicazione;

3. sulla proteina ORC si lega la proteina CDC6;

4. a questo complesso CDC6+ORC si legano poi le proteine CDT1 che stabilizzano tutto il complesso;

5. sul complesso ORC+CDC6+CTD1 si legano poi le elicasi MCM;

6. si legano, poi, le proteine CDK e BDK che fosforilano tutto il complesso facendo in modo che solo le
MCM restino unite al DNA;

7. le proteine GIN e CDC45 si legano, quindi, alle proteine MCM attivandole e facendo avanzare le
bolla di replicazione.
Figura 3.4: Alcune proteine che intervengono nella replicazione procariotica, eucariotica e virale

Figura 3.5: Fase di inizio della replicazione negli eucarioti. I riquadri si leggono dall’alto in basso, partendo da sinistra

43
Capitolo 3. Biologia Molecolare

3.3.2 Allungamento durante la replicazione negli Eucarioti


Anche in questo caso si formano i frammenti di Okazaki nel filamento lagging mentre il filamento leading
continua ad essere sintetizzato in modo veloce e lineare. Le proteine SSB/RPA evitano, poi, il riappaiamento
del DNA aperto dalle proteine MCM. In particolare:

1. La DNA polimerasi Alfa incontra il primer ed inizia a sintetizzare il filamento leading.


Successivamente, si stacca e la DNA polimerasi Epsilon continua la sintesi iniziata dalla proteina
Alfa sulla quale si lega anche un’altra proteina chiamata PCNA che previene il distacco della
polimerasi dal DNA. Quest’ultima è in alcuni casi usata anche dai procarioti;

2. Sul filamento lagging (quello che va in direzione opposta alla bolla di replicazione e su cui si formano
i frammenti di Okazaki) l’inizio della replicazione avviene tramite l’intervento della polimerasi Alfa
che riconosce l’RNA starter (primer) ed inizia la replicazione. A questo punto la proteina Alfa si
stacca ed il processo viene continuato dalla DNA polimerasi Delta coadiuvata dalla proteina PCNA
che permette, quindi, alla polimerasi di rimanere attaccata al DNA. Anche in questo caso i frammenti
di Okazaki vengono uniti da una ligasi (Fig. 3.6). Come ipotizzato per E. coli anche in questo caso
è possibile che si formi un’ansa ad uncino per permettere alle polimerasi di muoversi in direzione
5’—>3’ del nuovo filamento e nello stesso verso della bolla di replicazione;

Figura 3.6: Fase di allungamento della replicazione negli eucarioti.

3.3.3 Terminazione della replicazione all’estremità dei cromosomi negli Eucarioti


Quando la proteina polimerasi arriva all’estremità di un cromosoma, una proteina che si chiama telomerasi,
che ha un’attività retrotrascrittoria (possiede la capacità di sintetizzare DNA da un frammento di RNA),
allunga il filamento stampo del filamento lagging con alcune sequenze ripetute, usando il proprio stampo di
RNA. Questo processo viene completato dalla polimerasi Alfa. In questo modo tutto il cromosoma viene
replicato (Fig. 3.7). C’è comunque da sottolineare che durante l’invecchiamento le telomerasi perdono
parte di questa capacità enzimatica ed i telomeri si accorciano replicazione, dopo replicazione. Le telomerasi
sono particolarmente attive nelle cellule tumorali ed in quelle staminali. Un video dettagliato può essere
visualizzato all’indirizzo web: https://www.youtube.com/watch?v=AJNoTmWsE0s
Figura 3.7: Attività retrotrascrittasica delle telomerasi negli eucarioti.

3.4 Trascrizione nei Procarioti


3.4.1 Inizio della sintesi ed allungamento dell’RNA durante la trascrizione nei procarioti
In biologia molecolare, il termine trascrizione significa sintesi di RNA da uno stampo di DNA. Questo
vale sia per i procarioti sia per gli eucarioti. L’enzima che sintetizza l’RNA si chiama RNA polimerasi e si
muove anch’esso in direzione 5’—>3’ del nuovo filamento di RNA sintetizzato. L’inizio della trascrizione
avviene attraverso le seguenti fasi (Fig. 3.8):

1. L’ RNA polimerasi II, assieme ad una proteina chiamata Sigma, si lega ad una sequenza di DNA
che è solitamente identificata con le basi TTGACA, in una zona chiamata “-35” perché è localizzata
35 basi prima (in linguaggio scientifico si dice “a monte”) di un punto chiamato start o zona di inizio
della trascrizione. Solitamente in una zona 10 basi a monte dello start (chiamata “-10”) si trova una
regione chiamata TATA box che è caratterizzata dalla sequenza TATAAAT. La TATA box è molto
importante come ulteriore sito di legame per la RNA polimerasi;

2. La proteina Sigma si distacca dal DNA lasciando libero spazio alla RNA polimerasi II che, essendo
lunga circa 60-80 bp, si piega per entrare nella zona compresa tra la regione “-35” e lo start;

3. La RNA polimerasi II inizia la sintesi dalla zona di start specifica identificata sulla molecola di DNA.

45
Capitolo 3. Biologia Molecolare

Figura 3.8: Trascrizione nei Procarioti. I riquadri si leggono dall’alto in basso, partendo da sinistra.

3.4.2 Terminazione della trascrizione nei Procarioti


La terminazione nei procarioti si dice intrinseca quando l’RNA, che viene sintetizzato, raggiunge la
sequenza segnale di terminazione della trascrizione formando un’ansa. L’RNA polimerasi a questo punto si
blocca. Si dice, invece, terminazione Rho dipendente quando una proteina elicasi, chiamata Rho,
riconosce la sequenza di terminazione e ferma la trascrizione.

3.5 Trascrizione negli Eucarioti


La trascrizione negli eucarioti è un processo più complicato rispetto a quello già visto nei procarioti. Negli
eucarioti, infatti, c’è un nucleo in cui avviene la trascrizione, ed esiste anche un’elaborazione dell’mRNA
messaggero attraverso un processo molecolare chiamato splicing. Inoltre, la trascrizione negli eucarioti coinvolge
un numero di proteine molto più numeroso rispetto a quello dei procarioti. Per ogni gene, poi, si forma
solitamente un singolo filamento di mRNA che, attraverso lo splicing alternativo, puo’ essere tradotto in
proteine diverse (vedi i paragrafi successivi).

3.5.1 Inizio della Trascrizione negli Eucarioti


L’inizio della trascrizione negli Eucarioti avviene attraverso le seguenti fasi:

1. Il fattore di trascrizione TFIID si lega alla regione TATA box che si trova all’inizio del sito di
trascrizione chiamato Ini. La regione sul DNA che comprende tre zone regolatrici importanti: l’Ini,
la TATA box ed un’altra zona ancora più a monte chiamata UPS. L’unione di queste unità
cromosomiche localizzate sul DNA a monte del punto di inizio della trascrizione prende il nome di
promotore;

2. La proteina TBP si lega a TFIID, mentre TFIIA si lega a TBP;

3. La proteina TFIIB si lega al sito di inizio sul DNA chiamato Ini;

4. L’RNA polimerasi II a cui è legata la proteina TFIIF si unisce alla proteina TFIIB che è localizzata
ancora sulla regione Ini;

5. Alla RNA polimerasi II si lega un complesso proteico chiamato STF che è formato da proteine
specifiche (fattori di trascrizione) per quel particolare gene;

6. La proteina TFIIH attiva l’RNA polimerasi II che inizia la trascrizione;


7. All’RNA viene, poi, aggiunto un cappuccio (cap) al 5’, composta da una molecola chiamata 7-metil
guanosina legata all’mRNA tramite un ponte trifosfato 5’-’5 (Fig. 3.9). Inoltre, alla porzione
terminale 3’ del mRNA vengono aggiunti circa 200-2000 nucleotidi di Adenine (poli-A). La
funzione di questa coda di Adenine è quella di stabilizzare l’mRNA.
3.6

Figura 3.9: Trascrizione negli Eucarioti. I riquadri si leggono dall’alto in basso, partendo da sinistra.

3.6.1 Stop della Trascrizione negli Eucarioti


Durante la sintesi del filamento di RNA, l’RNA polimerasi II raggiunge una sequenza di terminazione e si
blocca. Lo stop della trascrizione negli eucarioti è coadiuvato da fattori di trascrizione che sono proteine
legate alla RNA polimerasi II e poi al DNA al fine di regolarne la trascrizione.

3.6.2 Lo splicing
L’RNA, come abbiamo visto nel primo capitolo, può essere RNA messaggero (mRNA), ribosomiale
(rRNA) o transfer (tRNA). Nel caso dell’mRNA, dopo l’elaborazione che porta alla sua maturazione (cap
+ poly-A), c’è anche un’altra fase chiamata splicing. Durante lo splicing, alcune zone del DNA vengono
eliminate mentre le rimanenti vengono legate tra loro in modo da formare un RNA (mRNA) più corto che
sarà poi trasportato nel citoplasma per essere tradotto in proteina. Le regioni di RNA eliminate si chiamano
introni, quelle che rimangono sono chiamate esoni (Fig. 3.10).

Figura 3.10: Struttura dell’mRNA eucariotico e dello spliceosoma.

Le fasi dello splicing


Un mRNA eucariotico non ancora maturo è formato da esoni ed introni che saranno poi escissi. Alle
estremità abbiamo, inoltre, il cap (5’) e la poly A (3’). Gli introni presentano al loro interno sequenze del
tipo “GU”, “A branch site”, “Pyrimidine rich region” e “AG region”. Inoltre, il complesso proteico

47
Capitolo 3. Biologia Molecolare

deputato allo splicing si chiama spliceosoma costituito dalle subunità U1, U2, U4, U5 e U6. La subunità
U3 non prende parte al processo di splicing ed ha, invece, una funzione regolatoria nella sintesi dell’RNA
ribosomiale.

Le fasi dello splicing sono:

1. Le subunità U1 e U2 si legano all’RNA nella regione “GU” e lo piegano;

2. Le subunità U4, U5, e U6 si legano alla regione “AG”;

3. L’interazione tra le subunità U1+U2 e U4+U5+U6 fanno sì che l’estremità dell’introne dove si trova
la zona “GU” venga tagliata ed unita sulla zona chiamata “A branch site”;

4. Viene effettuato un taglio anche sull’altra estremità dove si trova la regione “AG”;

5. Gli introni vengono escissi mentre gli esoni si uniscono (Fig. 3.11).

Figura 3.11: Fasi dello splicing. I riquadri si leggono dall’alto in basso, partendo da sinistra.

Una figura esemplificativa che descrive, in generale, la trascrizione e la traduzione nei procarioti ed eucarioti
può essere visualizzata in Figura 3.12.
Figura 3.12: Differenza tra trascrizione e traduzione nei procarioti ed eucarioti

3.6.3 Lo Splicing Alternativo


Le regioni “GU” ed “AG” appena studiate, offrono anche un’altra possibilità. Gli esoni possono essere
usati con combinazioni diverse al fine di creare mRNA di tipo diverso. In questo modo lo stesso gene
eucariotico può essere trascritto in decine di molecole di mRNA che potranno tradotte in altrettante proteine.
Nel genoma umano, infatti, ci sono circa 20,000 geni ma più di 2,000,000 di proteine diverse.

3.7 Regolazione della trascrizione


La regolazione dell’espressione genica è molto importante perché permette di modulare l’azione dei geni
tramite la loro traduzione in proteine. In alcuni tessuti alcuni geni devono essere molto attivi, in altri gli stessi
geni devono essere addirittura disattivati. Questa fine regolazione non è ancora del tutto chiara ma avviene,
probabilmente, attraverso i seguenti processi biologici:
• Regolazione attraverso microRNA: i miRNA (vedi paragrafo 2.1.2) sono piccoli RNA che non
codificano per nessuna proteina ma hanno una funzione prevalentemente regolatoria. Essi sono in
grado di bloccare la traduzione di specifici mRNA target che non possono, poi, essere tradotti in
proteine;

• Epigenetica: attraverso la metilazione del DNA è possibile bloccare la trascrizione di determinati


geni. Inoltre, attraverso la modificazione chimica delle cosiddette proteine istoniche (proteine
costitutivamente legate al DNA) è possibile attivare o inibire specifici geni a cui questi istoni sono
legati;

• Editing post-trascrizionale: non è ancora del tutto chiaro in che modo una cellula sia in grado di
modificare la sequenza nucleotidica di specifici mRNA già processati regolandone così la loro
azione dopo la trascrizione, ma questo processo è stato osservato per alcuni tipi cellulari
eucariotici;

• Intervento di altri non-coding RNA: oltre ai microRNA (miRNA) ci sono altre classi di RNA che
non codificano per nessuna proteina ma sono in grado di bloccare la traduzione di specifici mRNA
o regolarne l’espressione.

49
Capitolo 3. Biologia Molecolare

3.7 Traduzione nei procarioti


In biologia molecolare, traduzione significa sintesi delle proteine su di uno stampo di RNA ed avviene nel
citoplasma. Il complesso proteico che traduce l’mRNA in proteina è il ribosoma. Il ribosoma si muove
sempre in direzione 5’—>3’ come fanno anche gli enzimi DNA e RNA polimerasi. Il ribosoma è formato
da 2 subunità: una subunità grande, chiamata 50S ed una piccola, chiamata 30S. Il complesso totale si
chiama 70S e non 80S perché i coefficienti di sedimentazione (il processo di sedimentazione è una tecnica
di laboratorio) non sono additivi. La subunità 30S del ribosoma contiene 21 proteine “r” e una molecola
di rRNA (16S), mentre la subunità 50S contiene due tipi di rRNA (23S e 5S) e 31 proteine “r”. Entrambe
la subunità, poi, sono formate da 3 siti E, P ed A. Su questi siti si posizionano delle molecole che prendono
il nome di tRNA. Le molecole di tRNA sono RNA che trasportano gli amminoacidi che rappresentano le
unità fondamentali delle proteine. Quasi tutte le strutture biologiche all’interno delle cellule sono formate
da proteine che hanno funzioni strutturali o regolatorie (enzimi). Inoltre, più proteine possono formare
complessi proteici come, per esempio, il ribosoma. Una cosa importante da tenere presente è che le
molecole di mRNA vengono lette a triplette dal ribosoma. Cioè, per ogni tripletta di nucleotidi esiste un
singolo amminoacido (anche se non è vero il contrario) che è portato dal tRNA. La corrispondenza tra
triplette di nucleotidi e amminoacidi si chiama “codice universale. Nei procarioti non esiste il processo
biologico dello splicing perché non ci sono introni nel genoma dei batteri o archeobatteri. In generale, il
tRNA trasporta su un’estremità l’amminoacido, mentre sull’altra mostra l’anticodone, cioè la tripletta di
riconoscimento del codone (tripletta sull’RNA). Il primo tRNA che arriva trasporta con sé sempre
l’amminoacido “formil-Metionina” (fMet) che si lega al codone “AUG” (sequenza di inizio traduzione)
sull’mRNA. Di solito i tRNA che trasportano gli amminoacidi vengono anche indicati come “aa-tRNA”.
Questo primo tRNA che trasporta fMet va a posizionarsi sul sito P della subunità piccola 30S del ribosoma.
Nel momento in cui arriva il secondo tRNA col suo amminoacido, esso si va a posizionare sul sito A della
subunità minore. A questo punto l’amminoacido del primo tRNA (sul sito P) va a legarsi a quello sul sito
A, mentre il primo tRNA rimane sempre sulla tasca P. Lo spostamento ha luogo solo per quanto riguarda
il primo amminoacido che si sposta verso destra sopra il secondo amminoacido. A questo punto, il ribosoma
si sposta in avanti (direzione 5’ – 3’), cosicché il primo tRNA ora è posizionato sulla tasca E, il secondo
tRNA con i due amminoacidi è ora sulla tasca P, mentre la tasca A rimane vuota. Un terzo tRNA con il
proprio amminoacido si localizza sulla tasca A rimasta vuota ed il ciclo continua fino a che il ribosoma non
incontra i tre codoni di stop (UAA, UAG e UGA) e il processo di traduzione si ferma. Gli amminoacidi si
staccano dal mRNA dalla tasca P e la proteina è pronta, previo indirizzamento in distretti cellulari
competenti. La Figura 3.13 mostra una sintesi grafica di come avviene la traduzione nei procarioti.

Figura 3.13: Traduzione nei procarioti nel dettaglio. I riquadri si leggono dall’alto in basso, partendo da sinistra, girando
la pagina orizzontalmente.
3.8 Traduzione nei procarioti in dettaglio
Ci sono tre fattori di inizio nella traduzione dei procarioti (Fig. 3.13):

1. IF1: Questa proteina si lega al sito A e non permette che si leghino amminoacidi prima dell’arrivo di
fMet sul sito P;

2. IF2: Essa ha l’esclusiva funzione di portare il primo amminoacido fMet sul sito P. Non trasporta altri
amminoacidi;

3. IF3: Questa proteina ha molte funzioni, tra cui la stabilizzazione della subunità 30S e l’attacco
corretto dell’mRNA sui siti E, A e P.

Questi fattori si dispongono sulla subunità 30S legata all’mRNA posizionata con la tasca P sul codone di start
(AUG, GUG o UUG). Una sequenza ricca in purine chiamata Shine-Dalgarno è presente 10 basi a monte
dello start e si lega quasi perfettamente ad una regione complementare dell’rRNA 16S della subunità 30S.
In particolare:

• IF1 e IF3 si posizionano sulla subunità 30S sul sito A;

• IF2 trasporta l’fMet-tRNA sul sito P della subunità 30S;

• L’aa-tRNA che trasporta fMet contiene un anticodone che è complementare allo start codon (nel
caso lo start sia AUG, l’anticodone è UAC). Per anticodone, si intende la sequenza sull’aa-tRNA
complementare ad una generica tripletta sull’ mRNA;

• Dopo l’arrivo di fMet, IF1, IF2 e IF3 si staccano dalla subunità ribosomica 30S. La subunità 50S
si unisce alla subunità 30S;

• La proteina EF-Tu trasporta il secondo aa-tRNA sulla tasca A;

• La subunità 50S contiene un rRNA chiamato 23S che ha un’attività peptil-trasferasica. È, cioè, in
grado di legare l’amminoacido dell’aa-tRNA sulla tasca P a quello appena arrivata sulla tasca A
(Fig. 3.14);

Figura 3.14: Attività peptil-trasferasica. La formazione del legame peptidico avviene mediante una reazione tra il
polipeptide del peptidil-tRNA nel sito P e l’amminoacido dell’amminoacil-tRNA nel sito A. Questa attività è a carico
della subunità 50S nei procarioti e 60S negli eucarioti. Il primo amminoacido rimane quindi sempre più in "alto"
51
Capitolo 3. Biologia Molecolare
rispetto ai nuovi amminoacidi caricati.

• A questo punto il ribosoma si sposta (trasloca) di una tripletta grazie alla proteina EF-G in
direzione 5’—>3’, cosicché il tRNA scarico si posiziona sulla tasca E per poi uscirne, nella tasca
P rimane il peptidil-tRNA (tRNA carico), mentre la tasca A rimane vuota in attesa di un nuovo
amminoacido trasportato da EF-Tu;

• Il ciclo continua fino a quando il ribosoma non incontra i codoni di stop (UAG, UAA, UGA);

• Intervengono, quindi, dei fattori di rilascio RF1 e RF2 che bloccano la traduzione, mentre un terzo
fattore RRF rilascia la subunità 50S dalla subunità 30S.

3.9 Il codice universale


Come abbiamo detto il ribosoma legge ogni tripletta del mRNA a partire dal codone iniziale e si ferma quando
trova i codoni di stop. Nei procarioti come abbiamo visto i codoni di start sono tre (AUG, GUG o UUG)
mentre negli eucarioti è solo uno (AUG). Ad ogni codone corrisponde un amminoacido. In realtà non è
proprio così. Nella maggior parte dei casi codoni diversi codificano per lo stesso amminoacido. Questo vale
per tutti gli organismi viventi. Le triplette che codificano per lo stesso amminoacido sono in realtà molto
simili e generalmente differiscono solo per l’ultima delle tre basi. Questo porta a pensare, quindi, che
l’informazione più importante sia, effettivamente, contenuta nelle prime due basi e che la terza serva a
garantire una precisione maggiore. Chimicamente, gli amminoacidi sono molecole organiche composte da
un gruppo terminale amminico (-NH2 o N-terminale), da un gruppo carbossilico (-COOH o C-
terminale) e da un gruppo chiamato R che è caratteristico di ciascuno amminoacido (Figura 3.15). In totale
gli amminoacidi sono 20 (Figura 3.16), ma ne è stato scoperto uno nuovo che si chiama Selenocisteina
(Figura 3.17) che è presente solo in alcuni organismi. Tra l’altro è possibile trovare in alcuni libri di testo,
altri due amminoacidi chiamati Pirrolisina e formil-Metionina (primo amminoacido nella catena
peptidicaR di ogni batterio).
I peptidi sono costituiti da una catena di vari amminoacidi. La catena primaria
di un polipeptide costituisce la struttura primaria di una proteina.

Figura 3.15: Struttura generale degli amminoacidi.


Figura 3.16: Codice genetico universale.

Figura 3.17: I 20 amminoacidi con l’aggiunta dell’amminoacido Selenocisteina (SEC).

3.10 Traduzione negli eucarioti


La traduzione negli eucarioti è molto simile a quella dei procarioti ma i ribosomi sono più grandi (60S + 40S
= 80S) ed intervengono molto più fattori enzimatici. Inoltre la tasca E non è presente nei ribosomi di questi
organismi superiori. Anche in questo caso, la traduzione si muove in direzione 5’ —> 3’ ed il meccanismo
di entrata ed uscita degli amminoacidi dalle tasche P ed A è lo stesso quando confrontato con quello dei
procarioti. Non essendoci la tasca E, gli amminoacidi escono attraverso il sito P. Vediamo come avviene la
traduzione eucariotica nel dettaglio (Fig. 3.18 e Fig. 3.19):

1. Il complesso di pre-inizio si chiama 43S ed è formato dalla subunità ribosomica 40S + eIF2, eIF3,
Met-tRNA (primo aa-tRNA), eIF1 e eIF1A. Questo complesso ancora non si è legato all’mRNA. A
questo punto il fattore proteico eIF2 lega il primo aa-tRNA che in questo caso è il Met-tRNA (senza
il gruppo formile);

2. Un altro complesso formato da eIF4A, eIF4B, eIF4E e eIF4G si lega all’mRNA. Il complesso
eIF4A+eIF4E+eIF4G si chiama eIF4F. Inoltre, una proteina chiamata PABP si lega alla poly-A;

3. A questo punto il complesso 43S si unisce al complesso legato all’mRNA e formano tutti insieme il
complesso 48S (escluso PABP);

4. Il complesso 48S si sposta lungo l’mRNA fino ad arrivare al codone “AUG”;

5. A questo punto arriva la subunità 60S. Tutti i restanti fattori si staccano e si forma il complesso
ribosomiale 80S completo;

6. Come nei batteri anche nei procarioti c’è un fattore proteico chiamato EF-Tu che trasporta gli aa-tRNA
dopo che il primo amminoacido Met-tRNA si è legato alla tasca P. La tasca E negli Eucarioti, come
sottolineato nei paragrafi precedenti, non esiste. Nella fase successiva, EF-Tu posiziona sul ribosoma
i vari aa-tRNA utilizzando come fonte di energia la molecola GTP che idrolizzata si trasforma in
GDP. L’enzima di ricarica del GDP si chiama EF-Tu-Ts;

7. L’attività peptil-trasferasica è invece svolta dall’rRNA 28S della subunità 60S coadiuvata da alcune
53
Capitolo 3. Biologia Molecolare
proteine ribosomiali (Fig. 3.14);

8. Come ricordato in precedenza, i successivi amminoacidi si legano con lo stesso meccanismo conosciuto
nei procarioti. Lo stesso vale per l’uscita dei tRNA “scarichi” dal ribosoma, con la differenza della
mancanza della tasca E dalla struttura ribosomiale (Fig. 3.18);

9. Anche negli Eucarioti la proteina EF-G è utilizzata per la traslocazione;

10. I codoni di stop negli Eucarioti sono riconosciuti da un fattore di rilascio eRF1 coadiuvato da un altro
fattore eRF2. Il fattore di rilascio eRF1 termina la traduzione rilasciando la catena proteica. RRF
(fattore di riciclo del ribosoma) coadiuvata dalla proteina EF-G rilascia la subunità 60S dal ribosoma.
Negli eucarioti, i ribosomi sono sintetizzati nel nucleolo e trasportati nel citoplasma, dove possono
trovarsi sia liberi sia legati al Reticolo Endoplasmatico Ruvido (RER). Nel RER, i polipeptidi appena
sintetizzati vengono legati a molecole chimiche, in modo da venire “smistati” nei compartimenti
citoplasmatici più opportuni.

Figura 3.18: Schema generale di start, allungamento e terminazione della traduzione. Il meccanismo di base
della traduzione è il medesimo già visto nei Procarioti anche se negli Eucarioti manca il sito E e non troviamo
la presenza della sequenza di Shine-Dalgarno per il riconoscimento del ribosoma alla molecola di RNA
messaggero. Inoltre negli Eucarioti, il primo amminoacido è la Metionina e non la formil-Metionina (procarioti).
Figura 3.20: Traduzione negli Eucarioti. L’inizio della Traduzione negli Eucarioti si svolge con il legame della
subunità 40S con altre proteine atte a formare il complesso 43S. Altre proteine si legano successivamente alla
molecola di RNA messaggero. Quando il complesso 43S lega l’mRNA questo nuovo complesso viene chiamato
48S (complesso più voluminoso) e si sposta alla ricerca del codone “AUG”. Sulle subunità eucariotiche ribosomiali
non è presente il sito E, ma lo schema in Figura 3.18 è valido anche negli eucarioti, se escludiamo il fatto che il
primo amminoacido trasportato sul sito P è in questo caso la Metionina e non la formil-Metionina come nei
procarioti.

3.11 Tecnologie usate nei laboratori di biologia molecolare


Le tecniche di biologia molecolare sono innumerevoli e molto complesse. Qui ne vedremo solo alcune
descritte sommariamente ed in moto molto sintetico. Per maggiori informazioni si consiglia di consultare testi
più approfonditi. Vediamone le metodologie principali:

PCR: la Polymerase Chain Reaction è una tecnica che permette l’amplificazione del DNA. A partire
da un basso numero di molecole di DNA si possono ottenere grandi quantità di materiale genomico.
È un’analisi di tipo qualitativo ed è una delle più usate nell’ambito della biologia molecolare. La
reazione, che ha esclusivamente la funzione di amplificare un determinato tratto di materiale
genetico, avviene principalmente in tre stadi attraverso l’utilizzo di una speciale attrezzatura:

1. Il frammento DNA da amplificare viene posto in una provetta assieme ai nucleotidi liberi, a
primers di RNA specifici per la sequenza da sintetizzare ed una DNA polimerasi termostabile.
La provetta viene, poi, posta all’interno della macchina per la PCR (termociclatore);

2. La macchina viene portata a 95◦ circa, in modo da denaturare il DNA (denaturation);

3. Successivamente la temperatura si abbassa a 55◦-65◦ circa, per permettere il matching tra


primers e DNA (annealing);

4. A questo punta la temperatura sale a 72◦ circa per permettere la sintesi dei nuovi filamenti da
parte della DNA polimerasi (extension). I cicli si susseguono fino ad un numero di 30 circa, per
4 ore in modo da avere un numero di molecole sufficienti per successive analisi (corsa su gel di
55
Capitolo 3. Biologia Molecolare

agarosio, sequenziamento, etc.). Un video esaustivo può essere visualizzato all’indirizzo web:
https://www.youtube.com/watch?v=iQsu3Kz9NYo

RT-PCR e qRT-PCR: la Reverse Transcription PCR (RT-PCR) è una delle tante varianti della
metodica PCR. La differenza tra RT-PCR e PCR è che nel primo caso si utilizza una molecola di
RNA che viene retrotrascritta nel suo complemento di DNA utilizzando una trascrittasi inversa o
retrotrascrittasi. Il nuovo DNA complementare viene poi amplificato mediante la tradizionale PCR
o real-time PCR. La maggior parte degli studenti che studiano questo processo spesso commettono
l'errore di scambiare la RT-PCR con la qRT-PCR poiché i due termini sono simili. La qRT-PCR è
in realtà una PCR quantitativa in grado di amplificare sia DNA che RNA. L'applicazione della qRT-
PCR, che ora è considerata la tecnica di analisi più potente e sensibile per gli studi genetici, si è
sviluppata in modo esponenziale. Attualmente questa tecnica viene utilizzata nell'analisi quantitativa
dell'espressione genica, nella genotipizzazione, nel rilevamento dei patogeni, nell'analisi dei
polimorfismi o mutazioni, nella valutazione dell’espressione genica misurazioni dell’RNA
regolatorio;

Microarray: questa metodica permette di valutare l’espressione genica di migliaia di geni con-
temporaneamente presenti in un tessuto o linea cellulare, utilizzando alcune sonde di DNA (che
rappresentano i geni) poste su di una superficie solida come vetro, plastica, o chip di silicio. A queste
sonde vengono legate, successivamente, le molecole di cDNA (RNA retrotrascritto in DNA
complementare) identiche per sequenza al mRNA cellulare estratto da un campione biologico di
interesse. La sintesi del cDNA viene effettuata usando una trascrittasi inversa che sintetizza una
molecola di DNA (o meglio cDNA) da una molecola di mRNA, usata come stampo. Questa molecola
di cDNA può essere a sua volta usata come stampo per la sintesi di un altro cDNA. Quest’ultimo,
però, avrà una sequenza identica a quella dell’mRNA di partenza e sarà a singolo filamento, grazie
all’intervento di una endonucleasi che disappaierà le due sequenze di cDNA. Il cDNA identico
all’mRNA verrà, poi, legato a fluorofori (agenti coloranti) e posto sopra il supporto che contiene le
sonde di DNA complementare (ibridazione). Dopo l’ibridazione, il microarray viene lavato per
rimuovere il cDNA che non si è legato. Generalmente il cDNA dei campioni trattati, o derivanti da
tessuti malati, è marcato con la Cianina 5 (Cy5) ed è rosso. È, poi, solitamente mescolato con un
DNA di un soggetto di controllo, marcato con un colorante fluorescente diverso, di solito con la
Cianina 3 (Cy3), che è verde. Quindi se la quantità di RNA messaggero espressa da un gene nelle
cellule di malate o trattate (rosso) risulta essere aumentata rispetto al controllo (verde), il colore che
ne risulterà tenderà ad un rosso acceso sarà verde. La fluorescenza è rilevata per mezzo di uno scanner
laser che acquisisce un’immagine dal supporto che contiene le sonde unite al cDNA marcato con i
due fluorofori. Successivamente verranno usati dei software appositi per convertire i segnali colorati
in valori numerici in modo da effettuare un’analisi statistica. Questa tecnica è stata abbandonata quasi
del tutto in favore della metodologia chiamata RNA-sequencing (RNA-seq) che è una piattaforma
che valuta la quantità di RNA grazie ai nuovi sistemi di sequenziamento di nuova generazione (NGS).

Next-Generation-Sequencing (NGS): il sequenziamento di nuova generazione (NGS) è una


tecnologia in grado di identificare la sequenza di DNA o RNA allo scopo studiare la variazione
genetica associata a malattie o altri fenomeni biologici quali l’identificazione di specie in matrici
animali o vegetali. Questa metodica è stata introdotta nel mercato per uso commerciale nel 2005, ed
è stato inizialmente chiamato "sequenziamento parallelo massiccio", poiché consentiva per la prima
volta il sequenziamento di molti filamenti di DNA contemporaneamente, anziché uno alla volta
come avveniva con il tradizionale sequenziamento Sanger mediante elettroforesi capillare. Il
sequenziamento di Sanger, comunque, rimane la tecnica migliore per analizzare un piccolo numero
di target genici e campioni poiché non è molto costoso ma risulta essere molto preciso. È anche
considerata la tecnologia di sequenziamento gold standard, quindi i risultati NGS sono spesso
verificati utilizzando il sequenziamento Sanger. Le piattaforme NGS sul mercato sono numerose ma
la più usata è l’Illumina consente l’identificazione di centinaia o migliaia di geni
contemporaneamente in più campioni, nonché la scoperta e l'analisi di diversi tipi di caratteristiche
genomiche in una singola corsa di sequenziamento, dalle varianti a singolo nucleotide (SNV), al
numero di copie e varianti strutturali, e persino fusioni di RNA. Attualmente la piattaforma Illumina
utilizza frammenti di DNA piccoli chiamati “short-reads” (frammenti corti) ma altre company
(PacBio) hanno messo a disposizione tecniche di sequenziamento sviluppate per l’analisi di reads
molto più grandi. Le piattaforme che utilizzano short-reads sono più precise ma non riescono ad
identificare regioni ripetute del genoma. Al contrario le metodologie di sequenziamento che usano
le long-reads riescono ad identificare tutte le regioni genomiche ma con una scarsa precisione.
Ulteriori vantaggi delle tecniche NGS includono la velocità e la produttività tanto che hanno
rivoluzionato l'analisi genetica e consentito nuovi sviluppi nella ricerca genomica e clinica, sia nel
campo della salute, delle scienze ambientali, agricole e forensi. Il sequenziamento di nuova

generazione può essere usato sia per l’analisi del DNA, RNA ed epigenetica:

1. Whole-Genome-sequencing: questa tecnica innovativa permette di sequenziare campioni


di DNA di interi genomi ed identificare, quindi, le sequenze a livello di basi azotate di un
individuo sia esso appartenente al gruppo dei virus, procarioti o eucarioti;

2. Exome-sequencing: questa tecnica innovativa permette di sequenziare campioni di DNA a


livello degli esoni contenuti all’interno di un genoma ed identificare le sequenze, quindi, dei
geni codificanti;

3. RNA-sequencing: questa tecnica ha la stessa funzione dei microarray ma è molto più


sensibile basandosi sul sequenziamento diretto dell’RNA e la sua quantificazione in baso al
numero di molecole analizzate;

4. CHiP-sequencing: questa tecnica permette di valutare l’espressione delle modificazioni istoniche


(epigenetica);

5. Bi-sequencing: questa tecnica permette di valutare la metilazione diretta del DNA.

Western Blot: questa metodica permette di rilevare e analizzare le proteine. Si basa su una tecnica
che prevede il trasferimento, noto anche come blotting, di proteine separate attraverso elettroforesi
dal gel ad una membrana dove è possibile visualizzare le strutture proteiche in modo specifico. La
procedura è stata descritta per la prima volta da H. Towbin e colleghi nel 1979 (Towbin, 1979).

Northern Blot: il Northern blot vengono utilizzati per la rilevazione di specifiche sequenze di RNA
tra una miscela di diversi RNA. Questa tecnica può essere utilizzata per caratterizzare l'espressione
di RNA da campioni di tessuto o colture cellulari. Implica una complessa procedura di isolamento e
ibridazione che si traduce in sonde etichettate legate alla sequenza di RNA di interesse per il
rilevamento e la visualizzazione. Questa tecnica è stata abbandonata in favore prima dei microarray
e poi dell’RNA-seq.

Southern Blot: il Southern blot è una tecnica di biologia molecolare utilizzata per il rilevamento di
una specifica sequenza di DNA in campioni di DNA grandi e complessi. Il metodo Southern blot può
essere utilizzato anche per determinare il peso molecolare dei frammenti di restrizione e per misurare
le quantità relative di DNA in campioni differenti. I campioni di DNA possono essere ottenuti da
tessuti o colture cellulari isolate. Sebbene sia stata soppiantata dalle tecniche di Whole-Genome-
Sequencing o Exome-sequencing è tuttora utilizzata per identificare piccole sequenze di DNA
specifiche.

57
Capitolo 3. Biologia Molecolare
IV
Bibliografia e Indice

Bibliografia…………………………………….63
Libri
Articoli

Indice................................................. 64

59
Bibliografia

Libri

[Ben-Naim, 2015] Arieh Ben-Naim. Information, Entropy, Life and Universe. 2015

[Buffon, 1749 - 1767] Georges-Louis Leclerc de Buffon. Histoire naturelle, générale et


particulière, avec la description du Cabinet du Roy. 1749 – 1767

[Campbell, 1982] Jeremy Campbell. Grammatical Man: Information, Entropy, Language, and
Life. 1982

[Carrol, 2017] Sean Carroll. The Big Picture: On the Origins of Life, Meaning, and the
Universe Itself. 2017

[Censorino, ~3rd AC] Censorino. De die natali (original 3rd century AC), Bologna,
Benedetto Faelli, 1497.

[Darwin, 1859] Charles Darwin. L’Origine delle Specie. 1859

[Dawkins, 2003] Richard Dawkins. Il Gene Egoista. 2003

[Devis, 2019] Paul Devis. The Demon in the Machine. 2019

[England, 2020] Jeremy England. Every Life Is on Fire: How Thermodynamics Explains the
Origins of Living Things. 2020

[Gould, 2002] Stephen Jay Gould. La Struttura della Teoria dell’Evoluzione. 2002

[Gregory, 2002] The evolution of the genome. T. Ryan Gregory, 2002

[Johannsen, 1909] Johannsen, W. Elemente der exakten Erblichkeitslehre, 1909

[Lamarck, 1809] Jean-Baptiste Lamarck. Philosophie Zoologique. 1809

[Lewin, 2012] Benjamin Lewin. Il Gene XII. 2012

[Lucrezio, first-century BC] De rerum Naturae, Lucrezio, first-century BC

61
[Maddox, 2003] Brenda Maddox. Rosalind Franklin: The Dark Lady of DNA. 2003

[Mendel, 1865] Gregor Mendel. Esperimenti su Ibridi nelle Piante. (1865) (Contenuto a
pagina 27).

[Morgan, 1915] Thomas Hunt Morgan. The Mechanisms of Mendelian Heredity. 1915

[Pross, 2017] Addy Pross. Whati is Life? How Chemistry Becomes Biology. 2016

[Sant-Hilaire, 1829] Étienne Geoffroy Saint-Hilaire. Cours de l'histoire naturelle des


mammifères (in French). Paris: Pichon & Didier. 1829

[Schrödinger, 1944] Erwin Rudolf Josef Schrödinger. What is life? 1944

Articoli

[Bastiaan, 2008] Persistent epigenetic differences associated with prenatal exposure to


famine in humans. Bastiaan T. Heijmans, Elmar W. Tobi, [...], and L. H. Lumey. PNAS, 2008.
vol. 105, no. 44. 2008

[Bejerano, 2004] Ultraconserved Elements in the Human Genome. Science, 2004, Vol 304, Issue
5675.

[Chargaff, 1950] Composition of human desoxypentose nucleic acid. Erwin Chargaff.


(1950).

[Egger, 2004] Epigenetics in human disease and prospects for epigenetic therapy. Gerda
Egger, Gangning Liang, Ana Aparicio, Peter A Jones. Nature. 2004;429(6990):457-63.

[Fariselli & Taccioli, 2020] DNA sequence symmetries from randomness: the origin of the
Chargaff’s second parity rule Piero Fariselli, Cristian Taccioli, Luca Pagani, Amos Maritan
Author Notes Briefings in Bioinformatics, Volume 22, Issue 2, March 2021, Pages 2172–2181,
https://doi.org/10.1093/bib/bbaa041

[Feinberg, 1983] Hypomethylation distinguishes genes of some human cancers from their
normal counterparts. Andrew P. Feinberg & Bert Vogelstein. Nature. 1983;301:89-92.

[Franklin, 1953] Evidence for 2-Chain Helix in Crystalline Structure of Sodium


Deoxyribonucleate. Rosalind Franklin. (1953) (Contenuto a pagina 29).

[Grønbaek, 2007] Epigenetic changes in cancer. Kirsten Grønbaek 1, Christoffer Hother, Peter
A Jones. APMIS. 2007;115(10):1039-59.

[Jones, 2002] The fundamental role of epigenetic events in cancer. Peter A Jones, Stephen
B Baylin. Nat Rev Genet. 2002 Jun;3(6):415-28.

[Kaat, 2002] Cardiovascular and diabetes mortality determined by nutrition during parents' and
grandparents' slow growth period. G Kaati, LO Bygren & S Edvinsson. European Journal of
Human Genetics. 2002;10:682-688.

[Karkas, 1968] Separation of B subtilis DNA into complementary strands II template


functions and composition as determined by transcription with RNA polymerase. Karkas JD,
Rudner R, Chargaff E. Proc Natl Acad Sci U S A 1968;60:915–20.

[Liberatore, 2016] The role of mitochondria in plant development and stress tolerance.
Liberatore KL, Dukowic-Schulze S, Miller ME, Chen C, Kianian SF. Free Radic Biol Med.
2016;100:238-256.

[Liu, 2013] A meta-analysis of the genomic and transcriptomic composition of complex life.
Ganqiang Liu; John S. Mattick; Ryan J. Taft. (2013) (Contenuto nelle pagine 31, 32).

[McClintock, 1950] The origin and behavior of mutable loci in maize. Barbara McClintock.
(1950) (Contenuto a pagina 34).

[Raspa, 2017] Public Health Literature Review of Fragile X Syndrome". Raspa M,


Wheeler AC, Riley C. Pediatrics. 139 (Suppl 3): S153–S171. doi:10.1542/peds.2016-1159C.
PMC 5621610. PMID 28814537. 2017

[Robertson, 2002] DNA methylation and chromatin unraveling the tangled web. Keith D
Robertson. Oncogene. 2002;21(35):5361-79.

[Rudner_a, 1968] Separation of B. subtilis DNA into complementary strands, I. biological


properties. Rudner R, Karkas JD, Chargaff E. Proc Natl Acad Sci U S A 1968;60:630–5.

[Rudner_b, 1968] Separation of B. subtilis DNA into complementary strands. 3. Direct


analysis. Rudner R, Karkas JD, Chargaff E. Proc Natl Acad Sci U S A 1968;60:921–2.

[Sinclair, 2015] Necessary relations for nucleotide frequencies. Robert Sinclair. (2015)
(Contenuto apagina 34).

[Stence & Crespi, 2013] What is genome? A. Stencel and B. Crespi. Molecular Ecology 22,
3437–3443. 2013

[Szybalski, 1966] Pyrimidine clusters on the transcribing strand of DNA and their possible
role in the initiation of RNA synthesis. Waclaw Szybalski. (1966) (Contenuto a pagina 34).

[Thrash, 2011] Phylogenomic evidence for a common ancestor of mitochondria and the
SAR11 clade. J. Cameron Thrash, Alex Boyd, Megan J. Huggett, Jana Grote, Paul Carini, Ryan J.
Yoder, Barbara Robbertse, Joseph W. Spatafora, Michael S. Rappé & Stephen J. Giovannoni.
Scientific Reports. Sci Rep 1. 2011,13:1-9.

[Visone & Croce, 2009] The American Journal of Pathology, Vol. 174, No. 4, Rosa Visone
& Carlo M. Croce, 2009

[Watson & Crick, 1953] A structure for deoxyribose nucleic acids. JD Watson. (1953)
(Contenuto a pagina 29).

[Wilkins, 1953] Molecular structure of deoxypentose nucleic acids. Maurice Wilkins. (1953)
(Contenuto a pagina 29).

63
64
Indice

Symbols Aploide ....................................................... 27, 31


Archea .................................................. 11, 13, 31
16S, rRNA....................................................... 44 ATR-X, sindrome ............................................. 22
23S, rRNA ...................................................... 44 AUG, codone di start ........................................ 45
28S, rRNA ...................................................... 46
30S, subunità ribosoma procariotico ...... 16, 44, 45 B
40S, subunità ribosoma eucariotico .................. 46
43S, complesso proteico .................................. 46 Batteri......................................................... 11, 31
48S, complesso proteico .................................. 46 Batteriofago MS2 ........................................ .... 32
50S, subunità ribosoma procariotico ...... 16, 44, 45 BDK, proteina.................................................. 42
5S, rRNA ........................................................ 44 Beckwith-Wiedemann, sindrome ...................... 22
60S, subunità ribosoma eucariotico .................. 46 Beta tubulina, proteina ..................................... 15
70S, ribosoma procariotico .............................. 44 Bi-sequencing .................................................. 47
80S, ribosoma eucariotico ........................... 44, 46 Biologia cellulare ............................................. 11
Biologia Molecolare......................................... 27
Bolla di replicazione ........................................ 40
A
Bp ............................................................. 31, 32
A branch site, regione di splicing ..................... 43 Buffon, Georges-Louis Leclerc de .................... 19
A, sito ribosoma ......................................... 44, 45
aa-tRNA .......................................................... 45 C
Acido desossiribonucleico ............................... 28
Acido ribonucleico .......................................... 29 C, valore .......................................................... 30
Adenina........................................................... 29 C-terminale, gruppo ......................................... 45
AG, regione di splicing .................................... 43 Cancro ............................................................. 22
Alleli ............................................................... 23 Cap.................................................................. 43
Alu, sequenze trasposoniche ............................ 34 Capsula............................................................ 12
Amminoacidi................................................... 45 Catabolismo ..................................................... 16
Anafase I .......................................................... 21 CDC45, proteina .............................................. 42
Anafase II......................................................... 21 CDC6, proteina ................................................ 42
Anafase mitotica .............................................. 20 CDK, proteina.................................................. 42
Anassimandro.................................................. 19 cDNA .............................................................. 47
Aneuploidia ..................................................... 33 CDT1, proteina ................................................ 42
Anticodone ................................................. 44, 45 Cellula ............................................................. 27

65
66 INDICE

Cellula, definizione........................................... 11 Duplicazione, eventi di ..................................... 32


Cellule asessuali .............................................. 33
Cellule sessuali ........................................... 18, 33 E
Cellule somatiche ................................. 18, 28, 31
Centrioli .......................................................... 16 E, sito ribosoma procariotico ...................... 44–46
Chargaff, Erwin ............................................... 28 Editing post-trascrizionale ................................ 44
Chargaff, I legge ......................................... 28, 33 EF-G, proteina ........................................... 45, 46
Chargaff, II legge ............................................ 33 EF-Tu, proteina .......................................... 45, 46
Cheratina, proteina .......................................... 15 EF-Tu-Ts, proteina ........................................... 46
CHiP-sequencing.............................................. 47 eIF1, proteina................................................... 46
Ciclo cellulare ............................................ 18, 22 eIF1A, proteina ................................................ 46
Ciclo di Krebs ................................................. 15 eIF2, proteina................................................... 46
Ciglia .............................................................. 12 eIF3, proteina................................................... 46
CircRNA ......................................................... 33 eIF4A, proteina ................................................ 46
Citoplasma ...................................................... 12 eIF4B, proteina ................................................ 46
Citoscheletro ................................................... 14 eIF4F, complesso proteico ................................ 46
Citosina ........................................................... 29 eIF4FE ............................................................ 46
Codice universale ............................................ 45 eIF4G, proteina ................................................ 46
Codone............................................................ 45 Elementi ripetuti .............................................. 35
Codone di start ................................................ 45 Elicasi, proteina ............................................... 43
Codoni di start ................................................. 45 ENCODE ........................................................ 33
Codoni di stop ................................................. 45 Endonucleasi ................................................... 47
Coffin-Lowry, sindrome .................................. 22 Enhancers ........................................................ 35
Colorazione Gram ........................................... 13 Epigenetica ..................................... 19–21, 44, 47
CpG ................................................................. 21 eRF1, proteina ................................................. 46
Crick, Francis .................................................. 29 eRF2, proteina ................................................. 46
Cromatina ....................................................... 28 Esoni .................................................... 34, 36, 43
Cromosomi ..................................................... 28 Esportina 5, proteina ........................................ 34
Crossing-over .................................................. 33 Espressione genica ........................................... 44
Cuvier, Georges............................................... 19 Eterocromatina ................................................ 35
Cy3, Cianina 3.................................................. 47 Eterocromatina facoltativa ................................ 35
Cy5 .................................................................. 47 Eucarioti .......................................................... 39
Eucromatina .................................................... 35
D Eventi di riparo del DNA ..................................... 33

Darwin, Charles.......................................... 19, 27 F


Dawkins, Richard ....................................... 23, 32
De Vries ........................................................... 27 Fattori di trascrizione ....................................... 43
Desmina, proteina............................................ 15 Filamenti intermedi .......................................... 15
Desossiribosio ................................................. 40 Flagelli ...................................................... 12, 15
Dicer ............................................................... 34 Fluorofori ........................................................ 47
DNA ................................................................ 27–29 fMet, formil-Metionina .................................... 45
DNA ligasi ...................................................... 34 FMR1, gene ..................................................... 22
DNA mitocondriale ......................................... 15 Fosfolipidi ....................................................... 13
Dna polimerasi Alfa......................................... 42 Fosforilazione ossidativa .................................. 15
DNA polimerasi Delta ..................................... 42 Franklin, Rosalind............................................ 29
DNA polimerasi Epsilon .................................. 42 Fucsina ............................................................ 13
DNA polimerasi III.......................................... 40 Fusione ............................................................ 33
DNA-sequencing .............................................. 47 Fuso mitotico ................................................... 16
DnaA, proteina ................................................ 39
DnaB, proteina ........................................... 39, 40 G
DnaG, proteina ................................................ 40
DNMT ............................................................. 21 G0, fase del ciclo cellulare................................ 22
Drosha/Pasha, complesso proteico ................... 34 G1, fase del ciclo cellulare................................ 22
Drosophyla Melanogaster ................................ 28 G2, fase del ciclo cellulare................................ 22
Duplicazione ................................................... 33 Garbage DNA ....................................................... 32
INDICE 67

GDP, molecola................................................. 46 Membrana plasmatica ................................ 12, 13


Gene ................................................................ 27 Mendel, Gregor ................................................ 27
Genoma............................................................ 27 Mendel, Leggi.................................................. 27
GIN, proteina .................................................. 42 Met-tRNA ....................................................... 46
Girasi, proteina ................................................ 39 Met-tRNA, amminoacido+tRNA ...................... 46
Glicolisi .......................................................... 15 Metafase I ........................................................ 21
Golgi ............................................................... 16 Metafase II....................................................... 21
Gould, SJ ........................................................ 20 Metafase mitotica............................................. 20
Gram negativi.................................................. 12 Metilazione ...................................................... 21
Gram positivi .................................................. 12 Microarray....................................................... 46
Gram, Christian ............................................... 13 Microfilamenti ................................................. 14
GTP, molecola ................................................. 46 MicroRNA....................................................... 33
GU, regione di splicing .................................... 43 Microtubuli ...................................................... 16
Guanina........................................................... 29 miRNA ...................................................... 34, 44
GUG, codone di start batterico ......................... 45 Mitocondri ....................................................... 15
Mitosi ............................................. 16, 18, 20, 28
H Modificazioni istoniche .................................... 22
mRNA ....................................................... 15, 29
Haemophilus influenzae .................................. 32 Mutazioni ........................................................ 27

I N
I, fase del ciclo cellulare .................................. 22 N-terminale, gruppo ......................................... 45
IF1, proteina .................................................... 45 Next Generation Sequencing ............................ 31
IF2, proteina .................................................... 45 Non-coding RNA............................................ 31, 44
IF3, proteina .................................................... 45 Nucleina .......................................................... 28
IHGSC, consorzio genoma umano ................... 33 Nucleo ............................................................. 14
Ini ................................................................... 43 Nucleoscheletro ............................................... 15
Introni ............................................ 33, 34, 36, 43
Istoni .......................................................... 14, 44 O

J Okazaki, frammenti............................... 39, 40, 42


Oncosoppressori ................................... .......... 22
Johannsen, Wilhelm ......................................... 27 Operone ........................................................... 43
Junk DNA ............................................................. 32 ORC, proteina .................................................. 42
Organismi pluricellulari ................................... 11
L ORI ................................................................. 42

Lagging, filamento 40, 42 Lamarck, Jean-Baptiste P


....................................................................... 19
Lamina, proteina......................................... 14, 15 P, sito ribosoma .......................................... 44, 45
Leading, filamento...................................... 40, 42 PABP, complesso proteico .......................... ..... 46
Lederberg ......................................................... 27 PCNA, proteina................................................ 42
Ligasi, proteina........................................... 40, 42 PCR................................................................. 46
LINEs ........................................................ 33, 34 Peptidoglicano ................................................. 12
Lisosomi ......................................................... 16 Perossisomi...................................................... 16
Long non-coding RNA .............................23, 33, 35 PiRNA ....................................................... 33, 35
LPS ................................................................. 12 Plasmidi........................................................... 12
LTR, zone geneomiche .................................... 30 Poliploidia ....................................................... 30
LTRs ................................................................ 33, 34 Polisaccaridi .................................................... 14
Poly-A ............................................................. 43
M Prader-Willi, sindrome ..................................... 22
Pre-miRNA...................................................... 34
McClintock, Barbara ....................................... 34 Pri-miRNA ...................................................... 34
MCM, proteina elicasi ..................................... 42 Primer........................................................ 40, 42
Meiosi .................................................. 18, 21, 28 Procarioti ......................................................... 39

67
68 INDICE

Profase I ........................................................... 21 Shine-Dalgarno, sequenza .......................... 45, 56


Profase II.......................................................... 21 Sigma, proteina ................................................ 42
Profase mitotica ............................................... 20 SINEs .............................................................. 34
Prometafase mitotica ....................................... 20 Sonda .............................................................. 47
Promotore ....................................................... 43 Spliceosoma .................................................... 43
Proteina ...................................................... 27, 33 Splicing ........................................................... 43
Proteine ........................................................... 28 Splicing alternativo .................................... 43, 44
Proteosomi ...................................................... 16 SSB, proteine ............................................. 40, 42
Pseudogeni ...................................................... 32 STF, complesso proteico .................................. 43
pseudogeni ...................................................... 32 Streptococchi ................................................... 12
Pyrimidine rich region, regione di splicing ....... 43 Strumenti da laboratorio ................................... 46
Struttura del DNA................................................. 29
Q subunità dello spliceosoma ............................... 44

qRT-PCR ............................................................... 46
T
R
TATA box .................................................. 42, 43
r, proteine ribosomiali ...................................... 44 Tau, complesso proteico ............................. ..... 40
Regolazione genica.......................................... 28 Taxa ....................................................................... 31
Replicone ........................................................ 39 TBP, proteina ................................................... 43
RER ................................................................ 46 Telofase II........................................................ 21
Reticolo Endoplasmatico ................................. 16 Telofase mitotica .............................................. 20
Reticolo Endoplasmatico Ruvido ..................... 16 Telomerasi, proteina ......................................... 42
Retrotrasposoni .......................................... 30, 34 TFIIA, proteina ................................................ 43
RF1, proteina................................................... 45 TFIIB, proteina ................................................ 43
RF2, proteina................................................... 45 TFIID, proteina ................................................ 43
Rho, proteina ................................................... 43 TFIIF, proteina ................................................. 43
Rho, proteina elicasi ........................................ 43 TFIIH, proteina ................................................ 43
Riarrangiamenti cromosomici .......................... 33 Timina ............................................................. 29
Ribosoma .................................. 12, 16, 29, 45, 46 Topoisomerasi IV............................................. 41
ribosoma ......................................................... 44 Traduzione................................................. 29, 46
Riproduzione ................................................... 18 Trascrizione ............................................... 29, 33
RNA................................................................. 27, 29 Trasposasi, proteina ......................................... 34
RNA non-codificanti ....................................... 35 Trasposoni ................................................. 32–34
RNA polimerasi I ............................................ 30 Trasposoni a DNA ................................................ 34
RNA polimerasi II .......................... 30, 34, 42, 43 tRNA ......................................................... 29, 44
RNA polimerasi III ..................................... 30, 34
RNA-sequencing .............................................. 47
RRF, proteina .................................................. 46 U
rRNA .............................................................. 29
U1, subunità dello spliceosoma ........................ 44
rRNA, 16S ...................................................... 45
U2, subunità dello spliceosoma ........................ 44
RT-PCR ................................................................. 46
Rubenstein-Taybi, sindrome ............................ 22 U3, proteina ..................................................... 44
U4, subunità dello spliceosoma ........................ 44
U5, subunità dello spliceosoma ........................ 44
S UAA, UAG e UGA, codoni di stop ................... 45
UAC, anticodone di start .................................. 45
S, fase del ciclo cellulare ................................. 22
Saccharomyces cerevisiae ................................ 32 UCRs............................................................... 35
Sanger ............................................................. 32 UPS ................................................................. 43
Scimpanzè ....................................................... 33
Selenocisteina ................................................. 46 V
Semiconservativa, replicazione ........................ 40
Sequenze palindromiche .................................. 33 Vacuoli................................................................... 16
Sequenze ultraconservate ................................. 35 Vimentina, proteina .......................................... 15
Sequenziamento .............................................. 32 Vita, definizione ............................................... 11
INDICE 69

W
Watson, James ................................................. 29
Western blot...................................................... 47
Wilkins, Maurice ............................................. 29

X
X fragile .......................................................... 22

69

Potrebbero piacerti anche