Sei sulla pagina 1di 23

LA COMPLESSITA' DEL GENOMA

DELLE PIANTE
La cellula vegetale contiene tre genomi:
•il genoma nucleare (nDNA)

•il genoma cloroplastico (cpDNA)

•il genoma mitocondriale (mtDNA).

Questi tre genomi interagiscono l'un l'altro e presentano un diverso livello di


differenziazione durante l'evoluzione. Generalmente, DNA cloroplastico e DNA
mitocondriale sono quelli più conservati. Numerosi confronti fra specie con diversa
posizione lungo l'arco evolutivo hanno indicato che il genoma degli organelli ha
subito, comparativamente, pochi cambiamenti a livello molecolare in bilioni di anni di
evoluzione, rispetto al DNA nucleare, che invece presenta notevoli differenze di
organizzazione e di dimensione non solo tra specie lontane ma anche tra specie
strettamente correlate.
IL GENOMA NUCLEARE

I solenoidi si dispongono in anse tenute insieme


da RNA e proteine non istoniche, e questa
disposizione è caratteristica di un cromosoma in
metafase di circa 4 micron, cioè 104 volte più
piccolo della molecola di DNA in esso contenuta.

I nucleosomi sono poi arrangiati in sequenza lungo


una fibra di cromatina che è ulteriormente
condensata in lunghezza con una ulteriore
compattazione di altre 6 volte dovuta alla
condensazione d 6,7 nucleosomi a formare una
struttura detta solenoide.

E' organizzato in strutture dette nucleosomi che


rappresentano l'unità base dei cromosomi e che
condensano il DNA in lunghezza di 5 volte.

Il genoma nucleare eucariotico è costituito da molecole di DNA lineare a


doppia elica secondo il modello di Watson e Crick, complessate con
proteine basiche, gli istoni.
IL PARADOSSO DEL VALORE C
La mancanza di correlazione tra complessità fenotipica degli organismi e
contenuto aploide di DNA è nota come "paradosso del valore C".

Ciascuna specie eucariotica ha una


caratteristica quantità di nDNA.

La quantità nelle cellule aploidi di una specie è


detta "valore C" ed è espressa in unità di paia
di basi (bp), picogrammi (pg) o come peso
molecolare (dalton).

1 pg è pari a 109 bp o 6x1011 daltons.

Il range del valore C è più esteso tra le piante


che tra qualunque altro gruppo di organismi.

Non c'è assolutamente correlazione tra valore


C e complessità fenotipica tra gli organismi
multicellulari.
Il paradosso del valore C è nato dall’assunto che la
dimensione del genoma nucleare avrebbe dovuto
aumentare in proporzione alla complessità fenotipica, in
funzione del numero dei geni.

Le analisi molecolari hanno dimostrato che questo


assunto è falso.
Nei genomi eucariotici solo l’1-2% corrisponde a geni
codificanti proteine.

Il paradosso del valore C è spiegato in base


all'esistenza di DNA ripetuto. In generale le specie
con valore C più elevato contengono maggiore quantità
di DNA ripetuto.
Fra le piante da fiore, fino all'80% del genoma nucleare
totale può essere costituito da DNA ripetuto.
Come è stato scoperto il DNA ripetuto,
la sua eterogeneità, e come si può
analizzare?
Il DNA è una macromolecola che
può essere denaturata e
rinaturata mediante variazioni di
temperatura. In una soluzione di
DNA frammentato e denaturato,
si può avere riassociazione solo
tra singole eliche con sequenze
complementari, per cui la
velocità di riassociazione sarà
una funzione della
concentrazione delle singole
eliche complementari. Se
indichiamo con C questa
concentrazione espressa in moli
di nucleotidi per litro e per
tempo (secondi) (moli-1xsec-
1xlitro), sapremo che ad ogni

dato tempo del processo di


rinaturazione, la frazione di
DNA che è ancora a singola elica
è inversamente proporzionale
alla concentrazione iniziale e al
tempo.
Nel genoma eucariotico le sequenze uniche o sequenze a
singola copia (in un organismo diploide ce ne sono quindi due)
sono rappresentate dai geni strutturali che codificano per
proteine.

Sequenze mediamente ripetute (da 103 a 105 copie). A


questa categoria appartengono i geni ripetuti.

Sequenze altamente ripetute (più di 105 copie)


Come sono organizzate le sequenze
ripetute?
Sequenze ripetute in tandem: sono disposte testa coda nel
genoma
TATATATA TGATTTGGTCAA TGATTTGGTCAA TGATTTGGTCAA

Geni ripetuti in tandem, cioè disposti l'uno dopo l'altro, testa-


coda nel genoma. Possono essere localizzati sullo stesso
cromosoma o su cromosomi diversi.

I geni ripetuti sono i geni che controllano la sintesi di alcune proteine come la famiglia delle
globine, la leghemoglobina, l'actina, le proteine "heat-shock", i geni per la sintesi di RNA
ribosomale, di RNA di trasporto, degli istoni, i geni per iso- e allo enzimi. Il numero di copie di
queste sequenze varia a seconda della specie considerata.
DNA non genico ripetuto in tandem è associato ai
centromeri e ai telomeri. Questo tipo di sequenze fa parte
delle altamente ripetute.
1.Le sequenze centromeriche sono esempi di sequenze altamente
ripetute trascritte. Hanno un contenuto in GC diverso da quello medio del
DNA totale di un organismo. Per questo motivo se i cromosomi sono
frammentati e centrifugati in una soluzione di cloruro di cesio (CsCl) che
separa il DNA sulla base della densità data dal contenuto in GC, queste
sequenze formano una banda a sedimentazione distinta detta DNA
satellite

rho 1,687

rho 1,70
2. I telomeri rappresentano la regione di DNA all'estremità di un
cromosoma lineare, generalmente, ma non essenzialmente,
eterocromatica. Nella maggior parte degli organismi studiati i telomeri
sono associati intimamente alla membrana nucleare. La loro
organizzazione è molto importante perché la loro funzione è quella di
protezione, di stabilizzazione dei cromosomi. Tutti i telomeri di una data
specie presentano una sequenza comune.

Le sequenze telomeriche possono essere suddivise in due tipi:

sequenze telomeriche semplici alle sequenze associate ai telomeri,


estremità dei cromosomi, costituite ovvero regioni vicine alle estremità
da sequenze semplici ripetute in dei cromosomi, ma non proprio
tandem. all'estremità, sono costituite da
ripetute complesse che si
estendono per molte migliaia di basi
dall'estremità della molecola di
DNA cromosomico.

La sequenza telomerica base, tipica delle piante (5'⇒TTTAGGG⇒3',


caratterizzata in Arabidopsis) presenta una notevole omologia con quella
dell'uomo (5'⇒TTAGGG⇒3').
Altri tipi di sequenze ripetute in tandem

Alcune sequenze ripetute in tandem caratterizzate da un motivo base lungo


da 9 a 24 bp sono state classificate come minisatelliti (hanno struttura più
corta, ma sono simili al classico DNA satellite).

Altre brevi sequenze il cui modulo di ripetizione è costituito da 1 a 6 coppie


di basi sono invece dette microsatelliti o short tandem repeats.
Sequenze ripetute disperse

Le sequenze ripetute disperse sono invece sparse nel genoma e


comprendono sia sequenze geniche che non geniche. Esempi di sequenze
ripetute disperse sono le SINEs (short interspersed nucleotide elements,
lunghe da 100 a 500 bp) e le LINEs (long interspersed nucleotide
elements), lunghe fino a 5000 bp)

Questo tipo di sequenze ripetute sono alquanto particolari in quanto


sono classificate come un tipo particolare di elementi trasponibili,
ovvero i retroposoni comuni ad animali e piante.
Le SINEs sono retropseudogeni, ovvero sequenze retrotrascritte da messaggeri in
cDNA e poi duplicate. L'evento di duplicazione ha poi condotto all'accumulo di
mutazioni che rendono non esprimibile tale sequenza pur essendo originariamente un
gene. Un esempio di questo tipo nell'uomo sono le sequenze Alu, così definite perché
caratterizzate da sequenze riconosciute dall'enzima di restrizione AluI.
Le LINEs sono retrosequenze, cioè sequenze genomiche, anch'esse
derivate da trascrizione inversa di RNA e successiva integrazione nel
genoma. Tutti gli organismi eucarioti hanno SINE e LINE ma le
proporzioni variano notevolmente. La loro localizzazione è varia all'interno
del genoma: si possono trovare negli introni, nelle sequenze fiancheggianti
i geni e nel DNA satellite e quando si trovano in queste posizioni possono
anche essere trascritte.
Come si originano le sequenze ripetute?
Uno dei meccanismi più potenti
dell'amplificazione del DNA è il
modello del "rolling circle". Una singola
unità di ripetizione è convertita in un
"circolo rotante" da cui si generano per
replicazione diverse unità convertite in
DNA duplex, tagliate dal circolo e
ricongiunte nella molecola di DNA
lineare. Il materiale amplificato
consiste perciò di un grosso numero di
ripetizioni identiche.
La produzione di
più copie di geni
per r-DNA, oltre al
meccanismo appena
descritto può
avvenire invece per
crossing over
ineguale tra
cromosomi diversi
o
intracromosomico.
I meccanismi alla base della
variazione del numero di copie di
microsatelliti implicano un errato
appaiamento delle ripetizioni
durante la replicazione del DNA,
fenomeno noto come replication
slippage (scivolamento della
polimerasi durante la
replicazione). Durante la
replicazione lo scivolamento può
avvenire tra ripetizioni contigue
portando a delezione o
duplicazione di un segmento di
DNA.

Il fenomeno dello slippage può avvenire anche in assenza di replicazione, ed in


questo caso si formeranno delle anse in corrispondenza di basi appaiate
erroneamente che verranno riparate. Il riparo porterà a delezioni o duplicazioni
dell'unità di ripetizione.
Come si può spiegare il paradosso del
valore C?
Per spiegare la presenza del DNA non genico sono state fatte 4 ipotesi
che si basano tutte sul possibile ruolo funzionale di tale tipo di sequenze.

1. Il DNA non genico è "junk", spazzatura. In tal senso non ha


funzione, non provoca né danno, né beneficio. E' quindi ininfluente
per l'adattamento di un individuo.

2.Il DNA non genico è un "parassita", privo di funzione o "selfish


DNA", DNA egoista. DNA "junk" o "selfish" si accumula ma è
mantenuto perché non costa in termini metabolici, quindi di spesa in
nutrienti ed energia per il suo mantenimento.

3.Il DNA non genico ha una funzione strutturale.


4.Il DNA non genico è essenziale per la sopravvivenza, per la
riproduzione e quindi per l'adattamento.
• E’ alla base della formazione di strutture non-B: correlate a tratti di
sequenze omogenee (ripetizioni semplici, omopurine, omopirimidine)
distribuite in regioni non codificanti del DNA (upstream, introni).
•Le sequenze omogenee delle zone di regolazione hanno un ruolo nella
modulazione dell’espressione genica e quindi della determinazione
fenotipica.