Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUZIONE
Per ricostruire il nostro passato dobbiamo attingere a delle fonti di informazioni diverse tra di loro.
Ad esempio le fonti archeologiche (prima fonte di informazione dello studio dell’evoluzione
umana), la genetica (perché il DNA porta l’informazione di tutti i processi demografici delle
popolazioni antiche della nostra specie – questo vuol dire che dall’analisi del nostro DNA siamo in
grado di poter capire quando due popolazioni si sono separata l’une dalle altre; possiamo capire
un determinato gruppo umano ha interagito con altre specie umane).
Dunque le analisi genetiche vanno a completare le informazioni ricavate dalle analisi dei siti
archeologici.
La tecnologia ci ha inoltre tutto permesso di estrarre campioni biologici dai resti fossili, o dai siti
archeologici. Permettendoci così di accedere al genoma dei nostri antenati.
MODELLO A SINGOLA USCITA (avviene 40-45 mila anni fa): la prima ipotesi viene chiamata “Out of
Africa”, cioè una dispersione fuori dal continente africano, a singola uscita. Questo vuol dire che
una piccola popolazione africana, con un unico grande evento è uscita dall’Africa, diffondendosi in
Europa, Eurasia e recentemente in America.
MODELLA A MULTIPLA USCITA (avviene 100 mila anni fa per la prima, 45 mila anni fa per quella
più recente): una valida alternativa. Secondo questa ipotesi, le ondate di diffusione sono state
almeno due; la prima più antica ha coinvolto solo le popolazioni austronesiane. La seconda, molto
più recente, ha coinvolto le popolazioni europee e asiatiche
I genetisti hanno deciso di testare questi due modelli, andando ad analizzare il genoma di individui
antichi (es. Homo sapiens arcaici), sia di individui attualmente vivi (uomo moderno).
Come accennato già in precedenza (vedi cap.1) il DNA umano contiene le tracce di tutti i
cambiamenti demografici avvenuti nella storia della nostra specie.
I modelli altro non presentano che due fenomeni demografici differenti, quindi uno dei due
modelli avrà lasciato delle tracce di cambiamenti demografici all’interno del DNA della specie
umana. Le tracce all’interno del genoma devono essere ovviamente ricostruite tramite simulazioni.
Di questi due modelli presumiamo di conoscere tutte le dinamiche demografiche e quindi date
queste dinamiche noi possiamo simulare qual è la variabilità genetica attesa secondo il
primo/secondo modello.
Una volta prodotte queste simulazioni di variabilità genetica noi le confrontiamo con la variabilità
genetica realmente osservata (quella variabilità genetica ottenuta analizzando i genomi degli
individui di varie popolazioni attualmente in vita).
Confrontando i dati ottenuti, abbiamo constatato quale dei due modelli ha prodotto dei dati di
variabilità genetica più simili a quelli osservati. I dati ottenuti sembrano essere in accordo con il
modello a multipla uscita.
2. DEFINIZIONE DI EVOLUZIONE
Cos’è l’evoluzione? È cambiamento, ma spesso viene frainteso come miglioramento o progresso. In
realtà è un processo passivo non direzionale. L’azione dei processi evolutivi non ha uno scopo con
un fine ultimo, quindi quello che realmente accade non è altro che una trasmissione di
determinate caratteristiche da una generazione all’altra e di un successivo differenziamento di
queste caratteristiche.
Questi sono fatti assolutamente dimostrati, perché l’evoluzione è un processo avvenuto in tempi
antichi che continua ad avvenire. Ci basti guardare l’albero delle specie viventi per capire non è un
processo lineare volto alla produzione di esseri sempre più efficaci o perfetti.
Inoltre, con il termine evoluzione, si intende anche lo studio dei meccanismi attraverso i quali
l’evoluzione si è compiuta e si compie. Infatti ricordiamoci che l’evoluzione è solo un cambiando
della specie nel tempo, ma i meccanismi che agiscono su questi cambiamenti non fanno parte del
processo evolutivo in sé. Ad esempio la selezione naturale è un meccanismo che agisce
sull’evoluzione, contribuendo a modellare i cambiamenti che avvengono passando da una
generazione all’altra.
Grazie al DNA non solo possiamo andare ad analizzare le interazioni infra-specifiche e intra-
specifiche, ma possiamo anche capire le basi della diversità biologica, cercando di capire a cosa
sono dovute le varie caratteristiche fisiche o morfologiche di ogni specie vivente (es. perché i
pavoni hanno questo piumaggio estremamente colorato).
Non solo: possiamo identificare le basi dell’adattamento ambientale delle specie in quella data
zona.
I principali interessi erano capire quali fossero le relazioni tra queste due specie, e quali geni
dell’orso polare erano stati selezionati per adattarsi meglio alla ambiente artico e sopravvivere.
I ricercatori si sono concentrati sullo studio di evidenze di selezione dell’orso polare. Hanno trovato
due segnali di selezione, che riguardano due geni differenti. Il primo gene, chiamato apoB, è
coinvolto nella catena metabolica degli acidi grassi ed è anche coinvolto nello sviluppo del tessuto
adiposo. Il secondo gene, o secondo segnale di adattamento al clima freddo è un gene collegato al
fenotipo bianco; un fenotipo estremamente comune nelle specie che vivono nel circolo polare
artico. Si pensa dunque che il fenotipo bianco sia un vantaggio, perché aumenta la mimetizzazione
aumentando conseguentemente le possibilità di successo durante la caccia.
Abbiamo anche delle applicazioni dell’ambito della medicina forense. Lo studio dei campioni di
DNA prelevati da una scena del crimine; l’analisi di caratteristiche genetiche permettono di
identificare i possibili sospettati di un crimine.
Un altro studio delle pandemie riguarda invece la diffusione dei patogeni che hanno decimato le
popolazioni indigene messicane, subito dopo il contatto con le popolazioni europee.
Molti patogeni che hanno causato gli alti livelli di mortalità tra gli indigeni non sono ancora
identificati. Nello studio Salmonella enterica genomes recovered from victims of a major 16th
century epidemic in Mexico hanno confrontato dei campioni di microrganismi campionati dalle
sepolture di individui morti prima dell’arrivo degli europei, con dei campioni prelevati da delle
sepolture di individui deceduti post-contatto con gli europei.
Con la metodologia “meta genomica’’ hanno analizzato tutte le specie presenti in tutti i due e
campioni (indigeni deceduti post e pre-contatto con gli europei). Hanno scoperto che l’unico
patogeno che non era presente nelle sepolture pre-contatto era la Salmonella enterica (S.
enterica).
TL; DR: Charles Darwin propose due teorie principali: la prima è quella della discendenza con
modificazioni, ovvero l’evoluzione; la seconda è la teoria dell’evoluzione per selezione naturale.
Ricordiamoci che la causa dello stress biologico selettivo (in questo caso l’antibiotico) non è mai la
causa del processo mutazionale. Quindi: il cambiamento dell’ambiente non produce una
mutazione favorevole nelle specie esposte a questa pressione selettiva. La mutazione è un
processo casuale e indipendente, perché le mutazioni possono essere già presenti all’interno del
pool della specie.
Lamarck propose la teoria che i cambiamenti nel mondo biologico erano il risultato di leggi
naturali, e non di qualche imposizione divina. I principi cardine della teoria proposta da Lamarck
erano principalmente due.
Il primo principio afferma che le specie si generano di continuo, e quindi supera l’idea di fissismo e
immutabilità delle teorie precedenti. Il secondo principio afferma che questo dinamismo
(cambiamenti e mutazioni) era il risultato di una risposta attiva a determinati bisogni degli
individui, permettendo lo sviluppo di caratteristiche utili trasmissibili alla prole.
Un esempio modello è l’evoluzione del collo delle giraffe: l’uso è il disuso di determinate
caratteristiche (definiti come caratteri acquisiti e successivamente caratteri adattativi) può portare
alla modificazione morfologica di determinati individui.
3.3 BASI DELL’EVOLUZIONISMO – CHARLES DARWIN
Nel periodo di studio sulle Isole di Galapagos in Equador, Darwin venne fortemente influenzato
dalle teorie di Malthus. Quest ultimo era un economista, e la teoria che influenzo parecchio Darwin
era la teoria secondo cui il tasso di crescita di una popolazione fosse maggiore rispetto al tasso di
crescita delle risorse alimentari.
In questo modo la crescita della popolazione doveva essere ridotta per poter usufruire della
scarsezza delle risorse alimentari, assicurando la sopravvivenza della popolazione.
L’idea che la crescita della popolazione fosse influenzata dalla disponibilità delle risorse alimentari,
influenzò Darwin e fu alla base del pensiero della selezione naturale, secondo cui: solo determinati
gruppi di individui sopravvivono alle pressioni dell’ambiente circostante, i meno adatti non si
riproducono e la specie perisce.
Riassunse questi principi portando le prove di questi processi, raccolte dalle analisi dello studio dei
fossili, della geologia, dell’anatomia comparata, ecc.
Uno degli esempi dell’evoluzione riportato ne: L’origine della specie, è rappresentato dalla storia
evolutiva dei fringuelli delle Isole Galapagos. Le caratteristiche principali che differenziavano
queste specie risiedono nella forma morfologica e nella funzione specifica del becco, quest’ultima
legata alla categoria di cibo di cui i fringuelli si nutrivano.
La parte iniziale dell’albero genealogico, che contiene gli antenati comuni di tutte le specie dei
fringuelli, riporta un’ampia ramificazione basata sull’ambiente in cui i fringuelli abitano.
Possiamo dunque dire che queste specie si sono adattate a specifici ambienti e ad una specifica
alimentazione, ma discendono tutte da un antenato comune.
3.4 DIFFERENZE PRINCIPALI TRA DUE TEORIE EVOLUZIONISTICHE – LAMARCK E DARWIN
Secondo Lamarck le specie evolvono, ereditando dei caratteri acquisiti con uno sviluppo grazie
all’uso o disuso di una determinata caratteristica, perché utile nella risposta di un determinato
bisogno (es. delle giraffe, vedi cap. 3.2)
Secondo la teoria evoluzionistica Darwiniana nel gruppo originale della specie delle giraffe erano
presenti sia individui con colli più sviluppati, sia individui con colli corti. La pressione naturale, e
dunque la capacità di raggiungere le foglie sui rami più alti degli alberi, ha fatto sì che gli individui
più dotati sopravvivessero.
Nella teoria di Lamarck il collo lungo è dunque una caratteristica acquisita, mentre nella teoria
evoluzionistica di Darwin, la variabilità (collo lungo/corto) erano già presenti simultaneamente
nella specie delle giraffe, ma la capacità di rispondere meglio agli stimoli, ha fatto si che solo gli
individui con il collo lungo sopravvivessero.
Quindi si supera l’idea di progressione biologica proposta da Lamarck, che proponeva un progresso
evoluzionistico basato sulla trasformazione di una data specie in individui sempre più specializzati.
Dunque si abbraccia la teoria di Darwin, rappresentata da un albero con diversi noti raffiguranti la
formazione di due specie con caratteristiche distinte, la cui base simboleggia un antenato comune,
mentre i rami rappresentano le modificazioni morfologiche o genetiche.
TL; DR: le mutazioni possono avvenire in qualsiasi cellula del nostro corpo, sia in cellule somatiche
che germinali. Siccome le mutazioni vengono trasmesse alla progenie queste assumono un
significato evolutivo e sono la prima fonte di variabilità.
Le modificazioni che avvengono al livello della sequenza del DNA hanno una forte influenza sul
fenotipo risultante. Se il genotipo costituisce la sorgente primaria della variazione, il fenotipo è il
bersaglio finale dell’evoluzione: è l’elemento su cui le pressioni evolutive lavorano. La selezione
naturale seleziona determinati fenotipi, questi fenotipi sono direttamente dipendenti dal
genotipo. Le mutazioni che producono un effetto fenotipico sono quelle mutazioni che avvengono
all’interno delle porzioni del genoma codificanti, e sono dunque funzionali alla produzione delle
proteine.
Le mutazioni; ogni codone codificante un AA può mutare in altri 9 codoni attraverso sostituzioni di
un singolo nucleotide. Un esempio è il codone CCU che codifica per l’amminoacido prolina.
I nuovi codoni differenti hanno effetti differenti a livello di produzione dell’amminoacido. Tuttavia,
nonostante questo forte potere di modifica
degli amminoacidi che vanno a comporre le
proteine, il sistema di traduzione dei
codoni in amminoacidi limita gli effetti
delle mutazioni. Infatti il codice genetico è
ridondante, o degenerato. Questo vuol dire
che diverse triplette codificano per lo stesso
amminoacido.
L’inserzione o delezione di tre (o multipli di tre) nucleotidi non altera il frame di lettura dell’ORF
(viene mantenuto il frame), e risulta quindi essere maggiormente tollerabile nel corso
dell’evoluzione (la proteina risulterà essere un po’ più lunga o leggermente più corta).
Se si verifica l’inserzione o la delezione di un numero diverso di nucleotidi, allora il codice di lettura
risulterà falsato, generando probabilmente una proteina non funzionale:
4.5 GENERZIONE DELLA VARIABILITÀ – MUTAZIONI DELLE SEZIONI RIPETUTE DEL GENOMA
In questo caso le mutazioni sono causate da uno scivolamento della polimerasi durante la
replicazione. Sappiamo che nel genoma ci sono delle regioni composte da piccole sequenze
ripetute. In queste regioni la precisone della polimerasi viene a meno, capita dunque che aggiunga
più ripetizioni a quelle esistenti del filamento stampo.
Queste sono le regioni con il più alto tasso di mutazioni genomiche. Questi loci del DNA vengono
utilizzati spesso per il riconoscimento degli individui, infatti ogni essere umano ha un particolare
polimorfismo di numero di coppie.
5. INDIVIDUI E POPOLAZIONI
I geni nell’individuo sono determinati dalle leggi Mendeliane. Ricordiamoci che un individuo può
essere omozigote per allele (lo stesso allele
ad un locus in organismi diploidi), oppure
eterozigote per allele (alleli diversi ad un locus
in organismi diploidi), a seconda di quello che
ha ereditato dal padre e dalla madre. Sappiamo
che la popolazione è definita dalle frequenze alleliche (da: corso di Genetica – UniFe prof.ssa C.
Scapoli).
Per definire la popolazione genica prendiamo in esempio una moltitudine di lucertole.
Le (N=) 5 lucertole sono organismi diploidi, avendo a disposizione un totale di 10 genomi aploidi
(cromosomi) in totale.
Come possiamo vedere il loco viola è monomorfica perché uguale in tutti gli individui, e dunque
non può esserci variabilità. Mentre Per i loci primi c’è variabilità. Nella popolazione dunque
andiamo a considerare la struttura di ogni singola posizione del genoma, vedendo in tutta la
popolazione, quanti alleli e con quale sequenza si presentano. Quindi una popolazione è definita
dal suo pool genico – set di alleli presenti in tutta la popolazione.
Molto importante, nella genetica di popolazione, è la dimensione della popolazione: in genere
indicata con N per la componente aploide, 2N per la diploide (da non confondere con il numero
degli individui riportato nell’esempio grafico delle lucertole).
Le frequenze alleliche cambiano nel tempo; questa è la base di tutta la genetica evoluzionistica.
L’evoluzione è determinata dal cambiamento delle frequenze alleliche.
Nell’esempio riportato sopra abbiamo parlato di alleli, in realtà, quando si parla di variabilità
genetica si preferisce lo studio del genotipo e delle specifiche sequenze nucleotidiche o addirittura
di interi genomi.
Il pool genico è l’insieme di tutti gli alleli contenuti nella popolazione ad un determinato locus.
I loci possono presentare più alleli: i gruppi di individui di sottopopolazione diverse possono
presentare assortimenti allelici differenti che si combinano in genotipi differenti.
Ma come possiamo descrivere quantitativamente il pool genico?
Bisogna campionare due numeri differenti: la frequenza allelica (spesso citata nei testi didattici
come frequenza genica) dei vari alleli che compongono il pool genico, e siccome abbiamo detto
che gli alleli si uniscono per formare i genotipi; bisognerà di conseguenza analizzare la frequenza
genotipica.
Come estraiamo queste informazioni? Abbiamo i numeri assoluti, o le frequenze relative (per
entrambe le frequenze alleliche e genotipiche).
In una popolazione naturale sono presenti 3 fenotipi facilmente distinguibili dovuti a 2 alleli del
locus A:
A’ A’ 353
A’ A 494
AA 153
TOTALE 1000
Premessa: stiamo studiando un singolo locus bi-allelico (A’/A = A/a) a dominanza completa.
Usiamo la terminologia A’/A perché stiamo studiando un sistema con assenza di dominanza, il che
ci permette di lavorare direttamente sulla distribuzione dei genotipi.
Considerando ciò che abbiamo descritto nel capitolo 6.3 – Definizione del pool genico; sappiamo
che per definire quest’ultimo abbiamo bisogno di definire in primis le frequenze genotipiche, e
non posso andare a lavorare direttamente sulle frequenze alleliche perché negli organismi il primo
campionamento che viene fatto è quello degli individui, quindi le frequenze alleliche.
Vediamo subito dalla tabella una distribuzione dei genotipi. Dal totale degli individui campionati
individuiamo un gruppo di omozigoti A’ (353), un altro gruppo di omozigoti A (153) e degli
eterozigoti (494) Abbiamo dunque raccolto dei dati relativi alle frequenze genotipiche, dai quali
dobbiamo ricavare le frequenze alleliche.
Per ricavare le frequenze alleliche non dobbiamo fare altro che contare quanti alleli ho all’interno
del totale degli individui (1000), cioè la frequenza di ogni singolo allele.
Frequenza allele A’ = p
Gli alleli A’ sono 353 x 2 (gli omozigoti introducono nella popolazione 2 alleli)
+494 x 1 (gli eterozigoti introducono solo 1 allele A’)
Frequenza allele A = q
Gli alleli A sono 154 x 2 (gli omozigoti introducono nella popolazione 2 alleli)
+494 x 1 (gli eterozigoti introducono solo 1 allele A)
Anche il totale deve essere moltiplicato x 2: gli organismi diploidi introducono nel pool 2
alleli indipendentemente da quale allele.
' '
f r e q u e n z a a l l e l e A → f ( A )= p=
(2 D+H )
=
( D + 12 H )
2N N
f r e q u e n z a a l l e l e A → f ( A ) =q=
(2 R+ H )
=
( R + 12 H )
2N N
p+q=1
→ p=1−q ;
→ q=1− p
D
A ' A ' =D in d i v i d u i ; f ( A ' A' )=
=d
N
H
A ' A=H i n d i v i d ui ; f ( A ' A )= =h
N
R
A A=R i n d iv i d u i; f ( A A )= =r
N
Calcolo di frequenze alleliche:
Numero di alleli = 2N (perché 2 gameti)
'
f ( A )=p=
(2 D+H )
=
( D+ 12 H ) ; f ( A ) = p=d + 1 h
'
2N N 2
f ( A ) =q=
(2 R+ H )
=
( R + 12 H ) ; f ( A )= q= r + 1 h
2N N 2
Prendiamo in considerazione la [6] assunzione: gli incroci avvengono completamente a caso, se gli
incroci tra gli individui della popolazione avvenissero a caso, la relazione tra i genotipi e le
frequenze alleliche dovrebbe essere la seguente:
Generazione zero (tempo 0) con genotipi:
f ( A A )=d f ( A a )=h f ( a a )=r t o t a le=N
( 12 h )= p→ p+q=1
p ( A )= d +
1
p ( a )= ( r + h )=q → p +q=1
2
Vediamo ora come cambia la generazione dalla fertilizzazione del gamete femminile (A,a) con lo
spermatozoo maschile (A,a), dunque se la generazione zero (tempo 0) avevamo p,q; alla
generazione 1 otterremmo p2 ,2 p q , q 2 . Perché ( p +q )2 = p 2+ 2 p q+ q2 , ottenendo così
l’equilibrio di Hardy-Weinberg, derivato dalla prima legge di Mendel.
x 2=
∑ ( o s s e r v a t i−a t t e s i )2
at t e si
Il chi-quadro è il confronto delle frequenze osservate, rispetto alle frequenze attese, di tutte le
classi fenotipiche (somma). Dunque per determinare la presenza dell’equilibrio del locus della
popolazione è necessario disporre dell’analisi delle frequenze osservate, ottenute dal
campionamento della popolazione. Poi è necessario disporre del numero di frequenze attese,
calcolabile.
Ricaviamo poi le frequenze genotipiche dalle frequenze alleliche, e infine possiamo andare ad
espletare il confronto con il chi-quadro, verificando lo scostamento dalla popolazione ideale.
Dunque il test permette di verificare se le frequenze genotipiche osservate si discostano da quelle
attese per una popolazione ideale. Se questo scostamento è significativo, vuol dire che una o più
assunzioni sono state violate.
Frequenze genotipiche:
p=
(2 D+ H )
=
( D+ 12 H ) = ( 48+ 22) =0.48+ 1 0.44=0.70
2N N 100 2
⇒ q=1− p=1−0.70=0.30
Attesi:
N× p2 N×2 p q N×q2
( 0.700 )2×100 2( 0.700)×( 0.300 )×100 ( 0.300 )2×100
49.00 42.00 9.00
x 2=
∑ ( o s s e r v a t i−a t t e s i )2 ; o t t e n e n d o :
at t e si
p 0.700
q 0.300
L’ipotesi dunque non può essere rifiutata; di conseguenza la popolazione è all’equilibrio. Ovvero: il
locus che stiamo studiando all’interno della popolazione è in equilibrio perché l’ipotesi nulla (gli
assunti di una popolazione ideale – assenza delle 5 forze evolutive) viene rispettata.
Da questa popolazione è possibile distribuire tre genotipi diversi: AA, Aa, aa. Quali e quante
distribuzioni osservate possiamo ottenere data la distribuzione delle frequenze genotipiche p e q?
Potremmo avere delle popolazioni che si differenziano per la distribuzione di frequenze alleliche:
AA Aa Aa p
40 0 60 0.4
35 10 55 0.4
20 40 40
Esiste un infinito numero di distribuzioni osservate, ma la formula dell’equilibrio Hardy – Weinberg
afferma che solo una condizione riflette la giusta condizione di equilibrio, cioè:
p2×100=0.16 è l a f r e q u e n z a a t t e s a a l l' e q ui li b r i o p e r il g e n o t i p o A A ;
2 '
q ×100=0.36 è l a f r e q u e n za a t t e s a a ll e q u il ib r i o p e r i l g e n o t i p o a a ;
Dunque solo una popolazione che presenta 16 individui AA, 48 individui Aa e 36 individui aa,
rifletterà le giuste condizioni di equilibrio di Hardy-Weinberg:
Nelle popolazioni naturali, le frequenze genotipiche sono quasi sempre in equilibrio di Hardy-
Weinberg. Inoltre: nelle diverse popolazioni le frequenze alleliche sono molti diverse.
0.1 SUMMA
o Una popolazione è caratterizzata dalle frequenze dei diversi genotipi e dei diversi alleli al
suo interno;
o Una popolazione si dice in equilibrio per il locus considerato quando le sue frequenze
genotipiche possono essere predette sulla base delle frequenze alleliche, e le frequenze
alleliche non cambiano attraverso le generazioni;
o Le popolazioni in equilibrio non si evolvono. I fattori che provocano lo scostamento
dell’equilibrio sono i fattori dell’evoluzione;
o In una popolazione in equilibrio: l’unione tra individui è casuale, non agiscono: mutazioni,
selezione, migrazioni e gli effetti del caso.
Sistema delle frequenze alleliche nel caso di un gene con due alleli co-dominanti (metodo
per conta diretta);
Sistema ad alleli multipli;
Sistema a loci X-linked;
Sistemi a dominanza completa
Si parla di allelismo multiplo quando in una popolazione è presente un allele selvatico e molte
varianti (anche se un individuo diploide avrà al massimo 2 alleli diversi).
Come facciamo ad agganciare le frequenze alleliche degli alleli multipli alle frequenze genotipiche
della generazione successiva? Banalmente: la relazione che unisce le frequenze alleliche alle
frequenze genotipiche non cambia, ma si differenzia in termini di dimensione. I dati delle
frequenze alleliche si otterranno come sempre campionando la popolazione; dal dato ottenuto
dobbiamo calcolare le frequenze alleliche:
Pesando due volte la
1 1 1 2 1 3 1 4 frequenza osservata del
1 ( 2× A A ) + A A + A A + A A e t c .
p=f ( A )= ; genotipo omozigote, perché
2×nu m e r o t o t al e d e g li in d i v i d u i questi alleli contribuiscono al
pool genico con una doppia
dose
2 ( 2× A 2 A2 ) + A 1 A2 + A2 A 3 + A2 A 4 e t c .
q =f ( A )= ;
2×nu m e r o t o t al e d e g li in d i v i d u i
3 ( 2×A 3 A 3 ) + A1 A 3 + A 2 A 3+ A 3 A 4 e t c .
r =f ( A ) = ;
2×n u m e r o t o t a l e d e g l i i n d iv i d u i
Non si sommano tutti gli eterozigoti, ma solo quelli che hanno l’allele considerato di volta in volta.
La legge di Hardy-Weinberg ci dice che una volta attenute le frequenze alleliche possiamo ricavare i
genotipi attesi nella popolazione successiva. I tre alleli (freq. allele A1 = p, freq. allele A2 = q, freq.
allele A3 = r) si assortiscono per formare 6 genotipi, cioè tre omozigoti e 3 eterozigoti. In caso di
co-dominanza tra i tre alleli, ai sei genotipi corrispondono sei fenotipi.
( p +q+ r ) 2 ; d o v e :
→ A 1 A 1= p2
→ A 2 A 2=q2
→ A 3 A 3=r 2
2 a l e l l i : ( p+q )2= p2 +2 p q +q 2 ;
3 a l l e l i : ( p+ q+r )2= p 2+ q2 +r 2 +2 p q +2 p r +2 q r ;
n a l l e l i : ( p+ q+r +…+ n ) 2
7.3.2 ESTENSIONI DELLA LEGGE DI HARDY-WEINBERG – SISTEMA A LOCI X-LINKED
In questo caso la situazione è complicata dal fatto che i maschi possiedono un solo allele e le
femmine eterozigoti due alleli. In equilibrio di Hardy-Weinberg:
f e mm ine:
f ( X A X A ) = p2
a a 2
f ( X X =q
f ( X A X a ) =2 p q
m asc hi:
f ( X A Y )= p
f ( X a Y )=q
Dunque nelle femmine sono presenti tre genotipi (A1A1, A1A2, A2A2), mentre nei maschi sono
presenti solo due genotipi (A1, A2). Nei maschi le frequenze alleliche e le frequenze genotipiche
coincidono, pertanto condizioni dovute ad alleli recessivi di geni legati al cromosoma X sono molto
più frequenti nei maschi che nelle femmine (se q è piccolo, q 2 è ancor più piccolo). A partire dai
numeri assoluti dei diversi genotipi (quanti individui con diversi genotipi sono stati osservati) si
calcola:
1 ( 2× A 1 A1 ) f e mm in e + ( A1 A 2 ) f e m mi n e+ A 1 m a s c h i
p=f ( A )= ;
( 2×nu m e r o t o t al e d e ll e f e mmi n e )+ nu me r o t o t a l e d e i m a s c h i
Richiamando il dato dell’aumento delle possibilità di condizioni dovute ad alleli recessivi di geni
legati al cromosoma, citato nel paragrafo precedente, possiamo fare un esempio: la cecità dei
colori (daltonismo).
f e n o t i p o q=0.08 ( 8 % n e ll a p o p o l a z io n e )
f r e q u e n z a d i d a l t o n i c i m a sc h i=q=0.08 ;
2 2
f r e q u e n z e d i d al t o ni c h e f e m mi n e=q =0.08 =0.0064 ( 0.64 % )
Possiamo stimare quanti sono gli individui R h(+) con genotipo omozigote RhRh e quanto sono gli
individui R h ¿ ¿ con genotipo eterozigote Rhrh.
7.4 STIMA DELLE FREQUENZE ALLELICHE PER MEZZO DELLA LEGGE DI HARDY-WEINBERG
Es. carattere autosomico recessivo: Fibrosi cistica. Incidenza della malattia nella popolazione
caucasica: 1 ;
2500
Quindi:
q 2=4 ×10−4 →q=√ 4 ×10−4 =0.02
p=1−0.02=0.98
f ( A a )=2 p q=2×0.98×0.02=0.0392
Nel caso che la popolazione non sia infinitamente grande, cosa assolutamente irreale e
impossibile, sebbene si possa intendere che la popolazione abbia un numero di individui
sufficientemente grande; la differenza tra la predizione del modello di HW (Hardy-Weinberg) e il
dato osservato è praticamente trascurabile.
Quando invece abbiamo una popolazione piccola, questa viene soggettata all’effetto della deriva
genica. Più piccola è la popolazione, più forte è l’effetto della deriva genetica. Ma cos’è
esattamente la deriva genica? È la variazione (ingl. genetic drift) delle frequenze geniche di una
popolazione, dovuta unicamente al caso, detta anche effetto di Sewall Wright. Il limitato numero di
individui e il loro isolamento permettono oscillazioni delle frequenze alleliche estremamente
ampie e casuali che possono portare alla scomparsa di un allele e alla fissazione dell’altro. Si ha
anche nel caso di un piccolo gruppo di individui che va a colonizzare una nuova zona: se negli
individui fondatori c’è un’alta frequenza di un carattere (per es., l’albinismo) la frequenza di questo
gene sarà elevata nella nuova popolazione (effetto del fondatore, vedi capitolo 6.2.1). La selezione
naturale riduce la frequenza di questo gene se ha valore adattativo negativo. La d. genetica agisce
soprattutto sui geni cosiddetti neutrali con scarso o nullo valore adattativo. Le derivazioni casuali
delle frequenze attese sono il risultato di un fenomeno generale definito errore di
campionamento. La deriva genetica è il risultato di tale errore.
Osserviamo nell’immagine sovrastante come l’effetto della deriva genica cambia in base al numero
di individui nella popolazione campionata in un periodo che va da zero a cinquanta anni; ogni linea
presenta l’andamento della frequenza degli alleli, ogni colore rappresenta una popolazione diversa.
Il fenomeno è naturalmente più intenso e meno omogeneo (o compatto) nella popolazione con
soli 20 individui. La deriva genica riduce la variabilità nelle popolazioni, e aumenta quella fra le
popolazioni. Come conseguenza dalla diminuzione della variabilità, la deriva genica va ad
aumentare la consanguineità entro le popolazioni
L’altra assunzione del modello di HW è che tra gli individui di questa popolazione l’incrocio è
casuale, la popolazione è dunque in panmissia: la probabilità degli individui di riprodursi è
indipendente dal loro genotipo, dunque nessun individuo si riproduce più degli altri. Prendiamo in
considerazione l’esempio dei gruppi sanguigni LM e LN .
LM ( p ) N
♂ /♀ L (q )
M M M 2 M N
L ( p) L L (p ) L L (pq)
N
L (q ) LM LN ( p q ) L N L N ( q2 )
da qui:
f ( L M )=0.5395 ;
f ( L N ) =0.4605;
M N 2
f ( L L ) = p =0.2911
AA Aa aa F
Generazione 0 D H R 0
Generazione 1 1 1 1 1
D+ H H R+ H
4 2 4 2
Generazione 2 3 1 3
D+ H H R+ H
8 4 8
Generazione 3 7 1 7
D+ H H R+ H
16 8 16
| | | |
Gen. ∞ 1 0 1 1
D+ H R+ H
2 2
AA Aa aa
Generazione 0 p
2
2 pq q2
| | | |
Gen. ∞ p2+ 2 q= p ( p+q )= p 0 q 2+ p q=q ( p+ q )= q
La consanguineità cambia la frequenza genotipiche, ma non le frequenze alleliche, per cui non
viene considerato un agente evolutivo.
Le altre tre assunzioni della legge di HW a che vedere con i veri agenti dell’evoluzione: la
mutazione, la migrazione e la selezione naturale. Questi vanno a cambiare la frequenza degli alleli
nelle popolazioni. Se in una popolazione cha stiamo studiando le percentuali dei genotipi che
osserviamo (campioniamo) sono significativamente diversi da quelli attesi, possiamo presumere
che uno di questi tre agenti (mutazione, migrazione e selezione naturale) è presente nella
popolazione. Ma come facciamo a riconoscere quale dei tre sta esercitando pressione?
Nel modello di Hardy-Weinberg si possono aggiungere dei parametri che tengono conto delle
azioni di questi agenti.
8.1.1 CLASSIFICAZIONE E PRESENZA DI MUTAZIONI DELL’EQUILIBRIO DI HARDY-WEINBERG
Il cambiamento delle frequenze geniche basato soltanto sulle mutazioni è un processo lento.
Riassumiamo ancora una volta la classificazione delle mutazioni:
Generazione 0: f ( A ) =p 1 ;
Il tasso di mutazione è la frequenza con cui cambia l’allele da wild-type a mutato, cioè la frequenza
con cui “A’’ diventa “a’’ nel corso di una generazione:
A →a=t a s s o d i m u t a z i o n e ( u ) ×p=u p
atasso di reversione ( v ) →A;
L’effetto sarà un aumento della frequenza dell’allele A che risulta della mutazione come:
Δ p=v p−u p
→G e n n e r a z i o n e 1: f ( A )= p 1+ Δ p
Per stimare la frequenza dell’allele A della generazione 1 dell’isola allora bisogna calcolare:
f ( A ) = p ' y= m ( p x ) + ( 1−m ) p y ;
Alleli A Alleli A
nei nei
migranti residenti
La variazione della frequenza allelica della popolazione Y dovuta alla
migrazione ( Δ p) :
Δ p=m ( p x )+ p y−m ( p y )− p y
→ Δ p=m( p x− p y )
Δ p=m ( p x− p y )
La variazione nella frequenza allelica dovuta al flusso genico dipende da due fattori:
1. m: proporzione dei migranti nella popolazione finale;
2. la differenza nelle frequenze alleliche tra i migrati e i residenti ( p x− p y )
Quando non esiste differenza ( p x− p y ) =0 , la variazione della frequenza allelica è zero
Δ p=p .
Con una migrazione continua, px e py, diventeranno sempre più simili. A lungo andare il flusso
genico tende ad unificare le popolazioni.
Possiamo anche fare delle predizioni, calcolando la probabilità di cambiamento della frequenza
allelica.
( 4 ×N f × N m )
N e= ;
(N f + N m
N f =n ume r o d i f em mi n e i n et à r i p r od u t t i v a ,
N m=n u m er o d i m a sc h i i n e t à ri p r o d u t t i v a
L’effetto della deriva genica è stimolato dalla dimensione effettiva della popolazione, cioè Ne.
Le fluttuazioni delle dimensioni della popolazione, o rapporti-sessuali sbilanciati, abbassano
sensibilmente il valore medio di Ne. Nelle popolazioni umane è comune approssimare Ne ad 1
3
della popolazione censita.
0.2 SUMMA
La deriva genica fa sì che le frequenze alleliche cambino nel tempo in modo casuale;
La deriva genica aumenta la diversità tra popolazioni e diminuisce quella entro popolazioni;
Per ogni allele la probabilità di fissazione e pari alla sua frequenza;
L’effetto della deriva genica è stimolato dalla dimensione effettiva della popolazione (Ne);
La deriva è amplificata da fenomeni quali l’effetto del fondatore e l’effetto collo di bottiglia
In termini riproduttivi possiamo dire che in un bosco inquinato la farfalla carbonaria riesce a
riprodursi con maggior successo di un lepidottero tipica. Da questo punto di vista la selezione
naturale si può determinare stabilendo il tasso di riproduzione, espresso come fitness o
adattabilità dell’individuo. La fitness (w) o adattabilità viene definita come la capacità riproduttiva
relativa di un individuo (o probabilità di progenie). La fitness dipende da due fattori:
Genotipo AA Aa Aa
Numero medio 4.0 4.0 2.4
discendenti [1]
Fitness riproduttiva 4.0 4.0 2.4
=1 =1 =0.6
[2] 4.0 4.0 4.0
Genotipo AA Aa Aa
Vita riproduttiva 1.5 1.8 2.0
media [3]
Fitness di 1.5 1.8 2.0
=0.7 =0.9 =1
sopravvivenza [4] 2.0 2.0 2.0
Genotipo AA Aa Aa
Fitness riproduttiva 1 1 0.6
Fitness di 0.7 0.9 1
sopravvivenza
Prodotto 0.7 0.9 0.6
Per quanto riguarda la vita riproduttiva media [3]: è probabile che uno dei tre genotipi viva più a
lungo degli altri. La media degli individui con genotipo aa è la più altra con un valore pari a 2.0
(gg/mesi). Per calcolare il fitness di sopravvivenza [4] adottiamo lo stesso metodo che abbiamo
utilizzato per calcolare la fitness riproduttiva [2].
L’effetto della selezione dipende principalmente dalle fitness relative dei genotipi e delle frequenze
alleliche nella popolazione. Le fitness possono essere W 11 per l’omozigote dominante, W 12 per
l’eterozigote, e W 22 per l’omozigote recessivo.
s=1−w
Genotipo A1 A1 A1 A2 A2 A2
Frequenze p2 → ( 0,6 )2=0,36 2 p q →2×0,6×0,4=0,48
q 2→ ( 0,4 )2=0,16
genotipiche iniziali
Fitness w 11 → ( 0 ) w 12 → ( 0,4 ) w 22→ ( 1 )
p2 w 11 → ( 0,36×0 ) =0 2 p q w12 → ( 0,48×0,4
q 2 w)=0,19
22
Frequenza dopo → ( 0,16×1 ) =0,16
selezione
Frequenza genotipica p 2 w 11 0 2 p q w 12 0,19 ' q2 w 22 0,16
P' = −¿ =0 H ' = −¿ Q==0,54−¿ =0,46
relativa dopo w 0,35 w 0,35 w 0,35
selezione
Frequenza allelica 1 1
p' =P' + ( H ') p' = 0+ =0,27
dopo selezione 2 2×0,54
q' = 1− p' q' = 1−0,27=0,73
Il valore della fitness può dirci se esiste la selezione, e anche contro quale allele è stata attuata la
selezione. Infatti:
1. 11 12 22 '
w =w =w =1→n o n c è s e l e z i o n e ;
2. w 11=w12<1 e w22 =1→s e l e z i o n e c o n t r o l ' al l e l e d o m in a n t e A1 ;
3. w 11=w12=1 e w22 <1→s e l e z i o n e c o n t r o l ' al l e l e r c e s i v o A2 ;
4.
11 12 22 22 1
w <w <w e w =1→s e l e z io n e c o n t r o a ll e l e A i n a s s e n z a d i e f f e t t i d i d o mi n a n z a ;
5. w 22 e w22 <1 e w12=1→ s e l e z i o n e a f a v o r e d e l l' e t e r o z i g o t e ;
6. w 12< w11 e w22 =1→ s e l e z i o n e a f a v o r e d e g li o m o z i g o t i.
Vediamo ora di focalizzarci sui modelli di selezione direzionale, per capire come cambia la
frequenza allelica nel corso delle generazioni. A livello generale possiamo fare gli stessi
ragionamenti che abbiamo fatto con la tabella precedente. Prendiamo una frequenza iniziale
p2 , 2 pq e q2 , dei tre genotipi possibili:
Genotipo
AA Aa aa Totale f(a)
Frequenze p2 2 pq q2 1
iniziali dei
zigoti
Fitness (w) 1 1 1-s
Contribuzion p2 2 pq 2
q ( 1− s ) 1−s q 2 *
e alla
generazione
successiva
Frequenze p2 2 pq 2
q (1−s ) 1 ' q −s q2
q = *
genotipiche 1−s q
2
1−s q2 1−s q
2
1− s q
2
normalizzate
dopo
selezione
Cambiament −s p q 2
∆ q=q ' −q= 2
o della 1− s q
frequenza
allelica
'
'
'
F r equ en za all equ il ibr i od e ll all el e r e c es si v o :q =
'
10−6
0,1
e
=0,0032;
e
F r e q u e n z a a ll e q u il ib r i o d e ll a ll e l e d o min a n e t e : p =
√(
10−6
)
=0,00001.
0,1
Poiché la selezione non può agire su un allele recessive allo stato eterozigote, la frequenza di
questa all’equilibrio è considerevolmente superiore della frequenza all’equilibrio per un allele
dominante con la stessa fitness (w) e lo stesso tasso di mutazione (u).
0.3 SUMMA
La selezione naturale implica la riproduzione differenziale dei genotipi;
Il diverso successo riproduttivo dei diversi genotipi viene misurato dalla fitness darwiniana;
Gli effetti della selezione dipendono dalle fitness relative dei diversi genotipi (selezione
direzionale e selezione bilanciata);
Il risultato finale non è un adattamento perfetto, perché l’ambiente non è costante e perché
i meccanismi di selezione sessuale possono agire in senso diverso.
9. MODELLO CONCETTUALE DELL’EVOLUZIONE – Dott.ssa Maria Teresa Vizzari
Abbiamo visto che il modello che descrive il processo di evoluzione proposto da C. Darwin, altro
non è che un modello per discendenza con modificazioni; le specie non restano immutabili nel
tempo ma si modificano accumulando mutazioni, queste vengono infine trasmesse da generazione
in generazione. Darwin descrisse il processo evolutivo in questi termini osservando diverse specie.
A quei tempi però, nessuno, nemmeno Darwin, conosceva il meccanismo esatto di trasmissione e
di ereditarietà dei caratteri. Darwin, accorgendosi che le specie che vivevano in areali diversi
esprimevano delle somigliane, riuscì a definire il proprio modello ascrivendo le somiglianze alla sua
teoria del processo di discendenza con modificazioni, suggerendo che le diverse specie devono
discendere da una specie ancestrale comune. Questo principio che afferma che le specie abbiamo
come punto di partenza una sola specie preesistente viene chiamato cladogenesi.
Tuttavia esiste un altro processo evolutivo, definito anagenesi, un processo che descrive la
formazione di una nuova specie escludendo la suddivisione in gruppi differenti: una specie
ancestrale inizia ad accumulare mutazioni e con il passare del tempo l’accumulo di cambiamenti è
così rilevante, che la specie mutata è significativamente diversa dalla forma ancestrale, possiamo
dunque definirle come specie diverse.
La mancanza della “particella’’ dell’ereditarietà dei caratteri diede diversi problemi a Darwin di
natura critica, dimostrando la presenza di una grossa lacuna. Questa venne colmata solo agli inizi
del ventesimo secolo, con la riscoperta degli studi di G. Mendel sulle piante di Pisello odoroso. Così
si riscoprirono le leggi che regolano l’ereditarietà dei caratteri. Nel novecento inoltre, gli studiosi
riuscirono ad individuare l’elemento causa dell’ereditarietà dei caratteri, ovvero il DNA e i geni.
Prendendo in considerazione le leggi di Mendel; la variabilità che noi osserviamo (la differenza tra i
vari individui di un determinato carattere) è dovuta al processo di mutazione. Questo processo di
cambiamento nella sequenza delle basi del DNA ha significato evolutivo solo se avviene nelle
cellule germinali di un individuo.
La distanza che separa tra loro le due specie diverse è proporzionale alla distanza che le spara dal
loro antenato comune. Questo vuol dire che il grado di differenziazione tra due specie è
direttamente proporzionale al tempo intercorso dalla separazione dell’antenato comune.
Dunque maggiore sarà il tempo trascorso, più grandi saranno le differenze.
9.2 ADATTAMENTO NEL MODELLO DARWINIANO
Il modello proposto da Darwin afferma che le specie sono inclini al cambiamento e alla divergenza,
per azione della selezione naturale. Infatti la principale forza evolutiva che porta al cambiamento
delle specie è la selezione naturale attraverso il processo di adattamento. Possiamo dunque
affermare che nel modello darwiniano, ciò che porta alla specie a modificarsi e divergere è il
processo di adattamento.
L’adattamento fa sì ce le popolazioni vengano a possedere caratteri che le rendono atte a vivere nel
loro ambiente (questi caratteri si chiamano a loro volta adattamenti). Il processo di adattamento si
spiega con la selezione naturale.
A seguito del cambiamento ambientale (es. colorazione della colorazione della flora da verde in
giallo) il predatore non riuscirà più a predare il gruppo delle ranocchie con la colorazione gialla,
perché grazie alle nuove condizioni ambientali, la combinazione tra ambiente e mimetizzazione
regalerà un maggiore successo alla specie di ranocchie gialle.
Quindi: è determinante il contesto ambientale entro cui la selezione naturale agisce. Abbiamo
dimostrato che la capacità riproduttiva è un concetto relativo, dipendente e in completa
correlazione con altri fattori ambientali.
Da queste dinamiche possiamo dedurre che un sistema ecologico non è un sistema stabile o fisso,
ma è difatti un sistema estremamente dinamico ed in continua evoluzione. Questa idea è stata
riassunta nell’ipotesi della regina rossa, proposta nel 1973 da Van Valen. Il nome dell’ipotesi
prende spunto da uno dei personaggi di “Alice nello specchio’’; in un passaggio del romanzo la
regina Rossa è costretta a correre molto velocemente per poter così restare ferma sempre nello
stesso punto.
La metafora descrive perfettamente il sistema ecologico che abbiamo appena esposto in questo
capitolo; le specie continuano ad evolversi, l’ambiente continua a mutare, ad ogni cambiamento
ambientale segue un cambiamento nelle specie, ma le relazioni tra preda e predatore restano
invariate – le prede continueranno ad essere prede e i predatori: predatori (variando sempre in
risposta alle mutazioni ambientali).
0.4 SUMMA
Un carattere adattativo deve essere:
Ereditabile: se è stato modellato dalla selezione naturale deve essere genetico (la selezione
naturale non può agire su tratti che non passano alle generazioni future);
Funzionale: se è stato modellato dalla selezione per uno scopo preciso deve svolgere quel
compito;
Migliorare il fitness: la selezione naturale permette l’aumento di frequenza dei caratteri
che aumentano la fitness dell’organismo che lo possiede.
10.5 VALUTAZIONE DELLA FITNESS
Darwin conia il termine “survival of the fittest’’. Chiarisce che la selezione naturale non è un agente
esterno che osserva e discrimina le differenze individuali, ma il risultato dell’esistenza di individui
con caratteristiche differenti e della relazione (determinata dall’ambiente) tra queste
caratteristiche e la probabilità di sopravvivere e riprodursi.
Un adattamento è un carattere che apporta un contributo positivo alla fitness del suo portatore.
Possiamo valutare la fitness da diversi punti di vista:
Per ulteriore approfondimento vedi capitoli 8 – 8.2, nei quali abbiamo trattato la valutazione della
fitness e il calcolo di essa.
Cosa avviene a delle specie che non discendono da uno stesso antenato comune ma che vivono in
ambienti simili e che presentano delle caratteristiche simili. In questo caso parliamo di evoluzione
convergente; l’azione della selezione naturale può portare la formazione di specie che, pur non
essendo imparentate tra loro, finiscono con somigliare le una alla altre in quanto vivono in
ambienti molti simili. Si verifica quando due o più gruppi che non sono strettamente imparentati,
evolvono caratteristiche morfologicamente e fisiologicamente simili. Ciò è generalmente il risultato
dell’occupazione dello stesso habitat e delle risposte a pressioni selettive simili.
Dunque:
Struttura omologa: strutture simili e posizioni simili, funzioni differenti;
Struttura analoga: funzioni simili, ma origini diverse.
Un esempio di selezione naturale è la variazione fenotipica della farfalla punteggiata delle betulle
(Biston betularia), già vista nel capitolo 8.1.3.
La selezione artificiale è stato il processo con cui C. Darwin ha spiegato la selezione naturale.
Infatti: il primo capitolo de “L’origine della specie’’, è dedicato alla selezione artificiale, e quindi alla
domesticazione delle specie. In questo primo capitolo Darwin raccoglie le osservazioni dei risultati
dei diversi incroci guidati dall’azione dell’uomo su diverse varietà di picconi. Questi incroci erano
degli incroci ben definiti; effettuati selezionando degli esemplari che avevano delle caratteristiche
esclusive, quali: la dimensione del becco, il tipo di piumaggio, la colorazione delle piume, e
dimensioni. L’obbiettivo di questi incroci controllati era quello di formare delle razze di piccioni che
avessero delle caratteristiche specifiche. Quando parliamo di selezione artificiale di domesticazione
ci riferiamo allo stesso identico processo riportato dall’esempio della domesticazione del piccione.
Darwin definì l’azione della selezione artificiale come un enorme esperimento con le stesse
dinamiche con le quali la natura modella le “proprie’’ specie.
12.2 CONTESTO STORICO DELLA SELEZIONE NATURALE E MODELLI DI DIFFUSIONE DEL NEOLITICO
L’uomo moderno ha origine in Africa, circa 130.000 anni fa. Colonizza il continente africano, e circa
70,000 anni fa si espande verso gli alti continenti, in un processo che viene definito “out of Africa’’.
Nel colonizzare il pianeta, l’uomo moderno (Homo sapiens) rimpiazza le forme arcaiche pre-
esistenti; come l’uomo di Neanderthal (Europa) e l’uomo di Denisova (Asia e Siberia).
Lo stile di vita dei primi AMH è basato sulla caccia e sulla raccolta (cacciatori-raccoglitori, hunter-
gatherer). Una struttura sociale più complessa e una maggiore ingegnosità nella fabbricazione di
armi e utensili hanno favorito l’Homo sapiens alle altre specie umane.
La rivoluzione agricola è uno dei processi fondamentali della storia dell’uomo moderno, infatti: lo
sviluppo dell’agricoltura ha contribuito in maniera sostanziale a plasmare il mondo come lo
conosciamo ora. Il periodo in cui è iniziata la rivoluzione agricola viene definito Neolitico, periodo
antecedente al Mesolitico. Durante il Neolitico l’uomo cambi stile di vita da hunter-gatherer ad
agricoltore-allevatore.
Il punto di origine dell’agricoltura e dell’allevamento è il vicino oriente, è da qui che tutte le
competenze agricole sono state trasmesse in tutto il continente Euroasiatico. I primi siti
archeologici con le prime evidenze di domesticazione hanno una datazione di circa 10,000 anni.
Nel tempo ci si è chiesti se la diffusione della capacità di coltivare piante e allevare animali del
Neolitico, fosse stato un processo di trasmissione strettamente culturale, o se alla trasmissione di
conoscenze si fosse accompagnata anche una migrazione di individui e popolazioni.
Sono stati proposti due modelli per spiegare la diffusione del Neolitico del continente Eurasiatico:
La prima viene preposta dal genetista Luigi Luca Cavalli-Sforza, ed è rappresentata da un modello di
diffusione ad elica (vedi immagine in basso a sinistra), basato su evidenze archeologiche.
Quello che ci si aspetta da questo modello è che oltre a trasmettere le nuove competenze culturali,
si siano anche trasmessi anche dei geni, infatti: durante questa espansione i gruppi di popoli di
agricoltori sono necessariamente entrati in contatto con i gruppi di cacciatori e raccoglitori già
presenti in queste zone. Questo è il processo che viene descritto dal grafico sovrastante (sinistra),
dove i pallini blu scuri rappresentano le popolazioni di agricoltori, indicati anche con la lettera F
(farmers), mentre gli hunter-gatherers sono indicati con la sigla HG e i pallini grigi. La dimensione
dei pallini rappresenta la capacità di sopravvivenza.
In alternativa si propone un modello generale: il modello di diffusione per acculturazione (vedi
immagine in alto a destra). Notiamo che ad un incontro tra HG ed F non segue un cambiamento
nella composizione genetica della popolazione, c’è semplicemente una trasmissione culturale
della capacità di domesticazione di piante e animali.
Il modello principale di diffusione del neolitico è quello di diffusione ad elica proposto da Cavalli-
Sforza: disponendo di centinaia di campioni di genomi antichi di raccoglitori e cacciatori, si è potuta
ricostruire la diffusione delle capacità culturali, anche a livello genomico, avvenuta circa 10 millenni
fa.
12.3 L’INNOVAZIONE DELLA DOMESTICAZIONE NEL NEOLITICO
L’innovazione più importante del Neolitico è la domesticazione: incrocio selezionato di piante ed
animali al fine di renderli più utili ed idonei alle esigenze dell’uomo, aumentando così la capacità di
sopravvivenza dell’uomo e favorendo la colonizzazione di aree più ampie. Di conseguenza segue la
divergenza delle specie domestiche dalle rispettive specie selvatiche. Vediamo nella tabella
sottostante le caratteristiche desiderabili delle specie adatte all’addomesticamento:
Animali Piante
Dieta basata sulla disponibilità di risorse Semi e tuberi più grandi
Crescita e riproduzione rapide Brevi tempi di generazione, mutazioni più
frequenti
Animali placidi e pacifici Riproduzione ermafrodite, preferibile all’auto
incrocio
Allevati in cattività Facilmente raccoglibile
Facile da addestrare, facile da gestire Immagazzinato per lunghi periodi
Rimane calmo se spostato al chiuso Controllo monogenico dei tratti cruciali
Solo poche specie animali e piante sono state domesticate dall’uomo rispetto a quelle “sfruttate’’
dai cacciator-raccoglitori.
Consideriamo la selezione artificiale nell’esempio della spiga di grano. Nei cereali la transizione del
selvatico al domestico ha riguardato essenzialmente tre caratteri principali coinvolti nella facilità di
raccolta del prodotto: la resistenza della spiga (la spiga che non si disarticola a maturazione
disperdendo il seme è essenziale per poter coltivare e raccogliere il prodotto), la “vestitura’’ della
cariosside (le cariossidi nude sono di immediato utilizzo rispetto a quelle vestite che rimangono
unite a glume e glumelle) e la dimensione della cariosside (la cariosside più grande è stata
preferite).
Il gene correlato a questi tratti fenotipici è il gene MC1R, che nei topi è il gene dedito alla
colorazione del manto.
Per quanto riguarda il bestiame non è importante solo la colorazione, anche altre caratteristiche
hanno un’importanza rilevante. Di queste caratteristiche si è stato in grado di rilevare ed
identificare i geni responsabili:
Oltre ad identificare quali caratteristiche sono state selezionate è possibile identificare i punti di
origine di domesticazione, intesa come regione geografica dove ha avuto atto la selezione
artificiale. Possiamo dunque adottare due approcci:
Filogeografia: studio della diversità genetica in relazione al contesto geografico;
DNA antico
Nel caso della domesticazione dei bovini il processo di domesticazione è un esempio di come il
DNA antico e moderno possano essere combinati per studiare l’origine del processo di
domesticazione. Ci sono due tipi di bovini domestici, l’europeo Bos taurus, e il più adatto ai climi
aridi Bos indicus, tipico dell’India. Questi due tipi sono considerati specie diverse anche se sono tra
loro interfertili. Evidenze archeologiche suggeriscono che tutti i bovini taurini sono stati
domesticati a partire dall’aurochs nel vicino oriente tra 10.8 e 10.3 KYA. Cosa ci dice il DNA?
Da un’analisi più approfondita utilizzando sia DNA antico che DNA moderno, si è stato in grado di
identificare due processi di domesticazione differenti: uno ha coinvolto solo la specie Bos Taurus
nel vicino oriente 10,000 anni fa, e un altro evento di domesticazione parallelo e indipendente ha
portato alla domesticazione del Bos indicus in Asia (10,000 anni fa).
Un altro esempio è la domesticazione del cane, che a differenza delle altre specie di allevamento,
ha una storia evolutiva leggermente differente. Questa sembra essere iniziata molto tempo prima
rispetto all’addomesticazione delle altre specie animali o vegetali. La datazione dei primi resti di
forme domestiche del cane risale infatti a 35,000 - 40,000 anni fa.
Il Medio Oriente sembra essere stato il punto d’origine della domesticazione del cane. Questa
ipotesi è confermata a livello genetico, infatti la presenza di una stessa mutazione in diverse specie
di cani domestici ha una singola origine ed è stata ritrovata in gruppi di lupi del Medio Oriente. In
particolare questa origine sembra essere correlata alle specie di cani più piccole; tutti i cani di
piccola taglia sembrano avere una mutazione sul gene IGF1, “clusterizzando’’ con i lupi (significa
che sono geneticamente più simili ai gruppi dei lupi del Medio Oriente). Questa evidenza
suggerisce una prima evoluzione dei cani di taglia piccola in Medio Oriente.
Studi più recenti hanno dimostrato che la domesticazione del cane è avvenuta in due punti
d’origine differenti: il primo è rappresentato dal Medio Oriente, il secondo dall’Asia.
I geni associati ai principali tratti fenotipici che caratterizzano le diverse razze canine sono stati
identificati. In particolare sono stati identificati i polimorfismi nei geni responsabili della forma,
statura e conformazione delle razze bassotte. I polimorfismi sono stati indentificati sul cromosoma
18 nel genoma dei cani.
13. SELEZIONE SESSUALE
I processi di selezione sessuale furono identificati da C. Darwin durante il suo studio delle specie
animali e lo studio sulla selezione naturale. Darwin si accorse che molti caratteri presenti nelle
specie non miglioravano la fitness dell’individuo, dunque non migliorava la probabilità di
sopravvivenza. Questi caratteri però, influenzavano la capacità riproduttiva degli individui.
La riproduzione sessuale infatti, a differenza della seleziona naturale, non dipende da una lotta per
l’esistenza e non influenza la capacità di sopravvivenza di un individuo (specie) in un determinato
ambiente, ma riguarda la capacità degli individui con determinate caratteristiche di riprodursi e
trasmettere il proprio patrimonio genetico alle successive generazioni.
Ne: ‘’L’origine delle Specie’’ del 1859, Darwin descrisse la selezione sessuale con:
“Questa [selezione] non dipende da una lotta per l’esistenza, ma da una lotta tra i maschi per il
possesso delle femmine, e il risultato non è la morte del competitore sconfitto, bensì la scarsità o
l’assenza di prole. La selezione sessuale, dunque, p meno rigorosa della selezione naturale.
Generalmente i maschi più vigorosi, i meglio adattati ai posti che occupano in natura, lasceranno
una maggior quantità di discendenti’’.
La selezione sessuale è un processo che coinvolge individui della stessa specie, infatti la
competizione, a differenza della selezione naturale, è limitata agli individui presenti negli individui
maschili in una determinata specie.
In tempi recenti si sono scoperti altri meccanismi tramite i quali opera la selezione sessuale, ad
esempio la competizione tra gli spermatozoi a livello delle gonadi e la scelta criptica della femmina,
dunque vengono inclusi anche i processi post-copula.
13.1.2 ESEMPI DI PROCESSI DI SELEZIONE SESSUALE POST-COUPLA
La competizione tra maschi a livello spermatico: sono numerosissime la modalità con cui il maschio
riduce la probabilità che lo sperma di un altro maschio vada a fecondare le uova della femmina.
Ad esempio in moltissime specie di uccelli, i maschi dopo essersi riprodotti con una femmina
difendono il territorio circostante in modo da tener lontani altri individui maschili.
In altre specie, come ad esempio nei ragni, crostacei, rane e insetti, i maschi possiedono delle
strutture particolari per afferrare le femmine; proteggendole da altri individui maschi e impedendo
un possibile troncamento dell’accoppiamento.
Altri meccanismi possono riguardare i caratteri morfologici della seppia gigante australiana. I
maschi che vincono esibendo la propria colorazione, difendono il proprio territorio dai competitori.
I maschi che non sono stati scelti dalla femmina imitano la colorazione femminile, per ingannare il
maschio e avvicinarsi alla femmina.
Nei casi in cui le femmine si accoppiano con diversi partner maschili si ha una competizione
spermatica nel momento in cui gli spermatozoi di due o più maschi devono fecondare un numero
limitato di uova. In questo caso i maschi reagiscono producendo una maggiore quantità di
spermatozoi, aumentando la possibilità di fecondazione. Per questo motivo i testicoli delle specie
poligame di primati sono più grandi di quelle delle specie monogame.
In alcuni casi particolari possiamo assistere ad una competizione tra femmine. Presenta gli stessi
meccanismi della competizione tra i maschi e viene adottata nelle specie in cui le cure parentali
sono a carico del partner maschile.
Scelta criptica della femmina: risulta da un processo controllato da una femmina che si è
accoppiata con più maschi e che favorirà la paternità dell’individuo maschio che presenta caratteri
migliori rispetto agli altri. Viene definita criptica perché coi metodi tradizionali non si riesce a
determinare chi sia il maschio con il miglior successo riproduttivo.
13.2 DIMORFISMO SESSUALE
I maschi per poter aver maggiore successo di riproduzione sviluppano dei caratteri molto
appariscenti (colorazioni, vocalizzazioni, comportamenti, ornamenti), estremamente esagerati
rispetto ai caratteri standard femminili. Questi caratteri vengono definiti caratteri secondari dei
maschi hanno un ruolo fondamentale nel corteggiamento perché vengono valutati dalle femmine.
Ma il fatto che questi caratteri siano esageratamente appariscenti, possono contemporaneamente
dimostrarsi ecologicamente svantaggiosi. Lo svantaggio mimetico dei predatori e la capacità di
fuga delle prede vengono drasticamente ridotte a causa di questi caratteri secondari.
Ragioniamo: solitamente sono i maschi ad essere più vistosi e più grandi, questo dovrebbe
comportare un effetto deleterio per la sopravvivenza e aumentare i costi dal punto di vista
energetico, svantaggiando così questi individui. Ma questa incoerenza di caratteri è stata
mantenuta nel corso dell’evoluzione?
Per sottoporre a verifica l’ipotesi che i colori sgargianti dei maschi attraggono più predatori, Jerry F.
Husak e i suoi collaboratori hanno costruito modello in argilla colorati come i maschi e le femmine
di questa specie e li hanno messi nel deserto. Dopo una settimana il 90% dei modelli che
ricalcavano l’aspetto del maschio mostravano segni di morsi di serpente o beccati di uccelli, mentre
nessuno dei modelli femminili mostrava segni da parte di predatori.
Il dimorfismo sessuale nelle specie animali e noto anche nei resti fossili.
k ( k −1 )
×1
2
P (c o a l e s c e n z a)= , d o v e :
2N
k ( k−1 )
è il n u me r o d i c o p p ie d i c o p i e d e l g e n e ;
2
1
è la p r o b a bi li t à c h e u n a c o p p i a si a c o a le s c e nt e.
2N
In questo modo calcoliamo la probabilità di coalescenza di tutte e cinque le copie del gene, e
quindi di andare ad identificare l’antenato comune alle copie del gene.
14.1 IL COALESCNTE ED ESEMPI DI RICOSTRUZIONE DELLA GENEALOGIA DI CAMPIONI
Il coalescente è un modello che predice la distribuzione degli eventi di coalescenza i geni. Partendo
da un campione di copie geniche osservate, usiamo il coalescente per calcolare la relazioni tra gli
individui del campione procedendo a ritroso nel tempo (dal presente verso il passato). Ciò
permette la ricostruzione della genealogia del campione di partenza.
Nelle righe seguenti vedremo come viene ricostruita la genealogia di un campione di 22 individui.
Per semplicità parliamo di un sistema aploide. Il numero degli antenati diminuisce fino al MRCA
(most recent common ancestor; vedi immagine sottostante ultima riga “1 ancestor”).
Nella nostra situazione di partenza (vedi immagine sovrastante.) sono presenti i campioni,
composti da 22 individui. Questa prima riga presenta la situazione osservata al presente. Grazie al
coalescente possiamo calcolare le probabilità di coalescenza e quindi identificare gli eventi di
coalescenza delle generazioni passate. Andando in dietro di una generazione iniziamo ad
individuare gli eventi di coalescenza: identificando 18 antenati (diciotto perché ci sono alcuni
individui che non contribuiscono (4 individui, 18+4=22 i n d i v id u i t o t al i ) alla generazione
presente, volendo dire che non hanno lasciato discendenti).
Indietreggiando per una generazione, arrivando a tre generazioni precedenti; anche in questo caso
abbiamo identificato differenti eventi di coalescenza. Anche in questa generazione ci sono degli
individui (pallini azzurri) che non hanno contribuito alle generazioni successive, dunque il numero
di antenati si riduce nuovamente. Ricostruendo la genealogica arriviamo ad un antenato comune.
È ormai intuitivo che per studiare la storia della popolazione non abbiamo bisogno di tutti gli
individui che ne fanno parte in tutte le generazioni, perché ci sono molti individui che non
contribuiscono al nostro campione al presente.
14.2 POSSIBILI EFFETTI DI FORMA E LUNGHEZZA SULLA GENEALOGIA
Le genealogie sono definite da due parametri: forma (ordine eventi di coalescenza) e lunghezza
dei rami. La popolazione che abbiamo analizzato nell’esempio precedente ha una genealogia
basata su un numero di popolazione (22 individui) sempre costante, questo significa che la
dimensione della popolazione non cambiava nel tempo. Cosa succede alla genealogia quando la
popolazione si espande? Tanto più grande è la popolazione campionata, tanto più piccola sarà la
probabilità che avvenga un evento di coalescenza. Al contrario: se la dimensione della popolazione
è molto piccola, la probabilità d coalescenza sarà molto grande.
Spieghiamo questo fenomeno di forma con l’immagine sovrastante: al tempo t1 stiamo calcolando
la probabilità di coalescenza, che sarà un rapporto relativamente basso ( k ( k−1 ) ). Se
28
confrontiamo il tasso di coalescenza calcolato nella popolazione con dimensione di 14 individui,
con il tasso di coalescenza di una popolazione con 7 individui; notiamo che i rapporti cambiano
rilevantemente.
Questo rapporto tra dimensione e tasso di coalescenza è importantissimo: perché la
distribuzione degli eventi di coalescenza nella genealogia seguirà determinate forme, informandoci
della storia demografica della popolazione.
La lunghezza dei rami della genealogia è informativa sulla storia demografica della popolazione
che stiamo studiando.
14.3 SIMULAZIONI DI COALESCENZA E VARIABILITÀ GENETICA
Tramite l’utilizzo del coalescente possiamo studiare le diverse popolazioni, stimando qual è stata la
loro storia demografica. Un modo per poter sfruttare il potere della teoria del coalescente è quello
di utilizzare delle simulazioni. Una simulazione di coalescenza di basa su diversi passaggi:
1. Bisogna disegnare uno scenario demografico: es. popolazione che resta costante;
2. Definire il campione di individui che si vuole tenere in considerazione: N di individui;
3. Selezionare un campione di individui che permetterà l’analisi di questo modello
demografico;
14.3.2 STUDIO DI ABC E DNA ANTICO – RELAZIONE GENEALOGICA TRA LE POPOLAZIONI DEL
PRIMO MEDIOEVO IN PIEMONTE E LE POPOLAZIONI MODERNE DEL PIEMONTE
L’obbiettivo era quello di capire se le invasioni barbariche che hanno interessato queste zone del
primo medioevo, abbiano influenzato la storia demografica di composizione genetica delle
popolazioni piemontesi moderne. Per analizzare e confermare o rifiutare l’ipotesi della presenza di
un contributo genetico da parte dei longobardi, i ricercatori sono andati a campionare diverse zone
del Piemonte. Una volta scelti i campioni ancestrali e i campioni moderni, si è passati a definire le
due ipotesi: la prima ipotesi afferma che le popolazioni longobarde antiche siano gli antenati delle
popolazioni piemontesi moderne. La seconda ipotesi invece, afferma che le popolazioni dei
longobardi antichi non abbiamo contribuito alla variabilità genetica delle popolazioni moderne.
Una volta simulati i dataset secondo il modello di continuità e il modello di discontinuità, siamo
pronti a confrontarli con i campioni moderni (quattro popolazioni moderne differenti: Torino,
Postua, Val di Susa, Trino Vercellese). Il colore blu si riferisce ai dataset prodotti dal modello due di
discontinuità, mentre quelli rossi si riferiscono ai dataset prodotti dal primo modello di continuità.
In giallo (si vede difficilmente) è rappresentata la variabilità genetica osservata nella quattro
popolazioni moderne.
Come possiamo osservare dalla tabella delle probabilità: il modello che ha prodotto la variabilità
genetica più simile alla variabilità genetica delle popolazioni moderne è il modello di discontinuità,
il modello numero 2.
UUU UCU
Phe Ser
(Idrofobico) (polare)
Mutazione nonsenso UUA UAA
Leu Stop
Mutazione frame-shift CATCATCAT / CAT – CAT – CAT / CTA – TCA – TCA
Mutazioni in frame CATCATCAT / CAT – CAT – CAT / CAT – TTC – CAT
15.2 EVOLUZIONE MOLECOLARE COME STUDIO DELLE RELAZIONI EVOLUTIVE TRA LE SPECIE
Il confronto delle sequenze genetica è strumento cruciale per la ricostruzione delle relazioni
evolutive tra le specie; quali sono le specie più vicine nel tempo evolutivo, qual è l’antenato
comune più recente. Nel confronto delle sequenze, anche l’identificazione del numero di
nucleotidi e amminoacidi diversi tra due o più genomi a confronto, ci permettono di: identificare la
relazione tra le specie, ma: poiché l’evoluzione agisce mutando un’unità alla volta (nucleotide o
amminoacido), il numero di differenze accumulate è indicatore di tempo di separazione dal primo
antenato comune. I principali vantaggi dei confronti basati sui dai molecolari sono:
Se osserviamo la seconda immagine, possiamo vedere che si sono molti più gap rispetto alla prima
immagine: questo indica una storia evolutiva con un cospicuo numero di eventi di inserzione o
delezione dei nucleotidi (questo tipo di mutazione porta ad un frameshift).
Dunque: quando vi sono diverse opzioni di allineamento viene preferito il modello con un numero
minore di gaps perché più compatibile con la storia evolutiva degli organismi, ma questo non
implica che il modello scelto rappresenti una decifrazione esatta del corso evolutivo delle specie
sotto analisi. Il modello in questione, seppur non ottimale, viene chiamato modello ottimale.
Notiamo subito la presenza di un accumulo delle sostituzioni delle diverse specie (nucleotidi
indicati con lettere rosse). Concentriamoci sulle sequenze della specie numero tre (3) e quattro (4).
L’interpretazione più semplice: nei punti dove il cambiamento non è avvenuto, è logicamente un
segno che indica l’assenza di un fenomeno di sostituzione nel corso evolutivo delle specie.
Siccome il tempo evolutivo (o il temo di diversificazione) tra le due specie è molto lungo: è anche
possibile che dove non siano visibili mutazioni ci siano in stati in realtà dei passaggi intermedi (ad
esempio un passaggio a tre fasi da: timina, citosina e nuovamente timina).
Per tenere conto di queste sostituzioni multiple (invisibili) nel confronto tra le specie, è stato
sviluppato un modello matematico: il modello di Jukes-Cantor, questo include un parametro α
(tasso di cambiamento tra i nucleotidi). Il modello ipotizza che: al tempo 0 nella molecola
ancestrale ci fosse una citosina, la probabilità che al tempo 1 (passate diverse generazioni) la
citosina sia rimasta invariata verrà data dalla probabilità di ottenere una citosina; meno la
probabilità di tutte le altri possibili sostituzioni (G, T, A = 3α). Così Jukes e Cantor stimano che in un
tempo futuro, la probabilità che in un sito del DNA ci sia sempre lo stesso nucleotide, viene data
dall’espressione: P c ( t )= 1 + 3 e−4 a t (teniamo a mente che la probabilità che non avvengano
4 4
mutazione di dipende soprattutto dal tasso di cambiamento, e dal tempo trascorso).
Una volta calcolato il valore della K (numero di sostituzioni per sito), e avendo anche delle
informazioni sul tempo che è trascorso dalla divergenza delle due specie da quella ancestrale,
possiamo andare a stimare il tasso di sostituzione: r= K ( x → y ) , dove x e y indicano i genomi
2T
allineati e messi a confronto.
Per capire la variabilità del tasso evolutivo bisogna avere ben presente la struttura del gene: in un
gene ci sono regioni codificanti dette esoni, queste unità vengono trascritte in mDNA.
Geni diversi all’interno del genoma hanno tassi di sostituzione diversi.
MANCA LEZIONE: PRESENTAZIONE_06_video
16.1 ARCHITETTURA DI BASE DEL GENOMA EUCARIOTE E DIFFERENZE TRA LE DIVERSE SPECIE
Iniziamo dallo studio di alcune caratteristiche dei genomi eucarioti che siamo riusciti a sequenziare
ed analizzare grazie alle tecnologie di sequenziamento genomico. Una di queste caratteristiche
viene chiamato valore C. Il valore C viene detto anche contenuto di DNA aploide (quantità) in
alcune specie.
La mancanza di correlazione tra la complessità genica (o morfologica) di un organismo e le
dimensioni del suo genoma è definita paradosso del valore C. Infatti non esiste una correlazione
diretta tra complessità dell’organismo e quantità di DNA, ad esempio: i mammiferi hanno una
quantità di DNA tra le 2Gb (giga basi) e le 8Gb; mentre esistono anfibi con meno di 1Gb ed altre
specie di anfibi che hanno più di 100Gb (vedi immagine sottostante a sinistra).
Un’altra caratteristica osservabile nel confronto tra sequenze genomiche di specie appartenenti da
diverse taxa, è la correlazione tra frazione del genoma non codificante e complessità
dell’organismo (vedi immagine sovrastante a destra). Nel grafico viene rappresentata la
percentuale del DNA che non codifica per le proteine. La presenza di questo DNA non codificante
spiega anche la variazione rispetto alla densità genica di diversi organismi. La densità genica viene
calcolata come il rapporto del numero dei geni moltiplicato per il numero di mega basi (lunghezza
del genoma). Le sequenze non codificanti corrispondo agli introni, alle sequenze ripetute (spesso
intercettabili all’interno degli intorni) e alle sequenze inter-geniche.
Per molto tempo si considerava il DNA non-codificante come DNA spazzatura (junk DNA); però oggi
sappiamo che questo DNA può avere un ruolo molto importante per quanto riguarda la struttura
genica degli organismi, spiegando l’evoluzione della complessità del genoma. Naturalmente ora
sappiamo che il DNA non-codificante fa da spaziatore tra i geni codificanti, coordinando le aree di
espressione genica, e molte sequenze ripetute all’interno degli introni hanno un ruolo di splicing
del mRNA.
Nei genomi degli eucarioti si osservano regioni dove la densità genica è più alta e vengono
chiamate regioni ricche di geni, mentre altre regioni hanno un numero significativamente inferiore
e vengono chiamate deserti genici.
I geni riuniti nelle regioni ricche di geni hanno introni piccoli e tendono a trascriversi
abbondantemente.
0.5 SUMMA
Gli studi di genomica comparativa hanno permesso di confrontare genomi completi tra
specie di taxa diverse, contribuendo alla caratterizzazione delle sue differenze strutturali e
funzionali;
Negli eucarioti esiste una scarsa correlazione tra dimensione del genoma e complessità
dell’organismo (paradosso del valore C);
Gli organismi più complessi hanno una maggior percentuale di sequenze non codificanti nel
loro genoma, e una bassa densità genica, a confronto di organismi più semplici;
Queste sequenze non codificanti (junk DNA) sembra abbiano un ruolo importante nella
regolazione dell’espressione genica e nel processo di splicing del mRNA, contribuendo
all’aumento della complessità degli organismi eucarioti.
16. 2 DIMENSIONI DEL GENOMA E NUMERO DI GENI CODIFICANTI
Si è notato che vi era una correlazione abbastanza lineare tra la dimensione del genoma e il
numero di geni presenti all’interno del genoma. Seguendo questa logica ci si aspettava che ai
genomi più grandi corrispondesse un numero di geni maggiore. Questo ragionamento nasce
dall’assunzione che per comporre una proteina ci vogliano circa 300 amminoacidi, un
amminoacido è codificato da una tripletta di nucleotidi, quindi 300 amminoacidi ed ognuno di
questi codificato da 3 nucleotidi: 300 ×3=900 nucleotidi. Così si può ricavare una stima del
numero di geni nel genoma, calcolando:
d i me n si o n e d e l g e n o m a
=n u m e r o d i g e n i n e l g e n o m a ;
1000
Questa formula funziona con speciale efficienza nel calcolo del numero di geni negli organismi
procarioti.
Quando negli anni ’90 parte il progetto di sequenziamento del genoma umano, e considerando la
presenza di introni e sequenze ripetute, ci si aspettava di ricavare un numero di geni intorno ai
100.000. In realtà il numero che ricavarono era intorno ai 30.000 geni che codificano per proteine.
Oggi esistono diversi software per un calcolo più preciso del numero di geni, questi possono anche
predire la locazione del gene cercando tra le sequenze caratteristiche del gene ricercato: isole
CpG senza regioni promotrici, open reading frames con esoni (codone start ATG, condoni stop
TAA/TAG/TGA), e regioni con alto contenuto di guanina e citosina (GC).
Si è arrivati a tre osservazioni generali per spiegare che l’incremento della complessità del gene è
un prerequisito all’origine di organismi pluricellulari complessi:
La struttura del gene è molto più elaborata degli organismi eucariotici multicellulari;
anziché negli organismi eucarioti unicellulari;
Forme simili di struttura genomica sono riscontrabili nei due regni maggiori che si sono
evoluti indipendentemente in due linee ben distinte: piante e animali;
I geni più complessi trasportano informazioni che permettono la sintesi di proteine con
compiti più difficili ed elaborati.
Degli altri elementi che dal punto evolutivo ci permettono di guadagnare complessità sono gli
istoni (rimodellamento della cromatina) e la metilazione delle isole CpG sul DNA. L’attivazione del
gene dipende dal processo di rimodellamento della cromatina, che viene mediato per la
modificazione epigenetica degli istoni. Questi sono due elementi di controllo della regolazione
della espressività genica.
La teoria della formazione di nuovi geni spiega anche la comparsa di segmenti duplicati nel
genoma. Grazie alle tecnologie che permettono il sequenziamento genomico abbiamo potuto
provare che i segmenti duplicati nel genoma eucariotico sono veramente molto frequenti.
I segmenti duplicati nel genoma stanno alla base della comparsa delle famiglie multi-geniche:
molti geni risiedono in multiple copie che costituiscono cluster di geni, questi possiedono sequenze
genetiche simili tra di loro e codificano proteine molto simili tra di loro, avendo spesso funzioni
simili.
Degli esempi di famiglia multi-genica sono i geni della globina (emoglobina, immunoglobuline,
ecc.) e i geni HOX (intervengono nello sviluppo della simmetria corporale), e rappresentano i
gruppi di geni imparentante che si sono evoluti a partire da un gene ancestrale attraverso
duplicazione genica.
Nelle prossime pagine studieremo la famiglia delle globine perché è un esempio di famiglia multi-
genica che ha subito tanti processi di clonazione durante la propria storia evolutiva.
Il grafico sottostante rappresenta l’espressione dei diversi tipi di emoglobina durante lo sviluppo
dell’individuo. Nel sacco vitellino della specie umana l’emoglobina espressa è un’emoglobina
costituita da due tipi di catena (una catena α sottotipo ζ e una catena β sottotipo ε), dopo circa 3
mesi dallo sviluppo del feto la sintesi dell’emoglobina si sposta; la percentuale delle catene ζ e ε si
abbassa, aumentano però le percentuali delle catene α e γ. Queste catene
α e γ, sono necessarie per la formazione dell’emoglobina fetale nel
fegato e nella milza del feto. La catena α è di un solo tipo,
mentre la catena γ ha due sottotipi: γA e γG,
entrambe vanno a costituire
l’emoglobina F (fetale). Questa emoglobina F viene
prodotta fino a poco prima della nascita,
segue una diminuzione di produzione dell’emoglobina F con
simultanea e progressiva sostituzione con la catena β. La
dodicesima settimana, dopo la nascita, l’emoglobina è
quasi interamente sostituita dalle catene
α e β.
Una piccola percentuale di emoglobina a2, che fa
parte dall’emoglobina catena δ sarà presente nel sangue del
nascituro.
L’espressione delle diverse catene lungo lo sviluppo dell’individuo è correlata alla disposizione dei
geni sul cromosoma:
Cioè: le percentuali delle tipologie di emoglobine presenti nel sangue e le loro continue sostituzioni
durante lo sviluppo del feto si susseguono; l’attivazione dei geni richiesti segue un effetto domino.
Nell’immagine sovrastante vediamo come il primate ancestrale, con geni di un solo tipo per le
globine, abbia dato origine a geni diversi, con chiare duplicazioni per le diverse catene delle
globine dei primati moderni. Oggi sappiamo che il numero di copie dei geni per le globine è
variabile anche all’interno di alcune popolazioni umane. Queste osservazioni suggeriscono che le
duplicazioni e le delezioni dei geni nelle famiglie multi-geniche facciano parte di un processo
dinamico e attualmente in continua esecuzione.
Infine possiamo differenziare i geni in base al loro meccanismo di separazione:
Geni ortologi: geni omologhi che si sono separati per un evento di speciazione;
Geni paraloghi: in una stessa specie, sono geni derivati da un unico gene ancestrale che ha
subito duplicazione genica.
17.2 MECCANISMI DELLA DUPLICAZIONE GENICA – CROSSING OVER INEGUALE
Il crossing-over è un processo che prende atto durante la divisione meiotica, concretamente
durante la profase della meiosi 1; quando i cromosomi omologhi si appaiano per formare la
tetrade, e si scambiano i frammenti con i cromatidi fratelli. Perché questo accada in modo corretto
è fondamentale che le sequenze omologhe vengano allineate in modo preciso.
A volte, quando ci sono delle regioni ripetute causate da duplicazioni geniche, queste similitudini
possono portare a degli errori nell’appaiamento. Consecutivamente il crossing-over ineguale porta
a delezione o duplicazione del gene scambiato.
Sembra che sia stato proprio un processo di crossing-over ineguale con conseguente delezione, o
duplicazione dei geni γ nella linea evolutiva delle scimmie antropomorfe.
I quattro cluster del gene Hox nel genoma umano esemplificano l'ipotesi 2R (figura
Sottostante) Il complesso omeotico (HOM-C), cioè il gene che controlla altri geni, si presenta come
un singolo ammasso di invertebrati come Drosophila, Caenorhabditis elegans e anfioxus, ma si
trova come quattro gruppi di geni Hox paraloghi in vertebrati come topi e umani.
È da notare che l'ordine dei geni nei cluster Hox non solo è stato conservato nell’umano e nel topo,
ma è stato anche conservato tra i quattro gruppi di mammiferi. La quadruplicazione dei geni Hox e
la scoperta di altri geni paraloghi collegati ai cluster Hox forniscono prove a sostegno di
coinvolgimento di duplicazioni cromosomiche su larga scala o del genoma intero nel
evoluzione dei genomi dei vertebrati.
Oltre ai due cicli di duplicazione del genoma nella linea dei vertebrati, Ohno
(1970) hanno proposto un ciclo di duplicazione del genoma nei pesci; dopo la divergenza dei pesci
lobedfin che ha portato a organismi terrestri. Prove a sostegno della terza duplicazione sono state
rilevate nel Pesce zebra e nel Medaka, e sono basate sull'osservazione che generalmente hanno
famiglie multi-geniche più grandi.
Un altro passaggio logico è la somiglianza tra le linee evolutive, infatti: due linee evolutive si
assomigliano di più tra loro rispetto ad una terza linea evolutiva se condividono un antenato
comune di tempi più recenti.
Uno dei problemi dei metodi basati sulle distanze è che la distanza tra i corpi di gruppi può essere
misurata ma non necessariamente proporzionale linearmente con il tempo. Infatti: all’aumento
della distanza temporale, il numero di differenze non può accumularsi in maniera lineare. Più passa
il tempo, maggiore è la frazione di mutazioni che avvengono a siti già mutati e quindi non
aumentano (e a volte diminuiscono) la distanza.
Quali sono le basi logiche di questo criterio? Ovvero, perché l’albero con meno cambiamenti
dovrebbe essere quello corretto?
Principio filosofico e teologico del 13. Secolo (Williamo of Ockham): tra diverse spiegazioni,
la più semplice è da preferire. Inutile ricorrere a molte assunzioni se posso spiegare
qualcosa con poche;
Dio ha creato tutto, e Dio non avrebbe creato nulla di complesso se poteva fare la stessa
cosa in maniera semplice;
La selezione naturale favorisce gli adattamenti rapidi, ossia in un numero minore di passi;
Statisticamente, i cambiamenti evolutivi sono rari, quindi è improbabile che avvengano
molte volte.
Un esempio:
Supponiamo di lanciare una moneta ed ottenere testa. La probabilità di osservare i dati (la moneta
caduta con il lato testa rivolto verso l’alto) varia con le ipotesi che posso fare sulla moneta stessa.
P ( D , H 1 ) )=0.5
P ( D , H 2 )=1
P ( H , D ) è la probabilità a posteriore
della tipologia e della lunghezza dei rami;
P ( D , H ) è la verosimiglianza (già vista);
P( H ) è la probabilità a priori della topologia e della lunghezza dei rami;
P ( D ) p una costante che non deve essere calcolata grazie al
MCMC (metodo computazionale Monte Carlo Markov Chain, che permette di ottenere
campioni da una distribuzione di probabilità complessa);
Infine possiamo adottare il metodo bootstap, per testare la robustezza di un albero
filogenetico, gruppi e speciazione. I valori bootstap superiori all’80% indicano un supporto
molto forte, ma anche i valori >50% indicano che un gruppo è presente frequentemente negli
pseudo data set (altre combinazioni hanno valori sicuramente molto più bassi). Un supporto
basso non indica che il clade è sbagliato, ma solo che il supporto statistico è basso.