Sei sulla pagina 1di 77

1.

INTRODUZIONE
Per ricostruire il nostro passato dobbiamo attingere a delle fonti di informazioni diverse tra di loro.
Ad esempio le fonti archeologiche (prima fonte di informazione dello studio dell’evoluzione
umana), la genetica (perché il DNA porta l’informazione di tutti i processi demografici delle
popolazioni antiche della nostra specie – questo vuol dire che dall’analisi del nostro DNA siamo in
grado di poter capire quando due popolazioni si sono separata l’une dalle altre; possiamo capire
un determinato gruppo umano ha interagito con altre specie umane).
Dunque le analisi genetiche vanno a completare le informazioni ricavate dalle analisi dei siti
archeologici.
La tecnologia ci ha inoltre tutto permesso di estrarre campioni biologici dai resti fossili, o dai siti
archeologici. Permettendoci così di accedere al genoma dei nostri antenati.

1.1 MIGRAZIONI DELL’ HOMO SAPIENS E CONTRIBUTO DELL’ ANALISI GENETICA


L’uomo moderno ha avuto origine in africa circa 200,000 anni fa. Ha colonizzato il mondo interno
partendo dal continente Africano. Su alcune questioni esistono ancora delle diatribe. Una fra tutte
è la modalità con cui l’homo sapiens ha lasciato il continente africano. Infatti c’è un dibattito molto
acceso su quante ondante di diffusione i nostri antenati abbiamo dovuto seguire per poter arrivare
a colonizzare tutto il mondo.
La comunità scientifica si divide in base a due ipotesi alternative:

MODELLO A SINGOLA USCITA (avviene 40-45 mila anni fa): la prima ipotesi viene chiamata “Out of
Africa”, cioè una dispersione fuori dal continente africano, a singola uscita. Questo vuol dire che
una piccola popolazione africana, con un unico grande evento è uscita dall’Africa, diffondendosi in
Europa, Eurasia e recentemente in America.
MODELLA A MULTIPLA USCITA (avviene 100 mila anni fa per la prima, 45 mila anni fa per quella
più recente): una valida alternativa. Secondo questa ipotesi, le ondate di diffusione sono state
almeno due; la prima più antica ha coinvolto solo le popolazioni austronesiane. La seconda, molto
più recente, ha coinvolto le popolazioni europee e asiatiche

I genetisti hanno deciso di testare questi due modelli, andando ad analizzare il genoma di individui
antichi (es. Homo sapiens arcaici), sia di individui attualmente vivi (uomo moderno).
Come accennato già in precedenza (vedi cap.1) il DNA umano contiene le tracce di tutti i
cambiamenti demografici avvenuti nella storia della nostra specie.
I modelli altro non presentano che due fenomeni demografici differenti, quindi uno dei due
modelli avrà lasciato delle tracce di cambiamenti demografici all’interno del DNA della specie
umana. Le tracce all’interno del genoma devono essere ovviamente ricostruite tramite simulazioni.
Di questi due modelli presumiamo di conoscere tutte le dinamiche demografiche e quindi date
queste dinamiche noi possiamo simulare qual è la variabilità genetica attesa secondo il
primo/secondo modello.
Una volta prodotte queste simulazioni di variabilità genetica noi le confrontiamo con la variabilità
genetica realmente osservata (quella variabilità genetica ottenuta analizzando i genomi degli
individui di varie popolazioni attualmente in vita).

Confrontando i dati ottenuti, abbiamo constatato quale dei due modelli ha prodotto dei dati di
variabilità genetica più simili a quelli osservati. I dati ottenuti sembrano essere in accordo con il
modello a multipla uscita.
2. DEFINIZIONE DI EVOLUZIONE
Cos’è l’evoluzione? È cambiamento, ma spesso viene frainteso come miglioramento o progresso. In
realtà è un processo passivo non direzionale. L’azione dei processi evolutivi non ha uno scopo con
un fine ultimo, quindi quello che realmente accade non è altro che una trasmissione di
determinate caratteristiche da una generazione all’altra e di un successivo differenziamento di
queste caratteristiche.
Questi sono fatti assolutamente dimostrati, perché l’evoluzione è un processo avvenuto in tempi
antichi che continua ad avvenire. Ci basti guardare l’albero delle specie viventi per capire non è un
processo lineare volto alla produzione di esseri sempre più efficaci o perfetti.

L’immagine rappresenta tutte le interazioni filogenetiche evolutive di tutte le specie viventi.


Vediamo che non c’è un’evoluzione lineare, infatti le specie appartenenti allo stesso regno
coesistono tra loro.

Nell’immagine a sinistra possiamo osservare le


relazioni tra i mammiferi, ritrovando la nostra
specie in fondo nell’angolo a destra, insieme a
tutti gli altri primati: gorilla, scimpanzè, ecc.
Possiamo dunque vedere, anche in questo caso,
la relazioni che collegano la nostra specie a tutti
gli altri mammiferi non sono delle relazioni lineari
relative alla complessità dell’organismo.

Nello schema generale inoltre, possiamo vedere


addirittura le specie estinte, come i dinosauri.
Quando si parla di evoluzione si intendono molte
cose diverse:
Il fatto che le specie cambiano nel tempo, e
quindi ogni specie ha una sua storia.
Quando parliamo di evoluzione possiamo
intendere anche la possibilità di ricostruire la
storia passata dalla vita sulla terra (come visto
nel capitolo 1.1).

Inoltre, con il termine evoluzione, si intende anche lo studio dei meccanismi attraverso i quali
l’evoluzione si è compiuta e si compie. Infatti ricordiamoci che l’evoluzione è solo un cambiando
della specie nel tempo, ma i meccanismi che agiscono su questi cambiamenti non fanno parte del
processo evolutivo in sé. Ad esempio la selezione naturale è un meccanismo che agisce
sull’evoluzione, contribuendo a modellare i cambiamenti che avvengono passando da una
generazione all’altra.

2.1 STUDIARE L’EVOLUZIONE ATTRAVESO LA GENETICA


Nel DNA di qualsiasi specie vi è un “record’’ (registrazione) di quelli che sono state tutte le fasi
evolutive di una specie.
Partendo dallo studio del confronto del DNA di specie o individui diversi, possiamo constatare le
differenze tra specie o individui, di quantificarle e infine spiegare quali meccanismi hanno
provocato queste differenze. Ad esempio il meccanismo che hanno differenziato l’antenato
comune in scimpanzè o homo sapiens, due specie ben distinte.
Le differenze tra il genoma umano e quello di uno scimpanzè possono essere quantificate, e
dunque possiamo capire quanto antica è la separazione di queste due specie dall’antenato
comune.

Grazie al DNA non solo possiamo andare ad analizzare le interazioni infra-specifiche e intra-
specifiche, ma possiamo anche capire le basi della diversità biologica, cercando di capire a cosa
sono dovute le varie caratteristiche fisiche o morfologiche di ogni specie vivente (es. perché i
pavoni hanno questo piumaggio estremamente colorato).
Non solo: possiamo identificare le basi dell’adattamento ambientale delle specie in quella data
zona.

2.1.1 STUDIO SULL’ORSO POLARE - ADATTAMENTO ALL’AMBIENTE


Guardando il DNA della specie possiamo identificare le caratteristiche che in quel determinato
ambiente sono state selezionate positivamente, come nel caso dell’orso polare.
In questo studio sull’orso polare, gli autori hanno campionato una serie di individui appartenenti a
due specie di orso:
La prima specie è l’orso polare, diffuso nel circolo polare artico
La seconda specie è l’orso bruno, diffuso in Nord America e Fenno-Scandinavia (o Fennoscandia)

I principali interessi erano capire quali fossero le relazioni tra queste due specie, e quali geni
dell’orso polare erano stati selezionati per adattarsi meglio alla ambiente artico e sopravvivere.
I ricercatori si sono concentrati sullo studio di evidenze di selezione dell’orso polare. Hanno trovato
due segnali di selezione, che riguardano due geni differenti. Il primo gene, chiamato apoB, è
coinvolto nella catena metabolica degli acidi grassi ed è anche coinvolto nello sviluppo del tessuto
adiposo. Il secondo gene, o secondo segnale di adattamento al clima freddo è un gene collegato al
fenotipo bianco; un fenotipo estremamente comune nelle specie che vivono nel circolo polare
artico. Si pensa dunque che il fenotipo bianco sia un vantaggio, perché aumenta la mimetizzazione
aumentando conseguentemente le possibilità di successo durante la caccia.

2.1.2 STUDIO SUL PANDA - RECETTORI DEL GUSTO


Un altro esempio di adattamento lo ritroviamo nel genoma del Panda, l’unico animale erbivoro
appartenente al genere degli orsi. Per individuare il motivo del perché solo il panda segue un tipo
di alimentazione erbivora, i ricercatori sono andati ad analizzare il genoma di questa specie.
L’evidenza che sono riusciti ad estrapolare è un gene chiamato Tas1r1: questo è un gene legato ai
recettori del gusto, e permette agli orsi di assaporare il gusto nella carne. Nei panda il gene Tas1r1
è disattivato, non funzionale. Spiegando così l’incapacità dei panda di assaporare la carne e così
gradualmente abbia spostato la sua attenzione dal consumo di carne, al consumo di bambù.
2.1. STUDIO SULL’ORSO MARSICANO – VARIABILITÀ E SOPRAVVIVENZA
Questa specie di orso, che abita sugli Appennini italiani, ha una storia particolare.
È una specie numericamente piccola, e solitamente quando una specie ha una dimensione di
individui estremamente ridotta facilmente viene classificata come specie in via di estinzione, o a
rischio.
Ma dallo studio del suo genoma è risultato che questa specie ha pochissime variabilità, dunque
pochissime chance di riuscire a rispondere in modo efficace ad eventuali cambiamenti di ambiente,
però questo non vale per tutte le regioni del loro genoma. Infatti gli autori di questo studio hanno
identificato che in alcuni geni l’orso marsicano presenta ancora un’elevata variabilità, e questi geni
estremamente importanti per la sopravvivenza dell’orso.
Il primo gene riguarda il senso dell’olfatto, gli altri geni sono invece legati al sistema immunitario
dell’animale. In questi due geni per la sopravvivenza le variabilità sono alte, a differenza delle altre
regioni del genoma dove la variabilità è minore.

2.2 APPLICAZIONI MEDICHE


Una delle possibili applicazioni mediche è lo studio della variazione dei virus, l’identificazione e la
prevedibilità dell’andamento di determinati virus o batteri, in modo da poter designare una
appropriata terapia che possa combattere l’insorgenza di questi patogeni, superando così la
farmacoresistenza, un problema estremamente grave, soprattutto per quando riguarda la
farmacoresistenza agli antibiotici.

Abbiamo anche delle applicazioni dell’ambito della medicina forense. Lo studio dei campioni di
DNA prelevati da una scena del crimine; l’analisi di caratteristiche genetiche permettono di
identificare i possibili sospettati di un crimine.

2.1.4 STUDIO SULLA POPOLAZIONE TIBETANA


Gli autori hanno confrontato il genoma di alcuni individui Tibetani e di altri individui Cinesi.
Da confronto del genoma di questi due gruppi etnici i ricercatori hanno identificato delle differenze
in un gene: EPAS1, un gene coinvolto nella produzione dell’emoglobina, e come sappiamo
l’emoglobina ha la funziona di trasportare l’ossigeno dei tessuti del corpo. Ciò che hanno
constatato è che nei Tibetani è presente una variante di questo gene che produce molta più
emoglobina che nella variante genica presente nella popolazione cinese.
L’origine della variante di questo gene dovrebbe essere stata ereditata con un contatto tra
popolazioni antiche di Homo sapiens con l’Homo di Denisova, del quale si conosce ancora
pochissimo.
2.1.5 STUDIO DELL’ORIGINE DELL’EVOLUZIONE DI IMPORTANTI EPIDEMIE
Attraverso lo studio genetico dei patogeni, possiamo capire l’origine e anche l’evoluzione di
importanti epidemie passata.
Uno studio ha analizzato dei campioni di Yersinia pestis, ovvero il patogeno della Peste Nera.
I ricercatori erano interessati ad identificare le differenze tra i ceppi attualmente presenti in alcune
zone del mondo, e i ceppi di Y. pestis che hanno causato la Peste Nera in Europa (1347-1351).
Perché i ceppi del 1300 erano più aggressivi e quelli attuali sono meno virulenti? Sono andati a
campionare le sepolture del periodo medievale nei cimiteri di Londra, per poi confrontare i
campioni con i ceppi moderni dello stesso batterio. Quello che hanno scoperto è estremamente
sorprendente: i due ceppi non presentano nessun tipo di differenza che possa spiegare la
differenza di aggressività. Ciò che ha reso letale la peste nera non era tanto la caratteristica del
genoma del patogeno, ma le abitudini sociali particolari del periodo medievale.

Un altro studio delle pandemie riguarda invece la diffusione dei patogeni che hanno decimato le
popolazioni indigene messicane, subito dopo il contatto con le popolazioni europee.
Molti patogeni che hanno causato gli alti livelli di mortalità tra gli indigeni non sono ancora
identificati. Nello studio Salmonella enterica genomes recovered from victims of a major 16th
century epidemic in Mexico hanno confrontato dei campioni di microrganismi campionati dalle
sepolture di individui morti prima dell’arrivo degli europei, con dei campioni prelevati da delle
sepolture di individui deceduti post-contatto con gli europei.
Con la metodologia “meta genomica’’ hanno analizzato tutte le specie presenti in tutti i due e
campioni (indigeni deceduti post e pre-contatto con gli europei). Hanno scoperto che l’unico
patogeno che non era presente nelle sepolture pre-contatto era la Salmonella enterica (S.
enterica).

3. BASI DI BIOLOGIA EVOLUZIONISTICA


Esploriamo le varie fasi che hanno portato alla formulazione della teoria dell’evoluzione fatta da
Darwin. Dunque il primo principio si basa sul cambiamento, quindi la trasmissione di modificazione
con il passare del tempo di generazione in generazione. Il secondo principio afferma che il
cambiamento viene ereditato a seconda delle pressioni evolutive esercitate dall’ambiente sulle
specie che lo abitano; questo prende il nome di evoluzione per selezione naturale.

TL; DR: Charles Darwin propose due teorie principali: la prima è quella della discendenza con
modificazioni, ovvero l’evoluzione; la seconda è la teoria dell’evoluzione per selezione naturale.

Un aspetto importante delle modificazioni e di come si trasmettono di generazione in generazione,


è che queste modificazioni hanno un significato evolutivo solo se avvengono a livello di gruppi di
popolazioni o specie, a livello di individuo non hanno un significato evolutivo. Queste
modificazioni possono essere modificazioni lievi che avvengono a livello di specie (es. le differenze
dell’espressione di un gene), oppure possono essere delle modificazioni estremamente rilevanti
che portano a dei cambiamenti radicali (es. la formazione di due specie diverse: rettili – uccelli).
Ovviamente le modificazioni rilevanti che portano alla formazione di specie completamente
distinte, non sono altro che un accumulo di modificazioni lievi.

Futuyama: Capitolo 1; Ferraguti & Castellacci: Capitoli 2,6


3.1 ESEMPIO DELL’EVOLUZIONE BATTERICA – FARMACORESISTENZA
L’esempio cardine dei principi della teoria dell’evoluzione di Darwin è l’evoluzione dei batteri.
Come sappiamo molti batteri sono la causa dell’insorgenza di infezioni, e fino ai primi anni del 20°
secolo le persone morivano per sepsi o shock settico, sifilide, tubercolosi e polmonite.
La situazione comincia a cambiare nel 1960, durante un periodo di studi sugli antibiotici
(penicillina). Si pensava che con l’utilizzo degli antibiotici si potesse interamente eradicare il
problema delle infezioni batteriche.
Oggi sappiamo che questa previsione era errata; perché i batteri possono sviluppare delle
resistenze agli antibiotici. Questa caratteristica viene chiamata farmacoresistenza o antibiotico
resistenza, rappresenta un problema estremamente grave perché le malattie e le infezioni che
sembravano essere stata debellate, si stanno recentemente diffondendo, e le terapie antibiotiche
che venivano usate per combattere queste malattie risultano inefficaci.

Come hanno acquisito i batteri la caratteristica di sopravvivere agli antibiotici?


Consideriamo due ipotesi: il farmaco ha indotto la mutazione, oppure i batteri presentano già una
mutazione dormiente, possibilmente attivabile sotto la pressione della selezione antibiotica.
Ovviamente oggi sappiamo che tra le mutazioni già presenti nel pool dei batteri sono presenti
queste variazioni che conferiscono resistenza ai farmaci, ma non sono evidenti, perché l’ambiente
in cui il batterio proliferava non richiedeva una resistenza specifica.

Ricordiamoci che la causa dello stress biologico selettivo (in questo caso l’antibiotico) non è mai la
causa del processo mutazionale. Quindi: il cambiamento dell’ambiente non produce una
mutazione favorevole nelle specie esposte a questa pressione selettiva. La mutazione è un
processo casuale e indipendente, perché le mutazioni possono essere già presenti all’interno del
pool della specie.

3.2 BASI DELL’EVOLUZIONISTMO – PRIMA DI DARWIN: LAMARCK


“Lamarck fu il primo le cui conclusioni sull’evoluzione attrassero molta attenzione. Questo
naturalista giustamente celebrato per primo richiamò l’interesse sul fatto che i cambiamenti del
mondo organico come quello inorganico, siano il risultato di leggi e non avvengano per miracolosa
interposizione’’ (Charles Darwin, 18619)

Lamarck propose la teoria che i cambiamenti nel mondo biologico erano il risultato di leggi
naturali, e non di qualche imposizione divina. I principi cardine della teoria proposta da Lamarck
erano principalmente due.
Il primo principio afferma che le specie si generano di continuo, e quindi supera l’idea di fissismo e
immutabilità delle teorie precedenti. Il secondo principio afferma che questo dinamismo
(cambiamenti e mutazioni) era il risultato di una risposta attiva a determinati bisogni degli
individui, permettendo lo sviluppo di caratteristiche utili trasmissibili alla prole.

Un esempio modello è l’evoluzione del collo delle giraffe: l’uso è il disuso di determinate
caratteristiche (definiti come caratteri acquisiti e successivamente caratteri adattativi) può portare
alla modificazione morfologica di determinati individui.
3.3 BASI DELL’EVOLUZIONISMO – CHARLES DARWIN
Nel periodo di studio sulle Isole di Galapagos in Equador, Darwin venne fortemente influenzato
dalle teorie di Malthus. Quest ultimo era un economista, e la teoria che influenzo parecchio Darwin
era la teoria secondo cui il tasso di crescita di una popolazione fosse maggiore rispetto al tasso di
crescita delle risorse alimentari.

In questo modo la crescita della popolazione doveva essere ridotta per poter usufruire della
scarsezza delle risorse alimentari, assicurando la sopravvivenza della popolazione.
L’idea che la crescita della popolazione fosse influenzata dalla disponibilità delle risorse alimentari,
influenzò Darwin e fu alla base del pensiero della selezione naturale, secondo cui: solo determinati
gruppi di individui sopravvivono alle pressioni dell’ambiente circostante, i meno adatti non si
riproducono e la specie perisce.

3.3.1 NASCITA DELLA TEORIA DELL’EVOLUZIONE DI CHARLES DARWIN


Nel testo “L’origine della specie’’, pubblicato nel 1859 Darwin riassume i principi cardine della sua
teoria dell’evoluzionismo:
 tutti gli organismi sono generati da un comune antenato e che in seguito hanno subito delle
modificazioni;
 le modificazioni sono state guidate dall’azione di processi naturali, quali soprattutto la
selezione naturale;

Riassunse questi principi portando le prove di questi processi, raccolte dalle analisi dello studio dei
fossili, della geologia, dell’anatomia comparata, ecc.
Uno degli esempi dell’evoluzione riportato ne: L’origine della specie, è rappresentato dalla storia
evolutiva dei fringuelli delle Isole Galapagos. Le caratteristiche principali che differenziavano
queste specie risiedono nella forma morfologica e nella funzione specifica del becco, quest’ultima
legata alla categoria di cibo di cui i fringuelli si nutrivano.
La parte iniziale dell’albero genealogico, che contiene gli antenati comuni di tutte le specie dei
fringuelli, riporta un’ampia ramificazione basata sull’ambiente in cui i fringuelli abitano.
Possiamo dunque dire che queste specie si sono adattate a specifici ambienti e ad una specifica
alimentazione, ma discendono tutte da un antenato comune.
3.4 DIFFERENZE PRINCIPALI TRA DUE TEORIE EVOLUZIONISTICHE – LAMARCK E DARWIN
Secondo Lamarck le specie evolvono, ereditando dei caratteri acquisiti con uno sviluppo grazie
all’uso o disuso di una determinata caratteristica, perché utile nella risposta di un determinato
bisogno (es. delle giraffe, vedi cap. 3.2)
Secondo la teoria evoluzionistica Darwiniana nel gruppo originale della specie delle giraffe erano
presenti sia individui con colli più sviluppati, sia individui con colli corti. La pressione naturale, e
dunque la capacità di raggiungere le foglie sui rami più alti degli alberi, ha fatto sì che gli individui
più dotati sopravvivessero.
Nella teoria di Lamarck il collo lungo è dunque una caratteristica acquisita, mentre nella teoria
evoluzionistica di Darwin, la variabilità (collo lungo/corto) erano già presenti simultaneamente
nella specie delle giraffe, ma la capacità di rispondere meglio agli stimoli, ha fatto si che solo gli
individui con il collo lungo sopravvivessero.

Quindi si supera l’idea di progressione biologica proposta da Lamarck, che proponeva un progresso
evoluzionistico basato sulla trasformazione di una data specie in individui sempre più specializzati.
Dunque si abbraccia la teoria di Darwin, rappresentata da un albero con diversi noti raffiguranti la
formazione di due specie con caratteristiche distinte, la cui base simboleggia un antenato comune,
mentre i rami rappresentano le modificazioni morfologiche o genetiche.

3.5 ERNST MAYR E LE CINQUE TEORIE DARWINIANE

 Evoluzione in sé: dinamismo, cambiamento incessante e in parte direzionale;


 Origine comune: ramificazione dei taxa;
 Gradualismo: “Natura non facit saltus’’; questo non significa velocità costante;
 Moltiplicazione delle specie: i predarwiniani credevano ad un numero costante di specie;
 Selezione naturale: primo step – generazione della variabilità (caso)
secondo step – selezione ed eliminazione (direzione)

4. MANCANZA DELLA TEORIA ADEGUATA SULL’EREDITARIETÀ DEI CARATTERI


Darwin si accorse che quelle specie che lui osservava dovessero avere un’origine comune. Fu allora
che iniziò a formulare quella che poi definì “discendenza con modificazioni’’.
Consiste nella presenza di un'unica popolazione ancestrale di un antenato comune a tutte le specie
osservate, da cui in un certo momento nel passato si sono differenziati, e questi gruppi divisi hanno
accumulato delle modificazioni che portarono alla nascita delle specie diverse (es. fringuelli).
Come detto in precedenza: le modificazioni particolari che riguardavano ogni singola specie
permette a queste specie di sopravvivere in un determinato ambiente.

4.1 ESPERIMENTI DI MENDEL


Prima degli esperimenti di Mendel, la teoria maggiormente considerata come modello base di
trasmissione dei caratteri era quella dell’ereditarietà miscelata. Secondo questo modello i caratteri
parentali si miscelano nei figli e una vota trasmessi ai figli, le caratteristiche originali dei genitori
non potevano più essere osservate. Gli esperimenti di Mendel l’ibridazione sulle piante di pisello,
riuscirono a dimostrare che i geni che determinano i caratteri non si fondono nella prole:
rimangono distinte. Secondo le leggi di Mendel è possibile che il fenotipo sia una miscela dei
fenotipi parentali, ma i geni non si miscelano, segregano e vengono ereditati inalterati.
4.1.1 ASSORTIMENTO INDIPENDETE
Un altro elemento essenziale è l’assortimento indipendente: processo con cui gli alleli si
suddividono gli uni dagli altri in modo indipendente durante la formazione dei gameti.
Questo assortimento indipendente era già stato osservato da Mendel durante i suoi esperimenti,
non è una regola universale. Infatti è valido solo se i geni sono molto distanti tra loro. Al contrario,
se due loci sono associati tra loro più o meno strettamente (es. sono poco distanti e sullo stesso
cromosoma), la segregazione non è indipendente. Il risultato è un’associazione non casuale degli
alleli sul cromosoma detta linkage disequilibrium, dunque un’associazione non casuale degli alleli
alla meiosi.

4.2 GENERAZIONE DELLA VARIABILITÀ – MUTAZIONI


Il lavoro sperimentale svolto di Mendel, e successivamente approfondito dai primi genetisti del
ventesimo secolo ha permesso di chiarire quali sono i fattori legati all’ereditarietà dei caratteri;
dunque individuare nel gene l’unità fondamentale dell’ereditarietà e capire i meccanismi di
trasmissione da una generazione all’altra.
Un altro importante contributo che ha fatto luce su come questi caratteri vengono ereditati e
trasmessi, lo dobbiamo ad un altro grande studioso August Weismann (1833-1914).
Weismann è il primo a proporre una netta distinzione tra le cellule somatiche e le cellule germinali
(cellula uovo e spermatozoi). Queste ultime vengono poi trasmesse alla generazione successiva.

Dal processo di replicazione dipende la sopravvivenza degli individui. La replicazione è un processo


estremamente preciso, tuttavia in alcune condizioni l’imprecisione della replicazione può scaturire
l’insorgenza di errori. Questi errori prendono il nome di mutazioni e sono dei fenomeni casuali.
Se queste avvengono all’interno delle cellule della linea germinale, vengono ereditate nella
generazione successiva. La nuova generazione sarà caratterizzata da una novità genetica, assente
negli individui parentali. La variabilità che noi osserviamo è dovuta al processo di mutazione, le
mutazioni sono dunque la prima fonte di variabilità.

TL; DR: le mutazioni possono avvenire in qualsiasi cellula del nostro corpo, sia in cellule somatiche
che germinali. Siccome le mutazioni vengono trasmesse alla progenie queste assumono un
significato evolutivo e sono la prima fonte di variabilità.

Le modificazioni che avvengono al livello della sequenza del DNA hanno una forte influenza sul
fenotipo risultante. Se il genotipo costituisce la sorgente primaria della variazione, il fenotipo è il
bersaglio finale dell’evoluzione: è l’elemento su cui le pressioni evolutive lavorano. La selezione
naturale seleziona determinati fenotipi, questi fenotipi sono direttamente dipendenti dal
genotipo. Le mutazioni che producono un effetto fenotipico sono quelle mutazioni che avvengono
all’interno delle porzioni del genoma codificanti, e sono dunque funzionali alla produzione delle
proteine.

4.2.1 CLASSIFICAZIONE DELLE MUTAZIONI E LORO EFFETTI


Tipi di mutazioni:
 Sostituzioni: transazioni (pur-pur) o trasversioni (pur-pir);
 Ricombinazione (CAAC-GTCT);
 Indel: delezione (-sequenza) o inserzione (+sequenza);
 Inversione (ACGT-TGCA)
Le mutazioni possono di conseguenza causare:
 Sinonimia (GTC-GTA = Val-Val);
 Non sinonimia (GTC-TTC = Val- Cys): conservative (quando il nuovo amminoacido presenta
le stesse caratteristiche chimiche di quello originale) e non-conservative (quando
l’amminoacido ha differenti proprietà);
 Nonsenso (AAG – TAG = Lys – Stop)

Le mutazioni; ogni codone codificante un AA può mutare in altri 9 codoni attraverso sostituzioni di
un singolo nucleotide. Un esempio è il codone CCU che codifica per l’amminoacido prolina.
I nuovi codoni differenti hanno effetti differenti a livello di produzione dell’amminoacido. Tuttavia,
nonostante questo forte potere di modifica
degli amminoacidi che vanno a comporre le
proteine, il sistema di traduzione dei
codoni in amminoacidi limita gli effetti
delle mutazioni. Infatti il codice genetico è
ridondante, o degenerato. Questo vuol dire
che diverse triplette codificano per lo stesso
amminoacido.

4.3 GENERAZIONE DELLA VARIABILITÀ –


RICOMBINAZIONE
Dopo le mutazioni, un’altra fonte di variabilità è la ricombinazione.
La ricombinazione consiste nello scambio di
porzioni di DNA tra due cromosomi omologhi:
tra due cromosomi omologhi appaiati si creano
dei punti di contatto e una volta che i cromosomi
divisi durante la formazione dei gameti. Le
sequenze scambiate vengono chiamate sequenze
ricombinanti, diverse dalle sequenze parentali
(vedi immagine sottostante).
La ricombinazione può avere due effetti: può
essere una ricombinazione reciproca (vedi immagine capitolo 4.3), oppure non reciproca. In
questo ultimo caso solo uno dei due cromosomi viene modificato. Dunque anche la
ricombinazione reciproca è un potente mezzo di generazione della variabilità.
4.4 GENERAZIONE DELLE VERIABILITÀ – INDEL E FRAMESHIFT
Le inserzioni e delezioni hanno degli effetti molto importanti quando influenzano la struttura della
proteina finale che deve essere tradotta da quella sequenza.
Le mutazioni che vengono introdotte delle indel nelle sequenze codificanti vengono chiamate
Frameshift, perché fanno a modificare il frame di lettura dei codoni.
Se in una delle triplette avviene una semplice sostituzione il frame di lettura non viene modificato,
perché quella base viene sostituita da un’altra base, e le triplette rimangono triplette, quello che
può cambiare è il tipo di amminoacido che viene inserito, non il numero di amminoacidi che
vengono inseriti
Se invece, nel frame di lettura, avviene una indel, il frame cambia completamente. Le indel
possono portare alle:
 Terminazioni premature per delezione;
 Perdite di codone di stop per delezione;
 Perdita di codone per inserzione;
 Terminazione prematura per inserzione

L’inserzione o delezione di tre (o multipli di tre) nucleotidi non altera il frame di lettura dell’ORF
(viene mantenuto il frame), e risulta quindi essere maggiormente tollerabile nel corso
dell’evoluzione (la proteina risulterà essere un po’ più lunga o leggermente più corta).
Se si verifica l’inserzione o la delezione di un numero diverso di nucleotidi, allora il codice di lettura
risulterà falsato, generando probabilmente una proteina non funzionale:

4.5 GENERZIONE DELLA VARIABILITÀ – MUTAZIONI DELLE SEZIONI RIPETUTE DEL GENOMA
In questo caso le mutazioni sono causate da uno scivolamento della polimerasi durante la
replicazione. Sappiamo che nel genoma ci sono delle regioni composte da piccole sequenze
ripetute. In queste regioni la precisone della polimerasi viene a meno, capita dunque che aggiunga
più ripetizioni a quelle esistenti del filamento stampo.
Queste sono le regioni con il più alto tasso di mutazioni genomiche. Questi loci del DNA vengono
utilizzati spesso per il riconoscimento degli individui, infatti ogni essere umano ha un particolare
polimorfismo di numero di coppie.

4.6 GENERAZIONE DELLA VARIABILITÀ – COPY NUMBER VARIATION


Sono sempre dei polimorfismi che riguardano dei loci ripetuti nel DNA, ma a differenza dei
polimorfismi, le copy numer variant non si fermano solo a delle piccole porzioni della sequenza del
DNA ma ad intere regioni del cromosoma.

5. INDIVIDUI E POPOLAZIONI
I geni nell’individuo sono determinati dalle leggi Mendeliane. Ricordiamoci che un individuo può
essere omozigote per allele (lo stesso allele
ad un locus in organismi diploidi), oppure
eterozigote per allele (alleli diversi ad un locus
in organismi diploidi), a seconda di quello che
ha ereditato dal padre e dalla madre. Sappiamo
che la popolazione è definita dalle frequenze alleliche (da: corso di Genetica – UniFe prof.ssa C.
Scapoli).
Per definire la popolazione genica prendiamo in esempio una moltitudine di lucertole.
Le (N=) 5 lucertole sono organismi diploidi, avendo a disposizione un totale di 10 genomi aploidi
(cromosomi) in totale.
Come possiamo vedere il loco viola è monomorfica perché uguale in tutti gli individui, e dunque
non può esserci variabilità. Mentre Per i loci primi c’è variabilità. Nella popolazione dunque
andiamo a considerare la struttura di ogni singola posizione del genoma, vedendo in tutta la
popolazione, quanti alleli e con quale sequenza si presentano. Quindi una popolazione è definita
dal suo pool genico – set di alleli presenti in tutta la popolazione.
Molto importante, nella genetica di popolazione, è la dimensione della popolazione: in genere
indicata con N per la componente aploide, 2N per la diploide (da non confondere con il numero
degli individui riportato nell’esempio grafico delle lucertole).

Le frequenze alleliche cambiano nel tempo; questa è la base di tutta la genetica evoluzionistica.
L’evoluzione è determinata dal cambiamento delle frequenze alleliche.

6. DEFINIZIONE DELLA GENETICA DI POPOLAZIONI E CONCETTI ESSENZIALI


La genetica di popolazione è lo studio della variabilità all’interno di una specie. Senza variabilità
genetica non si può parlare di evoluzione e di conseguenza non si può parlare di genetica.
La variabilità genetica viene anche usata per analizzare i rapporti dell’evoluzione della specie –
filogenesi.

I concetti essenziali: i processi evolutivi avvengono principalmente all’interno delle popolazioni,


perché è la popolazione che si evolve nel tempo, non l’individuo. Una specie è solitamente
composta da una singola popolazione, vedremo anche che ci sono delle popolazioni che
rappresentano la solita eccezione che conferma la regola. Per popolazione si intende un unico
gruppo di individui che si incrociano casualmente.
Il più delle volte le specie sono divise in popolazioni o sottopopolazioni. Perché una sottospecie sia
divisa in popolazioni, ci devono essere delle condizioni (chiamiamole anche barriere), che fanno sì
che gli individui comincino ad essere così tanto diversi geneticamente, che questa diversità si
trasmette in una suddivisione, o sottopopolazioni caratterizzate da struttura genetiche diverse.
Le barriere possono essere di tipo biologico, geografico, ecc. Nella specie umana non ci sono
barriere rilevanti che possano portare alla suddivisione della specie in popolazioni diversi. È
corretto definire la specie umana come un’unica popolazione. La specie umana è dunque
l’eccezione che conferma la regola.

6.1 VARIABILITÀ ALL’INTERNO DELLE POPOLAZIONI


La genetica di popolazione va definire questa variabilità con degli strumenti statistico-matematici,
e spiega come questa variabilità si trasforma nel corso del tempo.
Due popolazioni A e B hanno diversi indici di variabilità in base al numero N di alleli disponibili.
Ho è l’indice di variabilità, e possiamo subito notare quanto possa essere controintuitivo che la
popolazione A con il maggior numero di alleli, abbia un Ho minore rispetto alla popolazione B.
Osserviamo la popolazione B, e notiamo la presenza tre genotipi (blu/blu; rosso/rosso; blu/rosso),
mentre la popolazione alternativa A ha un livello di variabilità minore.

Nell’esempio riportato sopra abbiamo parlato di alleli, in realtà, quando si parla di variabilità
genetica si preferisce lo studio del genotipo e delle specifiche sequenze nucleotidiche o addirittura
di interi genomi.

6.2 VARIAZIONE DELLE FREQUENZE ALLELICHE NELLE POPOLAZIONI


Il sistema più utilizzato è il sistema di mappe. Prendiamo l’esempio di frequenza di tre alleli AB0
determinanti i gruppi sanguigni.
I tre alleli presentano frequenze molto diverse se disposti in una mappa politica. Ad esempio:
l’allele 0 in Sud America ha la frequenza più altra (vedi prima mappa). Mentre l’allele B è quasi
assente nelle popolazioni delle Americhe (vedi seconda mappa).

6.2.1 REGOLE DI DISTRIBUZIONE DELLE FREQ. ALLELICHE


La distribuzione dei vari alleli all’interno della popolazione
mondiale umana è che il fondatore del Nord America, dunque i
coloni che sono andati a colonizzare le Americhe, erano
portatori dell’allele zero. Successivamente andremo a vedere
l’effetto del fondatore.
L’allele zero si è dunque gradualmente diffuso nel Nord America
per poi arrivare, tramite migrazione, nel Sud continente. Per
quanto riguarda l’allele A (guarda terza mappa); si pensa che si
sia originato da una mutazione a livello della Scandinavia.
Oppure che l’allele B (vedi seconda mappa) abbia avuto origini
nel centro asiatico.
Quindi abbiamo tre origini: origine per mutazione, oppure
origine per effetto del fondatore, con conseguente origine per
mutazione. Queste sono le forze evolutive che vengono
studiate nella genetica di popolazione. La forza evolutiva
principale è ovviamente la selezione naturale.
6.3 DEFINIZIOEN DI POPOLAZIONE MENDELIANA E POOL
GENICO
La genetica di popolazione studia la frequenza degli alleli e dei genotipi in gruppi di individui, e la
variazione di queste frequenze in generazioni successive; basandosi sui principi mendeliani a livello
di popolazione: dominanza, recessività, segregazione, posizione dei geni sul cromosoma.
La genetica di popolazione è quindi valida solo per le popolazioni mendeliane.
Queste popolazioni di tipo mendeliano sono riconosciute come un gruppo di individui di una stessa
specie diploide (a generazioni sovrapposte) che vivono in una data area ed i cui membri possono
riprodursi sessualmente. Tali individui quindi condividono lo stesso insieme di alleli: pool genico.

Il pool genico è l’insieme di tutti gli alleli contenuti nella popolazione ad un determinato locus.
I loci possono presentare più alleli: i gruppi di individui di sottopopolazione diverse possono
presentare assortimenti allelici differenti che si combinano in genotipi differenti.
Ma come possiamo descrivere quantitativamente il pool genico?
Bisogna campionare due numeri differenti: la frequenza allelica (spesso citata nei testi didattici
come frequenza genica) dei vari alleli che compongono il pool genico, e siccome abbiamo detto
che gli alleli si uniscono per formare i genotipi; bisognerà di conseguenza analizzare la frequenza
genotipica.

Come estraiamo queste informazioni? Abbiamo i numeri assoluti, o le frequenze relative (per
entrambe le frequenze alleliche e genotipiche).

6.3.1 STUDIO DEI POLIMORFISMI


I numeri campionati: numeri assoluti e frequenze relative, sono riferiti ai polimorfismi.
Esistono diversi tipi di polimorfismi: morfologici, elettroforesici, di restrizione (RFLP), di lunghezza,
di sequenza, di numero di copie, di comportamento.
Nell’uomo, o per gli organismi modello più studiati si può direttamente lavorare sui polimorfismi di
sequenza, ed esaminare il polimorfismo a livello di singolo nucleotide.

7. CALCOLO FREQUENZE ALLELICHE E GENOTIPICHE


Frequenza genotipica = la proporzione di un certo genotipo nella popolazione

In una popolazione naturale sono presenti 3 fenotipi facilmente distinguibili dovuti a 2 alleli del
locus A:

 A’ A’  353
 A’ A  494
 AA  153
 TOTALE  1000

Premessa: stiamo studiando un singolo locus bi-allelico (A’/A = A/a) a dominanza completa.
Usiamo la terminologia A’/A perché stiamo studiando un sistema con assenza di dominanza, il che
ci permette di lavorare direttamente sulla distribuzione dei genotipi.
Considerando ciò che abbiamo descritto nel capitolo 6.3 – Definizione del pool genico; sappiamo
che per definire quest’ultimo abbiamo bisogno di definire in primis le frequenze genotipiche, e
non posso andare a lavorare direttamente sulle frequenze alleliche perché negli organismi il primo
campionamento che viene fatto è quello degli individui, quindi le frequenze alleliche.

Vediamo subito dalla tabella una distribuzione dei genotipi. Dal totale degli individui campionati
individuiamo un gruppo di omozigoti A’ (353), un altro gruppo di omozigoti A (153) e degli
eterozigoti (494) Abbiamo dunque raccolto dei dati relativi alle frequenze genotipiche, dai quali
dobbiamo ricavare le frequenze alleliche.
Per ricavare le frequenze alleliche non dobbiamo fare altro che contare quanti alleli ho all’interno
del totale degli individui (1000), cioè la frequenza di ogni singolo allele.

 Frequenza allele A’ = p
Gli alleli A’ sono 353 x 2 (gli omozigoti introducono nella popolazione 2 alleli)
+494 x 1 (gli eterozigoti introducono solo 1 allele A’)
 Frequenza allele A = q
Gli alleli A sono 154 x 2 (gli omozigoti introducono nella popolazione 2 alleli)
+494 x 1 (gli eterozigoti introducono solo 1 allele A)

 Anche il totale deve essere moltiplicato x 2: gli organismi diploidi introducono nel pool 2
alleli indipendentemente da quale allele.

 ' ( 2×353+ 494 ) 1200


f ( A ) =p= =  = 0.6
2000 2000

 ( 2  ×   153+ 494 ) 800


f ( A ) =q= = = 0.4
2000 2000

Ottenuta la genotipica allelica possiamo ricavare la frequenza allelica. La frequenza allelica è la


frequenza di un allele ad un dato locus, ed è uguale alla proporzione di un certo allele sul totale
degli alleli possibili ad un locus di popolazione.

' '
f r e q u e n z a   a l l e l e   A → f ( A )= p=
(2 D+H )
=
( D +   12 H )
2N N

f r e q u e n z a   a l l e l e   A → f ( A ) =q=
(2 R+ H )
=
( R +   12 H )
2N N

da qui ci basterebbe conoscere:

p+q=1

→  p=1−q  ;
→  q=1− p

7.1 FORMULARIO PER IL CALCOLO DI FREQUENZE GENOTIPICHE E ALLELICHE

 Calcolo della frequenza genotipiche:


Popolazione di individui = N

 D
A ' A ' =D   in d i v i d u i ;         f ( A ' A' )=
=d
N
 H
A ' A=H   i n d i v i d ui ;         f ( A ' A )= =h
N
 R
A A=R  i n d iv i d u i;           f (   A A )= =r
N
 Calcolo di frequenze alleliche:
Numero di alleli = 2N (perché 2 gameti)

'
f ( A )=p=
(2 D+H )
=
( D+ 12 H ) ;         f ( A ) = p=d + 1 h
'
2N N 2

f ( A ) =q=
(2 R+ H )
=
( R + 12 H ) ;         f ( A )= q= r + 1 h  
2N N 2

7.2 LEGGE DI EQUILIBRO DI HARDY-WEINBERG (1908) E DIMOSTRAZIONE MATEMATICA


Cosa lega le grandezze tra le frequenze genotipiche e quelle alleliche?
La relazione che lega queste due grandezze è stata definita legge dell’equilibrio di Hardey-
Weinberg. Utilizzarono l’algebra per spiegare come le frequenze alleliche possono predire le
frequenze genotipiche.
I due scienziati, lavorando separatamente i indipendentemente, hanno assunto che: l’organismo
analizzato dovesse essere diploide a riproduzione sessuale [1]; che le generazioni non si dovessero
sovrapporre [2]; che la segregazione dei geni dovesse essere di tipo mendeliano [3], e che le
frequenze alleliche non fossero uguali nei due sessi [4]. Questi sono dunque gli assunti della legge
di equilibrio di H-W solo se abbiamo una popolazione mendeliana.
Possiamo certamente notare che l’assunzione numero [4] è una novità: i due ricercatori infatti,
hanno dato per assodato che le frequenze alleliche che stavano considerando insieme ai sistemi
genetici analizzati, presentassero un eguale distribuzione degli alleli nei due sessi. Questo significa
che il sesso della cavia non doveva influenzare il loro modello, e il loro ragionamento.

Formalizziamo ora gli assunti più importanti di questo equilibrio:

 La popolazione è costituita da un numero elevato di individui [5];


 Gli incroci avvengono completamente a caso [6];
 Gli individui non differiscono tra loro per il tasso di sopravvivenza e la capacità riproduttiva
– assenza di selezione [7];
 Gli alleli sono del tutto stabili – assenza di mutazione [8];
 Non c’è migrazione [9)

Prendiamo in considerazione la [6] assunzione: gli incroci avvengono completamente a caso, se gli
incroci tra gli individui della popolazione avvenissero a caso, la relazione tra i genotipi e le
frequenze alleliche dovrebbe essere la seguente:
Generazione zero (tempo 0) con genotipi:
f   ( A A )=d f ( A a )=h f ( a a )=r t o t a le=N

Generazione zero (tempo 0) con alleli:

( 12 h )= p→ p+q=1
p ( A )= d +

1
p ( a )= ( r + h )=q → p +q=1
2

Assunzione: l’unione tra i genotipi è casuale (random mating);


Conseguenza: l’unione tra i gameti e casuale (panmissia).

Vediamo ora come cambia la generazione dalla fertilizzazione del gamete femminile (A,a) con lo
spermatozoo maschile (A,a), dunque se la generazione zero (tempo 0) avevamo p,q; alla
generazione 1 otterremmo p2 ,2 p q ,   q 2 . Perché ( p +q )2 = p 2+ 2 p q+ q2 , ottenendo così
l’equilibrio di Hardy-Weinberg, derivato dalla prima legge di Mendel.

La legge di equilibrio afferma che in una


popolazione mendeliana panmittica (ovvero in una
popolazione in cui le unioni tra individui si
formano per associazione di genotipi) che non
presenti: selezione, mutazione, migrazione e che
sia composta da un numero elevato di individui, il
rapporto tra gli alleli e tra i genotipi è costante da
una generazione all’altra e la popolazione si
considera in equilibrio al locus considerato.

7.2.1 ACCERTAMENTO LEGGE DELL’EQUILIBRIO DI HARDY-WEINBERG


Come facciamo ad accertare questo equilibrio? Abbiamo bisogno di uno strumento che ci
permetta di determinare se il locus nella popolazione è in equilibrio.
Si utilizza il test statistico del chi-quadro x 2 . La formulazione è:

x 2=
∑ ( o s s e r v a t i−a t t e s i )2
at t e si

Il chi-quadro è il confronto delle frequenze osservate, rispetto alle frequenze attese, di tutte le
classi fenotipiche (somma). Dunque per determinare la presenza dell’equilibrio del locus della
popolazione è necessario disporre dell’analisi delle frequenze osservate, ottenute dal
campionamento della popolazione. Poi è necessario disporre del numero di frequenze attese,
calcolabile.
Ricaviamo poi le frequenze genotipiche dalle frequenze alleliche, e infine possiamo andare ad
espletare il confronto con il chi-quadro, verificando lo scostamento dalla popolazione ideale.
Dunque il test permette di verificare se le frequenze genotipiche osservate si discostano da quelle
attese per una popolazione ideale. Se questo scostamento è significativo, vuol dire che una o più
assunzioni sono state violate.

7.2.2 PRIMO ESEMPIO DI ACCERTAMENTO DELL’EQUILIBRIO DI HARDY-WEINBERG


Innanzitutto campioniamo un numero di individui all’interno di una popolazione, campionando N
individui, con N = 100. Immaginiamo quindi di considerare un fenotipo di colorazione della corolla
dei una Rosa chinensis, e di stabilire che 48 individui hanno una colorazione rossa dovuta al
genotipo AA (omozigosi dominante), 8 piante presenteranno una struttura genotipica omozigote
recessivo, caratterizzata da una colorazione bianca. Mentre 44 esemplari con colorazione
intermedia rosa (stiamo assumendo che ci sia un’assenza di dominanza completa) al genotipo
eterozigote Aa.
Per capire se queste tre distribuzioni osservate si adattano ad una popolazione ideale, bisogna
ricavare le frequenze attese.

Frequenze genotipiche:

p=
(2 D+ H )
=
( D+ 12 H ) = ( 48+ 22) =0.48+ 1 0.44=0.70
2N N 100 2

⇒ q=1− p=1−0.70=0.30

Attesi:
N× p2 N×2 p q N×q2
( 0.700 )2×100 2( 0.700)×( 0.300 )×100 ( 0.300 )2×100
49.00 42.00 9.00

Ora possiamo calcolare la sommatoria chi-quadro:

x 2=
∑ ( o s s e r v a t i−a t t e s i )2 ; o t t e n e n d o :
at t e si

Osservati Attesi Contingenze


Gen-11 48 49 0.020
Gen-12 44 42 0.095
Gen-22 8 9 0.111
100 100 0.227=c h i−q u a d r o

p 0.700
q 0.300

7.2.3 VARIAZIONE DEI VALORI DEL CHI-QUADRO


Da cosa dipende il chi-quadro? I gradi di libertà di pendono:
 Dagli scarti tra i valori osservati e attesi (e quindi dal numero di addendi);
 Dal numero di parametri stimati;

Il grado di libertà viene calcolato sottraendo 1 dal numero


di classi genotipiche, dunque:
(numero di classi -1).
Nel caso del nostro esempio: un chi-quadro di tre classi
genotipiche, dobbiamo togliere un grado di libertà, per
poi sottrarne un altro: ( 3−1 ) −1=1 .
Il valore ottenuto nella tabella sovrastante (0.227) deve essere interpretato utilizzando una tabella
delle probabilità del chi-quadro. Notiamo che il valore è al disotto dell’area dove l’ipotesi nulla
sarebbe accettabile.

L’ipotesi dunque non può essere rifiutata; di conseguenza la popolazione è all’equilibrio. Ovvero: il
locus che stiamo studiando all’interno della popolazione è in equilibrio perché l’ipotesi nulla (gli
assunti di una popolazione ideale – assenza delle 5 forze evolutive) viene rispettata.

Ovviamente ad ogni valore. del chi-quadro equivale una probabilità.

7.2.4 SECONDO ESEMPIO – SIGNIFICATO DI EQUILIBRIO


Se in una popolazione sono presenti 80 alleli A e 120 alleli a, con un totale di 200 alleli 2N;

allora: p= 80 =0.4   ⇒ q=0.6 .


200

Da questa popolazione è possibile distribuire tre genotipi diversi: AA, Aa, aa. Quali e quante
distribuzioni osservate possiamo ottenere data la distribuzione delle frequenze genotipiche p e q?
Potremmo avere delle popolazioni che si differenziano per la distribuzione di frequenze alleliche:

AA Aa Aa p
40 0 60 0.4
35 10 55 0.4
20 40 40
Esiste un infinito numero di distribuzioni osservate, ma la formula dell’equilibrio Hardy – Weinberg
afferma che solo una condizione riflette la giusta condizione di equilibrio, cioè:

p2×100=0.16   è   l a   f r e q u e n z a   a t t e s a   a l l' e q ui li b r i o   p e r   il   g e n o t i p o   A A ;

2 p q  ×  100=0.48   è   la   f r e q u e n z a   a t t e s a   a ll ' e q u il ib r i o   p e r  i l   g e n o t i p o   A a ;

2 '
q ×100=0.36   è  l a   f r e q u e n za   a t t e s a   a ll e q u il ib r i o   p e r  i l   g e n o t i p o   a a ;

Dunque solo una popolazione che presenta 16 individui AA, 48 individui Aa e 36 individui aa,
rifletterà le giuste condizioni di equilibrio di Hardy-Weinberg:

AA; p=0,4 Aa; p=0,4 aa; p=0,4


2
p ×100=0.16 2 p q×100=0.48 2
q ×100=0.36
16 individui 48 individui 36 individui

Nelle popolazioni naturali, le frequenze genotipiche sono quasi sempre in equilibrio di Hardy-
Weinberg. Inoltre: nelle diverse popolazioni le frequenze alleliche sono molti diverse.

0.1 SUMMA
o Una popolazione è caratterizzata dalle frequenze dei diversi genotipi e dei diversi alleli al
suo interno;
o Una popolazione si dice in equilibrio per il locus considerato quando le sue frequenze
genotipiche possono essere predette sulla base delle frequenze alleliche, e le frequenze
alleliche non cambiano attraverso le generazioni;
o Le popolazioni in equilibrio non si evolvono. I fattori che provocano lo scostamento
dell’equilibrio sono i fattori dell’evoluzione;
o In una popolazione in equilibrio: l’unione tra individui è casuale, non agiscono: mutazioni,
selezione, migrazioni e gli effetti del caso.

7.3 ESTENSIONI DELLA LEGGE DI HARDY-WEINBERG


La legge di Hardy-Weinberg e la legge del binomio può estendersi e riadattarsi in diverse
condizioni. Si possono trovare a livello di modelli di controllo genetico dei fenotipi:

 Sistema delle frequenze alleliche nel caso di un gene con due alleli co-dominanti (metodo
per conta diretta);
 Sistema ad alleli multipli;
 Sistema a loci X-linked;
 Sistemi a dominanza completa

7.3.1 ESTENSIONI DELLA LEGGE DI HARDY-WEINBERG – SISTEMA AD ALLELI MULTIPLI


In una popolazione a sistema di alleli multipli, troveremo un allele selvatico (maggiormente diffuso
nella popolazione), e un allele mutante (chiamato variante alternativa o allele alternativo).

Si parla di allelismo multiplo quando in una popolazione è presente un allele selvatico e molte
varianti (anche se un individuo diploide avrà al massimo 2 alleli diversi).
Come facciamo ad agganciare le frequenze alleliche degli alleli multipli alle frequenze genotipiche
della generazione successiva? Banalmente: la relazione che unisce le frequenze alleliche alle
frequenze genotipiche non cambia, ma si differenzia in termini di dimensione. I dati delle
frequenze alleliche si otterranno come sempre campionando la popolazione; dal dato ottenuto
dobbiamo calcolare le frequenze alleliche:
Pesando due volte la
1 1 1 2 1 3 1 4 frequenza osservata del
1 ( 2× A A ) + A A + A A + A A e t c .
p=f ( A )= ; genotipo omozigote, perché
2×nu m e r o   t o t al e   d e g li   in d i v i d u i questi alleli contribuiscono al
pool genico con una doppia
dose

2 ( 2× A 2 A2 ) + A 1 A2 + A2 A 3 + A2 A 4 e t c .
q  =f ( A )= ;
2×nu m e r o   t o t al e   d e g li   in d i v i d u i

3 ( 2×A 3 A 3 ) + A1 A 3 + A 2 A 3+ A 3 A 4 e t c .
r  =f ( A ) = ;
2×n u m e r o  t o t a l e   d e g l i  i n d iv i d u i

Non si sommano tutti gli eterozigoti, ma solo quelli che hanno l’allele considerato di volta in volta.
La legge di Hardy-Weinberg ci dice che una volta attenute le frequenze alleliche possiamo ricavare i
genotipi attesi nella popolazione successiva. I tre alleli (freq. allele A1 = p, freq. allele A2 = q, freq.
allele A3 = r) si assortiscono per formare 6 genotipi, cioè tre omozigoti e 3 eterozigoti. In caso di
co-dominanza tra i tre alleli, ai sei genotipi corrispondono sei fenotipi.

Le frequenze genotipiche dunque, vengono ricavate dallo sviluppo del trinomio:

( p +q+ r ) 2 ; d o v e :

→ A 1 A 1= p2
→ A 2 A 2=q2
→ A 3 A 3=r 2

Sviluppiamo ora il binomio con alleli multipli:

2   a l e l l i : ( p+q )2= p2 +2 p q +q 2 ;
3   a l l e l i : ( p+ q+r )2= p 2+ q2 +r 2 +2 p q +2 p r +2 q r ;

n  a l l e l i : ( p+ q+r +…+ n ) 2
7.3.2 ESTENSIONI DELLA LEGGE DI HARDY-WEINBERG – SISTEMA A LOCI X-LINKED
In questo caso la situazione è complicata dal fatto che i maschi possiedono un solo allele e le
femmine eterozigoti due alleli. In equilibrio di Hardy-Weinberg:

f e mm ine:
f ( X A X A ) = p2
a a 2
f ( X X =q
f ( X A X a ) =2 p q

m asc hi:
f ( X A Y )= p
f ( X a Y )=q
Dunque nelle femmine sono presenti tre genotipi (A1A1, A1A2, A2A2), mentre nei maschi sono
presenti solo due genotipi (A1, A2). Nei maschi le frequenze alleliche e le frequenze genotipiche
coincidono, pertanto condizioni dovute ad alleli recessivi di geni legati al cromosoma X sono molto
più frequenti nei maschi che nelle femmine (se q è piccolo, q 2 è ancor più piccolo). A partire dai
numeri assoluti dei diversi genotipi (quanti individui con diversi genotipi sono stati osservati) si
calcola:

1 ( 2× A 1 A1 ) f e mm in e + ( A1 A 2 ) f e m mi n e+ A 1 m a s c h i
p=f ( A )= ;
( 2×nu m e r o   t o t al e   d e ll e   f e mmi n e )+ nu me r o   t o t a l e   d e i   m a s c h i

Richiamando il dato dell’aumento delle possibilità di condizioni dovute ad alleli recessivi di geni
legati al cromosoma, citato nel paragrafo precedente, possiamo fare un esempio: la cecità dei
colori (daltonismo).

f e n o t i p o   q=0.08  ( 8 %  n e ll a   p o p o l a z io n e )
f r e q u e n z a   d i  d a l t o n i c i   m a sc h i=q=0.08 ;
2 2
f r e q u e n z e   d i   d al t o ni c h e   f e m mi n e=q =0.08 =0.0064  ( 0.64 % )

7.3.3 ESTENSIONI DELLA LEGGE DI HARDY-WEINBERG – SISTEMA A DOMAINZA COMPLETA


Al locus A corrispondono due alleli (A e a), dando così la possibilità di comparsa di due fenotipi
corrispondenti ai tre genotipi. Ad un fenotipo dominante corrispondono due genotipi (AA e Aa,
cioè p2 e  2 p q . Mentre ad un fenotipo recessivo corrisponde un genotipo (aa, cioè q 2 ).
Quindi: dobbiamo assumere, senza poterlo dimostrare statisticamente, che la popolazione sia in
equilibrio di Hardy-Weinberg è possibile ricavare la frequenza dell’allele recessivo a partire dalla
frequenza degli individui aa ( q 2 ) . Non si può dimostrare statisticamente perché è un riflesso della
determinazione dei gradi di libertà

Prendiamo come esempio il sistema sanguigno Rh.


A due alleli corrisponde il fenotipo Rh (dominante) e il fenotipo rh (rcessivo). A tre genotipi
corrispondono RhRh, Rhrh e rhrh. Mentre ai due fenotipi ‘’PI’’ corrispondono Rh (+) ed rh (-), gli
individui rh(-) sono tutti omozigoti rhrh. Se la popolazione è in equilibrio di Hardy-Weinberg, la loro
frequenza sarà q 2 . Diventa allora possibile ricavare la f(rh), cioè q , calcolando la radice del valore.
Una volta noto q, possiamo infine calcolare il valore di p.

7.3.3.1 ESEMPIO DI SISTEMA A DOMINANZA COMPLETA


Esempio di calcolo di frequenze alleliche nel caso di due alleli, uno dominante ed uno recessivo: il
locus Rh.

Popolazione campionata N=1097 ;

fenotipo Rh¿¿ r h¿¿


genotipo R hR h  o  R h r h r hr h
frequenza 920 177
=0.839 ; ( p 2+ 2 p q ) =0.161; ( q2 )
1097 1097
2
frequenza allele r h   ( q ) q=r a d q   ( q )=   0.161=0.402
frequenza allele R h  ( p ) p=1−q=1−0.402=0.598

Possiamo stimare quanti sono gli individui R h(+) con genotipo omozigote RhRh e quanto sono gli
individui R h ¿ ¿ con genotipo eterozigote Rhrh.

7.4 STIMA DELLE FREQUENZE ALLELICHE PER MEZZO DELLA LEGGE DI HARDY-WEINBERG
Es. carattere autosomico recessivo: Fibrosi cistica. Incidenza della malattia nella popolazione
caucasica: 1 ;
2500

Quindi:
q 2=4  ×10−4   →q=√ 4  ×10−4 =0.02

p=1−0.02=0.98

f ( A a )=2 p q=2×0.98×0.02=0.0392

Possiamo concludere predicendo che il 4 % della popolazione caucasica è portatore di fibrosi


cistica.

8. INTRODUZIONE II - GENETICA ED EVOULZIONE (Dott.ssa Gloria González Fortes)


Discuteremo sull’origine e l’evoluzione della variabilità genetica. La mutazione come forza
generatrice di variabilità. Approfondiremo la legge di equilibrio di Hardy-Weinberg e descriveremo
i fenomeni popolazionistici che rompono tale equilibrio, soffermandoci con particolare attenzione
su:

 Selezione Naturale: concetto di fitness e di adattamento all’ambiente. Definizione di


coefficiente di selezione e calcolo delle frequenze alleliche attese alla generazione
successiva in caso di selezione naturale per diversi modelli di dominanza (dominanza
complete, codominanza, e sovra-dominanza)

 Deriva Genetica: natura stocastica di genetica ed evoluzione. Come cambiamento le


frequenze alleliche nel tempo per effetto del campionamento, Concetto di dimensione
effettiva.
8.1 EFFETTI CAUSATI DELL’ ASSENZA DI CONDIZIONI DELL’EQULIBRIO DI HARDY-WEINBERG
Condizioni e assunti della legge di Hardy Weinberg:
 Popolazione infinita →d eri v a   ge nic a ;
 Incrocio casuale (panmissia);
 Assenza di mutazione;
 Assenza di migrazione;
 Assenza di selezione naturale

Nel caso che la popolazione non sia infinitamente grande, cosa assolutamente irreale e
impossibile, sebbene si possa intendere che la popolazione abbia un numero di individui
sufficientemente grande; la differenza tra la predizione del modello di HW (Hardy-Weinberg) e il
dato osservato è praticamente trascurabile.

Quando invece abbiamo una popolazione piccola, questa viene soggettata all’effetto della deriva
genica. Più piccola è la popolazione, più forte è l’effetto della deriva genetica. Ma cos’è
esattamente la deriva genica? È la variazione (ingl. genetic drift) delle frequenze geniche di una
popolazione, dovuta unicamente al caso, detta anche effetto di Sewall Wright. Il limitato numero di
individui e il loro isolamento permettono oscillazioni delle frequenze alleliche estremamente
ampie e casuali che possono portare alla scomparsa di un allele e alla fissazione dell’altro. Si ha
anche nel caso di un piccolo gruppo di individui che va a colonizzare una nuova zona: se negli
individui fondatori c’è un’alta frequenza di un carattere (per es., l’albinismo) la frequenza di questo
gene sarà elevata nella nuova popolazione (effetto del fondatore, vedi capitolo 6.2.1). La selezione
naturale riduce la frequenza di questo gene se ha valore adattativo negativo. La d. genetica agisce
soprattutto sui geni cosiddetti neutrali con scarso o nullo valore adattativo. Le derivazioni casuali
delle frequenze attese sono il risultato di un fenomeno generale definito errore di
campionamento. La deriva genetica è il risultato di tale errore.

Osserviamo nell’immagine sovrastante come l’effetto della deriva genica cambia in base al numero
di individui nella popolazione campionata in un periodo che va da zero a cinquanta anni; ogni linea
presenta l’andamento della frequenza degli alleli, ogni colore rappresenta una popolazione diversa.
Il fenomeno è naturalmente più intenso e meno omogeneo (o compatto) nella popolazione con
soli 20 individui. La deriva genica riduce la variabilità nelle popolazioni, e aumenta quella fra le
popolazioni. Come conseguenza dalla diminuzione della variabilità, la deriva genica va ad
aumentare la consanguineità entro le popolazioni
L’altra assunzione del modello di HW è che tra gli individui di questa popolazione l’incrocio è
casuale, la popolazione è dunque in panmissia: la probabilità degli individui di riprodursi è
indipendente dal loro genotipo, dunque nessun individuo si riproduce più degli altri. Prendiamo in
considerazione l’esempio dei gruppi sanguigni LM e LN .
LM ( p ) N
♂ /♀ L (q )
M M M 2 M N
L ( p) L L (p ) L L (pq)
N
L (q ) LM LN ( p q ) L N L N ( q2 )

da qui:

f ( L M )=0.5395 ;
f ( L N ) =0.4605;
M N 2
f ( L L ) = p =0.2911

Il contrario di questa condizione di panmissia è proprio la consanguineità; un fenomeno della


popolazione dove gli incroci tra individui imparentati avviene con più frequenza. Un caso molto
chiaro di consanguineità è presente nelle piante con possibilità di autofecondazione. Qual è
l’effetto?

L’indice di consanguineità è: F= o s s e r v at i  −at t e s i =1− o s s e r v a t i


o s ser v at i at t e si

AA Aa aa F
Generazione 0 D H R 0
Generazione 1 1 1 1 1
D+ H H R+ H
4 2 4 2
Generazione 2 3 1 3
D+ H H R+ H
8 4 8
Generazione 3 7 1 7
D+ H H R+ H
16 8 16
| | | |
Gen. ∞ 1 0 1 1
D+ H R+ H
2 2

AA Aa aa
Generazione 0 p
2
2 pq q2
| | | |
Gen. ∞ p2+ 2 q= p ( p+q )= p 0 q 2+ p q=q ( p+ q )= q

La consanguineità cambia la frequenza genotipiche, ma non le frequenze alleliche, per cui non
viene considerato un agente evolutivo.

Le altre tre assunzioni della legge di HW a che vedere con i veri agenti dell’evoluzione: la
mutazione, la migrazione e la selezione naturale. Questi vanno a cambiare la frequenza degli alleli
nelle popolazioni. Se in una popolazione cha stiamo studiando le percentuali dei genotipi che
osserviamo (campioniamo) sono significativamente diversi da quelli attesi, possiamo presumere
che uno di questi tre agenti (mutazione, migrazione e selezione naturale) è presente nella
popolazione. Ma come facciamo a riconoscere quale dei tre sta esercitando pressione?
Nel modello di Hardy-Weinberg si possono aggiungere dei parametri che tengono conto delle
azioni di questi agenti.
8.1.1 CLASSIFICAZIONE E PRESENZA DI MUTAZIONI DELL’EQUILIBRIO DI HARDY-WEINBERG
Il cambiamento delle frequenze geniche basato soltanto sulle mutazioni è un processo lento.
Riassumiamo ancora una volta la classificazione delle mutazioni:

 Mutazioni a seconda della cellula interessata: somatica – germinale;


 Mutazioni a seconda dell’entità: puntiforme (genica) – cromosomica (genomica);
 Mutazioni a seconda della loro origine: spontanee – indotte;
 Mutazioni a seconda dell’effetto: neutrali – dannose – favorevoli
Possiamo andare a formalizzare l’effetto della mutazione sul cambiamento delle frequenze alleliche
in una popolazione. Facciamo un esempio:

Generazione 0: f ( A ) =p 1 ;

Il tasso di mutazione è la frequenza con cui cambia l’allele da wild-type a mutato, cioè la frequenza
con cui “A’’ diventa “a’’ nel corso di una generazione:

A t asso di mut azione (u)→a ;


L’effetto sarà una diminuzione della frequenza di A da une generazione alla successiva, che viene
calcolato come:

A →a=t a s s o  d i   m u t a z i o n e   ( u ) ×p=u p

Ma esistono anche mutazioni di tipo reversibile:

atasso di reversione  ( v ) →A;
L’effetto sarà un aumento della frequenza dell’allele A che risulta della mutazione come:

a→ A=t a s s o  d i   r e v e r s i o n e   ( v )  ×  p=v p

Il cambiamento della frequenza dell’allele A viene descritto come:

Δ p=v p−u p
→G e n n e r a z i o n e   1: f ( A )= p 1+ Δ p

8.1.2 PRESENZA DI MIGRAZIONE E FLUSSO GENICO


Quando parliamo di migrazione stiamo parlando di individui che si spostano da una popolazione
all’altra o semplicemente soltanto delle piccole comunità frammentate che si spostano. Che questo
processo porti ad un cambio nella frequenza degli alleli della popolazione di destinazione dei
migranti; c’è bisogno che gli individui migranti si riproducano nella popolazione di destinazione e
che riesca dunque a passare i propri alleli alla prole. Questo cambio delle frequenze alleliche che
viene mediato dal processo di migrazione viene chiamato come flusso genico.
Per spiegare il flusso genico prendiamo in esempio il fenomeno di migrazione unidirezionale:
Durante la migrazione unidirezionale gli individui si spostano dal continente (pallina blu) verso
l’isola (pallina arancione).
Immaginiamo l’esistenza di una popolazione sul continente, dove la la frequenza dell’allele A nella
generazione 0 sia: A= p x . Poi immaginiamo che una popolazione diversa, quella sull’isola, abbia
una frequenza dell’allele A della generazione 0 uguale ad: A= p y .
Quando avviene la migrazione, dove una piccola percentuale degli individui del continente si
sposta sull’isola, la generazione successiva (generazione 1) avrà una proporzione di migranti uguale
ad “m’’ ed una proporzione di residenti uguale ad 1−m  ( v e d i  i mm a gi n e   s o t t o s t a nt e ) .

Per stimare la frequenza dell’allele A della generazione 1 dell’isola allora bisogna calcolare:

f ( A ) = p ' y= m ( p x ) + ( 1−m ) p y ;

Alleli A Alleli A
nei nei
migranti residenti
La variazione della frequenza allelica della popolazione Y dovuta alla
migrazione ( Δ p) :

Come p' y=m ( p x )+ ( 1−m ) p y ;  


Δ p=m ( p x )+ ( 1−m ) p y− p y

Sviluppando il termine ( 1−m ) p y   otteniamo:

Δ p=m ( p x )+ p y−m ( p y )− p y
→  Δ p=m( p x− p y )
Δ p=m ( p x− p y )

La variazione nella frequenza allelica dovuta al flusso genico dipende da due fattori:
1. m: proporzione dei migranti nella popolazione finale;
2. la differenza nelle frequenze alleliche tra i migrati e i residenti ( p x− p y )
Quando non esiste differenza ( p x− p y ) =0 , la variazione della frequenza allelica è zero
Δ p=p .

Con una migrazione continua, px e py, diventeranno sempre più simili. A lungo andare il flusso
genico tende ad unificare le popolazioni.

9. IMPORTANZA DELLA DERIVA GENICA


La deriva genica è un’importanza evolutiva, perché il motore del cambiamento delle frequenze non
è un cambio adattativo alle condizioni ambientali, è un cambiamento totalmente stocastico delle
frequenze alleliche. V’è poi un’importanza per la conservazione: la perdita di diversità genetica, per
le piccole popolazioni. Infine possiamo considerare un’importanza biomedica: alleli patologici
altrove rari possono essere comuni in piccole popolazioni.
9.1 FORMULAZIONE MATEMATICA DELLA GERIVA GENICA – MODELLO DI WRIGHT & FISHER

N è il numero di individui della popolazione. A popolazioni piccole sono associate varianze di


campionamento maggiori; perché l’effetto della deriva genetica è maggiore.

Possiamo anche fare delle predizioni, calcolando la probabilità di cambiamento della frequenza
allelica.

9.1.1 DIMOSTRAZIONE SPERIMENTALE DELL’EFFETTO DELLA DERIVA GENICA NELLE POPOLAZIONI


DI PICCOLE DIMENSIONI – ESPERIMENTO DI BURI
L’esperimento continua fino ad arrivare a 19 generazioni,
appuntando ogni volta i fenotipi e genotipi dei campioni. Il
grafico a destra rappresenta la distribuzione degli alleli dalla
generazione 1 (dove in tutte le popolazioni dell’allele b w 75 wild-
type è intorno al 50%) alle seguenti generazioni, dove la
frequenza dell’allele campionato va a disperdersi, finché in molte
delle popolazioni nella diciannovesima generazione l’allele si è
fissato al 100%, oppure è scomparso con
frequenza 0%.
Le osservazioni dell’esperimento di Buri ci dicono che la deriva
genetica in queste popolazioni piccole di 16 individui, va ad
aumentare la dispersione genetica tra le popolazioni ed allo
stesso tempo porta ad una diminuzione del numero di
eterozigoti, dunque l’eterozigosi si riduce attraverso le
generazioni.
Sia il modello matematico, sia il modello sperimentale di Buri ci
fanno capire quanto sia importante la dimensione della
popolazione dell’effetto della deriva genetica. Quando parliamo
di popolazione dobbiamo stare attenti, perché non parliamo del
totale a degli individui della popolazione, ma facciamo
riferimento agli individui che sono in età riproduttiva. Per
stabilire la grandezza della deriva genetica dobbiamo conoscere
la dimensione della popolazione riproduttiva, cioè la dimensione
effettiva della popolazione (Ne):

( 4  ×N f  ×  N m )
N e= ;
(N f + N m

N f =n ume r o   d i   f em mi n e  i n  et à   r i p r od u t t i v a ,
  N m=n u m er o  d i   m a sc h i  i n  e t à   ri p r o d u t t i v a

L’effetto della deriva genica è stimolato dalla dimensione effettiva della popolazione, cioè Ne.
Le fluttuazioni delle dimensioni della popolazione, o rapporti-sessuali sbilanciati, abbassano
sensibilmente il valore medio di Ne. Nelle popolazioni umane è comune approssimare Ne ad 1
3
della popolazione censita.

9.2 AGENTI CHE PORTANO ALL’ERRORE DI CAMPIONAMENTO


La deriva genetica può essere anche interpretata come un errore di campionamento. Cos’è che può
causare l’errore di campionamento, o più precisamente: cosa fa sì che una piccola popolazione
rimanga tale anche per un tempo prolungato? Le popolazioni isolate, ad esempio gli inabitanti di
un’isola o di una valle, o di qualsiasi altra barriera naturale (catene montuose) o artificiale (strade);
la competitività all’interno di una popolazione, etc.
Un fenomeno che aumenta l’effetto della deriva è l’effetto del fondatore: un processo che
determina una perdita parziale di variabilità genetica nella popolazione di nuova formazione.
Un altro effetto che può causare errori di campionamento è l’effetto collo di bottiglia: questo
effetto ha luogo quando una popolazione subisce una drastica riduzione delle dimensioni. Le
frequenze alleliche vengono alterate per un della popolazione. Immaginiamo di avere una bottiglia
piena di biglie rosse e blu. Il numero di biglie blu è nettamente maggiore del numero di biglie rosse
presenti all’interno della bottiglia. Immaginiamo ora di versare casualmente un po’ di contenuto
nella bottiglia all’interno di un piccolo recipiente. Il recipiente, a differenza della bottiglia, contiene
più biglie rosse che blu, e ciò è dovuto alla mera casualità. Le biglie rappresentano gli alleli e ora
l’allele rosso sarà più frequente nelle generazioni successive, a differenza della bottiglia
(generazione 0).

0.2 SUMMA
 La deriva genica fa sì che le frequenze alleliche cambino nel tempo in modo casuale;
 La deriva genica aumenta la diversità tra popolazioni e diminuisce quella entro popolazioni;
 Per ogni allele la probabilità di fissazione e pari alla sua frequenza;
 L’effetto della deriva genica è stimolato dalla dimensione effettiva della popolazione (Ne);
 La deriva è amplificata da fenomeni quali l’effetto del fondatore e l’effetto collo di bottiglia

8.1.3 PRESENZA DI SELEZIONE NATURALE E VERIAZIONE DELLE FREQUENZE ALLELICHE


Andremo a valutare l’effetto della selezione naturale in una popolazione ideale di Hardy Weinberg:
è una popolazione grande, l’incrocio tra individui avviene in modo casuale, migrazione e mutazioni
non sono attuabili.
La teoria della selezione naturale e come agisce nella evoluzione della specie è una teoria
sviluppata da Charles Darwin, e pubblicata ne: “L’origine della specie’’ dove egli parla della
variabilità nelle popolazioni come un fattore preesistente, dunque la presenza della variabilità è
una condizione necessaria perché la selezione naturale possa agire.

Un caso di studio esemplare riguardante la selezione naturale e le variazioni delle frequenze


alleliche è il melanismo del lepidottero Biston betularia. Esistono due cromie, la forma tipica
(bianca) e quella carbonaria (nera).
Nel 1700 si è visto nella campagna inglese come la forma tipica fosse quella più frequente.
Dopodiché, con l’industrializzazione, la contaminazione ambientale; il cambio di colore della
corteccia degli alberi a causa della presenza della fuliggine prodotta dalle fabbriche, aumentò la
frequenza del fenotipo carbonaria vicino ai boschi delle aree metropolitane.
Ovviamente la pressione del predatore (selezione naturale) influisce sulla frequenza allelica della
Biston betularia tipica, che diminuisce nel corso dei secoli.

In termini riproduttivi possiamo dire che in un bosco inquinato la farfalla carbonaria riesce a
riprodursi con maggior successo di un lepidottero tipica. Da questo punto di vista la selezione
naturale si può determinare stabilendo il tasso di riproduzione, espresso come fitness o
adattabilità dell’individuo. La fitness (w) o adattabilità viene definita come la capacità riproduttiva
relativa di un individuo (o probabilità di progenie). La fitness dipende da due fattori:

a) Mortalità differenziale (possibilità di sopravvivenza): X vive più a lungo di Y perciò


lascia più discendenti;
b) Fertilità differenziale: nello stesso lasso di tempo X si riproduce con più efficacia di Y e
perciò lascia più discendenti.

Vediamo un esempio di adattamento fitness all’interno di una popolazione di lepidotteri:

Genotipo AA Aa Aa
Numero medio 4.0 4.0 2.4
discendenti [1]
Fitness riproduttiva 4.0 4.0 2.4
=1 =1 =0.6
[2] 4.0 4.0 4.0

Genotipo AA Aa Aa
Vita riproduttiva 1.5 1.8 2.0
media [3]
Fitness di 1.5 1.8 2.0
=0.7 =0.9 =1
sopravvivenza [4] 2.0 2.0 2.0

Genotipo AA Aa Aa
Fitness riproduttiva 1 1 0.6
Fitness di 0.7 0.9 1
sopravvivenza
Prodotto 0.7 0.9 0.6

Fitness totale 0.7 0.9 0.6


=0.77 =1 =0.66
0.9 0.9 0.9

Il valore w rappresenta la fitness, se vogliamo calcolare il suo valore dobbiamo innanzitutto


calcolare il valore medio dei discendenti [1] per ognuno dei genotipi.
Abbiamo detto che la fitness è la capacità riproduttiva, relativa alla capacità riproduttive degli altri
individui della popolazione, e così, per calcolare la fitness riproduttiva [2] andremmo a dividere il
valore di ognun genotipo con il valore del genotipo con la fitness più alta (4.0).

Per quanto riguarda la vita riproduttiva media [3]: è probabile che uno dei tre genotipi viva più a
lungo degli altri. La media degli individui con genotipo aa è la più altra con un valore pari a 2.0
(gg/mesi). Per calcolare il fitness di sopravvivenza [4] adottiamo lo stesso metodo che abbiamo
utilizzato per calcolare la fitness riproduttiva [2].

L’effetto della selezione dipende principalmente dalle fitness relative dei genotipi e delle frequenze
alleliche nella popolazione. Le fitness possono essere W 11 per l’omozigote dominante, W 12 per
l’eterozigote, e W 22 per l’omozigote recessivo.

Coefficiente di delezione (s): misura dell’intensità relativa di selezione contro un genotipo

s=1−w

Genotipo A1 A1 A1 A2 A2 A2
Frequenze p2 → ( 0,6 )2=0,36 2 p q →2×0,6×0,4=0,48
q 2→ ( 0,4 )2=0,16
genotipiche iniziali
Fitness w 11 → ( 0 ) w 12 → ( 0,4 ) w 22→ ( 1 )
p2 w 11 → ( 0,36×0 ) =0 2 p q w12 → ( 0,48×0,4
q 2 w)=0,19
22
Frequenza dopo → ( 0,16×1 ) =0,16
selezione
Frequenza genotipica p 2 w 11 0 2 p q w 12 0,19 ' q2 w 22 0,16
P' = −¿ =0 H ' = −¿ Q==0,54−¿ =0,46
relativa dopo w 0,35 w 0,35 w 0,35
selezione
Frequenza allelica 1 1
p' =P' + ( H ') p' = 0+ =0,27
dopo selezione 2 2×0,54
q' = 1− p' q' = 1−0,27=0,73

Variazione della frequenza allelica dovuta alla selezione: ∆ p= p ' − p →   ∆ p=0,27−0,6=0,33


Fitness media della popolazione: w−¿ p2 w11 +2 p q w 12 +q 2 w 22
→ 0+0,19+0,16=0,35

Il valore della fitness può dirci se esiste la selezione, e anche contro quale allele è stata attuata la
selezione. Infatti:

1. 11 12 22 '
w =w =w =1→n o n   c è s e l e z i o n e ;
2. w 11=w12<1   e   w22 =1→s e l e z i o n e   c o n t r o  l ' al l e l e   d o m in a n t e   A1 ;  
3. w 11=w12=1   e   w22 <1→s e l e z i o n e   c o n t r o  l ' al l e l e  r c e s i v o   A2 ;
4.
11 12 22 22 1
w <w <w e   w =1→s e l e z io n e   c o n t r o   a ll e l e   A i n   a s s e n z a   d i   e f f e t t i  d i   d o mi n a n z a ;
5. w 22 e   w22 <1   e   w12=1→ s e l e z i o n e   a   f a v o r e   d e l l' e t e r o z i g o t e ;
6. w 12< w11 e   w22 =1→ s e l e z i o n e   a   f a v o r e   d e g li   o m o z i g o t i.
Vediamo ora di focalizzarci sui modelli di selezione direzionale, per capire come cambia la
frequenza allelica nel corso delle generazioni. A livello generale possiamo fare gli stessi
ragionamenti che abbiamo fatto con la tabella precedente. Prendiamo una frequenza iniziale
p2 ,   2 pq   e   q2 , dei tre genotipi possibili:

Genotipo
AA Aa aa Totale f(a)
Frequenze p2 2 pq q2 1
iniziali dei
zigoti
Fitness (w) 1 1 1-s
Contribuzion p2 2 pq 2
q ( 1− s ) 1−s q 2 *
e alla
generazione
successiva
Frequenze p2 2 pq 2
q (1−s ) 1 ' q −s q2
 q = *
genotipiche 1−s q
2
1−s q2 1−s q
2
1− s q
2

normalizzate
dopo
selezione
Cambiament −s p q 2
∆ q=q ' −q= 2
o della 1− s q
frequenza
allelica

*Fitness media della popolazione: p2+ 2 p q+ q2−s q 2=1− s q 2 ;


**La frequenza dell’allele a dopo la selezione (q’) è uguale alla somma della frequenza
2 2 2
dell’omozigote aa e metà della frequenza dell’eterozigote: q' = q −s q + 1 2 p q = q−s q
(
2
1− s q
2 2
2 1− s q ) 1− s q
8.2 EQUILIBRIO TRA SELEZIONE E MUTAZIONE
La mutazione crea variabilità, la selezione invece va ad attuare contro una delle varianti nelle
tabelle sopracitate. Bisogna dunque capire qual è la situazione di equilibrio dove; da una parte
quello che viene creato dalla mutazione, viene dall’altra parte eliminato dalla selezione. Dunque ci
aspettiamo di arrivare in una situazione di equilibrio dove gli effetti di selezione e mutazione si
eguagliano in ugual misura.
2
In caso della selezione contro l’allele recessivo: ∆ q= − s p q , se l’allele è raro q=0 , dunque
2
1−s q
∆ q= −s p q2 .

Contemporaneamente, la mutazione agisce aumentando la frequenza dell’allele a. Si ha equilibrio


tra mutazione e selezione quando la diminuzione della frequenza allelica dovuta alla selezione è
uguale all’aumento dovuto alla selezione: s p q 2=u p ,   d o v e   u   è   il   t a s s o   d i   mu t a z i o n e .

Così la frequenza dell’allele a nell’equilibrio sarà:


up u
s p 2= =u , q 2= ,
p s

Per un allele dominante (A) la frequenza di a all’equilibrio sarà: pe = u ;


s
Facciamo un esempio: se il tasso di mutazione u=10−6   e   s=0,1 , allora le frequenze di equilibrio
risulterebbero tali:

'

'
'
F r equ en za  all equ il ibr i od e ll all el e  r e c es si v o :q =
'
10−6
0,1
e
=0,0032;
e
F r e q u e n z a   a ll e q u il ib r i o d e ll a ll e l e   d o min a n e t e : p =
√(
10−6
)
=0,00001.
0,1

Poiché la selezione non può agire su un allele recessive allo stato eterozigote, la frequenza di
questa all’equilibrio è considerevolmente superiore della frequenza all’equilibrio per un allele
dominante con la stessa fitness (w) e lo stesso tasso di mutazione (u).

0.3 SUMMA
 La selezione naturale implica la riproduzione differenziale dei genotipi;
 Il diverso successo riproduttivo dei diversi genotipi viene misurato dalla fitness darwiniana;
 Gli effetti della selezione dipendono dalle fitness relative dei diversi genotipi (selezione
direzionale e selezione bilanciata);
 Il risultato finale non è un adattamento perfetto, perché l’ambiente non è costante e perché
i meccanismi di selezione sessuale possono agire in senso diverso.
9. MODELLO CONCETTUALE DELL’EVOLUZIONE – Dott.ssa Maria Teresa Vizzari
Abbiamo visto che il modello che descrive il processo di evoluzione proposto da C. Darwin, altro
non è che un modello per discendenza con modificazioni; le specie non restano immutabili nel
tempo ma si modificano accumulando mutazioni, queste vengono infine trasmesse da generazione
in generazione. Darwin descrisse il processo evolutivo in questi termini osservando diverse specie.
A quei tempi però, nessuno, nemmeno Darwin, conosceva il meccanismo esatto di trasmissione e
di ereditarietà dei caratteri. Darwin, accorgendosi che le specie che vivevano in areali diversi
esprimevano delle somigliane, riuscì a definire il proprio modello ascrivendo le somiglianze alla sua
teoria del processo di discendenza con modificazioni, suggerendo che le diverse specie devono
discendere da una specie ancestrale comune. Questo principio che afferma che le specie abbiamo
come punto di partenza una sola specie preesistente viene chiamato cladogenesi.
Tuttavia esiste un altro processo evolutivo, definito anagenesi, un processo che descrive la
formazione di una nuova specie escludendo la suddivisione in gruppi differenti: una specie
ancestrale inizia ad accumulare mutazioni e con il passare del tempo l’accumulo di cambiamenti è
così rilevante, che la specie mutata è significativamente diversa dalla forma ancestrale, possiamo
dunque definirle come specie diverse.

La mancanza della “particella’’ dell’ereditarietà dei caratteri diede diversi problemi a Darwin di
natura critica, dimostrando la presenza di una grossa lacuna. Questa venne colmata solo agli inizi
del ventesimo secolo, con la riscoperta degli studi di G. Mendel sulle piante di Pisello odoroso. Così
si riscoprirono le leggi che regolano l’ereditarietà dei caratteri. Nel novecento inoltre, gli studiosi
riuscirono ad individuare l’elemento causa dell’ereditarietà dei caratteri, ovvero il DNA e i geni.

Prendendo in considerazione le leggi di Mendel; la variabilità che noi osserviamo (la differenza tra i
vari individui di un determinato carattere) è dovuta al processo di mutazione. Questo processo di
cambiamento nella sequenza delle basi del DNA ha significato evolutivo solo se avviene nelle
cellule germinali di un individuo.

9.1 PRINCIPIO DI DIVERGENZA


Il principio di discendenza delle modificazioni è strettamente collegato al principio di divergenza.
Questo vuol dire che le specie accumulano modificazioni fino a divergere in specie differenti.
Ovviamente questo principio della divergenza implica che tutte le specie viventi condividano un
antenato comune, e che tutte le relazioni evolutive di tutte le specie possono essere rappresentate
da un albero filogenetico, dove alla radice troviamo l’antenato comune di tutte le specie esistenti.
Questo modello (o ragionamento) si applica a qualsiasi scala, applicandolo a livello di coppie di
specie; prendendo come esempio la specie umana e quella degli scimpanzè (condividono un
antenato comune risalente e circa 8 milioni di anni fa), o tra specie umana e le balene (condividono
un antenato comune che risale a circa 60 milioni di anni fa).

La distanza che separa tra loro le due specie diverse è proporzionale alla distanza che le spara dal
loro antenato comune. Questo vuol dire che il grado di differenziazione tra due specie è
direttamente proporzionale al tempo intercorso dalla separazione dell’antenato comune.
Dunque maggiore sarà il tempo trascorso, più grandi saranno le differenze.
9.2 ADATTAMENTO NEL MODELLO DARWINIANO
Il modello proposto da Darwin afferma che le specie sono inclini al cambiamento e alla divergenza,
per azione della selezione naturale. Infatti la principale forza evolutiva che porta al cambiamento
delle specie è la selezione naturale attraverso il processo di adattamento. Possiamo dunque
affermare che nel modello darwiniano, ciò che porta alla specie a modificarsi e divergere è il
processo di adattamento.
L’adattamento fa sì ce le popolazioni vengano a possedere caratteri che le rendono atte a vivere nel
loro ambiente (questi caratteri si chiamano a loro volta adattamenti). Il processo di adattamento si
spiega con la selezione naturale.

Il processo dell’adattamento (e l’azione della selezione naturale) è stato identificato da C. Darwin


come la prima forza che causa l’evoluzione delle specie. Tratteremo più aventi delle diverse forme
di selezione, come la selezione sessuale e la selezione artificiale mediata dall’uomo.

10. SELEZIONE NATURALE - CARATTERI ADATTIVI E SUCCESSO RIPRODUTTIVO


Questo termine sintetizza le interazioni tra gli organismi e gli ambienti in cui vivono. Sulla base
delle caratteristiche possedute dagli organismi, questi si dicono essere più, o meno, adatti a
sopravvivere all’interno di un dato ambiente. Il possesso di determinati caratteri che aumenta la
probabilità di sopravvivere vengono definiti caratteri adattativi. Questi caratteri, oltre ad
aumentare la probabilità di sopravvivenza degli individui, aumentano la probabilità di avere una
discendenza più numerosa.
A cosa porta questo fattore di aumento delle probabilità di discendenze maggiori? I caratteri
adattativi aumenteranno di frequenza nella popolazione della specie, mentre i caratteri sfavorevoli
diminuiranno in frequenza. Ovviamente i caratteri favorevoli (o caratteri adattivi) devono essere
ereditabili.

Possiamo definire la selezione naturale rappresenta un successo differenziale, in un certo


ambiente, nella riproduzione degli individui con diverse caratteristiche ereditabili. Dunque
l’efficacia della riproduzione e una maggiore capacità riproduttiva, sono i fattori fondamentali della
selezione naturale, e sono strettamente in relazione con l’ambiente in cui questi individui vivono.

10.1 DEFINIZIONE E TIPOLOGIE DI CARATTERE E CORRELAZIONE TRA VARIABILITÀ E


ADATTAMENTO
Facciamo un passo indietro. A cosa ci riferiamo quando parliamo di caratteri? Dare una definizione
di carattere o di tratto non è semplice, fino ad ora ci siamo riferiti ai caratteri come caratteristiche
morfologiche (genetica mendeliana): forma dei semi, colore del fiore, ecc. In un contesto più
ampio, la definizione di carattere è necessariamente più estesa, perché i caratteri adattativi non
sono esclusivamente morfologici. Infatti i caratteri possono essere definiti di natura fisiologica (es.
proteine “antifreezing’’ prodotte dai pesci antartici), comportamentale (es. modalità di
corteggiamento) e morfologica. Così la definizione del termine carattere deve prendere anche
queste differenti sfaccettature. A volte è difficile individuare caratteri selezionati, non sono
identificabili scomponendo l’organismo nelle sue singole parti, o osservando i fossili. Un carattere
non è semplicemente una parte dell’organismo.
Le variazioni tra individui sono indipendenti dall’adattamento. Non tutte le caratteristiche che
osserviamo hanno significato adattativo; sappiamo che la variabilità è il risultato del processo
mutazionale, e che la mutazione è un processo casuale, e il processo mutazionale produce
variabilità, ed è sulla variabilità che agisce la selezione naturale. Dunque questi due processi sono
disgiunti l’uno dall’altro. La selezione naturale non produce l’adattamento, ma seleziona da un
insieme di caratteri già presenti all’interno della popolazione.

10.2 GRADUALISMO ED EQUILIBRIO PUNTEGGIATO


“Le lacune incolmabili fra le diverse specie NON possono essere attribuite SOLO all'imperfezione
della nostra conoscenza paleontologica. Eldredge e Gould propongono di "leggere" in maniera
letterale i dati fossili: se non ci sono forme, è perché queste non si sono fossilizzate, se le specie non
mostrano evoluzione, è perché, in un certo periodo, non si sono evolute. Scaturisce quindi una
storia naturale in cui lunghi periodi di stasi (o di equilibrio) delle specie sono intervallati (o
punteggiati) da brevi periodi di rapida evoluzione: i cosiddetti equilibri punteggiati. Questa nuova
interpretazione spiega perché mancano le forme di transizione: semplicemente, si sono evolute in
tempi troppo brevi per poter lasciare tracce fossili. Oppure, si tratta di meccanismi di speciazione
(formazioni di nuove specie) che riguardano popolazioni estremamente limitate, che hanno avuto
pochissime possibilità di lasciare prove paleontologiche. Abbiamo quindi a disposizione
un'interpretazione complementare a quella gradualista che si può affiancare alle descrizioni
evolutive tradizionali.
Mentre nell'interpretazione del gradualismo la selezione lavora lentamente e costantemente, nella
visione punteggiata il lavoro della selezione naturale è concentrato in brevi periodi di intensa
attività, alla fine dei quali nasce una nuova specie. Ecco quindi emergere un tempo in cui vi sono
"istanti" più importanti, momenti in cui la selezione e gli altri meccanismi evolutivi modificano
qualitativamente la popolazione. In questa nuova visione la selezione naturale è legata
cambiamenti ambientali locali e improvvisi come un tifone tropicale che crea uno stagno isolato
all'interno del quale si sviluppa una particolare specie di zanzare. che ne regolano l'azione così
come possono farlo eventi esterni casuali ed imprevedibili come la caduta di un meteorite, la
scomparsa dei dinosauri e la conseguente affermazione dei mammiferi che per tutta l'era
mesozoica avevano vivacchiato senza grandi speranze; insomma, la nostra presenza sul pianeta è
dovuta ad un gran colpo di fortuna, una specie di lotteria in cui abbiamo preso il primo premio.”
10.3 MODELLO ADATTATIVO DI CHARALES DARWIN
Il modello darwiniano dell’evoluzione è un modello adattativo per cui la principale causa della
modificazione della specie è data dall’azione della selezione naturale. Ma la mutazione è un
processo casuale (come abbiamo già accennato tante volte): da una generazione all’altra possono
verificarsi cambiamenti che non hanno nessun significato adattativo, cioè le modificazioni non
aumentano la capacità riproduttiva. In questo caso il successo riproduttivo non è legato al carattere
vantaggioso ma è solo effetto del caso. La frequenza dei caratteri non può fluttuare nelle
generazioni per puro effetto del caso, vedremo nei prossimi capitoli il perché.

Anche l’evoluzione e la selezione naturale devono essere interpretati in termini probabilistici e


statistici: gli organismi che possiedono caratteri vantaggiosi hanno una maggiore probabilità di
riprodursi, ma questo esito non è scontato nei singoli casi e si rivela solo ad un esame della
popolazione nel suo insieme, dove la frequenza dei caratteri vantaggiosi tenderà ad aumentare.
In questi casi, la variabile biologica, ha una distribuzione normale, cioè simmetrica rispetto alla
Media. Vediamo l’azione della selezione naturale e suoi tre possibili effetti:

Nell’immagine intitolata selezione direzionale vediamo che: quando un carattere è vantaggioso, la


media della popolazione si sposta in direzione di quel carattere. Mentre nel caso di una selezione
stabilizzante gli organismi sono già ben adattati al loro ambiente. I cambiamenti sono per lo più
sfavoriti e tenderanno ad essere eliminati dalla selezione naturale. Per ultimo: con la selezione
divergente s’intente una popolazione in grado di suddividersi in sub-popolazioni, in ciascuna della
quali si producono adattamenti particolari, vi è dunque un modello di divergenza.
10.4 CONSEGUENZE DEL CAMBIAMENTO NELL’HABITAT E IPOTESI DELLA REGINA ROSSA
Prendiamo in esempio uno scenario paludoso con una predominanza di flora color verde; con la
presenza di un predatore (l’airone) e di una specie predata (la rana). All’interno della specie di rane
sono presenti due gruppi con colorazioni diverse; giallo e verdi. I due gruppi sono completamente
in grado di riprodursi in modo efficace all’interno dell’ambiente paludoso verde, inoltre mostrano
la stessa capacità riproduttiva. Ovviamente la capacità riproduttiva non è l’unico elemento da
tenere in considerazione, perché alla capacità bisogna aggiungere l’azione del predatore.
In questo specifico ambiente l’airone prederà molto più facilmente le rane gialle, la quale
mimetizzazione con l’ambiente paludoso (verde) è drasticamente meno efficace, rispetto alle rane
con colorazione verde.

A seguito del cambiamento ambientale (es. colorazione della colorazione della flora da verde in
giallo) il predatore non riuscirà più a predare il gruppo delle ranocchie con la colorazione gialla,
perché grazie alle nuove condizioni ambientali, la combinazione tra ambiente e mimetizzazione
regalerà un maggiore successo alla specie di ranocchie gialle.
Quindi: è determinante il contesto ambientale entro cui la selezione naturale agisce. Abbiamo
dimostrato che la capacità riproduttiva è un concetto relativo, dipendente e in completa
correlazione con altri fattori ambientali.

Da queste dinamiche possiamo dedurre che un sistema ecologico non è un sistema stabile o fisso,
ma è difatti un sistema estremamente dinamico ed in continua evoluzione. Questa idea è stata
riassunta nell’ipotesi della regina rossa, proposta nel 1973 da Van Valen. Il nome dell’ipotesi
prende spunto da uno dei personaggi di “Alice nello specchio’’; in un passaggio del romanzo la
regina Rossa è costretta a correre molto velocemente per poter così restare ferma sempre nello
stesso punto.
La metafora descrive perfettamente il sistema ecologico che abbiamo appena esposto in questo
capitolo; le specie continuano ad evolversi, l’ambiente continua a mutare, ad ogni cambiamento
ambientale segue un cambiamento nelle specie, ma le relazioni tra preda e predatore restano
invariate – le prede continueranno ad essere prede e i predatori: predatori (variando sempre in
risposta alle mutazioni ambientali).

0.4 SUMMA
Un carattere adattativo deve essere:
 Ereditabile: se è stato modellato dalla selezione naturale deve essere genetico (la selezione
naturale non può agire su tratti che non passano alle generazioni future);
 Funzionale: se è stato modellato dalla selezione per uno scopo preciso deve svolgere quel
compito;
 Migliorare il fitness: la selezione naturale permette l’aumento di frequenza dei caratteri
che aumentano la fitness dell’organismo che lo possiede.
10.5 VALUTAZIONE DELLA FITNESS
Darwin conia il termine “survival of the fittest’’. Chiarisce che la selezione naturale non è un agente
esterno che osserva e discrimina le differenze individuali, ma il risultato dell’esistenza di individui
con caratteristiche differenti e della relazione (determinata dall’ambiente) tra queste
caratteristiche e la probabilità di sopravvivere e riprodursi.
Un adattamento è un carattere che apporta un contributo positivo alla fitness del suo portatore.
Possiamo valutare la fitness da diversi punti di vista:

 Individuo: numero di figli alla generazione successiva;


 Allele: numero di copie dell’allele che entrano alla generazione successiva, aumento di
frequenze dell’allele;
 Popolazione: aumento media ponderata delle fitness individuali degli individui che
compongono la popolazione in esame.

Per ulteriore approfondimento vedi capitoli 8 – 8.2, nei quali abbiamo trattato la valutazione della
fitness e il calcolo di essa.

11. EVOLUZIONE DIVERGENTE, CONVERGENTE E PARALLELISMO EVOLUTIVO


Fino ad ora abbiamo parlato di specie che discendono da un antenato comune e si differenziano
accumulando mutazioni che le rendono adatte a vivere in un determinato ambiente. Questo tipo di
evoluzione viene definita come evoluzione divergente o radiazione adattativa: “l’evoluzione di
una specie ancestrale, che era adattata ad un particolare habitat, in un certo numero di specie
differenti, ognuna di queste adattate ad uno specifico ambiente.’’
Il risultato sarà costituito da diverse nuove specie dello stesso antenato comune, che vivranno in
modo differente rispetto alla specie ancestrale. L’origine di una nuova specie è stata possibile
grazie alla presenza della variabilità e dai processi di adattamento che abbiamo visto fino ad ora.
Un esempio di evoluzione divergente è l’evoluzione del Fringuello dell’arcipelago delle Galàpagos.

Cosa avviene a delle specie che non discendono da uno stesso antenato comune ma che vivono in
ambienti simili e che presentano delle caratteristiche simili. In questo caso parliamo di evoluzione
convergente; l’azione della selezione naturale può portare la formazione di specie che, pur non
essendo imparentate tra loro, finiscono con somigliare le una alla altre in quanto vivono in
ambienti molti simili. Si verifica quando due o più gruppi che non sono strettamente imparentati,
evolvono caratteristiche morfologicamente e fisiologicamente simili. Ciò è generalmente il risultato
dell’occupazione dello stesso habitat e delle risposte a pressioni selettive simili.

Possiamo poi descrivere un terzo fenomeno evolutivo chiamato parallelismo evolutivo:


l’evoluzione indipendente dello stesso carattere da caratteri omologhi in specie diverse ma
filogeneticamente vicine.
11.1 CARATTERI ANALOGHI ED OMOLOGHI; ORTOLOGI E PARALOGI
I caratteri ereditati da un antenato comune vengono definiti caratteri omologhi. Mentre nel caso
di un’evoluzione convergente, i caratteri vengono diversamente definiti caratteri analoghi.
Questa è una prima grande differenza tra l’evoluzione divergente e l’evoluzione convergente.
Esempi di caratteri omologi si possono ritrovare nella struttura e nella conformazione degli arti di
diverse specie mammifere: umani, gatti, balene, pipistrelli.
Un esempio di omologia dei geni invece, è rappresentato dai geni che codificano per le globine nel
sangue: in questo le sequenze che codificano per la globina beta negli umani e nei topi sono simili
tra loro perché sono state ereditate una popolazione ancestrale.

I caratteri omologhi delle sequenze geniche possono essere ulteriormente sub-classificati in


caratteri ortologi e paralogi, cioè a seconda dell’evento che ha portato alla loro separazione. Due
sequenze vengono definite ortologhe quando la loro separazione è avvenuta in seguito a un
evento di speciazione, ossia la formazione di una nuova specie.
Due sequenze vengono invece definite paraloghe quando, all’interno del medesimo genoma, si
verifica un evento di duplicazione genica.

Dunque:
 Struttura omologa: strutture simili e posizioni simili, funzioni differenti;
 Struttura analoga: funzioni simili, ma origini diverse.

12. SELEZIONE ARTIFICIALE


Nei casi di selezione naturale possiamo osservare l’azione della selezione artificiale. La selezione
naturale e la selezione artificiale producono cambiamenti, modificazioni, in animali e piante. La
differenza tra le due modalità di selezione consiste nella “guida’’ al processo di selezione, nel primo
caso dato dall’ambiente, dal
contesto naturale, e nel
secondo caso dall’esigenza e
dall’azione dell’uomo.
Possiamo riassumere
affermando che la selezione
naturale è il processo
tramite il quale organismi
che sono ben adattati al loro
ambiente sopravvivono e si
riproducono con successo.
La selezione naturale è
anche un processo tramite il
quale i tratti favorevoli diventano più comuni e quelli sfavorevoli diventano meno comuni nelle
generazioni successive.
Per quanto riguarda la selezione artificiale possiamo affermare che è un processo dove: una serie
di incroci controllati fnno in modo che le caratteristiche desiderate vengano trasmesse alle
generazioni successive. Gli incroci controllati fanno in modo che le caratteristiche desiderate si
presentino ad altra frequenza in animali allevati e piante coltivate.

Un esempio di selezione naturale è la variazione fenotipica della farfalla punteggiata delle betulle
(Biston betularia), già vista nel capitolo 8.1.3.
La selezione artificiale è stato il processo con cui C. Darwin ha spiegato la selezione naturale.
Infatti: il primo capitolo de “L’origine della specie’’, è dedicato alla selezione artificiale, e quindi alla
domesticazione delle specie. In questo primo capitolo Darwin raccoglie le osservazioni dei risultati
dei diversi incroci guidati dall’azione dell’uomo su diverse varietà di picconi. Questi incroci erano
degli incroci ben definiti; effettuati selezionando degli esemplari che avevano delle caratteristiche
esclusive, quali: la dimensione del becco, il tipo di piumaggio, la colorazione delle piume, e
dimensioni. L’obbiettivo di questi incroci controllati era quello di formare delle razze di piccioni che
avessero delle caratteristiche specifiche. Quando parliamo di selezione artificiale di domesticazione
ci riferiamo allo stesso identico processo riportato dall’esempio della domesticazione del piccione.
Darwin definì l’azione della selezione artificiale come un enorme esperimento con le stesse
dinamiche con le quali la natura modella le “proprie’’ specie.

12.1 STEPS DELLA SELEZIONE ARTIFICIALE

1. Si decide quali sono le caratteristiche importanti;


2. Si scelgono animali che portano queste caratteristiche e si incrociano;
3. Si scelgono i figli di questi incroci che mostrano le caratteristiche scelte e si incrociano a loro
volta;
4. Si ripete questo processo per tantissime generazioni;

12.2 CONTESTO STORICO DELLA SELEZIONE NATURALE E MODELLI DI DIFFUSIONE DEL NEOLITICO

L’uomo moderno ha origine in Africa, circa 130.000 anni fa. Colonizza il continente africano, e circa
70,000 anni fa si espande verso gli alti continenti, in un processo che viene definito “out of Africa’’.
Nel colonizzare il pianeta, l’uomo moderno (Homo sapiens) rimpiazza le forme arcaiche pre-
esistenti; come l’uomo di Neanderthal (Europa) e l’uomo di Denisova (Asia e Siberia).
Lo stile di vita dei primi AMH è basato sulla caccia e sulla raccolta (cacciatori-raccoglitori, hunter-
gatherer). Una struttura sociale più complessa e una maggiore ingegnosità nella fabbricazione di
armi e utensili hanno favorito l’Homo sapiens alle altre specie umane.

La rivoluzione agricola è uno dei processi fondamentali della storia dell’uomo moderno, infatti: lo
sviluppo dell’agricoltura ha contribuito in maniera sostanziale a plasmare il mondo come lo
conosciamo ora. Il periodo in cui è iniziata la rivoluzione agricola viene definito Neolitico, periodo
antecedente al Mesolitico. Durante il Neolitico l’uomo cambi stile di vita da hunter-gatherer ad
agricoltore-allevatore.
Il punto di origine dell’agricoltura e dell’allevamento è il vicino oriente, è da qui che tutte le
competenze agricole sono state trasmesse in tutto il continente Euroasiatico. I primi siti
archeologici con le prime evidenze di domesticazione hanno una datazione di circa 10,000 anni.

Nel tempo ci si è chiesti se la diffusione della capacità di coltivare piante e allevare animali del
Neolitico, fosse stato un processo di trasmissione strettamente culturale, o se alla trasmissione di
conoscenze si fosse accompagnata anche una migrazione di individui e popolazioni.
Sono stati proposti due modelli per spiegare la diffusione del Neolitico del continente Eurasiatico:
La prima viene preposta dal genetista Luigi Luca Cavalli-Sforza, ed è rappresentata da un modello di
diffusione ad elica (vedi immagine in basso a sinistra), basato su evidenze archeologiche.

Quello che ci si aspetta da questo modello è che oltre a trasmettere le nuove competenze culturali,
si siano anche trasmessi anche dei geni, infatti: durante questa espansione i gruppi di popoli di
agricoltori sono necessariamente entrati in contatto con i gruppi di cacciatori e raccoglitori già
presenti in queste zone. Questo è il processo che viene descritto dal grafico sovrastante (sinistra),
dove i pallini blu scuri rappresentano le popolazioni di agricoltori, indicati anche con la lettera F
(farmers), mentre gli hunter-gatherers sono indicati con la sigla HG e i pallini grigi. La dimensione
dei pallini rappresenta la capacità di sopravvivenza.
In alternativa si propone un modello generale: il modello di diffusione per acculturazione (vedi
immagine in alto a destra). Notiamo che ad un incontro tra HG ed F non segue un cambiamento
nella composizione genetica della popolazione, c’è semplicemente una trasmissione culturale
della capacità di domesticazione di piante e animali.

Il modello principale di diffusione del neolitico è quello di diffusione ad elica proposto da Cavalli-
Sforza: disponendo di centinaia di campioni di genomi antichi di raccoglitori e cacciatori, si è potuta
ricostruire la diffusione delle capacità culturali, anche a livello genomico, avvenuta circa 10 millenni
fa.
12.3 L’INNOVAZIONE DELLA DOMESTICAZIONE NEL NEOLITICO
L’innovazione più importante del Neolitico è la domesticazione: incrocio selezionato di piante ed
animali al fine di renderli più utili ed idonei alle esigenze dell’uomo, aumentando così la capacità di
sopravvivenza dell’uomo e favorendo la colonizzazione di aree più ampie. Di conseguenza segue la
divergenza delle specie domestiche dalle rispettive specie selvatiche. Vediamo nella tabella
sottostante le caratteristiche desiderabili delle specie adatte all’addomesticamento:

Animali Piante
Dieta basata sulla disponibilità di risorse Semi e tuberi più grandi
Crescita e riproduzione rapide Brevi tempi di generazione, mutazioni più
frequenti
Animali placidi e pacifici Riproduzione ermafrodite, preferibile all’auto
incrocio
Allevati in cattività Facilmente raccoglibile
Facile da addestrare, facile da gestire Immagazzinato per lunghi periodi
Rimane calmo se spostato al chiuso Controllo monogenico dei tratti cruciali

Solo poche specie animali e piante sono state domesticate dall’uomo rispetto a quelle “sfruttate’’
dai cacciator-raccoglitori.

12.3.1 IMPATTO DELLA DOMESTICAZIONE SU FENOTIPI E GENOTIPI – STUDIO SUL CEREALE


Dunque la principale conseguenza dell’addomesticazione da parte dell’uomo è la divergenza delle
specie domestiche da quelle allo stato selvatico. Tuttavia queste differenze si concentrano a livello
morfologico, questi cambiamenti infatti non portano alla formazione di specie diverse. Le specie
selvatiche e le varietà domestiche sono tra di loro interfertili, e vengono considerate come
un’unica specie, con differenti razze (nel caso animale) o varietà (nel caso vegetale). Pensiamo alla
possibilità di riproduzione tra cani e lupi, o all’incrocio tra la varietà domestica dei girasoli con la
varietà selvatica: queste specie vengono considerate sotto un'unica specie, ma di razza o varietà
differente.

Consideriamo la selezione artificiale nell’esempio della spiga di grano. Nei cereali la transizione del
selvatico al domestico ha riguardato essenzialmente tre caratteri principali coinvolti nella facilità di
raccolta del prodotto: la resistenza della spiga (la spiga che non si disarticola a maturazione
disperdendo il seme è essenziale per poter coltivare e raccogliere il prodotto), la “vestitura’’ della
cariosside (le cariossidi nude sono di immediato utilizzo rispetto a quelle vestite che rimangono
unite a glume e glumelle) e la dimensione della cariosside (la cariosside più grande è stata
preferite).

12.4 CONSEGUENZE GENETICHE DELLA SELEZIONE ARTIFICIALE


Le principali conseguenze a livello molecolare (genetico) della selezione artificiale, quindi della
domesticazione, riguardano una forte riduzione della diversità genetica nelle specie domestiche.
Perché? Come già sappiamo la riduzione della diversità genetica è dovuta all’effetto del fondatore
(collo di bottiglia). Questa riduzione della diversità si riscontra in particolar modo in quei loci che
sono stati target della selezione, in queste regioni la diversità genetica sarà minore rispetto al resto
del genoma.
Un esempio di riduzione di variabilità nella specie domestiche è rappresentato dal caso del mais.
Vediamo dal grafico sottostante che la diversità nucleotidica presente nel progenitore selvatico
Teosinte è stata calcolata sul gene TB1, responsabile per la struttura della pianta. Notiamo che
nella regione del promotore di questo gene c’è un’importante differenza tra la diversità
nucleotidica tra la due varietà (Teosinte e Maize). La diversità nucleotidica del progenitore è
nettamente superiore rispetto a quella presente nella regione nel promotore del Maize.

12.5 DOMESTICAZIONE NELLO SPECIFICO – DOMESTICAZIONE DEGLI ANIMALI


Rispetto alle piante, i tratti fenotipici selezionati per gli animali sono più specie-specifici. Infatti nei
bovini ha avuto atto una riduzione della dimensione corporea e delle corna dal Neolitico al
Medioevo. La riduzione degli strumenti di difesa ha reso questi animali più placidi.
La domesticazione di animali è caratterizzata anche dalla scelta di caratteri comportamentali:
vengono favoriti gli individui meno aggressivi e più facilmente gestibili per gli allevamenti. A questo
si accompagnano una serie di diverse caratteristiche, come ad esempio la riduzione della capacità
cranica e una riduzione dell’acutezza dei sensi, tutte correlate alla docilità degli animali.
Inoltre in moltissime specie è stato selezionato il colore del manto degli animali, basti pensare alle
diverse razze di bovini che spesso differiscono solo per la colorazione del manto.

Il gene correlato a questi tratti fenotipici è il gene MC1R, che nei topi è il gene dedito alla
colorazione del manto.
Per quanto riguarda il bestiame non è importante solo la colorazione, anche altre caratteristiche
hanno un’importanza rilevante. Di queste caratteristiche si è stato in grado di rilevare ed
identificare i geni responsabili:

 KIT responsabile della macchiatura del manto degli animali;


 MC1R responsabile della colorazione del mando degli animali;
 PLAG1 correlato con la statura in una determinata razza di bovini;
 ASIP correlato il livello di produzione degli adipociti dell’animale;
 RXFP3 correlato alla regolazione dell’ingestione di cibo e al peso corporeo dei topi;
12.6 IDENTIFICAZIONE DELLA REGIONE DI ORIGINE DEL PROCESSO DI DOMESTICAZIONE
È possibile identificare quali geni sono stati sottoposti alla selezione artificiale, semplicemente
confrontando le specie domestiche con quelle selvatiche. Questo confronto ovviamente non si
limita solo all’analisi delle caratteristiche morfologiche, ma si espande a livello genomico.

Oltre ad identificare quali caratteristiche sono state selezionate è possibile identificare i punti di
origine di domesticazione, intesa come regione geografica dove ha avuto atto la selezione
artificiale. Possiamo dunque adottare due approcci:
 Filogeografia: studio della diversità genetica in relazione al contesto geografico;
 DNA antico

Nel caso della domesticazione dei bovini il processo di domesticazione è un esempio di come il
DNA antico e moderno possano essere combinati per studiare l’origine del processo di
domesticazione. Ci sono due tipi di bovini domestici, l’europeo Bos taurus, e il più adatto ai climi
aridi Bos indicus, tipico dell’India. Questi due tipi sono considerati specie diverse anche se sono tra
loro interfertili. Evidenze archeologiche suggeriscono che tutti i bovini taurini sono stati
domesticati a partire dall’aurochs nel vicino oriente tra 10.8 e 10.3 KYA. Cosa ci dice il DNA?
Da un’analisi più approfondita utilizzando sia DNA antico che DNA moderno, si è stato in grado di
identificare due processi di domesticazione differenti: uno ha coinvolto solo la specie Bos Taurus
nel vicino oriente 10,000 anni fa, e un altro evento di domesticazione parallelo e indipendente ha
portato alla domesticazione del Bos indicus in Asia (10,000 anni fa).

Un altro esempio è la domesticazione del cane, che a differenza delle altre specie di allevamento,
ha una storia evolutiva leggermente differente. Questa sembra essere iniziata molto tempo prima
rispetto all’addomesticazione delle altre specie animali o vegetali. La datazione dei primi resti di
forme domestiche del cane risale infatti a 35,000 - 40,000 anni fa.
Il Medio Oriente sembra essere stato il punto d’origine della domesticazione del cane. Questa
ipotesi è confermata a livello genetico, infatti la presenza di una stessa mutazione in diverse specie
di cani domestici ha una singola origine ed è stata ritrovata in gruppi di lupi del Medio Oriente. In
particolare questa origine sembra essere correlata alle specie di cani più piccole; tutti i cani di
piccola taglia sembrano avere una mutazione sul gene IGF1, “clusterizzando’’ con i lupi (significa
che sono geneticamente più simili ai gruppi dei lupi del Medio Oriente). Questa evidenza
suggerisce una prima evoluzione dei cani di taglia piccola in Medio Oriente.
Studi più recenti hanno dimostrato che la domesticazione del cane è avvenuta in due punti
d’origine differenti: il primo è rappresentato dal Medio Oriente, il secondo dall’Asia.

I geni associati ai principali tratti fenotipici che caratterizzano le diverse razze canine sono stati
identificati. In particolare sono stati identificati i polimorfismi nei geni responsabili della forma,
statura e conformazione delle razze bassotte. I polimorfismi sono stati indentificati sul cromosoma
18 nel genoma dei cani.
13. SELEZIONE SESSUALE
I processi di selezione sessuale furono identificati da C. Darwin durante il suo studio delle specie
animali e lo studio sulla selezione naturale. Darwin si accorse che molti caratteri presenti nelle
specie non miglioravano la fitness dell’individuo, dunque non migliorava la probabilità di
sopravvivenza. Questi caratteri però, influenzavano la capacità riproduttiva degli individui.
La riproduzione sessuale infatti, a differenza della seleziona naturale, non dipende da una lotta per
l’esistenza e non influenza la capacità di sopravvivenza di un individuo (specie) in un determinato
ambiente, ma riguarda la capacità degli individui con determinate caratteristiche di riprodursi e
trasmettere il proprio patrimonio genetico alle successive generazioni.

Ne: ‘’L’origine delle Specie’’ del 1859, Darwin descrisse la selezione sessuale con:
“Questa [selezione] non dipende da una lotta per l’esistenza, ma da una lotta tra i maschi per il
possesso delle femmine, e il risultato non è la morte del competitore sconfitto, bensì la scarsità o
l’assenza di prole. La selezione sessuale, dunque, p meno rigorosa della selezione naturale.
Generalmente i maschi più vigorosi, i meglio adattati ai posti che occupano in natura, lasceranno
una maggior quantità di discendenti’’.

La selezione sessuale è un processo che coinvolge individui della stessa specie, infatti la
competizione, a differenza della selezione naturale, è limitata agli individui presenti negli individui
maschili in una determinata specie.

13.1 MECCANISMI DELLA SELEZIONE NATURALE


Charles Darwin definì due meccanismi con la quale agisce la selezione naturale: competizione tra
maschi e scelta delle femmine.
La competizione tra maschi rientra tra quei processi di selezione intrasessuale, ovvero avviene tra
gli individui dello stesso sesso. L’elemento importante nella competizione tra i maschi per l’accesso
alle femmine si palesa con un aumento dell’aggressività dei maschi. Vi sono poi modalità diverse di
competizione, e si possono suddividere in: esibizioni di colori appariscenti, esibizione di corna e
zanna possenti.
L’altra categoria riguarda la scelta delle femmine sul fenotipo maschile: in questo caso parliamo di
un processo di selezione intersessuale. Viene definita intersessuale perché gli individui
appartenenti ad un sesso operano una scelta di selezione sugli individui appartenenti al sesso
opposto. In questo caso i maschi evolvono dei caratteri ornamentali per risultare più attraenti.
I più famosi esempi sono rappresentati dalla coda del pavone maschio, o dalla colorazione del
muso dei mandrilli. In entrambi i processi la selezione agisce sul maschio della specie, prima
dell’accoppiamento (pre-copula).
Ma perché la selezione sessuale agisce soltanto sugli individui maschi? Femmine e maschi hanno
un potenziale riproduttivo diverso: le femmine infatti producono pochi gameti grandi (ovuli), i
maschi producono tanti gameti piccoli (spermatozoi). Questa condizione di differenza di potenziale
riproduttivo viene definita anisogamia. Un maschio può accoppiarsi con molte femmine senza
troppi danni alla fitness. Una femmina monogama che si accoppia con un partner non adeguato
potrebbe avere una drastica riduzione della fitness.

In tempi recenti si sono scoperti altri meccanismi tramite i quali opera la selezione sessuale, ad
esempio la competizione tra gli spermatozoi a livello delle gonadi e la scelta criptica della femmina,
dunque vengono inclusi anche i processi post-copula.
13.1.2 ESEMPI DI PROCESSI DI SELEZIONE SESSUALE POST-COUPLA
La competizione tra maschi a livello spermatico: sono numerosissime la modalità con cui il maschio
riduce la probabilità che lo sperma di un altro maschio vada a fecondare le uova della femmina.
Ad esempio in moltissime specie di uccelli, i maschi dopo essersi riprodotti con una femmina
difendono il territorio circostante in modo da tener lontani altri individui maschili.
In altre specie, come ad esempio nei ragni, crostacei, rane e insetti, i maschi possiedono delle
strutture particolari per afferrare le femmine; proteggendole da altri individui maschi e impedendo
un possibile troncamento dell’accoppiamento.
Altri meccanismi possono riguardare i caratteri morfologici della seppia gigante australiana. I
maschi che vincono esibendo la propria colorazione, difendono il proprio territorio dai competitori.
I maschi che non sono stati scelti dalla femmina imitano la colorazione femminile, per ingannare il
maschio e avvicinarsi alla femmina.

Nei casi in cui le femmine si accoppiano con diversi partner maschili si ha una competizione
spermatica nel momento in cui gli spermatozoi di due o più maschi devono fecondare un numero
limitato di uova. In questo caso i maschi reagiscono producendo una maggiore quantità di
spermatozoi, aumentando la possibilità di fecondazione. Per questo motivo i testicoli delle specie
poligame di primati sono più grandi di quelle delle specie monogame.

In alcuni casi particolari possiamo assistere ad una competizione tra femmine. Presenta gli stessi
meccanismi della competizione tra i maschi e viene adottata nelle specie in cui le cure parentali
sono a carico del partner maschile.

13.1.3 SCELTA CRIPTICA DELLA FAMMINA SUL FENOTIPO MASCHILE


Il corteggiamento da parte dei maschi ha come fine ultimo l’accoppiamento con la femmina scelta,
ovvero la fecondazione delle sue uova e la produzione di progenie; ma non sempre
l’accoppiamento porta alla fecondazione.
Dopo l’accoppiamento inizia un processo che è sotto il controllo esclusivo della femmina, e che può
impedire la fecondazione delle uova. I processi possono essere riassunti nei seguenti meccanismi:

 Interruzione prematura dell’accoppiamento:un tempo di copula più lungo aumenta le


chance del maschio di fecondare una femmina ( i maschi di Paratrechalea ornata e altre
specie di ragno attirano la femmina per prolungare l’accoppiamento);

 Assenza di ovulazione o utero impreparato;


 Mancanza di deposizione delle uova negli ovipari;
 Rimozione delle spermatofore prima che abbiamo rilasciato gli spermatozoi: le femmine
di Gallus gallus preferiscono accoppiarsi con maschi dominanti, ma la maggior parte delle
copule sono forzate e spesso maschi subordinati riescono ad accoppiarsi comunque. Le
femmine rimuovono lo sperma dei machi di basso rango per controllare la fecondazione
anche in seguito ad accoppiamenti forzati.

 Uso selettivo degli spermatozoi immagazzinati

Scelta criptica della femmina: risulta da un processo controllato da una femmina che si è
accoppiata con più maschi e che favorirà la paternità dell’individuo maschio che presenta caratteri
migliori rispetto agli altri. Viene definita criptica perché coi metodi tradizionali non si riesce a
determinare chi sia il maschio con il miglior successo riproduttivo.
13.2 DIMORFISMO SESSUALE
I maschi per poter aver maggiore successo di riproduzione sviluppano dei caratteri molto
appariscenti (colorazioni, vocalizzazioni, comportamenti, ornamenti), estremamente esagerati
rispetto ai caratteri standard femminili. Questi caratteri vengono definiti caratteri secondari dei
maschi hanno un ruolo fondamentale nel corteggiamento perché vengono valutati dalle femmine.
Ma il fatto che questi caratteri siano esageratamente appariscenti, possono contemporaneamente
dimostrarsi ecologicamente svantaggiosi. Lo svantaggio mimetico dei predatori e la capacità di
fuga delle prede vengono drasticamente ridotte a causa di questi caratteri secondari.
Ragioniamo: solitamente sono i maschi ad essere più vistosi e più grandi, questo dovrebbe
comportare un effetto deleterio per la sopravvivenza e aumentare i costi dal punto di vista
energetico, svantaggiando così questi individui. Ma questa incoerenza di caratteri è stata
mantenuta nel corso dell’evoluzione?
Per sottoporre a verifica l’ipotesi che i colori sgargianti dei maschi attraggono più predatori, Jerry F.
Husak e i suoi collaboratori hanno costruito modello in argilla colorati come i maschi e le femmine
di questa specie e li hanno messi nel deserto. Dopo una settimana il 90% dei modelli che
ricalcavano l’aspetto del maschio mostravano segni di morsi di serpente o beccati di uccelli, mentre
nessuno dei modelli femminili mostrava segni da parte di predatori.
Il dimorfismo sessuale nelle specie animali e noto anche nei resti fossili.

13.3 MODELLI DI SELEZIONE SESSUALE – MODELLO DI FISHER E SEXY GENES


All’inizio c’è una variazione nella preferenza delle femmine per certi caratteri secondari maschili.
Questa preferenza aumenta la fitness dei maschi dotati di questi ornamenti, che potranno
accoppiarsi con un numero maggiore di femmine. Anche le femmine vedranno aumentata la loro
fitness, produrranno figli maschi con ornamenti (ad alta fitness) e figlie femmine che preferiranno
maschi con ornamenti (alta fitness).
Una volta avviato questo processo di autorinforza: aumento ornamenti – aumento fitness,
aumento scelta della femmina per maschi con ornamenti – aumento fitness. Questa viene definita
selezione sessuale runaway o sexy genes (modello di R. Fisher 1930). Il modello Fisher non
prevede un costo ecologico dei caratteri secondari maschili e nella scelta femminile.

13.4 MODELLI DI SELEZIONE SESSUALE – MODELLO DEI GENI BUONI


L’espressione dei caratteri secondari è un segnale onesto della qualità genetica generale del
maschio che li porta. Le femmine, accoppiandosi con i maschi con ornamenti più sviluppati,
produrranno prole con una maggiore probabilità di sopravvivenza. Maschi di buona salute
segnalano alle femmine la loro buona qualità. Questo modello viene chiamato modello good
genes.
14. TEORIA DEL COALESCNTE
Per ovviare la limitazione di ignoranza di ogni stato genetico dei singoli individui, abitante la
popolazione di interesse, viene in aiuto la teoria del coalescente.
Con il coalescente possiamo ricostruire la genealogica di un campione estratto dalla nostra
popolazione d’interesse. La genealogia viene ricostruita attraverso il calcolo della probabilità, a
condizione che gli individui del nostro campione condividano un antenato comune. La probabilità
corrisponde a:
1
P r o b   ( t w o   g e n e s   s h a r e   a   p a r en t )= ,   2 N   p er   d i p l o i d i ,   N   p er   a p l o id i  (e s.   mt D N A )
2N

L’individuazione dell’antenato comune di due copie di un gene rappresenta un evento di


coalescenza. La probabilità che due copie dello stesso gene condividano lo stesso antenato
comune nella generazione successiva resta invariata.

Prendiamo in considerazione il seguente esempio (vedi immagine a


destra); in questo schema non campioniamo due coppie dello
stesso gene, ma ne campioniamo cinque (5 pallini rappresentati dal
colore rosso nella fila più in alto). La probabilità che questi cinque
individui vadano a coalescenza è rappresentata dalla seguente
formula:

k ( k −1 )
×1
2
P   (c o a l e s c e n z a)= ,  d o v e :
2N
k ( k−1 )
  è   il   n u me r o   d i   c o p p ie   d i   c o p i e   d e l   g e n e ;
2
1
  è   la   p r o b a bi li t à  c h e   u n a  c o p p i a   si a   c o a le s c e nt e.
2N

In questo modo calcoliamo la probabilità di coalescenza di tutte e cinque le copie del gene, e
quindi di andare ad identificare l’antenato comune alle copie del gene.
14.1 IL COALESCNTE ED ESEMPI DI RICOSTRUZIONE DELLA GENEALOGIA DI CAMPIONI
Il coalescente è un modello che predice la distribuzione degli eventi di coalescenza i geni. Partendo
da un campione di copie geniche osservate, usiamo il coalescente per calcolare la relazioni tra gli
individui del campione procedendo a ritroso nel tempo (dal presente verso il passato). Ciò
permette la ricostruzione della genealogia del campione di partenza.

Nelle righe seguenti vedremo come viene ricostruita la genealogia di un campione di 22 individui.
Per semplicità parliamo di un sistema aploide. Il numero degli antenati diminuisce fino al MRCA
(most recent common ancestor; vedi immagine sottostante ultima riga “1 ancestor”).

Nella nostra situazione di partenza (vedi immagine sovrastante.) sono presenti i campioni,
composti da 22 individui. Questa prima riga presenta la situazione osservata al presente. Grazie al
coalescente possiamo calcolare le probabilità di coalescenza e quindi identificare gli eventi di
coalescenza delle generazioni passate. Andando in dietro di una generazione iniziamo ad
individuare gli eventi di coalescenza: identificando 18 antenati (diciotto perché ci sono alcuni
individui che non contribuiscono (4 individui, 18+4=22  i n d i v id u i   t o t al i ) alla generazione
presente, volendo dire che non hanno lasciato discendenti).
Indietreggiando per una generazione, arrivando a tre generazioni precedenti; anche in questo caso
abbiamo identificato differenti eventi di coalescenza. Anche in questa generazione ci sono degli
individui (pallini azzurri) che non hanno contribuito alle generazioni successive, dunque il numero
di antenati si riduce nuovamente. Ricostruendo la genealogica arriviamo ad un antenato comune.

È ormai intuitivo che per studiare la storia della popolazione non abbiamo bisogno di tutti gli
individui che ne fanno parte in tutte le generazioni, perché ci sono molti individui che non
contribuiscono al nostro campione al presente.
14.2 POSSIBILI EFFETTI DI FORMA E LUNGHEZZA SULLA GENEALOGIA
Le genealogie sono definite da due parametri: forma (ordine eventi di coalescenza) e lunghezza
dei rami. La popolazione che abbiamo analizzato nell’esempio precedente ha una genealogia
basata su un numero di popolazione (22 individui) sempre costante, questo significa che la
dimensione della popolazione non cambiava nel tempo. Cosa succede alla genealogia quando la
popolazione si espande? Tanto più grande è la popolazione campionata, tanto più piccola sarà la
probabilità che avvenga un evento di coalescenza. Al contrario: se la dimensione della popolazione
è molto piccola, la probabilità d coalescenza sarà molto grande.

Spieghiamo questo fenomeno di forma con l’immagine sovrastante: al tempo t1 stiamo calcolando
la probabilità di coalescenza, che sarà un rapporto relativamente basso ( k ( k−1 ) ). Se
28
confrontiamo il tasso di coalescenza calcolato nella popolazione con dimensione di 14 individui,
con il tasso di coalescenza di una popolazione con 7 individui; notiamo che i rapporti cambiano
rilevantemente.
Questo rapporto tra dimensione e tasso di coalescenza è importantissimo: perché la
distribuzione degli eventi di coalescenza nella genealogia seguirà determinate forme, informandoci
della storia demografica della popolazione.
La lunghezza dei rami della genealogia è informativa sulla storia demografica della popolazione
che stiamo studiando.
14.3 SIMULAZIONI DI COALESCENZA E VARIABILITÀ GENETICA
Tramite l’utilizzo del coalescente possiamo studiare le diverse popolazioni, stimando qual è stata la
loro storia demografica. Un modo per poter sfruttare il potere della teoria del coalescente è quello
di utilizzare delle simulazioni. Una simulazione di coalescenza di basa su diversi passaggi:

1. Bisogna disegnare uno scenario demografico: es. popolazione che resta costante;
2. Definire il campione di individui che si vuole tenere in considerazione: N di individui;
3. Selezionare un campione di individui che permetterà l’analisi di questo modello
demografico;

Grazie al coalescente posso ricostruire la genealogia corrispondente a questo modello


demografico. La forma e la lunghezza dei rami dipendono dalle caratteristiche del modello
demografico. Fino a questo punto abbiamo parlato di ricostruzione di genealogia, di rapporti tra
individui della popolazione campionata, ma non abbiamo mai parlato di variabilità genetica.
Nelle simulazioni di coalescenza, infatti, prima ricostruiamo la genealogia dei campioni fino ad
individuare l’antenato comune più recente (forma e lunghezza dei rami), successivamente
possiamo integrare l’informazione della variabilità genetica: imponiamo sulla genealogia che
avvenga un certo numero di mutazioni (simuliamo un certo numero di possibilità di mutazioni). Il
numero di mutazioni che avverranno dipenderà dal tasso di mutazione conosciuto, che daremo al
nostro modello.
Con questo passaggio di integrazione di variabilità genetica dipendente dal tasso di mutazione
definito, generiamo il livello di variabilità atteso nella popolazione, dato il modello demografico
che stiamo studiando. Una volta ottenuto questo dataset di variabilità genetica simulata, su base di
modello demografico, posso confrontare statisticamente i dati di variabilità genetica simulata, con i
dati di variabilità genetica osservati, basando la comparazione sull’osservazione di diversi modelli
demografici (costante, bottleneck, espansione, popolazione strutturata, ecc.).
Ogni modello demografico è definito da diversi parametri demografici, ad esempio la dimensione
della popolazione N e che varia o non varia in ogni generazione (vedi immagine sottostante).
Ogni modello demografico (o schematico) genera dataset di variabilità genetica in funzione di
valore dei parametri demografici.

14.3.1 APPROXIMATE BAYESIAN COMPUTATION COME STRUMENTO DI SIMULAZIONE


Uno dei metodi che ci permette di utilizzare le simulazioni di coalescenza per fare inferenza
demografica è rappresentato dal Approximate Bayesian Computation (ABC).
Questo metodo consiste in differenti passaggi, gli stessi che abbiamo velocemente descritto nel
capitolo 14.3. Il primo step è quello di definire le ipotesi demografiche: definire i modelli
demografici che possono spiegare la variabilità genetica che osserviamo nella popolazione studio.
Dopodiché definisco i parametri che regolano i modelli demografici ed associo ad ogni parametro
un range di possibili valori, dopodiché iniziamo a produrre i
dataset simulati di variabilità genetica.
Finita la prima fase, inizia la seconda fase: una volta ottenuti i
dataset dobbiamo riassumere l’informazione genetica prodotta,
utilizzando delle statistiche. Una volta riassunti i dataset possiamo
andare a confrontarli con i dataset di variabilità genetica osservati
nelle popolazioni reali.
Una volta terminate le fasi di definizione e simulazione con riassunzione dei
dataset, vogliamo individuare il modello demografico che ha prodotto la
variabilità genetica più simile a quello reale che osservo. Una volta
identificato il modello possiamo fare una serie di controlli di
qualità per assicuraci che la scelta sia giusta.
Andiamo a vedere più nel dettaglio ogni passaggio:

Il primo passaggio è produrre dataset di variabilità


simulata: in questo esempio siamo interessati ad
analizzare la storia delle popolazioni africane e non
africane. Vogliamo testare due ipotesi. La prima ipotesi afferma che: le popolazioni africane e non
africane si siano originate in modo indipendente, delineando un’evoluzione multiregionale
(rappresentato dal modello 1), mentre la seconda ipotesi afferma che le popolazioni non africane
discendono dalle popolazioni africane (modello 2 – out of Africa). Abbiamo due popolazioni che
vogliamo analizzare e vorremmo capire qual è stata la loro storia demografica, successivamente
abbiamo formulato due ipotesi e le abbiamo riassunte con due modelli demografici differenti.
Una volta definiti tutti i parametri e le distribuzioni a priori associate, possiamo generare la
variabilità genetica attesa per ogni modello, grazie al coalescente. Ottenuti i dataset possiamo
confrontarli con i dataset delle popolazioni reali che stiamo studiando. Nel riquadro (vedi prossima
pagina) vediamo come vengono messi a confronto i dati del modello 1, del modello 2 e in nero i
dati del modello realistico che sto studiando.
Mettendo tutti e tre i dataset a confronto possiamo
decidere quale dei due modelli ha prodotto i dataset
di variabilità più simili a quelli osservati nella realità.
Definiamo dunque una soglia (rappresentata
dall’anello nero) e andiamo vedere quanti dataset del
modello 1 e del modello 2, sono più vicini al dato
osservato. In questo caso quello che è ottengo è un
rapporto 30% di probabilità di corrispondenza per il
modello 1, e un 70% di probabilità di corrispondenza per il modello 2 “Out of Africa”. Fatto ciò
possiamo stimare i possibili valori che definiscono il modello demografico di tipo 2 (dimensioni,
tempo, ecc.)

Grazie al metodo Approximate Bayesian Computation (ABC) che ci permette di utilizzare le


simulazioni di coalescenza per studiare la storia demografica delle popolazioni, possiamo
analizzare un enorme quantità di casi, come ad esempio le relazioni genealogiche tra le
popolazioni antiche e le popolazioni moderne, sfruttando; oltre al metodo Bayesiano, anche
l’analisi dello studio del DNA antico, del quale abbiamo già trattato nel capitolo 12.6.

14.3.2 STUDIO DI ABC E DNA ANTICO – RELAZIONE GENEALOGICA TRA LE POPOLAZIONI DEL
PRIMO MEDIOEVO IN PIEMONTE E LE POPOLAZIONI MODERNE DEL PIEMONTE
L’obbiettivo era quello di capire se le invasioni barbariche che hanno interessato queste zone del
primo medioevo, abbiano influenzato la storia demografica di composizione genetica delle
popolazioni piemontesi moderne. Per analizzare e confermare o rifiutare l’ipotesi della presenza di
un contributo genetico da parte dei longobardi, i ricercatori sono andati a campionare diverse zone
del Piemonte. Una volta scelti i campioni ancestrali e i campioni moderni, si è passati a definire le
due ipotesi: la prima ipotesi afferma che le popolazioni longobarde antiche siano gli antenati delle
popolazioni piemontesi moderne. La seconda ipotesi invece, afferma che le popolazioni dei
longobardi antichi non abbiamo contribuito alla variabilità genetica delle popolazioni moderne.

Una volta simulati i dataset secondo il modello di continuità e il modello di discontinuità, siamo
pronti a confrontarli con i campioni moderni (quattro popolazioni moderne differenti: Torino,
Postua, Val di Susa, Trino Vercellese). Il colore blu si riferisce ai dataset prodotti dal modello due di
discontinuità, mentre quelli rossi si riferiscono ai dataset prodotti dal primo modello di continuità.
In giallo (si vede difficilmente) è rappresentata la variabilità genetica osservata nella quattro
popolazioni moderne.
Come possiamo osservare dalla tabella delle probabilità: il modello che ha prodotto la variabilità
genetica più simile alla variabilità genetica delle popolazioni moderne è il modello di discontinuità,
il modello numero 2.

15. INTRODUZIONE ALL’EVOLUZIONE MOLECOLARE (Dott.ssa Gloria González Fortes)


La evoluzione molecolare fa parte dalla biologia evolutiva, e si occupa dello studio dei cambiamenti
evolutivi in base alle informazioni delle molecole che contengono l’informazione ereditaria,
dunque è fondamentalmente lo studio dell’evoluzione dei geni e dei genomi. Anche le informazioni
proteiche possono contribuire allo studio dell’evoluzione molecolare, perché queste sono collegate
alle sequenze genomiche.
Oltre ad usare le molecole contenenti informazioni genetiche, l’evoluzione molecolare sfrutta gli
strumenti della genetica di popolazione: teorie e metodologie.

15.1 RIPASSO - CLASSIFICAZIONE DELLE MUTAZIONI


 A seconda della cellula interessata: somatica – germinale;
 A seconda dell’entità: puntiforme (genica) – cromosomica (genomica);
 A seconda della loro origine: spontanee – indotte;
 A seconda dell’effetto: neutrali – dannose favorevoli;
15.1.1 RIPASSO - CLASSIFICAZIONE DELLE MUTAZIONI PUNTIFORMI
Mutazione silente o sinonima AGG  AGA
Arg  Arg
Mutazione missenso AAA  AGA
Lys  Arg
(basico)  (basico)

UUU  UCU
Phe  Ser
(Idrofobico)  (polare)
Mutazione nonsenso UUA  UAA
Leu  Stop
Mutazione frame-shift CATCATCAT / CAT – CAT – CAT / CTA – TCA – TCA
Mutazioni in frame CATCATCAT / CAT – CAT – CAT / CAT – TTC – CAT

15.2 EVOLUZIONE MOLECOLARE COME STUDIO DELLE RELAZIONI EVOLUTIVE TRA LE SPECIE
Il confronto delle sequenze genetica è strumento cruciale per la ricostruzione delle relazioni
evolutive tra le specie; quali sono le specie più vicine nel tempo evolutivo, qual è l’antenato
comune più recente. Nel confronto delle sequenze, anche l’identificazione del numero di
nucleotidi e amminoacidi diversi tra due o più genomi a confronto, ci permettono di: identificare la
relazione tra le specie, ma: poiché l’evoluzione agisce mutando un’unità alla volta (nucleotide o
amminoacido), il numero di differenze accumulate è indicatore di tempo di separazione dal primo
antenato comune. I principali vantaggi dei confronti basati sui dai molecolari sono:

 L’informazione è facilmente quantificabile;


 Si possono confrontare organismi molto diversi;
 Maggiore quantità d’informazione disponibile per il confronto;

15.2.1 ALLINEAMENTO DELLE SEQUENZE


Lo strumento base per la ricerca dell’evoluzione molecolare è l’allineamento delle sequenze, sia
delle sequenze di DNA, e sia delle sequenze di proteine. Si tratta di identificare i nucleotidi
condivisi da entrambi i campioni, e di identificare anche i cambiamenti (mutazioni).

Se osserviamo la seconda immagine, possiamo vedere che si sono molti più gap rispetto alla prima
immagine: questo indica una storia evolutiva con un cospicuo numero di eventi di inserzione o
delezione dei nucleotidi (questo tipo di mutazione porta ad un frameshift).
Dunque: quando vi sono diverse opzioni di allineamento viene preferito il modello con un numero
minore di gaps perché più compatibile con la storia evolutiva degli organismi, ma questo non
implica che il modello scelto rappresenti una decifrazione esatta del corso evolutivo delle specie
sotto analisi. Il modello in questione, seppur non ottimale, viene chiamato modello ottimale.

15.3 TIPI E MODALITÀ DI SOSTITUZIONE


Per interpretare il significato evolutivo dei cambiamenti nelle sequenze bisogna prima conoscere e
studiare i tipi e le modalità di sostituzione osservabili nelle molecole.

L’immagine sovrastante presenta un allineamento di proteine. Il confronto delle proteine


omologhe dimostra che nel corso dell’evoluzione, non tutti i cambiamenti sono uguali; infatti molti
vengono favoriti. L’osservazione di queste preferenze nei primi studi portava già allora ad diversi
principi evolutivi: le mutazioni sono eventi poco frequenti e rari, e nel corso dell’evoluzione
vengono favorite quelle mutazioni che portano a cambiamenti leggeri, a livello proteico. I
mutamenti che portano ai cambiamenti drastici al livello delle proteine vengono sfavoriti e dunque
eliminati dal pool genico delle specie.

15.3.1 TASSI EVOLUTIVI: PROBABILITÀ DI CAMBIAMENTO, PROBABILITÀ NUMERO DI


SOSTITUZIONI PER SITO E PROBABILITÀ DI SOSTITUZIONE NUCLEOTIDICA
Prendiamo in esempio lo studio evolutivo di quattro specie uniche, per questo stiamo analizzando
le sequenze dei geni omologhi di queste quattro specie (geni che condividono un antenato
comune).

Notiamo subito la presenza di un accumulo delle sostituzioni delle diverse specie (nucleotidi
indicati con lettere rosse). Concentriamoci sulle sequenze della specie numero tre (3) e quattro (4).

L’interpretazione più semplice: nei punti dove il cambiamento non è avvenuto, è logicamente un
segno che indica l’assenza di un fenomeno di sostituzione nel corso evolutivo delle specie.
Siccome il tempo evolutivo (o il temo di diversificazione) tra le due specie è molto lungo: è anche
possibile che dove non siano visibili mutazioni ci siano in stati in realtà dei passaggi intermedi (ad
esempio un passaggio a tre fasi da: timina, citosina e nuovamente timina).
Per tenere conto di queste sostituzioni multiple (invisibili) nel confronto tra le specie, è stato
sviluppato un modello matematico: il modello di Jukes-Cantor, questo include un parametro α
(tasso di cambiamento tra i nucleotidi). Il modello ipotizza che: al tempo 0 nella molecola
ancestrale ci fosse una citosina, la probabilità che al tempo 1 (passate diverse generazioni) la
citosina sia rimasta invariata verrà data dalla probabilità di ottenere una citosina; meno la
probabilità di tutte le altri possibili sostituzioni (G, T, A = 3α). Così Jukes e Cantor stimano che in un
tempo futuro, la probabilità che in un sito del DNA ci sia sempre lo stesso nucleotide, viene data
dall’espressione: P c ( t )= 1 + 3 e−4 a t (teniamo a mente che la probabilità che non avvengano
4 4
mutazione di dipende soprattutto dal tasso di cambiamento, e dal tempo trascorso).

Una volta calcolato il valore della K (numero di sostituzioni per sito), e avendo anche delle
informazioni sul tempo che è trascorso dalla divergenza delle due specie da quella ancestrale,
possiamo andare a stimare il tasso di sostituzione: r= K ( x → y ) , dove x e y  indicano i genomi
2T
allineati e messi a confronto.

15.3.2 VARIABILITÀ DEI TASSI EVOLUTIVI ALL’INTERNO DEI GENI

Per capire la variabilità del tasso evolutivo bisogna avere ben presente la struttura del gene: in un
gene ci sono regioni codificanti dette esoni, queste unità vengono trascritte in mDNA.
Geni diversi all’interno del genoma hanno tassi di sostituzione diversi.
MANCA LEZIONE: PRESENTAZIONE_06_video

16. EVOLUZIONE DEL GENOMA


L’obbiettivo ultimo della genomica evolutiva è capire come siamo passati dalle prime di forme di
vita semplici, alle complesse strutture genomiche della nostra era; spiegando così la biodiversità e
tutte le funzioni complesse come ad esempio la funzione cognitiva della nostra specie.
Esistono diverse branche della genomica: genomica strutturale, genomica comparativa, genomica
funzionale.

16.1 ARCHITETTURA DI BASE DEL GENOMA EUCARIOTE E DIFFERENZE TRA LE DIVERSE SPECIE
Iniziamo dallo studio di alcune caratteristiche dei genomi eucarioti che siamo riusciti a sequenziare
ed analizzare grazie alle tecnologie di sequenziamento genomico. Una di queste caratteristiche
viene chiamato valore C. Il valore C viene detto anche contenuto di DNA aploide (quantità) in
alcune specie.
La mancanza di correlazione tra la complessità genica (o morfologica) di un organismo e le
dimensioni del suo genoma è definita paradosso del valore C. Infatti non esiste una correlazione
diretta tra complessità dell’organismo e quantità di DNA, ad esempio: i mammiferi hanno una
quantità di DNA tra le 2Gb (giga basi) e le 8Gb; mentre esistono anfibi con meno di 1Gb ed altre
specie di anfibi che hanno più di 100Gb (vedi immagine sottostante a sinistra).
Un’altra caratteristica osservabile nel confronto tra sequenze genomiche di specie appartenenti da
diverse taxa, è la correlazione tra frazione del genoma non codificante e complessità
dell’organismo (vedi immagine sovrastante a destra). Nel grafico viene rappresentata la
percentuale del DNA che non codifica per le proteine. La presenza di questo DNA non codificante
spiega anche la variazione rispetto alla densità genica di diversi organismi. La densità genica viene
calcolata come il rapporto del numero dei geni moltiplicato per il numero di mega basi (lunghezza
del genoma). Le sequenze non codificanti corrispondo agli introni, alle sequenze ripetute (spesso
intercettabili all’interno degli intorni) e alle sequenze inter-geniche.
Per molto tempo si considerava il DNA non-codificante come DNA spazzatura (junk DNA); però oggi
sappiamo che questo DNA può avere un ruolo molto importante per quanto riguarda la struttura
genica degli organismi, spiegando l’evoluzione della complessità del genoma. Naturalmente ora
sappiamo che il DNA non-codificante fa da spaziatore tra i geni codificanti, coordinando le aree di
espressione genica, e molte sequenze ripetute all’interno degli introni hanno un ruolo di splicing
del mRNA.
Nei genomi degli eucarioti si osservano regioni dove la densità genica è più alta e vengono
chiamate regioni ricche di geni, mentre altre regioni hanno un numero significativamente inferiore
e vengono chiamate deserti genici.
I geni riuniti nelle regioni ricche di geni hanno introni piccoli e tendono a trascriversi
abbondantemente.

0.5 SUMMA
 Gli studi di genomica comparativa hanno permesso di confrontare genomi completi tra
specie di taxa diverse, contribuendo alla caratterizzazione delle sue differenze strutturali e
funzionali;
 Negli eucarioti esiste una scarsa correlazione tra dimensione del genoma e complessità
dell’organismo (paradosso del valore C);
 Gli organismi più complessi hanno una maggior percentuale di sequenze non codificanti nel
loro genoma, e una bassa densità genica, a confronto di organismi più semplici;
 Queste sequenze non codificanti (junk DNA) sembra abbiano un ruolo importante nella
regolazione dell’espressione genica e nel processo di splicing del mRNA, contribuendo
all’aumento della complessità degli organismi eucarioti.
16. 2 DIMENSIONI DEL GENOMA E NUMERO DI GENI CODIFICANTI
Si è notato che vi era una correlazione abbastanza lineare tra la dimensione del genoma e il
numero di geni presenti all’interno del genoma. Seguendo questa logica ci si aspettava che ai
genomi più grandi corrispondesse un numero di geni maggiore. Questo ragionamento nasce
dall’assunzione che per comporre una proteina ci vogliano circa 300 amminoacidi, un
amminoacido è codificato da una tripletta di nucleotidi, quindi 300 amminoacidi ed ognuno di
questi codificato da 3 nucleotidi: 300  ×3=900 nucleotidi. Così si può ricavare una stima del
numero di geni nel genoma, calcolando:

d i me n si o n e   d e l   g e n o m a
=n u m e r o  d i   g e n i   n e l   g e n o m a ;
1000
 
Questa formula funziona con speciale efficienza nel calcolo del numero di geni negli organismi
procarioti.

Quando negli anni ’90 parte il progetto di sequenziamento del genoma umano, e considerando la
presenza di introni e sequenze ripetute, ci si aspettava di ricavare un numero di geni intorno ai
100.000. In realtà il numero che ricavarono era intorno ai 30.000 geni che codificano per proteine.
Oggi esistono diversi software per un calcolo più preciso del numero di geni, questi possono anche
predire la locazione del gene cercando tra le sequenze caratteristiche del gene ricercato: isole
CpG senza regioni promotrici, open reading frames con esoni (codone start ATG, condoni stop
TAA/TAG/TGA), e regioni con alto contenuto di guanina e citosina (GC).

Il passaggio successivo è un passaggio sperimentale, e consiste nella clonazione del frammento di


DNA con sequenza genica caratteristica, attraverso un vettore batterico, e con l’analisi del gene
clonato come passaggio finale.
Un altro metodo di analisi finale per la conferma del gene consiste nel mettere la sequenza
identificata a confronto con un microarray di RNA, e vedere per complementarietà delle basi tra
RNA e DNA se la sequenza è presente nell’RNA espresso.

16.3 STURTTURA DEL GENE EUCARIOTICO ED IMPLICAZIONI PER LA COMPLESSITÀ BIOLOGICA


Aggiungiamo che il processo di splicing non accade necessariamente sempre nello stesso modo,
non sempre vengono eliminati gli stessi introni. Ci sono dei processi di splicing alternativo:
partendo dalla stessa sequenza genica si può arrivare a dei prodotti proteici (a livello di traduzione)
con delle differenze strutturali (leggere o rilevanti).

Si è arrivati a tre osservazioni generali per spiegare che l’incremento della complessità del gene è
un prerequisito all’origine di organismi pluricellulari complessi:
 La struttura del gene è molto più elaborata degli organismi eucariotici multicellulari;
anziché negli organismi eucarioti unicellulari;
 Forme simili di struttura genomica sono riscontrabili nei due regni maggiori che si sono
evoluti indipendentemente in due linee ben distinte: piante e animali;
 I geni più complessi trasportano informazioni che permettono la sintesi di proteine con
compiti più difficili ed elaborati.

16.4 IPOTESI DELL’ORIGINE DELL’INTRONE: TEORIA DELL’ENDOSIMBIOSI


Dall’analisi filogenetica e dalla analisi di distribuzione degli introni di un’ampia varietà di genomi
eucariotici, risulta chiaro che nelle prime cellule eucariote ancestrali erano già presenti degli
introni. Sappiamo anche che il numero degli introni era eccessivamente elevato; stimando tre
introni per gene codificante proteine.
La teoria che ha avuto più successo nello spiegare l’origine degli introni è direttamente ricollegabile
alla teoria endosimbionte dell’origine della cellula eucariote. L’idea è che gli introni abbiamo
avuto origine nelle cellule che formano i mitocondri (o cloroplasti vegetali), e che queste cellule di
tipo batterico avessero nel proprio genoma introni di tipo 2; un gruppo di introni con capacità di
self-splicing. Durante il processo endosimbionte che porta alla formazione delle cellule con nucleo
e altri organuli cellulari, gli introni avrebbero potuto migrare verso il DNA, integrandosi con il
genoma nucleare.
Fino a qua abbiamo visto come l’architettura del gene sia strettamente correlata alla capacità
funzionale del genoma, e della complessità degli organismi.

Degli altri elementi che dal punto evolutivo ci permettono di guadagnare complessità sono gli
istoni (rimodellamento della cromatina) e la metilazione delle isole CpG sul DNA. L’attivazione del
gene dipende dal processo di rimodellamento della cromatina, che viene mediato per la
modificazione epigenetica degli istoni. Questi sono due elementi di controllo della regolazione
della espressività genica.

17. ORIGINE DI NUOVI GENI E FAMIGLIE MULTI-GENICHE


Nel 1932, J.B.S. Haldane propone che alla base del processo di formazione di nuovi geni ci sia
l’assistenza dei geni ridondanti (multiple copie di un gene). Nello stesso anno viene scoperto per la
prima volta un caso di duplicazione con conseguenze a livello fenotipico dell’occhio, legate al gene
bar, questo associato al cromosoma X della Drosophila melanogaster. Questo vuol dire che: più
geni bar vengono duplicati (e sono presenti sul genoma), più l’occhio della Drosophila si stringe.
Nel 1970, Susumu Ohno, pubblica il libro intitolato Evolution by Gene Duplication (1970),
postulando una teoria secondo la quale la duplicazione genica sia il meccanismo fondamentale che
permette l’origine di nuovi geni; perché secondo Ohno la ridondanza permette all’organismo di
avere un gene sempre funzionale (derivazione ancestrale), e dall’altra parte di avere una copia
dello stesso gene (ridondante) non necessariamente funzionale, ma questa copia ha più possibilità
di accumulare delle varianti durante i processi di mutazione.

La teoria della formazione di nuovi geni spiega anche la comparsa di segmenti duplicati nel
genoma. Grazie alle tecnologie che permettono il sequenziamento genomico abbiamo potuto
provare che i segmenti duplicati nel genoma eucariotico sono veramente molto frequenti.
I segmenti duplicati nel genoma stanno alla base della comparsa delle famiglie multi-geniche:
molti geni risiedono in multiple copie che costituiscono cluster di geni, questi possiedono sequenze
genetiche simili tra di loro e codificano proteine molto simili tra di loro, avendo spesso funzioni
simili.
Degli esempi di famiglia multi-genica sono i geni della globina (emoglobina, immunoglobuline,
ecc.) e i geni HOX (intervengono nello sviluppo della simmetria corporale), e rappresentano i
gruppi di geni imparentante che si sono evoluti a partire da un gene ancestrale attraverso
duplicazione genica.
Nelle prossime pagine studieremo la famiglia delle globine perché è un esempio di famiglia multi-
genica che ha subito tanti processi di clonazione durante la propria storia evolutiva.

17.1 FAMIGLIA DELLE EMOGLOBINE UMANE


Nell’uomo la famiglia multi-genica delle globine è costituita da 7 geni simil-α (che codificano per le
diverse varianti delle catene globina α) e si trovano tutti sul cromosoma 16, e 6 geni simil-β che si
trovano sul cromosoma 11 (codificano le diverse catene globina β).
I due geni sembrano essersi originati dalla duplicazione di un gene ancestrale, sono seguite poi
delle modificazioni che hanno portato a queste diversificazioni; infatti notiamo come la struttura
dei due geni sia molti simile, in quanto conservano tre esoni (verde) e due introni (arancione).
Duque la struttura, in primis, è la prova che i due geni si siano originati dallo stesso gene
ancestrale. I due geni globina (α e β) si trovano su due cromosomi diversi (leggi primo paragrafo
del capitolo).

Il grafico sottostante rappresenta l’espressione dei diversi tipi di emoglobina durante lo sviluppo
dell’individuo. Nel sacco vitellino della specie umana l’emoglobina espressa è un’emoglobina
costituita da due tipi di catena (una catena α sottotipo ζ e una catena β sottotipo ε), dopo circa 3
mesi dallo sviluppo del feto la sintesi dell’emoglobina si sposta; la percentuale delle catene ζ e ε si
abbassa, aumentano però le percentuali delle catene α e γ. Queste catene
α e γ, sono necessarie per la formazione dell’emoglobina fetale nel
fegato e nella milza del feto. La catena α è di un solo tipo,
mentre la catena γ ha due sottotipi: γA e γG,
entrambe vanno a costituire
l’emoglobina F (fetale). Questa emoglobina F viene
prodotta fino a poco prima della nascita,
segue una diminuzione di produzione dell’emoglobina F con
simultanea e progressiva sostituzione con la catena β. La
dodicesima settimana, dopo la nascita, l’emoglobina è
quasi interamente sostituita dalle catene
α e β.
Una piccola percentuale di emoglobina a2, che fa
parte dall’emoglobina catena δ sarà presente nel sangue del
nascituro.

L’espressione delle diverse catene lungo lo sviluppo dell’individuo è correlata alla disposizione dei
geni sul cromosoma:
Cioè: le percentuali delle tipologie di emoglobine presenti nel sangue e le loro continue sostituzioni
durante lo sviluppo del feto si susseguono; l’attivazione dei geni richiesti segue un effetto domino.

Nell’immagine sovrastante vediamo come il primate ancestrale, con geni di un solo tipo per le
globine, abbia dato origine a geni diversi, con chiare duplicazioni per le diverse catene delle
globine dei primati moderni. Oggi sappiamo che il numero di copie dei geni per le globine è
variabile anche all’interno di alcune popolazioni umane. Queste osservazioni suggeriscono che le
duplicazioni e le delezioni dei geni nelle famiglie multi-geniche facciano parte di un processo
dinamico e attualmente in continua esecuzione.
Infine possiamo differenziare i geni in base al loro meccanismo di separazione:
 Geni ortologi: geni omologhi che si sono separati per un evento di speciazione;
 Geni paraloghi: in una stessa specie, sono geni derivati da un unico gene ancestrale che ha
subito duplicazione genica.
17.2 MECCANISMI DELLA DUPLICAZIONE GENICA – CROSSING OVER INEGUALE
Il crossing-over è un processo che prende atto durante la divisione meiotica, concretamente
durante la profase della meiosi 1; quando i cromosomi omologhi si appaiano per formare la
tetrade, e si scambiano i frammenti con i cromatidi fratelli. Perché questo accada in modo corretto
è fondamentale che le sequenze omologhe vengano allineate in modo preciso.
A volte, quando ci sono delle regioni ripetute causate da duplicazioni geniche, queste similitudini
possono portare a degli errori nell’appaiamento. Consecutivamente il crossing-over ineguale porta
a delezione o duplicazione del gene scambiato.
Sembra che sia stato proprio un processo di crossing-over ineguale con conseguente delezione, o
duplicazione dei geni γ nella linea evolutiva delle scimmie antropomorfe.

17.2.1 MECCANISMI DELLA DUPLICAZIONE GENICA – TRASPOSONI


Il crossing-over ineguale non spiega perché troviamo geni duplicati in cromosomi diversi (es. α e β
globine). Gli elementi mobili (50% della sequenza del genoma) del genoma ci permettono di
spiegare questo fenomeno: trasposoni (3%), LTR – retrotrasposoni (8%), sequenze SINES (13%) e
LINES (20%). La differenza più rilevante è quella tra trasposoni e retrotrasposoni: i primi vanno a
spostarsi direttamente da una posizione all’altra del genoma, mentre i retrotrasposoni vengono
trascritti in RNA, e sarà questo RNA a retro-trascriversi lasciano una copia della propria sequenza in
un altro gene (quindi ci sono due geni uguali).

17.3 ORIGINE DI NUOVI GENI CON MECCANISMI ALTERNATIVI


In inglese viene definito come new genes “from scratch” il meccanismo che da origine a nuovi geni
partendo da una sequenza genomica non funzionale.
Vi è poi la fusione genica, un processo di fusione tra due geni separati. Un esempio classico di
fusione è il gene jingwei della Drosophila e codifica per delle proteine che partecipano al
metabolismo degli ormoni e dei feromoni.
Un altro meccanismo è l’exon shuffling (rimescolamento degli esoni); che cambia il numero di
esoni e la loro posizione, ed è il meccanismo alternativo più importante per quanto riguarda la
generazione di nuovi geni.
Ultimo, e non meno importante, è il meccanismo del
trasferimento genico orizzontale (Lateral or horizontal
gene transfer). Questo è un processo di endosimbiosi:
l’organismo incorpora nel proprio genoma il materiale genetico di un
altro organismo, pur non essendo un discendente diretto
dell’organismo dal quale il materiale genico è
stato trasferito. Questo meccanismo viene
adottato dai batteri e dagli archeaea. Esistono poi quattro
sottocategorie di trasferimento genico orizzontale: coniugazione,
trasformazione, trasferimento intracellulare o endosimbiotico e
attraverso agenti di trasferimento genico. Così le infezioni virali dei
retrovirus (a RNA) funzionano come un veicolo per il trasferimento
orizzontale dei geni, perché incorporano il proprio
materiale genetico nella cellula ospite (vedi immagine
sovrastante).
18. DESTINO EVOLUTITVO DEI GENI DUPLICATI
Abbiamo scoperto come la duplicazione genetica può portare alla comparsa di due o multiple
copie di un gene, ma qual è il destino di queste copie? Le copie intraprendono destini diversi che
possono portare a diverse conseguenze:
 Ridondanza: nessuna divergenza funzionale, cioè il gene è più “robusto”;
 Pseudogenizzazione: presenza di divergenze funzionali, come mutazioni, codoni stop,
frame shift, ecc;
 Divergenza funzionale: neofunzionalizzazione (comparsa di nuove funzioni in uno dei geni
copia) e subfunzionalizzazione (tutti i geni hanno funzioni diverse tra loro e anche rispetto
al gene ancestrale);
 Conversione genica: con il passare del tempo i geni copia, che hanno precedentemente
acquisito funzioni diverse, cominciano ad assomigliarsi tra loro, acquisendo anche funzioni
molto simili;

19. EVENTI DI DUPLICAZIONE GENOMICA - IPOTESI 2R E 3R


Susumu Ohno (1970) ha inizialmente suggerito che l'aumento della complessità organica durante
l'evoluzione dei vertebrati avrebbe potuto verificarsi solo se si fosse verificato un aumento
considerevole del numero di geni e ha proposto che ciò avvenisse con la duplicazione di interi
genomi in un processo chiamato poliploidizzazione.
L'ipotesi più popolare che ci fossero due cicli di duplicazione del genoma mediante
poliploidizzazione all'inizio della storia dei vertebrati (l'ipotesi 2R) è stata difficile da testare fino a
poco tempo fa. Tra le linee di prova a sostegno di questa ipotesi vi sono la dimensione relativa del
genoma, il numero dei geni relativo e l'esistenza di presunte regioni genomiche duplicate durante
la poliploidizzazione. La disponibilità di sequenze per una parte sostanziale del genoma umano
rende possibili i primi test di questa ipotesi. Il confronto delle dimensioni della famiglia genica nel
genoma umano e nei genomi degli invertebrati non mostra alcuna evidenza di un rapporto 4: 1 tra
vertebrati e invertebrati. Inoltre, test filogenetici espliciti per la topologia attesi da due cicli di
poliploidizzazione hanno rivelato topologie alternative nella maggior parte delle famiglie di geni
umani. Allo stesso modo, le analisi filogenetiche hanno dimostrato che regioni genomiche
putativamente duplicate spesso includono geni duplicati in tempi molto diversi nell'evoluzione
della vita. L'ipotesi 2R può quindi essere decisamente respinta. Piuttosto, l'evidenza attuale
favorisce un modello di evoluzione del genoma in cui predomina la duplicazione in tandem, sia di
segmenti genomici che di singoli geni.

I quattro cluster del gene Hox nel genoma umano esemplificano l'ipotesi 2R (figura
Sottostante) Il complesso omeotico (HOM-C), cioè il gene che controlla altri geni, si presenta come
un singolo ammasso di invertebrati come Drosophila, Caenorhabditis elegans e anfioxus, ma si
trova come quattro gruppi di geni Hox paraloghi in vertebrati come topi e umani.
È da notare che l'ordine dei geni nei cluster Hox non solo è stato conservato nell’umano e nel topo,
ma è stato anche conservato tra i quattro gruppi di mammiferi. La quadruplicazione dei geni Hox e
la scoperta di altri geni paraloghi collegati ai cluster Hox forniscono prove a sostegno di
coinvolgimento di duplicazioni cromosomiche su larga scala o del genoma intero nel
evoluzione dei genomi dei vertebrati.
Oltre ai due cicli di duplicazione del genoma nella linea dei vertebrati, Ohno
(1970) hanno proposto un ciclo di duplicazione del genoma nei pesci; dopo la divergenza dei pesci
lobedfin che ha portato a organismi terrestri. Prove a sostegno della terza duplicazione sono state
rilevate nel Pesce zebra e nel Medaka, e sono basate sull'osservazione che generalmente hanno
famiglie multi-geniche più grandi.

20. INTRODUZIONE FILOGENESI – CONCETTI GENERALI


La filogenesi è lo studio delle relazioni evolutive tra entità biologiche (non solo specie) che
condividono antenati comuni. La sua rappresentazione grafica è l’albero filogenetico, questo
contiene i tempi e gli schemi temporali (topologia) dei processi di divergenza.
La logica alla base di un albero filogenetico sta nel fatto che: tutti gli organismi hanno un unico
antenato comune nel passato; ogni coppia di organismi ha un antenato comune nel passato; eventi
di speciazione si susseguono nel tempo creando nuove specie.
Ovviamente per creare un albero filogenetico bisogna calcolare le distanze tra gli individui. La
distanza dipende dalla somma dei cambiamenti lungo le due linee:

Un altro passaggio logico è la somiglianza tra le linee evolutive, infatti: due linee evolutive si
assomigliano di più tra loro rispetto ad una terza linea evolutiva se condividono un antenato
comune di tempi più recenti.

20.1 INTRODUZIONE FILOGENESI – ALBERI CON RADICE E SENZA RADICE


Esistono rappresentazioni di alberi con e senza radice. Per ogni albero senza radice ci sono 2s-3
alberi con radice, dove ‘’s’’ è il numero di unità tassonomiche. 2s-3 corrisponde al numero di rami.
Si considerano solo alberi dicotomici. Se s = 8, ci sono circa 130 mila alberi con radice, ma solo 10
mila senza radice.
Gli alberi con radice identificano direzioni di cambiamento.

20.2 INTRODUZIOENE FILOGENESI – TROVARE LA RADIC DI UN ALBERO FILOGENETICO


(ROOTING)
Esistono diversi metodi, uno tra i quali è il metodo dell’outgroup: utilizzo un gruppo esterno alla
filogenesi che sto analizzando. Assumendo che l’outgroup si sia separato prima di tutti gli altri
(devo fare un’ipotesi filogenetica esterna al gruppo che mi interessa). Detto questo: la divergenza
dell’outgroup non deve essere né troppo piccola, né troppo grande.
20.3 INTRODUZIONE FILOGENESI – VERA SOMIGLIANZA PER COSTRUIRE ALBERI (OMOLOGIA)
 Un carattere che si è evoluto una volta e non ha subito riversioni ha un valore filogenetico;
 La somiglianza in due linee filogenetiche per un carattere di questo tipo viene chiamato
omologia;
 In altre parole, un carattere di questo tipo è simile (o presente) in due specie perché era
così nel loro antenato comune;
 Le ali sono un carattere omologo in aquile e colombo perché l’antenato comune era alato.
Stesso ragionamento vale per i peli in cani e uomini.

20.4 INTRODUZIONE FILOGENESI – DISTINGUERE OMOLOGIE DA OMOPLASIE: EFFETTI DELLA


POSSIBILE CONGRUENZA
Se c’è omologia, la somiglianza fenotipica tende ad essere più profonda nella struttura, nella
posizione, nel modello di sviluppo embrionale. Darwin stesso però riconosce l’importanza del
concetto di congruenza: la presenza di molti altri caratteri che suggeriscono se una somiglianza è
una omologia è la miglior prova. Fondamentalmente (e implicito) il concetto di congruenza nelle
ricostruzioni basate sulle sequenze di DNA.

21. METODI DI RICOSTRUZIONE DI ALBERI FILOGENETICI


Essenzialmente possiamo suddividere le metodologie in quattro grandi settori di metodi
filogenetici molecolari, anche se al giorno d’oggi sappiamo che si può ricostruire un albero
filogenetico partendo anche da dati non molecolari (fenotipici e comportamentali):
 Metodi basati sulla stima di distanze, per esempio UPGMA, e Neighbor – Joining;
 Metodi basati sul criterio della parsimonia;
 Metodi basati sulla verosimiglianza;
 Metodi bayesiani;

21.1 METODI DI RAPIDA COMPUTAZIONE BASATI SULLE DISTANZE - UPGMA


I metodi basati sulle distanze prevedono essenzialmente il calcolo di una matrice di distanze, cioè
tutte le unità tassonomiche (in questo caso le specie A, B, C, D, E ed F) vengono confrontate a
coppie. Per ciascuna coppia vengono calcolate le distanze.
Il metodo poi procede in maniera interattiva; unendo i gruppi che portano la minore distanza.
Vediamo che la distanza più breve è quella tra la specie A e la specie B, e si forma un piccolo e
parziale albero riferito alle prime
due specie. Il passaggio successivo (Cycle
2) che ci porta alla seconda
matrice di distanza, implica una misura di
una distanza media tra il gruppo che abbiamo
appena formato (A e B) e tutti gli altri.
Essenzialmente la matrice si riduce, creando un nuovo gruppo AB,
non A e B. Ad esempio per calcolare la
distanza media tra AB da C, calcoliamo la
distanza media tra A e C, e poi tra D e C (in
entrambi i casi il risultato è 4). La
distanza media è dunque 4. Il
passaggio successivo prevede un'altra riduzione
(Cycle 3), e continuiamo con lo stesso metodo (ERRORE: la terza tabellina espone il numero 6
come valore minore, in realtà è 4 il valore minore).

Uno dei problemi dei metodi basati sulle distanze è che la distanza tra i corpi di gruppi può essere
misurata ma non necessariamente proporzionale linearmente con il tempo. Infatti: all’aumento
della distanza temporale, il numero di differenze non può accumularsi in maniera lineare. Più passa
il tempo, maggiore è la frazione di mutazioni che avvengono a siti già mutati e quindi non
aumentano (e a volte diminuiscono) la distanza.

21.1.1 METODI DI RAPIDA COMPUTAZIONE BASATI SULLE DISTANZA – NEIGHBOR JOINING


Non è un metodo che vedremo in dettaglio, ma ci interessa il fatto che questo metodo considera la
distanza media di ogni specie da tutte le altre.

21.2 METODI DELLA MASSIMA PARSIMONIA


 L’albero migliore è quello con il numero minore id cambiamenti (evolutivi, mutazioni, ecc.),
cioè quello più parsimonioso.
 Ci possono essere molte tipologie che implicano lo stesso numero di cambiamenti. Sono
tutte ugualmente valide.
 Poche assunzioni sul modello di evoluzione molecolare, trovo l’albero con il minor numero
di omoplasie;
 Ancora usato soprattutto per caratteri fenotipici;
 Funziona abbastanza bene se l’omoplasia è rara o distribuita casualmente sui diversi
rami;
 Tende a sottostimare la lunghezza dei rami.

Quali sono le basi logiche di questo criterio? Ovvero, perché l’albero con meno cambiamenti
dovrebbe essere quello corretto?
 Principio filosofico e teologico del 13. Secolo (Williamo of Ockham): tra diverse spiegazioni,
la più semplice è da preferire. Inutile ricorrere a molte assunzioni se posso spiegare
qualcosa con poche;
 Dio ha creato tutto, e Dio non avrebbe creato nulla di complesso se poteva fare la stessa
cosa in maniera semplice;
 La selezione naturale favorisce gli adattamenti rapidi, ossia in un numero minore di passi;
 Statisticamente, i cambiamenti evolutivi sono rari, quindi è improbabile che avvengano
molte volte.

21.2.1 PARSIMONIA E L’ALGORITMO DA APPLICARE AD OGNI TOPOLOGIA


Essenzialmente c’è un concetto importante che bisogna introdurre in questo tipo di metodo e che
varrà anche per i metodi successivi; ed è quello della applicazione dell’algoritmo a tutte le tipologie
possibili. Da un punto di vista teorico: se ho otto specie e centrotrenta mila tipologie possibili devo
calcolare il numero di cambiamenti in ognuna di queste tipologie e infine
scegliere l’analizzato con il minor numero di cambiamenti. Dunque non devo
ricostruire interamente l’albero ma devo valutare tutte le tipologie
possibili. I cambiamenti (come vediamo dall’immagine a sinistra) sono:
2 per il primo esempio, 3 per il secondo e il terzo. Seleziono come più
parsimonioso e quindi più probabile la topologia numero uno.
Otteniamo dunque: uno o più alberi
maggiormente parsimoniosi; le ipotesi
(dove e quando) sono accaduti i vari
cambiamenti per ogni carattere; la
lunghezza dei rami (in numero di
cambiamenti); e se si vuole, si possono
indagare alberi subottimali (con più cambiamenti rispetto a quello più parsimonioso). È necessario
analizzare tutte le tipologie? Infatti se abbiamo 20 specie il numero di tipologie da analizzare è
davvero alto, dunque la soluzione esatta diventa impossibile da stimare dal punto di vista
computazionale. Dobbiamo ricorre per forza alle soluzioni euristiche: analizziamo solo una parte
delle specie possibili, cioè quelle che pensiamo siano più vicine alla verità. Per esempio, il metodo
sequential addition è un valido albero di partenza filogenetico, iniziato da una tripletta casuale.
21.2.2 RIASSUMERE TANTI ALBERI UGUALMENTE PARSIMONIOSI
Se dovessimo alla fine ottenere degli alberi che hanno lo stesso numero di cambiamenti
(ugualmente parsimoniosi) come posso rappresentarli? Esiste un albero corretto secondo il criterio
della parsimonia, però posso decidere di rappresentare un albero che contenga più alberi corretti.
Il metodo sottostante viene chiamato consenso stretto tra due alberi ugualmente parsimoniosi.
Un'altra metodologia è il consenso con majority rule tra tre alberi ugualmente parsimoniosi, dove i
numeri sull’albero indicano la frequenza dei clade negli alberi ugualmente parsimoniosi:

21.3 METODI DI MASSIMA VEROSIMIGLIANZA E METODI BAYESIANI


Essenzialmente sono i metodi più utilizzati, e sono metodi statistici e precisi, ma anche molto lenti
dal punto di vista computazionale: il modello di evoluzione deve essere molto esplicito, cioè ci
devono essere formule matematiche che portano i parametri sul: rapporto tra mutazioni
trasversioni e transizioni, distribuzione dei tassi di mutazione lungo la sequenza, ecc. Quindi tutta
una serie di caratteristiche del modello molecolare di evoluzione deve essere esplicitata.
Il concetto di verosimiglianza è legato alla probabilità di osservare i dati (dato un certo
modello/ipotesi). Mentre il metodo bayesiano si basa sulla probabilità a posteriori.

Il concetto di verosimiglianza di un’ipotesi può essere espresso come:


'
V erosimiglianza di un ipotesi=L ( Likehood) =probabilità di osservare i dati D se è vera l ipotesi H;
In termini matematici può essere espresso come:

L ( H , D )=P r o b   ( D , H )=P ( D , H ) ,  d o v e   il  m o d e l lo   s p e c i f i c a  l a   f u n z io n e   P( D|H )

L’ipotesi che possiede la maggiore L, ossia il maggior valore di verosimiglianza, è quella da


preferire.

Un esempio:

Supponiamo di lanciare una moneta ed ottenere testa. La probabilità di osservare i dati (la moneta
caduta con il lato testa rivolto verso l’alto) varia con le ipotesi che posso fare sulla moneta stessa.

Se la moneta ha una testa e una croce, ed è equilibrata, allora vale:

P ( D , H 1 ) )=0.5

Se la moneta ha due teste, allora vale:

P ( D , H 2 )=1

21.3.1 LA VEROSOMIGLIANZA APPLCIA A RC


D = sequenza;
H = topologia e lunghezza dei rami;
Modello = modello evolutivo di sostituzione (ad esempio il modello che specifica come la basi
nucleotidiche mutino).
Dobbiamo trovare la topologia (con lunghezza dei rami) che massimizza la probabilità di generare
le sequenze che osservo, cioè l’albero con la massima verosimiglianza (likehood).
Attenzione a non confondere likehood con probabilità. La likehood di un albero non è la probabilità
che un albero sia quello vero [ P  ( H|D)] , ma la probabilità che quell’albero abbia originato i dati
che osserviamo [ P ( D , H )=L( H|D)] .
21.3.2 ACCENNI AI METODI BAYESIANI E BOOTSTAP PER TESTARE ROBUSTEZZA DELL’ALBERO,
GRUPPI E COSPECIAZIONE

Si veda “A biologis’s guide to Bayesian phylogenetic analysis” (Nature Ecology and


Evolution 2017).

 P ( H , D ) è la probabilità a posteriore
della tipologia e della lunghezza dei rami;
 P ( D , H ) è la verosimiglianza (già vista);
 P( H ) è la probabilità a priori della topologia e della lunghezza dei rami;
 P ( D )   p una costante che non deve essere calcolata grazie al
MCMC (metodo computazionale Monte Carlo Markov Chain, che permette di ottenere
campioni da una distribuzione di probabilità complessa);
Infine possiamo adottare il metodo bootstap, per testare la robustezza di un albero
filogenetico, gruppi e speciazione. I valori bootstap superiori all’80% indicano un supporto
molto forte, ma anche i valori >50% indicano che un gruppo è presente frequentemente negli
pseudo data set (altre combinazioni hanno valori sicuramente molto più bassi). Un supporto
basso non indica che il clade è sbagliato, ma solo che il supporto statistico è basso.

Potrebbero piacerti anche