Sei sulla pagina 1di 86

XVIII Taller Monográfico Biología

Molecular Básica Aplicada a la


Informática

Rodolfo Salas Lizana


Instituto de Ecología,
Universidad Nacional Autónoma de México
rsalas@ecologia.unam.mx
Hoy
I. Introducción a la evolución biológica
¿Qué es evolución biológica?
Origen de la variación
Genética de poblaciones

II. Evolución molecular


Teoría neutral de la evolución
molecular
Tasas de substitución
III. Evolución de genes y genomas
Origen de nuevos genes
El destino de los genes duplicados

Ejercicio Práctico: Tasas de substitución


en secuencias de ADN
¿Qué es Evolución?
Evolvere (lat.): Revelar o desarrollar
características potenciales y ocultas.

Actualmente se usa simplemente como


cambio

En un contexto biológico:
Cambio en las propiedades de grupos de
organismos a lo largo del tiempo
Evolución
El estudio de la evolución tiene dos
aproximaciones complementarias:

1.Describe los patrones de cambio en los


caracteres
• Entre genes, individuos,
poblaciones, especies o grandes taxa
• En tiempos diferentes o en lugares
diferentes
1.Explica las causas que dieron origen a
los patrones observados
Evolución
Existe un contínuo entre los procesos que
ocurren en

•escalas pequeñas (tiempo ecológico)–


microevolución
Ecología evolutiva
Genética de poblaciones
•y escalas muy grandes (tiempo evolutivo)—
macroevolución
Biología filogenética
Evo-devo
Evolución de alelos en las poblaciones
(genética de poblaciones)
1. Describir la variación genética observada
• Contextos diversos: espacial, temporal
y asociaciones con caracteres de
interés, etc

1.Inferir las causas que dieron origen a esa


variación
• Una combinación de las fuerzas
evolutivas: selección natural, deriva
genética, mutación, endogamia,
migración y recombinación

3. Estimar los parámetros asociados a las


inferencias
• ¿cuánto? ¿cuándo?
Para estudiar la dinámica poblacional de los
genes es común aislar cada una de las fuerzas
para considerar sus efectos.

Esto sólo es posible usando modelos


idealizados

El modelo más sencillo es el propuesto


independientemente por GH Hardy y W Weinberg
(1908)
Las poblaciones HW:
•Tamaño infinito
•Apareamiento aleatorio

•Poblaciones diploides, hermafroditas o con


sexos en igual proporción
•No hay ninguna fuerza evolutiva operando
•Generaciones discretas
Las poblaciones HW demuestran que:

1. Las frecuencias alélicas no cambian en


el tiempo
2. Toma un evento de apareamiento aleatorio
para que las frecuencias genotípicas
alcancen el equilibrio

•Matemáticamente demuestra que se pueden


obtener las frecuencias alélicas a partir
de las genotípicas y viceversa.
•Su utilidad, como en muchos otros modelos,
es la de proveer una hipótesis nula para
contrastar con datos reales.
Modelo mínimo HW
Un locus, A, con dos alelos, A1 y A2
Hay tres posibles genotipos:
Frecuencias de alelos
p q p + q = 1;
p = D + H/2
A1A1, A1A2 y A2A2
D + H + R = 1
D H R
Frecuencias de genotipos D = p2
H = 2pq
Gametas R = q2
A1 A2
producidas
A1 A1A1 A1A2
Cruzas
A1A2 A2A2 posibles
A2
Entonces, si las frecuencias alélicas y
genotípicas de las poblaciones HW no cambian,

¿qué las hace cambiar?

Cualquier proceso capaz de cambiar las


frecuencias alélicas y/o genotípicas
es llamado una fuerza evolutiva

Las fuerzas evolutivas son:


1. La deriva genética
2. La mutación
3. La selección natural
4. La migración
5. La recombinación
6. La endogamia
Endogamia Mutación

Variación
(variación genética observada)

Deriva
Migración genética
Selección
Natural
Para estudiar algunas de estas fuerzas,
utilizaremos un nuevo modelo:

Poblaciones Wright-Fisher (1930-31)

•Generaciones discretas
•Individuos haploides o dos subpoblaciones
de machos y hembras
•Todos los individuos tienen la misma
sobrevivencia y fecundidad (no hay SN)
•La población no tiene estructura geográfica
ni social
•Los genes en la población no recombinan
•El tamaño de la población es finito y
constante
La primera diferencia entre las poblaciones HW y
las WF da lugar a la primera fuerza evolutiva:

Deriva genética
(Genetic drift)

•Las poblaciones reales no son infinitas


•En las poblaciones finitas habrá cambios
aleatorios en las frecuencias alélicas

•La aleatoriedad viene de:


•Estocasticidad demográfica (no todos los individuos tienen hijos)
•Segregación mendeliana (en poblaciones
diploides y sexuales)
8 repeticiones

N = 50

p0 = 0.1

N = 10

http://darwin.eeb.uconn.edu/simulations/jdk1.0/drift.html
N = 50

p0 = 0.5

N = 10

http://darwin.eeb.uconn.edu/simulations/jdk1.0/drift.html
Características de la deriva:

1. Causa cambios aleatorios en la frecuencia


de los alelos (la evolución NO es repetible);
2. Se pierden alelos de la población
(disminuye la variación);
3. La dirección del cambio es neutral

La “fuerza” de la deriva depende del


tamaño de la población
La permanencia de un alelo en la
población depende de su frecuencia
inicial
Mutación
•La mutación introduce variación en las
poblaciones

•En cada generación, la probabilidad de que


exista un nuevo alelo depende de µ

•µ es la tasa espontánea de mutación

•La probabilidad de que una gameta experimente


una mutación es, por lo tanto:

2Nµ

En una población diploide de N individuos;


En una población haploide de 2N individuos
Mutación y deriva
•La mutación es opuesta a la deriva porque
introduce variación en las poblaciones

•Sin embargo, se puede alcanzar un equilibrio


entre ambas

•El equilibrio se alcanza cuando la tasa a


la que se pierden alelos por deriva es igual
a la tasa a la que nuevos alelos son generados
por la mutación

•La tasa de fijación de nuevos alelos (la tasa


de subtitución en secuencias de DNA) está
determinada por este balance (cuanto tarda en llegar a uno)
La probabilidad de fijación de una mutación neutra

En una población afectada por la deriva,


la probabilidad promedio de fijación de un
alelo es igual a su frecuencia inicial

La frecuencia inicial de una mutación en


una población es 1/2N

La mutación introduce, en promedio, nuevos


alelos a una tasa de 2Nµ

La tasa de substitución promedio, k


es el producto de la probabilidad de tener
nuevas mutantes y la probabilidad de que se
fije un alelo (su frecuencia inicial)
k =(1/2N)(2Nµ)

k = µ
La tasa promedio de fijación (de substitución)
de alelos neutros es igual a la tasa
espontánea de mutación.

Fundamento de la teoría neutral


de la evolución molecular
(Sueoka, Freese, Robertson, Kimura y Ohta,
Jukes y King)
Selección Natural

•La SN es la fuerza responsable de la


adaptación
•La SN puede alterar la frecuencia
de los alelos y de los genotipos en
una población.
•La SN es oportunista y determinista:
depende de la variación preexistente
y tiene una dirección.
La selección natural actúa cuando los
genotipos tienen diferentes
adecuaciones
(fitness).

La adecuación es un carácter, o grupo


de ellos, que confiere una cierta
ventaja en términos de supervivencia
y reproducción al individuo que los
porta.
El modelo fundamental
•Locus autosómico
•Especie hermafrodita (o con misma proporción
de sexos)
•Ciclo de vida sincrónico: apareamiento alea-
torio, selección, apareamiento aleatorio,
selección, etc.

Recién Selección Adultos


p nacidos p’
p p’

HW Una generación HW
Adecuación relativa
Genotipo: A1A1 A1A2 A2A2

A.absoluta: ω 11 ω 12 ω 22

Adecuación
relativa: 1 ω 12 /ω 11 ω 22 /ω 11

Adecuación
relativa: 1 1-hs 1-s

Donde 1-hs = ω 12 /ω 11 y 1-s = ω 22 /ω 11

S= coef.de selección

H= efecto del heterocigoto


s:coeficiente de selección.

Si s > 0, A2A2 tiene una adecuación menor que A1A1.


Si s < 0, A1A1 tiene una adecuación menor que A2A2.

Sin embargo, se asume generalmenet que s toma valores


entre 0 y 1.

h:el efecto del heterócigo.

h=0 A1 es dominante y A2 recesivo


h=1 A2 es dominante y A1 recesivo
0<h<1 dominancia incompleta
h<0 sobredominancia
h>1 subdominancia
h:el efecto del heterócigo.

Dominancia h=0 A1 es dominante y A2 recesivo


completa h=1 A2 es dominante y A1 recesivo
(casos
especiales)

0<h<1 dominancia incompleta


h=1/2:muchos alelos con poco efecto en la adecuación
actúan casi de manera aditiva; el heterócigo es efectiva_
mente intermedio entre los fenotipos homócigos.

h<0 sobredominancia
h>1 subdominancia
Tres tipos de selección

¿Cuál será el destino del alelo A1?

• p→1 (fijarse)
• p→0 (perderse)
• p→p^ (llegar a un valor intermedio)
• p→p (no cambiar)

El resultado depende de las relaciones


de dominancia (h) y de la frecuencia inicial
del alelo.
Selección direccional
(la que Darwin tenía en mente)

p→1 (se fija)

Ocurre con dominancia incompleta

0<h<1

La adecuación de A1A1 excede la de A1A2, que,


a su vez excede la de A2A2:
ω 11 >ω 12 >ω 22

Δsp>0, es decir, la tasa es positiva

La tasa de cambio de p (Δsp) depende de la


Selección direccional

p = 0.9
h = 0.500000000001 p = 0.5
s = 0.333333333333 p = 0.1
http://darwin.eeb.uconn.edu/simulations/selection.html
0.014

0.012

0.01
Deltasp

0.008

0.006
h = 0.5
0.004 s = 0.1
0.002

0
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
p

La selección direccional es lenta


cuando hay poca variación genética
(cuando p está cerca de cero o uno)
y es más efectiva cuando la variación
está en su máximo (en este caso, p = 0.5)
Selección balanceadora

h<0 (sobredominancia)
p→p^ (p llega a un valor intermedio)

Δsp>0 cuando p está cerca de cero y


Δsp<0 cuando p está cerca de 1
Δsp=0 cuando p alcanza el equilibrio:

^ = h-1
p
2h-1
Selección balanceadora

p = 0.9

^
p

p = 0.1

h = -3
s = 0.1111 ^ = 0.5714285
p

http://darwin.eeb.uconn.edu/simulations/selection.html
Selección balanceadora

p = 0.9
^
p

p = 0.1

h = -0.333333
s = 0.2727273 ^ = 0.8
p

http://darwin.eeb.uconn.edu/simulations/selection.html
Selección disruptiva
h > 1 (subdominancia)

El resultado de la selección depende de la


frecuencia inicial del alelo.

La frecuencia p desciende hasta cero si


p < p^
y la frecuencia p llega a 1 si
p > p^

donde
^ = h-1
p
2h-1
Selección disruptiva

p = 0.9

p = 0.5

p = 0.1

Si p = 0.9
h = 1.5 ^ ; se fija
p > p
s = 0.1666667 ^ = 0.25
p
Si p = 0.1
^ ; se pierde
p < p
http://darwin.eeb.uconn.edu/simulations/selection.html
La Selección Natural interactúa con otras
fuerzas evolutivas.

•La mutación genera la variación que la


Selección Natural precisa, pero
•La mutación puede restar poder a la
selección si es muy alta (cambiando incluso
alelos que conferían
alta adecuación)

•La deriva elimina la variación de las


poblaciones…
•La deriva define el destino de las nue_
vas mutaciones…
Selección natural y deriva genética

10 simulaciones, p = 0.01, N = 20, s = 0.2


Selección natural y deriva genética

10 simulaciones, p = 0.01, N = 50, s = 0.2


Selección natural y deriva genética

10 simulaciones, p = 0.01, N = 100, s = 0.2


Selección vs. deriva genética

•Son fuerzas equivalentes en tanto que


ambas pueden eliminar variación
•Son fuerzas opuestas porque una es aleatoria
y la otra es determinista

•La fuerza de la selección cambia con la


frecuencia del alelo
•Una copia de una mutación nueva tiene una
frecuencia de 1/2N

•La fuerza de la selección es


1/2N*s, que es menor a la fuerza de la deriva

•Si s >> 1/2N, la selección dominará a la


deriva para alelos con frecuencias intermedias

La mayor parte de la interacción entre


deriva y selección es al nivel de los alelos
raros
•Una nueva mutación con un 1% de ventaja
cuando es heteróciga, tiene sólo el 2% de
probabilidades de fijarse.

•1% de ventaja es selección fuerte

•En una población grande (N = 106), la


selección dominaría si p fuera moderada

•En otras palabras, el 98% de las mutaciones


ventajosas se perderían por deriva!

•¿y qué tal si se fijan alelos deletéreos?


Selección vs. deriva genética

100 simulaciones, p = 0.01, N = 5, s = 0.01


en contra del alelo A
Tasas de substitución:
Alelos neutrales k=2Nµ[1/(2N)]=µ teoria neutral= tasa de mutacion

Alelos seleccionados k=2Nµπ i[1/(2N)]

Alelos seleccionados k=4Nµ(1-h)s


a favor

2Nµs
Alelos deletéreos k =
e2Ns -1

Teoría casi neutral de la evolución


molecular (Tomoko Ohta)
We need a breake…
Evolución Molecular: Teoría Neutral

Variation neither useful nor injurious


would be affected by natural selection,
and would be left either a fluctuating
element, as perhaps we see in certain
polymorphic species, or would ultimately
become fixed, owing to the nature of the
organism and the nature of the conditions.

Charles Darwin, 1859


Non darwinian evolution

Frecuencias esperadas vs. Observadas


bajo el supuesto de evolución neutra
en las diferencias de aa en 53 proteinas
de mamíferos. La línea representa la
idealización esp=obs.
La teoría neutral de la evolución molecular
sostiene que, en secuencias de aa y DNA:

•Pocas mutaciones son ventajosas y


fijadas por la SN

•Muchas mutaciones son desventajosas y


son eliminadas por la SN

•La gran mayoría de las mutaciones


observadas son neutrales con respecto a
la adecuación y son mantenidas por la
deriva genética
La teoría neutral predice:

La existencia de un reloj molecular, tanto


con proteínas como con DNA

Las proteinas con funciones importantes


tienen tasas de substitución (por loci)
más bajas que las proteínas con funciones
menos importantes (aplica para aa y DNA)

La cantidad de polimorfismos en una


población depende de Ne y µ (Las poblaciones
más grandes conservan más polimorfismos que
las pequeñas)
Entre más tiempo haya transcurrido desde la
divergencia, se acumulan más substituciones en
el mismo sitio (multiple hits)

El reloj molecular no es universal


Las substituciones
seleccionadas modifican
la longitud de las
ramas en una
filogenia
La teoría neutral no siempre se cumple,
simplemente porque la selección, y otras
fuerzas evolutivas, ocurren simultáneamente
en las poblaciones en escenarios harto
complejos; sin embargo:

•La teoría neutral provee de una Hipótesis


nula que permite justamente probar que
la selección ocurrió en un determinado locus

•Los principios de la teoría neutral están


implícita o explícitamente en la inferencia
filogenética

•El reloj molecular es usado ampliamente


en biología evolutiva
Comparación de las tres teorías:
Fuerzas evolutivas al nivel molecular:

Hipótesis nula:
Evolución neutral
Hipótesis alternativas:
Selección natural: Selección purificadora (negativa)
Selección natural: Selección adaptativa (positiva)

Se ha encontrado que el 45% de las substituciones de aminoácidos


entre genes homólogos de Drosophila simulans y D. yakuba ha
sido adaptativa (Eyre-Walker, 2002)
Para la teoría neutral, el polimorfismo en las poblaciones es
transitorio.

En una misma proteína puede haber regiones completamente


neutrales o completamente sujetas a selección. La tasa de
evolución de una proteína se puede medir por la proporción de
sitios neutrales que contiene:

k = f0u

Donde u es la tasa de mutación y f0 la fracción de mutaciones


(o sitios) neutrales
La proporción de sitios neutrales se puede modificarse por
la función directa de la proteína

Pero también por la interacción con otras proteínas:

La interacción puede ser en la formación de n-meros,


porque están involucradas en la misma función o en la
misma ruta metabólica

Las redes de interacciones de genes comparadas entre genomas


completos son la fuente de información para probar esta
hipótesis
Hay una correlación negativa entre la tasa de evolución de
proteínas y el número de interacciones que tienen con otras proteínas
(Fraser et al, 2002)
Evolución por selección purificadora y selección
adaptativa

En selección purificadora (negativa):

f0< 1 y k < u

Cuando la selección purificadora es muy fuerte, sólo las


substituciones sinónimas son permisibles, no hay
substituciones al nivel de aminoácidos
Se aprovecha esta predicción para detectar
selección purificadora
en genes codificantes usando:

ω = kn/ks

Donde kn es la proporción de substituciones


no sinónimas por sitio no sinónimo y ks es
la proporción de substituciones
sinónimas por sitio sinónimo

En la selección purificadora hay valores


bajos de ω
Selección positiva Darwiniana (adaptativa):
Las subtituciones no sinónimas entre genes de pares de especies
exceden a las substituciones sinónimas

Esto ocurre comúnmente cuando hay diversificación en la


función de las proteínas (evolución adaptativa en una de ellas)

ω >1

Este tipo de evolución ha sido documentado en la evolución de


genes de resistencia a enfermedades (inmunoglobulinas y
citocinas), evasión del sistema inmune por parásitos y en
la formación de barreras a la reproducción
Evolución adaptativa de la
lisozima

(Kornegay et al., 1994)


Otros ejemplos de selección natural al nivel molecular:

FOXP2.- Los mutantes de este gene en humanos producen


defectos en habilidades del habla
4-6 substituciones de aminoácidos desde la divergencia de humanos
y chimpancés
1 substitución desde la divergencia del ratón y el ancestro de
los primates
MYH.-Este gene es responsable de la musculatura en la
mandíbula de los primates
En los humanos está inactivo por un corrimiento en el marco
de lectura
La ω en este gene es de 0.1 entre primates y casi 1 en humanos
Genes OR.- Son genes que producen receptores en el
sistema olfatotorio
Mientras en el ratón hay 1200 genes funcionales, en el humano
sólo hay 550
Modelos de substitución en secuencias de DNA

Jukes & Cantor- 1 parámetro

Cualquier nucleótido puede ser substituido


por otro con la misma probabilidad: α
pA(2) =(1-3α )pA(1) + α [1-pA(1) ]
JC

1.2

0.8

pii(t)
0.6
p

pij(t)

0.4

p=0.25
0.2

0
0 500000000 1000000000 1500000000 2000000000 2500000000
t(años)

α =1x10-9 subst/sitio/año
Kimura pondera las transiciones y las
transversiones en el modelo previo, por eso
tien dos parámetros
transiciones

transversiones

transversiones
tr
e s

an
on

sv
si

er
e r

si
sv

on
an

es
tr

transiciones
JC(punteadas)vs. K2P (sólidas),
X=Permanece, Y=Transición, Z=Transversión
Estimación de la tasa de substitución
Método de Jukes y Cantor (JC)
La probabilidad de que un par de secuencias
difieran en un sitio, en el tiempo t es:

Como el tiempo es un parámetro generalmente


desconocido, lo que se estima es K, el número de
substituciones entre un par de secuencias desde
su divergencia:

Donde p se asume como la proporción de


substituciones observadas
De una manera similar, el número de
substituciones por sitio, K, basado en el
modelo de dos parámetros de Kimra se obtiene:

Donde

Y P es la proporción de diferencias
transicionales y
Q es la proporción de diferencias
transversionales
Los métodos JC y K2P sólo son aplicables cuando:

*La proporción de cada nucleótido es


aproximadamente igual (~0.25)

*La tasa de mutación es homogénea a lo


largo de las secuencias

*Las secuencias no son codificantes


*Las proporciones diferentes de nucleótidos
pueden corregirse fácilmente pesando por
las diferentes frecuencias

*Las tasas heterogéneas se pueden incluir


añadiendo un parámetro más. Para JC la
corrección queda:

donde p es la proporción de diferencias entre


un par de secuencias y , que es
el parámetro alfa de una distribución gamma.
De la misma manera, la heterogeneidad en la
tasa de substitución entre sitios se
puede corregir en el modelo K2P:

Donde P y Q, son las porporciones de


transiciones y transversiones y a es el
parámetro alfa de la distribución gamma.
*Para secuencias codificantes hay muchos
métodos, éste es el de Li (1993):

1. Se dividen los sitios por codones


2. En cada codón se dividen los sitios por
el número de degeneraciones posibles
por sitio
3. Se ponderan las ti y las tv por cada
sitio definido
4. Se obtienen dos K’s: Kn y Ks; el número
de substituciones por sitio no-sinónimo
y el número de substituciones por sitio
sinónimo
5. La K total es la porporción de cada
una de las obtenidas en el paso anterior
ponderadas por el número de sitios
de cada categoría
Duplicación de genes

Ortología y paralogía en familias de genes


Evolución de genes y genomas
Duplicaciones de genomas completos y de genes indviduales

(Gu et al., 2002)


Duplicación en bloque

Genes del MHC, junto


con genes housekeeping
(COL) se encuentran
en el mismo orden en
3 diferentes cromosomas
de humanos

(Kasahara, 1997)
Tamaños de familias de genes en varias especies de
levaduras

Algunas familias parecen


ser “amplificadas”
adaptativamente
¿cuál es el destino de un par de genes duplicados?

•Divergir en secuencia y función

•Conservar función (y secuencia) por conversión


genética

•Conservar función (y constreñir la divergencia en


secuencia)

•Una copia pierde función (se hace pseudogene)


Evidencia de conversión de genes localizada y evolución
concertada en las globulinas de primates

(Tagle et al., 1991)


Patrones filogenéticos en tres modelos de duplicación de genes
Las duplicaciones generan, en un principio, redundancia (neutral)

La diversificación funcional de las copias puede darse en


dos escenarios diferentes:

1. Neofuncionalización
genes ECP y EDN de la familia de ribonucleasas, en
primates
2. Subfuncionalización
familia de genes hox (tienen que ver con el desarrollo
de vertebrados)
El modelo de
Duplicación
Degeneración
Complementación

(Prince and Picket, 2002)


Tasas de duplicación:

•Comparando genomas de varios genomas


eucariontes, se ha encontrado que ocurriría 0.01
duplicaciones por gene por millón de años

•Este número es más alto de lo que se pensaba y

quizás para algunos organismos sea un


sobreestimado
proxy del tiempo desde la divergencia

Potrebbero piacerti anche