Sei sulla pagina 1di 60

Dr.

Ricardo Salomn Torres


Facultad de Ingeniera - UABC
Bioingeniera.

La evolucin es la teora en que los grupos de organismos cambian con el


tiempo por lo que los descendientes difieren estructuralmente y
funcionalmente de sus antepasados. La evolucin tambin puede ser definida
como el proceso biolgico por el cual los organismos heredan caractersticas
morfolgicas y fisiolgicas que definen una especie.
El origen de las especies (1859, Charles Darwin), cita: Como muchos ms
individuos de cada especie nacen los que pueden sobrevivir; y como, en
consecuencia, hay una frecuente lucha recurrente de la existencia, se sigue
que todo ser, si vara, por un poco de cualquier manera provechoso para l
bajo las complejas y a veces variables de la vida, tendr una mejor
oportunidad de sobrevivir, y por lo tanto ser seleccionado de forma natural.
Desde el poderoso principio de la herencia, toda variedad seleccionada
tender a propagar su nueva y modificada forma".

La evolucin es un proceso de cambio. La herencia es generalmente


conservadora. los descendientes se parecen a sus padres y sin embargo,
la estructura y funcin del organismo cambia a lo largo de generaciones.
Hay tres mecanismos principales por los cuales pueden ocurrir cambios:
Las condiciones de crecimiento que afecten el desarrollo.
El mecanismo de la reproduccin sexual asegura el cambio de una
generacin a la siguiente.
La mutacin con seleccin, as como la deriva gentica puede producir
cambios en los genes y ms generalmente en los cromosomas.

A nivel molecular, la evolucin es un proceso de mutacin con la


seleccin. La evolucin molecular es el estudio de los cambios en los
genes y las protenas en todas las diferentes ramas del rbol de la vida.
Esta disciplina tambin utiliza datos de los organismos actuales para
reconstruir la historia evolutiva de las especies.
La filogenia es la inferencia de relaciones evolutivas. Tradicionalmente, la
filogenia se evalu mediante la comparacin de las caractersticas
morfolgicas entre los organismos de una variedad de las especies. Sin
embargo, la secuencia de datos moleculares tambin se pueden utilizar
para el anlisis filogentico. Las relaciones evolutivas que se infieren, que
generalmente se representan en forma de un rbol, pueden proporcionar
hiptesis de acontecimientos biolgicos pasados.

Metas de la Filogentica Molecular


Todas las formas de vida comparten un origen comn y son parte del rbol
de la vida. Ms del 99% de todas las especies que han existido se han
extinguido.
Un objeto de la filogenia es deducir los rboles correctos para todas las
especies de vida. Histricamente, los anlisis filogenticos se basan en
caractersticas fcilmente observables, tales como la presencia o ausencia
de alas o de una mdula espinal. Recientemente, los anlisis filogenticos
se basan en datos de secuencias moleculares que definen familias de genes
y protenas. Otro objeto de la filogenia es inferir o estimar el tiempo de
divergencia y la ltima vez que entre los organismos compartieron un
ancestro comn.
Mientras que el rbol de la vida ofrece una metfora atractiva, la evolucin
no se basa en que necesariamente exista un solo rbol. En lugar de ello, la
evolucin se basa en un proceso de mutacin y seleccin.

Metas de la Filogentica Molecular


Un rbol real representa los eventos verdaderos e histricos ocurridos en la
evolucin. Es esencialmente imposible generar un verdadero rbol. En lugar
de ello, generamos rboles que representan una versin hipottica de los
acontecimientos histricos. Tales rboles describen una serie de eventos
evolutivos que se infieren a partir de los datos disponibles, en base a algn
modelo.
Sin embargo, tambin es til para ver ortlogos y parlogos en un contexto
evolutivo. Hemos aplicado una variedad de enfoques para estudiar las
relaciones de las protenas mediante:
Alineamiento por pares utilizando las matrices de puntuacin.
Bsquedas con BLAST, y
Alineacin de secuencias mltiples.

Metas de la Filogentica Molecular


Todos estos enfoques se basan en modelos evolutivos para tener en cuenta
las similitudes observadas y las diferencias entre las secuencias
moleculares.
Una mutacin puntual aceptada en una protena es una sustitucin de un
aminocido por otro, aceptado por la seleccin natural. Es el resultado de
dos procesos distintos: la primera, es la aparicin de una mutacin en la
parte de la plantilla gen al producir un aminocido de una protena; el
segundo es la aceptacin de la mutacin de la especie en la nueva forma
predominante.

Metas de la Filogentica Molecular


La filogentica puede responder a preguntas como:

Cuntos genes estn relacionados con mi gen favorito?


Qu tan relacionadas estn las ballenas y delfines con las vacas?
Dnde y cundo se origin el VIH u otros virus?
Cul es la historia de la vida en la tierra?
Fue la extinta quagga ms como una cebra o un caballo?

En este captulo, utilizamos mltiples alineamientos de secuencias de


protenas (o ADN o ARN) para generar rboles filogenticos. Estos rboles
proporcionan una visualizacin de la evolucin en la historia de las
secuencias moleculares.

Trasfondo histrico.
Histricamente, los globinas han sido una de las familias de protenas ms
importantes para nuestra comprensin de la bioqumica y la evolucin
molecular, desde la identificacin de la hemoglobina en la dcada de 1830 y la
mioglobina en los aos 1860 para su cristalizacin en el siglo XIX con el
propsito de los estudios comparativos entre especies.
Estos estudios se centraron en dos aspectos de los rboles filogenticos. En
primer lugar, los rboles pueden representar la relacin de subfamilias de
protenas particulares, tales como las globinas alfa, beta, globinas y
mioglobinas. En segundo lugar, los rboles pueden representar la relacin de
las especies, proporcionando inferencias acerca de la historia de la evolucin
de formas de vida, as como la historia de los genes y productos gnicos.

Trasfondo histrico.

Utilizando
el
software
MEGA y las secuencias de
protenas en el archivo 7.1,
obtendremos el siguiente
rbol.

Trasfondo histrico.
La insulina es una pequea
protena secretada por las
clulas
de
los
islotes
pancreticos que estimulan la
captacin de glucosa en los
receptores de la insulina en las
clulas musculares y hepticas.

Trasfondo histrico.

0.1 x 10-9

Nmero de substitucin
de nucletidos por
lugar y ao.

0.1 x 10-9
1 x 10-9

Hiptesis del Reloj Molecular


En la dcada de 1960, las secuencias se acumularon para abundantes protenas, tales
como hemoglobinas, citocromo c, y fibrinopptidos en una variedad de especies.
Algunas protenas, tales como citocromo c de muchos organismos, se encontraron
que evolucionaban muy lentamente, mientras que otras familias de protenas
acumulaban muchas sustituciones. Emil Zuckerkandl y Linus Pauling (1962), as como
Emanuel Margoliash (1963) proponen el concepto de un reloj molecular. Esta
hiptesis afirma que para cada gen dado (o protena), la tasa de evolucin molecular
es aproximadamente constante en todos los linajes evolutivos.
La forma en la que se calcularon las tasas de mutacin fueron con la siguiente
ecuacin, donde m es el numero total de aminocidos que tuvieron un cambio en un
segmento de 100 aminocidos y n es el numero observado de aminocidos cambiados
en 100 residuos.

N = 1 e-(m/100)
100

Conclusiones de la Hiptesis del Reloj Molecular


Para cada protena, los datos se encuentran en una lnea recta. Esto sugiere que
la tasa de cambio de la secuencia de aminocidos se ha mantenido constante
para cada protena.
Las tasas promedio de cambio son muy diferentes para cada familia de
protenas. Por ejemplo, fibrinopptidos evolucionan con una tasa mucho ms
alta de sustitucin. El tiempo (en millones de aos) para un cambio de 1% en la
secuencia de aminocidos que se produzca entre dos lneas divergentes de la
evolucin es 20 MA para el citocromo c, 5.8 MA para la hemoglobina, y 1.1 MA
para fibrinopptidos.
Las variaciones observadas en la velocidad de cambio entre las familias de
protenas reflejan las limitaciones funcionales impuestas por la seleccin natural.

Hiptesis del Reloj Molecular


La tasa de sustitucin de aminocidos se mide por el nmero de sustituciones
por sitio y aminocido por ao
La mutacin es el proceso bioqumico que da como resultado un cambio en
la secuencia. Por ejemplo, una polimerasa de copias de ADN (o ARN) con una
tasa de mutacin particular. La sustitucin es el cambio observado en
secuencias de cido nucleico o protena (por ejemplo, entre las diversas
histonas). Las sustituciones observadas que se corrigen en una poblacin se
producen a una tasa que refleje tanto la mutacin y la seleccin, el proceso
por el cual los personajes son seleccionados a favor (o en contra) en la
evolucin. Si la tasa de mutacin de las polimerasas entre los genes de un
organismo es relativamente constante, la variacin en las tasas de
sustitucin entre esos genes puede ser debido principalmente a la seleccin
positiva o negativa.

Hiptesis del Reloj Molecular


Una implicacin importante de la hiptesis del reloj molecular es que si las
secuencias de protenas evolucionan a tasas constantes, entonces pueden ser
usados para estimar el tiempo en que las secuencias divergen. De esta manera las
relaciones filogenticas se pueden establecer entre organismos. Esto es anlogo a
las fechas que se establecen de los especmenes geolgicos mediante la
desintegracin radiactiva.
Como una aproximacin prctica para probar si una secuencia tiene un
comportamiento de reloj molecular, podemos usar la prueba de tasa relativa de
Tajima (1993). Para las secuencias A, B, y C de la misma protena o ADN / ARN a
partir de tres especies, sean A y B dos especies de las que se quiere comparar las
tasas relativas de evolucin. Sea C una secuencia de un grupo afuera. La prueba de
Tajima determina si se acelera la evolucin en los linajes A o B, en el caso de que se
rechacen las hiptesis nula, A y B representan tasas de evolucin de la igualdad.
Dado que el nmero observado de sustituciones en la secuencia de pares AB, AC y
BC podemos inferir distancias OA, OB, y OC y as probar la hiptesis nula de que las
tasas relativas OA y OB son iguales.

Hiptesis del Reloj Molecular


Una prueba de velocidad relativa para determinar si dos secuencias siguen la hiptesis del
reloj molecular de aproximadamente tasas constantes de aminocido o sustitucin de
nucletidos en el tiempo evolutivo.
Tajima (1993) propuso una prueba de velocidad relativa para determinar si la protena o
cido nucleico a partir de secuencias de dos organismos (A y B) han evolucionado a una
relativa similar tasa. A y B comparten un ancestro comn (O), y la secuencia de un grupo
afuera (C) es conocida. Al medir las tasas de sustitucin AB, AC y BC es posible inferir las
tasas de OA y OB y para llevar a cabo una prueba de chi cuadrado (x2) para determinar si
estas tasas son comparables (la hiptesis nula) o si un linaje ha evolucionado a un ritmo
acelerado o desacelerado respecto, violando de esta manera el comportamiento de un
reloj molecular.
Prueba de la tasa relativa de Tajima se implementa en el programa de software MEGA
(Tamura et al, 2007;. Kumar et al, 2008.).

Hiptesis del Reloj Molecular


Prueba de la tasa relativa de Tajima se implementa en el programa de software MEGA
(Tamura et al, 2007;. Kumar et al, 2008.).

Seleccin Positiva y Negativa


Teora de la evolucin de Darwin sugiere que, a nivel fenotpico, se
seleccionan rasgos en una poblacin que mejoran la supervivencia (seleccin
positiva), mientras que los rasgos que reducen la aptitud son seleccionados
en contra (seleccin negativa). Por ejemplo, entre un grupo de jirafas
millones de aos en el pasado, esas jirafas que tenan ya cuellos fueron
capaces de llegar ms alto follaje y fueron ms reproductivamente exitosos
que sus miembros del grupo ms corto de cuello, es decir, no hubo seleccin
positiva para la altura.

Seleccin Positiva y Negativa


A nivel molecular, un punto de vista evolutivo convencional es que la seleccin
positiva y negativa tambin operan sobre secuencias de ADN. Un gen que
codifica una enzima se puede duplicar y luego los cambios de nucletidos
subsiguientes pueden permitir que uno de los genes duplicados codifiquen una
enzima con una nueva funcin que es ventajosa y por lo tanto seleccionado.
Hace unos 25 millones de aos, el gen de la lisozima se duplico y asumi una
nueva funcin digestiva en el estmago en el ancestro de cabras, vacas y
ciervos. La aparicin de esta nueva funcin se produjo de forma independiente
en los monos comedores de hojas. En cada uno de estos casos la tasa de
sustitucin de aminocidos aument debido a la seleccin positiva cuando la
lisozima asume una nueva funcin.

Seleccin Positiva y Negativa


Hay varias formas de evaluar si la seleccin se ha producido en la secuencia
de datos. Un enfoque se basa en el hecho de que la porcin de ADN que
codifica para una protena puede tener sustituciones tanto sinnimas y no
sinnimas.
Para un cambio de nucletido en un codn dado, una sustitucin sinnima
no da lugar a un cambio en el aminocido que se especifica.
Una sustitucin no sinnima hace cambiar el aminocido que se especifica.

Seleccin Positiva y Negativa

Seleccin Positiva y Negativa


La comparacin de las tasas de sustitucin no sinnimas por sitio no sinnimos (dN)
frente a la sustitucin sinnimo por sitio sinnimo (dS) puede revelar evidencia de
seleccin positiva o negativa. Si dS es mayor que dN, esto sugiere que la secuencia de
ADN est bajo seleccin negativa o depurar. La seleccin negativa es la seleccin que
limita el cambio en una secuencia de aminocidos correspondiente; esto ocurre cuando
algn aspecto de la estructura y/o funcin de una protena es crtica y no puede tolerar
sustituciones. Cuando dN es mayor que dS, esto sugiere que se produce la seleccin
positiva. Un ejemplo de seleccin positiva es cuando un gen duplicado est bajo presin
de seleccin para desarrollar nuevas funciones.
Veamos un ejemplo con MEGA y el archivo 7.5
Otro ejemplo con SNAP y en archivo 7.3
http://www.hiv.lanl.gov/content/sequence/SNAP/SNAP.html
Un ejemplo mas en http://www.datamonkey.org/

Teora neutral de la evolucin molecular


Hay una enorme cantidad de polimorfismos de ADN en todas las especies
que es difcil explicar por la seleccin natural convencional. Los
polimorfismos de nucletido simple (SNP), son una forma muy comn de
polimorfismos que no parece estar bajo la seleccin en la mayora de los
casos. Del mismo modo, muchas variantes de nmero de copias
cromosmicas ocurren en individuos aparentemente normales. Estos
implican mltiples regiones de hasta millones de pares de bases de ADN
que se eliminan o se duplican y la mayora de las variantes de nmero de
copias parecen ser espordicos, benignos, y no bajo la presin selectiva
positiva o negativa.

Teora neutral de la evolucin molecular


Motoo Kimura propuso un modelo diferente para explicar la evolucin a nivel
del ADN. Seal que la tasa de los promedios de sustitucin de aminocidos
aproximadamente tienen un cambio por 28x106 aos para las protenas de
100 residuos. Se estima, adems, que la tasa correspondiente de sustitucin
de nucletidos debe ser extremadamente alto (un par de bases de ADN se
sustituye en el genoma de una poblacin cada 2 aos en promedio).
La mayora de las sustituciones de ADN observadas deben ser neutras o casi
neutras, y que la causa principal del cambio evolutivo (o variabilidad) en el
nivel molecular es la deriva aleatoria de alelos mutantes. La mayora de las
mutaciones no sinnimas son perjudiciales, y por lo tanto no se observan
como sustituciones en la poblacin. Bajo este modelo, llamado la teora
neutral de la evolucin, la seleccin darwiniana positiva juega un papel muy
limitado. De hecho, la existencia de un reloj molecular tiene sentido en el
contexto de la hiptesis neutra porque la mayora de las sustituciones de
aminocidos son neutrales.

Propiedades de los arboles filogenticos

Filogenia molecular es el estudio de las relaciones evolutivas entre organismos o


entre molculas utilizando las tcnicas de la biologa molecular. Muchas otras tcnicas
se utilizan para estudiar la evolucin, incluyendo la morfologa, la anatoma, la
paleontologa y la fisiologa. Nos centraremos en los rboles filogenticos utilizando
datos de secuencias moleculares. Comenzamos con una explicacin de la
nomenclatura utilizada para describir los rboles.
Hay dos tipos principales de informacin inherente a cualquier rbol filogentico: la
topologa y las longitudes de las ramas. Es necesario introducir una variedad de
trminos que son utilizado para caracterizar los rboles.

Propiedades de los arboles filogenticos


Un rbol filogentico es un grfico
compuesto por ramas y nodos. Slo una
rama (tambin llamado un borde)
conecta dos nodos. Los nodos
representan las unidades taxonmicas
(taxones o taxones); el nodo (del latn
para "nudo") es el punto de dos o ms
ramas de interseccin o de terminacin.
Para nosotros, los taxones sern
tpicamente las secuencias de protenas.
Una unidad taxonmica operacional
(OTU) es un taxn existente presente en
un nodo externo, o de la hoja; la UTO
son las secuencias de cidos nucleicos o
protenas disponibles que estamos
analizando en un rbol.

Propiedades de los arboles filogenticos


Cada rbol se compone de cinco OTUs (denominados A, B, C, D, y E). Estos cinco OTUs
definen cinco nodos externos. Adems, hay nodos internos en las posiciones F, G, H e I.
Cada nodo interno representa un antepasado inferido de la OTU.

Clade ABF (monophyletic group)

Clade ABF/CDH/G

F
1

2 G

H 2 C
1
6

2 G

H 2 C
1
6

E
time

D
E

time

Un nodo interno est bifurcado si tiene slo dos linajes descendientes inmediatos
(ramas). Cualquier rama que se puede dividir en dos o mas ramas hijas. Un rbol se
multifurca si tiene un nodo con ms de dos descendientes inmediatos. Un clado es un
grupo de todos los taxones que se han derivado de un ancestro comn ms el mismo
antepasado comn. Un clado tambin se llama un grupo monofiltico.

Ejemplos prcticos de un clado.

Races de los arboles filogenticos.


Un rbol filogentico tiene una raz que representa un ancestro comn ms reciente de
todas las secuencias. A menudo, esta raz no se conoce hoy en da, y algunos algoritmos
de decisiones de los rboles no proporcionan conjeturas acerca de la colocacin de una
raz. La alternativa a un rbol con raz es un rbol sin races. Un rbol sin races especifica
las relaciones entre las UTOs. Sin embargo, no define el camino evolutivo por completo
o hace suposiciones acerca de sus antepasados comunes.

Races de los arboles filogenticos.


La figura muestra un rbol binario con cinco
OTUs que es, ya sea sin raz (Fig. a) o con
raz (Fig. b). Las UTOs (taxones existentes,
hojas) estn numeradas del 1 al 5. Algunas
OTUs se pueden intercambiar sin alterar la
topologa del rbol, como 4 y 5, ya sea en el
rbol. Una regla es que las OTUs o Clados
que comparten un nodo ancestral
inmediato se pueden girar en ese nodo.
Pero otros no se pueden intercambiar, como
1 y 2. Tenga en cuenta que en un rbol sin
raz la direccin del tiempo es
indeterminado.

Races de los arboles filogenticos.


La principal forma de raz un rbol es especificar un grupo afuera. En la fig. c,
imaginemos que las secuencias de 1 a 5 son mioglobinas ortlogas de mamferos y
que se obtiene la secuencia de una protena bacteriana o un invertebrado
homlogo (OTU 6). Esta secuencia de invertebrados se deriva claramente de un
ancestro comn que es anterior a la aparicin de todos los dems UTOs. Por lo
tanto, se puede utilizar para definir la ubicacin de la raz.

Enumerando arboles filogenticos y seleccionando estrategias de bsqueda


El nmero de rboles posibles para describir las relaciones de una docena de
secuencias de protenas es asombrosamente grande. Es importante conocer el
nmero de rboles posibles para cualquier rbol. Slo hay un "verdadero" rbol que
representa el camino evolutivo por el cual las secuencias moleculares (o incluso
especies) evolucionaron. El nmero de rboles posibles es til para decidir qu
algoritmos de rbol de decisiones para aplicar.
Arboles sin Raz.

Nu =

(2n-5)!
2n-3(n-3)!

Arboles con Raz.

Nr =

(2n-3)!
2n-2(n-2)!

Enumerando arboles filogenticos y seleccionando estrategias de bsqueda

Nmero de posibles rboles con races y sin races

Enumerando arboles filogenticos y seleccionando estrategias de bsqueda


A. Con dos UOTs, slo hay un rbol posible.
B. Para tres taxones, es posible construir ya sea un rbol sin races o tres rboles con
races diferentes

Enumerando arboles filogenticos y seleccionando estrategias de bsqueda

Para cuatro OTUs (4 secuencias alineadas):


a) 3 posibles arboles sin raz.
b) 15 posibles arboles con raz.
Pero de todos estos, solo uno es un rbol
Real, en el cual su topologa describe el
Proceso evolutivo, por el cual esas secuencias
Evolucionaron.

Enumerando arboles filogenticos y seleccionando estrategias de bsqueda


Una bsqueda exhaustiva examina todos los rboles posibles y selecciona el que
tiene las caractersticas ms ptimas, como la suma total ms corta de las
longitudes de las ramas. Un lmite prctico importante se alcanza a alrededor de 12
secuencias, para el que hay ms de 6.5x108 posibles rboles sin races y 1.3x1010
rboles con raz.
Algunos algoritmos de piden por lo menos 12 secuencias para realizar una
construccin de arboles optima, mediante una bsqueda exhaustiva.

Especies de Arboles contra arboles Gene/Proteina.


El anlisis de la evolucin de protenas
puede ser complicado en el momento en
que dos especies se separaron. La
especiacin, el proceso por el cual dos
especies nuevas se crean a partir de una
nica especie ancestral, se produce
cuando las especies se vuelven
reproductivamente aisladas (Figura). En
los rboles filogeneticos, un nodo
interno representa un evento de
especiacin. Por En un rbol de genes (o
rbol de protena), un nodo interno
representa la divergencia de un gen
ancestral en dos genes nuevos (o
protenas) con secuencias distintas.

Especies de Arboles contra arboles Gene/Proteina.

Software Filogenetico PAUP puede reconstruir


de ADN o secuencias de protenas ancestrales
que estn presentes en un nodo de inferidos

Especies de Arboles contra arboles Gene/Protena.

En una poblacin genticamente polimrfica, eventos de duplicacin de genes


pueden ocurrir antes o despus de la especiacin. Un rbol de protena (o gen)
difiere de un rbol de especies en dos maneras:
(1) La divergencia de dos genes de dos especies pueden haber precedido el
evento de especiacin. Esto puede causar sobreestimacin de longitudes
de rama en un anlisis filogentico.
(2) La topologa del rbol de genes puede diferir de la de las especies de
rboles. En particular, puede ser difcil de reconstruir una especie de rbol
de un rbol de genes.

Arboles de ADN, ARN y basados en protenas.


El estudio de ADN es ms informativo que la protena. Hay varias razones para esto:

El ADN permite el estudio de tasas de mutacin sinnimas y no sinnimas.

Cambios en el ADN incluyen los que se observa directamente en una alineacin,


tales como sustituciones de un solo nucletido, sustituciones secuenciales, y las
sustituciones coincidentes.

Regiones no codificantes pueden ser analizados usando la filogenia molecular. Para


algunas porciones de ADN no codificador, hay poca presin evolutiva para conservar
la secuencia de nucletidos.

Los pseudogenes se han estudiado utilizando filogenia molecular, por ejemplo para
estimar la tasa neutral de la evolucin. Por definicin, los pseudogenes no codifican
protenas funcionales.

Arboles de ADN, ARN y basados en protenas.

Mientras que el anlisis de ADN puede ofrecer muchas ventajas, a veces


es preferible estudiar las protenas para el anlisis filogentico. La
distancia evolutiva entre dos organismos pueden ser tan grande que
pueden ocurrir en muchos sitios todos los posibles cambios de
nucletidos (incluso varias veces), por lo que esa seal filogentica se
pierde. Las protenas tienen 20 estados (aminocidos) en lugar de slo
cuatro estados de ADN, por lo que es una seal filogentica ms fuerte.

Anlisis filogentico molecular se puede dividir en cinco etapas:


(1) Seleccin de secuencias para el anlisis.
(2) Alineacin de secuencias mltiples.
(3) La especificacin de un modelo estadstico de nucletidos o
evolucin de aminocidos.
(4) La generacin de rboles, y
(5) Evaluacin rbol.

Etapa 1: Adquisicin de la secuencia.


Las secuencias de inters pueden ser adquiridas en formato FASTA de
cualquiera de los sitios oficinas, como los resultados que arroja BLAST y las
secuencias de una gran variedad de bases de datos que hasta ahortia hemos
visto.
Para ARN, estas bases de datos puede ser Rfam y la base de datos ribosomal.
Para las protenas, estas bases de datos incluyen Pfam e InterPro.
Para los virus, se incluyen las bases de datos de referencia para el virus de la
inmunodeficiencia humana y hepatitis Virus C.
http://hcv.lanl.gov

Etapa 2: Alineamiento de secuencias mltiples

[1] Confirme que todas las secuencias sean homlogas


[2] Realiza ajustes con GAPs y penalizaciones segn sea necesario
para optimizar la alineacin.
[3] Restringe el anlisis filogentico de las regiones de
alineamiento mltiple de secuencias para las datos que estn
disponibles para todos los taxones.

Etapa 3: Modelos de sustitucin de aminocidos y de ADN

transition

transversion

transversion

C
transition

Etapa 3: Modelos de sustitucin de aminocidos y de ADN


Para los mtodos basados en la distancia, se utilizan modelos estadsticos
para estimar el nmero de cambios de ADN o de aminocidos que se
produjeron en una serie de comparaciones por pares de secuencias. El
enfoque ms simple para definir la relacin de un grupo de nucletidos (o
aminocidos) es alinear secuencias por pares de secuencias y contar el
nmero de diferencias. El grado de divergencia es llamado a veces la
distancia de Hamming.
Entrar al Software MEGA, trabajar con nucletidos y aminocidos, observar
los resultados en:
La opcin de estadsticas.
Calcular la distancia por pares para obtener:
El numero de diferencias, la distancia-P y la correccin de Poisson.
utilizando el archivo 7.1

Etapa 3: Modelos de sustitucin de aminocidos y de ADN

Entrar al Software MEGA y construir un rbol filogentico, reutilizando


Los datos cargados en memoria de aminocidos y generar los arboles:
Con correccin de Poison
Con correccin p-distance
Podemos jugar con las opciones que se nos indica en el algoritmo del
Mtodo estadstico Neighbor-joining.

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Hay muchas maneras de construir un rbol filogentico, pero consideraremos cuatro
mtodos principales para hacer rboles: los mtodos basados en la distancia, mxima
parsimonia, mxima verosimilitud e inferencia bayesiana.
Mtodos basados en la distancia comienzan mediante el anlisis de alineamientos
por pares de las secuencias y el uso de esas distancias para inferir la relacin entre
todos los taxones.
Mxima Parsimonia es un mtodo basado en caracteres en el que se analizan
columnas de los residuos en una alineacin de secuencias mltiples para identificar
el rbol con las longitudes cortas totales de las ramas que pueden explicar las
diferencias de caracteres observados.
Mxima Verosimilitud y la Inferencia Bayesiana son enfoques estadsticos
basados en modelos en los que se infiere el mejor rbol que puede dar cuenta de
los datos observados.

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Algunos algoritmos para la construccin de arboles filogenticos son:

PAUP (Phylogenetic Analysis Using Parsimony).


MEGA (Molecular Genetic Evolutionary Analysis).
PHYLIP (the PHYLogeny Inference Package)
TREE-PUZZLE.
MrBayes .

PAUP posee una interfaz especialmente fcil de usar para la plataforma Macintosh,
aunque es un paquete comercial. Los otros son de libre disposicin. MEGA
es particularmente atractivo para la plataforma PC. PHYLIP es quizs el ms
popular programa, y es de lnea de comandos impulsado sin una interfaz grfica de
usuario accesible.

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Mtodos basados en la distancia.
Comienzan con la construccin de un rbol mediante el clculo de las distancias
por pares entre las secuencias moleculares. Una matriz de puntuaciones de
pares para todas las protenas alineadas (o secuencias de cidos nucleicos) se
utiliza para generar un rbol. El objetivo es encontrar un rbol en el que las
longitudes de rama corresponden lo ms estrechamente posible a las distancias
observadas. Los principales mtodos basados en la distancia incluyen el
mtodo de grupo de pares no ponderados con media aritmtica (UPGMA) y
neighbor-joining (NJ). Mtodos basados en la distancia de la filogenia son
computacionalmentes rpidos, y por lo tanto son particularmente tiles para el
anlisis de un mayor nmero de secuencias (por ejemplo, 50 o 100).

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Mtodo UPGMA

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Mtodo Neighbor-Joining

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Mxima Parsimonia.
La palabra parsimonia (del latn, "de sobra") se refiere a simplicidad de
supuestos en una formulacin lgica.

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Mxima Verosimilitud
Est diseado para determinar las longitudes de topologa de rbol y ramas que
tienen la mayor probabilidad de producir el conjunto de datos observado. Una
probabilidad se calcula para cada residuo en una alineacin, incluyendo algunos
modelo del proceso de sustitucin de nucletidos o de aminocidos. Es uno de los
mtodos intensivos pero ms flexibles ms computacionalmente disponibles.
Mtodos de mxima parsimonia a veces fallan cuando hay grandes cantidades de
cambio evolutivo en diferentes ramas de un rbol. Mxima verosimilitud, en
cambio, ofrece un modelo estadstico para el cambio evolutivo que vara a travs
de las ramas.

http://www.tree-puzzle.de/

Etapa 4: Mtodos Filogenticos para construccin de un rbol.


Inferencia Bayesiana.
MrBayes es un programa para la inferencia bayesiana a travs de una
amplia gama de modelos filogenticos y evolutivos. MrBayes utiliza la
cadena de Markov Monte Carlo (MCMC) para estimar la distribucin
posterior de los parmetros del modelo.

http://mrbayes.sourceforge.net/

Etapa 5: Evaluacin del rbol


Despus de haber construido un rbol filogentico, cmo se puede
evaluar su exactitud? Los principales criterios por los que la precisin
puede evaluarse son la consistencia, eficiencia y robustez. Uno puede
estudiar la precisin de un mtodo de generacin de rboles o la precisin
de un rbol en particular.
Bootstrapping no es una tcnica para evaluar la precisin de un rbol. En su
lugar, se describe la robustez de la topologa de rbol.
Un rbol se genera a partir del conjunto de datos al azar. A continuacin, se
generan un gran nmero de repeticiones de arranque; tpicamente, entre
100 y 1,000 nuevos rboles se hacen por este proceso. Los rboles de
arranque se comparan con el rbol inferido(s) original. La informacin que
se obtiene de bootstrapping es la frecuencia con la que se observa cada
clado en el rbol original.

Etapa 5: Evaluacin del rbol


En el 100% (bootstrapping), en caballos, perros, y globina alfa canguro fueron
apoyados como miembros de un clado. Sin embargo, el clado que contiene el caballo y
el perro fue apoyado en slo el 52% de las repeticiones de arranque. Esto significa que
en el 48% de los rboles de arranque se unieron a ese grupo de protenas, y podemos
inferir que no hay un fuerte apoyo a un grupo relacionado caballo/perro que comparte
un ancestro con la protena de canguro. En general, el arranque puede proporcionar
una medida de lo bien apoyado que una topologa de rbol inferido se encuentra sobre
muestreos repetidos del conjunto de datos.

Determine si la secuencia de ADN mitocondrial en humanos y chimpancs


tienen las tasas de evolucin iguales entre linajes. Para ello, utilice la prueba de
velocidad relativa de Tajima como se aplica en MEGA y el archivo 7.12 con
secuencias de ADN mitocondrial de humanos, chimpancs,
bonobo,
orangutn, gorila, y el gibn.
Con estas mismas secuencias realizar pruebas de evaluacin del rbol
(bootstrapping) para 100, 500 y 1000 repeticiones.
Repetir estos ejercicios para ADN y Aminocidos.
Fecha de entrega: 12 de Octubre.

Potrebbero piacerti anche