Sei sulla pagina 1di 12

Introduccin a la Bioinformtica, prctica 3: Creacin de rboles filogenticos.

Introduccin
En esta prctica conoceremos los fundamentos de los anlisis filogenticos por medios informticos. Principalmente cubriremos el uso de algunas de las herramientas bioinformticas ms conocidas y la manera de crear filogramas y cladogramas con ellas.
Para seguir adelante con esta prctica, es fundamental que conozca la manera de recuperar secuencias y cmo crear alineamientos mltiples con estas. Si encuentra alguna dificultad en esto, por favor remitase a las dos prcticas anteriores: BLAST y recuperacin de secuencias biolgicas, Alineamiento mltiple e identificacin y bsuqeda de motivos.

Nota: estas prcticas se basan en la premisa de que se conoce el marco terico general sobre el cual stas se basan, de esta manera no se pretende que estas prcticas sean un tutorial en s mismas, sino ms bien un complemento fundamental para poner en prctica los conceptos recibidos en las clases tericas. Sin embargo, eventualmente encontrar descripciones y explicaciones de conceptos que as lo requieran, estos se encuentran encerrados en marcos de color verde.

Preparando nuestras secuencias


No exageremos si afirmamos que el exito o fracaso de un anlisis filogentico radica en el alineamiento mltiple (AM) que obtengamos de nuestras secuencias. Bsicamente debemos seguir los lineamientos planteados en la anterior gua acerca de AM. Garbage in, garbage out (basura a la entrada, basura a la salida), es una vieja premisa en anlisis bioinformticos, y bsicamente nos recuerda que no importa lo efectivo que sea un programa o algoritmo, la calidad de nuestros resultados siempre depender de la calidad de la informacin que le suministremos a este. Recupere y realice un alineamiento mltiple (preferiblemente mediante clustalw, ya que necesitaremos una archivo .aln completamente vlido ms adelante) con las siguientes secuencias de insulina para diferentes especies: 1. NP_000198 2. P30410 3. NP_062002 4. P01321 5. NP_032412 6. P01311

7. P01315 8. P01332 9. NP_776351 10.P01318

Una vez realizado el alineamiento, preste atencin al rbol gua calculado por clustalw, recuerde que este NO es un rbol filogentico. Entonces , cul es el significado de este rbol gua? Guarde el archivo de alineamiento. Salve tambin el rbol gua, lo utilizaremos ms adelante.

Edicin de nuestro alineamiento


Generalmente, tendemos a pensar en un alineamiento mltiple como en un archivo sagrado, intocable y portador de la verdad absoluta. Sin embargo, en la vida real es muy comn realizar ediciones manuales de nuestros alineamientos, y esto puede responder a varias circunstancias. Por ejemplo, algunas veces resulta evidente para nuestros ojos que la remocin de una seccin de gaps podra dar lugar a un mejor alineamiento (simplemente ningn algoritmo puede superar nuestra capacidad de raciocinio), sin llegar a alterar drsticamente nuestros resultados. En el caso de la creacin de rboles. Los gaps no son de mucha ayuda y por lo general trabajamos con las regiones muy conservadas, y es rutinario suprimir las regiones ricas en gaps y trabajar nicamente con dichos bloques de conservacin. En el caso de clustalw, es posible hacerle explcito que no queremos trabajar con regiones ricas en Gaps (ms adelante detallaremos este proceso). De esta manera es posible realizar una edicin manual de nuestro alineamiento, esto es posible tanto desde JalView, como desde BioEdit, e incluso desde cualquier procesador de palabra como Open Office Writer, Kword, Abiword o

Ms Word. ****

Creacin de rboles filogenticos con clustalw


Existen herramientas mucho ms sofisticadas que clustalw para la creacin de rboles (ms adelante veremos algunas de ellas), que nos permiten controlar cada uno de los aspectos de la creacin de nuestro rbol, para lo cual debemos intimar con muchos de los detalles detrs de los algoritmos existentes para este fin. Particularmente con clustalw resulta muy sencillo crear nuestros rboles. ...visite nuevamente la pgina de clustalw en el sitio web del EBI: http://www.ebi.ac.uk/clustalw e ingrese el alineamiento mltiple creado en el paso anterior. Esta vez clustalw, entender que hemos ingresado un AM y que no debe crear uno nuevamente! Sin embargo debemos darle algunas indicaciones antes de continuar. Lo primero que debemos decirle es el tipo de mtodo que utilizaremos para la creacin de nuestro rbol: Seleccione NJ en el men desplegable: TREE TYPE, de la seccin PHYLOGENETIC TREE.

Con esta opcin hemos decidido crear nuestro rbol mediante el mtodo Neighbor Joining, que es tal vez el mtodo de mayor aceptacin para este tipo de anlisis. Mtodos para la creacin de rboles Bsicamente existen 2 categoras de mtodos para la creacin de rboles en estudios filogenticos: Mtodos basados en distancia (dentro de los que se encuentran UPGMA y NJ), y los mtodos basados en la composicin de las secuencias (ac se encuentran el mtodo de mxima parsimonia ML, y el de mxima probabilidad ML). Cada uno de estos mtodos tiene sus fortalezas y sus debilidades, pero es ms ampliamente usado NJ, ya que ha probado ser bastante eficaz.

Como fue mencionado anteriormente, generalmente no es conveniente crear nuestro rbol haciendo uso de las regiones ricas en gaps, si no hemos editado nuestro alineamiento manualmente debemos decirle a clustalw que no use dichas regiones. Seleccione On en el men desplegable: Ignore Gaps de la seccin PHYLOGENETIC TREE.

Despus de unos segundos, aparecern nuestros resultados. La pgina de resultados es similar a la presentada al hacer un alineamiento mltiple, sin embargo su contenido es un poco diferente.

Cabe anotar que se crea por defecto un rbol Phylip, adems del que hemos pedido (NJ). Por defecto tambin, clustalw muestra primero un cladograma, que se ubica al final de la pgina de resultados:

Esta vez nos interesa conocer las distancias relativas de las ramas en nuestros rboles y no solamente su topologa, as que hes ms conveniente que veamos el rbol como un filograma: Presione el botn Show as phylogram Tree.

Compare este rbol con el rbol gua creado por clustalw al realizar el alineamiento. Encuentra diferencias y/o similitudes entre ellos? De qu manera se organizan lo OTUs en cada uno de estos? Puede ser interesante guardar nuestro rbol para futuros anlisis y tal vez la idea de tomar capturas de pantalla cada vez que queramos guardar nuestros rboles no resulte muy atractiva. Clustalw nos ofrece la opcin de guardar nuestro rbol en un formato conocido como Newick. Presione el botn View PH File que se encuentra en la parte inferior del filograma. Despus de unos segundos ser llevado a una pgina web en la cual nuestro rbol ha sido convertido a dicho formato, que se caracteriza por su gran cantidad de parntesis.

Creacin de rboles filogenticos mediante Phylip


Como fue mencionado anteriormente, clustalw es bsicamente una herramienta para alineamiento mltiple de secuencias, sin embargo hemos visto que es posible realizar muy buenos rboles mediante su utilizacin. Para el mundo de la filogenia, sin embargo, existen otros programas mucho ms usados, y que de alguna manera podemos caracterizar como de gama alta, es decir son programas (y suites) especficamente desarrollados para este propsito, generalmente reservados para los gures en este tipo de anlisis. Dentro de esta gama alta de programas contamos con PAUP y PHYLIP. En esta oportunidad trabajaremos con este ltimo. Visite la siguiente direccin: http://bioweb.pasteur.fr/seqanal/phylogeny/phylip-uk.html Phylip puede ser considerado mejor como un paquete de programas para anlisis filogentico ms que un programa individual. Esta es la razn por la cual se encuentra frente a un listado de programas en este momento.

El truco para trabajar con Phylip es utilizar los programas en orden y conocer de antemano lo que queremos lograr. Nuestro objetivo es crear un rbol basado en distancias, as que lo primero que debemos hacer es crear la matriz de distancias de nuestro alineamiento mltiple. En la primera seccin Programs for molecular sequence data en la seccin Proteins presione el enlace advanced form del programa protdist. Ser llevado-a la siguiente pgina web:

Ingrese all su direccin de correo electrnico, tambin copie y pegue el alineamiento mltiple realizado anteriormente (Incluyendo la lnea que dice CLUSTALW). Dependiendo de la longitud del alineamiento, los resultados pueden aparecer en pantalla inmediatamente o ser enviados a la direccin de correo que se ha ingresado, esto depende de la carga del servidor y no existe manera de controlar este comportamiento. Siga el enlace a Bootstrap en la parte inferior del formulario.

Este formulario nos permite definir los parmetros bajo los cuales realizaremos el bootstrap de nuestro rbol. Seleccione la casilla Perform a bootstrap before analysis. En la casilla Random Number seed, introduzca 3 y en la opcin How many replicates 2. El nmero de rplicas por lo general debe ser como mnimo 100. Esto implica sin embargo una gran carga para el servidor, por ahora dejaremos este nmero en 2, as obtendremos nuestros resultados mucho ms rpido y, en general, el concepto se podr comprender igualmente. Despues de unos minutos llegar una serie de correos a la direccion que ingres anteriormente.

El ms importante de estos correos es el primero de ellos: acces all protdist results, los otros correos contienen detalles acerca de los anlisis realizados. El contenido de este correo es una URL que le llevar a una pgina web con los resultados. Siga dicho link a la pgina de resultados. Seleccione neighbor del men desplegable en la parte superior de la pgina de resultados.

Mediante esta opcin estamos especificando que usaremos el programa Neighbor, que convierte nuestra matriz de distancia en un rbol NJ. Presione el botn Run the selected program on outfile.

La anterior accin le llevar a una nueva pgina web. Seleccione Neighbor-Joining como mtodo de distancia.

De esta manera obtendremos un rbol NJ. Siga el enlace que dice Bootstrap options, y llene los campos de acuerdo a la siguiente imgen.

En la seccin other options, ingrese el nmero 8 en la casilla outgroup species. tiene alguna idea de por qu hemos escogido este nmero para el outgroup? Pista: est directamente relacionado con el alineamiento mltiple realizado.

Presione el botn run neighbor que se encuentra en la parte superior de la pgina.

Despus de unos minutos apareceran los resultados en pantalla (o llegarn los enlaces correspondientes a su correo).

Los primeros 2 enlaces llevan a los archivos que contienen los rboles de los consensos. Outfile.consense muestra una versin en texto de nuestro rbol, as como datos generales acerca del proceso de bootstrapping.

Outtree.consense, lleva a un archivo en formato Newick. Los siguientes dos enlaces nos muestran los rboles que fueron utilizados para crear el rbol consenso. De igual manera que para el rbol consenso, el enlace outtree es una versin en formato Newick de dichos rboles.

Esta vez encontramos nicamente dos rboles debido a que este fue el nmero de rplicas que pedimos, generalmente deben ser alrededor de 100! Phylip, ofrece tambin herramientas que permiten visualizar nuestro rbol de una mejor manera. Seleccione la opcin drawtree del men desplegable, justo debajo de los dos primeros enlaces y presione el botn ubicado a la derecha de este.

Esto le llevar a una nueva pgina en la que puede establecer el formato de la grfica en la que ser exportado nuestro rbol. Adems de si queremos ver nuestro rbol como un fenograma o un cladograma. Esta vez utilizaremos las opciones por defecto (archivo en formato postscript y cladograma).

Presione el botn Run drawtree. Asegrese de que su direccin de correo electrnico se encuentra en la casilla.

Obtendr una nueva pgina web con un enlace al archivo postscript.

Gua elaborada por Andrs M. Pinzn V., del Centro de Bioinformtica del Instituto de Biotecnologa en la Universidad Nacional de Colombia y del Laboratorio de Micologa y Fitopatologa de la Universidad de los Andes, y est distribuida bajo licencia:

Creative Commons Bogot Colombia - Julio de 2006. Cualquier sugerencia o inquietud dirigirla a: ampinzonv@unal.edu.co andrespinzon@gmail.com

Potrebbero piacerti anche