Sei sulla pagina 1di 6

Alineacin de secuencia mltiple con Clustal X

La serie de programas de Clustal ampliamente utilizado para la alineacin para la preparacin de


rboles filogenticos. Los programas han sufrido varias encarnaciones, en 1997 se produjo la Clustal
W 1.7 actualizacin y de Clustal X, que tiene una interfaz de Windows. A pesar de que nos gusta
pensar que la gente usa Clustal programas porque producen buenos alineaciones, sin duda una de
las razones para el amplio uso de los programas su portabilidad a todas las computadoras. La
portabilidad puede tener un inconveniente, y para muchos aos la interfaz de Clustal ha tenido para
ser sencillo. Clustal X (Ref. 1) ahora proporciona una interfaz grfica de usuario mucho ms
agradable (ver Fig. 1) para X, Mac y PC ventanas, manteniendo la portabilidad. Presenta alineaciones
en las que los residuos conservacin se muestra en color, y tiene una herramienta muy til para
marcar regiones pobres de la alineacin. En adicin, el usuario puede seleccionar estas regiones
para reordenacin. As, Clustal X aade ms flexibilidad a las estrategias disponibles para preparar
mltiples alineaciones.

Una historia de los programas Clustal los programas de Clustal han sido desarrollo continuo por
ms de diez aos, por lo que las versiones disponibles no dar los mismos resultados. Esto puede
ser confuso a los nuevos usuarios; por lo tanto, sentimos que una corta historia de desarrollo
Clustal ayudara a aclarar los asuntos.

El primer programa Clustal2,3, escrito por Des Higgins en 1988, fue diseado para realizar una
alineacin eficiente en las PCs, que tena entonces una potencia informtica dbil por los
estndares actuales. Aprovech un alineacin recursiva eficiente en memoria algoritmo4 con la
alineacin progresiva estrategia introducida por Feng y Doolittle5 y Willie Taylor6. La esencia
alineacin progresiva es alinear la secuencias ms estrechamente relacionadas los difciles
divergentes duran. La precomparacin utiliz un mtodo rpido de FASTA bsqueda de palabras y
el dendrograma construido utilizando el mtodo UPGMA7,8. Los mens de texto simple hicieron
Clustal fcil de utilizar. Aunque concebido como un "pobre programa de alineacin del hombre,
cualquier persona que podra permitirse un microordenador, Clustal era en realidad uno de los
programas ms actualizados de su tipo.

Alan Bleasby y Rainer Fuchs ayudaron Higgins9 renovar ampliamente Clustal para un nuevo
lanzamiento, Clustal V, en 1992. Incorporaron alineaciones de perfil (alineaciones de viejas
alineaciones) y la facilidad para generar rboles de la alineacin mediante el uso rpido de Vecino-
Unin mtodo10. El usuario podra tambin probar el rbol para la robustez usando una prueba
simple de bootstrap de topologa de rbol. Julie Thompson y Toby Gibson colaboraron en la
tercera generacin, Clustal W (W para Ponderacin, que fue aplicado a secuencias y penalidades
gap) 12, que fue lanzado en 1994. Clustal W se parece mucho a Clustal V, pero hay muchas
diferencias internas. Incorporamos la brecha especfica de posicin penalidades para que se
puedan aplicar disminuido en los residuos hidroflicos y dondequiera que se introduzcan las
lagunas en la alineacin13. La secuencia de precomparacin en Clustal W usa ms sensibles la
programacin dinmica, que produce un dendrograma mucho mejor. Los dendrograma en s se
calcula ahora Vecino-Unir, que mejora el rbol topologa y proporciona un mtodo para ponderar
secuencias sobre la base de sus divergencias. En versiones posteriores de Clustal W, las mscaras
de brecha-pena pueden guiar la alineacin (por ejemplo, en los casos en que la informacin de la
estructura secundaria es disponible; ver Fig. 1). El programa puede tambin combinar alineaciones
juntas o agregar una lista de nuevas secuencias a una vieja alineacin, convirtindose as en una
herramienta de alineacin. Aunque hemos desarrollado Clustal W para funcionar en una
computadora local, numerosos Se han establecido servidores web - por ejemplo, en el EBI (http:
//www2.ebi.ac.uk/clustalw/).

Franois Jeanmougin y Frdric Plewniak se uni a nosotros en el desarrollo de Clustal X. Nos


hemos centrado en proporcionar interfaz moderna de Windows, manteniendo portabilidad a
travs del NCBI Vibrant Toolkit (que se puede encontrar en
ftp://ncbi.nlm.nih.gov/toolbox/ncbi_tools/).

Aunque las alineaciones producidas son los mismos que los producidos por la corriente de Clustal
W, el usuario puede mejor evaluar alineaciones en Clustal X (Ref. 1). Dentro de las alineaciones, se
conservan se destacan las columnas (con un color esquema que el usuario puede personalizar).

Debajo de la alineacin de secuencia, Clustal X proporciona una parcela de conservacin de


residuos. Herramientas de anlisis de calidad que destacan las regiones desalineadas. disponible.
El usuario puede entonces dirigirse a problemas realineando cualquiera de las secuencias
seleccionadas o bloques seleccionados de la alineacin y construir alineaciones difciles poco a
poco, de modo que las reas tratado uno a la vez. Clustal X es por lo tanto, una herramienta para
trabajar en mltiples alineaciones, en lugar de simplemente programa de alineacin.

Figura 1. Captura de pantalla de una sesin con Clustal X en modo de ventana dividida para la
alineacin del perfil. Archaeal Las secuencias TFIIB (ventana inferior) estn alineadas con TFIIB
eucariotas prealignadas (ventana superior). Se ha aplicado una mscara estructural de la
estructura resuelta de TF2B_Human. Se muestran informacin estructural y las curvas de calidad
para cada alineacin. Horizontal los desplazamientos estn bloqueados. a / A, a-hlice.
Figura 2. Imagen de pantalla de NJplot que muestra un rbol calculado por Clustal X de la
alineacin TFIIB generada en la Fig. 1. La raz se coloca en la rama que une los eucariotas y
archaea. Las longitudes de ramificacin son proporcionales a la secuencia divergencia y se puede
medir con relacin a la barra mostrada (arriba a la derecha). Las etiquetas de rama registran la
estabilidad de las ramas ms de 1000 repeticiones bootstrap.

Introduccin a Clustal X

Los programas Clustal W y Clustal X tienen diseos autoexplicativos y en lnea ayuda est
disponible, de modo que programas no debera ser difcil. Por inexperto usuarios, el principal
obstculo parece estar consiguiendo que el programa lea sus secuencias. Se deben recoger las
secuencias en un solo archivo en un formato que Clustal puede leer. El formato ms simple es
FASTA, pero el EMBL y SWISSPROT los formatos de base de datos se pueden leer directamente.

Por lo general, el conjunto de secuencias ser exportado de algn otro anlisis de secuencias
paquete (la mayora de los cuales Formato FASTA). Los usuarios de la Web pueden extraer
conjuntos de secuencias de bases de datos a travs de SRS servidores (por ejemplo, desde
http://srs.ebi.ac.uk/).

Finalmente, si es necesario, el usuario puede montar y editar secuencias en un procesador de


palabras paquete, siempre que las secuencias se guardan como texto con linebreaks. Una vez
cargado en Clustal X, las secuencias pueden debe alinearse inmediatamente usando el parmetro
predeterminado configuracin. Tenga en cuenta que el valor predeterminado en particular la
brecha de brecha ajustes - no siempre dan lo mejor alineacin. Los nuevos usuarios deberan
algunas pruebas, utilizando y reducir las penalidades ver cmo funciona el programa.

En alineacin difcil casos, generalmente pagar a prueba diferentes parmetros. Los herramientas
de alineacin Clustal X puede ayudar mucho en evaluando los resultados de la alineacin.
Cundo y cmo usar Clustal X - y cuando no!

El amplio uso de Clustal W y X parecen implicar que siempre alinean las secuencias bien. De hecho,
esto es no siempre es as. La alineacin algoritmo ha sido optimizado alinear conjuntos de
secuencias que estn enteramente colineal - es decir, las secuencias tienen la misma protena
dominios y estos dominios estn en el mismo orden. Si no se cumple esta condicin (y muchas
veces no lo es), Clustal X pueden producir desalineaciones graves.

El usuario debe pensar un poco en el naturaleza del conjunto de secuencias.

Cundo utilizar Clustal X

El programa Clustal X puede usarse para alinear cualquier grupo de protenas o secuencias de
cido que estn relacionadas con otros en toda su longitud.

Sin embargo, todava pueden encontrados.

Secuencias divergentes.

Clustal trata de alinear las secuencias ms estrechamente relacionadas primero, para construir un
representante perfil de la familia. Divergente secuencias se retrasan por defecto hasta este perfil
est disponible. Si solo tienes miembros divergentes de una familia, resultan en la mayora (si no
todas) de las secuencias ser retrasado, y la progresividad de la alineacin se pierde. En esto caso,
puede cambiar el parmetro de retardo o utilice el modo de alineacin de perfiles para impulsar el
orden de alineacin usted mismo. En casos extremos, las secuencias pueden simplemente ser
demasiado divergente para ser correctamente alineado.

Sesgo de composicin.

Clustal emplea posiciones especficas penalidades para ayudar a introducir brechas en las regiones
hidroflicas del alineacin. Por defecto, los residuos G, P, S, N, D, Q, E, K y R se consideran para ser
hidrfilo. Si sus secuencias muestran un sesgo en uno (o ms) de estos residuos, debe eliminar
residuo de la lista de Protein Gap Men Parmetros.

Pocas secuencias.

Una alineacin de un pequeo nmero (, 10) de muy lejano protenas podran ser poco fiables. T
debe comprobar tal alineamiento cuidadosamente

Cundo no usar Clustal X (o cundo usarlo con mucha precaucin)

Las secuencias no comparten ascendencia.

Esto se intenta sorprendentemente a menudo - en su mayora, pero no siempre, por accidente.


(Esto a menudo nos sucede cuando extraemos un conjunto de secuencias utilizando una bsqueda
por palabra clave).
Las secuencias tienen Nand grande, variable Salientes C-terminales (por ejemplo quinesinas).

Los terminales no conservados deben ser removidos, o la opcin 'Usar Matriz Negativa' debe ser
invocado - de lo contrario un se puede producir una falsa alineacin.

Las secuencias estn parcialmente relacionadas.

Multidominio protenas que tienen complejo historias evolutivas a menudo comparten algunos,
pero no todos, del conjunto de dominio. Los alicientes producidos en estos casos ser impredecible.

Las secuencias incluyendo el corto no superposicin fragmentos

A veces las personas intentar alinear un conjunto de fragmentos cortos a una sola secuencia de
referencia. Esto no funcionar en Clustal X. Si las secuencias no se superponen, por supuesto, no
tienen nada que ver, y el rbol gua y la ponderacin de secuencia generados son un disparate!
Encontrar otro manera de hacerlo.

La calidad de la alineacin se puede comprobar utilizando las herramientas de anlisis


proporcionadas por Clustal X, as como el muy potente residuo-colorante. La alineacin proceso
puede ser rastreado ahorrando los mensajes de progreso en una archivo de registro. Desde aqu,
puede ver qu secuencias se han retrasado en la orden de alineacin mltiple hasta que el ncleo
perfil ha sido construido. Tambin puede examinar el rbol gua (archivo * .dnd) utilizando NJplot,
pero recuerde que esto no es un fiable rbol filogentico.

Visualizacin de rboles con NJplot

Clustal X puede calcular rboles usando el mtodo de unin de vecinos10, un algoritmo


ampliamente utilizado y relativamente rpido que agrupa secuencias minimizando la suma de
longitudes de rama.

Sin embargo, Clustal X no muestra rboles. Un simple programa de visualizacin de rboles, NJplot
(Ref. 14), se incluye en el ClustalX paquete de distribucin. Al igual que Clustal X, NJplot est
disponible para todas las plataformas informticas. NJplot lee el formato phylip rbol de salida de
Clustal X y muestra rboles como dendrogramas. Manipulaciones bsicas de las etiquetas de texto,
las el rerooting del rbol se puede realizar, pero la topologa de rbol subyacente no puede ser
cambiado. Tenga en cuenta que NeighbourJoining los rboles no estn enraizados, por lo que el
usuario debe decidir si existe una raz vlida o no. La figura 2 muestra un rbol generada por
Clustal X y mostrada por NJplot. Otros paquetes de visualizacin de rbol tiles incluyen TreeTool,
disponible para Sun UNIX only15 y TreeView, que se ejecuta en Macs / PCs16. Estos programas
pueden mostrar rboles tanto radialmente como en dendrogramas. Los alineamientos clustales
tambin pueden ser utilizados como insumos para rbol, tales como PHYLIP17, PhyloWin18 o
PAUP (que fue desarrollado por D. L. Swofford en el Smithsonian Institute).

Conclusin

En este artculo, ofrecemos algunas orientaciones que esperamos sea til a los usuarios de Clustal.
En el no demasiado lejano alineacin progresiva, la alineacin progresiva estrategia para los
ltimos diez aos probablemente quedar obsoleto. Iterativo estrategias de alineacin, como
PRRP19 y SAGA20, se inform que se desempean como bien, o mejor que, Clustal X para
pequeo nmero de secuencias, pero actualmente demasiado lento para manejar grandes
conjuntos de datos Las estrategias iterativas ms eficientes, cada vez ms potente computadoras
de escritorio, podra pronto alineaciones de alta calidad para todos los que los necesitan.

Potrebbero piacerti anche