Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Índice
Algoritmo del BLAST
Primera etapa: ensemillado oseeding.
Segunda etapa: extensión.
Tercera etapa: evaluación
Programas de la familia BLAST
Blastn
Blastp
BlastX
TBlastn
TBlastX
Bl2seq
Variantes del BLAST
Gapped Blast
PsiBlast
WU BLAST
Consideraciones al usar BLAST
Véase también
Enlaces externos
Referencias
BLAST usa una matriz de sustitución de aminoácidos o nucleótidos para calificar sus alineamientos. Dicha matriz contiene la
puntuación (también llamadascore) que se le da al alinear un nucleótido o un aminoácido X de la secuencia A con otro aminoácido Y
de la secuencia B. Las matrices más usadas para calificar alineamientos de proteínas son la BLOSUM y la PAM (ambas fueron
obtenidas midiendo la frecuencia de los aminoácidos en una gran muestra de proteínas). También se permite al usuario definir su
propia matriz. El tipo de matriz usada es determinante para los resultados que se obtendrán, el uso de una matriz incorrecta puede
llevar a calificar erróneamente los alineamientos y por lo tanto obtener resultados equivocados.
El algoritmo de BLAST tiene tres etapas principales: ensemillado, extensión y evaluación. A continuación se describen brevemente
cada una de ellas:
Blastn
Es de los más comúnmente usados. Compara una secuencia de nucleótidos contra una base de datos que contenga también secuencias
nucleotídicas.
Blastp
Es el otro tipo de BLAST más usado. Es un BLAST "con huecos" (o gaps) que compara una secuencia de aminoácidos contra una
base de datos del mismo tipo. Usualmente usa la matriz de sustitución BLOSUM o PAM para realizar los alineamientos, aunque
puede usar una matriz definida por el usuario.
BlastX
Este programa usa como entrada una secuencia de nucléotidos. Traduce la secuencia en sus seis posibles marcos de lectura (tres
marcos de lecturas por hebra) y compara estas secuencias traducidas contra una base de datos de proteínas. Se usa cuando se tiene
sospecha de que la secuencia de entrada codifica para unaproteína pero no se sabe exactamente cuál es su producto.
TBlastn
Compara una secuencia proteica con una base de datos de nucléotidos. Para realizar esto traduce todas las secuencias de nucleótidos
en sus seis marcos de lectura. Se usa cuando se tiene una proteína, y el análisis con Blastp no ha sido exitoso. Se debe tener cuidado
con los resultados de este Blast, porque una buena cantidad de las secuencias traducidas no son proteínas que existan en la naturaleza.
TBlastX
Tblastx compara las traducciones de seis cuadros de una secuencia de consulta de nucleótidos contra las traducciones de seis cuadros
de una base de datos de secuencias de nucleótidos.
Bl2seq
Bl2seq (BLAST 2 Secuencias) permite la búsqueda BLAST de una secuencia en contra de otra secuencia, sin tener que ejecutar
formatdb para crear una base de datos BLAST de la secuencia que ha de ser contrastada. Bl2seq es uno de los programas distribuidos
junto con el antiguo programa blastall por el NCBI. El NCBI recomienda que las personas comienzan a usar los programas del
paquete blast+ en su lugar.
PsiBlast
Esta variante de BLAST2 es usada para buscar posibles homólogos en organismos muy lejanos entre ellos, filogenéticamente
hablando. Está disponible sólo para secuencias de aminoácidos. Se trata de un programa iterativo que va calculando sus propias
Matriz de sustitución en cada iteración.
Al inicio, hace un Blastp normal, usando una matriz estándar para calificar los alineamientos. De las secuencias obtenidas en este
alineamiento, el programa genera una nueva matriz de sustitución, basándose en las frecuencias de los aminoácidos de las secuencias
obtenidas en los alineamientos. Usa esta nueva matriz para realizar otro alineamiento. Esto permite en general encontrar nuevos
alineamientos, que son usados para calcular una nueva matriz. El proceso se repite tantas veces como el usuario lo indique, o hasta
que ya no se encuentran nuevos alineamientos.
WU BLAST
Más que una variante, es el algoritmo de BLAST implementado por bioinformáticos de la Universidad de Washington. Según sus
creadores, es un algoritmo mucho más rápido y eficiente que el BLAST de NCBI, e igual de sensible. Es ideal si se quieren realizar
análisis masivos de BLAST. Otra diferencia es la licencia, WU BLAST es software propietario y es gratuito solo para uso académico.
El programa de BLAST NO garantiza que las secuencias que alinea sean homólogas y mucho menos que tengan la
misma función, simplemente provee posibles candidatos. Se necesitan más análisis para anotar correctamente una
secuencia.
La puntuación del BLAST depende del largo de la secuencia, una secuencia muy corta tendrá una puntuación
menor que una grande simplemente por la cantidad de caracteres que tiene. Así que siempre se debe interpretar la
puntuación con respecto al largo de la secuencia.
El e-valor depende del tamaño de la base de datos. Para bases de datos muy pequeñas, e-valores altos son más
significativos que para bases de datos muy grandes. Para la base de datos no redundante (NR) de NCBI por lo
general e-valores de 0.01 o menos son considerados como significativos, pero esto puede depender de la
secuencia que se esté analizando.
Se debe tener cuidado con los errores de anotación; es común que alguna secuencia que se anotó mal (ya sea
porque se anotó automáticamente o por error humano) sea utilizada como referencia para anotar otras secuencias
similares, por lo que los errores de anotación se pueden propagar rápidamente. Siempre debemos especificar que
la función de nuestra secuencia es posible o probable si fue asignada usando identidad con otras secuencias.
Asimismo debemos tener en cuenta que la gran mayoría de las funciones asignadas en la actualidad son putativas
y que pueden no ser una buena referencia para una asignación funcional.
A pesar de lo que comúnmente se piensa, las secuencias con la mejor puntuación o el mejor e-valor NO
necesariamente son los mejores candidatos a ser genes homólogos. Es importante analizar todos los alineamientos
que encuentra el programa y sacar conclusiones en base al resultado global.
BLAST tiene varios parámetros por defecto que en general funcionan bien para la mayoría de los casos, pero habrá
situaciones en las que es necesario cambiarlos para obtener mejores resultados. No hay forma de saber
exactamente qué parámetro es el óptimo, y se tienen que realizar múltiples pruebas hasta encontrar las mejores
condiciones.
Véase también
Algoritmo Smith-Waterman
Alineamiento de secuencias
Bioinformática
Genómica
Enlaces externos
BLAST en National Center for Biotechnology Information (NCBI)(en inglés).
Tutorial de Blast en NCBI(en inglés)
Servidor del Wu Blast (en inglés)
mpiBLAST Demo - mpiBLAST Parallel Version (italian - inglés)
Referencias
1. Smith TF, Waterman MS (1981). «Identification of common molecular subsequences» (http://linkinghub.elsevier.com/
retrieve/pii/0022-2836(81)90087-5). J Mol Biol 147 (1): 195-7. PMID 7265238.
2. Altschul, S. F., et. al. (1997). «Gapped BLAST and PSI-BLAST: a new generation of protein database search
programs» (http://nar.oxfordjournals.org/cgi/content/full/25/17/3389). Nucleic Acid Res 25: 3389-402. PMID 9254694.
Obtenido de «https://es.wikipedia.org/w/index.php?title=BLAST&oldid=101824274
»
Se editó esta página por última vez el 12 sep 2017 a las 07:40.
El texto está disponible bajo laLicencia Creative Commons Atribución Compartir Igual 3.0 ; pueden aplicarse cláusulas
adicionales. Al usar este sitio, usted acepta nuestrostérminos de uso y nuestra política de privacidad.
Wikipedia® es una marca registrada de laFundación Wikimedia, Inc., una organización sin ánimo de lucro.