Sei sulla pagina 1di 4

Problema de Bioinformtica.

INTRODUCCIN
La bioinformtica es un rea de investigacin que aprovecha
herramientas informticas para trabajar con informacin biolgica
como secuencias de ADN. Con la ayuda de computadoras y bases de
datos, se puede extraer mucha informacin a partir de una secuencia
de ADN: determinar si dicha secuencia codifica una protena o es una
secuencia regulatoria, si contiene sitios de corte por enzimas de
restriccin, si incluye una regin con SNPs, qu tanta identidad tiene
con secuencias similares de ADN, etc.
En el siguiente ejercicio vamos a usar herramientas
bioinformticas y bases de datos del Centro Nacional de Informacin
en Biotecnologa de los EU (NCBI, por sus siglas en ingls). Con ayuda
de este centro, vamos a encontrar la secuencia completa del gen
TAS2R38 a partir de las secuencias de los oligonucletidos que
empleamos para amplificar una regin del mismo.
Los oligonucletidos que usamos son:
Forward: 5CCTTCGTTTTCTTGGTGAATTTTTGGGATGTAGTGAAGAGGCGG-3
Reverse: 5'-AGGTTGGCTTGGTTTGCAATCATC-3'

Uso de BLAST
Una de las herramientas ms tiles que podemos encontrar en la
pgina del NCBI (http://www.ncbi.nlm.nih.gov) es BLAST (siglas en
ingls de Herramienta Bsica de Bsqueda de Alineamientos Locales).
BLAST busca regiones con similaridad local entre secuencias de
nucletidos o protenas, comparndolas con bases de datos. Adems
nos indica qu tan significativas son las coincidencias que encuentra
entre nuestra secuencia y las que se le parecen en bases de datos.
Por lo tanto, esta herramienta puede usarse para inferir relaciones
funcionales y evolutivas entre secuencias, as como para identificar a
miembros de familias de genes.
1. Entrar a la pgina del NCBI
2. Hacer click en el vnculo llamado "BLAST"
3. Hacer click en la herramienta " nucleotide blast"
4. Escribir las secuencias de ambos oligonucletidos en la ventana de
bsqueda. Evitar usar cualquier carcter que no corresponda a
nucletidos. Puedes escribir ambas secuencias seguidas, o separadas
por un espacio.
PROBLEMA: Investiga qu es el formato FASTA de secuencias. Para
qu tipo de informacin biolgica podemos usar este formato?
5. No hace falta modificar ninguna otra opcin. Hacer click en el botn
"BLAST" para que se lleve a cabo la bsqueda usando el algoritmo

MegaBlast. Espera algunos minutos hasta que aparezca la pgina de


resultados.
Despus de buscar la secuencia de los oligonucletidos dentro de las
millones de secuencias que hay en las bases de datos, BLAST nos
devolver muchos resultados.
En primer lugar hay un resumen grfico con lneas de distintos
colores. Qu crees que representan dichas lneas? Qu indica su
color? Mueve el puntero del mouse lentamente sobre las lneas. Qu
informacin aparece en la barra que se encuentra inmediatamente
sobre la grfica?
Despus del resumen grfico encontrars una lista de secuencias que
presentaron coincidencias significativas con tu bsqueda. Esta lista
contiene una descripcin de la secuencia similar, con valores que
indican qu tan similares son dichas secuencias a la que buscaste.
Leyendo la descripcin de las secuencias Puedes deducir la
secuencia de qu gen es similar a la de los oligonucletidos?
Adems del nombre del gen, se indica la especie de los organismos a
los que pertenece dicha secuencia. Qu organismos son los que
aparecen primero en la lista? Si no los puedes identificar por su
nombre cientfico, has una bsqueda en internet.
Pon especial atencin en la columna "Ident". Esta columna muestra el
porcentaje de identidad entre la secuencia que escribimos y la que se
encontr en la base de datos. Qu animales tienen un 100% de
identidad? Cul es el primer organismo en tener menos de 100% de
identidad?
En esta tabla se incluyen gran cantidad de organismos con
secuencias que tengan identidad mayor al 90%. Selecciona algunos al
azar y con su nombre cientfico, has una bsqueda de imgenes en
internet. Viendo las imgenes de estos animales, puedes deducir a
qu orden pertenecen?
Sabemos que los oligonucletidos fueron diseados para detectar un
gen humano. Cmo explicas la similitud de la secuencia con el orden
de mamferos que detectaste?
Se dice que la biologa molecular brinda las pruebas ms recientes de
la Teora de la Evolucin. Cmo usaras los resultados que
encontraste en este ejercicio para apoyar o refutar esta teora?
Sigue avanzando en la pgina para encontrar la tercera parte del
reporte: los alineamientos de las secuencias. Estos alineamientos
muestran exactamente qu parte de nuestra secuencia es idntica a
la secuencia similar. Vers un par de secuencias unidas por lneas.
Una de ellas se llama "Query", que representa a la secuencia que
introdujimos en el blast, y la otra se llama "Sbjct", que representa a la
secuencia en la base de datos que tiene homologa con el query (En
cuanto a la comparacin de secuencias, Qu significa "homologa" y
qu "identidad"?). Los nmeros que flanquean a esta secuencia
representan en qu posicin del gen existe coincidencias con
nuestros oligonucletidos.
Cmo puedes usar esos nmeros para predecir el tamao del
amplicn?

Busca el parmetro "Strand". Una parte de la identidad debe estar


marcada como "Plus/Plus", mientras que el resto debe venir como
"Plus/Minus". Esto se refiere a la hebra que tiene identidad con
nuestra secuencia. Cmo coinciden las secuencias de los
oligonucletidos con la hebra con la que se aparearn? Dibuja ambas
hebras del DNA humano (sentido y antisentido) y trata de deducir a
qu hebra se aparear el oligonucletido Forward y a cul el Reverse.
No olvides marcar los extremos 5` y 3` tanto de los oligos como de la
secuencia de ADN con la que se aparean.

EJERCICIO OPCIONAL: GENERACIN DE UN FILOGRAMA A


PARTIR DE SECUENCIAS DE TAS2R38 DE DIVERSOS
PRIMATES
Has click en el identificador de secuencias (Sequence ID) del
alineamiento con la secuencia del humano. Este vnculo te llevar a
una pgina con mucha informacin acerca del gen identificado. Entre
otra informacin, podemos encontrar la secuencia de la protena
(donde cada letra representa un residuo de aminocidos) casi al final
de la pgina, antes de la secuencia del gen. Copia dicha secuencia
en un editor de textos. En el editor de textos, antes de la secuencia
escribe ">Especie" sin comillas y sustituyendo "Especie" por el
nombre de la especie a la que pertenezca dicha secuencia. Es
importante dar enter despus de la instruccin >Especie, justo antes
de la secuencia, por ejemplo:
>Humano
MLTLTRIRTVSYEVRSTFLFISVLEFAVGFLTNAFVFLVNFWDVVKRQALSNSDC
VLLCLSISRLFLHGLLFLSAIQLTHFQKLSEPLNHSYQAIIMLWMIANQANLWLA
ACLSLLYCSKLIRFSHTFLICLASWVSRKISQMLLGIILCSCICTVLCVWCFFSRP
HFTVTTVLFMNNNTRLNWQIKDLNLFYSFLFCYLWSVPPFLLFLVSSGMLTVSL
GRHMRTMKVYTRNSRDPSLEAHIKALKSLVSFFCFFVISSCVAFISVPLLILWRD
KIGVMVCVGIMAACPSGHAAVLISGNAKLRRAVMTILLWAQSSLKVRADHKAD
SRTLC
Copia en el mismo archivo la secuencia de la protena proveniente de
al menos otros 4 organismos, separando con enter cada secuencia.
No cierres este archivo todava!
Existen diversas herramientas gratuitas en lnea para comparar
secuencias. En este ejemplo vamos a usar una llamada "Clustal
Omega", desarrollada por el Instituto de Bioinformtica Europeo.
Entra a la pgina https://www.ebi.ac.uk/Tools/msa/clustalo/
En la ventana de secuencias de entrada, copia las 5 secuencias
separadas por su identificador de especie que tienes en tu editor de
texto. Clustal Omega necesita el identificador ">Especie" para
distinguir el principio y final de cada secuencia.
Sin modificar ninguna opcin, presiona el botn "Submit" para que el
servidor del EBI busque similitudes entre las secuencias. Despus de
algunos minutos, llegaremos a la pgina de resultados donde nos
muestra alineadas todas las secuencias. Haz click en la pestaa

llamada "Phylogenetic Tree" para que veas una representacin grfica


de las similitudes entre las secuencias. Qu secuencia se parece ms
a la del humano? Cul es la menos parecida? Coincide con lo que
esperaras de acuerdo a tus conocimientos previos sobre evolucin
humana?
Repite este ejercicio pero usando ahora las secuencias de nucletidos.
Se recomienda hacer las comparaciones con la herramienta MUSCLE,
que puede encontrarse en https://www.ebi.ac.uk/Tools/msa/muscle/
Esta herramienta est optimizada para comparar secuencias de
nucletidos.
Hay ms o menos diferencias en la secuencia de nucletidos que en
la de aminocidos? A qu se debe? Cambia significativamente el
filograma obtenido con este ejercicio?

Potrebbero piacerti anche