Bioinformática 2 2011 Tutorial

Materia: Biologa Molecular
Carrera: Qumico Bacterilogo y Parasitlogo

Escuela Nacional de Ciencias Biolgicas
2011
Autores:

Dra. Addy Cecilia Helguera Repetto

Dra. Lizbel Esperanza Len Sols

Dr. Jorge Francisco Cerna Corts

Dr. Juan Arturo Casteln Vega
En este tutorial se hacen sealamientos
importantes mediante el uso de flechas,
crculos y letras de colores.
Empleando la base de datos ENTREZ, obtener la secuencia
nucleotdica del gen aerA de Aeromonas hydrophila (Cdigo de
acceso: DQ186611) y realizar los siguientes anlisis
bioinformticos:

1- Obtener 5 secuencias homlogas al gen y delimitar las
secuencias codificantes de los genes.
2- Realizar el alineamiento de las secuencias mediante el
programa ClustalX.
3- Elaborar el rbol filogentico con los datos obtenidos en el
punto anterior.
Obtencin de las secuencias homologas a aerA de Aeromonas hydrophila
1.- Entrar a la pgina del
NCBI.

2.- Seleccionar
nucleotide
(nucletido) y escribir el
cdigo de acceso del
gen a buscar (en este
caso se seguir
estudiando el mismo
que para la prctica de
Bioinformtica I)
1
Para guardar la
secuencia en formato
de texto se tiene que
seleccionar la opcin
FASTA (1)
Se muestra una
pgina en la cual
aparece la
secuencia
completa del gen,
la cual se guarda
como archivo de
texto (*.txt).
Con la secuencia anterior
se procede a realizar la
bsqueda de secuencias
homlogas, para lo cual
se utiliza la herramienta
Blast. En la pgina
inicial del NCBI
seleccionar Blast.
Seleccionar la
opcin
Nucleotide
blast.
Se puede escribir
el nmero de
acceso de la
secuencia en
estudio o bien la
secuencia en
formato FASTA.
Dar la orden BLAST.
Escoger la base de datos en
donde queremos realizar la
bsqueda (others).
1
2
3
Aparece una pantalla en la que
se muestran los alineamientos.
Elegir seis secuencias.
Al final de esta pantalla
presionar el botn Get
selected sequences
(obtener la secuencia
seleccionada).
Seleccionar los 6 recuadros
NO SELECCIONAR LAS
SECUENCIAS DE
GENOMA COMPLETO Y
GUARDARLO COMO
FORMATO DE TEXTO
Una vez que se guardaron en
formato FASTA es
importante cambiarles el
nombre a uno ms pequeo.
Se guardan los cambios
hechos.
Alineamiento de las secuencias por medio del programa ClustalX
Abrir el programa ClustalX y en
File (Archivo) dirigirse a
Load sequences (cargar
secuencias). Seleccionar el
archivo guardado
anteriormente.
Seleccionar multiple
alignment mode (modo de
alineamiento mltiple)
En alignment
(alineamiento) (1)
seleccionar Do
Complete alignment
(Hacer el alineamiento
completo) (2).
Posteriormente aparece un recuadro
en el cual se indica en donde y con
que extensiones se guarda el
dendrograma (*.dnd) (3) y el
alineamiento *.aln) (4) y finalmente
seleccionar align (alineamiento)
(5).
1
2
3
4
5
Construccin del rbol filogentico empleando el programa MEGA 2.1
Al abrir el programa dirigirse a
File (Archivo) para seleccionar
Convert to MEGA format.
Convertir el archivo
obtenido del programa
CLUSTALX.
Se muestra un cuadro en el cual se
selecciona la ubicacin del archivo
generado en CLUSTALX con
extensin .aln (flecha) y seleccionar OK.
Posteriormente
aparece una
pantalla con las
secuencias del
alineamiento.
1- Cerrar archivo
del alineamiento.
2- Se muestra una
ventana en la cual se
aceptan los cambios
Hechos.
1- Abrir el archivo
convertido a formato
MEGA.
2- Seleccionar la secuencia codificante.
Seleccionar el
cdigo gentico
standard (1) y
cerrar la ventana
(2).
1
2
Se realiza el estudio
filogentico por medio
del mtodo del vecino
ms cercano.
Primero se va a la opcin
de Phylogeny
(Filogenia) (1) y despus
se selecciona el modelo
Neighbor-Joining
(vecino ms cercano) (2).
1
2
Una vez seleccionado el
tipo de anlisis, se
procede a determinar el
nmero de diferencias.
Aparece una pantalla
donde se selecciona:
Models (1) (Modelos),
Nucleotide
(Nucletido) (2) y
finalmente No. of
Differences (No. De
diferencias) (3).
1
2
3
Se muestra un
rbol con las
distancias (con
respecto al nmero
de secuencias
nucleotdicas)
entre cada
secuencia en
estudio.
Para poder guardar
este rbol se va a
File (Archivo) y se
selecciona Export
current tree (Exportar
el rbol).
Posteriormente se elige
Image (Imagen) (1) para
guardar la imagen (y ser
vizualizada en otro
programa) escoger la
opcin marcada con la
flecha (2).
1
2
Se realiza otro estudio
filogentico basado
en la distancia evolutiva.
Se selecciona Models
(Modelos) (1), Nucleotide
(Nucletido) (2) y finalmente
p-distance (Distancia P) (3).
1
2
3
Se muestra el rbol con las
distancias evolutivas, en
donde cero significa que no
hay diferencias entre las
secuencias.
Empleando la base de datos ENTREZ, obtener la secuencia
nucleotdica de aerA de Aeromonas hydrophila (Cdigo de
acceso: DQ186611).

Delimitar la secuencia codificante del mismo y realizar una
bsqueda de protenas relacionadas empleado la
herramienta PSI-BLAST
Se requiere bajar
la secuencia del
gen, como ya se
ha hecho con
anterioridad.
1
2

En esta
informacin se
puede observar
que el gen
completo consta
de 2526 pb.
Se muestra como
resultado una hoja que se
proporciona informacin
general de la secuencia,
es importante seleccionar
la regin codificante
marcada como CDS.
Una vez que se
selecciona la
secuencia
codificante, sta
posee un tamao
de 1482 pb.
La secuencia se
guarda en los
formatos FASTA
y texto .
Para llevar a cabo la
bsqueda de protenas se
requiere tener la secuencia en
Aminocidos (aa), para
obtenerla se selecciona
protein id (No. de acceso de
la protena).
Aparece una pgina que
contiene informacin
general, como el No. de aa.
Cambiar a formato fasta (1) y
Guardar como texto (2)
Una vez que se obtiene la secuencia
se guarda como archivo de texto (*.txt).
Bsqueda de protenas relacionadas utilizando PSI-BLAST
Para hacer este
anlisis se ingresa
primero a la pgina
NCBI-BLAST y se
selecciona protein blast.
Se inserta el nmero de
acceso o la secuencia de
aminocidos.
Elegir el algoritmo Psi-
Blast (1) y posteriormente
ejecutar BLAST (2).
1
2
Aparece una pantalla en
la que se muestra el
dominio presente en
la protena, indicado
dentro del
valo.
La pantalla se actualiza
automticamente para
mostrar las protenas
relacionadas.
En esta pantalla se
observan los
alineamientos
significativos con
las diferentes
protenas.
Hacer una bsqueda en Internet de sitios donde se
puedan realizar los siguientes anlisis
bioinformticos: determinacin de peso molecular y
punto isoelctrico de protenas, anlisis de
antigenicidad, bsqueda de pptidos seal y
modelamiento de protenas.
http://expasy.org/
Ir a
proteomics
Determinar las propiedades fisicoqumicas de la protena.
En la pgina
de Proteomics:
1- Seleccionar
Protparam
1- Pegar la secuencia
de la protena.
2- Elegir compute parameters
Resultado: Aparece una
pantalla en donde se
muestran algunas
propiedades tales como el
punto isoelctrico (1), peso
molecular (2) y composicin
atmica (3), entre otras.
1
2
3
Bsqueda de pptidos seal
Ir a proteomics (1) y
seleccionar protein
sequences and
identification (2)

Identificacin de
potenciales sitios
de corte
Pegar la secuencia
de la protena (1)
Seleccionar la (s)
enzimas y/o los
qumicos que deseamos
probar (2)
Presionar perform (3)
Probables sitios
de corte identificados
Elaborar un modelo de estructura terciara de una protena
con base en homologa a protenas reportadas
Ir a
1. Proteomics
2. Protein structure 3. Ir a swiss-model repository
Pegar la secuencia
de la protena
Estructura
terciaria
Protena
Elaborar un modelo de estructura
terciara de una protena
1. proteomics
2. Protein structure
3. Ir a swiss model
workspace
Trabajar en
Automated mode
1. Poner la direccin electrnica
2. Titulo del proyecto
3. Pegar la secuencia de la protena
Resultado
Bsqueda de promotores en aerA de
Aeromonas hydrophila
Es necesario contar con la secuencia de aerA en formato FASTA
Ir a http://www.fruitfly.org/
En el inferior de
la pagina seleccionar
Analysis Tools
(herramientas de anlisis)
Aparece una pgina que muestra las herramientas para el anlisis
(Analysis tools)
Elegir Promoter Prediction
(prediccin del promotor)
Para la obtencin de la secuencia del promotor realizar lo siguiente:
Seleccionar la opcin de

1. prokaryote (procarionte).

2. no.

3. Ingresar en minimum
promoter score (puntuacin
mnima para el promotor) el
valor de 0.9.

4. Pegar la secuencia del gen.

5. Dar click a submit
(procesar).
Aparece la pagina con el resultado
Punto de inicio
de la transcripcin
Convertir una secuencia
de DNA a RNA
El programa que se utiliza es el DNAMAN
Pgina principal del programa DNAMAN
Para la conversin de la secuencia de DNA a RNA, realizar lo siguiente:
1. Seleccionar file (archivo).
2. Elegir new (nuevo).
3. Introducir la secuencia
del gen.

4. Seleccionar la secuencia.
5- Ir a Sequence (secuencia).
6. Seleccionar load DNA1
(descargar DNA1).
7. Elegir from selection
(desde seleccin).
8- Aparece un recuadro.
Oprimir el botnaceptar.
9- Ir a DNA1.

10- Elegir RNA sequence
(Secuencia de RNA).
Aparece un recuadro que contiene el resultado
Secuencia de RNA.
Bsqueda de estructuras secundarias
relevantes para la secuencia del RNA
El programa que se utiliza es el Rnadraw
Pgina principal del programa
1- Colocarse en el espacio
en blanco y presionar el
botn derecho del ratn.
Aparece un cuadro.

2- Seleccionar New file
(Archivo nuevo).
La bsqueda de estructuras secundarias relevantes para la secuencia
del RNA se realiza de la siguiente manera
3- Aparece un cuadro, donde
hay que seleccionar la
opcin de import text file
(importar archivo de texto).

4- Seleccionar OK.
5- Aparece un recuadro donde
se debe seleccionar
el archivo del gen en estudio,
el cual puede ser de DNA o RNA.

6- Elegir abrir.
Se muestra el archivo.
7- Colocar el ratn sobre la
secuencia y presionar el botn
Derecho. Aparece un recuadro.

8- Seleccionar calculate
(calcular) y se muestra otro
recuadro.

9- Elegir structure(s)
(estructura(s)).
10- Aparece un recuadro y
se presiona calculate
(calcular).
Comienza a calcular
la estructura.
El programa termina de calcular
la estructura secundaria del RNA.

11- Presionar en el signo +.

12- Elegir 2D radial drawing.
Estructura secundaria
del RNA.
Resultado

Bioinformática 2 2011 Tutorial

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Bioinformática 2 2011 Tutorial

Caricato da

Copyright:

Formati disponibili

Materia: Biologa Molecular

Carrera: Qumico Bacterilogo y Parasitlogo

Potrebbero piacerti anche