Escuela Nacional de Ciencias Biolgicas 2011 Autores:
Dra. Addy Cecilia Helguera Repetto
Dra. Lizbel Esperanza Len Sols
Dr. Jorge Francisco Cerna Corts
Dr. Juan Arturo Casteln Vega En este tutorial se hacen sealamientos importantes mediante el uso de flechas, crculos y letras de colores. Empleando la base de datos ENTREZ, obtener la secuencia nucleotdica del gen aerA de Aeromonas hydrophila (Cdigo de acceso: DQ186611) y realizar los siguientes anlisis bioinformticos:
1- Obtener 5 secuencias homlogas al gen y delimitar las secuencias codificantes de los genes. 2- Realizar el alineamiento de las secuencias mediante el programa ClustalX. 3- Elaborar el rbol filogentico con los datos obtenidos en el punto anterior. Obtencin de las secuencias homologas a aerA de Aeromonas hydrophila 1.- Entrar a la pgina del NCBI.
2.- Seleccionar nucleotide (nucletido) y escribir el cdigo de acceso del gen a buscar (en este caso se seguir estudiando el mismo que para la prctica de Bioinformtica I) 1 Para guardar la secuencia en formato de texto se tiene que seleccionar la opcin FASTA (1) Se muestra una pgina en la cual aparece la secuencia completa del gen, la cual se guarda como archivo de texto (*.txt). Con la secuencia anterior se procede a realizar la bsqueda de secuencias homlogas, para lo cual se utiliza la herramienta Blast. En la pgina inicial del NCBI seleccionar Blast. Seleccionar la opcin Nucleotide blast. Se puede escribir el nmero de acceso de la secuencia en estudio o bien la secuencia en formato FASTA. Dar la orden BLAST. Escoger la base de datos en donde queremos realizar la bsqueda (others). 1 2 3 Aparece una pantalla en la que se muestran los alineamientos. Elegir seis secuencias. Al final de esta pantalla presionar el botn Get selected sequences (obtener la secuencia seleccionada). Seleccionar los 6 recuadros NO SELECCIONAR LAS SECUENCIAS DE GENOMA COMPLETO Y GUARDARLO COMO FORMATO DE TEXTO Una vez que se guardaron en formato FASTA es importante cambiarles el nombre a uno ms pequeo. Se guardan los cambios hechos. Alineamiento de las secuencias por medio del programa ClustalX Abrir el programa ClustalX y en File (Archivo) dirigirse a Load sequences (cargar secuencias). Seleccionar el archivo guardado anteriormente. Seleccionar multiple alignment mode (modo de alineamiento mltiple) En alignment (alineamiento) (1) seleccionar Do Complete alignment (Hacer el alineamiento completo) (2). Posteriormente aparece un recuadro en el cual se indica en donde y con que extensiones se guarda el dendrograma (*.dnd) (3) y el alineamiento *.aln) (4) y finalmente seleccionar align (alineamiento) (5). 1 2 3 4 5 Construccin del rbol filogentico empleando el programa MEGA 2.1 Al abrir el programa dirigirse a File (Archivo) para seleccionar Convert to MEGA format. Convertir el archivo obtenido del programa CLUSTALX. Se muestra un cuadro en el cual se selecciona la ubicacin del archivo generado en CLUSTALX con extensin .aln (flecha) y seleccionar OK. Posteriormente aparece una pantalla con las secuencias del alineamiento. 1- Cerrar archivo del alineamiento. 2- Se muestra una ventana en la cual se aceptan los cambios Hechos. 1- Abrir el archivo convertido a formato MEGA. 2- Seleccionar la secuencia codificante. Seleccionar el cdigo gentico standard (1) y cerrar la ventana (2). 1 2 Se realiza el estudio filogentico por medio del mtodo del vecino ms cercano. Primero se va a la opcin de Phylogeny (Filogenia) (1) y despus se selecciona el modelo Neighbor-Joining (vecino ms cercano) (2). 1 2 Una vez seleccionado el tipo de anlisis, se procede a determinar el nmero de diferencias. Aparece una pantalla donde se selecciona: Models (1) (Modelos), Nucleotide (Nucletido) (2) y finalmente No. of Differences (No. De diferencias) (3). 1 2 3 Se muestra un rbol con las distancias (con respecto al nmero de secuencias nucleotdicas) entre cada secuencia en estudio. Para poder guardar este rbol se va a File (Archivo) y se selecciona Export current tree (Exportar el rbol). Posteriormente se elige Image (Imagen) (1) para guardar la imagen (y ser vizualizada en otro programa) escoger la opcin marcada con la flecha (2). 1 2 Se realiza otro estudio filogentico basado en la distancia evolutiva. Se selecciona Models (Modelos) (1), Nucleotide (Nucletido) (2) y finalmente p-distance (Distancia P) (3). 1 2 3 Se muestra el rbol con las distancias evolutivas, en donde cero significa que no hay diferencias entre las secuencias. Empleando la base de datos ENTREZ, obtener la secuencia nucleotdica de aerA de Aeromonas hydrophila (Cdigo de acceso: DQ186611).
Delimitar la secuencia codificante del mismo y realizar una bsqueda de protenas relacionadas empleado la herramienta PSI-BLAST Se requiere bajar la secuencia del gen, como ya se ha hecho con anterioridad. 1 2
En esta informacin se puede observar que el gen completo consta de 2526 pb. Se muestra como resultado una hoja que se proporciona informacin general de la secuencia, es importante seleccionar la regin codificante marcada como CDS. Una vez que se selecciona la secuencia codificante, sta posee un tamao de 1482 pb. La secuencia se guarda en los formatos FASTA y texto . Para llevar a cabo la bsqueda de protenas se requiere tener la secuencia en Aminocidos (aa), para obtenerla se selecciona protein id (No. de acceso de la protena). Aparece una pgina que contiene informacin general, como el No. de aa. Cambiar a formato fasta (1) y Guardar como texto (2) Una vez que se obtiene la secuencia se guarda como archivo de texto (*.txt). Bsqueda de protenas relacionadas utilizando PSI-BLAST Para hacer este anlisis se ingresa primero a la pgina NCBI-BLAST y se selecciona protein blast. Se inserta el nmero de acceso o la secuencia de aminocidos. Elegir el algoritmo Psi- Blast (1) y posteriormente ejecutar BLAST (2). 1 2 Aparece una pantalla en la que se muestra el dominio presente en la protena, indicado dentro del valo. La pantalla se actualiza automticamente para mostrar las protenas relacionadas. En esta pantalla se observan los alineamientos significativos con las diferentes protenas. Hacer una bsqueda en Internet de sitios donde se puedan realizar los siguientes anlisis bioinformticos: determinacin de peso molecular y punto isoelctrico de protenas, anlisis de antigenicidad, bsqueda de pptidos seal y modelamiento de protenas. http://expasy.org/ Ir a proteomics Determinar las propiedades fisicoqumicas de la protena. En la pgina de Proteomics: 1- Seleccionar Protparam 1- Pegar la secuencia de la protena. 2- Elegir compute parameters Resultado: Aparece una pantalla en donde se muestran algunas propiedades tales como el punto isoelctrico (1), peso molecular (2) y composicin atmica (3), entre otras. 1 2 3 Bsqueda de pptidos seal Ir a proteomics (1) y seleccionar protein sequences and identification (2)
Identificacin de potenciales sitios de corte Pegar la secuencia de la protena (1) Seleccionar la (s) enzimas y/o los qumicos que deseamos probar (2) Presionar perform (3) Probables sitios de corte identificados Elaborar un modelo de estructura terciara de una protena con base en homologa a protenas reportadas Ir a 1. Proteomics 2. Protein structure 3. Ir a swiss-model repository Pegar la secuencia de la protena Estructura terciaria Protena Elaborar un modelo de estructura terciara de una protena 1. proteomics 2. Protein structure 3. Ir a swiss model workspace Trabajar en Automated mode 1. Poner la direccin electrnica 2. Titulo del proyecto 3. Pegar la secuencia de la protena Resultado Bsqueda de promotores en aerA de Aeromonas hydrophila Es necesario contar con la secuencia de aerA en formato FASTA Ir a http://www.fruitfly.org/ En el inferior de la pagina seleccionar Analysis Tools (herramientas de anlisis) Aparece una pgina que muestra las herramientas para el anlisis (Analysis tools) Elegir Promoter Prediction (prediccin del promotor) Para la obtencin de la secuencia del promotor realizar lo siguiente: Seleccionar la opcin de
1. prokaryote (procarionte).
2. no.
3. Ingresar en minimum promoter score (puntuacin mnima para el promotor) el valor de 0.9.
4. Pegar la secuencia del gen.
5. Dar click a submit (procesar). Aparece la pagina con el resultado Punto de inicio de la transcripcin Convertir una secuencia de DNA a RNA El programa que se utiliza es el DNAMAN Pgina principal del programa DNAMAN Para la conversin de la secuencia de DNA a RNA, realizar lo siguiente: 1. Seleccionar file (archivo). 2. Elegir new (nuevo). 3. Introducir la secuencia del gen.
4. Seleccionar la secuencia. 5- Ir a Sequence (secuencia). 6. Seleccionar load DNA1 (descargar DNA1). 7. Elegir from selection (desde seleccin). 8- Aparece un recuadro. Oprimir el botnaceptar. 9- Ir a DNA1.
10- Elegir RNA sequence (Secuencia de RNA). Aparece un recuadro que contiene el resultado Secuencia de RNA. Bsqueda de estructuras secundarias relevantes para la secuencia del RNA El programa que se utiliza es el Rnadraw Pgina principal del programa 1- Colocarse en el espacio en blanco y presionar el botn derecho del ratn. Aparece un cuadro.
2- Seleccionar New file (Archivo nuevo). La bsqueda de estructuras secundarias relevantes para la secuencia del RNA se realiza de la siguiente manera 3- Aparece un cuadro, donde hay que seleccionar la opcin de import text file (importar archivo de texto).
4- Seleccionar OK. 5- Aparece un recuadro donde se debe seleccionar el archivo del gen en estudio, el cual puede ser de DNA o RNA.
6- Elegir abrir. Se muestra el archivo. 7- Colocar el ratn sobre la secuencia y presionar el botn Derecho. Aparece un recuadro.
8- Seleccionar calculate (calcular) y se muestra otro recuadro.
9- Elegir structure(s) (estructura(s)). 10- Aparece un recuadro y se presiona calculate (calcular). Comienza a calcular la estructura. El programa termina de calcular la estructura secundaria del RNA.
11- Presionar en el signo +.
12- Elegir 2D radial drawing. Estructura secundaria del RNA. Resultado