Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Bioinformtica
Bioinformtica
03-Jun-14
Experimental
Datos
Conocimientos
Bases de
datos
pblicas
Bioinformtica
03-Jun-14
Bioinformtica
Aprox. 27 years
> 145 Giga bases
http://www.ncbi.nlm.nih.gov/Genbank/genbankstats.html
http://www.wellcome.ac.uk/Education-resources/Teaching-and-education/Big-Picture/All-issues/Genes-Genomes-andHealth/WTDV027167.htm
03-Jun-14
Experimental
Datos
Conocimientos
Bases de
datos
pblicas
Experimental
Datos
Conocimientos
Bases de
datos
pblicas
03-Jun-14
Prediccin de
genes
La expresin
gnica podra
facilitar la
prediccin
gnica
03-Jun-14
Human Interactome
Virus-Host Interactome
Worm Interactome
Yeast Interactome
Bioinformtica
OBJETIVO
03-Jun-14
Bioinformtica
Bioinformtica
Qu es una base de datos?
Tipos de bases de datos
Primarias
GENBANK, PDB
Datos biolgicos originales
Secundarias
UNIPROT
Informacin procesada, manual o automticamente
Especializadas
TAIR, FlyBase
Campos de investigacin ms especficos / Organismos
03-Jun-14
Ensembl
Genomas en Ensembl
03-Jun-14
Genomas en Phytozome
Donde es posible, cada gen fue anotado con datos de PFAM, KOG, KEGG y PANTHER y con conexiones a
bases pblicas como RefSeq, UniProt, TAIR y JGI.
Organizacin-Anotacin de genomas
Identificar de elementos del genoma
Asociar informacin biolgica para esos elementos
03-Jun-14
Secuencias disponibles
10
03-Jun-14
11
03-Jun-14
12
03-Jun-14
Bioinformtica
Anlisis bioinformtico sobre tres tipos de datos:
-secuencias genmicas
-estructuras macromoleculares
-experimentos de genmica funcional (experimentos de expresin a gran escala,
ensayos de doble hbrido en levaduras a gran escala)
Tambin puede aplicarse a otros tipos de anlisis como rboles taxonmicos , relacin
entre vas metablicas, bsqueda de textos y manejos estadsticos de gran escala.
Bioinformtica
Tcnicas diversas
Alineamiento de secuencias primarias
Alineamiento de estructuras 3D
Construccin de rboles filogenticos
Prediccin y clasificacin de estructuras proteicas
Prediccin de estructura de RNAs
Prediccion de funcin proteica
Clustering o agrupamiento de datos de expresin gnica
Bsqueda de motivos y patrones conservados
El desarrollo de algoritmos es una parte importante de la bioinformtica.
13
03-Jun-14
Bioinformtica
Supuestos evolutivos
-El grado de conservacin de las secuencias en el alineamiento revela
asociaciones evolutivas y las variaciones reflejan los cambios que han ocurrido
durante la evolucin mediante sustituciones, inserciones y deleciones.
-Las relaciones evolutivas son tiles para caracterizar la funcin de distintas
secuencias, al transferir informacin a aquellas que no han sido
experimentalmente estudiadas.
Alineamiento global
CATGATGA
CTGAGAT
14
03-Jun-14
Alineamiento global
CATGATGA
CTGAGAT
CATGATGAC-TGA-GAT
Nos puede ayudar a entender la funcin de un nuevo gen
Programacin dinmica es la solucin ptima.... pero es lenta
A menudo, los mtodos heuristicos son mas usados (BLAST, BLAT)
Alineamiento locales
Matrices de puntajes
-Se construyen del anlisis de regiones muy conservadas de familias de protenas
-Comprobaron las frecuencias relativas de aparicin de los aminocidos y las probabilidades
de sustitucin entre ellos
-A cada posible identidad o sustitucin se le asigna una puntuacin basada en las
frecuencias observadas en el alineamiento de protenas
-Se da una puntuacin positiva a las sustituciones ms probables, mientras que
corresponde una puntuacin negativa para sustituciones menos probables
BLOSUM 62
15
03-Jun-14
Matrices de puntaje
Alineamiento de dos secuencias
BLOSUM90
PAM30
BLOSUM62
PAM120
BLOSUM45
PAM250
Menos divergente
Ms divergente
Globina humana
vs chimpanc
Globina humana
vs bacterial
16
03-Jun-14
Alineamientos mltiples
Tres o ms protenas (o acidos nucleicos) parcial o totalmente alineados.
17
03-Jun-14
Usos tpicos
Alineamientos mltiples
FAMILIAS
CONSERVACIN DE RESIDUOS
Al estudiar clones de cDNA, es una prctica comn secuenciarlos. Un alineamiento mltiple puede
mostrar si hay variantes o discrepancias en las secuencias
FILOGENIA
Cuando se examina los resultados de una bsqueda en bases de datos, ver dichos resultados como un
alineamiento mltiple puede ser muy til para revelar residuos o motivos conservados.
SPLICING ALTERNATIVO
Si una protena en estudio pertenece a un grupo de protenas, esta pertenencia puede proveer detalles
de la probable funcin, estructura y evolucin de dicha protena.
Los algoritmos de filogenia comienzan con alineamientos mltiples como dato inicial. La parte ms
crtica de hacer un rbol es realizar un alineamiento ptimo
ELEMENTOS REGULADORES
Las regiones regulatorias de muchos genes contienen sitios consenso para factores de transcripcin y
otros elementos conservados. Muchas de estas regiones se identifican en secuencias conservadas
mediante alineamientos mltiples
Prediccin de dominios
y motivos proteicos
Motivos
PROSITE
EMOTIF
Ejemplo: E-X(2)-[FHM]-X(4)-L
Dominios
PRINTS
BLOCKS
PFAM
PRODOM
SMART
INTERPRO
18
03-Jun-14
Prediccin de dominios
y motivos proteicos
Prediccin de genes
Categoras
De novo (basado en algoritmos)
19
03-Jun-14
Genmica funcional
Microarreglos o tcnicas de secuenciamiento masivo
Anlisis de coexpresin
20
03-Jun-14
Genmica Comparativa
Qu es igual y qu diferente?
Genes conservados entre organismos. La conservacin sugiere una funcin compartida e
importante. Por ej.: un 80% de genes humanos responsables de enfermedades se encuentran
en el genoma de Drosophila. Esto sugiere que estos genes podran cumplir funciones
importantes en otros eucariotas y fortalece la utilizacin de especies modelo para su uso en
investigacin.
Genes NO conservado entre organismos. Podran ser responsables de las diferencias
fenotpicas entre dos organismos. Por ej.: I) M.leprae y M. tuberculosis. La primera tiene el
tiempo de duplicacin celular mas prolongado. La comparacin de los genomas muestra una
reduccin del nmero de genes a casi la mitad, aunque muchos permanecen como
pseudogenes. II) Humano vs. Chimpac: sus genomas se parecen en un 98.75%, la protena
promedio difiere en dos aminocidos, la mayor divergencia la muestran los transcriptomas de
los testculos y la menor divergencia es en el cerebro.
Genmica Evolutiva
Cmo los genomas cambian con el tiempo? Cules son
las fuerzas evolutivas responsables de esos cambios?
Tasa de prdida de genes.
Duplicacin gnica.
Podra suceder que luego de la duplicacin una de las copias sufra mutaciones y se
convierta en pseudogen, o que se favorezca la estabilidad de dos copias
funcionales, o una copia sufre mutaciones que le confieren otra funcin.
21
03-Jun-14
Herramientas
Filogenia
Bases de Datos
Modelado de
estructuras
Motivos/Dominios
Prediccin
Genes
HMM
Promotores/Elementos
regulatorios
Alineamientos de a
pares /mltiples
22