Bioinformatica Aplicado A La Medicina Veterinaria

Indice
I. INTRODUCCIÓN………………………………………………………………………………………………3
II. RESUMEN……………………………………………………………………………………………………...4
III. REVISION BIBLIOGRFICA…………………………………………………………………………………..5
3.1. MARCO TEORICO…………………………………………………………………………………………….5
3.1.1 Reseña histórica de la Bioinformática……………………………………………………………………5
3.1.2 Bioinformática………………………………………………………………………………………………...6
3.1.3 objetivos de la bioinformática……………………………………………………………………………..6
 Organizar los datos en bases de datos…………………………………………………………..7
 Desarrollo de herramientas y recursos que ayudan en el análisis de datos………………7
 Utilizar estas herramientas para analizar los datos e interpretar los resultados…………8
3.1.4 Alcance de la bioinformática……………………………………………………………………………….8
Aplicación de la Bioinformática en las ciencias veterinarias………………………………………...8
3.1.5 Origen y ADN………………………………………………………………………………………………….9
3.1.6 Análisis de secuencia de ADN……………………………………………………………………………..9
 Alineación de secuencias de ADN………………………………………………………………..10
3.1.7 Algoritmo Genético………………………………………………………………………………………….11
3.1.8 Expresión genética………………………………………………………………………………………….11
3.1.9 ¿Cómo se puede aplicar la bioinformática?...................................................................................12
3.1.10 Nuevos temas de la bioinformática………………………………………………………………………13
3.1.11 Algunas sub disciplinas importantes dentro de la Bioinformática………………………………...14
3.1.12 Base de datos considerando nucleótidos……………………………………………………………….16
IV. CONCLUSIONES……………………………………………………………………………………………18
V. REFERENCIA BIBLIOGRAFICA…………………………………………………………………………..19
1
BIOINFORMATICA APLICADA EN LA MEDICINA VETERINARIA
I. INTRODUCCION
La bioinformática es el estudio de la información biológica que se

apoya en la teoría de la información, computación y matemáticas. La
bioinformática ha acelerado su desarrollo y utilización ante la gran
necesidad de descifrar la enorme cantidad de información, la cual ha
emergido y sido revelada por el proyecto del genoma humano,
estudios que se han extendido a otros genomas de animales o de
plantas.
El ácido desoxirribonucleico (ADN), la molécula que encierra el código

de la vida, controla directamente la biología fundamental de la vida y
determina las particularidades de cada organismo; por ello, en el caso
particular del humano, las variaciones y las mutaciones presentes en el
ADN genómico predisponen o condicionan el desarrollo de muchas
enfermedades que afectan a los humanos.
Imaginémonos que un técnico en computación quiere reparar la unidad

principal de una computadora: primero debe consultar el diagrama o
circuitos, etc., de esa unidad de computación. El técnico necesita de
esta información para entender cómo funciona dicha unidad y así
poder repararla. Pues bien, algo semejante pasa con los seres vivos,
vamos a verlo de una manera muy simple. Para entender cómo
funciona y cómo se puede modificar un ser viviente, es necesario
conocer sus planos maestros, es decir, su genoma, el cual está
constituido por toda la información presente en sus moléculas de ADN.
Podemos afirmar que “si no hay codificación, no hay información”. Esto
quiere decir que la información implica el uso de un código. Un ser
vivo, visto de una manera muy sintética, está conformado por dos
grandes sistemas interdependientes: uno, el genético, contiene y
perpetúa la información; otro, el metabólico–estructural, se ocupa de
capturar la materia y la energía del medioambiente; asimismo, opera el
sistema genético de información.
En general, cuando mejor conocemos un sistema, más rápido y de

manera eficiente lo modificamos, y la bioinformática se ocupa de
almacenar, analizar e interpretar la enorme cantidad de resultados que
se obtienen en forma de secuencias de ADN.
Este proceso se resume en tres grandes etapas de trabajo: una de
identificación de secuencias, otra de anotación de secuencias y una
más de anotación funcional. Por medio del programa de computación
BLAST se pueden encontrar secuencias parecidas.
Cuando se quiere conocer el genoma de un microorganismo, por
ejemplo de una bacteria, se obtienen millones de pequeñas partes de
2
su genoma, de alrededor de 700 pares de bases. Es necesario
entonces armar o ensamblar el genoma, lo cual consiste en solucionar
un enorme rompecabezas cuyas piezas son los pequeños fragmentos
de ADN bacteriano, y que podemos armar encontrando cuáles
segmentos se sobrelapan entre sí.
Con estos estudios del genoma bacteriano, a partir de la

bioinformática, se han analizado diversos géneros bacterianos, por
ejemplo el de las micobacterias y el de las nocardias, microorganismos
presentes en el medioambiente, los cuales se agrupan dentro de los
actinomicetos, algunos de gran utilidad para los humanos y animales,
por la producción de sus metabolitos secundarios, por ejemplo,
antibióticos, también patógenos que producen enfermedades tanto de
tipo sistémico como localizadas.
La bioinformática representa una nueva disciplina de la investigación

científica, la cual de una manera emergente se ha hecho
imprescindible para el mejor conocimiento del funcionamiento de los
seres vivos, con grandes potencialidades de aplicabilidad para el
manejo y tratamiento de muchas enfermedades, su estudio, a futuro,
estará enmarcado dentro de la “medicina genética”.
II. RESUMEN
El desarrollo de la Tecnología de la Información y la Comunicación ha

generado nuevos campos de conocimiento los cuales manejan un lenguaje
universal (lenguaje de las computadores u ordenadores) y a su vez
permiten utilizar los datos que en muchos de los casos son gratuitos y se
encuentran publicados en la web o internet pero que requiere una
formación académica en biología y sistemas informáticos para dar un uso
adecuado de ella. La interacción de diversas disciplinas permite tener una
visión diferente de la ciencia y permite extraer mayor información de
manera eficiente acelerando los procesos de investigación.
En la actualidad constantemente se crean programas que refinan las

búsquedas en bases de datos biológicas o que permiten identificar la
estructura molecular de forma gráfica apartir de la información presente en
una base de datos de proteínas, carbohidratos o lípidos; o reconocer la
composición de un gen en una especie animal o vegetal, todo esto es el
aporte de la interacción entre el conocimiento de la biología y la informática
reunidos en una disciplina conocida como Bioinformática.
3
III. REVISION BIBLIOGRFICA
3.1. MARCO TEORICO
3.1.1 Reseña histórica de la Bioinformática.
El inicio de la biología molecular, la bioquímica y la genética, ciencias

vinculadas a la informática, tuvo lugar aproximadamente hace 50 años,
cuando en 1953 Watson y Crick los padres del ADN30 propusieron el
modelo de la doble hélice para explicar su estructura. Watson y Crick
no percibieron la gran cantidad de volumen de información que se
generaría y que crecería en forma exponencial a partir de ese
momento.
En forma contraria a lo que podría suponerse, las herramientas

computacionales comenzaron a aplicarse en la biología molecular
mucho antes del comienzo de la era de la Internet o de los proyectos
de secuenciación del genoma31 y con la constante producción de
información biológica, la cual crecía a un ritmo lento comparado con el
actual volumen de generación de datos, se creó la necesidad de
recopilar y organizar toda la información generada a partir de dichos
proyectos de secuenciación.
En 1965, Margaret Dayhoff creó la primera base de datos de

secuencias biológicas, en la cual almacenó y puso a disposición de la
comunidad científica todas las secuencias de ADN y proteínas
descritas hasta la fecha. Ocho años más tarde, en 1973, se anunció y
creó la base de datos más antigua que se conoce y la cual sigue
vigente, el Protein Data Bank32.
Hoy, 27 años después de su lanzamiento, además de servir como

base de datos de estructuras de proteínas, también lo hace como
reservorio de estructuras de toda clase de macromoléculas conocidas:
ADN, ARN y grandes complejos proteicos asociados con todo tipo de
biomoléculas.
Durante 1978, de nuevo Margaret Dayhoff fue la encargada de generar

la primera matriz de substitución de aminoácidos, denominada PAM33.
Tal avance en la interpretación de patrones de secuencia, obtenidos a
partir de información biológica, abrió el camino a los estudios sobre
evolución molecular que actualmente aportan una visión más
aproximada a las verdaderas relaciones filogenéticas entre especies.
En la década de los años 80, la bioinformática ya tenía nombre en el
ámbito de la investigación científica, y teniendo conocimiento de ello,
varios grupos de investigación de prestigio, dieron origen a la base de
datos más conocida en el mundo, el GenBank34. Dicho proyecto fue
4
financiado por los National Institutes of Health de los Estados Unidos y
otras instituciones gubernamentales, como el United States
Departament of Energy y el United States Department of Defense.
Pocos años después de la creación del GenBank, se generó su versión
europea y asiática, conocidas como la base de datos EMBL35 y
DDBJ36 en 1981 y 1984, respectivamente. En 1985 se reportó el
algoritmo FASTA o FAST-All de comparación de secuencias, el cual
directamente operaba como motor de búsqueda de secuencias
similares dentro de la base de datos GenBank.
Durante los años 1987 a 1990, se dio impulso a las bases de datos
para secuencias de proteínas que dio como resultado la creación de
SwissProt37 y PIR38. En 1990, se originó otro de los hitos más
importantes de la bioinformática. La implementación del algoritmo
BLAST39 revolucionó completamente la exploración y búsqueda de
secuencias biológicas en bases de datos
En 1993 se inició la era genómica con la ejecución del proyecto de

secuenciación de genoma humano. Siendo éste un proyecto tan
ambicioso, se logro secuenciar los primeros genomas no virales. En el
año 2003, se finalizó la secuencia definitiva del genoma humano, este
hecho se logró gracias a la proyección y explotación del potencial de la
industria con base biotecnológica.
3.1.2 Bioinformática
La bioinformática es un área emergente interdisciplinaria que se ocupa

de la aplicación de la informótica a la recopilación, almacenamiento,
organización, análisis, manipulación, presentación y distribución de
información relativa a los datos biológicos o médicos, tales como
macromoléculas (por ejemplo DNA o proteínas).
Ha evolucionado para servir de puente entre las observaciones (datos)

y el conocimiento que se deriva (información) sobre, por ejemplo, la
función de los procesos y, posteriormente, la aplicación (conocimiento).
3.1.3 objetivos de la bioinformática

Uno de los principales objetivos de la bioinformática es comprender
mejor una célula viva y cómo funciona a nivel molecular. Mediante el
análisis de secuencias moleculares en bruto y de datos estructurales,
la investigación bioinformática puede generar nuevas ideas y
proporcionar una perspectiva global de la célula.
La razón de que las funciones de una célula pueden entenderse mejor

mediante el análisis de datos de las secuencias, es, porque el flujo de
5
información genética está dictado por el “dogma central” de la biología,
en la cual el ADN se transcribe a ARN, y este se traduce en proteínas.
Las funciones celulares se llevan a cabo principalmente por proteínas
cuyas capacidades están determinadas por sus secuencias. Por lo
tanto, la solución de problemas funcionales utilizando la secuencia y, a
veces los enfoques estructurales han demostrado ser una tarea
fructífera.
 Organizar los datos en bases de datos
La bioinformática organiza los datos permitiendo a los investigadores

acceder a la información existente y publicar nuevos datos a medida
que éstos se producen. Cabe señalar que la información almacenada
en estas bases de datos es inservible hasta que se analiza. Por lo
tanto, la curación de datos es una tarea esencial realizada por la
bioinformática.
Durante estos años, el almacenamiento de datos en las BBDD ha

crecido exponencialmente. En la siguiente figura podemos ver el
crecimiento de la International Nucleotide Sequence Database
Collection.
 Desarrollo de herramientas y recursos que ayudan en el

análisis de datos
Por ejemplo, uno de los intereses principales en la biología es

comparar una secuencia nueva de una proteína con secuencias
previamente caracterizadas. Se necesita programas como BLAST
(Basic Local Alignment Search Tool) que encuentra las regiones de
similitud local entre las secuencias. Esto nos permitiría predecir
funciones.
6
 Utilizar estas herramientas para analizar los datos e
interpretar los resultados
La bioinformática ha revolucionado los estudios biológicos. Si,

tradicionalmente, estos estudios se concentraron en los detalles de los
sistemas, en la actualidad, se pueden realizar análisis globales con
todos los datos disponibles. Esto permite descubrir principios comunes
y nuevas características de los sistemas
biológicos.
3.1.4 Alcance de la bioinformática
La Bioinformática se compone de dos subcampos: el desarrollo de

herramientas informáticas y bases de datos, y la aplicación de estas en
la generación de conocimientos biológicos para comprender mejor los
sistemas vivos. Estos dos subcampos son complementarios entre sí.
El desarrollo de herramientas incluye el software de grabación de la
secuencia, el análisis estructural y funcional, así como la construcción
y la conservación de bases de datos biológicas. Estas herramientas se
utilizan en varias áreas de investigación genómica y biología molecular
como el análisis de la secuencia molecular.
El análisis de los datos biológicos a menudo genera nuevos problemas

y desafíos que a su vez estimulan el desarrollo de nuevas y mejores
herramientas computacionales. Las áreas de análisis de secuencias
incluyen la alineación de secuencias, la búsqueda en la base de datos
de secuencia, el descubrimiento de patrones, la reconstrucción de las
relaciones evolutivas, y la formación y la comparación del genoma.
APLICACIÓN DE LA BIOINFORMÁTICA EN LAS CIENCIAS VETERINARIAS
Básicamente, los sistemas informáticos que se emplean en estos campos son:
 Bases de datos (Información Científica)

 Software para visualización de aplicaciones
 Programas para control de reactivos, geles y otros materiales
 Generación y ensamblaje de secuencias
 Programas para análisis de secuencias, Alineación de secuencias.
 Programas para predicción de estructura de proteínas
 Paquetes de integración y ensamblaje de mapas genéticos
 Software para clasificación y comparación
 Técnicas de Inteligencia Artificial
 Gestión de datos
 Bases de datos locales o accesibles mediante redes de comunicaciones.
7
 Literatura médica y científica unida a las secuencias.
 Distribución de datos
 Redes de comunicaciones
 Aplicaciones
 Gestión de datos en el laboratorio
 Automatización de experimentos
 Ensamblaje de secuencias contiguas
 Predicción de dominios funcionales en secuencias génicas
 Búsquedas en las bases de datos de estructuras
 Predicción de genes
3.1.5 Origen y ADN
El desarrollo de la bioinformática es el resultado del increíble avance

producido en los últimos años en el campo de la biología molecular y
en el de las ciencias de la computación. Su origen se remonta a la
mitad del siglo pasado, cuando se logró comprender la estructura
tridimensional del ADN, la molécula responsable de transmitir la
herencia genética. Luego, el inicio del proyecto del genoma humano a
finales de los '80 propició un rápido desarrollo de esta disciplina debido
al gran volumen de datos biológicos generados y la necesidad de
analizarlos. Como dato, las secuencias de las proteínas contienen en
promedio entre 100 y 5000 aminoácidos y las secuencias de ADN son
aún más grandes, el ADN de la bacteria E. Coli tiene 4.7 millones de
bases y el del ser humano 3.3 billones.
Esta explosión de información sobre secuencias genómicas originó

una demanda de herramientas computacionales e_cientes para
gestionar y analizar los datos. A comienzos de la década del 2000, se
completó la secuenciación del ADN de los seres humanos lo que abrió
nuevos caminos en la investigación médica y científica. Así, el futuro
de la medicina comenzó a verse desde otra perspectiva, orientando las
investigaciones a la búsqueda de una terapéutica personalizada y el
testeo más eficiente de fármacos; de esta manera, la bioinformática se
convirtió en uno de los pilares fundamentales de las investigaciones
biomédicas de vanguardia.
3.1.6 Análisis de secuencia de ADN
El análisis de la secuencia es el descubrimiento de similitudes

funcionales y estructurales, y las diferencias entre múltiples secuencias
biológicas. Esto puede hacerse comparando las nuevas
(desconocidas) con las bien-estudiadas y anotadas (conocidas)
secuencias.
Los científicos han encontrado que dos secuencias similares poseen el
mismo papel funcional, vía de reglamentación o bioquímica, y la
8
estructura de la proteína. Si hay dos secuencias similares de diferentes
organismos, se dice que son secuencias homólogas.
 Alineación de secuencias de ADN
La comparación de la secuencia se encuentra en el centro del

análisis de la bioinformática. Se trata de un importante primer paso
hacia el análisis estructural y funcional de las secuencias
recientemente determinadas. Como nuevas secuencias biológicas se
están generando a un ritmo exponencial, la comparación de
secuencias está cobrando cada vez más importancia para extraer la
inferencia funcional y evolutiva de una nueva proteína con las
proteínas ya existentes en la base de datos.
El proceso más fundamental en este tipo de comparación es la

alineación de secuencias. Este es el proceso por el cual se
comparan las secuencias mediante la búsqueda de patrones de
caracteres comunes y el establecimiento de los residuos de
correspondencia entre las secuencias relacionadas. El alineamiento
de pares de secuencias es el proceso de alineación de dos
secuencias, y es la base de la búsqueda de similitudes en la base de
datos y el alineamiento de secuencias múltiples. Un concepto
importante en el análisis de la secuencia es una homología de
secuencia. Cuando dos secuencias son descendientes de un origen
evolutivo común, se dice que tienen una relación homóloga u
homología. Un término relacionado, pero diferente es la similitud de
secuencias, que es el porcentaje de residuos alineados que son
similares en las propiedades físico-químicas tales como el tamaño, el
costo, y la hidrofobicidad.
Es importante distinguir la homología de secuencia del término

relacionado similitud de secuencia, porque los dos términos son
confundidos a menudo por algunos investigadores que los utilizan
indistintamente en la literatura científica. Para ser claros, la
homología de secuencia es una inferencia o conclusión de una
relación ancestral común extraída de la comparación de similitud de
secuencias, cuando las dos secuencias comparten un alto grado de
similitud suficiente.
Por otro lado, la similitud es un resultado directo de la observación

de la alineación de secuencia. La similitud de secuencias se puede
cuantificar con porcentajes, la homología es un estado cualitativo.
Por ejemplo, se puede decir que dos secuencias comparten el 40%
de similitud. Es incorrecto decir que las dos secuencias comparten el
40% de homología. Las secuencias son homólogas o no homólogas.
Por lo general, si el nivel de similitud de las secuencias es lo
suficientemente alto, se puede deducir una relación común evolutiva.
9
Al tratar con los problemas reales de investigación, no siempre está
claro qué nivel de similitud se puede inferir de las relaciones
homólogas. La respuesta depende del tipo de secuencias que se
examinen y las longitudes de la secuencia. Las secuencias de
nucleótidos consisten en sólo cuatro caracteres, y por lo tanto, las
secuencias no relacionadas tienen por lo menos un 25% de
posibilidad de ser idénticos. Para las secuencias de proteínas, hay
veinte posibles residuos de aminoácidos, y por lo tanto dos
secuencias no relacionadas pueden coincidir con el 5% de los
residuos por una oportunidad al azar. Si la diferencia está permitida,
el porcentaje podría aumentar al 10-20%. La longitud de la secuencia
es también un factor crucial. Cuanto más corta sea la secuencia,
mayor es la probabilidad de que cierta aproximación se puede
atribuir a la casualidad. Cuanto más larga sea la secuencia, es
menos probable que la coincidencia en el mismo nivel de similitud se
deba a la casualidad.
3.1.7 Algoritmo Genético
El algoritmo genético ha sido aplicado con éxito para resolver muchos

problemas prácticos en la bioinformática. Los algoritmos genéticos se
han utilizado para resolver problemas de alineación de secuencias
múltiples. Un enfoque bien conocido es SAGA, el cual crea una
población inicial de alineaciones al azar y cuasi-evoluciona. Se
considera que SAGA supera a la solución más común de los
problemas relacionados con alineación múltiple que utilizan un enfoque
progresivo.
Las nuevas técnicas tienden a combinar el algoritmo genético con

otros métodos computacionales, tales como el Método del K-vecino10
más cercano y la red neuronal de Keedwell y Narayanan, para resolver
los problemas de la expresión génica. Se les denomina métodos
hibrido-genéticos. Keedwell y Narayanan utilizan un algoritmo genético
para seleccionar un conjunto de genes para la clasificación y el uso de
una red neuronal para determinar la idoneidad de los genes.
3.1.8 Expresión genética
Con muy pocas excepciones, cada célula del cuerpo contiene un

conjunto completo de cromosomas y genes idénticos, pero solo una
fracción de estos genes se activan, sin embargo, es el subconjunto que
se “expresa” el que le confiere propiedades únicas para cada tipo de
célula.
La expresión génica es el término utilizado para describir la

transcripción de la información contenida en el ADN, el repositorio de
la información genética, en las moléculas de ARNm o mensajero que
10
se traducen en las proteínas que realizan la mayor parte de las
funciones críticas de las células. Los científicos estudian los tipos y
cantidades de ARNm producido por la célula para saber qué genes se
expresan, y a su vez proporcionan la información detallada sobre cómo
la célula responde a sus necesidades cambiantes.
La expresión de genes es un proceso muy complejo y bien regulado

que permite a la célula responder dinámicamente a los estímulos
ambientales y a sus propias necesidades cambiantes. Este mecanismo
actúa como un interruptor “on/off” para controlar que genes se
expresan en una célula, así como un control de volumen que aumenta
o disminuye el nivel de expresión de determinados genes como sea
necesario.
3.1.9 Anotación del genoma
Antes de depositar en una base de datos la secuencia ensamblada,

esta tiene que ser analizada por sus características biológicas útiles.
El proceso de anotación del genoma contiene las observaciones de las
características. Esto implica dos pasos: la predicción de genes y la
asignación funcional. Algunos ejemplos de las anotaciones terminadas
de genes en GenBank se han descrito en la sección de bases de datos
biológicas.
Como un ejemplo del mundo real, la anotación de genes del genoma

humano cuenta con una combinación de predicción teórica y
verificación experimental. La estructura de los genes se predijo por
primera vez por programas de predicción ab initio exón como
GENSCAN o FgenesH. La predicción se verifica por medio de
búsquedas BLAST contra una base de datos de secuencia. Los genes
predichos están adicionalmente comparados con las secuencias ADNc
y EST experimentalmente determinadas usando programas de
alineamiento por pares, como GeneWise, Spidey, SIM4 y
EST2Genome.Todas las predicciones son revisadas manualmente por
los curadores humanos.
3.1.10 ¿Cómo se puede aplicar la bioinformática?
La Bioinformática no sólo se ha convertido en una ciencia esencial

para la genómica básica y la investigación en biología molecular,
también está teniendo un gran impacto en muchas áreas de la
biotecnología y las ciencias biomédicas. Tiene aplicaciones, que están
basadas por ejemplo, en los conocimientos de diseño de fármacos,
análisis forense de ADN y Biotecnología agrícola.
11
Un enfoque basado en la informática reduce significativamente el
tiempo y el costo necesario para desarrollar medicamentos con mayor
potencia y con menos efectos secundarios, y una menor toxicidad que
el uso del tradicional ensayo y error.
En medicina forense, los resultados de los análisis filogenéticos

moleculares han sido aceptados como pruebas en los tribunales
penales. Alguna estadística bayesiana sofisticada y basada en la
verosimilitud de los métodos de análisis de ADN se han aplicado en el
análisis forense de la identidad.
Vale la pena mencionar que la genómica y la bioinformática están a

punto de revolucionar los sistemas de salud mediante el desarrollo de
la medicina personalizada. La secuencia genómica de alta velocidad
junto con la tecnología informática sofisticada le permitirá a un médico
en una clínica secuenciar el ADN de un paciente de forma rápida, y
detectar así posibles mutaciones dañinas convirtiéndose el genoma en
protagonista para participar en el diagnóstico precoz y el tratamiento
eficaz de las enfermedades.
Las herramientas de la bioinformática se están utilizando en la

agricultura también, las bases de datos del genoma de plantas y el
análisis de expresión génica de este perfil han desempeñado un papel
importante en el desarrollo de nuevas variedades de cultivos que
tienen una mayor productividad y más resistencia a las enfermedades.
El campo de la bioinformática desempeña un papel cada vez más
creciente en el estudio de problemas biológicos fundamentales, debido
al crecimiento exponencial de la secuencia y a la información
estructural.
3.1.11 Nuevos temas de la bioinformática
A pesar de las dificultades, no hay duda de que la bioinformática es un

campo que tiene un gran potencial para revolucionar la investigación
biológica en las próximas décadas. En la actualidad, el campo está en
una importante fase de expansión. Además de proporcionar
herramientas de cálculo más fiables y más rigurosas para la secuencia,
estructura, y el análisis funcional, el mayor desafío para el futuro
desarrollo de la bioinformática es el desarrollo de herramientas para el
esclarecimiento de las funciones e interacciones de todos los
productos de los genes en una célula. Esto presenta un desafío
enorme, ya que requiere la integración de los diferentes campos de
conocimiento biológico y una variedad de complejas herramientas
matemáticas y estadísticas.
12
Para tener una mejor comprensión de las funciones celulares, son
necesarios los modelos matemáticos para simular una amplia variedad
de reacciones intracelulares y las interacciones a nivel de células
enteras. Esta simulación molecular de todos los procesos celulares se
denomina biología de sistemas. Alcanzar esta meta representa un gran
paso hacia la comprensión plena de un sistema vivo.
Es por eso que la simulación a nivel de sistema y la integración son

consideradas el futuro de la bioinformática. Este tipo de modelos de
redes complejas y hacer predicciones sobre su conducta presenta
grandes retos y oportunidades para los bioinformáticos.. El objetivo
último de esta iniciativa es transformar la biología de una ciencia
cualitativa a una ciencia cuantitativa y de predicción. Este es un
momento verdaderamente emocionante para la bioinformática.
3.1.12 Algunas sub disciplinas importantes dentro de la Bioinformática
Se basan en el desarrollo de nuevos algoritmos (fórmulas matemáticas

o métodos de resolución de problemas que emplean una secuencia
mecánica de pasos) y estadísticos con los cuales se pueda relacionar
partes de un conjunto enorme de datos, como por ejemplo métodos
para localizar un gen dentro de una secuencia, predecir estructura o
función de proteínas y poder agrupar secuencias de proteínas en
familias relacionadas que aseguren relaciones entre miembros de
grandes bases de datos. Igualmente el análisis e interpretación de
varios tipos de datos (nucleótidos, secuencias de aa, dominios de
proteínas, estructuras proteicas).Desarrollo e implementación de
herramientas que capaciten el acceso eficiente y manejo de diferentes
tipos de información.
La información obtenida es almacenada en equipos pertenecientes a

centros de investigación conocidos como servidores y ellos son las
fuentes originales de información, mantienen las bases de datos de
mayor importancia, y adicionalmente proporcionan acceso a las
mismas así como a un gran número de facilidades para procesar y
digerir esta información. La bioinformática se nutre especialmente de
dos grandes áreas del conocimiento, las ciencias biológicas y las
ciencias de la computación, dado este origen existen dos grandes
líneas de trabajo: La primera en la cuál las ciencias de la computación
utilizan modelos de las biológicas, ejemplo de ello lo constituyen las
redes neurales, los algoritmos genéticos, computación con ADN, entre
otras. La segunda en la cuál las ciencias biológicas utilizan modelos y
herramientas de las ciencias de la computación, como se menciona
anteriormente.
13
Tal vez una de las principales herramientas a utilizar son las Bases de
Datos las cuales se han creado considerando la creciente información
y estas pueden ser públicas o privadas (con acceso restringido o con
un valor económico) manejadas por instituciones de diversos sectores
de producción.
Las primeras bases de datos públicas de amplio interés biológico

fueron las bases de datos de secuencias de ácidos nucleicos iniciadas
en el EMBL, el Laboratorio Europeo de Biología Molecular. Esta
iniciativa fué imitada enseguida en los Estados Unidos de
Norteamérica con la base de datos GenBank, y se extendió pronto a
otras bases de datos de macromoléculas como SwissProt, PIR
(secuencias de proteínas) o PDB (Bases de Datos para Proteínas pero
considerando las estructuras 3D). Las instituciones involucradas han
procurado constantemente facilitar el acceso a las mismas con todos
los medios a su alcance, incluyendo -por supuesto- la Web.
La Medicina molecular y la Biotecnología constituyen dos áreas

prioritarias científico tecnológicas para el desarrollo e Innovación
Tecnológica. El desarrollo en ambas áreas está estrechamente
relacionado. En ambas áreas se pretende potenciar la investigación
genómica y postgenómica así como de la bioinformática, herramienta
imprescindible para el desarrollo de estas. Debido al extraordinario
avance de la genética molecular y la genómica, la Medicina Molecular
se constituye como arma estratégica del bienestar social del futuro
inmediato. Se pretende potenciar la aplicación de las nuevas
tecnologías y de los avances genéticos para el beneficio de la salud.
Dentro de las actividades financiables, existen acciones estratégicas,

de infraestructura, centros de competencia y grandes instalaciones
científicas. En esta área, la dotación de infraestructura se plasmará en
la creación y dotación de unidades de referencia tecnológica y centros
de suministro común, como Centros de Bioinformática, que cubran las
necesidades de la investigación en Medicina Molecular. En cuanto
centros de competencia, se crearán centros de investigación de
excelencia en hospitales en los que se acercará la investigación básica
a la clínica, así como centros distribuidos en red para el apoyo a la
secuenciación, DNA microarrays y DNA chips, sumado, en
coordinación con la red de centros de investigación genómica y
proteómica que se proponen en el área de Biotecnología. En esta área
la genómica y proteómica se fundamenta como acción estratégica o
instrumento básico de focalización de las actuaciones futuras.
Las tecnologías de la información jugarán un papel fundamental en la

aplicación de los desarrollos tecnológicos en el campo de la genética a
la práctica médica como refleja la presencia de la Bioinformática
médica y la Telemedicina dentro de las principales líneas en patología
14
molecular. La aplicación de los conocimientos en genética molecular y
las nuevas tecnologías son necesarios para el mantenimiento de la
competitividad del sistema sanitario no sólo paliativo sino preventivo.
La identificación de las causas moleculares de las enfermedades junto
con el desarrollo de la industria biotecnológica en general y de la
farmacéutica en particular permitirán el desarrollo de mejores métodos
de diagnóstico, la identificación de dianas terapéuticas y desarrollo de
fármacos personalizados y una mejor medicina preventiva.
El Centro Nacional para la Información en Biotecnología NCBI (del

ingles National Center for Biotechnology Information) depende de la
Librería Nacional de Medicina NLM (del ingles National Library of
Medicine) y el Instituto Nacional de Salud NIH (del ingles National
Institutes of Health) coordina junto al Instituto de Bioinformática
Europeo EBI (del ingles European Bioinformatics Institute) y el Banco
de Datos de DNA de Japón DDBJ (del ingles DNA Data Bank of Japan)
el mantenimiento sincronizado de las principales bases de datos de
interés biológico. Al igual que el EBI, el NCBI también dispone de un
sistema de consulta de las bases de datos que mantiene, en este caso
basado en Entrez. Entrez permite consultar no solo bases de datos
sino también la biblioteca digital del NCBI, que incluye un número
creciente de libros entre los cuales figuran textos de referencia
reconocidos internacionalmente.
Una de las áreas de mayor interés para las ciencias biológicas en

general es la utilización de Bases de Datos las cuales reúnen
información de diferentes tipos y son pilares para la construcción del
conocimiento generado a nivel mundial.
3.1.13 Bases de Datos considerando nucleótidos
La colaboración de las tres bases de datos más importantes hace

posible acceder a casi toda la información de secuencias de ADN
desde cualquiera de sus tres sedes:
 EMBL-BANK en el Instituto europeo de Bioinformática (EBI)

Enlace externo: EMBLBANK
(http://www.ebi.ac.uk/embl/index.html)
 DNA Data Bank of Japan (DDBJ) en el Centro de
Información Biológica (CIB) Enlace externo: DDBJ
(http://www.ddbj.nig.ac.jp/)
 GenBank en el Centro Nacional de Información
Biotecnológica (NCBI) Enlace externo: GenBank Entrez
Nucleotide
(http://www.ncbi.nlm.nih.gov:80/entrez/query.fcgi?db=Nucleot
ide)
15
Bases de Datos considerando proteínas
Bases de datos de secuencias de aminoácidos
 Swissprot contiene secuencias anotadas o comentadas, es

decir, cada secuencia ha sido revisada, documentada y
enlazada a otras bases de datos. Enlace externo: Swissprot en
el EBI (http://www.ebi.ac.uk/swissprot/access.html), Swissprot
en Expasy (http://us.expasy.org/sprot/)
 TrEMBL por Translation of EMBL Nucleotide Sequence
Database incluye la traducción de todas las secuencias
codificantes derivadas del (EMBL-BANK) y que todavía no han
podido ser anotadas en Swissprot. Enlace externo: TrEMBL
(http://www.ebi.ac.uk/trembl/)
 PIR por Protein Information Resource está dividida en cuatro
sub-bases que tienen un nivel de anotación decreciente. Enlace
externo: PIR (http://pir.georgetown.edu/)
 ENZYME enlaza la clasificación de actividades enzimáticas
completa a las secuencias de Swissprot. Enlace externo:
ENZYME (http://us.expasy.org/enzyme/)
 PROSITE contiene información sobre la estructura secundaria
de proteínas, familias, dominios, etc. Enlace externo: PROSITE
(http://us.expasy.org/prosite/)
 INTERPRO integra la información de diversas bases de datos
de estructura secundaria como PROSITE, proporcionando
enlaces a otras bases de datos e información más extensa.
Enlace externo: INTERPRO
(http://www.ebi.ac.uk/interpro/index.html)
 PDB por Protein Data Bank es la base de datos de estructura
terciaria 3-D de proteínas que han sido cristalizadas. Enlace
externo: PDB (http://www.rcsb.org/pdb/)
Bases de Datos considerando genomas
 Ensembl integra genomas eucariotas grandes, por el

momento contiene genoma humano, ratón, rata, fugu,
zebrafish, mosquito, Drosophila, C. elegans, y C. briggsae.
Enlace externo: Ensembl
(http://www.ebi.ac.uk/ensembl/index.html)
 Genomes server y TIGR son portales con información y/o
enlaces de todos los genomas secuenciados por el
momento, desde virus a humanos. Enlace externo: Genome
Server (http://www.ebi.ac.uk/genomes/index.html) Enlace
externo: TIGR (http://www.tigr.org/)
 Wormbase es el portal del genoma de gusano C. elegans.
Enlace externo:Wormbase (http://www.wormbase.org/)
16
IV. CONCLUSIONES
 Bioinformática es un campo donde la computación y la ingeniería de

software tienen un alto potencial de aplicación
 El desarrollo de la bioinformática requiere de avances significativos
en investigación en temas de ingeniería
 Existen posibilidades de proyectos en diferentes campos de la
ingeniería de sistemas.
17
V. REFERENCIA BIBLIOGRAFICA
Aplicaciones virtuales en biomedicina [en línea]. ESCOBAR ROA, Juan

Miguel. Facultad de Ingeniería Electrónica, Universidad El Bosque: Bogotá,
2006 - [citado el 30 de marzo de 2011]. Vol 1 No. 1.
BALDI, Pierre y BRUNAK, Soren. Bioinformatics: The Machine Learning

Approach. 2 ed. Londres: The MIT Press. 2001.
BIOTIC Area de Bioinformática y Salud Pública. s.f. Bioinformática

Asociada/Metodología/Análisis de datos [en línea]. Madrid, España.
18

Bioinformatica Aplicado A La Medicina Veterinaria

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Bioinformatica Aplicado A La Medicina Veterinaria

Caricato da

Copyright:

Formati disponibili

Indice

III. REVISION BIBLIOGRFICA…………………………………………………………………………………..5

3.1. MARCO TEORICO…………………………………………………………………………………………….5

3.1.1 Reseña histórica de la Bioinformática……………………………………………………………………5

3.1.3 objetivos de la bioinformática……………………………………………………………………………..6

 Organizar los datos en bases de datos…………………………………………………………..7

 Desarrollo de herramientas y recursos que ayudan en el análisis de datos………………7

3.1.4 Alcance de la bioinformática……………………………………………………………………………….8

Aplicación de la Bioinformática en las ciencias veterinarias………………………………………...8

3.1.5 Origen y ADN………………………………………………………………………………………………….9

3.1.6 Análisis de secuencia de ADN……………………………………………………………………………..9

 Alineación de secuencias de ADN………………………………………………………………..10

3.1.7 Algoritmo Genético………………………………………………………………………………………….11

3.1.8 Expresión genética………………………………………………………………………………………….11

3.1.9 ¿Cómo se puede aplicar la bioinformática?...................................................................................12

3.1.10 Nuevos temas de la bioinformática………………………………………………………………………13

3.1.11 Algunas sub disciplinas importantes dentro de la Bioinformática………………………………...14

3.1.12 Base de datos considerando nucleótidos……………………………………………………………….16

La bioinformática es el estudio de la información biológica que se

El ácido desoxirribonucleico (ADN), la molécula que encierra el código

Imaginémonos que un técnico en computación quiere reparar la unidad

En general, cuando mejor conocemos un sistema, más rápido y de

Con estos estudios del genoma bacteriano, a partir de la

La bioinformática representa una nueva disciplina de la investigación

El desarrollo de la Tecnología de la Información y la Comunicación ha

En la actualidad constantemente se crean programas que refinan las

3.1. MARCO TEORICO

3.1.1 Reseña histórica de la Bioinformática.

El inicio de la biología molecular, la bioquímica y la genética, ciencias

En forma contraria a lo que podría suponerse, las herramientas

En 1965, Margaret Dayhoff creó la primera base de datos de

Hoy, 27 años después de su lanzamiento, además de servir como

Durante 1978, de nuevo Margaret Dayhoff fue la encargada de generar

En 1993 se inició la era genómica con la ejecución del proyecto de

La bioinformática es un área emergente interdisciplinaria que se ocupa

Ha evolucionado para servir de puente entre las observaciones (datos)

3.1.3 objetivos de la bioinformática

La razón de que las funciones de una célula pueden entenderse mejor

 Organizar los datos en bases de datos

La bioinformática organiza los datos permitiendo a los investigadores

Durante estos años, el almacenamiento de datos en las BBDD ha

 Desarrollo de herramientas y recursos que ayudan en el

Por ejemplo, uno de los intereses principales en la biología es

La bioinformática ha revolucionado los estudios biológicos. Si,

3.1.4 Alcance de la bioinformática

La Bioinformática se compone de dos subcampos: el desarrollo de

El análisis de los datos biológicos a menudo genera nuevos problemas

APLICACIÓN DE LA BIOINFORMÁTICA EN LAS CIENCIAS VETERINARIAS

Básicamente, los sistemas informáticos que se emplean en estos campos son:

 Bases de datos (Información Científica)

3.1.5 Origen y ADN

El desarrollo de la bioinformática es el resultado del increíble avance

Esta explosión de información sobre secuencias genómicas originó

3.1.6 Análisis de secuencia de ADN

El análisis de la secuencia es el descubrimiento de similitudes

 Alineación de secuencias de ADN

La comparación de la secuencia se encuentra en el centro del

El proceso más fundamental en este tipo de comparación es la

Es importante distinguir la homología de secuencia del término

Por otro lado, la similitud es un resultado directo de la observación

3.1.7 Algoritmo Genético

El algoritmo genético ha sido aplicado con éxito para resolver muchos

Las nuevas técnicas tienden a combinar el algoritmo genético con