Principios de Bioinformática Aplicada Al Diagnóstico Microbiológico PDF

CLASE 9: PRINCIPIOS DE BIOINFORMÁTICA APLICADA AL DIAGNÓSTICO MICROBIOLÓGICO
Y A LA TERAPIA ANTIMICROBIANA.
Victor G. Ustedes se van a encontrar con que, aunque hay herramientas de la microbiología que
vienen desde principios de 1900, como por ejemplo la tinción de Gram y las primeras estrategias
de cultivo de las bacterias, también hay estrategias útiles para el diagnóstico y el tratamiento de
las enfermedades infecciosas que son de ahora, que son de los últimos 5 o 10 años y que tal vez
no estén completamente validadas, pero son herramientas a las que ustedes se van a enfrentar
como profesionales, porque son la humanización de la microbiología, son las estrategias
diagnósticas y de tratamiento más robustas que hay y se van a convertir en las herramientas que
van a estar disponibles para ustedes dentro de 5 a 10 años, si deciden dedicarse a la
investigación también se van a encontrar con ese tipo de herramientas y van a tener oportunidad
de desarrollar más herramientas de este tipo.
En la clase de hoy vamos a hablar de las herramientas de bioinformática para el diagnóstico y

tratamiento de las enfermedades infecciosas, lo que van a encontrar aquí es básicamente cómo
se estudian los patógenos emergentes y la diversidad viral de ellos y eso qué implicaciones tiene
también en la clínica. El uso de las herramientas bioinformáticas en las enfermedades infecciosas
va a tener usos en la clínica:
● Secuenciación Sanger y masiva: Primero el diagnóstico basado en la secuencia del

ácido nucleico o del material genético de los agentes infecciosas, ya vieron que las
bacterias tienen cromosomas y que son de ADN, pero hay un montón de agentes
infecciosas que son virus donde su material genético no es ADN, sino ARN. Este es uno
de los principales usos.
● Geno-tipificación y secuenciación profunda: El segundo uso y que es muy importante,

es la genotipificación y un proceso que se llama secuenciación profunda, ese proceso
tiene que ver con escudriñar al nivel más detallado la variabilidad genética para detectar
los cambios de aminoácidos que son responsables de que un agente infeccioso se
escape a un fármaco antimicrobiano o antibacteriano particular o a un antiviral, esto es
clave, sobre todo en la secuenciación profunda, es una estrategia indispensable para
detectar la resistencia a los antirretrovirales, (Laura O.) va a ser una de las herramientas
que necesitan para el seguimiento de los pacientes que tienen VIH y están bajo tratamiento
con antirretrovirales. Se van a detectar las mutaciones de resistencia, pero también, en las
bacterias, la genotipificación puede servir para detectar factores de virulencia, es decir, para
diferenciar subtipos variantes de bacterias que tienen mayor capacidad de adherirse, por
ejemplo, a las mucosas o de producir infecciones más graves en el TGI porque producen
enterotoxinas.
● Subtipificación y la filogenética: son unas estrategias que permiten detectar la variación

genética. En el área clínica se usa para hacer el seguimiento de los casos de interés
epidemiológicos, es decir, cuando aparecen brotes de algún agente infeccioso se requiere
encontrar la fuente del agente infeccioso y a partir de dónde se dispersó a la comunidad. El
segundo uso en el área clínica es cuando hay infecciones intrahospitalarias y se quiere
establecer cuáles son realmente infecciones intrahospitalarias y cuáles vinieron de la
comunidad, eso tiene sentido desde diversos puntos de vistas, por ejemplo, en las demandas
por infecciones nosocomiales, es decir, personas que adquieren infecciones mientras están
recibiendo atención médica y también para personal médico que pueden tener accidentes
biológicos.
● Modelamiento molecular: esta aplicación es netamente de investigación y lo que busca es

hacer el diseño de blancos terapéuticos, encontrar nuevas medicamentos y probar su
efectividad como también la producción de proteínas recombinantes, las cuales se producen,
por ejemplo, para su uso en vacunas como las que se usan contra VPH y HBV, estas son
proteínas que se producen en células, se tipifican y después se preparan como antígenos.
Para hacer la identificación de los microorganismos en base a secuencias hay dos estrategias: la
secuenciación Sanger y la secuenciación masiva o secuenciación de nueva generación, esta
última es menos sesgada, (Henry C.) tiene la capacidad de encontrar más agentes infecciosos,
mientras que la secuenciación Sanger está determinada por el proceso de amplificación o PCR, que
consiste en hacer copias de un fragmento del ácido nucleico del organismo utilizando unos cebadores
o primers que determinan cuál es el fragmento, es decir, da la especificidad. Para la secuenciación
Sanger se tiene una muestra del paciente, se purifican los ácidos nucleicos y se hacen las PCR con
lo cebadores específicos y ahora en vez de hacer una electroforesis en gel para ver la presencia o
ausencia del producto de amplificación (la banda), lo que se hace es obtener la secuencia de ese
fragmento y tener la información de cada uno de los nucleótidos que estaban contenidos ahí. Para
eso imaginamos que este (señalando la diapo) es el fragmento blanco del que se van a hacer copias
y éste es el cebador.
En la reacción de secuenciación hay 4 reacciones: el fragmento o templado, el cebador, la DNA

polimerasa (enzima que sintetiza el ácido nucleico, ADN en particular), nucleótidos. En estas 4
mezclas hay de 2 tipos de nucleótidos: los normales y unos marcados y modificados que terminan
las reacciones y hay alrededor del 10%; Cada vez que se incorpora uno de los que terminan la
reacción se para la síntesis y se tiene que en cada tubo de reacción hay un conjunto de moléculas de
tamaño completo y otras que se detuvieron en un momento particular porque se incorporó uno de los
nucleótidos modificados; éstos además, fluorescen haciendo que cada una de estas moléculas con
su tamaño se puede detectar por la fluorescencia que emite el nucleótido que detuvo la reacción.
Cuando se organizan por tamaños se reportan como: fluorescencia de T en el más pequeño,

fluorescencia de A en el que le sigue, fluorescencia de T en el siguiente, fluorescencia de C en el que
le sigue etc.. Esto se convierte en este resultado que se llama Electroferograma o cromatograma,
de este resultado se extrae esta porción que es la secuencia y esto es lo que el laboratorio entrega
como informe de resultado.
Allison E. Ese procedimiento se resume en estos procesos (diapositiva anterior). Una vez se tienen
las secuencias, se pasa a hacer una comparación con una base de datos de referencia. Dichas
bases de datos de referencia son lo más importante en bioinformática, porque resulta que la
información de las secuencias de los ácidos nucleicos las administran instituciones como el Instituto
Nacional de Biotecnología de Estados Unidos y el Instituto de Bioinformática de Europa.
Ellos guardan toda la información que generan los investigadores en el mundo, pero no todos los
investigadores son igual de responsables y organizados, pues algunos meten allá cosas que están
mal clasificadas. Es por eso que existen unos grupos que se llaman los curadores, que son expertos
en bacterias, virus, parásitos y toman de esa información desordenada los datos que están
organizados, le ponen la clasificación que realmente corresponde y los aprueban para ser usados
como secuencias de referencia para una especie de microorganismo o plantas, etc. Siempre que se
hacen estas comparaciones se tienen que comparar con bases de datos de secuencias de referencia,
y después se hace el reporte de investigación.
Criterios para hacer la identificación y el reporte:
1. Calidad de la secuencia
Cuando se obtienen estos cromatogramas a veces no salen de la calidad correcta y hay picos que
tienen doble información, y el cromatograma los lee ya no como Adenina, Timina, Citosina y Guanina
sino como combinaciones por ejemplo Timina con Citosina o Adenina con Guanina; entonces la
calidad del primer criterio es que haya menos del 10% de estas posiciones o nucleótidos que no se
identificaron completamente.
2. Elección de secuencias de referencias

Hay que utilizar las bases de datos de referencia y las más importantes son RefSeq del Instituto
Nacional de Biotecnología de Estados Unidos; BIBI que es de especialistas en bacterias y
16SPathDB que es especializada en bacterias patógenas de humanos. Eyder R.
No hay que aprenderse las bases de datos, solamente saber que existen y que las personas que
realizan un reporte tienen que recurrir a estas herramientas.
Cuando tenemos el resultado de un paciente hay que compararlo contra la secuencia de referencia.
3. Comparación por alineamiento de secuencias
Estos son los datos del paciente, tiene T, A, pero de ahí para allá no necesariamente se parecen si se
comparan las secuencias una a una, esto es porque para empezar estas son de tamaños diferentes,
por lo que para poder comparar eficientemente se realiza un alineamiento de secuencias que
consiste en partir las secuencias en bloques de 6 o 10 nucleótidos e ir ubicando esos bloques y
posteriormente introducir uniones, que son como gaps que involucran deleciones, etc., y que permiten
encontrar la similitud entre esas secuencias.
Cuando hay similitudes el sistema lo grafica como una raya, pero cuando no este deja el espacio.
Aquí pueden ver una mutación de adenina a guanina. Estos espacios son inserciones y deleciones,
dependiendo de si hay ganancia o pérdida de nucleótidos. Los cambios se llaman mutaciones o
sustituciones de nucleótidos.
Para usar la base de datos el Instituto Nacional de Biotecnología de EU. proporciona la herramienta
BLAST que pide una secuencia, y esa es la que vamos a investigar para ver si se parece a alguna de
las secuencias que ya están registradas en la base de datos.
En la base de datos está todo en general, pero también estas que son las secciones curadas. Karina
V.
Están entonces Genomas de referencia, está también Genomas 16s, porque el RNA16s es un
genoma específico de todos los procariotas y permite el diagnóstico de muchas especies al mismo
tiempo, porque tiene regiones conservadas y regiones con mucha variación.
Aquí (imagen superior) se introduce la secuencia problema y se selecciona la base de datos que se
va a utilizar y se pide correr BLAST.
Va a pedir un número de acceso cuando se va a comparar una secuencia que ya está dentro del
sistema con otras secuencias del sistema, cuando no, va a pedir como entrada un archivo que se
llama FASTA, que es un archivo que tiene un encabezado que empieza con > (mayor que) y una
identificación, por ejemplo ‘Paciente 1’, etc., y después tiene la secuencia.
4. Interpretación del resultado de BLAST

Los resultados que salen a partir de hacer un BLAST son estas tablas (imagen superior) donde les
dan un valor que es el porcentaje de similitud de su secuencia problema con las secuencias que
estaban en la base de datos de referencia, y entonces para reportar bacterias por ejemplo, se usa
una similitud mayor al 98%, entre el 95-97.9% reporta género y por debajo del 95% reporta familia.
Usando este valor (Ident) pero también hay que usar el valor de cobertura (Query cover) y quiere
decir las dos secuencias que se están comparando tienen que tener en común una buena proporción.
Estas son dos secuencias que tienen cobertura, la secuencia del Paciente 1 contra la Referencia,
tienen 100% de cobertura, que quiere decir que son idénticas.
Hay un valor E que significa la probabilidad de que estas dos cosas sean iguales por efectos del
azar, cuando esto (E-Value) es mayor que cero empieza a ser probable que sea efecto del azar y
cuando es por debajo de cero empiezan a ser muy parecidas. Estos valores son 0.001, 0.00001,
0.00018 por ejemplo, entonces son muy parecidos Lina Ch. y el extremo son esas (10), cobertura
muy baja, solo el 45% de los nucleótidos que se estaban comparando se parecieron, porcentaje de
identidad es decir cuantos son similares, solo el 77%, pero el valor E va a estar por encima de cero.
Este es un ejemplo de un reporte de resultados: trae el nombre del paciente, código, descripción de la
prueba, que tipo de secuenciación se hizo, contra qué secuencia de referencia se comparó y la fecha,
esta última es muy importante porque las bases de datos se actualizan cada cierto tiempo, entonces
puede ser que las secuencias de referencia cambien.
El resultado va a decir el % de similitud entre las secuencias y luego va a dar una conclusión, donde
nos va a decir de qué patógeno se trata, como proceder frente al tratamiento, etc.
¿Cuando utilizar una Secuenciación Sanger para apoyarse en el diagnóstico?
● Siempre que en la institución se tengan protocolos para amplificar con cebadores de amplio
espectro, entonces son PCRs, que identifican por ejemplo género, pero que no alcanzan a
identificar especies. En laboratorio podemos tener este producto para toda la familia del
microorganismo, después secuenciar y saber que especie es.
Para que esto sea eficiente hay que tener un servicio en la ciudad porque aunque este
proceso de PCR puede tardar dos horas y la secuenciación otras dos, si el servicio no está en
la ciudad, se tendría que esperar a que la muestra llegue al lugar donde le corresponde, por lo
que puede tardar aproximadamente 24 horas o más.
● Si se tiene un cultivo bacteriano que es positivo, pero que la identificación ha sido dudosa por
otros métodos como PCR, donde no se obtuvieron las bandas esperadas, entonces pueden
volverse al amplio espectro. Karol A.
Secuenciación masiva:
Es un proceso más sofisticado, por medio de una muestra del paciente, se obtienen los siguientes
pasos:
1. Se debe purificar ac. nucleicos.
2. En lugar de hacer PCR, todos los ac. nucleicos del paciente se fragmentan en pedazos
pequeños.
3. Luego, se marcan en uno o en los dos extremos con una pieza de ac. nucleico que se llama
adaptador y que tiene una secuencia que yo conozco, para a partir de aquí, amplificar estos
fragmentos usando un cebador sobre la secuencia conocida.
4. Después, se debe secuenciar a partir de los cebadores complementarias al adaptador.
5. Se obtienen también electroferogramas pero son más cortos, se llaman lecturas.
6. Estas lecturas se comparan contra la base de datos de referencia en un proceso que se llama
mapeo.
7. Después de eso, se genera una tabla de resultados. La base de datos de referencia puede
tener solo genomas de referencia para virus, solo para bacterias, puede tener para todos los
agentes infecciosos de humanos o cuando se hace vigilancia epidemiológica y agentes
infecciosos emergentes va a tener también potenciales agentes infecciosos que pueden pasar
de los animales a los humanos, cómo el Virus del Oeste del Nilo o algunas encefalopatías de
origen viral.
8. Se hace el mapeo de lecturas y se hace una tabla de resultados que dice cantidad de lecturas
que se mapearon contra cada uno de los genomas de referencia y esa tabla genera un
diagnóstico metagenómico en el que el agente infeccioso que obtuvo el mayor número de
lecturas es el que probablemente se está multiplicando en ese paciente, eso quiere decir que,
un paciente puede tener dos virus: un Herpes que a veces está en estado latente y puede
tener influenza, pero obtuvo un monton alto de lecturas para Influenza y muy poco para
Herpes, esto significa que la infección activa que tiene es Influenza, ya con esto se guia a
empezar un tratamiento específico y cómo Camilo esto no está estandarizado en aspectos
como el protocolo de secuenciación, que aún no se ha definido cuál es el más apropiado en la
clínica y las bases de datos que van a ser la referencia, las define cada grupo. No hay
recomendaciones de la OMS ni la FDA y aún no hay validación en este aspecto,
9. por lo tanto, se hace un diagnóstico definitivo que hay que confirmar con la prueba Gold
Standard si es posible y esperar que la sintomatología empiece a desaparecer con el
tratamiento de acuerdo con el diagnóstico metagenómico.
¿Cuándo se hace? Una secuenciación masiva puede tardar 4hr, pero si se tiene un secuenciador
disponible en la institución, de lo contrario, sucede lo mismo que con las secuenciaciones Sanger,
que demoran mucho en llegar a su destino. En Colombia, muy pocas instituciones tienen un
secuenciador de nueva generación, por lo que las muestras deben enviarse afuera y sólo se hace
para investigación. No hay protocolos validados, no hay reglas de cuántas lecturas hacen un
diagnóstico y las bases de datos no están especificadas para saber sobre cuáles agentes infecciosos
para comparar la muestra. Además, para la escogencia de las bases de datos a utilizar, se debe
considerar que existen patógenos de distribución local.
¿Cuándo usar o recurrir a estas herramientas? Cuando hay evidencia de un proceso infeccioso,
pero ninguna de las técnicas vistas anteriormente, ha sido capaz de identificar cuál es. Sin embargo,
es un proceso más complejo.
Un reporte debe incluir lo siguiente:
● Un tamizaje para virus, para bacterias u hongos, idealmente.

● Luego, se encuentra el agente infeccioso que predomina con lecturas que se reportan:
○ Lecturas que se reportan.
○ % de cobertura contra el genoma de referencia.
○ Al contar las lecturas, se puede estimar el número de copias, que para el ejemplo de la
tabla no importaría, pero cuando sea un virus, sí será relevante.
Subtipificación Nathalie T.
La subtipificación, es la otra herramienta utilizada, donde se busca detectar la variación dentro de la

especie para poder asociarla con un fenotipo global, el cual está directamente relacionado con los
serotipos.
Serotipo, son un grupo de variantes dentro de una especie, que han sido caracterizados por sus
antígenos de superficie, los cuales están codificados en su genoma, por lo que, directamente desde
la secuenciación se puede caracterizar el serotipo. Los serotipos son relevantes porque algunos de
ellos tienen mayor virulencia y pueden producir un espectro de sintomatología diferente. Así mismo, el
serotipo se relaciona con factores de virulencia asociados con la colonización de áreas específicas
del cuerpo.
De esta forma, la subtipificación sirve como estrategia de identificación de serotipos y además, para
encontrar o asociar la variabilidad genética a la fuente del agente infeccioso, lo que es indispensable
para hacer el seguimiento de las epidemias y de las infecciones intrahospitalarias. Adicionalmente,
sirve para establecer o asociar la variación genética con el origen geográfico de una muestra, lo que
permite establecer desde dónde se introdujo un agente infeccioso que se considera emergente en
una región diferente.
Para entender este proceso se debe considerar el siguiente caso:

Jessica G. En pacientes que consultaron en la misma área de la institución, incluyendo a la enfermera
involucrada en el episodio la cual dio positivo para la prueba de tuberculina el 18 de julio.
Prueba de tuberculina: (respuesta de compañero) es una prueba que consiste en la aplicación

intradérmica de un antígeno de la Mycobacterium y se espera 48 horas para observar si se presenta
una respuesta inflamatoria. Si es así, significa que hay presencia de linfocitos reactivos contra ese
antígeno.
Profesora confirma lo anterior y agrega: entonces dar positivo para la prueba de tuberculina quiere
decir que la persona ha estado expuesta al Mycobacterium tuberculosis o a otras especies dentro del
complejo de especies de esta bacteria. No necesariamente prueba que se haya originado en este
procedimiento.
Entonces lo que se buscaría en esta institución es establecer si se trata de casos de tuberculosis de

origen intrahospitalario, y hay dos cosas indispensables que se tienen que hacer para esto:
Primero: hay que establecer si los casos comparten la misma fuente de patógenos y eso se puede
hacer detectando la variabilidad genética entre los casos y el paciente inicial.
Segundo: todos estos casos tenemos que ubicarlos en relación a la fuente, también a unas
secuencias o a un organismo de referencia, y en lo posible a otras variantes del patógeno porque
esto ayuda a identificar a qué serotipo pertenecen, si es el caso, a qué subgrupo, etcétera.
Para identificar la cercanía genética, hay dos estrategias basadas en bandas de geles de agarosa en
donde se detectan bandas de distintos tamaños:
- La electroforesis de campo pulsado en gel de agarosa
- La amplificación de microsatélites
Hay otras estrategias que están basadas en secuencias.

En la electroforesis de campo pulsado se purifica el ácido nucleico de los pacientes y se cortan con
enzimas (las cuales cortan secuencias de manera específica) llamadas endonucleasas, y los
pacientes que tienen el mismo patrón de bandas tienen el mismo agente infeccioso más relacionado
o genéticamente más similar al que genera un patrón de bandas diferente.
Con la amplificación de microsatélites Camilo A. los cuales son secuencias repetidas que están en
el genoma y están en los cromosomas de las bacterias y en el genoma humano y aquí se hace PCR,
entonces son regiones específicas en un cromosoma, y estas regiones tienen repeticiones
(usualmente son unidades cortas de 3 o 4 nucleótidos) que se heredan a la descendencia y si
aumentan, aumentan en 1 unidad esas repetición.
Entonces lo que se hace es amplificar varias regiones génicas donde hay microsatélites y buscar el
tamaño de cada uno de los microsatélites. Los pacientes que tienen un mismo patrón de bandas para
cada uno de los microsatélites que se amplificaron, son los que poseen el agente infeccioso más
relacionado genéticamente.
Con la información anterior se puede generar este tipo de comparaciones (observados en la imagen
anterior). Si tenemos dos pacientes y estas son las bandas (una se le llamara 0 para sumar 10,
entonces se hace una tabla de presencia/ausencia para bandas cero hasta nueve y los pacientes van
compartir bandas, por ejemplo: el paciente 2 con el 3 comparten el 90% de las bandas, el paciente 1
con el 3 sólo el 70% y el 3 con el 2 el 50% de las bandas. A esto se le llama matriz de similitud.
Con esto ya podemos tener un dato numérico de cuál es la cercanía genética. En el ejemplo anterior:
el paciente 1 con el 3 tienen un 90% de cercanía genética, entonces en ese caso, estos pacientes
son genéticamente más relacionados.
Cuando se hace la estrategia de subtipificación por secuenciación, hay dos opciones:
● Amplificar varios genes particulares y tener la secuencia para analizarlas y asignarles un

código de variación por alelos (por ejemplo) y de esta forma determinar a qué genotipo o
subtipo es al pertenecen estos organismos de acuerdo a esas variaciones genéticas.
● Secuenciación del genoma completo donde las lecturas se comparan con la secuencia de
referencia, y esta permite clasificarlos en grupos. Estas clasificaciones deben coincidir con las
clasificaciones clásicas de genotipos o también con las clasificaciones con genes específicos.
¿Cómo se genera esta información cuando son las secuencias?

David O. Se debe obtener las secuencias de ácidos nucleicos de los pacientes, lo siguiente que se
hace es organizar las secuencias y compararlas haciendo el alineamiento, que consiste en ubicarlas
correctamente poniendo gaps o espacios en las regiones que no coinciden para poder adaptar u
organizar las otras porciones, comparando piezas pequeñas en cada interacción de la comparación.
Ejemplo:
Aquí tenemos estos pacientes, en los que encontramos que el paciente 5 con el 2 son más similares
en su información genética; y el más diferente es el paciente 1
Posteriormente se realiza la matriz de similitud de secuencias, y lo que tenemos es que el paciente

2 con el paciente 5 son idénticos, por lo que estos tienen una similitud del 100% en la secuencia que
obtuvimos, del 80% entre el paciente 5 y el paciente 4, y así sucesivamente, entonces se convierte en
un porcentaje de similitud de secuencias. Se puede concluir entonces, que el paciente 1 con el 5
llevan el mismo material genético, al menos en cuanto a la secuencia del fragmento que se amplifico.
Si es el genoma completo, con mayor razón se puede establecer que llevan el mismo agente
infeccioso.
Para graficar esa relación de similitud, la forma estándar que se usa es las filogenias, las cuales son
agrupaciones que muestran a los organismos analizados (Técnicamente llamados taxones). Las
líneas muestran la distancia genética, la distancia genética (Flecha azul en la diapositiva) mide 0,05
nucleótidos, entonces, si se mide de aquí hasta acá (señalando la diapositiva) cuántos nucleótidos
abra.
Luego entonces Danly G ,algunas de estas ramas son más largas, lo que quiere decidir que el
organismo tiene más cambios, tiene mayor distancia genética con respecto a los demás.
Los números que están en la imagen se llaman soporte estadístico, y lo que tiene, es que, cuando
un programa de bioinformática genera esto, usa varias estrategias para empezar y para analizar los
datos y genera cientos de gráficos y hace un promedio y dice: de los 100 árboles que hice 98
generaron agrupación, pero solo 50 generaron que iban juntos y el 100% generaron esta agrupación
(señala diapositiva).
Los grupos son llamados clado o linaje, este es un segundo clado o linaje (señala diapositiva) este
grupo se llama linaje de las salmonellas entéricas (resaltado en rojo).
Este punto de partida (a los cuantos nucleótidos se diversificaron esos grupos) se llama nodo o raíz.
Cuando se le agrega tiempo a este árbol filogenético, permite establecer en qué momento en el
tiempo se dio la mutación que originó esta nueva variante.
Las filogenias hacen parte de un grupo particular de gráficos que se llaman los dendrogramas,
dentro de estos se encuentran: El árbol filogenético, que tiene valores en cada línea, las líneas son
líneas de distancia, y esta distancia genética está expresada como porcentaje de características
similares o como tasa de mutación, además puede llevar una unidad de tiempo.
Existen otros gráficos de dendrogramas que son los cladogramas, los cuales no llevan distancia en
las líneas, están hechos con información que no se convierte en datos cuantitativos.
Tenemos E.coli, klebsiella pneumoniae, shigella y salmonella; ellas comparten unas características,
llamadas caracteres, y un estado en esas características. los estados posibles en este caso son solo
dos Andrés M. en el caso de nucleótidos son 4, se puede tener adenina, timina, guanina o citosina; en
este caso, los únicos estados posibles son que sea gram- o gram+, que sea un MO de colonización
intracelular o extracelular (entonces según eso, salmonella nunca hace extracelular y los otros si),
metabolizadores de lactosa que lo son E. coli y K. pneumoniae; y meningitis que solo lo causa E. coli.
Con estos caracteres se puede hacer un cladograma, y se hace de la siguiente manera:
esta es una línea imaginaria del tiempo, se asume que la caracteriza compartida por todos es la más
antigua, es la ancestral (ser gram-), ahí se grafica.
Después de esto aparecen las nuevas características, el que no comparte la siguiente característica
es salmonella, entonces, ahí se grafica.
Luego, las que comparten el metabolismo de lactosa (Shigella no) se grafican por encima, por lo tanto
esta capacidad de metabolizar lactosa apareció después de que se separaron los clados de Shigella
con Klebsiella pneumoniae; por último está E. coli, que evolucionó la capacidad de producir
meningitis después de que se separó de Klebsiella.
Para una filogenia, como los

valores son numéricos, se usa
la misma matriz de similitud que
se generó anteriormente..
Tenemos una barra de nivel de
similitud, en esta, encontramos
que: P2 y P5 son 100%
similares, P4 es similar al grupo
del P2-P5 en 80%, P3 al grupo
P2-P5-P4 se asemeja en 80%;
y por último, el P1 se asemeja
al P2 en 60%, y este es el
principio de las filogenias.
Luis O.
Para hacer una filogenia formal y hacer un artículo, por ejemplo para hacer el alineamiento se tienen
que utilizar programas específicos de comparación de secuencia y ahí hay unos ejemplos, para
hacer una matriz de distancias genéticas también se usan programas específicos. Además de eso
cuando se hace una filogenia normal se usa la teoría evolutiva la cual considera situaciones
adicionales como que los nucleótidos no todos tienen la capacidad de mutar, sino que por ejemplo
entre los que se parecen químicamente hay mayor probabilidad de mutar; ejemplo adenina contra
guanina cambia en una probabilidad del 27%, mientras que un cambio de guanina a timina ocurre en
una proporción más baja 9,2%, la frecuencia de cada nucleótido es también una característica.
Hay organismos ricos en guanina- citosina (bacterias) y hay otros que no lo son, entonces eso
también aumenta la probabilidad de que haya una frecuencia mayor de guanina-citosina y eso cambia
de cómo se utilizan estos procedimientos, a veces no todos los genes cambian a la misma tasa,
porque hay genes que se consideran están bajo selección positiva, o sea yo no puedo cambiar esto
mucho porque pierdo la capacidad de sobrevivir en el hospedero.
Cuando se hace esto?

Cuando se conoce que hay diferentes subtipos de agentes infecciosos con altos grados de virulencia,
cuando se sospecha brotes epidémicos y en los casos de sospecha de transmisión intrahospitalaria.
Cuando se hace todo el procedimiento incluyendo la subtipificación, la matriz de similitud y

espilogenia ?
Para hacer un reporte completo y un seguimiento institucional, o sea no es para diagnóstico, sino
para cerrar los casos reporte de casos.

Principios de Bioinformática Aplicada Al Diagnóstico Microbiológico PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Principios de Bioinformática Aplicada Al Diagnóstico Microbiológico PDF

Caricato da

Copyright:

Formati disponibili

CLASE 9: PRINCIPIOS DE BIOINFORMÁTICA APLICADA AL DIAGNÓSTICO MICROBIOLÓGICO

En la clase de hoy vamos a hablar de las herramientas de bioinformática para el diagnóstico y

● Secuenciación Sanger y masiva: Primero el diagnóstico basado en la secuencia del

● Geno-tipificación y secuenciación profunda: El segundo uso y que es muy importante,

● Subtipificación y la filogenética: son unas estrategias que permiten detectar la variación

● Modelamiento molecular: esta aplicación es netamente de investigación y lo que busca es

En la reacción de secuenciación hay 4 reacciones: el fragmento o templado, el cebador, la DNA

Cuando se organizan por tamaños se reportan como: fluorescencia de T en el más pequeño,

Criterios para hacer la identificación y el reporte:

2. Elección de secuencias de referencias

3. Comparación por alineamiento de secuencias

4. Interpretación del resultado de BLAST

¿Cuando utilizar una Secuenciación Sanger para apoyarse en el diagnóstico?

Un reporte debe incluir lo siguiente:

● Un tamizaje para virus, para bacterias u hongos, idealmente.

La subtipificación, es la otra herramienta utilizada, donde se busca detectar la variación dentro de la

Para entender este proceso se debe considerar el siguiente caso:

Prueba de tuberculina: (respuesta de compañero) es una prueba que consiste en la aplicación

Entonces lo que se buscaría en esta institución es establecer si se trata de casos de tuberculosis de

- La electroforesis de campo pulsado en gel de agarosa

Hay otras estrategias que están basadas en secuencias.

Cuando se hace la estrategia de subtipificación por secuenciación, hay dos opciones:

● Amplificar varios genes particulares y tener la secuencia para analizarlas y asignarles un

¿Cómo se genera esta información cuando son las secuencias?

Posteriormente se realiza la matriz de similitud de secuencias, y lo que tenemos es que el paciente

Para una filogenia, como los

Cuando se hace esto?

Cuando se hace todo el procedimiento incluyendo la subtipificación, la matriz de similitud y

Potrebbero piacerti anche