Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Y A LA TERAPIA ANTIMICROBIANA.
Victor G. Ustedes se van a encontrar con que, aunque hay herramientas de la microbiología que
vienen desde principios de 1900, como por ejemplo la tinción de Gram y las primeras estrategias
de cultivo de las bacterias, también hay estrategias útiles para el diagnóstico y el tratamiento de
las enfermedades infecciosas que son de ahora, que son de los últimos 5 o 10 años y que tal vez
no estén completamente validadas, pero son herramientas a las que ustedes se van a enfrentar
como profesionales, porque son la humanización de la microbiología, son las estrategias
diagnósticas y de tratamiento más robustas que hay y se van a convertir en las herramientas que
van a estar disponibles para ustedes dentro de 5 a 10 años, si deciden dedicarse a la
investigación también se van a encontrar con ese tipo de herramientas y van a tener oportunidad
de desarrollar más herramientas de este tipo.
Para hacer la identificación de los microorganismos en base a secuencias hay dos estrategias: la
secuenciación Sanger y la secuenciación masiva o secuenciación de nueva generación, esta
última es menos sesgada, (Henry C.) tiene la capacidad de encontrar más agentes infecciosos,
mientras que la secuenciación Sanger está determinada por el proceso de amplificación o PCR, que
consiste en hacer copias de un fragmento del ácido nucleico del organismo utilizando unos cebadores
o primers que determinan cuál es el fragmento, es decir, da la especificidad. Para la secuenciación
Sanger se tiene una muestra del paciente, se purifican los ácidos nucleicos y se hacen las PCR con
lo cebadores específicos y ahora en vez de hacer una electroforesis en gel para ver la presencia o
ausencia del producto de amplificación (la banda), lo que se hace es obtener la secuencia de ese
fragmento y tener la información de cada uno de los nucleótidos que estaban contenidos ahí. Para
eso imaginamos que este (señalando la diapo) es el fragmento blanco del que se van a hacer copias
y éste es el cebador.
Allison E. Ese procedimiento se resume en estos procesos (diapositiva anterior). Una vez se tienen
las secuencias, se pasa a hacer una comparación con una base de datos de referencia. Dichas
bases de datos de referencia son lo más importante en bioinformática, porque resulta que la
información de las secuencias de los ácidos nucleicos las administran instituciones como el Instituto
Nacional de Biotecnología de Estados Unidos y el Instituto de Bioinformática de Europa.
Ellos guardan toda la información que generan los investigadores en el mundo, pero no todos los
investigadores son igual de responsables y organizados, pues algunos meten allá cosas que están
mal clasificadas. Es por eso que existen unos grupos que se llaman los curadores, que son expertos
en bacterias, virus, parásitos y toman de esa información desordenada los datos que están
organizados, le ponen la clasificación que realmente corresponde y los aprueban para ser usados
como secuencias de referencia para una especie de microorganismo o plantas, etc. Siempre que se
hacen estas comparaciones se tienen que comparar con bases de datos de secuencias de referencia,
y después se hace el reporte de investigación.
1. Calidad de la secuencia
Cuando se obtienen estos cromatogramas a veces no salen de la calidad correcta y hay picos que
tienen doble información, y el cromatograma los lee ya no como Adenina, Timina, Citosina y Guanina
sino como combinaciones por ejemplo Timina con Citosina o Adenina con Guanina; entonces la
calidad del primer criterio es que haya menos del 10% de estas posiciones o nucleótidos que no se
identificaron completamente.
No hay que aprenderse las bases de datos, solamente saber que existen y que las personas que
realizan un reporte tienen que recurrir a estas herramientas.
Cuando tenemos el resultado de un paciente hay que compararlo contra la secuencia de referencia.
Estos son los datos del paciente, tiene T, A, pero de ahí para allá no necesariamente se parecen si se
comparan las secuencias una a una, esto es porque para empezar estas son de tamaños diferentes,
por lo que para poder comparar eficientemente se realiza un alineamiento de secuencias que
consiste en partir las secuencias en bloques de 6 o 10 nucleótidos e ir ubicando esos bloques y
posteriormente introducir uniones, que son como gaps que involucran deleciones, etc., y que permiten
encontrar la similitud entre esas secuencias.
Cuando hay similitudes el sistema lo grafica como una raya, pero cuando no este deja el espacio.
Aquí pueden ver una mutación de adenina a guanina. Estos espacios son inserciones y deleciones,
dependiendo de si hay ganancia o pérdida de nucleótidos. Los cambios se llaman mutaciones o
sustituciones de nucleótidos.
Para usar la base de datos el Instituto Nacional de Biotecnología de EU. proporciona la herramienta
BLAST que pide una secuencia, y esa es la que vamos a investigar para ver si se parece a alguna de
las secuencias que ya están registradas en la base de datos.
En la base de datos está todo en general, pero también estas que son las secciones curadas. Karina
V.
Están entonces Genomas de referencia, está también Genomas 16s, porque el RNA16s es un
genoma específico de todos los procariotas y permite el diagnóstico de muchas especies al mismo
tiempo, porque tiene regiones conservadas y regiones con mucha variación.
Aquí (imagen superior) se introduce la secuencia problema y se selecciona la base de datos que se
va a utilizar y se pide correr BLAST.
Va a pedir un número de acceso cuando se va a comparar una secuencia que ya está dentro del
sistema con otras secuencias del sistema, cuando no, va a pedir como entrada un archivo que se
llama FASTA, que es un archivo que tiene un encabezado que empieza con > (mayor que) y una
identificación, por ejemplo ‘Paciente 1’, etc., y después tiene la secuencia.
Usando este valor (Ident) pero también hay que usar el valor de cobertura (Query cover) y quiere
decir las dos secuencias que se están comparando tienen que tener en común una buena proporción.
Estas son dos secuencias que tienen cobertura, la secuencia del Paciente 1 contra la Referencia,
tienen 100% de cobertura, que quiere decir que son idénticas.
Hay un valor E que significa la probabilidad de que estas dos cosas sean iguales por efectos del
azar, cuando esto (E-Value) es mayor que cero empieza a ser probable que sea efecto del azar y
cuando es por debajo de cero empiezan a ser muy parecidas. Estos valores son 0.001, 0.00001,
0.00018 por ejemplo, entonces son muy parecidos Lina Ch. y el extremo son esas (10), cobertura
muy baja, solo el 45% de los nucleótidos que se estaban comparando se parecieron, porcentaje de
identidad es decir cuantos son similares, solo el 77%, pero el valor E va a estar por encima de cero.
Este es un ejemplo de un reporte de resultados: trae el nombre del paciente, código, descripción de la
prueba, que tipo de secuenciación se hizo, contra qué secuencia de referencia se comparó y la fecha,
esta última es muy importante porque las bases de datos se actualizan cada cierto tiempo, entonces
puede ser que las secuencias de referencia cambien.
El resultado va a decir el % de similitud entre las secuencias y luego va a dar una conclusión, donde
nos va a decir de qué patógeno se trata, como proceder frente al tratamiento, etc.
● Siempre que en la institución se tengan protocolos para amplificar con cebadores de amplio
espectro, entonces son PCRs, que identifican por ejemplo género, pero que no alcanzan a
identificar especies. En laboratorio podemos tener este producto para toda la familia del
microorganismo, después secuenciar y saber que especie es.
Para que esto sea eficiente hay que tener un servicio en la ciudad porque aunque este
proceso de PCR puede tardar dos horas y la secuenciación otras dos, si el servicio no está en
la ciudad, se tendría que esperar a que la muestra llegue al lugar donde le corresponde, por lo
que puede tardar aproximadamente 24 horas o más.
● Si se tiene un cultivo bacteriano que es positivo, pero que la identificación ha sido dudosa por
otros métodos como PCR, donde no se obtuvieron las bandas esperadas, entonces pueden
volverse al amplio espectro. Karol A.
Secuenciación masiva:
Es un proceso más sofisticado, por medio de una muestra del paciente, se obtienen los siguientes
pasos:
1. Se debe purificar ac. nucleicos.
2. En lugar de hacer PCR, todos los ac. nucleicos del paciente se fragmentan en pedazos
pequeños.
3. Luego, se marcan en uno o en los dos extremos con una pieza de ac. nucleico que se llama
adaptador y que tiene una secuencia que yo conozco, para a partir de aquí, amplificar estos
fragmentos usando un cebador sobre la secuencia conocida.
4. Después, se debe secuenciar a partir de los cebadores complementarias al adaptador.
5. Se obtienen también electroferogramas pero son más cortos, se llaman lecturas.
6. Estas lecturas se comparan contra la base de datos de referencia en un proceso que se llama
mapeo.
7. Después de eso, se genera una tabla de resultados. La base de datos de referencia puede
tener solo genomas de referencia para virus, solo para bacterias, puede tener para todos los
agentes infecciosos de humanos o cuando se hace vigilancia epidemiológica y agentes
infecciosos emergentes va a tener también potenciales agentes infecciosos que pueden pasar
de los animales a los humanos, cómo el Virus del Oeste del Nilo o algunas encefalopatías de
origen viral.
8. Se hace el mapeo de lecturas y se hace una tabla de resultados que dice cantidad de lecturas
que se mapearon contra cada uno de los genomas de referencia y esa tabla genera un
diagnóstico metagenómico en el que el agente infeccioso que obtuvo el mayor número de
lecturas es el que probablemente se está multiplicando en ese paciente, eso quiere decir que,
un paciente puede tener dos virus: un Herpes que a veces está en estado latente y puede
tener influenza, pero obtuvo un monton alto de lecturas para Influenza y muy poco para
Herpes, esto significa que la infección activa que tiene es Influenza, ya con esto se guia a
empezar un tratamiento específico y cómo Camilo esto no está estandarizado en aspectos
como el protocolo de secuenciación, que aún no se ha definido cuál es el más apropiado en la
clínica y las bases de datos que van a ser la referencia, las define cada grupo. No hay
recomendaciones de la OMS ni la FDA y aún no hay validación en este aspecto,
9. por lo tanto, se hace un diagnóstico definitivo que hay que confirmar con la prueba Gold
Standard si es posible y esperar que la sintomatología empiece a desaparecer con el
tratamiento de acuerdo con el diagnóstico metagenómico.
¿Cuándo se hace? Una secuenciación masiva puede tardar 4hr, pero si se tiene un secuenciador
disponible en la institución, de lo contrario, sucede lo mismo que con las secuenciaciones Sanger,
que demoran mucho en llegar a su destino. En Colombia, muy pocas instituciones tienen un
secuenciador de nueva generación, por lo que las muestras deben enviarse afuera y sólo se hace
para investigación. No hay protocolos validados, no hay reglas de cuántas lecturas hacen un
diagnóstico y las bases de datos no están especificadas para saber sobre cuáles agentes infecciosos
para comparar la muestra. Además, para la escogencia de las bases de datos a utilizar, se debe
considerar que existen patógenos de distribución local.
¿Cuándo usar o recurrir a estas herramientas? Cuando hay evidencia de un proceso infeccioso,
pero ninguna de las técnicas vistas anteriormente, ha sido capaz de identificar cuál es. Sin embargo,
es un proceso más complejo.
Subtipificación Nathalie T.
De esta forma, la subtipificación sirve como estrategia de identificación de serotipos y además, para
encontrar o asociar la variabilidad genética a la fuente del agente infeccioso, lo que es indispensable
para hacer el seguimiento de las epidemias y de las infecciones intrahospitalarias. Adicionalmente,
sirve para establecer o asociar la variación genética con el origen geográfico de una muestra, lo que
permite establecer desde dónde se introdujo un agente infeccioso que se considera emergente en
una región diferente.
Profesora confirma lo anterior y agrega: entonces dar positivo para la prueba de tuberculina quiere
decir que la persona ha estado expuesta al Mycobacterium tuberculosis o a otras especies dentro del
complejo de especies de esta bacteria. No necesariamente prueba que se haya originado en este
procedimiento.
Primero: hay que establecer si los casos comparten la misma fuente de patógenos y eso se puede
hacer detectando la variabilidad genética entre los casos y el paciente inicial.
Segundo: todos estos casos tenemos que ubicarlos en relación a la fuente, también a unas
secuencias o a un organismo de referencia, y en lo posible a otras variantes del patógeno porque
esto ayuda a identificar a qué serotipo pertenecen, si es el caso, a qué subgrupo, etcétera.
Para identificar la cercanía genética, hay dos estrategias basadas en bandas de geles de agarosa en
donde se detectan bandas de distintos tamaños:
- La amplificación de microsatélites
Con la amplificación de microsatélites Camilo A. los cuales son secuencias repetidas que están en
el genoma y están en los cromosomas de las bacterias y en el genoma humano y aquí se hace PCR,
entonces son regiones específicas en un cromosoma, y estas regiones tienen repeticiones
(usualmente son unidades cortas de 3 o 4 nucleótidos) que se heredan a la descendencia y si
aumentan, aumentan en 1 unidad esas repetición.
Entonces lo que se hace es amplificar varias regiones génicas donde hay microsatélites y buscar el
tamaño de cada uno de los microsatélites. Los pacientes que tienen un mismo patrón de bandas para
cada uno de los microsatélites que se amplificaron, son los que poseen el agente infeccioso más
relacionado genéticamente.
Con la información anterior se puede generar este tipo de comparaciones (observados en la imagen
anterior). Si tenemos dos pacientes y estas son las bandas (una se le llamara 0 para sumar 10,
entonces se hace una tabla de presencia/ausencia para bandas cero hasta nueve y los pacientes van
compartir bandas, por ejemplo: el paciente 2 con el 3 comparten el 90% de las bandas, el paciente 1
con el 3 sólo el 70% y el 3 con el 2 el 50% de las bandas. A esto se le llama matriz de similitud.
Con esto ya podemos tener un dato numérico de cuál es la cercanía genética. En el ejemplo anterior:
el paciente 1 con el 3 tienen un 90% de cercanía genética, entonces en ese caso, estos pacientes
son genéticamente más relacionados.
Si es el genoma completo, con mayor razón se puede establecer que llevan el mismo agente
infeccioso.
Para graficar esa relación de similitud, la forma estándar que se usa es las filogenias, las cuales son
agrupaciones que muestran a los organismos analizados (Técnicamente llamados taxones). Las
líneas muestran la distancia genética, la distancia genética (Flecha azul en la diapositiva) mide 0,05
nucleótidos, entonces, si se mide de aquí hasta acá (señalando la diapositiva) cuántos nucleótidos
abra.
Luego entonces Danly G ,algunas de estas ramas son más largas, lo que quiere decidir que el
organismo tiene más cambios, tiene mayor distancia genética con respecto a los demás.
Los números que están en la imagen se llaman soporte estadístico, y lo que tiene, es que, cuando
un programa de bioinformática genera esto, usa varias estrategias para empezar y para analizar los
datos y genera cientos de gráficos y hace un promedio y dice: de los 100 árboles que hice 98
generaron agrupación, pero solo 50 generaron que iban juntos y el 100% generaron esta agrupación
(señala diapositiva).
Los grupos son llamados clado o linaje, este es un segundo clado o linaje (señala diapositiva) este
grupo se llama linaje de las salmonellas entéricas (resaltado en rojo).
Este punto de partida (a los cuantos nucleótidos se diversificaron esos grupos) se llama nodo o raíz.
Cuando se le agrega tiempo a este árbol filogenético, permite establecer en qué momento en el
tiempo se dio la mutación que originó esta nueva variante.
Las filogenias hacen parte de un grupo particular de gráficos que se llaman los dendrogramas,
dentro de estos se encuentran: El árbol filogenético, que tiene valores en cada línea, las líneas son
líneas de distancia, y esta distancia genética está expresada como porcentaje de características
similares o como tasa de mutación, además puede llevar una unidad de tiempo.
Existen otros gráficos de dendrogramas que son los cladogramas, los cuales no llevan distancia en
las líneas, están hechos con información que no se convierte en datos cuantitativos.
Tenemos E.coli, klebsiella pneumoniae, shigella y salmonella; ellas comparten unas características,
llamadas caracteres, y un estado en esas características. los estados posibles en este caso son solo
dos Andrés M. en el caso de nucleótidos son 4, se puede tener adenina, timina, guanina o citosina; en
este caso, los únicos estados posibles son que sea gram- o gram+, que sea un MO de colonización
intracelular o extracelular (entonces según eso, salmonella nunca hace extracelular y los otros si),
metabolizadores de lactosa que lo son E. coli y K. pneumoniae; y meningitis que solo lo causa E. coli.
Con estos caracteres se puede hacer un cladograma, y se hace de la siguiente manera:
esta es una línea imaginaria del tiempo, se asume que la caracteriza compartida por todos es la más
antigua, es la ancestral (ser gram-), ahí se grafica.
Después de esto aparecen las nuevas características, el que no comparte la siguiente característica
es salmonella, entonces, ahí se grafica.
Luego, las que comparten el metabolismo de lactosa (Shigella no) se grafican por encima, por lo tanto
esta capacidad de metabolizar lactosa apareció después de que se separaron los clados de Shigella
con Klebsiella pneumoniae; por último está E. coli, que evolucionó la capacidad de producir
meningitis después de que se separó de Klebsiella.
Para hacer una filogenia formal y hacer un artículo, por ejemplo para hacer el alineamiento se tienen
que utilizar programas específicos de comparación de secuencia y ahí hay unos ejemplos, para
hacer una matriz de distancias genéticas también se usan programas específicos. Además de eso
cuando se hace una filogenia normal se usa la teoría evolutiva la cual considera situaciones
adicionales como que los nucleótidos no todos tienen la capacidad de mutar, sino que por ejemplo
entre los que se parecen químicamente hay mayor probabilidad de mutar; ejemplo adenina contra
guanina cambia en una probabilidad del 27%, mientras que un cambio de guanina a timina ocurre en
una proporción más baja 9,2%, la frecuencia de cada nucleótido es también una característica.
Hay organismos ricos en guanina- citosina (bacterias) y hay otros que no lo son, entonces eso
también aumenta la probabilidad de que haya una frecuencia mayor de guanina-citosina y eso cambia
de cómo se utilizan estos procedimientos, a veces no todos los genes cambian a la misma tasa,
porque hay genes que se consideran están bajo selección positiva, o sea yo no puedo cambiar esto
mucho porque pierdo la capacidad de sobrevivir en el hospedero.