Valoracion de Pruebas Diagnosticas Ampliado

DISEÑOS DE INVESTIGACION:
HIPOTESIS:
MUESTRA:
VARIABLES Y OPERACIONALIZACION DE VARIABLES:
INTRUMENTOS DE RECOLECION DE DATOS:
TABLA DE CONTINGENCIA DE 2 POR 2:
CUADROS Y GRAFICAS
TABLAS DE CONTINGENCIA
El término “tabla de contingencia” se refiere a que las tablas construidas se usan para
contrastar una asociación o relación entre dos variables. Las tablas de contingencia son una
forma de presentar datos categóricos, con dos o mas niveles.
Las tablas de contingencia 2 x 2, aparecen cuando cada una de las dos variables se estudia
en dos niveles. Cada observación del conjunto de datos cae exactamente en una celda. El
análisis de datos se basa en el examen del número de observaciones que caen dentro de
cada categoría . También son llamadas tablas tetracóricas, o tablas de conteo.
La notación cuando estamos en frente de un conteo de frecuencias es:
n 11 = número de observaciones dentro de la celda en la fila 1 y la columna 1.
n 1. = n 11 + n 12 = número de observaciones en la fila 1
n 2. = n 21 + n 22 = número de observaciones en la fila 1
n .1 = n 11 + n 21 = número de observaciones en la fila 1

n .2 = n 12 + n 22 = número de observaciones en la fila 1
n = número total de observaciones
Utilizadas para diferentes analisis de datos:
PRUEBA DE INDEPENDENCIA (ji-cuadrado)
PRUEBA DE HOMOGENIDAD (ji-cuadrado)
ESTUDIOS TRASVERSALES
ji-cuadrado
Odds Ratio (razón de chances)
ESTUDIOS DE CASOS Y CONTROLES
ESTUDIOS DE COHORTES
PRUEBA DE TRATAMIENTOS O INTERVENCIONES
PRUEBA DIAGNOSTICA
PRUEBA DE INDEPENDENCIA
ji-cuadrado
En una prueba de independencia el único número que el investigador controla directamente

es el tamaño total de la muestra. Se extrae una muestra de tamaño n de la población y cada
objeto se clasifica según las dos variables que se estudian. Ni las frecuencias de cada celda,
ni los totales de fila y columna se conocen de antemano.
El investigador no fija previamente ningún conjunto, es decir, son aleatorios.
El planteamiento de las Hipótesis será:
H 0 : A y B son independientes
H 1 : A y B no son independientes
Independencia significa que el conocimiento del nivel de clasificación de un objeto
respecto a la característica A no tiene nada que ver con su nivel respecto a la característica
B. Para expresar esta idea matemáticamente utilizamos las probabilidades dadas en la
siguiente tabla:
Tabla 2. Tabla de contingencia 2 x 2 con proporciones o probabilidades
Variable 1 (A)
Si No Total
Variable 2
Si p 11 p 12 p 1.
No p 21 p 22 p 2.
(B)
Total p .1 p .2 1
Se sabe que, para que dos sucesos sean independientes, la probabilidad de que ocurran
ambos a la vez debe ser igual al producto de las probabilidades de que cada suceso ocurra
individualmente.
P[A y B] = P[A]P[B]
p 11 = p .1 p 1.
La relación debe cumplirse para cada celda. Por tanto, la hipótesis nula de independencia se
expresa matemáticamente como
i = 1, 2
H 0 : p ij = p i. P .j
j = 1, 2
i = 1, 2
H 1 : p ij ? p i. P .j
j = 1, 2
Comparamos el número de observaciones en cada celda con el número esperado, si H 0 es

cierta. Si estos números difieren poco, no hay razón para rechazar H 0 ; si hay una gran
discrepancia entre los valores observados y esperados, entendemos esto como evidencia de
que H 0 no es cierta. Entonces se calcula el valor esperado así:
E ij = np ij
n 1. n .1 total fila marginal x total comlumna marginal

Ê 11 = ________________________ _________________________
n tamaño de la muestra
La pregunta es la siguiente: ¿son estas diferencias demasiado grandes como para que se
deban únicamente al azar?
Para responderla necesitamos un estadístico cuya distribución de probabilidad sea conocida

bajo la hipótesis de que H0 es cierta. El estadístico en cuestión es:
Prefijamos un nivel de significancia en 0.05
Si el valor p es pequeño (es menor de 0.05); podemos rechazar H 0
Para que las pruebas de Ji-cuadrado sean válidas, es necesario que las muestras sean
grandes. Es decir que las frecuencias esperadas no sean menores de 5. Si esto no se cumple,
puede utilizarse una prueba para pequeñas muestras llamada prueba exacta de Fischer para
contrastar independencia.
EJEMPLO
Se realiza una investigación para determinar si hay alguna asociación aparente entre la
altura de los estudiantes de posgrado y el éxito en sus clases, a juicio de sus profesores. Se
selecciona una muestra aleatoria consistente en 500 estudiantes. Se clasifica a cada
estudiante de acuerdo a dos criterios, la altura y el éxito. La tabla de contingencia generada
es la siguiente:
Mayor altura que el promedio poblacional

Si No
Exito Si 162 263 425
No 38 37 75
200 300 500
Comparamos el número de observaciones en cada celda con el número esperado, si H 0 es

cierta:
Datos utilizados para contrastar asociación entre altura y éxito en las clases. Las frecuencias
esperadas aparecen entre paréntesis :
Mayor altura que el promedio poblacional

Si No
Exito Si 162 (170) 263 (255) 425
No 38 (30) 37 (45) 75
200 300 500
Para saber si las diferencias entre valores halladoz y valores esperados es significativa
entonces aplicamos el estadistico ji-cuadrado:
A partir de la tabla Ji-cuadrado vemos que:
Como 4.18 está entre 3.84 y 5.02, el valor p está entre 0.025 (0.975) 0.05 (0.950). El valor
p es pequeño, es menor de 0.05. Podemos rechazar H 0 y concluir que la sobretalla y el
éxito en las clases no son independientes.
PRUEBA DE HOMOGENEIDAD
ESTADISTICO JI-CUADRADO
Considerando la segunda configuración experimental, en la que un conjunto de marginales

totales está fijado por el investigador, mientras que el otro es aleatorio, estamos en la
situación de que hay dos poblaciones en estudio. Estamos interesados en una característica
particular, y queremos responder a la pregunta ¿es igual la proporción de objetos con la
misma característica en las dos poblaciones?.
Los totales de fila marginales son fijados previamente por el Investigador. Los totales
columna marginales son libres, es decir, son variables aleatorias cuyos valores numéricos
sólo se conocen al final del experimento.
Si no hay asociación entre exposición y desarrollo de la enfermedad, la proporción de

personas con la enfermedad debería ser la misma en las dos poblaciones. Si hay
asociación estas proporciones podrían ser distintas .
Se usan las siguientes proporciones para expresar la hipótesis nula y comprender el

estadístico utilizado para contrastar H 0. La hipótesis nula de no asociación entre población
(variable B) y característica (variable A) es:
H 0 : p 11 =p 21
Obsérvese que si H 0 es cierta, también es cierto que p 12 = p 22 .
H 0 : la proporción con la característica es la misma en cada población.
El valor esperado se calcula así:
E 11 = n 1. p 11 .
E 21 = n 2. p 21 .
Donde
Ê 11 = n 1. = total fila x total columna / tamaño de la muestra
Luego se busca el valor p para el valor encontrado por el estadistico:

ELEMPLO
Un centro de atención odontológico que realiza en su mayoría obturaciones de amalgama,

ha expuesto a sus trabajadores a la manipulación del mercurio durante diez años. Se realiza
una investigación para descubrir si hay alguna asociación aparente entre la exposición y el
desarrollo de cierta enfermedad de la sangre. Para llevar a cabo el experimento se eligen
muestras aleatorias de 300 personas expuestas y 320 no expuestas. Estamos trabajando con
muestras de las dos poblaciones, los expuestos y los no expuestos. Se estudia cada sujeto
para determinar si tiene la enfermedad. El experimento genera una tabla 2 x 2 así:
luego de calcular las frecuencias esperadas, que aparecen entre paréntesis en la tabla:
Tiene la enfermedad
Si No
Expuesto a la Si 52 (48.39) 248 (151.61) n 1. = 300 (fijo)
manipulación de
mercurio No 48 (51.61) 272 (268.39) n 2. = 320 (fijo)
n .1 =100 n .2 =520 N = 620
(aleatorio) (aleatorio)
Calculamos el estadístico:
El valor p, a partir de la tabla Ji-cuadrado es:
Como el valor p es de 0.10. El valor p es > 0.05. No hay evidencia para rechazar la
hipótesis nula de igualdad de proporciones y de no asociación. En este caso las variables no
están asociadas lo que quiere decir que el mercurio no tiene que ver con la aparición de la
enfermedad.
ESTUDIOS TRASVERSALES
Los estudios transversales son diseños en los cuales la exposición y la enfermedad se miden
simultanamente o con una diferencia de tiempo muy corta. Debido a esto se denominan
estudios no direccionales .
Los estudios transversales permiten identificar individuos con determinada enfermedad y

sin ella, en una población, o determinados factores de riesgo o variables asociadas; de esta
manera son una fuente de sujetos para efectuar estudios de casos y controles. O de cohortes
.
Tres tipos de estudios transversales:
1. Estudio de prevalencia: Mide la frecuencia de un fenómeno en una población.

2. Estudio comparativo de Prevalencias: Evalúa en diferentes poblaciones, la
frecuencia de la enfermedad y compara las proporciones.
3. Estudio de asociación: Acá se evalúa simultanamente dos o más variables para
determinar si ellas son o no independientes.
los datos se organizan en una tabla de contingencia de 2x 2 asi:
Enfermedad
Si No Total
Exposición Si a b a+b
No c d c+ d
Totales a+c b+d a+b
+c+
d
Podemos obtener:
Prevalencia de la exposición:
Prevalencia de la enfermedad:
Prev. De exposición en los que tienen la enfermedad =

Prev. De exposición en los que no tienen la enfermedad =
Comparar la prevalencia entre expuestos y no expuestos y medir qué tan significativa es la

diferencia entre las proporciones con la prueba Ji-cuadrado.
Prevalencia de enfermedad en los expuestos =
Prevalencia de enfermedad en los no expuestos =
EJEMPLO: a partir de los siguientes datos podemos obtener:
Tiene la enfermedad
Si No
Expuesto a la Si 52 (48.39) 248 (151.61) n 1. = 300 (fijo)
manipulación de
mercurio No 48 (51.61) 272 (268.39) n 2. = 320 (fijo)
n .1 =100 n .2 =520 N = 620
(aleatorio) (aleatorio)
Prevalencia de la exposición:
Prevalencia de la enfermedad:
Prevalencia de enfermedad en los expuestos =

Prevalencia de enfermedad en los no expuestos =
Comparar la prevalencia entre expuestos y no expuestos y medir qué tan significativa es la

diferencia entre las proporciones con la prueba Ji-cuadrado.
Como el valor p es de 0.10. El valor p es > 0.05. No hay evidencia para rechazar la
hipotesis nula de igualdad de proporciones y de no asociación. En este caso las variables no
están asociadas lo que quiere decir que el mercurio no tiene que ver con la aparición de la
enfermedad.
ESTUDIOS DE CASOS Y CONTROLES
Los estudios de casos y controles son un tipo de investigación epidemiológica

observacional analítica. Por medio de este diseño se intenta establecer la asociación entre
una característica presente en el individuo, que llamaremos desenlace, y una exposición
previa, que debería incidir en la aparición de ese desenlace.
TABLAS DE CONTINGENCIA EN ESTUDIOS DE CASOS Y CONTROLES:
Desenlace --- enfermedad o Muerte

Si No
Exposición Si a b
No c d
Casos Controles
donde:
a = Caso expuesto
b = Control expuesto
c = Caso no expuesto
d = Control no expuesto
Acá analizamos la asociación entre las dos variables “exposición y desenlace” se utiliza la
prueba estadística Ji- cuadrado.
También se calcula el odds ratio
Se calcula el OR que se interpreta así:
Si el OR = 1 no se tendrá mayor riesgo por estar expuesto
Si el OR > 1 los expuestos tendrán mayor riesgo de desarrollar la enfermedad (factor

de riesgo)
Si el OR < 1 los expuestos tendrán menor riesgo de presentar la enfermedad (factor de

protección)
ESTUDIO DE COHORTES
Es un estudio observacional analítico, es decir no se realiza ni intervención, ni

aleatorización. Todos los sujetos son muy similares al inicio y difieren únicamente en los
factores de riesgo, pronóstico o exposición.
En el caso de los factores de riesgo el evento esperado es la enfermedad. En el caso de los

factores pronóstico, el evento esperado es una variedad de consecuencias relacionadas con
la enfermedad (muerte, incapacidad, secuelas, complicaciones, calidad de vida,
sufrimiento).
TABLAS DE CONTINGENCIA EN ESTUDIOS DE COHORTES
Se mide :
Enfermedad
Si No Total
Exposición Si a b a+b
No c d c+ d
Totales a b a + b + c + d
+ +
c d
Incidencia de la enfermedad en los expuestos =
Incidencia de la enfermedad en los no expuestos =
Si se realiza la división entre las dos incidencias, se obtiene una razón, que es lo que se
conoce con el nombre de riesgo relativo (RR).
RIESGO RELATIVO
En este tipo de estudio, una medida epidemiológica de asociación es el riesgo relativo (

RR). El riesgo relativo compara la incidencia de la enfermedad entre los expuestos con
la incidencia de la enfermedad entre los no expuestos
 Si RR = 1, la exposición no modifica el riesgo de enfermar entre los expuestos y los

no expuestos
 Si RR > 1, significa que la exposición aumenta la enfermedad en los expuestos

cuando se compara con los no expuestos.
 Si RR < 1, quiere decir que la exposición está protegiendo a los expuestos de que se
presente la enfermedad cuando se compara con los no expuestos.
"SIN EMBARGO, PARA QUE ESTOS RESULTADOS SEAN ESTADÍSTICAMENTE

SIGNIFICATIVOS TIENEN QUE HABERSE SOMETIDO AL TAMIZAJE DE UNA
PRUEBA DE SIGNIFICANCIA, QUE PARA EL CASO DEL RR ES EL Ji- cuadrado"
PRUEBA DE TRATAMIENTOS O ESTUDIOS DE INTERVENCIONES
Se puede definir una intervención, como toda acción que busca prevenir un desenlace, o
modificar el pronóstico de una entidad.
La forma ideal de estudiar una intervención es mediante un método que permita distribuir
todas las características de los individuos que pudieran tener relación con el desenlace, de
manera similar entre los dos grupos que se van a comparar. Acá el desenlace puede ser la
cura de la enfermedad. Así por ejemplo, la edad, los antecedentes de enfermedades, el peso,
la masa corporal, el grupo etnico, el destado de desarrollo dental, la maloclusión, etc.
debieran quedar igualmente distribuidos entre los dos grupos de comparación. Esto se logra
mediante la asignación aleatoria al tratamiento.
Hay tres características ideales para evaluar una intervención:
1. Tener un grupo de comparación

2. Asignar los pacientes por un método aleatorio al tratamiento
3. Controlar las variables que puedan causar confusión en la evaluación del desenlace.
Todas estas características las cumple los estudios clínicos aleatorizados controlados
(ECC).
TABLAS DE CONTINGENCIA EN ESTUDIOS DE INTERVENCIONES
n los ECC se tratará de mirar el número de personas que presentan un desenlace, dado que
se está expuesto a una intervención. Y se comparará con el número de personas que
presentan ese desenlace, dado que no se está expuesto o se está expuesto a otra intervención
EJEMPLO:
Se cree que el tratamiento con máscara facial en pacientes con maloclusión clase III de tipo
óseo, es efectivo para estimular el crecimiento del maxilar, redirigir el crecimiento
mandibular, corrigiento la maloclusión. Se realiza un estudio clínico aleatorizado
controlado, en el cual, a un grupo homogéneo de pacientes con el diagnóstico de
maloclusión clase III, se le toman registros iniciales de radiografía cefálica, modelos de
estudios, etc. , se designan aleatoriamente los pacientes que van a recibir tratamiento y los
que no y se procede a realizar la intervención. Luego de un año de tratamiento, se vuelven a
tomar los registros y se determina si en realidad hubo crecimiento o la corrección se debió a
procesos de compensación dental.
Desenlace
Crecimiento Compensación
Si No
Tratamiento Si a b
No c d
con máscara facial
Los resulatos fueron los siguientes:
Desenlace
Si No
Tratamiento Si 60 40 100
No 20 80 100
con máscara
facial
80 120 200
Comparamos la proporción (incidencia) de pacientes que estando expuestos a tratamiento

con máscara presentaron crecimiento, con la proporción de pacientes que no estando
expuestos al tratamiento presentaron crecimiento.
H0:p1=p2
H0:p1?p2
Por medio de la prueba JI-cuadrado
Desenlace
Si No
Tratamiento Si 60 (40) 40 (60) 100
No 20 (40) 80 (60) 100
con máscara
facial
80 120 200
entonces:
A un nivel de significancia de 0.05 y según la tabla de probabilidades de la distribución Ji-

cuadrado, tenemos que este valor p es menor que 0.001, es decir que rechazamos la
hipotesis de igualdad de proporciones y decimos que la proporción (incidencia) de
pacientes que estando expuestos a tratamiento con máscara presentaron crecimiento, es
significativamente diferente con la proporción de pacientes que no estando expuestos al
tratamiento presentaron crecimiento.
Si se encuentra que son muy diferentes, se considera que hay asociación entre la
variable exposición y el desenlace.
Para saber si esa asociación tiene significancia clínica, en este tipo de estudio, se utiliza una
medida epidemiológica de asociación es el riesgo relativo ( RR). El riesgo relativo compara
la incidencia del desenlace de crecimiento (SI) entre los expuestos con la incidencia del
desenlace de compensación (NO) entre los no expuestos:
Quiere decir que los pacientes que fueron expuestos al tratamiento con máscara facial
tienen la mitad de riesgo de compensación, frente a los que no estuvieron expuestos al
tratamiento con máscara.
recordemos que:
 Si RR = 1, la exposición no modifica el riesgo de enfermar entre los

expuestos y los no expuestos
 Si RR > 1, significa que la exposición aumenta la enfermedad en los
expuestos cuando se compara con los no expuestos.
 Si RR < 1, quiere decir que la exposición está protegiendo a los expuestos,

de que se presente la enfermedad, cuando se compara con los no expuestos.
Dado que el RR e s menor que 1 el tratamiento con máscara está estimulando

verdaderamente el crecimiento.
PRUEBA DIAGNOSTICA
El diagnóstico puede ser definido como el proceso de usar la historia clínica, el examen
físico, de laboratorio, estudios de imágenes y otras pruebas para identificar la enfermedad
responsable de la queja del paciente.
La ventaja de conocer la enfermedad responsable, y darle un nombre, es que podemos

tomar una decisión acerca del tratamiento y dar a los pacientes una información más segura
acerca del pronóstico.
Hay dos tipos de pruebas diagnósticas: cualitativas y cuantitativas.
Las pruebas diagnósticas cualitativas son aquellas que clasifican a los pacientes como
enfermos o libres de enfermedad, acorde con la presencia o ausencia de signos o síntomas.
Por ejemplo, una radiografía panorámica puede descartar la presencia de dientes
supernumerarios. En este caso el patrón referente es el número de dientes normal para la
edad 3 .
Las pruebas diagnósticas cuantitativas clasifican a los pacientes como enfermos o libres de
la enfermedad sobre la base de si ellos caen arriba o abjo de una cifra de corte
preseleccionada y que es conocida como criterio de positividad, valor crítico o valor de
referencia 3 .
VALIDEZ DE UNA PRUEBA DIAGNÓSTICA
Cualquier prueba diagnóstica dada está basada en la premisa de que los individuos
enfermos y los saludables pueden exacta y consistentemente ser diferenciados por la prueba
diagnóstica.
Si se encuentra ante una condición o enfermedad verdadera que se expresa a través de

diferentes maneras, como signos, síntomas, imágenes, resultados de laboratorio, estudios
histológicos, etc. El patrón de referencia o “Gold Estándar” es aquella prueba que se
acerca más a la verdadera condición.
El proceso diagnóstico estriba en determinar cuán distante está la nueva prueba dignóstica
del patrón de referencia que se supone está más cerca de la verdad. La distancia que
separará a la nueva prueba en estudio del patrón de referencia recibe el nombre de validez
de criterio y esta validez se mide a través de indicadores como la sensibilidad,
especificidad y valores predictivos positivos y negativos.
DEFINICIONES:
Prevalencia: probabilidad de una enfermedad, dentro de una población, en cualquier punto

del tiempo.
Incidencia: probabilidad que tiene un paciente sin enfermedad de desarrollar la

enfermedad durante un intervalo de tiempo (la incidencia de la dibetes mielitus es 0.2% por
año, refiriéndose a los nuevos casos.
Sensibilidad: probabilidad de una prueba positiva entre los pacientes con la enfermedad.
Especificidad: probabilidad de una prueba negativa entre los pacientes sin la enfermedad.
Valor predictivo positivo: Responde a la pregunta ¿ Dado el resultado positivo de una

prueba, cuál es la nueva probabilidad de enfermarse?
Valor predictivo negativo: Responde a la pregunta ¿ Dado el resultado negativo de una

prueba, cuál es la nueva probabilidad de enfermarse?
TABLAS DE CONTINGENCIA EN PRUEBAS DIAGNOSTICAS:
Pacientes con Pacientes sin Totales

enfermedad enfermedad
marginales
Prueba diagnóstica a b a+b
positiva
Prueba diagnóstica c d c+d
negativa
Totales a+c b+d a+b+c+d
marginales
 Verdaderos positivos (VP) = Casilla a

 Verdaderos negativos (VN) = Casilla d
 Falsos positivos (FP) = Casilla b
 Falsos negativos (FN) = Casilla c
 Todos los enfermos = (a+c)
 Todos los sanos = (b+d)
 Todas las pruebas positivas = (a+b)
 Todas las pruebas negativas = (c +d)
 Prevalencia : a + c / a + b + c + d
Valor Predictivo positivo:
Valor Predictivo negativo:

Los valores predictivos ayudan a contestar la pregunta: “¿Dado el resultado positivo o
(negativo) de una prueba, cuál es la nueva probabilidad de enfermarse?”
Probabilidad post-prueba de enfermarse dado una prueba positiva :
Probabilidad post-prueba de enfermarse dado una prueba negativa :
EJEMPLO:
Ejemplo 4. Consideremos el “dolor nocturno” en el diagnóstico de la pulpitis irreversible.
Pulpitis irreversible No pulpitis Totales

irreversible
Dolor nocturno 10 3 13
No dolor nocturno 31 215 246
Totales 41 218 259
= o 24%
o 98%
"PRUEBA DE ESPECIFICIDAD ALTA Y POSITIVA ==> HAY MAYOR

PROBABILIDAD DE ENFERMEDAD"
RAZONES DE PROBABILIDAD (LR) LIKELIHOOD RATIOS
Cuando decidimos ordenar una prueba diagnóstica, queremos saber cuál prueba nos va
ayudar mejor a descartar una enfermedad en nuestro paciente. En el lenguaje
epidemiológico, tomamos una determinación inicial de la probabilidad de la enfermedad
(probabilidad pre-prueba), practicamos la prueba, y luego realizamos una determinación
final de la probabilidad de la enfermedad (probabilidad post – prueba). El siguiente
diagrama nos ilustra este proceso de “revisar la probabilidad de la enfermedad”.
Las razones de probabilidad nos dicen: cuánto debemos inclinar nuestra sospecha hacia un
resultado particular. Dado que las pruebas pueden ser positivas o negativas, hay al menos
dos razones de probabilidad para cada prueba. La “razón de probabilidad positiva” (LR+)
nos dice cuanto se incrementa la probabilidad de enfermar si la prueba es positiva, mientras
la “razón de probabilidad negativa” (LR-) nos dice cuanto desciende la probabilidad de
enfermar si la prueba es negativa. La fórmula para calcular la razón de probabilidad es:
Probabilidad de individuo con la condición teniendo el resultado de la prueba
LR =-----------------------------------------------------------------------------------------------------
Probabilidad de individuo sin la condición teniendo el resultado de la prueba
Probabilidad de individuo con la condición teniendo la prueba positiva
LR+ = -----------------------------------------------------------------------------------------
Probabilidad de individuo sin la condición teniendo la prueba positiva
Probabilidad de individuo con la condición teniendo la prueba negativa
LR - = ------------------------------------------------------------------------------------------
Probabilidad de individuo sin la condición teniendo la prueba negativa
También se puede definir la LR + y LR_ en términos de sensibilidad y especificidad:
sensibilidad
LR+ = __________________
(1- especificidad)
(1 – sensibilidad)
LR- =
(especificidad)
Interpretación de las razones de probabilidad:
Un LR >1 indica una probabilidad incrementada de que la enfermedad esté presente.
Un LR <1 indica un descenso en la probabilidad de que la enfermedad esté presente
VALORACION DE PRUEBAS DIAGNOSTICAS:
Valoración de pruebas diagnósticas www.seh-lelha.org/pdiagnos.htm
Preparado por Luis M. Molinero (Alce Ingeniería)
CorreoE: bioestadistica alceingenieria.net

Octubre 2002
www.seh-lelha.org/stat1.htm
Esta página se acompaña con 2 calculadoras en línea
Aunque la literatura médica y el diseño de estudios de investigación ponen en general un

mayor énfasis en el tratamiento de las enfermedades, también las tareas diagnósticas
constituyen un núcleo muy importante de la práctica médica. Los procedimientos para
evaluar cuantitativamente la eficacia de un proceso de diagnóstico son sobradamente
conocidos y se basan en determinar su capacidad para clasificar correctamente los sujetos
en dos o más grupos. Se trata de determinar cómo se ajustan a la realidad los resultados de
clasificación, obtenidos con la prueba diagnóstica, y para ello es preciso conocer esa
realidad mediante algún método alternativo y completamente fiable, lo que en ocasiones no
es posible.
Es evidente que una buena prueba diagnóstica es la que ofrece resultados positivos en
enfermos y negativos en sanos. Por lo tanto, las condiciones que deben ser exigidas a un
test son3:
 Validez: Es el grado en que un test mide lo que se supone que debe medir.
¿Con que frecuencia el resultado del test es confirmado por procedimientos
diagnósticos más complejos y rigurosos? La sensibilidad y la especificidad
de un test son medidas de su validez.
 Reproductividad: es la capacidad del test para ofrecer los mismos
resultados cuando se repite su aplicación en circunstancias similares. La
variabilidad biológica del hecho observado, la introducida por el propio
observador y la derivada del propio test, determinan su reproductividad.
 Seguridad: La seguridad viene determinada por el valor predictivo de un
resultado positivo o negativo. ¿Con que seguridad un test predecirá la
presencia o ausencia de enfermedad? Ante un resultado positivo de un test
¿qué probabilidad existe de que este resultado indique presencia de la
enfermedad? Veremos posteriormente que esta probabilidad está muy
influenciada por la prevalencia de la patología.
El caso más sencillo de prueba diagnóstica es aquél en el que el resultado de la prueba es

dicotómico, pudiendo entonces reflejarse en una tabla como la de la figura
Patología
Enfermo E+ Sano E-
Positivo T+ a b Positivos Np = a+b

Prueba Negativo Negativos Nn =
c d
T- c+d
Total enfermos Ne = Total sanos Ns =

Total N
a+c b+d
En este contexto se utilizan dos índices para evaluar la calidad de la prueba diagnóstica:
Sensibilidad, es la proporción de verdaderos positivos identificados por la prueba del

total de enfermos.
Especificidad, es la proporción de verdaderos negativos identificados por la prueba del
total de sanos.
Aunque éstos son dos índices de calidad de la prueba, en la práctica clínica las preguntas a
las que interesa responder son: si un sujeto ha resultado positivo, ¿cuál es la probabilidad de
que esté verdaderamente enfermo? P(E+/T+), o por el contrario, si el sujeto resultó
negativo en la prueba ¿cuál es la probabilidad de que realmente esté sano? P(E-/T-). Estas
dos probabilidades se pueden calcular aplicando el teorema de Bayes, siempre que
sepamos la probabilidad de que el sujeto esté enfermo antes de realizar la prueba, que se
conoce como probabilidad pre-prueba. Si no tenemos ninguna información adicional
sobre el sujeto, dicha probabilidad será la prevalencia de la patología en la población,
aplicable sólo en el caso de programas de cribado o "screening" sobre la población general,
ya que en la práctica habitual los sujetos candidatos a una prueba diagnóstica lo son por las
sospechas deducidas de la anamnesis o por una sintomatología previa, y por tanto la
probabilidad de que padezcan la enfermedad bajo sospecha será superior a la prevalencia de
ésta en la población general.
Si llamamos P a la probabilidad pre-prueba de padecer la enfermedad, S a la sensibilidad de

la prueba y E a su especificidad, tenemos las siguientes fórmulas para calcular la
probabilidad post-prueba de que el sujeto esté enfermo cuando resultó positivo o de que
esté sano cuando resultó negativo:
donde la probabilidad condicional la hemos representado de la forma habitual con el

símbolo /. Así Pr(E+/T+) significa suceso E+ (enfermo) condicionado a que haya ocurrido
el suceso T+ (resultado + en la prueba).
Si calculamos estas probabilidades únicamente con los datos de nuestra tabla, la primera de
ellas P(E+/T+) corresponde a la proporción de sujetos que verdaderamente tienen la
enfermedad, de entre los que dieron positivo, y se conoce como valor predictivo positivo
VP+
Igualmente podemos calcular en la tabla la proporción de sujetos verdaderamente sanos
sobre el total de los que dieron negativo, valor predictivo negativo VP-
Puesto que esos dos índices VP+ y VP- son los que interesan en la práctica clínica,
parecería natural utilizarlos como índices de comparación a la hora de evaluar dos métodos
diagnósticos diferentes. Sin embargo presentan un grave inconveniente, ya que si se
calculan a partir de la tabla dependen de la proporción de enfermos en la muestra estudiada.
Por ello para una determinada prueba resulta necesario determinar unos índices de
valoración que, respondiendo a las necesidades reales en cuanto a la clasificación de
pacientes, sin embargo no dependan de esa proporción de enfermos en la muestra.
Así, podemos calcular el cociente entre la tasa de verdaderos positivos y la tasa de falsos
positivos:
Este cociente CP+ se conoce como cociente de probabilidad positivo o también como
cociente de verosimilitud (likelihood ratio of positive test). Valores mayores de CP+
indican mejor capacidad para diagnosticar la presencia de enfermedad.
De la misma forma, podemos definir un cociente de probabilidad negativo CP-
Vemos que valores de CP- menores indican una mejor capacidad diagnóstica de la prueba.
Se puede determinar unas fórmulas para expresar los cocientes de probabilidad en función
de la sensibilidad S y de la especificidad E
La ventaja de los cociente CP+ y CP- frente a los valores predictivos positivo y negativo
de la prueba radica en que, a diferencia de éstos, no dependen de la proporción de enfermos
en la muestra, sino tan sólo de la sensibilidad y especificidad de ésta, de ahí su utilidad a la
hora de comparar pruebas diagnósticas. Además si conocemos o podemos hacer una
estimación de la probabilidad pre-prueba de que un sujeto padezca la enfermedad,
utilizando los cocientes de probabilidad, al realizar el test podemos "corregir" ese valor de
acuerdo con el resultado, de tal manera que la probabilidad aumenta o disminuye según que
el resultado sea positivo o negativo, aplicando la siguiente fórmula
donde P es la probabilidad pre-prueba, CP el correspondiente cociente de probabilidad

(positivo si deseamos calcular la probabilidad de que padezca la enfermedad, negativo en
caso contrario) y Ppost es la probabilidad post-prueba.
Veamos un ejemplo de todo esto con números:
Patología
Enfermo E+ Sano E-
Positivo T+ 72 100 Positivos 172

Prueba
Negativo T- 18 150 Negativos 168
Total enfermos 90 Total sanos 250 Total 340
Aplicando las fórmulas anteriores tenemos
Valor estimado Intervalo de confianza 95 %

Sensibilidad 0.8 0.72 : 0.88
Especificidad 0.6 0.54 : 0.66
CP+ 2 1.66 : 2.4
CP- 0.33 0.22 : 0.51
Evidentemente los valores de los diferentes índices son estimaciones realizadas mediante
un experimento diseñado al efecto, por lo que es necesario calcular algún indicador de su
grado de incertidumbre, como puede ser un intervalo de confianza del 95%. Para el caso de
la sensibilidad y especificidad es sencillo ya que se trata de dos proporciones. En el caso de
los cocientes de probabilidad es algo más complejo y utilizamos una aproximación.
Para este ejemplo, si la probabilidad pre-prueba de un sujeto es de 0.7 y el resultado de la

prueba resulta positivo la probabilidad de que padezca la enfermedad se modifica,
aplicando la fórmula descrita anteriormente, a 0.82, mientras que si fue negativo se
modifica a 0.44.
Si comparamos dos pruebas diagnósticas A y B, y calculamos sus cocientes de probabilidad
positivos, y vemos que CP+A > CP+B, diremos que la prueba A es mejor que la B para
confirmar la presencia de enfermedad.
Si en cuanto a los cocientes de probabilidad negativos vemos que CP-A < CP-B, diremos
que la prueba A es mejor que la B para confirmar la ausencia de enfermedad.
Comparando los cocientes de probabilidad de dos pruebas diagnósticas existen cuatro

posibles resultados que podemos reflejar en una gráfica. En el eje de las Y representamos la
sensibilidad, en el eje de las X se representa (1-Especificidad). El punto representa los
valores de Sensibilidad y (1-Especificidad) observados para nuestra prueba A. Trazamos
una línea desde el origen (0,0) que pase por el punto A y otra desde el valor (1,1) que
también pase por ese punto, quedando dividido el gráfico en cuatro zonas como vemos en
la figura, de tal manera que cualquier otra prueba cuyo resultado representemos en esa
gráfica estará en alguna de las cuatro zonas
Las zonas corresponden a las siguientes situaciones:
1. En esta región la prueba B es siempre superior a la A, tanto para confirmar

presencia como ausencia de enfermedad
2. Aquí la prueba B sólo es superior a la A para confirmar ausencia de enfermedad
3. En esta zona B siempre es inferior a A
4. Si el resultado de B está en este área, será superior a A para confirmar la presencia
de enfermedad
Supongamos que deseamos comparar la prueba A con otra prueba B cuya sensibilidad es
0.9 y especificidad 0.5. Representándolo en la figura obtenemos
Donde vemos que B cae en la zona 2 por lo que es una prueba mejor que la A para
confirmar la ausencia de enfermedad, como podemos determinar también numéricamente al
calcular los correspondientes cocientes de probabilidad CP+ = 1.8 y CP- = 0.2
Todas estas consideraciones se refieren únicamente a la capacidad discriminatoria de una

prueba. La decisión sobre qué prueba diagnóstica es más adecuada, es siempre algo más
complicado, puesto que intervienen otros aspectos, como son el coste de la prueba, los
riesgos que supone para el paciente, valorar las consecuencias que conlleva un falso
positivo o un falso negativo...
Evidentemente para comparar los parámetros de dos pruebas diagnósticas habrá que
considerar que los valores obtenidos son sólo estimaciones y están sometidos por tanto a
posibles errores de muestreo, por lo que habrá que efectuar el correspondiente contraste
estadístico para determinar si las diferencias encontradas son suficientemente importantes
como para no poder ser atribuidas al azar.
Hasta ahora hemos estudiado el caso de un resultado dicotómico, pero en muchas ocasiones
las pruebas diagnósticas son cuantitativas, sobre todo cuando corresponden a
determinaciones analíticas. Evidentemente podemos utilizar todas las consideraciones
hechas hasta el momento si fijamos un punto de corte, un valor determinado de la prueba,
que marque el límite entre sano y enfermo. Pero eso no suele ser una tarea sencilla.
Podemos reflejarlo esquemáticamente en una figura:
Existe una zona de posibles resultados de la prueba para la que la distribución de sujetos
sanos y enfermos se solapan. Si queremos aumentar la probabilidad de detectar pacientes
enfermos, en la gráfica corresponde a mover el punto de corte hacia la izquierda, vemos
que entonces también aumentaremos el número de falsos positivos. Si movemos el punto
de corte hacia la derecha, disminuiremos los falsos positivos, pero a costa de aumentar el de
falsos negativos. Resumiendo, un aumento de la sensibilidad disminuye la especificidad, y
viceversa.
Una herramienta útil para evaluar la capacidad diagnóstica de una prueba cuantitativa para
todos los posibles puntos de corte, es la denominada curva ROC. También nos servirá para
comparar diferentes pruebas.
Para obtener la curva ROC, se calcula la sensibilidad y especificidad para cada uno de los
diferentes valores observados en nuestros datos y se representan en una gráfica, similar a la
anteriormente descrita, con la Sensibilidad en el eje de las Y, (1-Especificidad) en el eje de
las X.
En la situación ideal, una prueba que discrimina perfectamente, quedaría representado en la
gráfica como una línea que coincidiría con los lados izquierdo y superior del cuadrado;
mientras que una prueba que no discrimine en absoluto, corresponde a la línea diagonal (a
45º) que aparece en la figura. Por lo tanto, cuanto más desplazada esté la curva ROC hacia
el vértice superior izquierdo, mejor es la capacidad discriminatoria de la prueba.
Precisamente una forma de evaluar de manera global esa capacidad de discriminación
consiste en calcular el área del polígono que queda debajo de la curva ROC, y se denomina
área bajo la curva, sirviendo como índice de comparación entre pruebas diagnósticas,
cuanto mayor es el área mejor es la capacidad diagnóstica.
Calculadoras
Calculadora a partir de los datos de una tabla 2x2
Calculadora de la probabilidad post-prueba conociendo la sensibilidad y la

especificidad
Enlaces relacionados
Conceptos básicos para interpretar los resultados de un estudio sobre pruebas diagnósticas
Web de la Asociación Española de Atención Primaria
Calculadora para pruebas diagnósticas de la red CASPE (fichero Excel)
Statistics Notes: Diagnostic tests 1: sensitivity and specificity

D G Altman and J M Bland
BMJ 1994; 308: 1552. [Full text]
Statistics Notes: Diagnostic tests 2: predictive values
Douglas G Altman and J Martin Bland
BMJ 1994; 309: 102. [Full text]
Statistics Notes: Diagnostic tests 3: receiver operating characteristic plots
D G Altman and J M Bland
BMJ 1994; 309: 188. [Full text]
Pruebas diagnósticas: Sensibilidad y

especificidad.
Autores:
Pita Fernández, S., Pértegas Díaz, S.
Unidad de Epidemiología Clínica y Bioestadística. Complexo Hospitalario Universitario
de A Coruña (España)
Cad Aten Primaria 2003; 10: 120-124.
Actualizada el 07/12/2010.
Tabla de contenidos:
La validez de una prueba Tablas
diagnóstica: Tabla 1. Relación entre el resultado de una
- Sensibilidad prueba diagnóstica y la presencia o ausencia de
enfermedad
- Especificidad
Tabla 2. Resultados de la exploración y biopsia
- Ejemplo prostática de una muestra de pacientes con
La seguridad de una prueba sospecha de cáncer de próstata
diagnóstica: Tabla 3. Resultados de la aplicación del test de
- Valor predictivo positivo VIH en una población de baja prevalencia
- Valor predictivo negativo Tabla 4. Resultados de la aplicación del test de
La influencia de la VIH en una población de alta prevalencia
prevalencia Cálculos (Excel)
Razones de probabilidad: Estudio de la capacidad predictiva
- Razón de verosimilitudes de una prueba diagnóstica
positiva o cociente de
probabilidades positivo
- Razón de verosimilitudes
negativa o cociente de
probabilidades negativo
Bibliografía
La medicina es una ciencia de probabilidades y un arte de manejar la incertidumbre.

Dicha incertidumbre se extiende no sólo a las actividades preventivas, terapéuticas y
pronósticas sino también a las diagnósticas. En las fases del proceso diagnóstico
intervienen la historia clínica, la exploración física y la realización de pruebas
complementarias1-2. Cuando existen varias hipótesis diagnósticas, se realizará el
diagnóstico diferencial y las pruebas complementarias tratarán de aclarar las dudas
existentes. Si solamente hay una sospecha diagnóstica, las pruebas complementarias
tratarán de confirmarla. La realización simultánea de varias pruebas complementarias se
denomina pruebas complementarias en paralelo y la realización de pruebas
complementarias según los resultados de otras previas, se denomina pruebas
complementarias en serie. Al realizar pruebas en paralelo aumenta la probabilidad de
diagnosticar a un enfermo, pero también aumenta la probabilidad de considerar como
enfermo a un sano. El riesgo de la realización de pruebas en serie es no diagnosticar a
algunos enfermos. En cambio, pocos sanos serán considerados como enfermos.
Es evidente que una buena prueba diagnóstica es la que ofrece resultados positivos en
enfermos y negativos en sanos. Por lo tanto, las condiciones que deben ser exigidas a un
test son3:
 Validez: Es el grado en que un test mide lo que se supone que debe medir.
¿Con que frecuencia el resultado del test es confirmado por
procedimientos diagnósticos más complejos y rigurosos? La sensibilidad y
la especificidad de un test son medidas de su validez.
 Reproductividad: es la capacidad del test para ofrecer los mismos
resultados cuando se repite su aplicación en circunstancias similares. La
variabilidad biológica del hecho observado, la introducida por el propio
observador y la derivada del propio test, determinan su reproductividad.
 Seguridad: La seguridad viene determinada por el valor predictivo de un
resultado positivo o negativo. ¿Con que seguridad un test predecirá la
presencia o ausencia de enfermedad? Ante un resultado positivo de un test
¿qué probabilidad existe de que este resultado indique presencia de la
enfermedad? Veremos posteriormente que esta probabilidad está muy
influenciada por la prevalencia de la patología.
A su vez, es conveniente que el test sea sencillo de aplicar, aceptado por los pacientes o la
población general, que tenga los mínimos efectos adversos y que económicamente sea
soportable.
En este trabajo se revisarán fundamentalmente los conceptos que determinan la

validez de un test (sensibilidad y especificidad) y su seguridad (valores predictivos
positivos y negativos).
La validez de una prueba diagnóstica: Sensibilidad y especificidad
El caso más sencillo que se nos puede plantear es el de una prueba dicotómica, que
clasifica a cada paciente como sano o enfermo en función de que el resultado de la prueba
sea positivo o negativo. En casos como éste, generalmente un resultado positivo se
asocia con la presencia de enfermedad y un resultado negativo con la ausencia de la
misma. Cuando se estudia una muestra de pacientes, los datos obtenidos permiten
clasificar a los sujetos en cuatro grupos según una tabla 2x2 como la que se muestra en la
Tabla 1. En ella, se enfrenta el resultado de la prueba diagnóstica (en filas) con el estado
real de los pacientes (en columnas) o, en su defecto, el resultado de la prueba de
referencia o “gold standard” que vayamos a utilizar. El resultado de la prueba puede ser
correcto (verdadero positivo y verdadero negativo) o incorrecto (falso positivo y falso
negativo). El análisis de su validez puede obtenerse calculando los valores de sensibilidad
y especificidad4:
Sensibilidad
Es la probabilidad de clasificar correctamente a un individuo enfermo, es decir, la

probabilidad de que para un sujeto enfermo se obtenga en la prueba un resultado positivo.
La sensibilidad es, por lo tanto, la capacidad del test para detectar la enfermedad.
Cuando los datos obtenidos a partir de una muestra de pacientes se clasifican en una tabla
como la que se muestra en la Tabla 1, es fácil estimar a partir de ella la sensibilidad como
la proporción de pacientes enfermos que obtuvieron un resultado positivo en la prueba
diagnóstica. Es decir:
De ahí que también la sensibilidad se conozca como “fracción de verdaderos positivos

(FVP)”.
Especificidad
Es la probabilidad de clasificar correctamente a un individuo sano, es decir, la

probabilidad de que para un sujeto sano se obtenga un resultado negativo. En otras
palabras, se puede definir la especificidad como la capacidad para detectar a los sanos. A
partir de una tabla como la Tabla 1, la especificidad se estimaría como:
De ahí que también sea denominada “fracción de verdaderos negativos (FVN)”.
Ejemplo:
Como ejemplo de lo visto hasta ahora, consideremos los datos de un estudio en el que se
incluyó a 2.641 pacientes con sospecha de cáncer prostático que acudieron a una consulta
de Urología durante un periodo de tiempo determinado. Durante su exploración, se
recogió el resultado del tacto rectal realizado a cada uno de estos pacientes, según fuese
éste normal o anormal, y se contrastó con el posterior diagnóstico obtenido de la biopsia
prostática. Los datos del estudio y los resultados obtenidos se muestran en la Tabla 2. Se
encontraron en total 1.121 casos de cáncer, lo cual representa un 42,45% del total de
sujetos estudiados. La sensibilidad del tacto rectal para detectar cáncer fue de 56,56%
(634/1121) y la especificidad de 82,3% (1251/1520). Así, el tacto fue anormal en un
56,56% de los casos de cáncer prostático y normal en un 82,3% de los casos que
presentaron finalmente otras patologías. Esto significa que un 100-56,56=43,44% de los
pacientes que efectivamente tenían cáncer presentaban tactos normales. Claramente ello
indica la necesidad de utilizar otros marcadores más sensibles, como el PSA o sus
derivados, para poder establecer el diagnóstico de forma más precisa.
Resulta obvio que lo ideal sería trabajar con pruebas diagnósticas de alta sensibilidad y
especificidad, pero esto no siempre es posible. En general, las pruebas de screening deben
ser de alta sensibilidad para poder captar a todos los enfermos. Una prueba muy sensible
será especialmente adecuada en aquellos casos en los que el no diagnosticar la
enfermedad puede resultar fatal para los enfermos, como ocurre con enfermedades
peligrosas pero tratables, como los linfomas o la tuberculosis, o en enfermedades en las
que un falso positivo no produzca serios trastornos psicológicos o económicos para el
paciente (por ejemplo, la realización de mamografía en el cáncer de mama).
Por otra parte, la especificidad se refiere, como se señaló previamente, a la probabilidad

de que un sujeto sano sea clasificado adecuadamente. En general, las pruebas
confirmatorias del diagnóstico deben ser de alta especificidad, para evitar falsos positivos.
Los tests de alta especificidad son necesarios en enfermedades graves pero sin
tratamiento disponible que las haga curables, cuando exista gran interés por conocer la
ausencia de enfermedad o cuando diagnosticar a un paciente de un mal que realmente no
padece pueda acarrear graves consecuencias, ya sean físicas, psicológicas o económicas
(por ejemplo, en el caso del SIDA).
La seguridad de una prueba diagnóstica. Valores predictivos.
Los conceptos de sensibilidad y especificidad permiten, por lo tanto, valorar la validez de

una prueba diagnóstica. Sin embargo, carecen de utilidad en la práctica clínica. Tanto la
sensibilidad como la especificidad proporcionan información acerca de la probabilidad de
obtener un resultado concreto (positivo o negativo) en función de la verdadera condición
del enfermo con respecto a la enfermedad. Sin embargo, cuando a un paciente se le
realiza alguna prueba, el médico carece de información a priori acerca de su verdadero
diagnóstico, y más bien la pregunta se plantea en sentido contrario: ante un resultado
positivo (negativo) en la prueba, ¿cuál es la probabilidad de que el paciente esté
realmente enfermo (sano)?. Así pues, resulta obvio que hasta el momento sólo hemos
abordado el problema en una dirección. Por medio de los valores predictivos
completaremos esta información5:
Valor predictivo positivo:
Es la probabilidad de padecer la enfermedad si se obtiene un resultado positivo en el test.

El valor predictivo positivo puede estimarse, por tanto, a partir de la proporción de
pacientes con un resultado positivo en la prueba que finalmente resultaron estar enfermos:
Valor predictivo negativo:
Es la probabilidad de que un sujeto con un resultado negativo en la prueba esté realmente

sano. Se estima dividiendo el número de verdaderos negativos entre el total de pacientes
con un resultado negativo en la prueba:
Retomando el ejemplo anterior sobre cáncer prostático, el valor predictivo positivo es en

este caso del 70,21% (634/903) y el valor predictivo negativo del 71,98% (1251/1738).
Ello significa que en un 70,21% de los pacientes con un tacto anormal finalmente se
confirmó la presencia de cáncer, mientras que de los que no se detectaron anomalías en el
tacto un 71,98% estaban efectivamente sanos.
La influencia de la prevalencia.
Hemos visto cómo los valores de sensibilidad y especificidad, a pesar de definir

completamente la validez de la prueba diagnóstica, presentan la desventaja de que no
proporcionan información relevante a la hora de tomar una decisión clínica ante un
determinado resultado de la prueba. Sin embargo, tienen la ventaja adicional de que son
propiedades intrínsecas a la prueba diagnóstica, y definen su validez independientemente
de cuál sea la prevalencia de la enfermedad en la población a la cual se aplica.
Por el contrario, el concepto de valores predictivos, a pesar de ser de enorme utilidad a la

hora de tomar decisiones clínicas y transmitir a los pacientes información sobre su
diagnóstico, presenta la limitación de que dependen en gran medida de lo frecuente que
sea la enfermedad a diagnosticar en la población objeto de estudio. Cuando la prevalencia
de la enfermedad es baja, un resultado negativo permitirá descartar la enfermedad con
mayor seguridad, siendo así el valor predictivo negativo mayor. Por el contrario, un
resultado positivo no permitirá confirmar el diagnóstico, resultando en un bajo valor
predictivo positivo.
Ilustraremos lo anterior con un sencillo ejemplo. Para el diagnóstico del VIH se emplean
tests que han confirmado tener una alta validez, con valores aproximados de sensibilidad
y especificidad de un 99,5%. Supongamos que se aplicase esta prueba a la totalidad de la
población gallega, que se cifra en 2.800.000 habitantes. Si asumimos que en Galicia
existen 6.000 pacientes VIH positivos (lo cual implicaría una prevalencia de 6000/
2.800.000 =0,21%), el test resultaría positivo en un total de 19.940 sujetos, obteniéndose
un valor predictivo positivo del 29,9% (Tabla 3). Así pues, sólo un 29,9% de los sujetos
con un resultado positivo en el test resultarían estar realmente afectados, mientras que un
70,1% de los mismos no presentarían la enfermedad. Resulta obvio que en una
comunidad como la gallega la utilización de esta prueba no resultaría útil, debido a la alta
proporción de falsos positivos que conllevaría.
Veamos ahora que ocurriría si se aplicase la misma prueba a una población en la que el
número de enfermos VIH+ fuese de 800.000 (resultando en una prevalencia mucho
mayor de un 800.000/2.800.000=28,6%). En este caso, la predictividad de una prueba
positiva aumenta de un 29,9% a un 98,7%, disminuyendo la proporción de falsos
positivos a tan sólo un 1,3% (Tabla 4). Por lo tanto, si la prevalencia es alta, un resultado
positivo tiende a confirmar la presencia de la enfermedad, mientras que si la prevalencia
es baja, un resultado positivo no permitirá afirmar su existencia.
Razones de probabilidad
Queda claro pues cómo la prevalencia es un factor determinante en los valores predictivos
de un test. Por lo tanto, éstos , no pueden ser utilizados como índices a la hora de
comparar dos métodos diagnósticos diferentes, ni tampoco a la hora de extrapolar los
resultados de otros estudios a datos propios. Por ello, resulta necesario determinar otros
índices de valoración que sean a la vez clínicamente útiles y no dependan de la
prevalencia de la enfermedad en la población a estudiar. Así, además de los conceptos de
sensibilidad, especificidad y valores predicitivos, se suele hablar del concepto de razón de
verosimilitudes, razón de probabilidad, o cociente de probabilidades6. Estos miden cuánto
más probable es un resultado concreto (positivo o negativo) según la presencia o ausencia
de enfermedad:
 Razón de verosimilitudes positiva o cociente de probabilidades

positivo: se calcula dividiendo la probabilidad de un resultado positivo en
los pacientes enfermos entre la probabilidad de un resultado positivo entre
los sanos. Es, en definitiva, el cociente entre la fracción de verdaderos
positivos (sensibilidad) y la fracción de falsos positivos (1-especificidad):
 Razón de verosimilitudes negativa o cociente de probabilidades

negativo: se calcula dividiendo la probabilidad de un resultado negativo
en presencia de enfermedad entre la probabilidad de un resultado negativo
en ausencia de la misma. Se calcula por lo tanto, como el cociente entre la
fracción de falsos negativos (1-sensibilidad) y la fracción de verdaderos
negativos (especificidad):
Volvamos de nuevo al ejemplo planteado en la Tabla 2 sobre el diagnóstico de cáncer
prostático a partir del tacto rectal. En este caso, se obtiene un cociente de probabilidades
positivo de 3,20. Ello viene a indicarnos que un tacto anormal es, por lo tanto, 3 veces
más probable en un paciente con cáncer prostático que en otro sujeto sin cáncer.
La razón de probabilidades ofrece la ventaja de que relaciona la sensibilidad y la

especificidad de una prueba en un solo índice. Además, pueden obtenerse razones de
probabilidad según varios niveles de una nueva medida y no es necesario expresar la
información de forma dicotómica, como resultado de normal o anormal o bien positivo y
negativo. Por último, al igual que sucede con la sensibilidad y la especificidad, no varía
con la prevalencia. Esto permite utilizarlo como índice de comparación entre diferentes
pruebas para un mismo diagnóstico.
Hasta ahora hemos abordado el caso de una prueba con un resultado dicotómico (positivo
o negativo), pero en muchas situaciones la confirmación de un diagnóstico debe hacerse a
partir de un parámetro numérico, sobre todo cuando éste se realiza a partir de
determinaciones analíticas. La generalización a estas situaciones se consigue mediante la
elección de distintos valores de corte que permitan una clasificación dicotómica de los
valores de la prueba según sean superiores o inferiores al valor elegido. La diferencia
esencial con el caso más simple es que ahora contaremos no con un único par de valores
de sensibilidad y especificidad que definan la exactitud de la prueba, sino más bien con
un conjunto de pares correspondientes cada uno a un distinto nivel de decisión. La
estrategia de análisis adecuada consistiría en representar gráficamente los pares (1-
especificidad, sensibilidad) obtenidos al considerar todos los posibles valores de corte de
la prueba, obteniéndose así una curva llamada curva ROC. El área bajo dicha curva se
convierte así en el mejor indicador de la capacidad predictiva del test, independiente de la
prevalencia de la enfermedad en la población de referencia y en base al cual se podrán
establecer comparaciones entre diferentes pruebas diagnósticas7-10.
En definitiva, es sumamente importante el saber valorar la validez y seguridad de las

diferentes pruebas diagnósticas con el fin de seleccionar la más adecuada en cada
momento. La sensibilidad, la especificidad y los valores predictivos son los criterios
tradicionalmente utilizados para valorar la capacidad predictiva de un test11,12. Los
estudios de evaluación de tests diagnósticos son el instrumento adecuado para obtener
esta información. No obstante, no debemos olvidar que existen determinados aspectos en
el diseño de este tipo de investigaciones que pueden afectar a la precisión y a la validez
de las estimaciones realizadas. Una vez más, el cálculo de intervalos de confianza puede
ayudarnos a conocer la precisión de los índices calculados. La población de estudio, la
estrategia de muestreo, la selección del criterio de referencia y la forma de aplicación de
las pruebas diagnósticas serán algunos de los elementos a cuidar para evitar la presencia
de sesgos11,13,14.
Bibliografía
1. Sackett DL, Haynes RB, Guyatt GH, Tugwell P. Epidemiología clínica.
Ciencia básica para la medicina clínica. 2ª ed. Madrid: Editorial médica
panamericana; 1994.
2. Sandler G. The importance of the history in the medical clinic and the cost
of unnecessary test. Am Heart J 1980; 100: 928. [Medline]
3. Morrison AS. Screnning in Chronic disease. Second edition. New York:
Oxford University Press; 1992.
4. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 1: sensitivity
and specificity.BMJ 1994; 308: 1552. [Medline]
5. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 2: predictive
values. BMJ 1994; 309: 102. [Medline]
6. Dujardin B, Van der Ende J, Van Gompel A, Unger JP, Van der Stuyft P.
Likelihood ratios: a real improvement for clinical decisión making? Eur J
Epidemiol 1994; 10: 29-36. [Medline]
7. Burgueño MJ, García Bastos JL, González Buitrago JM. Las curvas ROC
en la evaluación de las pruebas diagnósticas. Med Clin (Barc) 1995; 104:
661-670. [Medline]
8. Zweig MH, Campbell G. Receiver-operating characteristics (ROC) plots: a
fundamental evaluation tool in clinical medicine. Clin Chem 1993; 39:
561-577. [Medline]
9. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 3: receiver
operating characteristic plots. BMJ 1994; 309: 188. [Medline]
10. Lopez de Ullibarri Galparsoro I, Pita Fernández S. Curvas ROC. Cad Aten
Primaria 1998; 5(4): 229-235.
11. Argimon Pallás JM, Jiménez Villa J. Métodos de investigación clínica y
epidemiológica. 2ª ed Barcelona: Harcourt; 2000.
12. Fletcher RH, Fletcher SW, Wagner EH. Clinical epidemiology: the
essentials. 3ª ed. Baltimore: Williams and Wilkins; 1996.
13. Cabello López JB, Pozo Rodríguez F. Estudios de evaluación de las
pruebas diagnósticas en cardiología. Rev Esp Cardiol 1997; 50: 507-
519. [Medline]
14. Greenhalgh T. How to read a paper: papers that report diagnostic or
screening tests. BMJ 1997; 315: 540-543. [Medline] [Texto completo]
GUIA DE ESTUDIO 2 PARA LA MATERIA
SALUD PÚBLICA III
Unidad 6
1. ¿A qué se le llama “estándar de oro”?
-A la prueba cuya alta efectividad esté ya establecida, con

sensibilidad y especificidad cercanas al 100%, que se considera como
estándar o patrón para el diagnóstico de una enfermedad.
2. ¿Para qué sirve el estándar de oro”?
-Para establecer la presencia o ausencia de una enfermedad en un

grupo de personas, a fin de constituir un criterio de referencia para
comparar la efectividad de nuevas pruebas contrastando los resultados
de ambas de manera independiente, con lo cual se lleva a cabo el
proceso de validación del nuevo instrumento, al calcular su sensibilidad y
especificidad.
3. Escriba la definición de sensibilidad.
-Es la probabilidad de que una prueba resulte positiva cuando el

individuo realmente tiene la enfermedad.
Tabla de 2x2 con los resultados de

una prueba
Resultado Sujetos con la Sujetos sin la

de la
prueba enfermedad enfermedad
Positiva Verdaderos b Falsos
positivos positivos
a
Negativa Falsos d
negativos Verdaderos
c negativos
4. Con los resultados de la tabla anterior escriba la fórmula para calcular

la sensibilidad de una prueba.
Verdaderos positivos a
Sensibilidad = ------------------------------------------- = ----

--
Total de casos con la enfermedad a+

c
5. Escriba la definición de especificidad.
-Es la probabilidad de que una prueba resulte negativa

cuando el individuo no tiene la enfermedad.
6. Escriba la fórmula para calcular la especificidad de una

prueba.
Verdaderos negativos d
Especificidad = ---------------------------------- = -------
Total de casos sin la enfermedad b+

d
7. ¿Qué importancia puede tener el calcular la sensibilidad y

especificidad de una prueba tomando en cuenta a los dudosos con o sin
el padecimiento?
-Que al incluir los casos dudosos con o sin el padecimiento se puede

conocer de manera más aproximada la verdadera eficacia diagnóstica
de la prueba.
8. Escriba la fórmula para calcular la sensibilidad tomando en cuenta los

casos dudosos con la enfermedad.
Verdaderos positivos
Sensibilidad = -------------------------------------------------------------
-----------------
Verdaderos pos. + Falsos neg. + Dudosos

con la enfermedad
9. Escriba la fórmula para calcular la especificidad tomando en cuenta

los casos dudosos sin la enfermedad.
Verdaderos negativos
Especificidad = ------------------- -----------------------------------

------------------------
Verdaderos neg. + Falsos pos. +

Dudosos sin la enfermedad
10. Escriba la definición de valor predictivo positivo.
-Es la probabilidad de que un individuo con la prueba positiva

realmente tenga la enfermedad.
11. Escriba la fórmula para calcular el valor predictivo positivo utilizando

el método diagnóstico.
Verdaderos positivos a
VPP = ------------------------------------------------------ = ------

-
Verdaderos positivos + Falsos positivos a

+b
12. Escriba la fórmula para calcular el valor predictivo positivo

utilizando el
teorema de Bayes.
(Sensibilidad) (Prevalencia)
VPP = ----------------------------------------------------------------------
-----------
(Sensibilidad)(Prevalencia) + (1-Especificidad)(1-
Prevalencia)
13. Escriba la definición de valor predictivo negativo.
-Es la probabilidad de que un individuo con la prueba negativa

realmente no tenga la enfermedad.
14. Escriba la fórmula para calcular el valor predictivo negativo utilizando

el método diagnóstico.
VPN = Verdaderos negativos

d
------------------------------------------------------- = -
-------
Verdaderos negativos + Falsos negativos

d+c
15. Escriba la fórmula para calcular el valor predictivo negativo utilizando

el teorema de Bayes.
(Especificidad)(1-Prevalencia)
VPN = ------------------------------------------------------------------
----------------
(Especificidad)(1-Prevalencia) + (1-
Sensibilidad)(Prevalencia)
16. ¿A qué se refiere la razón de probabilidades para una

prueba positiva?
-Es la probabilidad de una prueba positiva en una persona con la

enfermedad de interés dividida por la probabilidad de una prueba
positiva en una persona sin la enfermedad.
17. ¿Cómo se calcula la razón de probabilidades para una

prueba positiva?
RP+ = Sensibilidad/(1 – Especificidad)
18. ¿A qué se refiere la razón de probabilidades para una

prueba negativa?
-A la probabilidad de un resultado negativo en una persona con la
enfermedad de interés dividida por la probabilidad de un resultado
negativo en una persona sin la enfermedad.
19. ¿Cómo se calcula la razón de probabilidades para una

prueba negativa?
RP- = (1- Sensibilidad)/Especificidad
20. ¿A qué equivale la probabilidad preprueba?
-A la prevalencia.
21. ¿Cómo pueden convertirse las “suertes preprueba” en

“suertes posprueba”?
-Aplicando la siguiente fórmula:
Suertes preprueba x razón de probabilidad = suertes

posprueba
22. ¿Qué es una curva COR?
-Una curva COR (curva de características operativas para el receptor)

es una curva que expresa la relación entre la sensibilidad y la
especificidad para una prueba dada y se traza mediante una gráfica de
la tasa de verdaderos positivos (sensibilidad) contra la tasa de falsos
positivos (1-especificidad).
23. ¿Para qué sirve una curva COR?
-Para describir la precisión de una prueba en un intervalo de

puntos de corte.
-Puede servir como nomograma para la lectura de especificidad que

corresponde a una sensibilidad dada.
-Puede servir para comparar la sensibilidad y especificidad

de dos pruebas diagnósticas.
24. ¿Cuál es la zona o sitio ideal para establecer el punto de corte de

una prueba en una curva COR?
-La zona situada hacia el extremo superior izquierdo de la curva en

donde son idealmente mayores tanto la sensibilidad como la
especificidad.
25. ¿Qué son las pruebas en paralelo?
-Son pruebas diagnósticas que se aplican simultáneamente,

y el resultado global se interpreta como positivo o de sospecha,
cuando un resultado que lo es, al menos para una de las
pruebas utilizadas, y no necesariamente para todas.
26. ¿Para qué sirven las pruebas en paralelo?
-Para hacer una evaluación rápida, urgente, sobre todo si se cuenta

no con una muy sensible sino con 2 o más relativamente sensibles.
27. ¿Qué son las pruebas en serie?
-Son pruebas múltiples aplicadas en forma secuencial, es decir,

consecutivamente, cada una basada en los resultados de la prueba
previa que debe ser positiva pues el proceso diagnóstico se interrumpe
cuando se obtiene un resultado negativo.
28. ¿Cuándo se usan las pruebas en serie?
-Cuando el diagnóstico no es urgente o cuando alguna de las pruebas

es costosa y arriesgada y se practica, entonces, sólo cuando las pruebas
menos agresivas y costosas son positivas y sugieren la posibilidad de la
existencia de la enfermedad.
29. ¿Qué son las pruebas de tamiz?
-Son pruebas que se aplican a toda la población asintomática o a un

grupo de población en riesgo para diagnosticar un padecimiento cuya
morbilidad y mortalidad pueden disminuirse si la entidad se detecta y
trata en forma oportuna.
32. ¿Para qué sirven las pruebas de tamiz?
-Para detectar tempranamente, en una población en riesgo,

padecimientos potencialmente graves cuyo principio puede pasar
inadvertido y cuyo pronóstico se puede cambiar radicalmente si se
detectan y tratan oportunamente.
33. ¿Qué características debe tener una prueba de tamiz?
-Tener alta sensibilidad y especificidad, ser fácilmente aplicable,

barata y segura además de ser aceptada tanto por los pacientes como
por quienes la aplican.
34. ¿Qué es la medicina basada en la evidencia (MBE)?
-La MBE es la integración de las mejores evidencias de la investigación

con la experiencia clínica y los valores del paciente.
35.¿La pregunta “¿Cúal es la causa de la rabia?” es básica o
de primera línea?
-Es una pregunta básica.
36.¿La pregunta “¿El tratamiento temprano a base de vacuna y

globulina antirrábica después de ser mordido por un perro con
rabia previene la enfermedad y cambia el pronóstico del
enfermo?” es básica o de primera línea?
-Es una pregunta de primera línea.
Unidad 7
1. ¿Qué es un factor pronóstico?
-Es una característica que predice el curso clínico de una

enfermedad.
2. ¿A qué se denomina como historia natural de la

enfermedad?
-Al origen y evolución de la misma, sin intervención médica.
3. ¿Qué es el curso clínico de la enfermedad?
-Es su evolución con tratamiento médico.
4. ¿Qué es un estudio de cohortes?
-Es un estudio observacional, longitudinal, de preferencia

prospectivo, en donde un grupo está expuesto al factor en estudio y
otro no, buscando el efecto o enfermedad.
5. ¿Qué es el tiempo cero en un estudio de cohorte?
-Es el momento a partir del cual se empieza a observar la cohorte

(inicio de los síntomas, momento del diagnóstico, inicio del tratamiento
de cada paciente).
6. ¿Cuáles son los dos métodos mas comúnmente utilizados para

estimar la curva de sobrevida de un grupo de pacientes durante un
período de observación?
-El método de Cutler-Ederer o estimador actuarial y el método del

producto-límite o estimador de Kaplan-Meier.
DIBUJAR UNA CURVA CON LAS CARACTERÍSTICAS DE LA

PREGUNTA 7
7. ¿Qué diferencia hay entre las curvas de supervivencia A y

B?
-Que aunque las dos tienen una supervivencia de 0 a los 10 años la

curva A muestra una supervivencia del 50% a los 7 años mientras que
la curva B tiene una supervivencia de 50% a los 2 años y a los 7
muestra apenas un 5% de supervivencia, o sea que los sujetos de la
curva B tienen una tendencia a morir mucho más rápidamente que los
de la curva A aunque las curvas se igualen a los 10 años.
Unidad 8
1. ¿Cuál es el sesgo más frecuente en los estudios del curso

clínico de la enfermedad?
-El de selección.
2. ¿Cuándo pueden producirse sesgos de medición en una

cohorte?
-Cuando los procesos finales de interés son poco claros o de

diagnóstico difícil y pueden incrementarse si los criterios de diagnóstico
no se encuentran bien establecidos o los observadores del proceso
están influidos por el tratamiento que está recibiendo el enfermo. Pueden
ocurrir también si no se mide adecuadamente la exposición o factor de
interés entre los grupos que se comparan.
3. ¿En qué consiste la aleatorización?
-En la asignación de los pacientes para recibir el tratamiento

experimental o el de control mediante uno de varios procedimientos
disciplinados -análogos al lanzamiento de una moneda-, donde cada
paciente tiene una oportunidad igual de aparecer en cualquiera de los
grupos de tratamiento.
Tiene como propósito que el azar se encargue de distribuir

uniformemente las características de los participantes entre los grupos
que se conforman.
4. ¿En qué consiste la restricción en un estudio de cohortes?
-En “restringir” o permitir el ingreso de pacientes a un estudio sólo a

aquellos que posean un intervalo estrecho de características, de tal
manera que no haya mucha variación entre uno y otro paciente. Por lo
mismo, tienen después la limitante de no poder hacer extensivos los
resultados del estudio a toda la población.
5. ¿En qué consiste la estratificación en un estudio de

cohortes?
-En la subdivisión de los individuos de la cohorte en subgrupos

(estratos), por lo demás similares, particularmente en función de posibles
factores pronósticos.
6. ¿Qué es un ensayo clínico controlado?
-Es un estudio prospectivo que tiene la finalidad de comparar el efecto

y el valor de una intervención experimental contra otra control o testigo,
administradas ambas de manera aleatoria.
7. ¿Para qué sirven los ensayos clínicos controlados?
-Para evaluar de una manera científica las intervenciones

preventivas o terapéuticas.
8. ¿Para qué sirve el cegamiento en un ensayo clínico?
-Para evitar prejuicios tanto en el investigador como en el paciente o

en quien realiza el análisis de los resultados, que introduzcan sesgos en
el resultado del estudio.
9. ¿Cómo se llama a las intervenciones distintas a las que se están

estudiando que puede recibir un paciente después de la aleatorización?
-Cointervención, contaminación.
10. ¿Qué es la cointervención?
-Es la administración simultánea de un tratamiento

adicional en uno de los grupos.
11. ¿A qué se refiere la contaminación en un estudio?
-A la administración accidental de ambas maniobras, la de control y

la experimental, a un número determinado de pacientes.
12. ¿A qué se refiere el diseño del estudio?
-Se refiere al modo de aplicación de los tratamientos.
13. ¿Cómo se realiza un estudio en paralelo?
-Una vez efectuado el sorteo, cada paciente recibe la alternativa de

tratamiento asignada a su grupo.
14. ¿Cómo se realiza un estudio de tipo cruzado?
-Administrando al mismo sujeto los dos tratamientos por emplear, de

manera alterna, convirtiéndose cada individuo en su propio testigo o
control
15. ¿Para qué sirven los estudios de tipo cruzado?
-Para estudiar, sobre todo en pacientes con algunos padecimientos

crónicos, el efecto de dos tratamientos distintos que deben ser de efecto
y eliminación rápidos para que no interfieran el uno en los resultados del
otro.
16. ¿Qué son las variables de un estudio?
-Son características de los sujetos que tienen interés para

el estudio.
17. ¿Cuáles son variables de tipo demográfico?
-La edad, el sexo, la talla, la raza, el estado civil, etc.

18. ¿Cuáles son las variables de interés para el estudio?
-El diagnóstico, la etapa evolutiva, la presencia de síntomas y

signos cuya modificación sea de interés después de la administración
del tratamiento.
19. ¿Cuándo se dice que un tratamiento es eficaz?
-Cuando hace más bien que daño a quienes lo reciben.
20. ¿Cuándo se dice que un tratamiento es efectivo?
-Cuando hace más bien que daño a quienes se les ofrece.
21. ¿De qué otro modo se denomina el cumplimiento o aceptación de un

tratamiento?
-Adherencia o apego.
22. ¿A qué se refiere el efecto Hawthorne?
-A la tendencia de las personas a cambiar su comportamiento cuando

son blanco de interés y atenciones especiales en un estudio,
independientemente de la naturaleza específica de la atención que
puedan estar recibiendo.
23. ¿En qué consiste la regresión a la media?
-Es la tendencia de alguna manifestación extrema en un momento a

mostrar mejoría por razones puramente estadísticas asociadas a la
variabilidad biológica de cada sujeto y el número de mediciones.
24. ¿Qué son los controles históricos o no concurrentes?
-Son pacientes similares del pasado.
25. ¿Qué es el efecto placebo?
-La mejoría que experimenta un paciente de síntomas

desagradables tras recibir un placebo.
26. ¿A qué pregunta responden los ensayos pragmáticos?
-A la pregunta ¿Qué política de tratamiento es mejor en el momento

en que debe tomarse la decisión?
27. ¿A qué pregunta responden los ensayos explicativos?
-A la pregunta ¿Es mejor el tratamiento experimental si realmente fue

recibido?
28. ¿A qué se refiere el cegamiento en un ensayo clínico?
-Al desconocimiento de quien realiza o recibe una maniobra

terapéutica de si dicha maniobra es la experimental o la de control.
29. ¿A quiénes es conveniente someter a cegamiento en la

elaboración de un ensayo clínico?
-A quienes asignan a los pacientes al grupo de tratamiento, al

paciente, a los médicos que tienen a su cargo a los pacientes y al
investigador que evalúa los resultados.
30. ¿A qué se le llama error tipo I o alfa?
-A asegurar, erróneamente, que existe diferencia desde el punto de

vista estadístico entre las maniobras propuestas cuando en realidad no
la hay.
31. ¿A qué se le llama error tipo II o beta?
-A asegurar, erróneamente, que no existe diferencia desde el punto de

vista estadístico entre las maniobras realizadas cuando en realidad sí la
hay.
32. ¿A qué se refiere p < 0.05?
-Significa que las probabilidades de que la diferencia observada entre

las maniobras realizadas en un estudio se deba al azar son inferiores al
5%.
33. ¿A qué se refiere beta?
-A la magnitud que se atribuye, desde el punto de vista estadístico, a

la posibilidad de afirmar que no hay diferencia significativamente
estadística cuando en realidad sí la hay.
34. ¿Si el poder de la prueba es de 80% cuál es el valor de

beta?
-20%
35. ¿Con qué otro nombre se conoce a la importancia de la

diferencia clínica entre los grupos control o experimental?
-Delta.
36. ¿Cómo afectan el nivel de significancia (alfa) que se busca y el poder

que se desea de la prueba (beta) el tamaño de la muestra?
-Mientras mayor sea la significancia (alfa) que se busca y mayor el

poder que se desea de la prueba (beta), más grande debe ser el
tamaño de la muestra.
37. ¿Qué es la hipótesis nula?
-Es la hipótesis que niega la existencia de diferencia

significativamente estadística entre las maniobras que se comparan,
propuestas en la hipótesis de trabajo y que si se encuentra se debe al
azar.
38. ¿Por qué al incrementar el tamaño de la muestra se logra una

estimación más precisa de la medida de interés?
-Porque al incrementar el tamaño de la muestra se obtiene una

reducción en el error estándar, que al ser multiplicado por la
confiabilidad, da lugar a un intervalo de confianza más estrecho
alrededor del estimador estudiado: Confiabilidad x Error estándar =
Precisión.
39. ¿Qué es un ensayo clínico controlado con N de 1?
-Es un ensayo clínico controlado realizado en un sólo sujeto que es

sometido a pares de tratamientos que se distribuyen de manera
aleatoria, de manera que ni el paciente ni el médico conocen la
secuencia de la terapéutica.
40. ¿Qué importancia tiene la adherencia al tratamiento por parte de los

pacientes en un ensayo clínico?
-Es muy importante para valorar el efecto real del tratamiento. Su

incumplimiento puede llevar a errores importantes y resultados inciertos.
41. ¿En quiénes se lleva a cabo la etapa preclínica de un

estudio?
-En especies de animales inferiores.
42. ¿Qué se determina en la etapa preclínica de un estudio?
-La dosis letal media, el efecto funcional de la administración

subaguda y crónica, los cambios patológicos asociados, los efectos
sobre la capacidad reproductiva y la mutagenicidad de un medicamento.
43. ¿En qué consiste la fase I de la prueba clínica?
-En administrar el medicamento a voluntarios humanos para

determinar las características farmacodinámicas, efectos farmacológicos
y posible toxicidad en órganos vitales.
44. ¿En qué consiste la fase II de la prueba clínica?
-En ofrecer el medicamento a pequeños grupos de enfermos que

podrían beneficiarse por el medicamento y ver si efectivamente se
cumple el cambio anticipado por los estudios previos en sujetos sanos y
en especies inferiores.
45. ¿En qué consiste la fase III de la prueba clínica?
-En realizar ensayos clínicos controlados con el

medicamento.
46. ¿En qué consiste el análisis costo-minimización?
-En determinar cuál de las alternativas, con idénticas consecuencias

en todos los aspectos relevantes, resulta más barata.
47. ¿Cuál es la prioridad a considerar en el análisis costo-

efectividad?
-Los años de vida ganados, los días de inhabilidad evitados, la

mejoría obtenida por cada unidad monetaria invertida.
48. ¿Cómo se llama el análisis que mide tanto los costos como las
consecuencias de las alternativas en dinero?
-Análisis de costo-beneficio.
49. ¿Cuál es la prioridad a considerar en las consecuencias del

análisis costo-utilidad?
-Los días saludables o más frecuentemente los años de vida

ajustados por calidad.
50. ¿Qué documento contempla los aspectos éticos de la

investigación en seres humanos?
-Son varios; sin embargo, el más conocido es la Declaración de

Helsinki de 1964 revisada en Tokio en 1975, en Venecia en 1983 y en
Hong Kong en 1989.
Unidad 9
1. ¿Qué se conoce como umbral en el análisis de decisión?
-Al punto exacto en que la preferencia en el manejo cambia por una u

otra alternativa.
2. ¿A qué se refiere la utilidad esperada en el análisis de
decisión?
-Al resultado de multiplicar la utilidad asignada a las consecuencias

por la probabilidad de que éstas ocurran.
3. ¿Qué es el análisis de sensibilidad en el análisis de

decisión?
-Al análisis de los resultados de las alternativas modificando la

sobrevida o efectividad de un tratamiento o los valores de utilidad de las
alternativas.
4. ¿Cuál es la característica principal del análisis de

sensibilidad?
-Que permite “jugar” teóricamente con los resultados de las diferentes

alternativas y calcular, más claramente, cuál es la decisión más
adecuada para el caso que se está considerando.
5. ¿Qué dato(s) toma muy en cuenta el análisis de

sensibilidad?
-La utilidad y la utilidad esperada para las diferentes

consecuencias.
6. ¿Cómo facilita el análisis de decisión la toma de decisiones?
-Permitiendo ver, lo más objetivamente posible, desde el

punto de vista matemático, qué alternativa ofrece los mejores
resultados.
DIAGNÓSTICO III: AYUDAS DIAGOSTICAS: PRIMERA PARTE
Juan Pablo Chalco*
Siguiendo con la serie, ahora tocaremos un tópico Importante del Proceso Tabla de contenido
Diagnóstico, la valoración de los hallazgos a los exámenes, sean estos físicos o
auxiliares (como radiológicos o de laboratorio) y su real aporte para acercarnos Figuras y tablas
o alejarnos del diagnóstico propuesto. Bibliografía
Todo hallazgo de un examen (hepatomegalia, Ictericia, hiperglicemia, etc.) tiene
la propiedad de acercarnos o alejarnos de nuestra presunción diagnóstica. Estos
hallazgos pueden ser definidos dicotómicamente como "normal" o "anormal"
(Ejemplo: Presencia o ausencia de Hepatomegalia) sin embargo al hacerlo de
este modo, estamos perpetuando supuestos "puntos de corte" preestablecidos
(Menos de este valor es "normal" y más es "anormal"), generalmente extraídos
de estudios grandes con curva de Gauss, que pueden quitar o agregar
especificidad como veremos más adelante a cada test o valor asignado a cada
test.
La otra manera más racional es clasificar los hallazgos del examen en

subcategorías que van de alta probabilidad diagnóstica, media, baja y normal
para así evaluar su real propiedad diagnóstica para la enfermedad blanco a
través del calculo de los Iikelihood ratio. Pero vayamos por partes y veamos un
primer esquema. la tabla 1 es una clásica tabla de 2 x 2 en la que podemos
aprender la diferencia entre sensibilidad y especificidad vs. valor predictivo
positivo o negativo.
Sensibilidad y especificidad son cálculos "verticales": ( a/a+c) para sensibilidad

en líneas horizontales y (d/b+d) para especificidad en líneas oblicuas en la tabla
1 respectivamente. Esto significa que estos cálculos son hechos sabiendo la
enfermedad blanco como eje o punto de partida ( por ejemplo: porcentaje de
enfermos con examen positivo, para sensibilidad), es decir evalúa la "propiedad"
de la enfermedad para dar positivo o negativo a un examen, casi un proceso
diagnóstico retrospectivo. Muchos creen que los test con alta sensibilidad
confirman el diagnóstico y una alta especificidad lo descarta pero en realidad un
test con alta sensibilidad con resultado negativo descarta el diagnóstico y de
igual manera un test con alta especificidad con resultado positivo confirma el
diagnóstico. Contrariamente los valores predictivos son cálculos "horizontales".
Ver tabla 2.
Valor predictivo positivo (a/a+b) en líneas verticales, es el porcentaje de

pacientes con examen positivo que tienen la enfermedad y Valor predictivo
negativo(d/d+c) en grama; el porcentaje de pacientes con examen negativo que
no tienen la enfermedad. Esto significa un razonamiento más clínico puesto que
es la probabilidad que un resultado positivo o negativo signifique la presencia o
ausencia de la enfermedad blanco. Si se quiere avanzar más en la fineza del
diagnóstico o una manera de plasmarlo en probabilidades más exactas esta el
likelihood ratio (o tasa de probabilidad) que es la probabilidad que un resultado
positivo o negativo refleje la enfermedad; en resumen, es la división del
porcentaje del resultado dado (positivo o negativo) que tenga la enfermedad
entre el porcentaje con el mismo resultado(positivo o negativo) que no tenga la
enfermedad {(a/a+c) /(b/b+d)} o sens/(1-espec) para likelihood ratio positivo y
{(c/a+c)/(d/b+d)} o (1 ?sens)/espec. para likelihood ratio negativo y este tiene
un efecto multiplicativo en la probabilidad pre test como veremos más adelante.
Si analizamos esto último tanto la sensibilidad, especificidad y los valores predictivos son índices que no
tienen en cuenta el resultado o performance del test en todas sus posibilidades ( tanto positivas como
negativas, en enfermedad o en ausencia de ella), y se ve fácilmente en la tabla 1 y 2 ya que en sus cálculos
no se utilizan todas las posibilidades ( las celdas a, b, c y d), usando solo la mitad de ellas y con ello la
mitad de las propiedades del test para identificar o descartar la enfermedad blanco. Esto explica la limitación
de los valores predictivos cuando la prevalencia de la enfermedad varia mucho. El likelihood ratio lo
sumariza (utiliza todas las celdas o posibles resultados para evaluar las propiedades diagnosticas del test) y
lo presenta en una forma más practica y simple de aplicar. Veamos este ejemplo aparecido en el libro de
Medicina Basada en Evidencias de D. Sacket y luego modificado.
Supongamos que tenemos a un paciente con anemia y pensamos que la probabilidad de que tenga anemia
ferropénica es de 50% (Probabilidad pre test) o una chance de 50 a 50 (Proporción o pre test Odds) por la
anamnesis y el examen clínico. Supongamos que usted encuentra un, estudio sistemático de ferritina versus
el gold standard que es el contenido de hierro en médula ósea y también supongamos que es un buen
estudio y usted puede confiar en los resultados que presenta. Los resultados se muestran en la Tabla 3.
El resultado del examen de su paciente arroja 60 mmol/I lo cual lo coloca en la celda a o b. Entonces se
puede decir que el 90% de los pacientes con anemia ferropénica están en el mismo rango que su paciente
(a /a+ c), esta proporción de pacientes con la enfermedad blanco que tienen examen positivo se llama
Sensibilidad. Además un 73% de los pacientes con resultado positivo tienen anemia ferropénica (valor
predictivo positivo).También nota que solo el 15% de los pacientes que no tienen la enfermedad blanco
tienen resultados en el mismo rango o valor que su paciente lo cuál significa que su resultado es cerca de
seis veces más probable (90%/15%) de ser encontrado en alguien con anemia ferropénica que en alguien
sin ella y esto se llama likelihood ratio para un resultado de test positivo.
Es más Ud. sabia que el chance de su paciente de tener anemia ferropénica era de 50 a 50, esto es llamado
pre test odds de 1:1 y si multiplicamos esto por el likelihood ratio de 6 para obtener el post test odds: 1 x 6
= 6. Esto en la practica se convierte a probabilidad post test 6/(6+1) = 6/7 = 86%.Al final su sospecha
diagnóstica subió de 50% a un 86% al realizar este test y si su umbral terapéutico es mayor o igual a 80%
(nivel a partir del cual Ud. decide no realizar otra prueba y tratar la enfermedad), ya concluyó su proceso
diagnóstico. Este umbral se establece por consenso y depende también del tipo de enfermedad (gravedad y
pronóstico), así pudiera ser que si su nivel umbral para anemia ferropénica es de 90%, este primer ejemplo
no alcanzaría este criterio. Todo este ultimo cálculo de probabilidad post test se ahorra con un normograma
que desarrollaremos al final.
Ahora volvamos a nuestro ejemplo, la ferritina sérica parece un buen test con sensibilidad de 90%,
especificidad de 85%. Pero el valor predictivo positivo es de 73%, lo cual no es tan bueno y su valor
predictivo negativo de 95%. Sin embargo el likelihood ratio positivo de 6 parece inclinar la balanza hacia la
presencia de enfermedad blanco (Probabilidad post test de 86%) y así hacia una acción terapéutica
siguiendo con nuestro trabajo clínico. Pero si nuestra posibilidad pre test hubiera sido más baja, es decir un
20%, tendríamos un pre test odds de 0,25 (20%/80%) esto multiplicado por seis (nuestro likelihood ratio
positivo) 0,25 x 6 = 1,5 como post test odds y finalmente llevado a una probabilidad post test de 60%
(1,5/2,5). Esto significa que solo habría una posibilidad final de 60% que nuestro paciente tenga anemia
ferropénica comparado con el 86% de probabilidad post test de la primera parte del ejemplo con el mismo
resultado de ferritina sérica. Haciendo este juego de variar la posibilidad pre test llevándola de un extremo
(80% a 20%) para ver como varía la posibilidad post test del resultado de nuestro paciente, es una manera
practica de ver si el likelihood ratio establecido es útil para "confirmar" o "descartar" el diagnóstico y en
nuestro ejemplo no parece tener mucha potencia diagnóstica.
Otra manera de analizarlo es con el likelihood ratio a diferentes niveles de ferritina sérica y así
descubriremos una aún más poderosa herramienta diagnóstica ya que muchas veces los punto de corte
preestablecidos no son los más adecuados para acercarnos o alejarnos del diagnóstico. Algunos resultados
de pruebas diagnósticas se pueden dividir en niveles, en cinco para nuestro ejemplo que van de "Muy
positivo" a "Muy negativo"(extraídos de la misma fuente). Ver Tabla4.
En esta tabla se puede ver que la máxima sensibilidad (Resultado muy positivo < 15 mmol/l) es de 59% (
474/809) poco impresionante, pero esto representa un likelihood ratio de 52 (59%/1,1%) muy significativo,
lo cual generará posibilidades post test mayores de 85%. En otras palabras un resultado en este nivel es 52
veces más probable en uno con anemia ferropénica que en uno sin ella. En el otro extremo una especificidad
alta (Resultado muy negativo > 95 mmol/1) de 75% (1332/1 770) con un likelihood ratio de 0,08 (
5,9%/75%) lo cual produce probabilidades post test menos de 5% (la mayoría menos de 1%). Regresando
a nuestro ejemplo, nuestro paciente con un resultado de 60 mmol/l está en resultado "neutral" con un
likelihood ratio de 1 y una probabilidad pre test de 50% lo que nos da una probabilidad post test de 50%, lo
que nos llevaría a tomar otro test para confirmar (aumentar la probabilidad post test) o descartar (disminuir
la probabilidad post test). Todo este cálculo ( probabilidad post test) se abrevia sabiendo solo la probabilidad
pre test (conocida o por consenso) y el likelihood ratio derivado de estos cálculos (algunos ya conocidos y
otros en preparación), estos dos puntos se unen en el normograma de Fagan (Fig. 1) y su continuación nos
indica la probabilidad post test. Haga el intento con los mismos valores de probabilidad pre test y los
likelihood ratio del ejemplo y calcule las probabilidades post test usando el normograma y una regia.
Aquí nuestras conclusiones. Primero: deberíamos tener una lista de probabilidades pre test en cada
escenario clínico o caso problema para un diagnóstico presuntivo (Ejemplo: probabilidad de ITU en lactante
febril sin foco infeccioso aparente) o la prevalencia de la enfermedad (si no existe se puede establecer por
consenso para cada caso clínico). Segundo: deberíamos saber el poder diagnóstico de nuestros hallazgos al
examen físico o principalmente de exámenes auxiliares es decir conocer los likelihood ratio de estas
pruebas. Para exámenes auxiliares likelihood ratio positivo mayor de 10 y likelihood ratio negativo menores
de 0,1 son lo suficientemente poderosos para modificar importantemente casi cualquier probabilidad pre test
. Y tercero: siempre cargar en el bolsillo un normograma de Fagan para un cálculo sencillo de la probabilidad
post test para un diagnóstico acertado y así poder tomar una acción terapéutica adecuada o pedir otro
examen auxiliar (o repetir el mismo).
Sensibilidad y Especificidad
Sensibilidad Especificidad - Arterias y Venas
www.arteriasyvenas.org/index/sensibilidad_especificidad
Enviado por Dra. Onelia Greatty el 15 Sep 2011 - 8:39pm.
En el diagnóstico existen algunos conceptos estadísticos que es conveniente conocer ya que

nos manejamos con incertidumbres y probabilidades a las que acompaña un margen de
error. Explicaremos con ejemplos en nuestra área lo relacionado a sensibilidad,
especificidad, valor predictivo positivo y valor predictivo negativo.
Inicialmente vamos a explicar de manera gráfica los conceptos de sensibilidad y

especificidad de una prueba diagnóstica para dar cabida posteriormente a los de valor
predictivo positivo y valor predictivo negativo.
SENSIBILIDAD es la certeza con la cual una prueba identifica a

personas con una enfermedad, es decir identifica a los VERDADEROS POSITIVOS.
ESPECIFICIDAD es la certeza con la cual una prueba identifica a personas sin la

enfermedad, es decir aquellos quienes son los VERDADEROS NEGATIVOS.
Veamos el siguiente ejemplo para ilustrar diferentes grados de sensibilidad y especificidad

de las pruebas de diagnóstico. Supongamos que tenemos un grupo de 10 personas de las
cuales sólo 3 presentan trombosis venosa, a todos ellos se les aplican diferentes pruebas
diagnósticas para conocer quienes tienen la enfermedad:
Al aplicar la primera prueba se obtuvo que las tres personas portadoras de trombosis son
positivas al test y las siete no portadoras son negativas, entonces tendremos un test con una
sensibilidad y especificidad alta para el diagnóstico de trombosis venosa:
En la segunda prueba se detecta a las 3 personas con trombosis venosa y además a tres de
las personas saludables se les asigna falsamente como portadoras de trombosis venosa,
entonces tendremos un test de sensibilidad alta pues detecta a todos los verdaderos
positivos pero con una especificidad reducida ya que no es capaz de discernir
adecuadamente los verdaderos negativos.
En una tercera prueba se detecta a sólo uno de los tres casos de trombosis venosa tendría
una sensibilidad reducida pues sólo captó pocos verdaderos positivos y una especificidad
alta ya que detectó a todos los verdaderos negativos:
En la cuarta prueba empleada se identifica a sólo uno de los tres casos de trombosis y
también lo hace, de manera incorrecta, con tres de los sujetos sanos, la prueba tiene
sensibilidad reducida al captar sólo un verdaderopositivo y también tiene especificidad
reducida al identificar pocos verdaderos negativos:
Ahora vamos a ver cómo se cuantifica esto empleando una tabla 2x2 que representamos a
continuación para ejemplificar los resultados que podemos obtener ante una prueba
diagnóstica:
Como verán en la primera columna hemos ubicado a todos los sujetos realmente enfermos
(a+c) mientras que en la segunda columna están todos los verdaderamente sanos (b+d), en
la primera fila están aquellos sujetos cuya prueba fue positiva (a+b) mientras que en la
segunda fila están aquellos cuya prueba fue negativa (c+d). Ahora analicemos cada
cuadrante:
a: sujetos realmente enfermos cuya prueba fue positiva

b: sujetos sanos a los que la prueba detectó falsamente como positivos
c: sujetos enfermos a los que la prueba dió falsamente como negativos
d: sujetos sanos a los que la prueba detectó como negativos
Los casos expresados en los cuadrantes a y d serían los ideales con un test perfecto, no
obstante en las pruebas diagnósticas existe una posibilidad de fallo (falsos positivos o falsos
negativos) expresados en los cuadrantes c y b. De allí la importancia de conocer
previamente nuestra capacidad de detectar verdaderos positivos (sensibilidad) y verdaderos
negativos (especificidad) a modo de entender cuáles son las condiciones previamente
conocidas bajo la cual se acepta o se duda del resultado de una prueba.
De manera cuantitativa la sensibilidad la podemos expresar como la proporción de

verdaderos positivos (a) identificados por la prueba del total de enfermos (a+c):
Mientras que la especificidad representa la proporción de verdaderos negativos identificados por la

prueba del total de sanos:
Es deseable que las pruebas confirmatorias del diagnóstico sean de alta especificidad, para
evitar falsos positivos.
Para aplicar lo que hemos aprendido tomemos como ejemplo un

estudio publicado sobre el diagnóstico de estenosis carotídea por ecografía Doppler (ver el
estudio) en el cual se determinó contra muestras de endarterectomías que la velocidad pico
sistólica (tomada como parámetro aislado) mayor de 440 cm/seg en el sitio de una
estenosis carotídea tenía una especificidad de 100% y una sensibilidad de 58% para
detectar un diámetro de luz residual en el sitio de la estenosis ≤1.5 mm (esto si no era
combinado con otros parámetros y con los equipos del momento). La especificidad de
100% quiere decir que conseguir una velocidad menor de 440 cm/seg excluía por
completo la posibilidad de una luz residual ≤1.5 mm, no obstante para los pacientes en
quienes se obtuvo el registro de velocidad pico sistólica >440 cm/seg sólo en 58%
(sensibilidad reportada) existía realmente una luz residual ≤1.5 mm (verdaderos positivos),
en el 42% restante el registro de tal velocidad no se correspondió con un diámetro tan
pequeño. Un parámetro que debe ser considerado por el explorador en este caso para usar la
combinación de otros métodos con el fin de elevar su sensibilidad diagnóstica.
La sensibilidad y especificidad tienen la ventaja de que son propiedades intrínsecas a la
prueba diagnóstica y definen su validez independientemente de cuál sea la prevalencia de la
enfermedad en la población, presentan la desventaja de que no proporcionan información
relevante a la hora de tomar una decisión clínica ante un determinado resultado de la
prueba.
Hasta el momento hemos visto la situación en relación al test pero ¿cuál es la probabilidad
de que el paciente esté realmente enfermo si la prueba es positiva o, por el contrario, se
encuentre sano si la prueba es negativa?.. Por medio de los valores predictivos vamos a
obtener información al respecto.
Valor predictivo positivo (VPP):
Es la probabilidad de padecer la enfermedad si se obtiene un resultado positivo en la

prueba. Por ejemplo si al aplicarse una prueba para la detección de una enfermedad se
obtienen 100 personas con resultado positivo pero realmente 10 de ellas estaban sanas y 90
estaban verdaderamente enfermas entonces el VPP de la prueba es 90%, conociendo esto
sabremos que el 90% de los resultados positivos de la prueba son reales. Basados en nuestra
tabla de 2x2 la fórmula para su cálculo es:
Valor predictivo negativo:
Es la probabilidad de que un sujeto con un resultado negativo en la prueba esté realmente

sano. Si en otra prueba se obtiene 100 personas con resultado negativo para una
enfermedad y sólo 5 estaban realmente enfermas entonces el VPN (probabilidad de que las
personas no tengan realmente la enfermedad) es de 95%. Basados en nuestra tabla de 2x2 la
fórmula para su cálculo es:
Veamos un ejemplo en el campo de las enfermedades vasculares con
un artículo sobre el empleo de la prueba del dímero D en sala de urgencias para el
diagnóstico de tromboembolismo pulmonar (ver artículo). En ese caso el valor predictivo
positivo (VPP) de la prueba fué del 18% y el valor predictivo negativo (VPN) del 100%.
Quiere decir que en caso de sospecha de tromboembolismo pulmonar en sala de urgencias
si se aplica el dímero D y este sale negativo podemos tener toda confianza (100%) de que el
paciente no tiene un evento tromboembólico, en cambio si la prueba es positiva realmente
sólo en 18% de los casos detectados por el test se trataría de un evento tromboembólico. En
otras palabras que el uso del dímero D en esas condiciones es útil para rechazar el
diagnóstico más no para confirmarlo.
Los valores predictivos, a pesar de ser de enorme utilidad a la hora de tomar decisiones
clínicas y transmitir a los pacientes información sobre su diagnóstico, presentan la
limitación de que dependen en gran medida de la prevalencia de la enfermedad a
diagnosticar en la población objeto de estudio. Cuando la prevalencia de la enfermedad es
baja, un resultado negativo permitirá descartar la enfermedad con mayor seguridad. Por el
contrario, bajo esa misma condición un resultado positivo no permitirá confirmar el
diagnóstico, resultando en un bajo valor predictivo positivo.
@arteriasyvenas
Medidas de diagnóstico
La sensibilidad y la especificidad de la prueba diagnóstica ...
www.virtual.unal.edu.co/cursos/medicina/uv00045/.../anexo_1_1.html
Para las aplicaciones de los estudios de diagnóstico en medicina musculoesquelética ya
sean clínicos o paraclínicos (electrodiagnóstico, imágenes diagnósticas) se deben tener
claros los conceptos de validez y confiabilidad. Una prueba es válida si mide lo que
pretende medir. La validez se determina mediante estudios de sensibilidad y especificidad
tomando una referencia clínica o paraclínica. Una prueba es confiable si genera los mismos
resultados en diferentes momentos por el mismo examinador o por diferentes evaluadores.
La sensibilidad y la especificidad de la prueba diagnóstica, así como los valores

predictivos, la razón de probabilidad y la curva operador-receptor (COR), son conceptos
útiles ya que permiten informar los resultados de una prueba en términos de probabilidad
sobre la presencia o ausencia de la enfermedad así como sobre su pronóstico. Estas
medidas evalúan la calidad de una prueba de diagnóstico y son utilizadas en diferentes
especialidades médicas. Se recomienda la lectura de las revisiones sobre este tema en
BMJ(1-4)
En medicina musculoesquelética existen varias aplicaciones de las medidas de diagnóstico.

Los siguientes son algunos ejemplos:
¿Cuál es la sensibilidad y especificidad de los estudios de neuroconducción tomando como

referencia un cuadro clínico altamente sugestivo de Síndrome de Túnel del Carpo?
¿Cuál es la especificidad de un estudio electromiográfico en el diagnóstico de
radiculopatías lumbares?
¿Cuál es el valor predictivo positivo de un estudio de neuroconducciones compatible con
Síndrome de túnel del carpo en la comunidad? ¿Cómo cambia este valor predictivo positivo
cuando el examen se realiza en un hospital de tercer nivel?
¿Cuál es la especificidad de una prueba positiva de Neer en el Síndrome de pinzamiento?
Las pruebas de diagnóstico no son perfectas. En algunas situaciones clínicas, es preferible

contar con pruebas de diagnóstico muy sensibles con una especificidad no muy alta, como
en el diagnóstico de enfermedades que son tratables tales como la tuberculosis. Por el
contrario, y esto sucede en Rehabilitación y en las especialidades que tratan la
sintomatología musculoesquelética crónica, es preferible contar con pruebas altamente
específicas ya que los resultados apoyan un tratamiento quirúrgico.
Un buen ejemplo es el síndrome de túnel del carpo. Esta enfermedad se presenta aislada o
asociada a comorbilidades musculoesqueléticas tales como poliartralgias, síndrome de
pinzamiento del hombro, epicondilitis, etc, patologías que son crónicas y de difícil manejo
y que en ocasiones tienen un componente psicosocial importante. Un mal diagnóstico
puede implicar un manejo quirúrgico con resultados desfavorables para el paciente.
Sensibilidad, especificidad y valores predictivos
Para la estimación puntual de la sensibilidad, especificidad y valores predictivos se realizan

los cálculos en las tablas de 2x2 y los resultados se obtienen en forma de proporciones. La
presencia o ausencia de la enfermedad la define el estándar de oro o la referencia utilizada
por el investigador. La referencia puede ser un marcador biológico obtenido por un análisis
de sangre, una biopsia, una imagen, una prueba electrofisiológica, el cuadro clínico o
incluso el desenlace de la enfermedad. En algunas situaciones, las fallas son inevitables ya
que o no existe el marcador biológico o la referencia en sí misma es imprecisa. Por
ejemplo, los estudios de sensibilidad y especificidad para Síndrome de túnel del carpo que
se mencionan más abajo, utilizan como referencia o estándar de oro las características
clínicas del paciente. En otras investigaciones, por el contrario, el estándar de oro para
evaluar la sensibilidad y especificidad de los hallazgos clínicos son los estudios de
neuroconducción.
Enfermedad Enfermedad
presente ausente
a b
Prueba positiva
Verdadero positivo Falso positivo
c d
Prueba negativa
Falso negativo Verdadero negativo
Tabla 1. Tabla de 2 x 2 para las pruebas de diagnóstico
La sensibilidad de una prueba se define como el porcentaje de personas con la enfermedad

que tienen un resultado positivo.
Sensibilidad = Verdaderos positivos/Verdaderos positivos+Falsos negativos

= a/a+c x 100
Un resultado negativo de una prueba altamente sensible muy probablemente descarta la

enfermedad.
La especificidad se define como el porcentaje de personas sin la enfermedad de interés que

tienen un resultado negativo.
Especificidad= Verdaderos negativos/Verdaderos negativos+Falsos positivos

= d/d+b x 100
Si la prueba es positiva, con una alta probabilidad la persona padece la enfermedad.

Teniendo en cuenta la variación del azar, es preferible presentar estas proporciones en
intervalos de confianza del 95% de acuerdo a la fórmula:
p+/-z (1/2a)
p(1-p)/n
donde p es la proporción observada y n el número de individuos.
Los estudios de sensibilidad y especificidad son ejemplos de probabilidades condicionales

que si no son manejadas en la práctica cotidiana producen confusión. La información se
puede presentar de dos formas y a continuación se presenta un ejemplo:
Primera forma:
Ejemplo de información presentada en la forma de probabilidad condicional:

La probabilidad que una mujer tenga STC es 1%. Si tiene STC la probabilidad de tener una
EMG anormal es del 80% (sensibilidad). Si no tiene STC la probabilidad de tener una
EMG anormal es del 5% (especificidad del 95%).
Segunda forma:
El mismo ejemplo presentado en la forma de frecuencias naturales:

10 de cada 1000 mujeres tienen STC. De las 10 mujeres, 8 tendrán una EMG anormal. De
las 990 que no tienen STC, 50 tendrán una EMG anormal.
La sensibilidad y la especificidad son medidas de la exactitud de una prueba de diagnóstico

que sin embargo, no resuelven las preguntas referentes a un paciente en particular. Estas
preguntas son: ¿si la prueba es positiva, cuál es la probabilidad de que el paciente tenga la
enfermedad? si la prueba es negativa ¿cuál es la probabilidad de que no exista la
enfermedad? Para resolver estas preguntas se debe entender el significado del valor
predictivo de una prueba de diagnóstico el cual depende en buena parte de la prevalencia de
la enfermedad. En el caso de enfermedades raras, una prueba puede tener una alta
especificidad pero un bajo valor predictivo positivo. Para determinar la probabilidad de
que una persona tenga o no tenga la enfermedad basándose en los resultados de la prueba,
se utilizan los valores predictivos.
El valor predictivo positivo se define como el porcentaje de personas con la prueba positiva
que realmente tienen la enfermedad. Es decir, el valor predictivo positivo estima la
probabilidad de que la enfermedad exista si la prueba es positiva.
VP+ = Verdaderos Positivos/Verdaderos positivos+Falsos positivos x 100
= a/a+b
El valor predictivo negativo se define como el porcentaje de personas con la prueba

negativa que realmente no tiene la enfermedad.
VP- = Verdaderos negativos/Verdaderos negativos + Falsos negativos

= d/d+c

Valoracion de Pruebas Diagnosticas Ampliado

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Valoracion de Pruebas Diagnosticas Ampliado

Caricato da

Copyright:

Formati disponibili

DISEÑOS DE INVESTIGACION:

La notación cuando estamos en frente de un conteo de frecuencias es:

n 11 = número de observaciones dentro de la celda en la fila 1 y la columna 1.

n 12 = número de observaciones dentro de la celda en la fila 1 y la columna 2.

n 21 = número de observaciones dentro de la celda en la fila 2 y la columna 1.

n 22 = número de observaciones dentro de la celda en la fila 2 y la columna 2.

n 1. = n 11 + n 12 = número de observaciones en la fila 1

n 2. = n 21 + n 22 = número de observaciones en la fila 1

n .1 = n 11 + n 21 = número de observaciones en la fila 1

n = número total de observaciones

Utilizadas para diferentes analisis de datos:

PRUEBA DE INDEPENDENCIA (ji-cuadrado)

PRUEBA DE HOMOGENIDAD (ji-cuadrado)

Odds Ratio (razón de chances)

ESTUDIOS DE CASOS Y CONTROLES

PRUEBA DE TRATAMIENTOS O INTERVENCIONES

En una prueba de independencia el único número que el investigador controla directamente

El investigador no fija previamente ningún conjunto, es decir, son aleatorios.

El planteamiento de las Hipótesis será:

Tabla 2. Tabla de contingencia 2 x 2 con proporciones o probabilidades

Comparamos el número de observaciones en cada celda con el número esperado, si H 0 es

n 1. n .1 total fila marginal x total comlumna marginal

Para responderla necesitamos un estadístico cuya distribución de probabilidad sea conocida

Prefijamos un nivel de significancia en 0.05

Si el valor p es pequeño (es menor de 0.05); podemos rechazar H 0

Mayor altura que el promedio poblacional

Comparamos el número de observaciones en cada celda con el número esperado, si H 0 es

Mayor altura que el promedio poblacional

A partir de la tabla Ji-cuadrado vemos que:

Considerando la segunda configuración experimental, en la que un conjunto de marginales

Si no hay asociación entre exposición y desarrollo de la enfermedad, la proporción de

Se usan las siguientes proporciones para expresar la hipótesis nula y comprender el

Obsérvese que si H 0 es cierta, también es cierto que p 12 = p 22 .

H 0 : la proporción con la característica es la misma en cada población.

El valor esperado se calcula así:

Ê 11 = n 1. = total fila x total columna / tamaño de la muestra

Luego se busca el valor p para el valor encontrado por el estadistico:

Un centro de atención odontológico que realiza en su mayoría obturaciones de amalgama,

El valor p, a partir de la tabla Ji-cuadrado es:

Los estudios transversales permiten identificar individuos con determinada enfermedad y

Tres tipos de estudios transversales:

1. Estudio de prevalencia: Mide la frecuencia de un fenómeno en una población.

los datos se organizan en una tabla de contingencia de 2x 2 asi:

Prev. De exposición en los que tienen la enfermedad =

Comparar la prevalencia entre expuestos y no expuestos y medir qué tan significativa es la

Prevalencia de enfermedad en los expuestos =

Prevalencia de enfermedad en los no expuestos =

EJEMPLO: a partir de los siguientes datos podemos obtener:

Prev. De exposición en los que tienen la enfermedad =

Prev. De exposición en los que no tienen la enfermedad =

Prevalencia de enfermedad en los expuestos =

Prev. De exposición en los que tienen la enfermedad =

Prev. De exposición en los que no tienen la enfermedad =

Comparar la prevalencia entre expuestos y no expuestos y medir qué tan significativa es la

ESTUDIOS DE CASOS Y CONTROLES

Los estudios de casos y controles son un tipo de investigación epidemiológica

TABLAS DE CONTINGENCIA EN ESTUDIOS DE CASOS Y CONTROLES:

Desenlace --- enfermedad o Muerte

También se calcula el odds ratio

Se calcula el OR que se interpreta así:

Si el OR = 1 no se tendrá mayor riesgo por estar expuesto

Si el OR > 1 los expuestos tendrán mayor riesgo de desarrollar la enfermedad (factor

Si el OR < 1 los expuestos tendrán menor riesgo de presentar la enfermedad (factor de