Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Jorge Rodrguez
Centro de Polticas Pblicas y Postgrados Salud y Futuro
2015
Introduccin
Variable Categora
Sexo M-F
Das de hospitalizacin 1, 2, 3, etc.
Poblacin: Es el conjunto de todos los datos que permiten identificar un fenmeno dado. La
cardinalidad puede ser finita o infinita. Es la poblacin en estudio o Poblacin objetiva.
Muestra: Es un subconjunto de la poblacin con cardinalidad finita. Las muestras deben ser
diseadas en tamao, costo y tiempo de acuerdo o los objetivos perseguidos. Las caractersticas
que entreguen la muestra por lo general diferirn de las caractersticas reales de la poblacin, por
lo que resulta necesario realizar un buen diseo (tcnicas de muestreo).
Medidas de resumen:
Medidas de tendencia central: Las Medidas de tendencia Central son aquellos valores que
resumen en una sola expresin a los datos y hacia los cuales tienden a aglomerarse. Es decir,
caracterizan el comportamiento de la variable. Los ms conocidos son:
1. Promedio Aritmtico
2. Mediana
3. Moda
Medidas de posicin: Las medidas de posicin, describen y caracterizan parte de los datos, y
se reconocen como indicadores de acumulacin:
1. Cuartiles
2. Quintiles
3. Deciles
4. Percentiles
Medidas de dispersin: Las medidas de dispersin son indicadores que caracterizan el
comportamiento de la variabilidad de la variable. Indican el grado de homogeneidad o de
heterogeneidad con que se presentan los datos en una distribucin:
1. Amplitud
2. Varianza
3. Desviacin estndar
4. Recorrido interpercentlico
Medidas de comparacin: Las medidas de comparacin indican donde hay mayor variabilidad
a nivel grupal y comparan posiciones relativas entre individuos:
1. Coeficiente de variacin
2. Puntaje tpico
Cada uno de los indicadores tiene sus fortalezas y debilidades, que se deben considerar al
seleccionar un indicador para describir la informacin o para la toma de decisin.
Lo importante al resumir los datos, est en la seleccin e interpretacin de sus resultados, las
estructuras algebraicas no tienen mucha relevancia hoy, debido al uso de paquetes estadsticos.
Aplicaciones
Permiten evaluar tendencia.
Son un apoyo permanente en la toma de decisiones
En elemento importante en la actualidad que se debe considerar para competir, es el control
de calidad; satisfaccin usuaria, calidad de la atencin, etc.
Por ejemplo, en algunos pases, la asignacin de recursos a los hospitales es estndar, a pesar
que reconocen que los costos que tienen son variables, de tal manera que el gobierno puede
tomar decisiones realizando una estratificacin de los costos, a partir de la variabilidad de los
costos; promedio +- desviacin estndar.
Modelos de probabilidad
Aplicaciones
Se realiza un estudio para investigar la relacin entre el peso y el hbito de fumar de los
pacientes hipertensos. El espacio muestral son todos los pacientes hipertensos. Definamos al
suceso fumar con A y al suceso sobrepeso con B, evidentemente que se conforman 4
posibilidades de pacientes: A y B; A y no B; no A y B; No A ni B.
Preguntas de inters:
Cul es la probabilidad que un paciente hipertenso:
Sea fumador; tenga sobrepeso; sea fumador y con sobrepeso; sea fumador y no
tenga sobrepeso; no sea fumador y tenga sobrepeso, etc.
Tambin se pueden complejizar las preguntas:
Cul es la probabilidad que un paciente hipertenso:
Sea fumador si tiene sobrepeso
Tenga sobrepeso si es fumador
Sea fumador si no tiene sobrepeso
Tenga sobrepeso si no es fumador
Sea fumador o tenga sobrepeso
Probabilidad condicional
Esta forma de calcular una probabilidad est dada, cuando se tiene informacin que afecta al
suceso de inters, es decir son dependientes. Otra forma de enfocar el problema, es que para
calcular una probabilidad se cuenta con informacin relevante que nos permite mejorar nuestra
asignacin probabilstica.
En estos casos los espacios muestrales se ven afectados por la informacin con que se cuenta, de
tal manera, que el nuevo espacio muestral est condicionado a la informacin.
En el ejemplo anterior, si queremos calcular las mismas probabilidades, pero ahora usted sabe que
el paciente es una mujer, asumiendo que el gnero es una variable que afecta el sobrepeso y/o el
consumo de tabaco, el nuevo espacio muestral son las mujeres hipertensas.
Ejemplos
1. Tres mquinas denominadas A, B y C, producen un 43%, 26% y 31% de la produccin total de
una empresa respectivamente, se ha detectado que un 8%, 2% y 1.6% del producto
manufacturado por estas mquinas es defectuoso. Se selecciona un producto al azar:
Se encuentra que es defectuoso, cul es la probabilidad de que el producto haya sido
fabricado en la mquina B?,
Si el producto seleccionado resulta que no es defectuoso, cul es la probabilidad de que
haya sido fabricado en la mquina C?
Solucin:
Para resolver este problema nos ayudaremos con un diagrama:
8% D
43% A
92% ND
2% D
26% B
98% ND
1.6% D
31% C
98.4% ND
P(CND) =p(CND)/p(ND)
P(CND) =p(C)p(NDC)/(p(A)p(NDA)+p(B)p(NDB)+p(C)p(NDC))
= 0.31*0.984/(0.43*0.92 + 0.26*0.98 + 0.31*0.984)
= 0.30504/0.955440.31927
Es decir, la probabilidad que el producto sea fabricado por la maquina C, dado que
el producto no fue defectuoso es de 0.31927, es decir, de todos los productos no
defectuosos el 31.93% son fabricado por la maquina C.
2. Un hospital recibe pacientes todos los das y los pacientes que requieren ser hospitalizados, se
envan al servicio del hospital que corresponde su patologa, al hospital pblico ms cercano o
a una clnica, en una proporcin de 0.495, 0.185 y 0.32, respectivamente, de los cuales se ha
tenido informacin que se les ha dado un mal servicio al 4%, 2.8% y 1% respectivamente. Si se
selecciona a un paciente hospitalizado al azar:
4% Q
49.5% H1
96% NQ
2.8% Q
18.5% H2
97.2% NQ
1% Q
32% H3
99% NQ
Otra aplicacin de este concepto en salud, tiene que ver con los trminos de sensibilidad,
especificidad, falsos positivos, falsos negativos, valores predictivos negativos y positivos,
exactitud.
Ejemplo:
Resultado
Enfermo a b a+b
Sano c d c+d
Sensibilidad = a/(a+b)
Especificidad = d/(c+d)
Falso (+) = c/(c+d)
Falso (-) = b/(a+b)
VP(+) = a/(a+c)
VP(-) = d/(b+d)
Exactitud = (a+d)/(a+b+c+d)
Modelos de valor esperado
En muchos problemas, para poder facilitar el clculo de una probabilidad, se definen variables
aleatorias que consisten en asignar valores numricos a los resultados del problema.
Toda variable aleatoria tiene asignada una distribucin de probabilidad que puede ser discreta
(binomial, poisson, geomtrica, hipergeomtrica) o continua (normal, Chi cuadrado, etc.), las
cuales tienen indicadores de tendencia central, valor esperado (promedio aritmtico) y varianza,
que son las que definen su distribucin.
Cada distribucin tiene sus caractersticas que las definen y su forma de clculo.
Estas distribuciones deben satisfacer las mismas condiciones de una probabilidad.
Regresin mltiple
Supongamos que deseamos predecir una variable Y con K variable independientes
X1 X2, Xk K > 1
Y = variable dependiente
X1 X2, Xk = variables independientes
La forma general del modelo de regresin para K variables independientes es:
Y = b0+ b1 X1 + b2 X2 + b3 X3 + bk Xk + e
Donde los bi con i = 1, 2 k, se llaman coeficiente de la regresin, los cuales hay que estimar y E
es el error.
Ejemplo: Si se desea pronosticar el peso (y), en base a la estatura (X1) y la edad (X2) de los
pacientes.
Nio 1 2 3 4 5 6 7 8 9 10 11 12
Y 64 71 53 55 60 45 66 67 61 64 54 57
X1 57 59 55 60 52 50 60 58 57 59 53 55
X2 8 12 9 11 10 7 10 11 9 8 10 9
Se deben estimar los coeficientes del modelo bi con i = 0,1, 2, donde b0, representa la
constante y los otros dos coeficientes representan el impacto que tienen las variables
independientes sobre el peso del paciente.
El mtodo
1. Cada es una funcin lineal de los valores de Y.
2. Ya que se asume que Y tiene distribucin normal, cada uno de los estimadores tambin
tendr distribucin normal.
3. El anlisis se realiza a travs de la comparacin de las varianzas asociadas al modelo
(cuanto explica el modelo a la variable independiente) , al residuo (cuanto no explica el
modelo a la variable independiente)
4. Cmo se operar si la variable dependiente no es continua?, si es dicotmica se modela
una regresin logstica.
5. Hay casos en que existe el inters de identificar los elemento que amenazan el xito de una
decisin.