Sei sulla pagina 1di 11

Bioestadstica

Jorge Rodrguez
Centro de Polticas Pblicas y Postgrados Salud y Futuro
2015
Introduccin

Variable: Cualquier fenmeno que se desea estudiar.



Nivel o categora de la variable: Posibles respuestas para la misma, por ejemplo:

Variable Categora
Sexo M-F
Das de hospitalizacin 1, 2, 3, etc.

Las variables se clasifican de acuerdo a su nivel de medicin en:


Cualitativas: Se refiere a cualidades o atributos de los objetos observados:
Por ejemplo: color del cabello, profesin, estado civil, nivel-socioeconmico, etc.
a) Nominal: No hay orden preestablecido en los niveles de la variable (sexo, raza)
b) Ordinal: Existe un orden preestablecido (nivel socio-econmico, nivel educacional,
etc).

Cuantitativas: Son los fenmenos susceptibles de ser expresados cuantitativamente:


Por ejemplo: peso, estatura, calificaciones, edad, ingreso, etc.
a) Discretas: Son aquellas variables en que entre valores de la variable existe un nmero
finito de ellos: Ej.: N de hijos, N de camas, N de pacientes,
b) Continuas: Existen infinitos valores entre dos valores de la variables: Ej.: Peso, Talla,
edad, etc.

Poblacin: Es el conjunto de todos los datos que permiten identificar un fenmeno dado. La
cardinalidad puede ser finita o infinita. Es la poblacin en estudio o Poblacin objetiva.

Muestra: Es un subconjunto de la poblacin con cardinalidad finita. Las muestras deben ser
diseadas en tamao, costo y tiempo de acuerdo o los objetivos perseguidos. Las caractersticas
que entreguen la muestra por lo general diferirn de las caractersticas reales de la poblacin, por
lo que resulta necesario realizar un buen diseo (tcnicas de muestreo).

Parmetro: Es una caracterstica de la Poblacin, por lo general, es desconocido y una constante.


Estadgrafo: Es una caracterstica de la Muestra, es una variable ya que su valor depende de los
elementos que conforman la muestra seleccionada.

Presentacin de la informacin estadstica


Tablas estadsticas: Cuando en un conjunto de datos es necesario determinar una medida
que permita resumir el conjunto de datos en un valor representativo, la informacin
obtenida hay que ordenarla.
Grfico: Es una forma de representar los hechos. El objetivo es visualizar rpidamente la
informacin

Uso de los mtodos cuantitativos

Medidas de resumen:
Medidas de tendencia central: Las Medidas de tendencia Central son aquellos valores que
resumen en una sola expresin a los datos y hacia los cuales tienden a aglomerarse. Es decir,
caracterizan el comportamiento de la variable. Los ms conocidos son:
1. Promedio Aritmtico
2. Mediana
3. Moda
Medidas de posicin: Las medidas de posicin, describen y caracterizan parte de los datos, y
se reconocen como indicadores de acumulacin:
1. Cuartiles
2. Quintiles
3. Deciles
4. Percentiles
Medidas de dispersin: Las medidas de dispersin son indicadores que caracterizan el
comportamiento de la variabilidad de la variable. Indican el grado de homogeneidad o de
heterogeneidad con que se presentan los datos en una distribucin:
1. Amplitud
2. Varianza
3. Desviacin estndar
4. Recorrido interpercentlico
Medidas de comparacin: Las medidas de comparacin indican donde hay mayor variabilidad
a nivel grupal y comparan posiciones relativas entre individuos:
1. Coeficiente de variacin
2. Puntaje tpico

Cada uno de los indicadores tiene sus fortalezas y debilidades, que se deben considerar al
seleccionar un indicador para describir la informacin o para la toma de decisin.

Lo importante al resumir los datos, est en la seleccin e interpretacin de sus resultados, las
estructuras algebraicas no tienen mucha relevancia hoy, debido al uso de paquetes estadsticos.

Aplicaciones
Permiten evaluar tendencia.
Son un apoyo permanente en la toma de decisiones
En elemento importante en la actualidad que se debe considerar para competir, es el control
de calidad; satisfaccin usuaria, calidad de la atencin, etc.
Por ejemplo, en algunos pases, la asignacin de recursos a los hospitales es estndar, a pesar
que reconocen que los costos que tienen son variables, de tal manera que el gobierno puede
tomar decisiones realizando una estratificacin de los costos, a partir de la variabilidad de los
costos; promedio +- desviacin estndar.

Modelos de probabilidad

Una Probabilidad es la asignacin cuantitativa a un hecho de incertidumbre futuro.


Se debe considerar un experimento, que es cualquier proceso que genera resultados y en l debe
identificarse claramente el conjunto de posibles resultados (espacio muestral ).
Las asignaciones de probabilidad deben satisfacer dos requisitos:
a) Los valores asignados siempre estn entre 0 y 1.
b) La suma total de las asignaciones de todos los resultados del experimento debe ser 1.
Un suceso o evento puede ser un resultado o una parte del espacio muestral.
Las probabilidades se asocian a los sucesos.
Los sucesos pueden ser:
a) Excluyentes o no excluyentes: pueden ocurrir simultneamente o no ocurrir
simultneamente.
b) Independientes o dependientes: Las probabilidades pueden depender de otro suceso o ser
independiente de l.

Aplicaciones
Se realiza un estudio para investigar la relacin entre el peso y el hbito de fumar de los
pacientes hipertensos. El espacio muestral son todos los pacientes hipertensos. Definamos al
suceso fumar con A y al suceso sobrepeso con B, evidentemente que se conforman 4
posibilidades de pacientes: A y B; A y no B; no A y B; No A ni B.
Preguntas de inters:
Cul es la probabilidad que un paciente hipertenso:
Sea fumador; tenga sobrepeso; sea fumador y con sobrepeso; sea fumador y no
tenga sobrepeso; no sea fumador y tenga sobrepeso, etc.
Tambin se pueden complejizar las preguntas:
Cul es la probabilidad que un paciente hipertenso:
Sea fumador si tiene sobrepeso
Tenga sobrepeso si es fumador
Sea fumador si no tiene sobrepeso
Tenga sobrepeso si no es fumador
Sea fumador o tenga sobrepeso

Probabilidad condicional

Esta forma de calcular una probabilidad est dada, cuando se tiene informacin que afecta al
suceso de inters, es decir son dependientes. Otra forma de enfocar el problema, es que para
calcular una probabilidad se cuenta con informacin relevante que nos permite mejorar nuestra
asignacin probabilstica.
En estos casos los espacios muestrales se ven afectados por la informacin con que se cuenta, de
tal manera, que el nuevo espacio muestral est condicionado a la informacin.
En el ejemplo anterior, si queremos calcular las mismas probabilidades, pero ahora usted sabe que
el paciente es una mujer, asumiendo que el gnero es una variable que afecta el sobrepeso y/o el
consumo de tabaco, el nuevo espacio muestral son las mujeres hipertensas.

Ejemplos
1. Tres mquinas denominadas A, B y C, producen un 43%, 26% y 31% de la produccin total de
una empresa respectivamente, se ha detectado que un 8%, 2% y 1.6% del producto
manufacturado por estas mquinas es defectuoso. Se selecciona un producto al azar:
Se encuentra que es defectuoso, cul es la probabilidad de que el producto haya sido
fabricado en la mquina B?,
Si el producto seleccionado resulta que no es defectuoso, cul es la probabilidad de que
haya sido fabricado en la mquina C?

Solucin:
Para resolver este problema nos ayudaremos con un diagrama:

8% D
43% A
92% ND

2% D
26% B
98% ND

1.6% D
31% C
98.4% ND

a) Definiremos los eventos


D = evento de que el producto seleccionado sea defectuoso (evento que
condiciona)
A = evento de que el producto sea fabricado en la mquina A
B = evento de que el producto sea fabricado por la mquina B
C = evento de que el producto sea fabricado por la mquina C
P(BD) = p(BD)/p(D) = p(B)p(DB)/(p(A)p(DA) + p(B)p(DB) + p(C)p(DC))
P(BD) = (0.26*0.02)/(0.43*0.08 + 0.26*0.02 + 0.31*0.016)
= 0.0052/0.04456
=0.116697
Es decir, la probabilidad que el producto sea fabricado por la mquina B, dado que
el producto fue defectuoso es de 0.116697, es decir, de todos los productos
defectuosos el 11.67% son fabricados por la mquina B.

a. Sean, ND = evento de que el producto seleccionado no sea defectuoso (evento que


condiciona)
A = evento de que el producto sea fabricado en la mquina A
B = evento de que el producto sea fabricado por la mquina B
C = evento de que el producto sea fabricado por la mquina C

P(CND) =p(CND)/p(ND)
P(CND) =p(C)p(NDC)/(p(A)p(NDA)+p(B)p(NDB)+p(C)p(NDC))
= 0.31*0.984/(0.43*0.92 + 0.26*0.98 + 0.31*0.984)
= 0.30504/0.955440.31927
Es decir, la probabilidad que el producto sea fabricado por la maquina C, dado que
el producto no fue defectuoso es de 0.31927, es decir, de todos los productos no
defectuosos el 31.93% son fabricado por la maquina C.

2. Un hospital recibe pacientes todos los das y los pacientes que requieren ser hospitalizados, se
envan al servicio del hospital que corresponde su patologa, al hospital pblico ms cercano o
a una clnica, en una proporcin de 0.495, 0.185 y 0.32, respectivamente, de los cuales se ha
tenido informacin que se les ha dado un mal servicio al 4%, 2.8% y 1% respectivamente. Si se
selecciona a un paciente hospitalizado al azar:

Cul es la probabilidad que no se le haya dado un mal servicio?


Y se encuentra que l no se quej del servicio prestado, cul es la probabilidad de que se
haya sido hospitalizado en un hospital pblico?
Y el paciente se ha quejado del servicio recibido, Cul es la probabilidad que haya sido
hospitalizado en nuestro hospital?
Solucin:
Para facilitar el entendimiento de la informacin, utilizaremos el diagrama:

4% Q
49.5% H1
96% NQ

2.8% Q
18.5% H2
97.2% NQ

1% Q
32% H3
99% NQ

a) Sea, NQ = el paciente no se queja del servicio


H1 = el paciente haya sido hospitalizado en nuestro hospital
H2 = el paciente haya sido hospitalizado en un hospital pblico
H3 = el paciente haya sido hospitalizado en la clnica
P(NQ) = p(H1)p(NQH1) + p(H2)p(NQH2) + p(C)p(NQH3)
= 0.495*0.96+ 0.185*0.972 + 0.32*0.99
= 0.4752+ 0.17982 + 0.3168
= 0.97182
Es decir, la probabilidad que un paciente hospitalizado no tenga quejas del servicio
es de 0.97182, es decir, de todos los pacientes el 97.18% no se queja del servicio.

b) NQ = el paciente no se queja del servicio


H1 = el paciente haya sido hospitalizado en nuestro hospital
H2 = el paciente haya sido hospitalizado en un hospital pblico
H3 = el paciente haya sido hospitalizado en la clnica
P(H2NQ)=p(H2NQ)/p(NQ)
=(0.185*0.972)/(0.495*0.96+ 0.185*0.972+0.32*0.99)
= 0.17982/(0.4752 + 0.17982 + 0.3168)
= 0.17982/0.97182= 0.1850342
Es decir, la probabilidad que un paciente que no tiene quejas, haya sido
hospitalizado en un hospital pblico es de 0.1850342, es decir, de todos los
pacientes que no se quejan el 18.5% proviene de un hospital pblico.
c) Sea, Q = el paciente se queja del servicio
H1 = el paciente haya sido hospitalizado en nuestro hospital
H2 = el paciente haya sido hospitalizado en un hospital pblico
H3 = el paciente haya sido hospitalizado en la clnica
P(H1Q) = p(H1Q)/p(Q)
= 0.495*0.04/(0.495*0.04+ 0.185*0.028 + 0.32*0.01)
=0.0198/(0.0198 + 0.00518 + 0.0032)
= 0.0198/0.02818 = 0.7026
Es decir, la probabilidad que un paciente haya sido hospitalizado en nuestro
hospital, si se ha quejado es de 0.7026, es decir, de todos los pacientes que se
quejan, el 70.26% es de nuestro hospital.

Otra aplicacin de este concepto en salud, tiene que ver con los trminos de sensibilidad,
especificidad, falsos positivos, falsos negativos, valores predictivos negativos y positivos,
exactitud.
Ejemplo:

Resultado

Realidad Enfermo Sano Total

Enfermo a b a+b

Sano c d c+d

Total a+c b+d a+b+c+d

Sensibilidad = a/(a+b)
Especificidad = d/(c+d)
Falso (+) = c/(c+d)
Falso (-) = b/(a+b)
VP(+) = a/(a+c)
VP(-) = d/(b+d)
Exactitud = (a+d)/(a+b+c+d)
Modelos de valor esperado

En muchos problemas, para poder facilitar el clculo de una probabilidad, se definen variables
aleatorias que consisten en asignar valores numricos a los resultados del problema.
Toda variable aleatoria tiene asignada una distribucin de probabilidad que puede ser discreta
(binomial, poisson, geomtrica, hipergeomtrica) o continua (normal, Chi cuadrado, etc.), las
cuales tienen indicadores de tendencia central, valor esperado (promedio aritmtico) y varianza,
que son las que definen su distribucin.
Cada distribucin tiene sus caractersticas que las definen y su forma de clculo.
Estas distribuciones deben satisfacer las mismas condiciones de una probabilidad.

Pronsticos en los negocios

Regresin mltiple
Supongamos que deseamos predecir una variable Y con K variable independientes
X1 X2, Xk K > 1
Y = variable dependiente
X1 X2, Xk = variables independientes
La forma general del modelo de regresin para K variables independientes es:
Y = b0+ b1 X1 + b2 X2 + b3 X3 + bk Xk + e

Donde los bi con i = 1, 2 k, se llaman coeficiente de la regresin, los cuales hay que estimar y E
es el error.

Es necesario hacer notar que, con respecto a lo que vamos a discutir:


1. A veces es dificultoso determinar el mejor modelo, ya que pueden existir varios
modelos posibles.
2. Es difcil (si no imposible) visualizar cual es el modelo ajustado ya que no es posible
graficar los datos cuando k > 3.
3. A veces el mejor modelo ajustado tiene dificultades de ser interpretado en trminos
reales.
4. Los clculos se realizar con programas computacionales.
5. Si el nmero de variables independientes son 2, se denomina modelo de regresin
lineal simple.

Ejemplo: Si se desea pronosticar el peso (y), en base a la estatura (X1) y la edad (X2) de los
pacientes.

Nio 1 2 3 4 5 6 7 8 9 10 11 12
Y 64 71 53 55 60 45 66 67 61 64 54 57
X1 57 59 55 60 52 50 60 58 57 59 53 55
X2 8 12 9 11 10 7 10 11 9 8 10 9

Se deben estimar los coeficientes del modelo bi con i = 0,1, 2, donde b0, representa la
constante y los otros dos coeficientes representan el impacto que tienen las variables
independientes sobre el peso del paciente.

Supuestos de la regresin mltiple


Para cada especfica combinacin de puntos X1 X2 Xk , Y es una variable aleatoria con
una cierta distribucin de probabilidades.
Las Y observaciones son estadsticamente independientes una de otras.
e, es el componente del error en el modelo. Es el valor para el cual cualquier respuesta de
un individuo observado se desva de la superficie respuesta.
La estimacin de los coeficientes se realiza a travs del mtodo de los mnimos cuadrados.

El mtodo
1. Cada es una funcin lineal de los valores de Y.
2. Ya que se asume que Y tiene distribucin normal, cada uno de los estimadores tambin
tendr distribucin normal.
3. El anlisis se realiza a travs de la comparacin de las varianzas asociadas al modelo
(cuanto explica el modelo a la variable independiente) , al residuo (cuanto no explica el
modelo a la variable independiente)
4. Cmo se operar si la variable dependiente no es continua?, si es dicotmica se modela
una regresin logstica.
5. Hay casos en que existe el inters de identificar los elemento que amenazan el xito de una
decisin.

Potrebbero piacerti anche