Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
= x =
95%
1.96 x
+ 1.96 x
BIOESTADISTICA
Mg. Beatriz Castaeda Saldaa
Profesora de Bioestadstica
Facultad de Ingeniera Ambiental
Universidad Nacional de Ingeniera
BIOESTADISTICA
INDICE
INTRODUCCION
1. ESTADISTICA DESCRIPTIVA
1.1. Organizacin de datos
1.2. Medidas de Resumen
1.2.1. Medidas de Posicin
1.2.2. Medidas de Dispersin
1.2.3. Medidas de Forma
Prctica Domiciliaria 1
1.2.4. Medicin de datos nominales
Prctica Domiciliaria 2
Bibliografa del captulo
5
5
12
13
22
25
28
32
44
49
2. PROBABILIDAD
2.1. Funcin Probabilidad
2.2. Asignacin de probabilidad
2.3. Mtodos de enumeracin y conteo
2.4. Probabilidad Condicional. Probabilidad condicional de Bayes
2.5. Evaluacin de procedimientos de deteccin. Sensibilidad,
especificidad, valor predictivo
Prctica Domiciliaria 3
Bibliografa del captulo
51
53
54
56
62
67
70
79
3. VARIABLES ALEATORIAS Y
DISTRIBUCIONES DE PROBABILIDAD
3.1. Variable aleatoria. Funcin de cuanta. Funcin de densidad
Funcin de distribucin
3.2. Valor esperado y Varianza
Prctica Domiciliaria 4
3.3. Distribuciones de variables discretas
3.3.1. Distribucin de Bernoulli
3.3.2. Distribucin Binomial
3.3.3. Distribucin hipergeomtrica
3.3.4. Distribucin de Poisson
3.4. Distribuciones de variables continuas
3.4.1. Distribucin Exponencial
3.4.2. Distribucin Normal
Prctica Domiciliaria 5
3.5. Distribuciones de funciones de variables aleatorias
Bibliografa del captulo
80
87
90
95
95
96
99
103
106
106
108
118
128
133
134
80
BIOESTADISTICA
135
136
143
145
149
153
5. ESTIMACION
5.1. Estimacin Puntual
5.2. Estimacin intervlica
5.2.1. Estimacin intervlica para la media poblacional
Error de muestreo. Tamao de muestra
5.2.2. Estimacion intervlica para la varianza poblacional
5.2.2. Estimacin intervlica para la proporcin poblacional
Error de muestreo. Tamao de muestra
5.2.4. Estimacin intervlica para la diferencia de medias
poblacionales
5.2.5. Estimacin intervlica para la diferencia de proporciones
poblacionales
Prctica domiciliaria 7
Bibliografa del captulo
154
154
155
6. PRUEBA DE HIPTESIS
6.1. Pprincipios bsicos de prueba de hiptesis
6.1.1. Definicin
6.1.2. Elementos de una prueba de hiptesis
Ejercicio Aplicativo N 1
6.2. Pruebas Estadsticas
6.2.1. Pruebas paramtricas y Pruebas no paramtricas
6.2.2. Pruebas paramtricas
6.2.2.1. Pruebas de hiptesis para la media poblacional
6.2.2.2. Prueba Ji-Cuadrado para la varianza poblacional
6.2.2.3. Prueba Z para la proporcin poblacional
6.2.2.4. Pruebas de hiptesis para la comparacin de medias
poblacionales
6.2.2.5. Prueba para la media de la diferencia (datos apareados)
6.2.2.6. Prueba F para comparacin de varianzas poblacionales
6.2.2.7. Prueba Z para comparacin de proporciones poblacionales
6.2.3. Pruebas no paramtricas
6.2.3.1 Pruebas de bondad de ajuste de Kolmogorov-Smirnov
6.2.3.2. Prueba Ji- Cuadrado para comparacin de proporciones
6.2.3.2. Prueba de Independencia Ji-Cuadrado
Prctica domiciliaria 8
Bibliografa del captulo
156
161
162
167
171
173
177
178
178
178
178
196
198
200
201
208
209
213
216
226
229
234
239
239
248
255
260
268
ii
BIOESTADISTICA
7. REFERENCIAS BIBLIOGRFICAS
270
272
iii
BIOESTADISTICA
Lista de Cuadros
Cuadro 1. Clasificacin de variables segn escala de medicin
Cuadro 2. Edad de mujeres sometidas a evaluacin de porcentaje de saturacin
de colesterol en bilis
Cuadro 3. Etapa de la enfermedad de pacientes con cncer colorrectal
Cuadro 4. Frecuencia de bacteriemia en pacientes hipotticos con cultivos de
catter
Cuadro 5. Nmero de hijos por familia
Cuadro 6. Edad de pacientes
Cuadro 7. Codificacin de categoras
Cuadro 8. Casos con calcificaciones pulmonares en dos poblaciones con fbrica
de asbestos, segn distancia de los domicilios a la respectiva fbrica
Cuadro 9. Tasas especficas de calcificaciones pulmonares por distancias en dos
poblaciones
Cuadro 10. Casos esperados en poblacin A, bajo condiciones de la poblacin B
Cuadro 11. Exposicin a dieta con frituras para casos y Controles
Cuadro 12. Probabilidad marginal y conjunta
Ccuadro 13. Nivel crtico de una prueba estadstica: Interpretacin
Cuadro 14. Pruebas paramtricas
Cuadro 15. Pruebas no paramtricas
Cuadro 16. Prueba de hiptesis para la media poblacional
Cuadro 17. Prueba de hiptesis para diferencia de medias
Cuadro 18. Estimacion por intervalo
iv
BIOESTADISTICA
Lista de Grficos
Grfico 1. Edad de mujeres sometidas a evaluacin de porcentaje de saturacin
de colesterol en bilis
Grfico 2. Etapa de la enfermedad de pacientes con cncer colorrectal
Grfico 3.Frecuencia de bacteriemia en pacientes hipotticos con cultivos de
catter
Grfico 4. Distribucin acumulada de las mujeres segn edad.
Grfico 5. Distribucin simtrica
Grfico 6. Distribuiciones asimtricas
Grfico 7. Clasificacin de distribuciones segn curtosis
Grfico 8. Asignacin de probabilidades
Grfico 9. Diagrama de rbol
BIOESTADISTICA
vi
BIOESTADISTICA
Prlogo
Esta publicacin es fruto de los apuntes de clase desarrollados para mis alumnos
de la Facultad de Ingeniera Ambiental de la Universidad Nacional de Ingeniera,
los cuales empec a
vii
BIOESTADISTICA
Para cada tema se ha elaborado ejemplos aplicados los cuales sern resueltos en
clase con la participacin de los estudiantes. Al final de cada captulo se incluye un
listado de ejercicios y problemas denominado prctica domiciliaria.
viii
BIOESTADISTICA
INTRODUCCIN
La investigacin cientfica es la bsqueda continua del conocimiento y la
estadstica interviene en ella en la etapa de la experimentacin y observacin,
esto es, las observaciones experimentales y reconocimientos son partes
integrantes del mtodo cientfico, el cual conduce al empleo de las tcnicas
estadsticas, las que al ser utilizadas adecuadamente hacen ms eficientes las
investigaciones. Por ello es necesario que todos los investigadores se
familiaricen con las tcnicas y conceptos bsicos de la ciencia Estadstica.
ESTADSTICA
Es el campo de la ciencia que se ocupa de;
1) La recopilacin, organizacin y resumen de los datos
2) La obtencin de inferencias acerca de un conjunto de datos cuando slo se
observa una parte de ellos1.
BIOESTADSTICA
Cuando los datos que se estn analizando se obtienen de las ciencias
biolgicas y de la salud, se utiliza el trmino de bioestadstica para diferenciar a
esta aplicacin particular de herramientas y conceptos estadsticos.
Diseo de experimentos
BIOESTADISTICA
BIOESTADISTICA
BIOESTADISTICA
de Descripcin
Categrica
Escala
Ejemplo
Nominal
(no establece
orden)
Ordinal
-sexo
-estado civil
-raza
-Dolor
-Color (intensidad)
-Estado de
enfermedad
- nmero de hijos
- nmero de fallas
- Edad
- talla
- peso
-tiempo de
enfermedad
(orden en
categoras)
Cuantitativa
BIOESTADISTICA
Mujeres
% de
Sujeto Edad Sobresaturacin
1
23
40
2
31
86
3
58
111
4
25
86
5
63
106
6
43
66
7
67
123
8
48
90
9
29
112
10
26
52
11
64
88
12
55
137
13
31
88
14
20
80
% de
Sujeto Edad Sobresaturacin
1
40
65
2
33
86
3
49
76
4
44
89
5
63
142
6
27
58
7
23
98
8
56
146
9
41
80
10
30
66
11
38
52
12
23
35
13
35
55
14
50
127
BIOESTADISTICA
15
23
65
15
47
77
16
43
79
16
36
91
17
27
87
17
74
128
18
63
56
18
53
75
19
59
110
19
41
82
20
53
106
20
25
69
21
66
110
21
57
84
22
48
78
22
42
116
23
27
80
23
49
73
24
32
47
24
60
87
25
62
74
25
23
46
26
36
58
26
48
107
27
29
88
27
44
84
28
27
73
28
37
120
29
65
118
29
57
123
30
42
67
31
60
57
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)
Mujeres
% de
Orden Sujeto Edad Sobresaturacin
1
7
23
98
2
12
23
35
3
25
23
46
4
20
25
69
5
6
27
58
6
10
30
66
7
2
33
86
8
13
35
55
9
16
36
91
10
28
37
120
11
11
38
52
12
1
40
65
13
9
41
80
14
19
41
82
15
22
42
116
16
4
44
89
17
27
44
84
18
15
47
77
19
26
48
107
20
3
49
76
21
23
49
73
BIOESTADISTICA
22
3
58
111
22
14
50
127
23
19
59
110
23
18
53
75
24
31
60
57
24
8
56
146
25
25
62
74
25
21
57
84
26
5
63
106
26
29
57
123
27
18
63
56
27
24
60
87
28
11
64
88
28
5
63
142
29
29
65
118
29
17
74
128
30
21
66
110
31
7
67
123
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)
Agrupamiento de datos
Segn la cantidad y tipo de datos estos se pueden agrupar de dos maneras:
a) Agrupamiento por intervalos: Para datos cuantitativos
b) Por conteo individual: Segn categora o valor diferente
a) Agrupamiento por intervalos
Para la mejor descripcin o lectura de las edades, las agrupamos y
presentamos en una tabla de frecuencias por intervalos e ilustramos con un
grfico de histograma de frecuencias como sigue
R = Mx Mn
BIOESTADISTICA
c = R/k
Sugerencias:
a) 5 k 10
b) Todos los intervalos deben ser de igual longitud y de preferencia determinar
c como una medida que nos proporcione intervalos de fcil lectura
N de
mujeres
5
6
10
5
2
1
29
Porcentaje
17%
21%
34%
17%
7%
3%
100%
BIOESTADISTICA
Histograma de frecuencias
Se utiliza para representar frecuencias simples (absolutas o porcentuales) de
datos continuos. Se construye dibujando un eje en el cual se indican los
intervalos de clase, luego se dibuja una serie de rectngulos que tienen como
base los intervalos de clase y cuyas superficies deben ser proporcionales a las
frecuencias correspondientes a cada intervalo. En el caso de que todos los
intervalos sean de igual amplitud, la altura de cada rectngulo ser
proporcional a la frecuencia. Si los intervalos tienen amplitudes diferentes,
entonces, las alturas son llamadas densidad de frecuencia.
Grfico 1
Edad de mujeres sometidas a evaluacin de
porcentaje de saturacin de colesterol en bilis
N de mujeres
12
10
8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (aos)
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)
Polgono de frecuencias
Es un grfico que se utiliza, tambin, para representar las frecuencias simples
(absolutas o porcentuales) de datos continuos. Se construye uniendo con
segmentos los puntos correspondientes a los puntos medios y densidad de
frecuencias de cada intervalo (Ver grfico 1)
BIOESTADISTICA
Nmero de
pacientes
3
28
63
21
115
Porcentaje
3%
24%
55%
18%
100%
Grfico de barras
Se utiliza para representar frecuencias simples (absolutas o porcentuales) de
datos categricos o discretos. Se construye dibujando un eje en el cual se
10
BIOESTADISTICA
Nmero de pacientes
Etapa de la enfermedad
Datos Nominales
Si los datos son nominales ilustramos sus frecuencias con un grfico pastel, el
cual tiene por objeto mostrar que parte del todo es cada categora, como se
aprecia en el cuadro 4 y grfico 3.
Cuadro 4.
N de
pacientes
4
16
20
%
20%
80%
100%
11
BIOESTADISTICA
Grfico 3
20%
Si
No
80%
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, Manual Moderno 1997 (28)
12
BIOESTADISTICA
- Coeficiente de Variacin
Media Poblaciona l : =
x
i =1
Media Muestral :
x=
x
i =1
13
BIOESTADISTICA
Media Poblacional : =
x
i =1
ni
; Media Muestral :
N
x i = Valor individual o punto medio del intervalo
x=
x
i =1
14
ni
;
BIOESTADISTICA
Media
xi *
9.5
19.5
29.5
39.5
49.5
59.5
ni
5
10
20
22
13
5
75
xi ni
47.5
195.0
590.0
869.0
643.5
297.5
2642.5
Moda
Es el valor que ocurre con mayor frecuencia, por lo que se considera que
representa a los datos por ser el valor ms probable
Moda = 3 hijos
15
BIOESTADISTICA
o Para la edad:
que
toman
uniformemente
proporcionalidad
medida
dentro
de
entre
el
en
un
establecindose
tamao
intervalo
del
dado
intervalo
se
una
y
distribuyen
relacin
la
de
frecuencia
CUANTILAS O CUANTILES
Cuantila : X p
Es un valor en el recorrido de la variable en el que se acumula una porcin p de
datos con medida mxima el valor de la cuantila, es decir, un porcentaje (p x
100) de datos toma medidas menores o iguales a X
mayores o iguales a X p.
Mediana:
Me = X0.50
Indica que la mitad o el 50% de los datos toma medidas menor o igual a Me y
el otro 50% toma medida mayor o igual a Me, por ejemplo
Edad mediana = 36 aos
16
BIOESTADISTICA
Indica que el 50% de las personas tienen edad mxima 36 aos y que el otro
50% tiene mnimo 36 aos.
Cuartiles :
q1 = X0.25
; q2 = X0.50
q3 = X0.75
Son puntos que dividen al conjunto de datos en 4 partes, esto es en cada parte
se acumula 25% de los datos, por ejemplo
q1 = X0.25 = 27 aos ;
q3 = X0.75 = 45 aos
Indica que el 25% de las personas tienen hasta 27 aos y que el 75% tiene a
lo ms 45 aos, es decir el 50% tiene edad entre los 27 y 45 aos.
Dciles:
d1 = X0.10
; d2 = X0.20 ; ........ ;
d9 = X0.90
Son puntos que dividen al conjunto de datos en 10 partes donde cada una
acumula el 10% de datos, por ejemplo
d1 = X0.10 = 17 aos
; d8 = X0.80 = 52 aos
Indica que el 10% de las personas tienen a lo ms 17 aos y que el 80% tiene
mximo 52 aos, tambin podemos deducir que el 70% de las personas tiene
edad entre los 17 y 52 aos.
Percentiles:
P1 = X0.01
; P2 = X0.02 ; ........ ;
P99 = X0.99
Son puntos que dividen al conjunto de datos en 100 partes cada una con 1%
de los datos, por ejemplo
P20 = X0.20 = 23 aos ;
17
BIOESTADISTICA
Indica que el 20% de las personas tiene mximo 20 aos y que slo el 5% de
las personas tiene ms de 57 aos, tambin podemos deducir que el 75% de
las personas tienen edad entre los 23 y 57 aos.
r=nxp
Ejemplo 1.5. Consideremos nuevamente los datos del ejemplo 1.1 ordenados
segn edad (Tabla 2)
Mujeres
% de
Orden Sujeto Edad Sobresaturacin
1
7
23
98
2
12
23
35
3
25
23
46
4
20
25
69
5
6
27
58
6
10
30
66
7
2
33
86
8
13
35
55
9
16
36
91
10
28
37
120
11
11
38
52
12
1
40
65
13
9
41
80
14
19
41
82
15
22
42
116
16
4
44
89
17
27
44
84
18
15
47
77
19
26
48
107
18
BIOESTADISTICA
20
21
22
23
24
25
26
27
28
29
30
31
20
12
3
19
31
25
5
18
11
29
21
7
53
55
58
59
60
62
63
63
64
65
66
67
106
137
111
110
57
74
106
56
88
118
110
123
20
21
22
23
24
25
26
27
28
29
3
23
14
18
8
21
29
24
5
17
49
49
50
53
56
57
57
60
63
74
76
73
127
75
146
84
123
87
142
128
Mujeres
ni
n1
n2
...
nj-1
nj
...
nk
Ni
N1
N2
...
Nj-1
Nj
...
Nk
Si y slo si
Nj np
y Nj-1 < np
Ejemplo 1.6. Del ejemplo 1.4. y del cuadro 4 obtenemos las frecuencias
acumuladas con las que determinamos los percentiles 10, 25, 50, 75, 90 y 95
19
BIOESTADISTICA
n de
hijos
(xi)
0
1
2
3
4
5
6
Total
n de
familias
(ni)
4
8
11
15
10
13
3
64
N acumulado
de familias
Ni
4
12
23
38
48
61
64
ni
n1
n2
...
nj-1
nj
...
nk
Ni
N1
N2
...
Nj-1
Nj
...
Nk
LjI Ljs
2)
X p = L jI + c
Si y slo si
(np N )
j 1
nj
Nj np
y Nj-1 < np
, donde
20
BIOESTADISTICA
c:
LjI: Frontera de clase del intervalo j (el punto medio entre los extremos
consecutivos para intervalos discretos) o lmite inferior para intervalos
continuos.
Porcentaje
17%
21%
34%
17%
7%
3%
100%
N acumulado
5
11
21
26
28
29
21
BIOESTADISTICA
% de mujeres
Grfico 4
Distribucin acumulada de las mujeres
segn edad
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
20
29
39
49
59
69
79
Total
43 Edad (aos)
Rango: 23 74 aos
22
BIOESTADISTICA
2 =
( xi )2
i
N
n
S2 =
(x
x)
n1
x
1
N
n
2
i
2
i
2 Varianza Poblaciona l
n x
n1
Desviacin estndar
Varianza muestral
= 2
S=
S2
x=
Luego
S = 1,70 g/100ml
23
BIOESTADISTICA
Coeficiente de Variacin: C .V . =
S
x 100
x
1.7
x 100 = 18%
9.42
S2 =
( x i x ) 2 ni
Donde:
n1
2
i
ni n x
Varianza muestral
n1
K: Nmero de intervalos
Xi: Punto medio de cada intervalo
ni: Frecuencia simple para el intervalo
xi
9.5
19.5
29.5
39.5
49.5
59.5
ni
5
10
20
22
13
5
75
xi ni
47.5
195.0
590.0
869.0
643.5
297.5
2645.5
Xi2 ni
451.25
3802.50
17405.00
34325.50
31853.25
17701.25
105538.75
24
BIOESTADISTICA
x=
2645.5
= 35.27 aos
75
C .V . =
S = 12.86 aos
12.86
x 100 = 36.5%
35.27
Los resultados nos indican que los pacientes en promedio tienen 35 aos y
que sus edades tienden a dispersase en aproximadamente 13 aos respecto
de la edad promedio, es decir, la dispersin de la edad es el 36,5% de la edad
promedio.
Asimetra
Indica la deformacin horizontal de las distribuciones de frecuencia con
respecto a la media aritmtica. Para una distribucin unimodal tenemos tres
situaciones:
a) La distribucin
25
BIOESTADISTICA
Mo =
= Me
Asimetra Negativa
Me Mo
Asimetra Positiva
Mo Me x
3 ( x Me )
S
26
BIOESTADISTICA
Curtosis
Es una medida de la deformacin vertical de una distribucin de frecuencias, es
decir, nos indica el apuntamiento o achatamiento de la curva, lo cual est
relacionado con la dispersin de los datos.
Platicrtica
Mesocrtica
Leptocrtica
( x0.75 x0.25 )
2 ( x0.90 x0.10 )
Coeficiente de curtosis:
K=
Disribucin platicrtica:
Distribucin Mesocrtica: k 0.25 , esto ocurre cuando los datos tienen una
dispersin moderada. Por ejemplo en el caso de la distribucin normal
mesocrtica K = 0.263
27
BIOESTADISTICA
PRACTICA DOMICILIARIA 1
1. Los siguientes datos son parte de los resultados de una investigacin
acerca del reuso de aguas residuales y su impacto en los cultivos. Aqu se
presentan los datos recopilados para el logaritmo del coliforme fecal en el
agua de irrigacin y la verdura para una muestra de 100 productos
agrcolas, los que fueron irrigados con agua de diferente calidad bacteriana.
Se indica tambin la procedencia, el tipo de crecimiento y la calificacin de
cada producto para el consumo humano.
La codificacin utilizada es:
1
2
3
4
5
6
7
8
9
10
11
1
2
3
3
3
3
3
3
3
3
3
1
1
1
1
1
1
1
1
1
1
1
1.30
5.48
7.70
7.60
7.60
8.20
8.10
7.56
8.10
7.70
8.10
0.47
2.20
2.20
0.48
0.30
1.76
0.30
0.92
2.78
2.90
2.45
1
3
3
1
1
3
1
2
3
3
3
Caso
Proced
T.C.
51
52
53
54
55
56
57
58
59
60
61
3
3
3
3
3
3
3
3
3
3
3
2
2
2
2
2
2
2
2
2
2
2
Logcfa logcfv
7.56
8.10
8.20
7.70
8.20
8.10
7.60
8.13
8.13
7.70
8.13
0.79
2.24
4.72
2.60
5.20
0.66
2.17
0.95
4.11
2.75
4.11
Calif-P
2
3
3
3
3
1
3
1
3
3
3
28
BIOESTADISTICA
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
4
4
4
4
4
4
4
4
4
4
4
4
4
4
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
3
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
7.70
7.78
7.90
7.81
9.96
7.70
7.60
7.60
7.70
7.70
8.96
7.78
7.70
7.60
1.90
2.36
1.90
1.90
3.48
2.36
1.30
1.30
2.36
2.36
1.30
3.48
1.30
3.48
5.48
4.34
5.48
5.48
4.34
8.13
7.56
8.10
8.20
7.56
8.10
2.17
0.73
0.40
3.13
2.30
2.14
4.47
3.01
2.14
0.30
3.14
0.50
0.34
4.20
0.41
0.73
0.30
1.02
0.30
1.64
0.36
0.34
0.30
0.64
0.43
2.84
0.30
0.86
1.62
3.14
1.23
1.46
3.14
2.27
3.20
3.28
4.20
1.07
3.28
3
2
1
3
3
3
3
3
3
1
3
1
1
3
1
2
1
1
1
2
1
1
1
1
1
3
1
2
3
3
2
2
3
3
3
3
3
3
3
Caso
Proced
T.C.
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
1
1
1
1
1
1
2
2
3
3
3
4
4
4
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3
Logcfa logcfv
8.10
7.70
8.20
7.70
8.10
7.70
8.10
7.60
8.13
7.78
7.90
7.81
7.78
7.60
7.70
8.96
7.90
8.96
7.70
7.90
7.70
7.70
7.70
7.81
7.81
1.30
1.30
3.48
1.30
1.90
2.36
5.48
4.34
8.20
7.60
7.70
7.60
7.70
7.81
2.10
2.52
5.14
2.85
3.94
3.17
0.64
0.69
3.38
2.52
0.69
1.59
1.21
0.63
0.54
2.61
2.27
2.21
0.49
3.69
1.97
1.66
1.84
1.61
3.02
0.85
0.85
0.30
0.30
0.30
0.36
1.52
2.37
1.04
2.11
3.10
0.30
1.28
0.30
Calif-P
3
3
3
3
3
3
1
2
3
3
2
2
2
2
1
3
3
3
1
3
3
3
3
2
3
1
1
1
1
1
1
2
3
2
3
3
1
3
1
Fuente: Evaluacin de Riesgos para la salud por el uso de aguas residuales en agricultura.
Anexo 3: Aspectos Microbiolgicos. CEPIS-OPS. Lima, Per. 1990
29
BIOESTADISTICA
Raza
1
2
3
4
5
6
7
8
9
Mestiza
Blanca
Negra
Blanca
Blanca
Mestiza
Negra
Mestiza
Blanca
Sexo Edad
F
F
F
M
F
F
M
F
F
42
36
28
51
47
25
53
44
70
Contextura
Delgada
Gruesa
Gruesa
Mediana
Delgada
Delgada
Gruesa
Delgada
Mediana
2
0
4
2
3
1
1
0
1
2
1
2
6
1
2
0
5
0
No
No
si
si
si
No
si
No
No
Mucho
Poco
Mucho
Nada
Nada
Poco
Poco
Nada
Mucho
30
DMO
0.79
0.89
1.12
0.73
0.69
0.99
0.84
0.74
0.78
BIOESTADISTICA
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Blanca
Blanca
Mestiza
Mestiza
Blanca
Negra
Negra
Blanca
Blanca
Negra
Blanca
Negra
Blanca
Blanca
Blanca
Blanca
Mestiza
Blanca
Negra
Blanca
Blanca
F
F
M
F
F
F
F
M
F
F
M
F
F
F
M
F
F
F
M
F
F
32
46
48
26
64
71
48
62
55
68
73
77
56
80
49
38
64
45
82
31
67
Gruesa
Delgada
mediana
Gruesa
Delgada
Delgada
Delgada
Gruesa
Gruesa
Mediana
Mediana
Delgada
Delgada
Delgada
Mediana
Gruesa
Gruesa
Gruesa
Mediana
Delgada
Gruesa
3
4
2
1
1
0
0
2
1
1
2
0
0
1
3
1
3
3
2
3
1
4
4
0
2
5
3
1
2
1
0
4
2
5
6
0
1
1
0
2
0
1
No
si
si
No
si
si
si
No
si
No
No
No
si
si
No
No
si
si
si
No
No
Mucho
Poco
Nada
Nada
Poco
Nada
Poco
Poco
Mucho
Mucho
Nada
Poco
Poco
Nada
Poco
Mucho
Mucho
Poco
Nada
Nada
Nada
31
1.01
0.70
0.83
1.07
0.68
0.71
0.92
0.77
0.84
0.93
0.72
0.82
0.66
0.68
1.03
0.97
0.81
0.84
0.78
1.04
0.72
BIOESTADISTICA
p=
a
a+b
Ejemplo:
p=
Porcentaje
Un porcentaje es una proporcin multiplicada por 100. Indica la parte en
unidades por ciento, esta medida es ms fcil de asimilar y trasmitir que la
proporcin, en el ejemplo anterior
El 9% de los casos de cncer fueron de cncer pulmonar.
Razn
Una razn es la comparacin por cociente entre dos cifras de diferente o similar
naturaleza.
R=
a
b
380 camas
= 4 camas / enfermera
95 enfermeras
32
BIOESTADISTICA
R=
20 cirujanos
= 1 cirujano / 2 int ernistas .
40 int ernistas
R=
R1 18 alumnos / docente
=
= 1.8 R = 180%
R2 10 alumnos / docente
Esta razn compara dos razones y nos indica que los docentes del grupo 1
tienen 80% ms de intensidad de trabajo que los docentes del grupo 2, para la
interpretacin a la razn la hemos expresado en unidades porcentuales del
denominador.
MEDICION EPIDEMIOLOGICA
TASA
Una tasa es una comparacin por cociente entre un nmero de eventos
ocurridos en un tiempo y lugar dados y la poblacin que estuvo expuesta al
riesgo de que le ocurrieran dichos eventos en la misma poca y en ese mismo
lugar
Tasa =
a x base
a+b
33
BIOESTADISTICA
Los datos que integran una tasa ocurrieron en un perodo anterior al actual y en
cierto modo permiten anticipar, con un determinado valor numrico, la
probabilidad de que exista ese riesgo para
la poblacin en perodos
34
BIOESTADISTICA
Ejemplo 1.10
Cuadro 8. Casos con calcificaciones pulmonares en dos poblaciones
con fbrica de asbestos, segn distancia de los domicilios
a la respectiva fbrica
Poblacin A
Poblacin B
Distancia
Habitantes
Habitantes
(Km)
N
%
Casos
N
%
Casos
0 0,9
1 531 13,8 279
5 438
9,1
462
1,0 1,9
1 904 17,2
69
4 489
7,5
117
2,0 2,9
2 599 23,5 141
10 351 17,4
802
3,0 3,9
4 672 42,2
2
36 994 62,0
37
4,0 y ms
368
3,3 119
2 384
4,0
665
TOTAL
11 074 100,0 610
59 656 100,0 2083
Fuente: Centro Panamericano de Ecologa Humana y Salud. Evaluacin Epidemiolgica
de riesgos causados por agentes qumicos ambientales. Edicin de 1985. Mxico: OPS;
1985.
Con la informacin del cuadro obtenemos:
Tasa de A =
610
x1000 = 55,1 casos de calcificaciones / 1000 habi tan tes
11074
35
BIOESTADISTICA
Tasa de B =
2083
x1000 = 34,9 casos de calcificaciones / 1000 habi tan tes
59656
Tasa de A
55,1
x100 =
x100 = 158%
34,9
Tasa de B
Lo que nos indica que los habitantes de la poblacin A tienen un riesgo 58%
mayor al de la poblacin B para tener calcificaciones pulmonares.
AJUSTE DE TASAS
Cuando dos poblaciones tienen diferente estructura de poblacin no es
apropiado comparar las tasas globales ya que est comparacin podra no ser
vlida debido a stas diferencias, lo que nos permite, adems explicar las
razones de la diferencia y las posibles causas del mayor riesgo en una de las
poblaciones.
36
BIOESTADISTICA
Poblacin A
Habitantes
0 0,9
1,0 1,9
2,0 2,9
3,0 3,9
4,0 y ms
Tasas
Casos esperados en A
especificas bajo condiciones de B
de B
1 531
1 904
2 599
4 672
368
85,0
26,1
77,5
1,0
278,9
130
50
201
5
103
TOTAL
11 074
489
Fuente: Centro Panamericano de Ecologa Humana y Salud. Evaluacin
Epidemiolgica de riesgos causados por agentes qumicos ambientales. Edicin
de 1985. Mxico: OPS; 1985.
Tasa ajustada = Suma de casos esperados x constante
Poblacin
Ejemplo: Tasa ajustada =
Tasas iniciales
A
B
55,1 34,9
Tasas corregidas
A(ajustada) B
44,2
34,9
37
BIOESTADISTICA
La comparacin luego del ajuste (44,2/34,9 = 1,3) nos indica que si la poblacin
A estuviera sometida a condiciones de exposicin al asbesto iguales a las que
tiene B, el riesgo de tener calcificaciones pulmonares en A sera 30% mayor
que en la poblacin B, lo cual se explicara por la distribucin de la poblacin
segn distancia a la fbrica de asbestos.
Expuestas No expuestas
A1
A0
N1 A1
N0 - A0
N1
N0
RR =
Total
A
N-A
N
A1 / N 1
R EXP
=
A0 / N 0 R No Exp
38
BIOESTADISTICA
Estimacin intervlica
Para que podamos concluir, con certeza, que el factor considerado es un factor
de riesgo para la enfermedad, es necesario que el valor obtenido para el RR
sea significativamente mayor que 1, por ello para estar seguros de este
resultado se obtiene la estimacin intervlica al 95% de confianza para RR;
cuyos lmites se calculan con la siguiente expresin:
L=e
ln( RR ) 1.96
N 1 A1 N 0 A 0
+
N1A1
N0 A0
39
BIOESTADISTICA
e = 2.7182
es el nmero neperiano
ln(RR):
Ejemplo 1.15
Asuma que de 100 individuos expuestos 20 desarrollaron la enfermedad. En
un grupo de 200 individuos no expuestos, 25 desarrollaron la enfermedad. As
en un arreglo de 2x2 tenemos:
Individuos
Enfermos
No enfermos
Total
Expuestos No expuestos
20
25
80
175
100
200
Total
45
255
300
Li = e
100 20 200 25
+
100 ( 20 ) 200 ( 25 )
= 0.935
40
BIOESTADISTICA
Ls = e
ln(1.60 ) + 1.96
10020 20025
+
100 ( 20 ) 200 ( 25 )
= 2.74
0.935 2.74
Este resultado nos indica que no podemos concluir que el factor de exposicin
sea un factor de riesgo, pues la diferencia encontrada no es significativa.
Expuestos No expuestos
a
b
c
d
OR
Total
N1
N0
a b
axd
=
c d
b xc
41
BIOESTADISTICA
Estimacin intervlica
Para que podamos concluir, con certeza, que el factor considerado es un factor
de riesgo para la enfermedad, es necesario que el valor obtenido para el OR
sea significativamente mayor que 1, por ello para estar seguros de este
resultado se obtiene la estimacin intervlica al 95% de confianza para OR
L=e
ln( OR ) 1.96
1 1 1 1
+ + +
a b c d
donde
L:
e = 2.7182 :
es el nmero neperiano
ln(OR):
42
BIOESTADISTICA
Ejemplo 1.16
En un estudio de casos-control de dieta con frituras y cncer pancretico
(Norell et al 1986), los siguientes datos fueron obtenidos:
Dieta con
frituras
53
53
106
No dieta con
frituras
43
85
128
Total
96
138
234
OR = 53/43 = 1.98
53/85
Este resultado nos indica que hubo 98% ms de exposicin a la dieta con
frituras para los casos que para los controles, lo que probablemente influy en
el desarrollo del cncer.
Estimacin intervlica:
Li = e
1
1
1
1
+
+
+
53
43
53
85
= 1.167
43
BIOESTADISTICA
LS = e
1
1
1
1
+
+
+
53
43
53
85
= 3.359
1.167 3.359
Este resultado nos indica que podemos concluir que la dieta con frituras es un
factor de riesgo para el desarrollo de cncer pancretico, pues la diferencia
encontrada es significativa.
Prctica domiciliaria 2
1. En un estudio para examinar la relacin entre clase socio-econmica y tipo
ms frecuente de uso de tarjetas de crdito, se entrevistaron a 1500
usuarios de tarjetas de crdito y se obtuvo la informacin que aparece en la
tabla siguiente:
Clasificacin
Uso ms frecuente de tarjeta de crdito
Socio-econmica Entretenimiento Adquisicin de bienes Total
Alta
36
39
75
Media alta
114
186
300
Media
174
426
600
Media baja
72
228
300
Baja
41
184
225
Total
437
1063
1500
a) Elabore un grfico para comparar el uso de tarjeta de crdito segn
clasificacin socio-econmica
b) Quines son los mayores usuarios de tarjeta de crdito?
c) Analice y compare el uso de tarjeta de crdito para entretenimiento
44
BIOESTADISTICA
45
BIOESTADISTICA
se ha
46
BIOESTADISTICA
8.5 9.0]
Total
240
2200
Edad
04
5 14
15 24
25 34
35 44
45 54
55 64
65 74
+ 75
Total
Pas A
Pas B
Poblacin
Poblacin
(miles)
Muertes
(miles)
Muertes
10541
494
18152
666
22431
667
33860
1165
23922
1287
39021
2115
21339
3696
42779
5604
18333
11198
33070
14991
15512
26180
22815
37800
10572
39071
22232
98805
6377
44328
17332
146803
2643
31279
11836
161381
131670
158200
241097
469330
47
BIOESTADISTICA
48
BIOESTADISTICA
35
30
25
Del grupo A
Del grupo B
20
15
10
5
0
0
Grupo B
4.3
2.3
4
6
A.
And
NORELL,
S.
Introduction
To
MODERN
49
BIOESTADISTICA
50
BIOESTADISTICA
CAPITULO 2.
PROBABILIDAD
Probabilidad
Subjetiva
Objetiva
Terica o
a priori
Frecuencial o
a posteriori
Probabilidad Objetiva
Es la medida que asignamos basados en datos concretos y en la teora
matemtica. Esta forma de medicin se puede trasmitir a otras personas.
Definiciones
- Experimento aleatorio:
Todo procedimiento o actividad que genera dos o ms posibles resultados, por
ejemplo: Lanzar una moneda, observar la calidad de 3 productos
51
BIOESTADISTICA
- Espacio muestral: , S
Conjunto formado por todos los resultados posibles de un experimento
aleatorio, por ejemplo dados l os siguientes experimentos:
- Al lanzar una moneda
= {c, s}
= {BBB,BBD,BDB,BDD,DBB,DBD,DDB,DDD }
Evento elemental: w
Resultado individual del experimento aleatorio, por ejemplo w = BBB
Evento o Suceso:
Un subconjunto del espacio muestral, ejem: A = {BBD, BDB, DBB }
Nomenclatura. Como los eventos tienen que ver con la ocurrencia de ciertos
resultados algunos tienen una denominacin particular que difiere de la
nomenclatura general de los conjuntos, de esta manera:
Si A = , A es un evento imposible
Si A = , A es un evento seguro
AB = AB,
52
BIOESTADISTICA
es el evento complemento de A,
AA=
A P ( A) = p
Donde p debe cumplir los tres axiomas siguientes:
1. P(A) 0 , para todo evento A definido en
2. P() = 1
3. Dados A1, A2, ., An,
mutuamente
excluyentes, es decir:
entonces.
P ( U Ai ) = P ( Ai )
i =1
Propiedades
P() = 0
P(Ac) = 1 P(A)
P(AUB) = P(A) + P(B) - P(AB)
0 P(A) 1
53
BIOESTADISTICA
P ( A) =
n( A)
n
Afiliacin
partidaria
A
B
Otra
Total
A favor
120
50
50
220
Reaccin
Total
Neutral Se opone
20
20
160
30
60
140
10
40
100
60
120
400
Probabilidad Terica
Se basa en el razonamiento matemtico, as dado un experimento con n()
resultados igualmente posibles y un evento A con n(A) resultados favorables
igualmente posibles, entonces:
P ( A) =
n( A)
n( )
54
BIOESTADISTICA
8A
6B
6
B
A
7
A
6
B
8
A
5
B
C = {AB , BA}
n(C ) = n( AB ) + n( BA) = 8 x 6 + 6 x 8 = 96
n( ) = 14 x13 = 182
Luego
P (C ) =
96
= 0.527
182
55
BIOESTADISTICA
C
n() = 2x2 = 4
Ejemplo 2.6
Trasladarse de una ciudad A a otra ciudad C pasando por B, sabiendo que de
A a B hay 3 lneas de vehculos y de B a C hay 5 lneas.
n() = 3x5 = 15
Ejemplo 2.7
Extraer dos artculos de un lote en el que hay 5A y 10B
n() = 15 x 14
56
BIOESTADISTICA
2. Principio de Adicin
Si un proceso A puede realizarse de nA maneras y un proceso B puede
realizarse de nB maneras, entonces si A y B son procesos que no pueden
realizarse u ocurrir simultneamente, el nmero de maneras en que se puede
realizar el proceso A o B ser nA + nB
Ejemplo 2.8
Sea el experimento de extraer un artculo de un lote que contiene 4b, 2n y 3 A.
Sean los eventos:
A: El artculo extrado es b
B: el artculo extrado es n
Entonces
n(A B) = 4 + 2 = 6
Ejemplo 2.9
Sea el experimento que consiste en extraer 2 objetos de un conjunto que
contiene 8 A, 5B y 4C. Sean los sucesos:
A1 : El primer objeto extrado es A
A2 : El segundo objeto extrado es A
A1 A2 = {AA, AB, AC, BA, CA }
n(A1 A2) = n(AA) +n(AB) + n(AC) + n(BA) + n(CA)
= 8 x 7 + 8 x 5 + 8 x 4 + 5 x 8 + 4x 8 = 200
57
BIOESTADISTICA
3. Permutaciones u ordenamientos
Si se tiene un conjunto de n elementos, entonces el nmero de maneras
diferentes en que podemos presentarlos ordenadamente en lnea ser
N = n!
1 2 3 . . . n
n-1
n-1
N = n x n-1 x . . . x 2 x 1 = n!
el experimento sera similar al de extraer de uno en uno los elementos y
colocarlos en algn orden establecido.
Ejemplo 2.10
Un inspector visita 6 mquinas diferentes durante el da. A fin de impedir a los
operadores que sepan cuando inspeccionar, vara el orden de las visitas. de
cuntas maneras puede realizar las visitas
El nmero de maneras ser: 6! = 720
58
BIOESTADISTICA
N = n x n-1 x . . . x n (n-1) =
n!
( n r )!
Ejemplo 2.11
Placas con 3 nmeros y 2 letras deben construirse, si no se permite la
repeticin de dgitos y letras, cuntas placas se construyen con los dgitos 0,
1, 2, . , 9 y las letras A, B, ., E
4.
Combinaciones
n
n!
N = =
r r !( n r )!
Ejemplo 2.12
Un mecanismo puede fallar en 15 partes diferentes, si falla en 3 partes, de
cuntas maneras puede suceder?
15
15!
= 455
N = =
3 3! 12!
Ejemplo 2.13
De un grupo de 7 personas se elige 3 para formar una comisin, luego el
nmero de maneras diferentes de formar la comisin ser:
7
N = = 35
3
59
BIOESTADISTICA
Ejemplo 2.14
Un examen consiste de 10 preguntas cuyas respuestas son verdadero (V) o
falso (F) De cuntas maneras se puede contestar el examen marcando 3V y
7F
Este procedimiento lo podramos comparar con la accin de escoger 3
preguntas para responder verdadero y a las 7 restantes asignarle falso, luego:
10
N = = 120
3
5.
Particiones
n!
n1! n2 ! . . . nk !
Ejemplo 2.15
De cuntas maneras se puede distribuir un conjunto de 9 personas en 3
comisiones, la primera conformada por 3, la segunda por 4 y la tercera por 2
personas, respectivamente?
60
BIOESTADISTICA
6.
9!
= 1260
3! 4! 2!
Si se tiene n elementos entre los que n1, n2, , nk elementos son similares
entre si y
N =
n!
n1! n2 ! . . . nk !
Ejemplo 2.16
Sean las letras a, a, b, b, b si las deseamos presentar en lnea en un orden
diferente cada vez, el nmero de maneras ser:
N =
5!
= 10
2! 3!
7.
Ordenamiento en circulo
N = (n-1)!
Ejemplo 2.17
Sean las letras a, b, c , entonces el nmero de maneras de ordenarlas en lnea
sera 3! = 6, pero en circulo es solo 2! = 2 porque:
61
BIOESTADISTICA
abc
cab
bca
acb
bac
cba
P( A / B) =
P ( AB ) n( AB ) , si P(B) > 0
=
P( B)
n( B )
62
BIOESTADISTICA
Ejemplo 2.18
Con los datos del ejemplo 2.1, calculamos la probabilidad de que un ciudadano
este a favor del nuevo plan de impuestos dado que es de afiliacin partidaria A
Afiliacin
partidaria
A
B
Otra
Total
A favor
120
50
50
220
Reaccin
Total
Neutral Se opone
20
20
160
30
60
140
10
40
100
60
120
400
A: El ciudadano es de afiliacin A
P ( F / A) =
P ( AF ) 0.30 120
=
=
= 0.75
0.40 160
P ( A)
P(Ac)
P(A)
P(AB)=P(A)P(B/A)
Ac
A
P(B/A)
B
Bc
Bc
63
BIOESTADISTICA
B
BC
Prob.
marginal
Prob.
marginal
c
P(AB)
P(AB )
P(B)
c
c c
P(PAB ) P(A B )
P(Bc)
A
Ac
P(A)
P(Ac)
Elaboracin propia
2.
P(A) = P(A/B)
P(B) = P(B/A)
P(AB) = P(A) P(B)
64
BIOESTADISTICA
Ejemplo 2.19
Calculamos la probabilidad de obtener
moneda
P(cc) = P(c) P(c) = (1/2)(1/2) =
Probabilidad Total
Un evento de probabilidad total es un evento A que ocurre asociado a la
ocurrencia de n eventos Bi, tales que son mutuamente excluyentes y
colectivamente exhaustivos
BiBj = i j
Bi =
B2
B1
A
AC
P( A)=
B1
AB1
AcB1
B2
AB2
AcB2
P ( AB i ) =
Bn
...
A
...
Bn
ABn
AcBn
P (Bi )P ( A / Bi )
65
BIOESTADISTICA
P (B
/ A)=
P ( AB
P(A)
Ejemplo 2.20
Para las fiestas navideas una tienda de regalos contrata a 3 empaquetadores.
Carmen empaqueta el 30% de los regalos vendidos y olvida quitar la etiqueta
con el precio en 1 de cada 20, Juan empaqueta el 40% de los regalos que
empaqueta Sandra y olvida quitar la etiqueta con el precio en 1 de cada 10; y
Sandra olvida quitar la etiqueta con el precio en 1 de cada 25.
a) Cul es la probabilidad de que un cliente reciba un regalo con la etiqueta
del precio?
b) Si un cliente se quej de que no fue quitada la etiqueta del regal que
compr, cul es la probabilidad de que el error haya sido cometido por Juan?.
Luego el proceso de empaquetar los regalos lo ilustramos con el siguiente
diagrama
Regalos
0.30
Carmen
0.05
E
Donde
Juan
Sandra
0.10
0.04
66
BIOESTADISTICA
J + S =0.7
Regalos
empaquetados
Con etiqueta
Sin la etiqueta
Total
Carmen Juan
0,015
0,285
0,30
Sandra Total
0,02 0,02
0,018 0,48
0.20 0.50
0,055
0,945
1,00
P(A) = 0.055
Por consiguiente
P ( J / A) =
P ( JA) 0,02
=
= 0,364
P ( A) 0,055
67
BIOESTADISTICA
Prueba diagnstica
Positivo (+)
Negativo (-)
E + (PV)
E- (NF)
S+ (PF)
S- (NV)
TOTAL
E
S
Sensibilidad = E + x 100
E
Especificidad = S - x 100
S
Es la capacidad del mtodo para identificar a los que no tienen la enfermedad
Mide el porcentaje de sanos que el mtodo es capaz de identificar, es decir,
sanos que dan negativo a la prueba
Valor predictivo
Sobre la base de las estimaciones de la bondad de la prueba para
identificacin de sanos y enfermos, y teniendo en cuenta la prevalencia de la
enfermedad en determinada poblacin se calcula el valor predictivo positivo y
negativo
Poblacin
Enfermos
Sanos
TOTAL
Prueba diagnstica
Positivo (+)
Negativo (-)
P(E + )
P(E-)
P(S+)
P(S-)
P(+)
P(-)
TOTAL
P(E)
P(S)
68
BIOESTADISTICA
Ejemplo 2.21
Se estima que el 1% de la gente de cierto vecindario tiene tuberculosis; una
placa de rayos X es usada con la gente para prevenirla de la enfermedad. De
experiencias anteriores se sabe que los rayos X tienen una sensibilidad del
99% y una especificidad del 90%.
a) Si la prueba a una persona resulta positiva, cul es la probabilidad de
que no tenga tuberculosis?
b) Si la prueba resulta negativa, cul es la probabilidad de que est
enferma?
Resumimos la informacin en la tabla resumen de probabilidades
Poblacin
Enfermos
Sanos
TOTAL
Prueba diagnstica
Positivo (+)
Negativo (-)
0.0099
0.0001
0.099
0.891
0.1089
0.8911
TOTAL
0.01
0.99
Luego:
Valor predictivo Positivo (VP+) = P(E+) X 100 = 0.0099 x 100 = 9.09%
P(+)
0.1089
Mg. Beatriz Castaeda S.
69
BIOESTADISTICA
Prctica domiciliaria 3
70
BIOESTADISTICA
inspeccionadas obtenga la
probabilidad de:
a) Que ambos artculos sean defectuosos
b) Dado que ambos resultaron defectuosos, uno haya sido producido por la
mquina 1 y el otro por la mquina 2.
5. Se sabe que una caja se ha llenado lanzando un dado y colocando en ella
blancas en nmero igual al obtenido en el lanzamiento del dado. A
continuacin se ha aadido bolas negras en nmero determinado por una
segunda tirada del dado. Se sabe tambin que el nmero de bolas en la
71
BIOESTADISTICA
72
BIOESTADISTICA
es
la
probabilidad
de
que
un
producto
que
presente
73
BIOESTADISTICA
0.01
0.1
0.1
0.1
74
BIOESTADISTICA
y el 5% tiene 3
75
BIOESTADISTICA
76
BIOESTADISTICA
77
BIOESTADISTICA
tiene 95% de exactitud tanto para los que tienen como para los que no
tienen cncer. Si el 2% de la poblacin tiene cncer, Cul es el valor
predictivo positivo y cul el valor predictivo negativo? Interprete.
27. Una empresa de servicios que elabora proyectos de Plan Maestro para
infraestructura de agua y desage de pueblos y ciudades, garantiza que el
90% de los proyectos que prepara son aceptados por las entidades que dan
la buena pro. Suponga que una institucin le encarga 5 proyectos.
a) Cul es la probabilidad de que ninguno de los proyectos sea
aprobado?
b) Cul es la probabilidad de que al menos dos de los proyectos sean
aprobados?
28. Siete equipos participan en un campeonato. Se otorgar trofeo a los
equipos que ocupen las 3 primeras posiciones. Una empresa de loteras
promueve un juego para los que acierte con los pronsticos y premiar a los
que hayan acertado con al menos 1 de las posiciones ganadoras. Si un
pronstico recibiera premio cul es la probabilidad de que hubiere acertado
con los equipos en slo dos de las posiciones?
29. Sean P(A) = 0.30,
ii.
78
BIOESTADISTICA
79
BIOESTADISTICA
X : R
w X (w) = x
En trminos aplicados la v.a. asigna a cada resultado del experimento un
nmero segn una caracterstica numrica de los eventos.
Ejemplo 3.1.
Sea el experimento de lanzar 3 monedas, entonces el espacio muestral de este
experimento es:
={ccc, ccs, csc, css, scc, scs, ssc, sss}
donde
c: cara
s: sello
X(ccc) = 3
X(ccs) = 2
X(csc) = 2
X(css) = 1
X(scc) = 2
X(scs) = 1
X(ssc) = 1
X(sss) = 0
Luego el rango de X es
RX = {0, 1, 2, 3}
x: 0, 1, 2, 3
80
BIOESTADISTICA
81
BIOESTADISTICA
f(x) = P[X = x] = P( A = { wi / X ( wi ) = x} )
La funcin f para que sea funcin de cuanta debe cumplir con las siguientes
restricciones:
1) f(x) 0 x R
2)
f ( x ) = f ( x ) =1
x R x
Ejemplo 3.2.
Hallaremos la distribucin de probabilidad de la v.a. X, nmero de caras
observadas al lanzar 3 monedas.
1) Forma tabular
x
0
1
2
3
Suma
f(x)
1/8
3/8
3/8
1/8
1
2) Forma de funcin
1 / 8 , si x = 0, 3
f ( x ) = 3 / 8, si x = 1, 2
0 para otro valor x
82
BIOESTADISTICA
3) Forma grfica
f(x)
3/8
1/8
0
Para asignar probabilidades a las v.a. continuas se parte del estudio emprico
de grandes muestras y de aproximar la curva del polgono de frecuencias con
una funcin matemtica a la que denominamos funcin de de densidad de
probabilidad.
En el siguiente grfico se muestra el histograma y polgono de frecuencias de
la edad de mujeres trabajadoras en el sector textil, el cual se buscar de
aproximar con un modelo matemtico.
83
BIOESTADISTICA
Grfico 12
N de mujeres
12
10
8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (aos)
2)
f ( x )x =1
P(a X b) =
f ( x ) x
a
Ejemplo 3.3.
Sea X la v.a. que mide la vida en horas de cierto tipo de lmpara de radio que
tiene funcin de densidad
84
BIOESTADISTICA
100
si x > 100
f ( x) = x2
0
si x 100
Cul es la probabilidad de que una lmpara de radio de este tipo pueda durar
mximo 150 horas?
150
150
150
100
100
100
100 100
=
+
= 1/ 3
P(X 150) = 2 x = 2 x =
x 100
150 100
x
100 x
Que representa el rea bajo la curva de densidad en el intervalo de 100 a 150
f(x)
1/3
100 150
85
BIOESTADISTICA
f ( x)
x x0
f ( x ) x
F(x0 ) = P(X x0 ) =
Ejemplo 3.4.
a) Para la v.a. X: Nmero de caras observadas al lanzar 3 monedas
F(2) = P(X 2) = P(X = 0) + P(X = 1) + P(X = 2) = 1/8 + 3/8 + 3/8 = 7/8
b) Para la v.a. X: vida en horas de las lmparas de radio de cierto tipo
F(150) = P(X 150) = 1/3
300
300
300
100
100
100
100 100
=
+
= 2/3
F(300) = P(X 300) = 2 x = 2 x =
x
x
x
300
100
100
100
F ( x )
= f ( x)
x
4. Si X es v.a. continua
P(a X b) = P(a < X b) = P(a X < b) = P(a < X < b) = F(b) F(a)
5. Si X es v.a. discreta
P(a X b) = P(a < X b) + P(X = a) = F(b) F(a) + f(a)
86
BIOESTADISTICA
1) Si X es v.a. discreta
= E(X ) =
x f (x)
x R x
2) Si X es v.a. continua
= E(X )=
x f ( x ) x
= E( X ) =
x =3
x f ( x)
x =0
87
BIOESTADISTICA
1
100
= E ( X ) = x 2 x = 100 x = ln x ]100
=
x
x
100
100
Es decir la media o valor esperado de la vida de las lmparas de radio de este
tipo no est determinada, no existe, puesto que la integral no es convergente.
= V ( X ) = E [( X ) 2 ] =
(x )
f (x)
x R x
Simplificando la expresin
2 = E(X 2 ) 2 =
f ( x) 2
x R x
2) Si X es v.a. continua
= V ( X ) = E[( X ) ] =
2
( x )
f ( x) x
Simplificando la expresin
= E( X ) =
2
f ( x ) x 2
88
BIOESTADISTICA
Ejemplo 3.6.
a) Para la v.a. X: Nmero de caras observadas al lanzar 3 monedas
= 1.5
Obtenemos su varianza
2 = E( X 2 ) 2 =
f ( x) 2
x R x
2 = 0.87
1)
E (Y ) = E[G ( X )] =
G( x ) f ( x )
Si X es v.a. discreta.
2)
E (Y ) = E[G ( X )] =
G ( x ) f ( x ) x
Si X es v.a. continua.
V(X) = 2 , luego
E[G(x)] = c;
V[G(x)] = 0
V[G(x)] = b2 V(x)
89
BIOESTADISTICA
Prctica domiciliaria 4
1. Sea
x = 0, 1, 2, .......
F(x) =
0 , s x < 1/8
0.2 , s 1/8 < x < 1/4
0.9 , s 1/4 < x < 3/8
1 , s
x > 3/8
90
BIOESTADISTICA
x2 e-x/2
16
; si x > 0
91
BIOESTADISTICA
92
BIOESTADISTICA
f(x) = e-x/2 ;
si x > 0
93
BIOESTADISTICA
P(D=d) = k 2d ,
para d= 1,2,3,4
d!
a) Determinar el valor de k .
b) Calcular la demanda esperada.
c) Suponga que el costo de un artculo es de $3 y se vende por $5, y
94
BIOESTADISTICA
P(xito) = P
y P(fracaso) = 1-P = Q
x : 0, 1
1 P si x = 0
f ( x) =
si x = 1
P
La funcin de cuanta:
Luego E(X) = P
V(X) = P(1-P)
95
BIOESTADISTICA
P(xito) = P ;
P(fracaso) = 1 P = Q
n
f ( x) = P( X = x ) = P x (1 P)nx si x : 0, 1, 2, ..., n
x
= E( X ) = nP
2 =V( X ) = nP(1 P)
Ejemplo 3.7.
Un examen de opcin mltiple contiene 25 preguntas, cada una con 5
alternativas de respuestas. Suponga que un estudiante slo adivina las
respuestas.
a) Cul es la probabilidad de que el estudiante conteste de manera
correcta ms de 10 preguntas?
96
BIOESTADISTICA
P(RI) = 0.80
25
f ( x ) = 0.20 x 0.80 25 x
x
si x : 0, 1, 2, ..., 25
Aplicando el modelo
a) P ( X > 10) = P ( X 11) =
25
25
11
x 0.20
0.80 25 x = 0.0056
P(aprobar) = 0.0056
97
BIOESTADISTICA
rindan
Ejercicio
Supngase que se sabe que la probabilidad de recuperacin de cierta
enfermedad es de 0,40. Si 15 personas contraen la enfermedad (considrese
esto como una muestra aleatoria), cul es la probabilidad de que
a) Tres o ms se recuperen?
b) Cuatro o ms se recuperen?
c) Cinco o ms se recuperen?
d) Menos de tres se recuperen?
98
BIOESTADISTICA
Poblacin
N
Ac
N T
P=T
N
Proporcin de elementos
A en la poblacin
Muestra
n
A
Ac
n-x
p=x
n
Proporcin de elementos
A en la muestra
x: 0, 1, 2, ., n
si y slo si n T
y n N -T
99
BIOESTADISTICA
T N T
x
n
x
x : 0, 1, 2, ..., n si n T y n N T
f ( x) =
N
Media y Varianza
= E( X ) = n
T
= nP;
N
T
N
2 = n
N T N n
= nP (1 P )
N N 1
N n
N 1
Ejemplo 3.8
Mecanismos de direccin defectuosos han sido montados por error en 3 de un
grupo de 9 misiles. No se sabe que misiles tienen los mecanismos defectuosos.
Si se toma una muestra al azar de 4 misiles cul es la probabilidad de que:
a) La muestra no contenga misiles defectuosos?
b) La muestra contenga 2 misiles defectuosos?
a)
3 6
0 3
P ( X = 0) = = 0.238
9
3
b)
3 6
2 1
P ( X = 2) = = 0.214
9
3
100
BIOESTADISTICA
Ejercicio
Ciertos componentes para ensamble se envan en lotes de 25 unidades, para
la aceptacin de un lote se seleccionan 3 componentes al azar y si ninguno de
ellos tiene defectos se acepta el lote. Cul es la probabilidad de que se acepte
el lote si contiene:
a) cinco defectuosos?
b) Dos defectuosos?
T N T
x
n
x
= n P x (1 P )n x
lim
x
; haciendo P = T/N
n
N
n
P ( X = x ) P x (1 P ) n x ;
x
N n
= nP ; 2 = nP (1 P )
nP (1 P )
N 1
n
Para N tal que
0 . 10 decimos que N es grande
N
101
BIOESTADISTICA
Ejemplo 3.9
De un lote de 200 unidades de las cuales 10 son defectuosas se obtiene una
muestra aleatoria de tamao 4. Halle la probabilidad de que esta contenga un
artculo defectuoso.
4
Luego P ( X = 1) = 0.05 (0.95) 3 =0.1715
1
Si calculamos la probabilidad exacta con el modelo hipergeomtrico
10 190
1 3
P ( X = 1) =
= 0.1739
200
4
El error de aproximacin es de 2,4 milsimas
102
BIOESTADISTICA
f ( x) = P( X = x) = e
x
x!
= ; 2 =
103
BIOESTADISTICA
P ( X = 0) = e 0.8
0,8 0
= 0,449
0!
Ejercicio
Si el nmero promedio de accidentes graves por ao en una fbrica grande es
de cinco, encuentre la probabilidad de que en el ao en curso:
a) Haya exactamente siete accidentes.
b) Ocurran diez o ms accidentes.
c) No haya accidentes.
d) Haya menos de cinco accidentes
p 0,05
104
BIOESTADISTICA
P( X = x )
Binomial (n,p)
P( X = x )
Poisson ( = np)
Es decir :
x
n x
n x
lim P (1 P )
= e
x!
x
, haciendo
= nP
Ejemplo 3.11.
El 3% de las personas que reciben un tratamiento para cierta enfermedad no
se recuperan. Si 180 pacientes con sta
105
BIOESTADISTICA
Ejercicio
Una compaa de seguros halla que el 0.005% de la poblacin falleca cada
ao debido a cierto tipo de accidente, cul es la probabilidad de que tenga
que pagar a ms de 3 de 10 000 asegurados contra tales accidentes en un
ao?
e x ; si x > 0
f ( x) =
;
0
para
otro
valor
x
con > 0
Media y Varianza:
= ; 2 = 2 ; =
106
BIOESTADISTICA
Ejemplo 3.14.
Sea la v.a.
X: n de llamadas que recibe una central telefnica en una hora,
Con = 20 llamadas/hora
Es decir esperamos que en cada hora la central telefnica reciba alrededor de
20 llamadas.
Luego la variable
T: El tiempo transcurrido entre 2 llamadas consecutiva
tiene distribucin exponencial con = 20
20 e 20 t ; si t > 0
f (t ) =
; t en horas
0 para otro valor t
1
60 min
de hora =
= 3 min
20
20
20 e
20 t
dt = e 20 (1 / 12 ) = 0.189
1 / 12
107
BIOESTADISTICA
f ( x) =
1 x
; < x <
X es N(, 2)
Caractersticas
1. La distribucin es simtrica respecto a su media
-k
+k
Mo
Me
108
BIOESTADISTICA
68%
x
-
95%
X
- 2
+ 2
99.7%
X
- 3
+ 3
109
BIOESTADISTICA
Propiedades
1. Si X es N(x, x2), entonces
Y = a + b X es normal
Con
y = a + b x
2y = b2 x
2. Si X1, X2, ...Xn son n variables independientes cada una con distribucin
normal N(i, i2), entonces
Y = a1 X1 + a2 X2 + ...... + an Xn
Con
es normal
y = a1 1 + a2 2 + ..... + an n
2y = a12 12 + a22 22 + .... + an2 n2
Z=
Z = 0
2Z = 1
Simbolizamos Z es N(0,1)
110
BIOESTADISTICA
P( Z z )
Z
z
6.7%
Z
-1.5
99.3%
Z
2.45
3) P(-1.5 < Z < 2.45) = P(Z < 2.45)- P(Z < -1.5)
92.6%
Z
-1.5
Mg. Beatriz Castaeda S.
2.45
111
BIOESTADISTICA
6.7%
6.7%
Z
1.5
-1.5
Ejemplo 3.15
0.273
X
2,1
2,45
Z = 0.58
3,55
Z= 2.42
112
BIOESTADISTICA
Y = X 1 + X2 + X3 + X 4 + X 5
Donde Xi es el tiempo para lo comprensin de la pregunta i, el cual es
independiente del tiempo utilizado para la comprensin de las otras
preguntas.
Por propiedad del modelo normal, entonces
Y es normal con y = 2,1 x 5 = 10,5 min utos y y = 5 x (0.6) 2 = 1.34 min utos
99.96%
5
Z = -4.10
10,5
15
Z = 3.36
Luego
P( 5 < Y < 15 ) 1
113
BIOESTADISTICA
80%
10%
10%
X0.10
Z0.10 = -1.28
Z 0.10 =
X 0.10 10.5
= 1.28
1.34
Z 0.90 =
X 0.90 10.5
= 1.28
1.34
10.5
X0.90
Z0.90 = 1.28
114
BIOESTADISTICA
.375
.50
.25
0
n=2
.25
.25
.125
np = 1
n =3
.125
.063
np = 3/2
.25
.063
n=4
np = 2
x
0
Luego si
np > 5
np
y
115
BIOESTADISTICA
P( X xo )
Normal
factor de correccin
de continuidad
P[ X < xo + 0,5]
Binomial
P( X xo )
Binomial
Normal
P[ X > xo - 0,5]
Normal
P( x1 X x2 )
Binomial
Normal
Ejemplo 3.16.
Segn los archivos el 15% de los trabajadores de las plantas de cemento son
afectados por el slice, desarrollando neumoconiosis.
a) Si un organismo estatal selecciona, al azar, 16 trabajadores de una
planta de cemento para evaluar su estado de salud, cul es la
probabilidad de que a lo ms el 25% de los trabajadores, de la muestra,
haya desarrollado neumoconiosis? La planta tiene 500 trabajadores.
116
BIOESTADISTICA
Sea
n = 16 N = 500
Se desea calcular
P(A lo ms el 25% de la muestra haya desarrollado neumoconiosis)
= P(X 4) = 0.921
Esto es, se tiene 92% de probabilidad de que entre los 16 trabajadores
elegidos a lo ms 4 hayan desarrollado la enfermedad.
y = nP (1 P ) = 2.26
Se desea calcular
P(A lo ms el 25% de la muestra haya desarrollado neumoconiosis)
117
BIOESTADISTICA
= P ( X 10) P ( X 10.5) = P ( Z
10.5 6
) = P ( Z 1.99) = 0.9767
2.26
Ejercicio
En cierto pas en vas de desarrollo, el 30% de los nios est desnutrido. En
una muestra al azar de 80 nios de esta rea, cul es la probabilidad de que el
nmero de nios desnutridos sea
a) exactamente de 32?
b) menor de 20?
c) De 20 o ms?
d) Entre 15 y 20 inclusive?
PRACTICA DOMICILIARIA 5
1. El tiempo que transcurre entre llamadas a una empresa de artculos de
plomera tiene una distribucin exponencial con un tiempo promedio entre
llamadas de 15 minutos.
a) Cul es la probabilidad de que no haya llamadas en un lapso de 30
minutos?
b) Cul es la probabilidad de recibir al menos una llamada en un intervalo de
10 minutos?
c) Cul es la probabilidad de recibir la primera llamada entre 5 y 10 minutos
despus de haber abierto la empresa?
118
BIOESTADISTICA
119
BIOESTADISTICA
120
BIOESTADISTICA
121
BIOESTADISTICA
magntica ocurre a una tasa un defecto por cada 105 bits. Un sector de
datos est formado por 4096 bytes (un byte = 8 bits).
a) Cul es la probabilidad de que el sector tenga ms de un error?
b) Cul es la probabilidad de que de 8 sectores utilizados, mximo 2 sectores
tengan exactamente un error?
13. Los mensajes a una computadora utilizada como servidor lo hacen con una
tasa promedio de 10 mensajes por hora.
a) Determine el intervalo de tiempo necesario para que la probabilidad de
que no llegue ningn mensaje durante ese lapso de tiempo sea 0,90.
b) Cul es la probabilidad de que se reciba un mnimo de 15 mensajes
durante 2 horas consecutivas de trabajo?
14. El nmero de fallas de un instrumento de prueba, debido a las partculas
contaminantes de un producto, ocurre en promedio a 0.25 fallas por hora.
a) Cul es la probabilidad de que el instrumento no falle en una jornada
de 8 horas?
b) Calcule la probabilidad de que en 5 das de trabajo (jornada de 8 horas)
ocurran fallas mximo en 2 de estos das.
15. El tiempo de incapacidad por enfermedad de los empleados de una
compaa en un mes tiene una distribucin normal. Si el 40% ha tenido a lo
ms 95 horas y slo el 5% ha tenido tiempo de incapacidad mayor a 133
horas al mes.
122
BIOESTADISTICA
= 18 galones.
a) Qu porcentaje de viviendas tiene consumo mnimo de 100 galones
diarios?
b) Obtener la cantidad de agua que se consume como mximo en el 95% de
las viviendas.
17. Un fabricante de productos electrnicos espera que el 2% de las unidades
fallen durante el periodo de garanta.
a) Se hace un seguimiento de 18 unidades para determinar su desempeo
durante el tiempo de garanta Cul es la probabilidad de que a lo ms
una de las unidades falle durante el periodo de garanta?
b) Si se hace un seguimiento a 300 unidades, cul sera el nmero
mximo de unidades que fallara en el periodo de garanta con
probabilidad de 99%?
18. Un modelo de cierta marca de lavadora automtica se promociona
indicando que su duracin promedio es de 4,5 aos y que el 98% dura
hasta 7 aos sin descomposturas. Asumiendo distribucin normal
a) Cul es la desviacin estndar de la duracin?
b) Si la garanta cubre el reemplazo de la
adquirida,
qu
proporcin
del
total
unidades
vendidas
ser
reemplazada?
123
BIOESTADISTICA
124
BIOESTADISTICA
125
BIOESTADISTICA
II.
126
BIOESTADISTICA
127
BIOESTADISTICA
Y = a1 X1 + a2 X2 + ...... + an Xn
Con
es normal
y = a1 1 + a2 2 + ..... + an n
2y = a12 12 + a22 22 + .... + an2 n2
128
BIOESTADISTICA
X = xi
tiene distribucin que se aproxima al modelo normal conforme n crece
2x = V(xi)
x = E(xi)
Luego
Z=
X x
N (0,1) conforme n
3. Distribucin Ji-Cuadrado
f ( x) =
1
x ( k / 2 ) 1 e x / 2 ,
k/2
2 ( k / 2)
= E( X ) = K ;
para x > 0
2 =V ( X ) = 2 K
X2(K)
El parmetro K es denominado grados de libertad, y decimos que X es Jicuadrada con k grados de libertad ( X es
2
(k) )
129
BIOESTADISTICA
Propiedades
a) Si Z es normal N(0, 1) , entonces
Z2
es 2(1)
X
Z =
es (21)
c) Si Y1, Y2, ., Yk
X = Y +Y + .... +Y
2
1
2
2
2
n
es
2
(r )
donde r = k i
1
d) Si X1, X2, ., Xk
x
Y = i
1
k
es (k2 )
Uso de tablas
Sea la v.a. Ji-Cuadrado con k = 12 , entonces
P(2(12) 14) = 0.70
0.70
0
14
X2(12)
130
BIOESTADISTICA
0.90
0
X2(12)
18.5
4. Distribucin t-Student
f ( x) =
[( k + 1) / 2]
k ( k / 2) [( x 2 / k ) + 1]( k +1) / 2
= E( X ) = 0 ;
2 =V ( X ) =
k
k2
para k > 2
X
-t
+t
El parmetro K es denominado grados de libertad, y decimos que X es tStudent con k grados de libertad y denotamos:
X es t(k)
Propiedad
Si Z es normal N(0, 1) y Y es Ji-cuadrada con k grados de libertad, y si Z y Y
son variables independientes, entonces la variable
T=
Z
es t(k )
Y
k
131
BIOESTADISTICA
Uso de tablas
Sea la v.a. t-Student con k = 12 , entonces
P(t(12) 1.782) = 0.90
0.90
t(12)
1.782
0.98
0.01
0.01
-2.681
2.681
T(12)
5. Distribucin F
u/ 2
u + v u
x ( u / 2 )1
2 v
f ( x) =
,
( u+ v ) / 2
( u / 2) (v / 2) [( u / v ) x + 1]
= E( X ) =
v
;
v2
2 =
2v 2 ( u + v 2)
,
u(v 2)2 (v 4)
para v > 4
F(u,v)
132
BIOESTADISTICA
Propiedad
Sean W y Y variables aleatorias Ji-Cuadrada con grados de libertad, u y v,
respectivamente, entonces el cociente
F=
W /u
es F( u ,v )
Y /v
Uso de tablas
Sea la
0.25
0.415
F(3,5)
133
BIOESTADISTICA
N
K = para muestreo sin reposicin
n
El objetivo de elegir muestras es para estudiar en ella las caractersticas de
inters y luego sus resultados proyectarlos a la poblacin de la cual ha sido
extrada la muestra, proceso al cual se denomina inferencia estadstica. En
este sentido es necesario conocer como se relaciona la muestra con la
poblacin, por lo que estudiaremos las distribuciones del muestreo.
134
BIOESTADISTICA
Variable cuantitativa
x=
Media muestral
(x
=
x)2
n1
Varianza muestral
Variable es categrica
La poblacin se clasifica en 2 grupos de elementos para la caracterstica
analizada y cada elemento en la muestra es A o n o A segn la caracterstica
bajo observacin as definimos.
p=
x
proporcin de elementos A en la muestra
n
Definiciones:
1) Sea X una poblacin con distribucin f(x), media = , varianza = 2,
entonces si al elegir una muestra aleatoria se define la variable
135
BIOESTADISTICA
V(Xi) = V(X) = 2
Poblacin:
x1 = 2 aos x2 = 4 aos x3 = 6 aos
x4 = 8 aos x5 = 10 aos
Entonces:
= 6 aos
Media de la poblacin
2 = 8 aos2
Varianza poblacional
= 2,83 aos
136
BIOESTADISTICA
Media
muestral
Elementos
Muestra
Elementos
Media
muestral
(x1 , x1)=(2,2)
14
(x3 , x4)=(6,8)
2
3
4
5
6
7
8
9
10
11
12
13
(x1 , x2)=(2,4)
3
4
5
6
3
4
5
6
7
4
5
6
15
16
17
18
19
20
21
22
23
24
25
(x3 , x5)=(6,10)
8
5
6
7
8
9
6
7
8
9
10
(x1 , x3)=(2,6)
(x1 , x4)=(2,8)
(x1 ,x5)=(2,10)
(x2 , x1)=(4,2)
(x2 , x2)=(4,4)
(x2 , x3)=(4,6)
(x2 , x4)=(4,8)
(x2 , x5)=(4,10)
(x3 , x1)=(6,2)
(x3 , x2)=(6,4)
(x3 , x3)=(6,6)
(x4 , x1)=(8,2)
(x4 , x2)=(8,4)
(x4 , x3)=(8,6)
(x4 , x4)=(8,8)
(x4 , x5)=(8,10)
(x5 , x1)=(10,2)
(x5 , x2)=(10,4)
(x5 , x3)=(10,6)
(x5 , x4)=(10,8)
(x5 , x5)=(10,10)
x = 6
x2 = 4
x = 2
Podemos apreciar resultados que no son casuales sino que siguen una
estructura esperada
x = 6=
Las muestras tienen media alrededor de la media de la poblacin
=4=
2
x
2
n
8
2
137
BIOESTADISTICA
Muestra
Elementos
Media
muestral
(x1, x2)=(2,4)
(x1, x3)=(2,6)
(x1, x4)=(2,8)
(x1, x5)=(2,10)
(x2, x3)=(4,6)
(x2, x4)=(4,8)
(x2, x5)=(4,10)
(x3, x4)=(6,8)
(x3, x5)=(6,10)
10
(x4, x5)=(8,10)
Elaboracin propia
x = 6
x2 = 3
x = 1.73
x = 6=
Las muestras tienen media alrededor de la media de la poblacin
=4=
2
x
2 N n
8 52
n N 1 2 4
138
BIOESTADISTICA
Grfico 14
Nmero de nios
10
Edad (aos)
Grfico 15
Nmero de muestras
10
Media muestral
Grfico 16
Nmero de muestras
Media muestral
139
BIOESTADISTICA
Media
x =
Varianza =
2
x
2
n
Media
x =
Varianza
2
x
2 N n
n N 1
95%
1.96 x
+ 1.96 x
140
BIOESTADISTICA
Ejemplo 4.1
1) Se ha encontrado que despus de un periodo de entrenamiento, el tiempo
medio que requieren ciertas personas impedidas para realizar una tarea
particular es de 25 segundos con una desviacin estndar de 5 segundos.
Suponiendo distribucin normal para los tiempos, encuentre la probabilidad
de que una muestra de 25 personas proporcione una media:
a) De 26 segundos o ms
b) Entre 24 y 27 segundos
c) Mayor de 22 segundos.
= 1 seg
0.1587
x
25
26
Z=1
141
BIOESTADISTICA
0.81859
x
24
25
Z = -1
27
Z=2
0.99865
22
Z=-3
Ejercicios
1) Si las concentraciones de cido rico en hombres adultos y normales estn
distribuidas en forma casi normal con una media y una desviacin estndar
de 5.7 y 1 mg por ciento, respectivamente, encuentre la probabilidad de que
una muestra de tamao 9 proporcione una media:
a) Mayor de 6
b) Entre 5 y 6
c) Menor de 5.2
142
BIOESTADISTICA
(x
=
x)2
n1
E(S2) =
( n 1) S 2
es 2(n-1)
E(X2) = n -1
V(X2) = 2(n-1)
X2
0
Mg. Beatriz Castaeda S.
n-1
143
BIOESTADISTICA
Ejemplo 4.2
Para el ejemplo 4.1, previo, calcular la probabilidad de que la desviacin
estndar de la muestra sea mayor de 6 segundos
y = 5 seg
X =
As
( n 1) S 2
es 2(24)
P(S > 6) = P(
( n 1) S 2
>
( 24) 6 2
) = P (2(24) > 34.56) = 0.079
2
5
0.10
p
0.05
(224 )
Interpolando obtenemos:
X . P
33.2 .. . 0.10
34.56 p
36.4 ... 0.05
entonces
D . d
-3.20 .. 0.05
-1.84. p 0.05
144
BIOESTADISTICA
Poblacin
N
Ac
P=T
N
N T
Muestra
n
Ac
p=x
n
n-x
E(X) = nP
V(X) = nP(1-P)
E(X) = nP y
145
BIOESTADISTICA
p = P
2 =
P (1 P ) N n
n
N 1
Cuando para una muestra dada la poblacin es relativamente grande, esto es,
la fraccin de muestreo no pasa de la dcima parte de la poblacin
n
0.10 , decimos que la poblacin es grande o infinita y aproximamos a 1 el
N
factor de poblacin finita,
N n
1
N 1
2p =
P (1 P )
n
146
BIOESTADISTICA
P
Para poblaciones finitas p es normal con
p = P
2 =
P (1 P ) N n
n
N 1
p = P
2 =
P (1 P )
n
Ejemplo 4.3
1. Si en una poblacin de adultos el 15% estn sometidos a algn tipo de
dieta. Cul es la probabilidad de que en una muestra al azar de tamao
100, la proporcin de los que se encuentran sometidos a una dieta sea:
a) Mayor o igual a 0.20
b) Entre 0.10 y 0.20
c) No mayor de 0.12
147
BIOESTADISTICA
Solucin:
n= 100 muestra grande, aproximamos a la normal con
p = 0. 15;
p = 0.0357
Solucin:
n= 150 muestra grande, aproximamos a la normal con
p = 0. 20;
p = 0.033
Ejercicio.
El 60% de los empleados de una gran empresa faltaron a su trabajo debido a
enfermedad 3 o ms das en el ltimo ao. Si se extrae una muestra de 120 de
dichos empleados, cul es la probabilidad de que la proporcin de empleados
en la muestra que faltaron a su trabajo 3 o ms das debido a enfermedad est
entre 0.50 y 0.65?
148
BIOESTADISTICA
PRACTICA DOMICILIARIA 6
149
BIOESTADISTICA
Se desechen a lo ms 2 latas?
150
BIOESTADISTICA
obtenido ms de 200
151
BIOESTADISTICA
o ms estn
152
BIOESTADISTICA
153
BIOESTADISTICA
CAPITULO 5. ESTIMACIN
Proceso mediante el cual usando datos de una muestra se obtienen medidas
aproximadas de los parmetros poblacionales.
Estimacin puntual
Consiste en proporcionar un nico valor como aproximacin del parmetro.
Estimacin intervlica
Consiste en proporcionar un intervalo para el cual se tiene una probabilidad,
llamada confianza, de que el valor del parmetro est incluido en l.
Parmetro
Estimador
n
Media poblacional:
= x =
n
n
Varianza poblacional : 2
2 = S 2 =
Proporcin poblacional; P
P = p
(x
x)2
n1
154
BIOESTADISTICA
1 2 = x 1 x 2
Diferencia de medias: 1- 2
P1 P2 = p1 p2
Diferencia de proporciones: P1 - P2
5.2. Estimacin intervlica
Para una estimacin intervlica, usamos los datos de la muestra para obtener
los lmites del intervalo de manera que tengamos una probabilidad (1-) de
que el intervalo contiene al parmetro poblacional, as por ejemplo
Sabemos que la media muestral toma valores alrededor de la media
poblacional.
95%
1.96 x
+ 1.96 x
L = x 1 . 96
95%
1.96 x
x 1.96 x
x
x + 1.96 x
x + 1.96 x
155
BIOESTADISTICA
156
BIOESTADISTICA
L = x Z 1 / 2
L = x Z 1 / 2
S
n
L = x t 1 / 2
S
n
157
BIOESTADISTICA
n =49 personas
x = 90 latidos / minuto
y S = 10 latidos / minuto
L = x Z 1 / 2
S
n
1 - = 0.90 ,
Z0.95 = 1.645
Luego
Li = 90 1.645
10
= 87.65
49
y Ls = 90 + 1.645
10
= 92.35
49
Ejemplo 5.2.
Una muestra de 16 nias de 10 aos de edad proporcion un peso medio de
35,8 kg. y una desviacin estndar de 6 kg. Suponiendo que la distribucin de
los pesos es normal, encuentre un intervalo de confianza 90% para estimar el
peso medio de las nias de 10 aos.
n = 16 nias de 10 aos ;
x = 35,8 kg ;
S = 6 kg
158
BIOESTADISTICA
L = x t 1 / 2
S
n
1 - = 0.90 ,
Li = 35.8 1.753
6
= 33.17
16
y Ls = 35.8 + 1.753
6
= 38.42
16
1-
x +E
_
E
Grfico 17. Error de muestreo y cota superior
Entonces a
E = Z1 / 2
159
BIOESTADISTICA
error
mximo E, es:
Z 12 / 2 2
n=
, Si la poblacin es grande o infinita
E2
Z 12 / 2 2
E2
n=
Z 12 / 2 2
1 +
N E2
n0
=
;
n0
1+
N
E = Z 1 / 2
N n
n N 1
2
Z 12 / 2 2
n0 =
E2
Ejemplo 5.3.
El administrador de un hospital desea estimar el peso de los bebs nacidos en
su hospital, cun grande debe tomarse una muestra de los registros de
nacimientos si el administrador desea que el error mximo sea de 100 gr. con
una confianza de 99%?. La desviacin estndar de los pesos se ha estimado
en 200 gr.
Como deseamos determinar tamao de muestra (n)
Z 12 / 2 2
n=
E2
Error :
E = 100 gr
160
BIOESTADISTICA
Confianza :
Luego
1 - = 0.99
n=
Z0.995 = 2.575
2.575 ( 200) 2
100 2
= 26.52 27
Ejemplo 5.4.
El mantenimiento de cuentas de crdito puede resultar demasiado costoso si el
promedio de compra por cuenta baja de cierto nivel. El gerente de un almacn,
con 500 cuentas de crdito, desea estimar el promedio de la cantidad
comprada por mes por sus clientes y acepta un error de no ms de $ 2,50 al
95% de confianza. cuntas cuentas debe seleccionar del archivo de la
compaa, s la desviacin estndar de las compras se estima en $15
Z12 / 2 2
Primero calculamos n0 =
E2
Error :
E = $2.50
Confianza :
1 - = 0.95
Luego
1.96 2 15 2
n0 =
= 138.29 139
2.5 3
Z0.975 = 1.96
n=
139
= 109
1 + 139 / 500
161
BIOESTADISTICA
( n 1) S 2
es
2
(n-1)
/2
/2
1-
2 / 2
esto es
12 / 2
2(n-1)
( n 1) S 2
= 1
P / 2 <
<
/
2
2
( n 1) S
( n 1) S
= 1
P
< 2 <
2
2
1 / 2
/2
162
BIOESTADISTICA
Li =
( n 1) S
2
1 / 2
Ls =
( n 1) S
2 / 2
L = p Z 1 / 2
p(1 p )
n
p(1 p ) N n
n
N 1
Ejemplo 5.5.
Para una muestra de 200 pacientes, con enfermedades pulmonares, tratados
con cierto medicamento se obtuvo que el medicamento fue efectivo en 180 de
ellos. Construya un intervalo de 95% de confianza para estimar la efectividad
del medicamento.
Aqu deseamos estimar
p = 180/200 = 0.90
163
BIOESTADISTICA
1 - = 0.95,
Z0.975 = 1.96
0.90(0.10)
0.90(0.10)
= 0.858 y
Ls = 0.90 + 1.96
= 0.942
200
200
As concluimos que: con 95% de confianza se estima que el porcentaje de
Li = 0.90 1.96
Ejemplo 5.6.
Una muestra de tamao 400 seleccionada de entre los 2000 alumnos que
haban consultado el servicio de salud de una universidad el ao pasado indic
que 80 tenan enfermedad de naturaleza psicosomtica.
a) Obtenga una estimacin intervlica con 95% de confianza para el
porcentaje de alumnos que tenan enfermedad psicosomtica.
b) Proporcione una estimacin, con 95% de confianza, para el nmero de
alumnos que consultaron el servicio de salud y tenan enfermedad
psicosomtica.
De la muestra:
n = 400
p = 80/400 = 0.20
Luego
L = p Z1 / 2
Si (1-) = 0.95 ,
p(1 p ) N n
n
N 1
Z0.975 = 1.96
164
BIOESTADISTICA
Li = 0.20 1.96
= 0.165
400 1999
Ls = 0.20 1.96
= 0.235
400 1999
P = T/N
T = NP
T = N P = Np =
165
BIOESTADISTICA
1-
P-E
.
p
P
e
p
P+E
_
E
Grfico 18. Error de muestreo al estimar la proporcin poblacional
Entonces para poblaciones grandes o infinitas
E = Z 1 / 2
P (1 P
n
n=
Z 12 / 2 P (1 P )
E2
E = Z 1
/2
P (1 P ) N n
n
N 1
166
BIOESTADISTICA
Z 12 / 2 P (1 P )
2
n0
E
;
n=
=
n0
Z 12 / 2 P (1 P
1+
1 +
2
N
N E
Z 12 / 2 P (1 P )
n0 =
E2
Ejemplo 5.7.
El Director de un hospital desea saber que porcentaje de los pacientes dados
de
alta
estn
inconformes
con
los
cuidados
recibidos
durante
su
hospitalizacin.
a) Cun grande debe ser la muestra si se piensa que aproximadamente
el 25% de pacientes est inconforme y se desea tener una precisin del
5% al 95% de confianza?
b) Cun grande debe ser la muestra si se considera que el error mximo
deseado es de 0.05 para una confianza del 95% y no se dispone de
alguna otra informacin.
Z12 / 2 P (1 P )
n=
E2
E = 0.05
1- = 0.95
( Z0.975 = 1.96)
167
BIOESTADISTICA
1.96 2 (0.25)(0.75)
n=
= 288
0.05 2
b) Para la determinacin del tamao de muestra como no tenemos referencia
de P, consideremos que fijado E y la confianza (1-) la expresin para n es
una funcin cuadrtica de P y toma su valor mximo para P =0.50
As calculamos n asumiendo
P =0.50,
lo que proporcionar la muestra
ms grande que garantice una
precisin E con confianza 1-
P
0
0.50
n=
1.96 2 (0.50)(0.50)
= 384
0.05 2
L = ( x 1 x 2 ) Z1 / 2 x1 x 2
donde
x1 x 2
12
n1
22
n2
168
BIOESTADISTICA
L = ( x 1 x 2 ) Z 1 / 2 S x1 x 2
S x1 x 2 =
donde
s 12
s 22
+
n1 n 2
L = ( x 1 x 2 ) t1 / 2 S x1 x 2
donde
S x1 x 2 =
( n1 1) S12 + ( n2 1) S 22
n1 + n2 2
1
1
1
1
+
= Sc
+
n1 n2
n1 n2
Ejemplo 5.8.
En grupo de investigadores del cncer de mama reuni los siguientes datos en
cuanto al tamao de los tumores:
169
BIOESTADISTICA
Tipo de tumor
A
B
n
41
36
Construya un intervalo
(cm)
3.85
2.80
S(cm)
1.95
1.70
L = ( x 1 x 2 ) Z 1 / 2 S x1 x 2
Luego obtenemos
S x1 x 2 =
s12 s22
+
=
n1 n2
1.95 2 1.70 2
+
= 0.416
41
36
Li = 0.235 cm
Ls = 1.865 cm
Con 95% de confianza estimamos que la dimensin promedio del tumor tipo
A es mayor que la del tipo B entre 0.24 cm y 1.87 cm
Los tumores de mama tipo A en promedio tienen mayor tamao que los
tumores tipo B
Ejemplo 5.9.
Con el objeto de comparar dos programas de capacitacin de obreros en un
trabajo de precisin, se incluyeron 20 obreros en un experimento. De stos, se
tomaron 10 al azar y fueron entrenados con el mtodo 1, el resto fue
capacitado con el mtodo 2. Despus de completar sus respectivos cursos de
170
BIOESTADISTICA
Mtodo 1: 15
20
11
23
16
21
18
16
27
24
Mtodo 2: 23
31
13
19
23
17
28
26
25
28
Suponiendo
poblaciones con
distribucin normal y
varianzas
iguales,
n
10
10
x (min)
19.1
22.3
S (min)
4.8
5.9
Luego como las muestras son pequeas y las poblaciones son normales,
asumimos que las varianzas no difieren significativamente por lo que
obtenemos los lmites como:
L = ( x 1 x 2 ) t1 / 2 S x1 x 2
Primero calculamos
S x1 x 2 =
( n1 1) S 12 + ( n2 1) S 22
n1 + n2 2
1
1
9(4.8 2 ) + 9(5.9) 2
+
=
10 + 10 2
n1 n2
1
1
+
= 2.405
10 10
171
BIOESTADISTICA
Li = - 8.25
Ls = 1.85
Este resultado nos indica que al 95% de confianza no podemos concluir que los
obreros capacitados con el mtodo 1 sean en promedio ms veloces que los
capacitados con el mtodo, pues el intervalo incluye al 0, y por lo tanto no haya
diferencia entre las medias.
Ejercicio
Ocho personas obesas se pusieron a dieta durante un mes. Se observ
mediante anlisis clnicos la cantidad de triglicridos al comienzo y al final del
mes.
Persona
: A
295
287
305
Triglicrido final
251
249
259
: 263
270
323
277
299
233
267
242
265
hacerse?
(P1 - P2)
172
BIOESTADISTICA
L = ( p1 p2 ) Z 1 / 2 S p1 p 2
donde
S p 1 p 2 =
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
Ejemplo 5.10.
En un
secundarios de dos
De la muestras obtenemos:
S p 1 p 2 =
p1 = 11/50 = 0.22
p2 = 8/50 = 0.16
Li = 0.09
Ls = 0.21
173
BIOESTADISTICA
Con el medicamento
PRACTICA DOMICILIARIA 7
1. Una gran tienda desea estimar con una confianza de 98% y un error
mximo de 5 soles la verdadera media de las compras mensuales de sus
clientes de cuenta corriente. cul debera ser el tamao de muestra si se
sabe que la desviacin estndar es de 15 soles?
2. Cul es el tamao de muestra que se requiere para estimar la proporcin
de das en los que la contaminacin atmosfrica excede los 200
microorganismos por metro cbico, si se desea tener un error mximo de
6% con una confianza de 95%? No se tiene informacin previa de la
proporcin.
3. El mantenimiento de cuentas de crdito puede resultar demasiado costoso
s el promedio de compra por cuenta baja de cierto nivel. El gerente de un
almacn desea estimar el promedio de cantidad comprada por mes por sus
clientes que usan cuenta de crdito, con un error de no ms de $ 2,50 y una
confianza de 95%. cuntas cuentas se deben seleccionar del archivo de la
compaa si la desviacin estndar de las cuentas de crdito es de $ 7,50
4. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los
habitantes adultos de un pas estn a favor de cierto proyecto econmico
del Gobierno. Una muestra aleatoria de 625 adultos indica que 55% estn
174
BIOESTADISTICA
175
BIOESTADISTICA
b)
estudiantes.
11.Una muestra de tamao 400 seleccionada de los alumnos que haban
consultado el servicio de salud de una universidad durante el ao pasado
indic que 80 tenan enfermedad de naturaleza psicosomtica.
a) Con qu grado de confianza puede afirmarse que de 16 a 24 por ciento
de todos los alumnos que consultaron el servicio de salud el ao pasado
tenan una enfermedad psicosomtica?
b) Supngase que 2000 alumnos consultaron el servicio de salud el ao
pasado. Con la informacin de la muestra obtenga una estimacin
176
BIOESTADISTICA
177
BIOESTADISTICA
178
BIOESTADISTICA
CAPITULO 6.
PRUEBAS DE HIPTESIS
6.1.1. Definicin
Una prueba de hiptesis es un procedimiento estadstico con el cual, utilizando
la informacin que proporciona una o ms muestras aleatorias, tomamos la
decisin de rechazar o
179
BIOESTADISTICA
Ejemplo 6.1.
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es de 5%
H0: P = 0.05
H 0: P 1 = P 2
Ejemplo 6.2.
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es menor
del 5%
El nivel promedio de glicemia en pacientes
con diabetes tipo II del distrito de Catacaos
es mayor de 210 mg %
180
BIOESTADISTICA
H1: P1 > P2
Ejemplo 6.3
Se ha desarrollado un nuevo medicamento y deseamos probar que este es
ms eficaz que uno antiguo porque suponemos que el porcentaje de pacientes
curados es significativamente mayor con el medicamento nuevo que con el
antiguo.
Entonces:
H 0:
H 1:
El medicamento nuevo es ms
eficaz que el antiguo
181
BIOESTADISTICA
hiptesis.
descripcin alterna del estado del universo. Siempre existir una alternativa,
llamada hiptesis alterna o alternativa (H1), asociada con cualquier hiptesis
nula propuesta.
Las formas en las cuales se pueden presentar tanto las hiptesis nulas como
las alternativas son las siguientes:
182
BIOESTADISTICA
1. H0: = k
H 1: k
(alternativa bilateral)
2. H0: k
H 1: < k
(alternativa unilateral)
3. H0: k
H 1: > k
(alternativa unilateral)
2) Decisin
Al realizar el proceso de prueba de hiptesis y utilizar la informacin que
proporciona una muestra, sta nos puede indicar una de dos posibles
decisiones: rechazar o no rechazar la hiptesis nula (H0).
3) Estadstica de la prueba
Una vez formuladas las hiptesis se debe considerar la utilizacin de la
muestra para la comprobacin de stas, es decir, el uso de una medida de la
183
BIOESTADISTICA
Ejemplo 6.4
Se piensa que la vitamina C puede disminuir los niveles del colesterol srico, y
que esta disminucin en promedio es mayor de 50 mg. por 100 ml. Para
confirmar se evala una muestra de 40 personas (con niveles elevados de
colesterol) antes y despus de un tratamiento de un mes bajo un rgimen de
500 mg. diarios de vitamina C.
Entonces las hiptesis estadsticas son formuladas de la siguiente manera:
H0: 50
H1: > 50
Estas hiptesis son referidas al valor de la disminucin promedio (), por lo que
la medida de la muestra relacionada con estas hiptesis es la media muestral
( x ), ya que la media muestral se distribuye alrededor de la media poblacional,
segn el modelo normal.
De manera que si la hiptesis nula (H0) fuera cierta, esperaramos que la media
de la muestra, x , tome valor alrededor de 50 o menos; en cambio, si la
184
BIOESTADISTICA
H0
50
H1
> 50
Ejemplo 6.5
Siguiendo con el ejemplo anterior, tenemos que:
H0: 50
H1: > 50
185
BIOESTADISTICA
Z=
x 0
S
n
Z=
x 50
;
S
n
De manera que si la hiptesis nula (H0) fuera cierta, esperaramos que Z tome
un valor alrededor de 0 menor que 0; en cambio, si la hiptesis alterna (H1)
fuera la correcta, entonces esperaramos que Z tome valor alrededor de un
valor mayor que 0; grficamente tenemos:
Si x 50
Si x > 50
186
BIOESTADISTICA
Ejemplo 6.6
1. Prueba Z para la media
H0 : = 0
H0 : 0
Estadstica de la prueba:
Z=
x 0
S
n
H0 : 0
T =
Estadstica de la prueba:
x 0
S
n
H1 : P P 0
Estadstica de la prueba:
Z=
p P0
P0 (1 P0 )
n
187
BIOESTADISTICA
Ejemplo 6.7
Para probar las hiptesis
H0: 50
H1: > 50
Z =
x 50
S
n
Si x 50
Si x > 50
Regin de no Rechazo
188
BIOESTADISTICA
encontrada es pequea
5) Tipos de error
Al tomar una decisin sobre la base de la informacin que proporciona una
muestra, como desconocemos la situacin real de la poblacin, corremos el
riesgo de equivocarnos. As al no rechazar H0 cuando esta es verdadera no
cometemos error, en cambio si rechazamos H0 cuando es verdadera
189
BIOESTADISTICA
Poblacin
H0
Verdadera
H0
Falsa
H1
verdadera
La muestra indica
No rechazar H0
(no error)
Rechazar H0
(error tipo I)
No rechazar H0
(error tipo II)
Rechazar H0
(no error)
190
BIOESTADISTICA
Ejemplo 6.8
Continuando con el ejemplo anterior consideremos para la hiptesis alterna un
valor mayor que 50, por ejemplo 60, luego las hiptesis quedan especificadas
como:
191
BIOESTADISTICA
H0: = 50
H1: = 60
H0
1-
H1
1-
x
= 50
Regin de no rechazo
= 60
Regin crtica o de rechazo (R.C.)
192
BIOESTADISTICA
Ejemplo 6.9
Para las hiptesis formuladas anteriormente
H0: 50
H1: > 50
x = 58 ;
S = 16
193
BIOESTADISTICA
x 0
58 50
= P(Z 3.16) = 0.00079
P
16 / 40
S/ n
Grficamente tenemos:
p = 0.00079
Z
50
As
58
3.16
Este valor
p se interpreta
194
BIOESTADISTICA
Interpretacin
Conclusin
No rechazar H0
No hay evidencia suficiente
para rechazar.
Rechazar H0 a favor de H1
hay evidencia suficiente
para rechazar
Rechazar H0 a favor de H1
hay evidencia suficiente
para rechazar
Rechazar H0 a favor de H1
hay evidencia suficiente
para rechazar
195
BIOESTADISTICA
Resumen
En esta unidad Ud. ha recibido las bases para la realizacin de una prueba de
hiptesis estadstica, la cual ser una herramienta muy til para la
comprobacin de los supuestos planteados en las investigaciones en las que
Ud, participe. A continuacin se presenta un esquema resumido del
procedimiento a seguir para la realizacin de una prueba de hiptesis
los datos
196
BIOESTADISTICA
Ejercicio Aplicativo
RENDIMIENTO ESCOLAR Y DESARROLLO VISOMOTOR EN HIJOS DE
MADRES ADOLESCENTES
Silvestre N, Villena A. Gonzles G, Instituto de Investigaciones de la Altura.
Dpto. de Ciencias Fisiolgicas. Universidad Peruana Cayetano Heredia.
(Revista Mdica Herediana 7. Suplemento 1, 1996. pg 6)
El objetivo del presente estudio fue determinar el desarrollo visomotor y el
rendimiento escolar en hijos de madres adolescentes y compararlos con los
observados en hijos de madres adultas. La muestra estuvo constituida por 59
nios de 7-8 aos de edad, mestizos que residen en la ciudad, hijos de madres
adolescentes, y 73 nios de 7-8 aos de edad, hijos de madres adultas ( > 20
aos). El desarrollo visomotor fue evaluado utilizando la prueba de Bender. El
rendimiento escolar fue analizado en base al porcentaje de nios de cada
grupo que desaprob el ao escolar ( 10).
197
BIOESTADISTICA
4) Hiptesis estadsticas
198
BIOESTADISTICA
Uno
Dos
Variable
de inters
cuantitativa
Media :
Varianza: 2
Prueba Estadstica
Prueba Z
Prueba T
Prueba Ji-Cuadrado
Categrica
Proporcin: P
Prueba Z
cuantitativa
Categrica
K
(K 3)
Parmetro
Poblacional
cuantitativa
Elaboracin propia
199
BIOESTADISTICA
Variable
de inters
Hiptesis
Prueba Estadstica
Prueba de bondad de
Distribucin de la ajuste
Cuantitativa, poblacin tiene
Ordinal o
un modelo deter- Prueba Ji-Cuadrado *
categrica
minado
Prueba de Kolmogorov
Smirnov
Uno
Ordinal o
cuantitativa
Categrica
Dos
Ordinal o
cuantitativa
Categrica
Ordinal
cuantitativa
K
(K 3)
Categrica
de
Kruskal-
Prueba de Friedman*
Prueba de comparacin
de proporciones o de
homogeneidad
Prueba Ji-Cuadrado
Comparacin de
tratamientos
(Observaciones Prueba de Cochran *
relacionadas)
* Estas pruebas no son desarrolladas en este curso
Elaboracin propia
200
BIOESTADISTICA
independientes de una
poblacin
Requisitos:
1) La muestra es aleatoria
2) Muestra grande de cualquier poblacin o muestra de cualquier tamao si
la poblacin tiene distribucin normal.
3) Varianza poblacional 2 conocida.
Hiptesis:
a) H0: = 0
H1: 0
b) H0: 0
H1: > 0
c) H0: 0
H1: < 0
Estadstica de la prueba
Z=
x 0
/ n
Regla de decisin
a) Rechazar H0 al nivel , si
Z < -Z1-/2
Z > Z1-/2
201
BIOESTADISTICA
/2
/2
Z
-Z1-/2
R.C.
b) Rechazar H0 al nivel , si
Z1-/2
R.C.
Z > Z1-
Z
0
c) Rechazar H0 al nivel , si
Z1-
R.C.
Z < -Z1-
-Z1-
R.C.
Nota
Si la varianzas 2, es desconocida, entonces, slo cuando la muestra sea
grande (n 30 ), la estadstica Z se obtendr como
Z =
x 0
S/ n
202
BIOESTADISTICA
Ejemplo 6.10.
Se llev a cabo un estudio sobre nutricin en un pas en desarrollo. El objetivo
del estudio fue determinar si los habitantes de una regin rural tenan un
consumo diario mnimo de 2000 caloras, que cubriera sus requerimientos
bsicos para la supervivencia. Una muestra de 500 adultos campesinos report
un consumo medio diario de caloras de 2015 con una desviacin estndar de
210 caloras.
De acuerdo a los objetivos propuestos, planteamos hiptesis para el consumo
promedio diario de caloras en la regin:
H0: = 2000
50% 50%
= 2000
> 2000
203
BIOESTADISTICA
Z =
x
S /
2015 2000
210 / 500
= 1 . 598
la informacin de la muestra,
p = 0.0548
Z
1.598
Requisitos:
1) La muestra es aleatoria
2) Muestra pequea (n < 30) procedente de una poblacin normal.
3) Varianza poblacional 2 desconocida.
204
BIOESTADISTICA
Hiptesis:
a) H0: = 0
H1: 0
b) H0: 0
H1: > 0
c) H0: 0
H1: < 0
Estadstica de la prueba
T =
x 0
S/ n
Regla de decisin
a) Rechazar H0 al nivel , si
T < -t1-/2
T > t1-/2
/2
/2
T
-t1-/2
R.C.
b) Rechazar H0 al nivel , si
t1-/2
R.C.
T > t1-
T
0
t1-
R.C.
205
BIOESTADISTICA
c) Rechazar H0 al nivel , si
t < -t1-
-t1-
R.C.
Ejemplo 6.11.
Un laboratorio farmacutico conduce una investigacin relativa a la eficacia de
una vacuna contra el sarampin. La variable considerada es los ttulos de
anticuerpos en suero producidos por la vacuna.
La vacuna producida por otro laboratorio reporta un ttulo promedio
de
anticuerpos de 1.9.
Para probar si la nueva vacuna es ms eficaz que la vacuna antigua, se aplic
la vacuna a 16 voluntarios y se obtuvo los siguientes resultados:
1.2, 3.0, 2.5, 2.4, 1.9, 1.8, 1.5, 2.6, 2.7, 3.1, 1.7, 2.3, 2.2, 2.4, 2.2, 2.1
H1: El ttulo promedio del anticuerpo de esta nueva vacuna es mayor que
la de la vacuna antigua ( > 1.9)
Como la muestra es pequea, con los datos se ha se comprobado que la
distribucin de los ttulos del anticuerpo tienen distribucin normal, por lo tanto
para probar las hiptesis utilizaremos la prueba T
206
BIOESTADISTICA
x = 2.225
T=
x 0
S/ n
S = 0.518
2 .225 1 .9
= 2 .51
0 .518 / 16
p utilizando la
t (15 )
p = 0.012
t (15 )
2.51
Este
207
BIOESTADISTICA
Prueba
a) H0: = 0
H1: 0
b) H0: 0
H1: > 0
c) H0: 0
H1: < 0
Requisitos
Varianza 2 conocida
-Todo n de poblacin
Normal
n
grande
de
cualquier
poblacin
Estadstica
de la prueba
Distribucin
Decisin:
Rechazar H0
de
La estadstica Al nivel si
Si H0 es cierta
x 0
Z=
/ n
Normal
N(0,1)
Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-
Varianza
2
desconocida
- n grande (n > 30)
de cualquier poblacin
x 0
Z =
S/ n
Normal
a) Z < -Z1-
N(0,1)
Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-
Varianza
2
desconocida
- n < 30 de poblacin
Normal
x 0
T=
S/ n
t-Student
a) T < -t1-/2
T > t1-/2
b) T > t1-
c) T < -t1-
t(n -1)
a) Z < -Z1/2
/2
208
BIOESTADISTICA
Requisitos:
1) La muestra es aleatoria
2) La poblacin es normal.
Hiptesis:
a) H0: 2 = 20
H1: 2 20
b) H0: 2 20
H1: 2 > 20
c) H0: 2 20
H1: 2 < 20
Estadstica de la prueba:
X =
2
(n 1) S 2
02
2( n 1)
, si H0 es verdadera.
Regla de decisin:
si X2 < 2 / 2
a) Rechazar H0 al nivel ,
X2 > 12 / 2
/2
/2
X2
2 / 2
R.C.
12 / 2
R.C.
209
BIOESTADISTICA
b) Rechazar H0 al nivel ,
si
X2 >
12
X2
12
R.C.
si X2 < 2
c) Rechazar H0 al nivel ,
X2
R.C.
Ejemplo 6.12.
Para que un medicamento sea eficaz contra cierta enfermedad debe tener
cierta concentracin del principio activo definida con exactitud. Por esta razn
la concentracin
o que podran
ineficaces.
210
BIOESTADISTICA
estndar
= ( 0.1) /3 = 0.033
grficamente tendramos:
99.7%
X
5
y
4.9
3 = 0.1
5.1
3 = 0.1
H 1: 5
211
BIOESTADISTICA
se tom una muestra de 8 envases para los cuales se obtuvo las siguientes
concentraciones en mg /cc
n=8;
Luego
x = 4.9875;
S2 = 0.00439;
S=0.0663
(n 1) S 2 7(0.00439)
X =
=
= 28.21
20
(0.033) 2
2
X2
p utilizando la
2( 7)
p < 0.001
2( 7)
28.21
como P < 0.001, entonces se rechaza H0 a favor de H1
Luego, este resultado nos indica que la diferencia encontrada es muy grande y
que es casi improbable que se deba a la variabilidad del muestreo por lo que
212
BIOESTADISTICA
H 0: = 5
De los datos de la muestra tenemos:
T=
x 0
S/ n
H 1: 5
4.9875 5
= 0.533
0.0663 / 8
p utilizando la
t (7)
p > 0.25
2
t (7)
- 0.533
Por ser una prueba de alternativa bilateral
Este resultado nos indica que los datos son concordantes con el valor 5 para la
media poblacional, ya que la diferencia encontrada es pequea y es altamente
probable que se deba al azar del muestro.
213
BIOESTADISTICA
Requisitos:
1. Las n observaciones son mutuamente independientes
2. Cada resultado de las n observaciones tiene probabilidad P de
pertenecer a la categora 1
3. La muestra es grande
4. La poblacin es infinita, es decir la muestra(n) es mximo el 10% de la
poblacin(N) (n 0.10 N)
Hiptesis:
a) H0: P = P0
H 1: P P 0
b) H0: P P0
H 1: P > P 0
c) H0: P P0
H 1: P < P 0
214
BIOESTADISTICA
Estadstica de la prueba:
p P0
Z=
Z es N(0,1), si H0 es verdadera
P0 (1 P0 )
n
Regla de decisin
a) Rechazar H0 al nivel , si
Z < -Z1-/2
Z > Z1-/2
/2
/2
Z
-Z1-/2
R.C.
b) Rechazar H0 al nivel , si
Z1-/2
R.C.
Z > Z1-
Z
0
c) Rechazar H0 al nivel , si
Z1-
R.C.
Z < -Z1-
-Z1-
R.C.
Nota
Si la poblacin es finita, es decir, la muestra (n) es mayor al 10% de la
poblacin (N) (n > 0.10 N), entonces la estadstica Z se obtendr como
215
BIOESTADISTICA
p P0
Z =
P0 (1 P0 ) N n
n
N 1
Ejemplo 6.13.
Luego de la realizacin de un programa de inmunizacin contra la rubola, se
inform que la inmunizacin haba tenido una cobertura del 50% de los nios
de primaria. Una institucin supervisora sospecha que se ha sobre valorado la
cobertura del programa, por lo que aplic una encuesta a 500 nios de
primaria, revelando que 150 nios haban sido inmunizados. Al 5% de
significancia podremos decir que estos resultados validan lo afirmado acerca
de la cobertura del programa de inmunizacin?
Luego la proporcin en la muestra es
P = 150 = 0.30
500
H0: P = 0.50
Calculamos la estadstica Z
Z =
p P0
=
P 0 (1 P 0 )
n
0 . 30 0 . 50
= 8 . 944
0 . 50 ( 0 . 50 )
500
216
BIOESTADISTICA
6.2.2.4.
la comparacin de medias
Requisitos:
1) Ambas son muestras aleatorias de su poblacin correspondiente.
2) Las poblaciones 1 y 2 son independientes
3) Las muestras son grandes (n1 30; n2 30) de cualquier poblacin o
son de cualquier tamao si la poblaciones son normales.
4) Las varianzas poblacionales 21, 22 son conocidas
Hiptesis:
a) H0: 1 = 2
H1: 1 2
H0: 1 - 2 = 0
H1: 1 - 2 0
b) H0: 1 2
H1: 1 > 2
H0: 1 - 2 0
H1: 1 - 2 > 0
c) H0: 1 2
H1: 1 < 2
H0: 1 - 2 0
H1: 1 - 2 < 0
217
BIOESTADISTICA
Estadstica de la prueba
( x1 x 2 )
Z =
12
n1
22
n2
Regla de decisin
a) Rechazar H0 al nivel , si
Z < -Z1-/2
Z > Z1-/2
/2
/2
Z
-Z1-/2
R.C.
b) Rechazar H0 al nivel , si
Z1-/2
R.C.
Z > Z1-
Z
0
c) Rechazar H0 al nivel , si
Z1-
R.C.
Z < -Z1-
-Z1-
R.C.
218
BIOESTADISTICA
Nota
Si las varianzas 21, 22 son desconocidas, entonces slo cuando las
muestras sean grandes (n1 30, n2 30), la estadstica Z se obtendr
como
Z =
( x1 x2 )
S 12
S 22
+
n1
n2
Ejemplo 6.14.
Un epidemilogo desea comparar dos vacunas para la rabia. Las personas que
previamente haban recibido dichas vacunas se dividieron en dos grupos. El
grupo 1 recibi una dosis de refuerzo de la vacuna del tipo 1 y el grupo 2
recibi una dosis de refuerzo de la vacuna tipo 2. Las respuestas de los
anticuerpos se registraron dos semanas despus. Las medias, desviaciones
estndar y tamaos de las muestras para los dos grupos fueron los siguientes:
Grupo
Tamao de
La muestra
1
2
30
49
Media
x
4.5
2.5
Desv. est.
s
2.5
2.0
1 = 2
219
BIOESTADISTICA
1 2
Por ser muestras grandes y no contar con las varianzas poblacionales,
calculamos
Z=
( x1 x 2 )
S12 S 22
+
n1 n2
4.5 2.5
( 2.5) 2 ( 2.0) 2
+
30
49
= 3.71
p = 0.0001
2
3.71
p = P (Z 3.71) = 0.0001
2
Z
p = 0.0002 < 0.001
220
BIOESTADISTICA
Requisitos:
1) Ambas son muestras aleatorias de su poblacin correspondiente.
2) Las poblaciones 1 y 2 son independientes
3) Muestras pequeas de poblaciones son normales.
4) Las varianzas poblacionales
2 1 ,
suponen semejantes.
Hiptesis:
a) H0: 1 = 2
H1: 1 2
H0: 1 - 2 = 0
H1: 1 - 2 0
b) H0: 1 2
H1: 1 > 2
H0: 1 - 2 0
H1: 1 - 2 > 0
c) H0: 1 2
H1: 1 < 2
H0: 1 - 2 0
H1: 1 - 2 < 0
Estadstica de la prueba
T=
( x1 x2 )
;
1 1
Sp
+
n1 n2
con S2p =
221
BIOESTADISTICA
Regla de decisin
a) Rechazar H0 al nivel , si
T < -t1-/2
T > t1-/2
/2
/2
T
-t1-/2
R.C.
b) Rechazar H0 al nivel , si
t1-/2
R.C.
T > t1-
T
0
c) Rechazar H0 al nivel , si
t1-
R.C.
t < -t1-
-t1-
R.C.
Nota
Si no se cumple el requisito de que las varianzas sean semejantes (es
decir 21 22 ), entonces la estadstica T se obtendr como:
T =
( x1 x 2 )
S 12 S 22
+
n1 n2
222
BIOESTADISTICA
v=
S 12 S 22
n +n
2
1
( ) +( )
S 12
n1
n1 + 1
S 22
n2
n2 + 1
Ejemplo 6.16
Con el objeto de determinar si la privacin del sueo tiene algn efecto sobre la
frecuencia de la onda alfa del electroencefalograma de las personas, a veinte
personas voluntarias se dividi al azar en dos grupos. Las personas del grupo
A se sometieron a un perodo de privacin del sueo de 10 das, mientras que
las del grupo B sirvieron de control. Al trmino del perodo experimental, se
registr la frecuencia de la onda alfa componente de los electroencefalogramas
de las personas. Los resultados fueron los siguientes:
Grupo A:
10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B:
11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
A = B
223
BIOESTADISTICA
A B
Por ser muestras pequeas y no contar con las varianzas poblacionales, antes
de aplicar la prueba T para comparacin de medias, con los datos obtenidos
para el nivel alfa en cada grupo, se debe comprobar si estas muestras validan
los requisitos de poblacin normal y varianzas semejantes, lo cual es aceptado
(los procedimientos y resultados de estas pruebas sern presentados en la
secciones 6.2.26- ejemplo 6.19 y 6.2.3.1 ejemplo 6.20)
Tamao de
La muestra
A
B
10
10
Media
x
10.28
11.08
Desv. est.
S
0.5978
0.4590
Varianza comn
(n 1 1)S 12 + (n 2 1)S 22
9(0.5978 ) 2. + 9(0.459 ) 2
S =
=
= 0.284
n1 + n2 2
18
2
p
Y la estadstica T
( x1 x2)
T =
S
1
1
+
n1
n2
10 . 28 11 . 08
0 . 284
1
1
+
10
10
= 3 . 357
224
BIOESTADISTICA
p utilizando la
t (18 )
p < 0.005
2
t (18 )
-3.357
Por ser una prueba de alternativa bilateral
p < 0.01
Luego concluimos que esta muestra es una evidencia de que existe diferencia
en la frecuencia de la onda alfa para las personas sometidas a privacin
sensorial respecto a las que no fueron sometidas a la privacin, es decir, que la
privacin sensorial en las personas tienen efecto sobre la frecuencia de la
onda alfa de las personas (p < 0.01)
225
BIOESTADISTICA
Varianzas 21, 22
desconocidas
- n1 30, n2 30 de
cualquier poblacin
H1: 1 - 2 0
H1: 1 - 2 > 0
H1: 1 - 2 < 0
( x1 x 2 )
Normal
Decisin:
Rechazar H0
Al nivel si
a) Z < -Z1-/2
Z > Z1-/2
12 22
+
n1 n 2
N(0,1)
b) Z > Z1-
( x1 x 2 )
Normal
c) Z < -Z1-
a) Z < -Z1-/2
Z > Z1-/2
S 12 S 22
+
n1 n 2
N(0,1)
b) Z > Z1-
Estadstica
de la prueba
Z=
Z =
c) Z < -Z1-
( x1 x 2 )
Varianzas 21, 22
desconocidas, pero
semejantes
T =
( n1 1) S + ( n 2 1) S
n1 + n 2 2
Sp
S 2p =
( x1 x 2 )
S 12 S 22
n +n
2
1
b) T > t1-
c) T < -t1-
n1
S 22
b) T > t1-
c) T < -t1-
( ) +( )
S 12
n1 + 1
t-Student t(v)
2
2
a) T < -t1-/2
T > t1-/2
S 12 S 22
+
n1 n2
Varianzas 21, 22
Desconocidas y diferentes
v =
1
1
+
n1 n 2
t(n1 + n2 -2)
T =
a) T < -t1-/2
T > t1-/2
2
1
t-Student
Distribucin de
la estadstica
Si H0 es cierta
n2
n2 + 1
226
BIOESTADISTICA
inherentes a los
obtenerse de varias
227
BIOESTADISTICA
H1: d d0
b) H0: d d0
H1: d > d0
c) H0: d d0
H1: d < d0
Z=
d d0
Sd / n
o la
T=
d d0
Sd / n
Ejemplo 6.17
Doce personas participaron en un experimento para estudiar la efectividad de
cierta dieta, combinada con un programa de ejercicio, en la reduccin de los
niveles de colesterol en suero en al menos 10 unidades. La tabla muestra los
niveles de colesterol en suero para las 12 personas al principio del programa
(Antes) y al final del mismo (Despus).
Diferencia
Colesterol en suero
Persona Antes (X1) Despus (X2)
di
1
201
193
8
2
231
236
-5
3
221
216
5
4
260
233
27
5
228
214
14
228
BIOESTADISTICA
6
7
8
9
10
11
12
237
326
235
240
267
284
209
216
296
195
207
247
260
201
21
30
40
33
20
24
8
H0: d 10
H1: d > 10
es
d = 18.75 ;
S d = 13.11
229
BIOESTADISTICA
T =
d d0
Sd / n
18 . 75 10
= 2 . 312
13 . 11 / 12
p utilizando la
t (11)
p = 0.0206
t (11)
2.312
Luego podemos concluir que la muestra es una evidencia significativa (p <
0.025) de que esta dieta combinada con un programa de ejercicio es efectiva
para reducir los niveles de colesterol en suero en al menos 10 unidades.
Requisitos:
1) Ambas muestras son aleatorias de sus respectivas poblaciones
2) Las poblaciones 1 y 2 son independientes y cada una tiene distribucin
normal con varianzas 21 y 22 respectivamente.
230
BIOESTADISTICA
Hiptesis:
a) H0 : 21 = 22
H 1 : 2 1 2 2
b) H0 : 21 22
H1 : 21 > 22
c) H0 : 21 22
H 1 : 2 1 < 2 2
Estadstica de la Prueba
S12
F = 2
S2
Si H0 es cierta, F tiene distribucin F(n1-1, n2-1) ; donde n1 -1 y n2 1 son los
grados de libertad del numerador y denominador.
Regla de decisin
a) Rechazar H0 al nivel ,
si F < F2
F > F1 2
/2
/2
F
F2
F1 2
R.C.
b) Rechazar H0 al nivel ,
si
R.C.
F > F1
F
F1
R.C.
231
BIOESTADISTICA
c) Rechazar H0 al nivel ,
si F < F
F
F
R.C.
Ejemplo 6.18
De dos hospitales se tomaron muestras de tamao 10 de los pesos de recin
nacidos para probar si la dispersin de los pesos es la misma para los dos
hospitales. Los resultados obtenidos son los siguientes:
Hospital 1: 3.625, 3.430, 3.000, 3.625, 3.625, 3.150, 3.360, 3.230, 3.950, 3.400
Hospital 2: 3.800, 3.500, 3.350, 3.250, 4.100, 3.900, 3.900, 4.000, 3.670, 3.600
x 1 = 3.4395
S21 = 0.07696
n1 = 10
x 2 = 3.707
S22 = 0.07949
n2 = 10
H 0 : 21 = 22
Luego
H 1 : 21 22
F = 0.07696 = 0.968
0.07949
F0.025(9,9) = 0.2448
y 1-/2
F0.975(9,9) = 4.03
232
BIOESTADISTICA
0.025
0.025
0.2448
R.C.
0.968
F(9,9)
4.03
R.C.
Ejemplo 6.19
En el ejemplo 6.16, para poder aplicar la prueba T para comparar las medias
de dos grupos, uno de los requisitos que deben cumplir los datos es que las
varianza de ambos grupos sean semejantes, requisito que probaremos con la
prueba F
Hiptesis:
H 0 : 2 A = 2B
H 1 : 2 A 2B
Donde:
B es el grupo control
Variable:
Frecuencia
de
la
onda
alfa,
componente
de
los
233
BIOESTADISTICA
10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B:
11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
Grupo
Tamao de
La muestra
A
B
10
10
Media
x
10.28
11.08
Desv. est.
S
0.5978
0.4590
F = (0.5978)2 = 1.696
(0.4590)2
F0.025(9,9) = 0.2448
y 1-/2
F0.975(9,9) = 4.03
muestreo.
234
BIOESTADISTICA
Requisitos:
1. Los n1 resultados de la muestra de la poblacin 1 son mutuamente
independientes y de igual manera los n2 resultados de la muestra de la
poblacin 1 tambin son mutuamente independientes.
2. Cada resultado de las n1 observaciones de la muestra de la poblacin 1
tiene probabilidad P1 de estar en la categora 1 y Cada resultado de las
n2 observaciones de la muestra de la poblacin 2 tiene probabilidad P2
de estar en la categora 1.
3. Las muestras son grandes (n1 30 y n2 30)
4. Las poblaciones son infinitas (n1 0.10 N1 y n2 0.10 N2), es decir las
muestras son a lo ms el 10% de la poblacin correspondiente
Hiptesis:
a) H0: P1 P2 = 0
H 1: P 1 P 2 0
b) H0: P1 P2 0
H 1: P 1 P 2 > 0
c) H0: P1 P2 0
H 1: P 1 P 2 < 0
Estadstica de la prueba
Z=
p1 p 2
Sp1 p2
235
BIOESTADISTICA
Z es N(0,1), si H0 es verdadera
p(1 p ) p(1 p )
+
n1
n2
S p1 p2 =
Donde:
p =
x1 + x2
n1 + n2
p1 =
x1
n1
p2 =
x2
n2
Regla de decisin
a) Rechazar H0 al nivel , si
Z < -Z1-/2
Z > Z1-/2
/2
/2
Z
-Z1-/2
R.C.
b) Rechazar H0 al nivel , si
Z1-/2
R.C.
Z > Z1-
Z
0
Z1-
R.C.
236
BIOESTADISTICA
c) Rechazar H0 al nivel , si
Z < -Z1-
-Z1-
R.C.
Ejemplo 6.20
En el Ejercicio aplicativo, los investigadores tenan por objeto comparar el
desarrollo visomotor y el rendimiento escolar de hijos de madres adolescentes
con el de los hijos de madres adultas.
El desarrollo visomotor fue evaluado utilizando la prueba de Bender (Nmero
de errores que tiene el nio cuando trata de reproducir nueve figuras que le han
sido mostradas).
El rendimiento escolar fue analizado sobre la base del porcentaje de nios de
cada grupo que desaprob el ao escolar.
H0: 1 = 2
El promedio de errores de la prueba de Bender para hijos de madres
adolescentes es igual al promedio de los hijos de madres adultas.
H1: 1 > 2
El promedio de errores en la prueba de Bender es mayor para hijos de
madres adolescentes que para los hijos de madres adultas ( lo que indica un
retardo en el desarrollo vasomotor)
237
BIOESTADISTICA
H 0: P 1 = P 2
El porcentaje de nios que desaprob el ao escolar es igual para los hijos
de madres adolescentes que para los hijos de madres adultas.
H 1: P 1 > P 2
El porcentaje de nios que desaprob el ao escolar es mayor para los hijos
de madres adolescentes que para los hijos de madres adultas. (lo que indica
menor rendimiento escolar)
Madres adolescentes
59
6.34
0.38
13.8% (8)*
Madres adultas
73
4.75
0.24
4.3% (3)*
238
BIOESTADISTICA
Z=
( x1 x 2 )
2
1
2
2
S S
+
n1 n 2
6.34 4.75
0.38 + 0.24
2
= 3.53
p =
Sp1 p2 =
x1 + x2
8+ 3
=
= 0 . 083
n1 + n2
59 + 73
p(1 p) p(1 p)
0.083 (0.917) 0.083 (0.917)
+
=
+
= 0.048
n1
n2
59
73
Z =
p1 p2
0 . 136 0 . 041
=
= 1 . 979
S p1p2
0 . 048
239
BIOESTADISTICA
Datos:
Una muestra de tamao n de observaciones de una variable, las cuales son
ordenadas en una tabla de frecuencias absolutas y relativas acumuladas como
sigue:
Frecuencia Frecuencia relativa
Variable X Observada
Acumulada (pi)
X1
X2
:
XK
Toral
n1
n2
:
nk
n
p1 = n1/n
p2 = (n1 + n2)/n
:
PK = 1
Requisitos:
1) La muestra es aleatoria
2) La variable es de tipo numrico.
240
BIOESTADISTICA
Hiptesis:
H0: La variable tiene distribucin sigue el modelo f*(x)
H1: La distribucin de la variable difiere del modelo f*(x)
Estadstica de la prueba:
Para los valores Xi, observados en la muestra, se obtiene sus probabilidades
acumuladas correspondientes con el modelo f*(x) propuesto en la hiptesis
nula [Pi = P(X Xi)]. La estadstica de la prueba viene a ser D, la mayor
diferencia absoluta entre la probabilidad acumulada terica y la frecuencia
relativa acumulada (probabilidad acumulada estimada)
D = mxima{ Pi pi }
Decisin:
Rechazar H0 al nivel , si
D > W1
Ejemplo 6.21.
En el ejemplo 6.16. se plante la comparacin de medias del nivel alfa
componente de los electroencefalogramas para 2 grupos de personas, el grupo
A formado por personas que haban sido sometidas a un periodo de privacin
sensorial por 10 das y el grupo B formado
obtenidos fueron:
241
BIOESTADISTICA
Grupo A:
10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4
Grupo B:
11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9
Para que la aplicacin de la prueba T sea vlida debe comprobarse que las
muestras validan que la distribucin de los niveles alfa, para cada grupo tiene
distribucin normal
H0: Los registros del nivel alfa para las personas del grupo A tienen
distribucin normal
H1: La distribucin de los registros del nivel alfa para las personas del
grupo A no tienen distribucin normal
2)
H0: Los registros del nivel alfa para las personas del grupo B tienen
distribucin normal
H1: La distribucin de los registros del nivel alfa para las personas del
grupo B no tienen distribucin normal
242
BIOESTADISTICA
XA
pi
9.5
9.7
9.8
10
10.1
10.2
10.4
10.8
10.9
11.4
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
zi =
xi x
SA
-1.30
-0.97
-0.80
-0.47
-0.30
-0.13
0.20
0.87
1.04
1.87
Pi = P(Z zi)
Di = Pi - pi
0.095983
0.165967
0.211003
0.319755
0.381668
0.446771
0.579547
0.807811
0.850164
0.969503
0.004017
0.034033
0.088997
0.080245
0.118332
0.153229
0.120453
0.007811
0.049836
0.030497
D = mxima{ Pi pi } = 0.153229
W0.95 =
0.258
243
BIOESTADISTICA
XB
pi
10.1
10.8
10.9
11
11.2
11.4
11.6
11.7
0.1
0.2
0.4
0.5
0.7
0.8
0.9
1
zi =
xi x
SB
Pi = P(Z zi)
Di = Pi - pi
0.01638
0.27092
0.34747
0.43082
0.60312
0.75715
0.87137
0.91161
0.08362
0.07092
0.05253
0.06918
0.09688
0.04285
0.02863
0.08839
-2.14
-0.61
-0.39
-0.17
0.26
0.70
1.13
1.35
D = mxima{ Pi pi } = 0.09688
Luego como se aprecia, para ambos casos se acepta que la distribucin de los
registros del nivel alfa tiene distribucin normal, ya
Ejemplo 6.22.
Consideremos nuevamente el ejemplo 6.16
Doce personas participaron en un experimento para estudiar la efectividad de
cierta dieta, combinada con un programa de ejercicio, en la reduccin de los
niveles de colesterol en suero en al menos 10 unidades. La tabla muestra los
niveles de colesterol en suero para las 12 personas al principio del programa
(Antes) y al final del mismo (Despus).
Colesterol en suero
Diferencia
Persona Antes (X1) Despus (X2)
di
1
201
193
8
2
231
236
-5
3
221
216
5
244
BIOESTADISTICA
4
5
6
7
8
9
10
11
12
260
228
237
326
235
240
267
284
209
233
214
216
296
195
207
247
260
201
27
14
21
30
40
33
20
24
8
H0: d 10
H1: d > 10
es
d = 18.75 ;
S d = 13.11
245
BIOESTADISTICA
di
pi
-5
5
8
14
20
21
24
27
30
33
40
0.0833
0.1667
0.3333
0.4167
0.5000
0.5803
0.6667
0.7500
0.8333
0.9167
1.0000
di d
Sd
-1.812
-1.049
-0.820
-0.820
-0.362
0.095
0.172
0.400
0.629
0.858
1.087
zi =
Pi = P(Z zi)
Di = Pi - pi
0.0350
0.1471
0.2061
0.2061
0.3585
0.5380
0.5681
0.6556
0.7354
0.8046
0.8615
0.0483
0.0196
0.0439
0.1272
0.0581
0.0380
0.0152
0.0111
0.0146
0.0287
0.0552
D = mxima{ Pi pi } = 0.1272
Los valores Pi los hemos obtenido de la tabla de la distribucin acumulada para
la normal estandarizada.
En la tabla de Lilliefors del
obtenemos
W0.95 = 0.242
Luego entonces, como D < 0.242, no podemos rechazar la hiptesis de que las
diferencias tienen distribucin normal, por lo cual la prueba T aplicada para la
prueba de hiptesis para la media de la diferencia es vlida, pues se cumplen
los requisitos exigidos para su aplicacin.
246
BIOESTADISTICA
n
1
2
3
4
5
.80
.900
.684
.565
.493
.447
.90
.950
.776
.636
.565
.509
p
.95
.975
.842
.708
.624
.563
.98
.990
.900
.785
.689
.627
(Prueba bilateral)
.99
n .80
21 .226
.995
22 .221
.929
23 .216
.829
24 .212
.734
25 .208
.669
.90
.259
.253
.247
.242
.238
6
7
8
9
10
.410
.381
.358
.339
.323
.468
.436
.410
.387
.369
.519
.483
.454
.430
.409
.577
.538
.507
.480
.457
.617
.576
.542
.513
.489
26
27
28
29
30
.204
.200
.197
.193
.190
.233
.229
.225
.221
.218
.259
.254
.250
.246
.242
.290
.284
.279
.275
.270
.311
.305
.300
.295
.290
11
12
13
14
15
16
17
18
19
20
.308
.296
.285
.275
.266
.258
.250
.244
.237
.232
.352
.338
.325
.314
.304
.295
.286
.279
.271
.265
.391
.375
.361
.349
.338
.327
.318
.309
.301
.294
.437
.419
.404
.390
.377
.366
.355
.346
.337
.329
.468
.449
.432
.418
.404
.392
.381
.371
.361
.352
31
32
33
34
35
36
37
38
39
40
.187
.184
.182
.179
.177
.174
.172
.170
.168
.165
1.07
n
.214
.211
.208
.205
.202
.199
.196
.194
.191
.189
1.22
n
.238
.234
.231
.227
.224
.221
.218
.215
.213
.210
1.36
n
.266
.262
.258
.254
.251
.247
.244
.241
.238
.235
1.52
n
.285
.281
.277
.273
.269
.265
.262
.258
.255
.252
.95
.287
.281
.275
.269
.264
p
.98
.321
.314
.307
.301
.295
.99
.344
.337
.330
.323
.317
1 . 63
n
Fuente: CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY & SONS. New
York. 1980. pp 462.
247
BIOESTADISTICA
0.80
0.300
0.285
0.265
0.247
0.233
0.223
0.215
0.206
0.199
0.190
0.183
0.177
0.173
0.169
0.166
0.163
0.160
0.142
0.131
0.85
0.319
0.299
0.277
0.258
0.244
0.233
0.224
0.217
0.212
0.202
0.194
0.187
0.182
0.177
0.173
0.169
0.166
0.147
0.136
0.90
0.352
0.315
0.294
0.276
0.261
0.249
0.239
0.230
0.223
0.214
0.207
0.201
0.195
0.189
0.184
0.179
0.174
0.158
0.144
0.95
0.381
0.337
0.319
0.300
0.285
0.271
0.258
0.249
0.242
0.234
0.227
0.220
0.213
0.206
0.200
0.195
0.190
0.173
0.161
0.99
0.417
0.405
0.364
0.348
0.331
0.311
0.294
0.284
0.275
0.268
0.261
0.257
0.250
0.245
0.239
0.235
0.231
0.200
0.187
> 30
0.736
n
0.768
n
0.805
n
0.886
n
1.031
n
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30
Fuente: CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY & SONS. New
York. 1980. pp 463.
248
BIOESTADISTICA
Poblacin o
Caracterstica
Grupo
Categora1 Categora 2 .......... Categora c Totales
1
n11
n12
..........
n1c
n1
2
n21
n22
n2c
n2
.........
r
nr1
nr2
nrc
nr
Totales
C1
C2
Cc
n
El total de observaciones de todas las muestras reunidas es denotado por n
n = n1 + n2 + ..... + nr
el nmero total de observaciones en la j-sima categora es denotado por Cj.
Esto es, Cj es el nmero total de observaciones en la categora j provenientes
de todas las muestras reunidas en un solo grupo. Por ejemplo
249
BIOESTADISTICA
Requisitos:
1) Cada muestra es una muestra aleatoria
2) Los resultados de las muestras son
independientes de muestra a
muestra
3) Cada observacin puede ser clasificada slo en una de las c categoras
de la caracterstica bajo estudio.
Hiptesis:
Pij Pkj
Estadstica de la prueba:
r
X =
2
i = 1 j =1
(n
ij
E ij
E ij
nij
E
i =1 j = 1
ij
250
BIOESTADISTICA
Donde:
Si H0 es verdadera, entonces P1j = P2j = ...... = Prj = Pj
P j = Cj
n
As para la muestra del grupo i , esperaramos ni x Pj = ni Cj elementos en la
categora j
n
Eij = ni Cj
n
Luego a
Regla de decisin:
Rechazar H0 al nivel ,
si
X2 >
12
X2
.
12
R.C.
Observaciones:
1) Si alguna de las frecuencias esperadas Eij es pequea, la aproximacin
a la distribucin Ji-Cuadrado, puede ser pobre. Cochran establece que si
251
BIOESTADISTICA
2) Si r y c no son tan pequeos, y si parece que las Eij pueden ser tan
pequeas como 1, sin perjuicio de comprometer la validez de la prueba,
varias categoras pueden ser combinadas para eliminar las frecuencias
esperadas pequeas. Cuales categoras deberan ser combinadas es
problema de juicio. Generalmente, las categoras son combinadas solo
si ellas son similares en algn aspecto, tal que la hiptesis mantiene su
significado.
Poblacin
Poblacin 1
Poblacin 2
Total
Variable
Categora 1 Categora 2 Total
a
b
N1
c
d
N2
C1
C2
n
n(ad bc ) 2
X =
n 1 n 2 C1 C 2
2
252
BIOESTADISTICA
2
corregida
n( ad bc (n / 2)) 2
n 1 n 2 C1 C 2
o si
Ejemplo 6.23
Con el objeto de comparar la distribucin por grupo sanguneo de las personas
portadoras crnicas de cierto antgeno con la distribucin de grupos
sanguneos de los no portadores, se tom una muestra de 150 portadores y
200 no portadores obteniendo los siguientes resultados para el grupo
sanguneo:
253
BIOESTADISTICA
Grupo sanguneo
72
92
164
54
77
131
16
25
41
AB
14
150
200
350
Total
X =
2
i =1 j = 1
(n
ij
E ij
E ij
i =1 j =1
nij
Total
164
131
41
14
350
72 2
62
n=
+ ... + 350 = 1.6289
E ij
70
8
254
BIOESTADISTICA
Grfico 21
Grupo sanguineo de Portadores y
No portadores de antigeno
60%
40%
20%
0%
O
Portadores
No portadores
AB
Grupo sanguneo
255
BIOESTADISTICA
Requisitos
1) La muestra de n observaciones, es una muestra aleatoria (cada
observacin es independiente de las otras para ser clasificada en las
categoras i,j de las variables consideradas)
256
BIOESTADISTICA
Hiptesis
H0: Las variables son independientes
(Es decir cada observacin puede ser clasificada en una categora de una
variable independientemente de la categora en que fue clasificada de
acuerdo a la otra variable).
Prueba Estadstica
Sea
E ij =
Ri Cj
n
X2 =
i =1 j =1
(n
ij E ij
E ij
nij
E
i =1 j =1
ij
257
BIOESTADISTICA
Regla de decisin:
Rechazar H0 al nivel ,
si
X2 > 12
X2
12
R.C.
Las observaciones indicadas en la seccin 6.2.3.2 para la prueba Ji-Cuadrado
de comparacin de proporciones tambin se deben tener en cuenta para la
aplicacin de esta prueba.
Ejemplo 6.24
Con el objeto de verificar la suposicin de que la fabricacin de cierto producto
est
Nivel de exposicin
Alto
Medio
Bajo
185
33
17
Total
235
120
305
265
500
73
106
72
89
258
BIOESTADISTICA
producto.
H1: Las alteraciones respiratorias estn asociadas a la exposicin al
producto
Obtenemos las frecuencias esperadas y calculamos la estadstica X2 de la
prueba
FRECUENCIAS ESPERADAS
Presencia de
sntomas
S
No
Total
X2 =
Nivel de exposicin
Alto
Medio
Bajo
143.35
49.82
41.83
Total
161.65
305
265
500
56.18
106
47.17
89
235
185 2
332
172
1202
732
722
+
+
+
+
+
500 = 61.356
143.35 49.82 41.83 161.65 56.18 47.17
2( 2)
Ejemplo 6.25
Un psiclogo clnico toma una muestra de 200 pacientes que sufren ansiedad y
las clasifica de acuerdo a su restablecimiento y al tratamiento por medio de
terapia; obteniendo los siguientes datos:
259
BIOESTADISTICA
Tratamiento
Restablecimiento
Con terapia curados No curados Total
Tratados
140
20
160
No tratados
10
30
40
Total
150
50
200
Con esta informacin se desea evaluar si existe relacin entre el tratamiento y
la curacin
n(ad bc ) 2
200(140 x30 20 x10 ) 2
X =
=
= 66.67
n 1 n 2 C1 C 2
150 x50 x160 x 40
2
corregida
n ( ad bc (n / 2) )2
n1 n2 C1 C2
con
terapia
est
= 63.375
2(1)
p < 0.0005
relacionado
con
el
260
BIOESTADISTICA
Prctica Domiciliaria 8
1. Una muestra aleatoria de 40 hombres que trabajan en un proyecto de
construccin de un complejo residencial indica que 6 hombres no utilizan
cascos de proteccin.
a) Establezca un intervalo de confianza 98% con respecto a la proporcin
verdadera de hombres que no utilizan cascos de proteccin.
b) Si hay 1150 hombres trabajando en la construccin, con 95% de
confianza estime el nmero de los que no utilizan los cascos de
proteccin.
2. Se hicieron determinaciones de hemoglobina en 14 animales expuestos a
un compuesto qumico nocivo. Se registraron los siguientes valores: 15.6,
14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4,
13.9.
a) Construya un intervalo de 95% de confianza para la media. Interprete
b) Construya un intervalo de 90% para la varianza. Interprete
3. Una compaa transnacional instituy recientemente un programa de
seguridad en el trabajo para reducir el tiempo perdido debido a accidentes
de trabajo. En los 48 meses siguientes a la implantacin del programa el
tiempo perdido a causa de accidentes de trabajo promedi 91 horas por
mes con una desviacin estndar de 14 horas. En los 50 meses anteriores
al programa de seguridad el tiempo perdido debido a accidentes promedi
108 horas por mes con desviacin estndar de 12 horas. Son estos datos
una evidencia de que el programa de seguridad ha sido efectivo para
261
BIOESTADISTICA
trabajo?
4. Se informa que despus de una campaa de seguridad vial slo el 2% de
los vehculos que se detienen en una autopista interestatal no han sido
sometidos a una revisin de seguridad.
a) Si se detienen 16 vehculos, encuentre la probabilidad de que a lo ms 2
no satisfagan las normas de seguridad.
b) Si de un da se eligiera una muestra de 200 automviles para verificar la
revisin de seguridad cul es la probabilidad de que al menos el 5% de
los automviles detenidos no haya pasado la revisin?
c) Si en la muestra elegida result que 12 automviles no pasaron la
revisin de seguridad Qu concluira Ud. Acerca de la informacin
proporcionada?
d) Si en la autopista circulan aproximadamente 8000 automviles cada da,
obtenga una estimacin con 90% de confianza para el nmero de
automviles que no han pasado la revisin?
5. El peso de los pescados atrapados por un barco es aproximadamente
normal con una media de 4.5 kilos y una desviacin estndar de 0.5 kilos. Si
los peces pesan menos de 3 kg la embarcacin ser multada con una
suspensin de un mes.
a) Qu porcentaje de los peces que pesca tendr peso mximo de 3
kilos?
b) Cul es la probabilidad de que una muestra de 50 peces atrapados
proporcione una media de a lo ms 4,3 kg.?
262
BIOESTADISTICA
Nmero de muestras
5
8
12
10
11
9
55
263
BIOESTADISTICA
0
3
1
8
2
10
3
9
4
5
5
3
6
1
7
1
264
BIOESTADISTICA
265
BIOESTADISTICA
residentes en otra ciudad vecina se encuentra que 267 estn a favor del
aumento del lmite de velocidad. Estos datos indican que existe una
diferencia en el apoyo al
266
BIOESTADISTICA
1 2 3 4
1 3 2 1
4 2 3 3
5 6 7
2 1 3
1 2 3
8
2
3
x
Nios enfermos
Nios sanos
22.5
26.9
S
4.1
3.2
267
BIOESTADISTICA
secundaria
de
un
sistema
escolar
metropolitano
han
fumado
Poblacin A: 9.5, 10.5, 9.0, 9.75, 10.0, 13.0, 10.0, 13.5, 10.0, 9.5, 10.0, 9.75
Poblacin B:12.5, 9.5, 13.5,13.75, 12.0,13.75, 12.5, 9.5, 12.0,13.5,12.0, 12.0
268
BIOESTADISTICA
269
BIOESTADISTICA
270
BIOESTADISTICA
8. REFERENCIAS BIBLIOGRAFICAS
1. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de la
Salud. 4 Edicin, Editorial Limusa S.A. de C.V. Grupo Noriega Editores.
Mxico 2004
2. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de la
Salud. 3 Edicin, Editorial Limusa S.A. Mxico 1991
3. AHLBOM, A. And NORELL, S. Itroduction To MODERN EPIDEMIOLOGY.
Epidemiology Resourses Inc. USA. 1990
4. CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY &
SONS. New York. 1980.
5. DAWSON-SAUNDERS, B. And TRAPP, R. Bioestadstica Mdica. 2
Edicin. Manual Moderno, S.A. de C.V. Mxico. 2000
6. DAWSON-SAUNDERS, B. And TRAPP, R. Bioestadstica Mdica. 4
Edicin .Manual Moderno, S.A. de C.V. Mxico. 2004
7. Centro Panamericano de Ingeniera Sanitaria y Ciencias del Ambiente.
Evaluacin de Riesgos para la salud por el uso de aguas residuales en
agricultura. Anexo 3: Aspectos Microbiolgicos. CEPIS-OPS. Lima, Per.
1990
8. Centro
Panamericano
de
Ecologa
Humana
Salud.
Evaluacin
271
BIOESTADISTICA
272
BIOESTADISTICA
Anexo
RESUMEN DE ESTIMACION Y PRUEBA DE HIPOTESIS
273
BIOESTADISTICA
Parmetro
Media
Varianza 2 conocida
-Todo n de poblacin Normal
- n grande de cualquier
poblacin
Varianza 2 desconocida
- n grande (n > 30) de
cualquier poblacin
Varianza 2 desconocida
- n < 30 de poblacin
Normal
Varianza
Proporcin
Intervalo de confianza
(1- )
La poblacin es normal
Poblacin grande
Muestra grande
L = x Z 1 / 2
L = x Z 1 / 2
n
S
n
S
n
(n 1) S 2
Ls =
2 / 2
L = x t 1 / 2
Li =
( n 1) S 2
12 / 2
L = p Z1 / 2
P
Poblacin finita
Muestra grande
L = p Z1 / 2
p(1 p)
n
p(1 p) N n
n
N 1
Tamao de muestra
Poblac. grande
Z12 / 2 S 2
n=
E2
Poblac. finita
n0
n=
n
1+ 0
N
2
Z
S2
n0 = 1 / 22
E
Poblac grande.
Z 12 / 2 p(1 p)
n0 =
E2
n=
n0
Poblac finita
n0
1+
N
274
BIOESTADISTICA
Parmetro
Requisitos
2
Diferencia de
medias
1 - 2
Varianzas 1, 2 conocidas
-Todo n1, n2 de poblaciones
normales.
-n1 30, n2 30 en general
Varianzas 21, 22
desconocidas
- n1 30, n2 30
P1 P2
n1
22
n2
s12 s22
+
n1 n2
L = ( x 1 x 2 ) t1 / 2 S x1 x 2
Muestras grandes
poblacin.
x x =
L = ( x 1 x 2 ) Z 1 / 2 S x1 x 2 S x x =
Varianzas 21, 22
Desconocidas
Diferencia de
Proporciones
L = ( x 1 x 2 ) Z 1 / 2 x1 x 2
12
de
cada
S x1 x 2 =
( n1 1) S12 + ( n2 1) S 22
n1 + n2 2
1
1
+
n1 n2
L = ( p1 p2 ) Z 1 / 2 S p1 p 2
S p 1 p 2 =
p1 (1 p1 ) p2 (1 p2 )
+
n1
n2
275
BIOESTADISTICA
H0: = 0
a) H1: 0
b) H1: > 0
c) H1: < 0
Estadstica
de la prueba
Varianza 2 conocida
-Todo n de poblacin Normal
- n grande de cualquier poblacin
Varianza 2 desconocida
- n grande (n > 30) de
poblacin
x 0
/ n
x 0
Z =
S/ n
x 0
Z=
cualquier
Varianza 2 desconocida
- n < 30 de poblacin Normal
T=
Normal
N(0,1)
Normal
N(0,1)
t-Student
t(n -1)
S/ n
a)
b)
c)
H0: = 20
H1: 2 20
H1: 2 > 20
H1: 2 < 20
Requisitos
Distribucin de
La estadstica
Si H0 es cierta
H0: P = P0
a) H1: P P0
b) H1: P > P0
c) H1: P < P0
H0: P1 = P2
a) H1: P1 P2
b) H1: P1 > P2
c) H1: P1 < P2
La poblacin es normal
Muestra grande
X =
2
Z =
(2n 1)
(n 1) S 2
02
p P0
1
1
+
P (1 p )
n 2
n1
12
c) X2 < 2
b) X2 >
Normal
P0 (1 P0 ) N n
n
N 1
p1 p 2
Decisin:
Rechazar H0
Al nivel si
a) Z < -Z1-/2 Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-
; p=
N(0,1)
x1 + x 2
n1 + n 2
276
BIOESTADISTICA
de
poblaciones
H0: 12 = 220 Muestras
2
2
independientes,
cada
una con
a) H1: 1 2 0
2
2
b) H1: 1 > 2 0 distribucin normal.
c) H1: 12 < 220
Varianzas 21, 22 conocidas
a)H0: 1- 2 = 0
H1: 1 - 2 0
b)H0: 1 - 2 0
H1: 1- 2 > 0
c)H0: 1 - 2 0
H1: 1 - 2 < 0
S12
F= 2
S2
Z=
Z=
- n1 30, n2 30 de cualquier
poblacin
2
1
Normal
2
2
+
n1 n 2
N(0,1)
( x1 x 2 )
Normal
S12 S 22
+
n1 n2
T =
S p2 =
T =
a) F < F2 F > F1 2
b) F > F1
c) F < F
( x1 x 2 )
F(n1-1, n2-1)
N(0,1)
( x1 x 2 )
1
1
Sp
+
n1 n2
( n1 1) S + ( n2 1) S
n1 + n2 2
( x1 x 2 )
S12 S 22
+
n1 n2
T es t(v)
es t ( n1+ n 2 2 )
2
1
c) T < -t1-
2
( ) +( )
n1
n1 + 1
S2
2
2
S12 S 22
+
n1 n2
v= 2 2
2
S1
n2
n2 + 1
b) T > t1-
c) T < -t1-
277