Sei sulla pagina 1di 288

BIOESTADISTICA

= x =

95%

1.96 x

+ 1.96 x

Mg. Beatriz Castaeda Saldaa

BIOESTADISTICA
Mg. Beatriz Castaeda Saldaa
Profesora de Bioestadstica
Facultad de Ingeniera Ambiental
Universidad Nacional de Ingeniera

La Magster Beatriz Castaeda estudi la licenciatura en Estadstica en la Universidad


Nacional de Trujillo y realiz sus estudios de maestra en Economa en la Universidad
Nacional Mayor de San Marcos. Ejerce la docencia desde 1979 y es profesora Principal
en la Universidad Nacional de Ingeniera y en la Universidad Nacional Mayor de San
Marcos. Desde 1988 hasta el 2004 ha sido consultora en proyectos de Investigacin en el
Centro Panamericano de Ingeniera Sanitaria.

A mis alumnos que han sido y son


mi motor para seguir aprendiendo

BIOESTADISTICA

INDICE
INTRODUCCION

1. ESTADISTICA DESCRIPTIVA
1.1. Organizacin de datos
1.2. Medidas de Resumen
1.2.1. Medidas de Posicin
1.2.2. Medidas de Dispersin
1.2.3. Medidas de Forma
Prctica Domiciliaria 1
1.2.4. Medicin de datos nominales
Prctica Domiciliaria 2
Bibliografa del captulo

5
5
12
13
22
25
28
32
44
49

2. PROBABILIDAD
2.1. Funcin Probabilidad
2.2. Asignacin de probabilidad
2.3. Mtodos de enumeracin y conteo
2.4. Probabilidad Condicional. Probabilidad condicional de Bayes
2.5. Evaluacin de procedimientos de deteccin. Sensibilidad,
especificidad, valor predictivo
Prctica Domiciliaria 3
Bibliografa del captulo

51
53
54
56
62
67
70
79

3. VARIABLES ALEATORIAS Y
DISTRIBUCIONES DE PROBABILIDAD
3.1. Variable aleatoria. Funcin de cuanta. Funcin de densidad
Funcin de distribucin
3.2. Valor esperado y Varianza
Prctica Domiciliaria 4
3.3. Distribuciones de variables discretas
3.3.1. Distribucin de Bernoulli
3.3.2. Distribucin Binomial
3.3.3. Distribucin hipergeomtrica
3.3.4. Distribucin de Poisson
3.4. Distribuciones de variables continuas
3.4.1. Distribucin Exponencial
3.4.2. Distribucin Normal
Prctica Domiciliaria 5
3.5. Distribuciones de funciones de variables aleatorias
Bibliografa del captulo

80
87
90
95
95
96
99
103
106
106
108
118
128
133

4. DISTRIBUCIONES DEL MUESTREO

134

80

BIOESTADISTICA

4.1. Variables del muestreo


4.2. Distribucin de la media muestral
4.3. Distribucin de la varianza muestral
4.4. Distribucin de la proporcin muestral
Prctica domiciliaria 6
Bibliografa del captulo

135
136
143
145
149
153

5. ESTIMACION
5.1. Estimacin Puntual
5.2. Estimacin intervlica
5.2.1. Estimacin intervlica para la media poblacional
Error de muestreo. Tamao de muestra
5.2.2. Estimacion intervlica para la varianza poblacional
5.2.2. Estimacin intervlica para la proporcin poblacional
Error de muestreo. Tamao de muestra
5.2.4. Estimacin intervlica para la diferencia de medias
poblacionales
5.2.5. Estimacin intervlica para la diferencia de proporciones
poblacionales
Prctica domiciliaria 7
Bibliografa del captulo

154
154
155

6. PRUEBA DE HIPTESIS
6.1. Pprincipios bsicos de prueba de hiptesis
6.1.1. Definicin
6.1.2. Elementos de una prueba de hiptesis
Ejercicio Aplicativo N 1
6.2. Pruebas Estadsticas
6.2.1. Pruebas paramtricas y Pruebas no paramtricas
6.2.2. Pruebas paramtricas
6.2.2.1. Pruebas de hiptesis para la media poblacional
6.2.2.2. Prueba Ji-Cuadrado para la varianza poblacional
6.2.2.3. Prueba Z para la proporcin poblacional
6.2.2.4. Pruebas de hiptesis para la comparacin de medias
poblacionales
6.2.2.5. Prueba para la media de la diferencia (datos apareados)
6.2.2.6. Prueba F para comparacin de varianzas poblacionales
6.2.2.7. Prueba Z para comparacin de proporciones poblacionales
6.2.3. Pruebas no paramtricas
6.2.3.1 Pruebas de bondad de ajuste de Kolmogorov-Smirnov
6.2.3.2. Prueba Ji- Cuadrado para comparacin de proporciones
6.2.3.2. Prueba de Independencia Ji-Cuadrado
Prctica domiciliaria 8
Bibliografa del captulo

156
161
162
167
171
173
177
178
178
178
178
196
198
200
201
208
209
213
216
226
229
234
239
239
248
255
260
268

ii

BIOESTADISTICA

7. REFERENCIAS BIBLIOGRFICAS

270

Anexo: Resumen de Estimacin y Prueba de Hiptesis

272

iii

BIOESTADISTICA

Lista de Cuadros
Cuadro 1. Clasificacin de variables segn escala de medicin
Cuadro 2. Edad de mujeres sometidas a evaluacin de porcentaje de saturacin
de colesterol en bilis
Cuadro 3. Etapa de la enfermedad de pacientes con cncer colorrectal
Cuadro 4. Frecuencia de bacteriemia en pacientes hipotticos con cultivos de
catter
Cuadro 5. Nmero de hijos por familia
Cuadro 6. Edad de pacientes
Cuadro 7. Codificacin de categoras
Cuadro 8. Casos con calcificaciones pulmonares en dos poblaciones con fbrica
de asbestos, segn distancia de los domicilios a la respectiva fbrica
Cuadro 9. Tasas especficas de calcificaciones pulmonares por distancias en dos
poblaciones
Cuadro 10. Casos esperados en poblacin A, bajo condiciones de la poblacin B
Cuadro 11. Exposicin a dieta con frituras para casos y Controles
Cuadro 12. Probabilidad marginal y conjunta
Ccuadro 13. Nivel crtico de una prueba estadstica: Interpretacin
Cuadro 14. Pruebas paramtricas
Cuadro 15. Pruebas no paramtricas
Cuadro 16. Prueba de hiptesis para la media poblacional
Cuadro 17. Prueba de hiptesis para diferencia de medias
Cuadro 18. Estimacion por intervalo
iv

BIOESTADISTICA

Cuadro19. Prueba de hiptesis


Lista de Tablas
Tabla 1. Edad y porcentaje de sobresaturacin de colesterol en bilis
Tabla 2. Arreglo ordenado segn edad
Tabla 3. Data de la contaminacin bacteriana y calificacin de verduras
Tabla 4. Relacin de muestras posibles para muestreo con reposicin
Tabla 5. Relacin de muestras posibles para muestreo sin reposicin
Tabla 6: Cuantilas de la prueba de kolmogorov smirnov
Tabla 7: Cuantilas del test estadstico para normalidad de Lilliefors

Lista de Grficos
Grfico 1. Edad de mujeres sometidas a evaluacin de porcentaje de saturacin
de colesterol en bilis
Grfico 2. Etapa de la enfermedad de pacientes con cncer colorrectal
Grfico 3.Frecuencia de bacteriemia en pacientes hipotticos con cultivos de
catter
Grfico 4. Distribucin acumulada de las mujeres segn edad.
Grfico 5. Distribucin simtrica
Grfico 6. Distribuiciones asimtricas
Grfico 7. Clasificacin de distribuciones segn curtosis
Grfico 8. Asignacin de probabilidades
Grfico 9. Diagrama de rbol

BIOESTADISTICA

Grfico 10. Ordenamiento en crculo


Grfico 11. Funcin de cuanta de variable discreta
Grfico 12. Edad de mujeres trabajadoras en el sector textil
Grfico 13. Funcin de densidad de variable contina
Grfico 14. Distribucin de la edad de los nios (Poblacin)
Grfico 15. Distribucin de la media muestral (Muestreo con reposicin)
Grfico 16. Distribucin de la media muestral (Muestreo sin reposicin)
Grfico 17. Error de muestreo y cota superior
Grfico 18. Error de muestreo al estimar la proporcin poblacional
Grfico 19. Tipos de error en la toma de decisin
Grfico 20. Probabilidad de error tipo I () y de error tipo II ()
Grfico 21. Grupo sanguneo de portadores y no portadores de antgeno

vi

BIOESTADISTICA

Prlogo

Esta publicacin es fruto de los apuntes de clase desarrollados para mis alumnos
de la Facultad de Ingeniera Ambiental de la Universidad Nacional de Ingeniera,
los cuales empec a

compilar en el ao 2003 como una gua del curso de

Bioestadstica para agilizar el proceso enseanza-aprendizaje y dinamizar las


clases con la modalidad de taller.

Los temas trabajados cubren en su totalidad el sillabus del curso de Bioestadstica


en la Facultad de Ingeniera Ambiental y contiene 6 captulos. En el primer captulo
se desarrolla los mtodos para la organizacin, resumen y presentacin de datos,
as como la obtencin de indicadores del riesgo de enfermedad. En el segundo
captulo se estudia los conceptos de probabilidad, sus leyes y aplicaciones al rea
de salud como son el clculo de indicadores de la bondad de un mtodo de
deteccin y su aplicacin para el diagnstico de enfermedades. En el tercer y
cuarto captulos se ha tratado los temas de variables aleatorias, los modelos de
probabilidad para las poblaciones y las variables del muestreo. En los dos ltimos
captulos se ha trabajado los mtodos de la inferencia estadstica para la
obtencin de estimaciones y realizar pruebas de hiptesis acerca de las
poblaciones bajo anlisis.

vii

BIOESTADISTICA

Para cada tema se ha elaborado ejemplos aplicados los cuales sern resueltos en
clase con la participacin de los estudiantes. Al final de cada captulo se incluye un
listado de ejercicios y problemas denominado prctica domiciliaria.

Mg. Beatriz Castaeda Saldaa


Lima, enero 2007

viii

BIOESTADISTICA

INTRODUCCIN
La investigacin cientfica es la bsqueda continua del conocimiento y la
estadstica interviene en ella en la etapa de la experimentacin y observacin,
esto es, las observaciones experimentales y reconocimientos son partes
integrantes del mtodo cientfico, el cual conduce al empleo de las tcnicas
estadsticas, las que al ser utilizadas adecuadamente hacen ms eficientes las
investigaciones. Por ello es necesario que todos los investigadores se
familiaricen con las tcnicas y conceptos bsicos de la ciencia Estadstica.

ESTADSTICA
Es el campo de la ciencia que se ocupa de;
1) La recopilacin, organizacin y resumen de los datos
2) La obtencin de inferencias acerca de un conjunto de datos cuando slo se
observa una parte de ellos1.

BIOESTADSTICA
Cuando los datos que se estn analizando se obtienen de las ciencias
biolgicas y de la salud, se utiliza el trmino de bioestadstica para diferenciar a
esta aplicacin particular de herramientas y conceptos estadsticos.

La ciencia estadstica trata con:


-

Diseo de experimentos

Coleccin y manejo de datos

Evaluacin de medidas de resumen

Mg. Beatriz Castaeda S.

BIOESTADISTICA

Estimacin de parmetros poblacionales

Prueba de hiptesis respecto a las poblaciones

Estudio de la relacin entre dos o ms variables.

Poblacin: En el contexto del manejo estadstico se considera dos acepciones:


-

El conjunto de elementos para los cuales se tiene inters en


estudiar alguna caracterstica (por ejemplo los nios de un
distrito)

El conjunto de valores asociados a cada uno de los elementos


segn la caracterstica de inters (por ejemplo, si interesa
estudiar el peso de los nios, al medirlos se tendr la poblacin
de pesos de los nios del distrito)

Muestra: Es una parte de la poblacin, de manera anloga a la poblacin la


muestra puede referirse al subconjunto de elementos o al subconjunto de
valores correspondientes a los elementos para las caractersticas bajo estudio.

Unidades de observacin: Son los elementos para los cuales se va a estudiar


sus caractersticas.

Variable: Es la caracterstica que interesa estudiar para los elementos.

Mg. Beatriz Castaeda S.

BIOESTADISTICA

SELECCIN DE LOS MTODOS ESTADSTICOS

Antes de seleccionar un mtodo estadstico debemos tomar dos decisiones:


1) Determinar cul es la variable dependiente y cual es la independiente, y
2) Qu tipo de datos constituyen cada una de esas variables.

Clasificacin de las variables en funcin de los objetivos de la


investigacin
Variable dependiente: Puede identificarse como la variable de inters principal
o el desenlace principal del estudio. Queremos contrastar hiptesis o hacer
estimaciones, o efectuar ambos procedimientos, acerca de la variable
dependiente.

Variables independientes: Son las que determinan las caractersticas que es


necesario tener en cuenta o las condiciones en que se contrastan las hiptesis
o se realizan las estimaciones.

Tipos de variable y escala de medicin


Adems de caracterizar la funcin de las variables en el anlisis, para
seleccionar el mtodo estadstico para el manejo de los datos debemos
determinar el tipo de datos que constituyen las mediciones de cada variable.

Mg. Beatriz Castaeda S.

BIOESTADISTICA

Cuadro1. Clasificacin de variables segn escala de medicin


Tipo
variable

de Descripcin

Categrica

Clasifica a los elementos


en categoras o clases

Escala

Ejemplo

Nominal
(no establece
orden)
Ordinal

-sexo
-estado civil
-raza
-Dolor
-Color (intensidad)
-Estado de
enfermedad
- nmero de hijos
- nmero de fallas
- Edad
- talla
- peso
-tiempo de
enfermedad

(orden en
categoras)
Cuantitativa

Cuando asume valores


- Discretos
cuantitativos (numricos) - Continuos

Mg. Beatriz Castaeda S.

BIOESTADISTICA

CAPTULO 1. ESTADISTICA DESCRIPTIVA


La estadstica descriptiva se ocupa de la organizacin y resumen de datos para
la mejor descripcin de los elementos bajo estudio segn la o las
caractersticas de inters.

1.1. Organizacin de datos


Para la descripcin de un conjunto de datos el primer procedimiento consiste
en organizarlos presentndolos en un listado en forma ascendente y
agrupndolos para ser presentados en tablas y grficos de frecuencias.

Ejemplo 1.1. El siguiente cuadro proporciona la edad y el porcentaje de


sobresaturacin de bilis para una muestra de 31 varones y 29 mujeres en un
estudio sobre la formacin de clculos de colesterol en la vescula.

Tabla 1. Edad y porcentaje de sobresaturacin de colesterol en bilis


Varones

Mujeres

% de
Sujeto Edad Sobresaturacin
1
23
40
2
31
86
3
58
111
4
25
86
5
63
106
6
43
66
7
67
123
8
48
90
9
29
112
10
26
52
11
64
88
12
55
137
13
31
88
14
20
80

% de
Sujeto Edad Sobresaturacin
1
40
65
2
33
86
3
49
76
4
44
89
5
63
142
6
27
58
7
23
98
8
56
146
9
41
80
10
30
66
11
38
52
12
23
35
13
35
55
14
50
127

Mg. Beatriz Castaeda S.

BIOESTADISTICA

15
23
65
15
47
77
16
43
79
16
36
91
17
27
87
17
74
128
18
63
56
18
53
75
19
59
110
19
41
82
20
53
106
20
25
69
21
66
110
21
57
84
22
48
78
22
42
116
23
27
80
23
49
73
24
32
47
24
60
87
25
62
74
25
23
46
26
36
58
26
48
107
27
29
88
27
44
84
28
27
73
28
37
120
29
65
118
29
57
123
30
42
67
31
60
57
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)

Para describir la edad de las personas en el estudio ordenamos las edades


ascendentemente:
Tabla 2. Arreglo ordenado segn edad
Varones
% de
Orden Sujeto Edad Sobresaturacin
1
14
20
80
2
1
23
40
3
15
23
65
4
4
25
86
5
10
26
52
6
17
27
87
7
23
27
80
8
28
27
73
9
9
29
112
10
27
29
88
11
2
31
86
12
13
31
88
13
24
32
47
14
26
36
58
15
30
42
67
16
6
43
66
17
16
43
79
18
8
48
90
19
22
48
78
20
20
53
106
21
12
55
137

Mg. Beatriz Castaeda S.

Mujeres
% de
Orden Sujeto Edad Sobresaturacin
1
7
23
98
2
12
23
35
3
25
23
46
4
20
25
69
5
6
27
58
6
10
30
66
7
2
33
86
8
13
35
55
9
16
36
91
10
28
37
120
11
11
38
52
12
1
40
65
13
9
41
80
14
19
41
82
15
22
42
116
16
4
44
89
17
27
44
84
18
15
47
77
19
26
48
107
20
3
49
76
21
23
49
73

BIOESTADISTICA

22
3
58
111
22
14
50
127
23
19
59
110
23
18
53
75
24
31
60
57
24
8
56
146
25
25
62
74
25
21
57
84
26
5
63
106
26
29
57
123
27
18
63
56
27
24
60
87
28
11
64
88
28
5
63
142
29
29
65
118
29
17
74
128
30
21
66
110
31
7
67
123
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)

El arreglo nos permite apreciar que el grupo de varones tienen edades


ligeramente menores que las mujeres, pero para tener informacin de la
tendencia de la edad para los varones y mujeres es mejor organizar los datos
en forma agrupada.

Agrupamiento de datos
Segn la cantidad y tipo de datos estos se pueden agrupar de dos maneras:
a) Agrupamiento por intervalos: Para datos cuantitativos
b) Por conteo individual: Segn categora o valor diferente
a) Agrupamiento por intervalos
Para la mejor descripcin o lectura de las edades, las agrupamos y
presentamos en una tabla de frecuencias por intervalos e ilustramos con un
grfico de histograma de frecuencias como sigue

Criterios para determinar los intervalos


1) Determinar los valores mnimo y mximo
2) Calcular la amplitud o rango de los datos

Mg. Beatriz Castaeda S.

R = Mx Mn

BIOESTADISTICA

3) Determinar el nmero de intervalos (k) o la longitud de cada intervalo


(c), como:
K = R/c

c = R/k

Sugerencias:
a) 5 k 10
b) Todos los intervalos deben ser de igual longitud y de preferencia determinar
c como una medida que nos proporcione intervalos de fcil lectura

Lo ms importante es el criterio propio y el sentido comn. No existe regla


precisa para la determinacin del nmero de intervalos (k), generalmente
tratamos de no tener muchos, ni muy pocos. La razn bsica para agrupar los
datos es revelar la forma de la distribucin utilizando un nmero moderado de
intervalos.
En el cuadro 2 se presenta el agrupamiento de las mujeres por intervalos de
edad en la muestra del ejemplo 1.1
Cuadro2:

Edad de mujeres sometidas a evaluacin de


porcentaje de saturacin de colesterol en bilis
Edad (aos)
20 - 29
30 - 39
40 - 49
50 - 59
60 - 69
70 - 79
Total

N de
mujeres
5
6
10
5
2
1
29

Porcentaje
17%
21%
34%
17%
7%
3%
100%

Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)

Mg. Beatriz Castaeda S.

BIOESTADISTICA

Histograma de frecuencias
Se utiliza para representar frecuencias simples (absolutas o porcentuales) de
datos continuos. Se construye dibujando un eje en el cual se indican los
intervalos de clase, luego se dibuja una serie de rectngulos que tienen como
base los intervalos de clase y cuyas superficies deben ser proporcionales a las
frecuencias correspondientes a cada intervalo. En el caso de que todos los
intervalos sean de igual amplitud, la altura de cada rectngulo ser
proporcional a la frecuencia. Si los intervalos tienen amplitudes diferentes,
entonces, las alturas son llamadas densidad de frecuencia.
Grfico 1
Edad de mujeres sometidas a evaluacin de
porcentaje de saturacin de colesterol en bilis

N de mujeres

12
10
8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (aos)
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)

Polgono de frecuencias
Es un grfico que se utiliza, tambin, para representar las frecuencias simples
(absolutas o porcentuales) de datos continuos. Se construye uniendo con
segmentos los puntos correspondientes a los puntos medios y densidad de
frecuencias de cada intervalo (Ver grfico 1)

Mg. Beatriz Castaeda S.

BIOESTADISTICA

El polgono de frecuencias nos permite visualizar la forma de la distribucin y


en base a ella poder ajustarla a un modelo de probabilidad. Para el uso
descriptivo con este grfico podemos representar, simultneamente, la
distribucin de frecuencias de dos o ms subconjuntos de datos para efectos
de comparacin de tendencias de agrupamiento; en este caso se sugiere
graficar las frecuencias porcentuales para evitar distorsiones debido a la
diferencia en los tamaos de muestra.

b) Agrupamiento por conteo individual


Si los datos son categricos o de tipo discreto los ordenamos en cuadros de
frecuencia por conteo individual e ilustramos con un grfico de barras. Por
ejemplo en el cuadro 3 se presenta el agrupamiento de pacientes segn etapa
de gravedad de la enfermedad.

Cuadro 3. Etapa de la enfermedad de pacientes con cncer colorrectal


Etapa de la
enfermedad
1
2
3
4
Total

Nmero de
pacientes
3
28
63
21
115

Porcentaje
3%
24%
55%
18%
100%

Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (31)

Grfico de barras
Se utiliza para representar frecuencias simples (absolutas o porcentuales) de
datos categricos o discretos. Se construye dibujando un eje en el cual se

Mg. Beatriz Castaeda S.

10

BIOESTADISTICA

indican las categoras o valores diferentes de la variable, luego se dibujan


barras de igual ancho y cuyas longitudes deben ser proporcionales a las
frecuencias correspondientes a cada categora.
Grfico 2

Nmero de pacientes

Etapa de la enfermedad de pacientes


con cncer colorrectal
70
60
50
40
30
20
10
0

Etapa de la enfermedad

Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (31)

Datos Nominales
Si los datos son nominales ilustramos sus frecuencias con un grfico pastel, el
cual tiene por objeto mostrar que parte del todo es cada categora, como se
aprecia en el cuadro 4 y grfico 3.

Cuadro 4.

Frecuencia de bacteriemia en pacientes hipotticos


Con cultivos de catter
Bacteriemia
Si
No
Total

N de
pacientes
4
16
20

%
20%
80%
100%

Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (28)

Mg. Beatriz Castaeda S.

11

BIOESTADISTICA

Grfico 3

Frecuencia de bacteriemia en pacientes


hipotticos con cultivos de catter

20%

Si
No

80%

Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, Manual Moderno 1997 (28)

1.2. MEDIDAS DE RESUMEN


Llamadas tambin medidas descriptivas por que tienen por objeto describir la
naturaleza de la caracterstica en estudio.

MEDICIN DE DATOS NUMRICOS


Medidas de Posicin. Indican los valores que tienden a tomar los datos
- Media aritmtica o promedio
- Moda
- Cuantilas: Mediana, cuartiles, deciles, percentiles

Medidas de dispersin. Indican la variabilidad de los datos


- Amplitud o rango
- Varianza y desviacin estndar

Mg. Beatriz Castaeda S.

12

BIOESTADISTICA

- Coeficiente de Variacin

Medidas de forma. Indican la deformacin horizontal y vertical de los datos.


- Asimetra
- Curtosis

MEDICIN DE DATOS NOMINALES


- Proporciones y Porcentajes
- Razones
- Medicin epidemiolgica:
* Tasa. Ajuste de tasas
* Riesgo Relativo (RR)
* Odds Ratio (OR)

1.2.1 Medidas de Posicin


Media aritmtica o promedio
N

Media Poblaciona l : =

x
i =1

N = Nmero de elementos en la poblacin

Media Muestral :

x=

Mg. Beatriz Castaeda S.

x
i =1

n = Nmero de elementos en la muestra

13

BIOESTADISTICA

Es una medida de posicin que proporciona el valor que tiende a tomar la


variable para la mayora de los elementos en la poblacin o muestra, segn
corresponda.
Por su forma de clculo describe el centro de los datos en el sentido de un
centro de gravedad o punto de equilibrio, por ello se la considera como una
medida de tendencia central.

Obtencin de la media para datos agrupados


k

Media Poblacional : =

x
i =1

ni

; Media Muestral :
N
x i = Valor individual o punto medio del intervalo

x=

x
i =1

k = Nmero de valores diferentes o de intervalos


Obtencin de la media para agrupamiento por conteo individual
Ejemplo 1.2. En el cuadro 4 se presenta el agrupamiento de 64 familias segn
el nmero de hijos por familia y los productos del nmero de hijos (xi) por el
nmero de familias (ni) para cada valor individual de la variable

Cuadro 5. Nmero de hijos por familia


n de hijos n de familias
(xi)
(ni)
xi ni
0
4
0
1
8
8
2
11
22
3
15
45
4
10
40
5
13
65
6
3
18
TOTAL
64
198
Fuente: Datos simulados por el autor

Mg. Beatriz Castaeda S.

14

ni
;

BIOESTADISTICA

Media

x = 198 = 3.09 3 hijos por familia


64

Luego las familias tienen en promedio 3 hijos por familia.

Obtencin de la media para agrupamiento por intervalo


Ejemplo 1.3. En el cuadro 6 se presenta los intervalos de la edad y sus puntos
medios de cada intervalo, as como la frecuencia respectiva para una muestra
de 75 pacientes de una cierta enfermedad.

Cuadro 6. Edad de pacientes


Edad
5 14
15 24
25 34
35 44
45 54
55 64
TOTAL

xi *
9.5
19.5
29.5
39.5
49.5
59.5

ni
5
10
20
22
13
5
75

xi ni
47.5
195.0
590.0
869.0
643.5
297.5
2642.5

Fuente: Datos simulados por el autor

Media: x = 2642.5 = 35.23 aos


75
Las personas en la muestra tienen en promedio 35 aos, es decir, la mayora
de las personas en la muestra tienen alrededor de 35 aos.

Moda
Es el valor que ocurre con mayor frecuencia, por lo que se considera que
representa a los datos por ser el valor ms probable

Ejemplo 1.4. De los cuadros 4 y 5 obtenemos:


o Para el nmero de hijos por familia:

Mg. Beatriz Castaeda S.

Moda = 3 hijos

15

BIOESTADISTICA

o Para la edad:

35 44 aos es el intervalo modal


Moda = 39.5 aos *

* En el manejo de datos, para efectos descriptivos, se asume que los


datos

que

toman

uniformemente
proporcionalidad

medida

dentro

de

entre

el

en

un

establecindose

tamao

intervalo

del

dado

intervalo

se

una
y

distribuyen
relacin

la

de

frecuencia

correspondiente, de esta manera el punto medio representa a los datos en


el intervalo.

CUANTILAS O CUANTILES
Cuantila : X p
Es un valor en el recorrido de la variable en el que se acumula una porcin p de
datos con medida mxima el valor de la cuantila, es decir, un porcentaje (p x
100) de datos toma medidas menores o iguales a X

y el resto toma medida

mayores o iguales a X p.

A las cuantilas se las denomina de manera particular segn la porcin


acumulada a la izquierda del punto.

Mediana:

Me = X0.50

Indica que la mitad o el 50% de los datos toma medidas menor o igual a Me y
el otro 50% toma medida mayor o igual a Me, por ejemplo
Edad mediana = 36 aos

Mg. Beatriz Castaeda S.

16

BIOESTADISTICA

Indica que el 50% de las personas tienen edad mxima 36 aos y que el otro
50% tiene mnimo 36 aos.

Cuartiles :

q1 = X0.25

; q2 = X0.50

q3 = X0.75

Son puntos que dividen al conjunto de datos en 4 partes, esto es en cada parte
se acumula 25% de los datos, por ejemplo
q1 = X0.25 = 27 aos ;

q3 = X0.75 = 45 aos

Indica que el 25% de las personas tienen hasta 27 aos y que el 75% tiene a
lo ms 45 aos, es decir el 50% tiene edad entre los 27 y 45 aos.

Dciles:

d1 = X0.10

; d2 = X0.20 ; ........ ;

d9 = X0.90

Son puntos que dividen al conjunto de datos en 10 partes donde cada una
acumula el 10% de datos, por ejemplo
d1 = X0.10 = 17 aos

; d8 = X0.80 = 52 aos

Indica que el 10% de las personas tienen a lo ms 17 aos y que el 80% tiene
mximo 52 aos, tambin podemos deducir que el 70% de las personas tiene
edad entre los 17 y 52 aos.

Percentiles:

P1 = X0.01

; P2 = X0.02 ; ........ ;

P99 = X0.99

Son puntos que dividen al conjunto de datos en 100 partes cada una con 1%
de los datos, por ejemplo
P20 = X0.20 = 23 aos ;

Mg. Beatriz Castaeda S.

P95 = X0.95 = 57 aos

17

BIOESTADISTICA

Indica que el 20% de las personas tiene mximo 20 aos y que slo el 5% de
las personas tiene ms de 57 aos, tambin podemos deducir que el 75% de
las personas tienen edad entre los 23 y 57 aos.

OBTENCIN DE LAS CUANTILAS


a) Para datos no agrupados. Luego de ordenar los datos ascendentemente
se determina la cuantila p como el valor que ocupa el lugar r
X p = X(r)
Donde:

r=nxp

(si r no es entero redondear al entero superior)

Ejemplo 1.5. Consideremos nuevamente los datos del ejemplo 1.1 ordenados
segn edad (Tabla 2)

Arreglo ordenado segn edad


Varones
% de
Orden Sujeto Edad Sobresaturacin
1
14
20
80
2
1
23
40
3
15
23
65
4
4
25
86
5
10
26
52
6
17
27
87
7
23
27
80
8
28
27
73
9
9
29
112
10
27
29
88
11
2
31
86
12
13
31
88
13
24
32
47
14
26
36
58
15
30
42
67
16
6
43
66
17
16
43
79
18
8
48
90
19
22
48
78

Mg. Beatriz Castaeda S.

Mujeres
% de
Orden Sujeto Edad Sobresaturacin
1
7
23
98
2
12
23
35
3
25
23
46
4
20
25
69
5
6
27
58
6
10
30
66
7
2
33
86
8
13
35
55
9
16
36
91
10
28
37
120
11
11
38
52
12
1
40
65
13
9
41
80
14
19
41
82
15
22
42
116
16
4
44
89
17
27
44
84
18
15
47
77
19
26
48
107

18

BIOESTADISTICA

20
21
22
23
24
25
26
27
28
29
30
31

20
12
3
19
31
25
5
18
11
29
21
7

53
55
58
59
60
62
63
63
64
65
66
67

106
137
111
110
57
74
106
56
88
118
110
123

20
21
22
23
24
25
26
27
28
29

3
23
14
18
8
21
29
24
5
17

49
49
50
53
56
57
57
60
63
74

76
73
127
75
146
84
123
87
142
128

Para la variable Edad


Varones

Mujeres

X0.50 = 43 aos (np = 15.5)

X0-50 = 42 aos (np = 14.5)

X0.25 = 27 aos (np = 7.75)

X0.25 = 35 aos (np = 7.25)

X0.90 = 64 aos (np = 27.9)

X0.90 = 60 aos (np = 26.1)

b) Para datos agrupados


1) Agrupamiento por conteo individual. Datos agrupados ascendentemente
xi
X1
X2
...
Xj-1
xj
...
xk

ni
n1
n2
...
nj-1
nj
...
nk

Ni
N1
N2
...
Nj-1
Nj
...
Nk

Utilizamos las frecuencias acumuladas para determinar la cuantila, de esta


manera
Xp = xj

Si y slo si

Nj np

y Nj-1 < np

Ejemplo 1.6. Del ejemplo 1.4. y del cuadro 4 obtenemos las frecuencias
acumuladas con las que determinamos los percentiles 10, 25, 50, 75, 90 y 95

Mg. Beatriz Castaeda S.

19

BIOESTADISTICA

n de
hijos
(xi)
0
1
2
3
4
5
6
Total

n de
familias
(ni)
4
8
11
15
10
13
3
64

N acumulado
de familias
Ni
4
12
23
38
48
61
64

P10 = X0.10 = 1 pues np = 0.10 x 64 = 6.4


P25 = X0.25 = 2 pues np = 0.25 x 64 = 16
P50 = X0.50 = 3 pues np = 0.50 x 64 = 32
P75 = X0.75 = 4 pues np = 0.75 x 64 = 48
P90 = X0.90 = 5 pues np = 0.90 x 64 = 57.6
P95 = X0.95 = 5 pues np = 0.95 x 64 = 60.8

2) Datos agrupados por intervalos: Consideramos las frecuencias simples


(ni) y las frecuencias acumuladas (Ni).
Intervalos
L1I L1s
L2I L2s
..........
Lj-1 I L1j-1 s
LjI Ljs
.........
L1I L1s

ni
n1
n2
...
nj-1
nj
...
nk

Ni
N1
N2
...
Nj-1
Nj
...
Nk

1) Se determina el intervalo que contiene a la cuantila Xp como eIntervalo j:

LjI Ljs

2)

X p = L jI + c

Si y slo si

(np N )
j 1

nj

Mg. Beatriz Castaeda S.

Nj np

y Nj-1 < np

, donde

20

BIOESTADISTICA

c:

Amplitud del intervalo j

LjI: Frontera de clase del intervalo j (el punto medio entre los extremos
consecutivos para intervalos discretos) o lmite inferior para intervalos
continuos.

Ejemplo 1.7. Consideremos la distribucin de la edad de la muestra de


mujeres del ejemplo 1.1 presentadas en el

cuadro 2 para la cual

obtendremos los percentiles 25, 50 y 95.

Edad de mujeres sometidas a evaluacin de


porcentaje de saturacin de colesterol en bilis
N de
Edad (aos) mujeres
20 - 29
5
30 - 39
6
40 - 49
10
50 - 59
5
60 - 69
2
70 - 79
1
Total
29

Porcentaje
17%
21%
34%
17%
7%
3%
100%

N acumulado
5
11
21
26
28
29

P25 = 29.5 + 10 (7.25 5) = 33.5 aos


6
P50 = 39.5 + 10 (14.5 11) = 43 aos
10
P95 = 59.5 + 10 (27.55 26) = 67.25 aos
2

Mg. Beatriz Castaeda S.

21

BIOESTADISTICA

Otra manera de obtener las cuantilas es a partir del grfico de frecuencias


acumuladas en porcentaje, para lo cual el grfico debe ser hecho a escala para
facilitar la aproximacin, como se ilustra en el grfico 4 para el percentil 50, el
cual aproximadamente sera igual a 43 aos.

% de mujeres

Grfico 4
Distribucin acumulada de las mujeres
segn edad

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

20

29

39

49

59

69

79

Total

43 Edad (aos)

Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, 1997 (36)

1.2.2. Medidas de dispersin


1. Amplitud o rango:
Mide la variacin total indicando los valores mnimo y mximo del conjunto de
datos, por ejemplo para las edades de las mujeres en el ejemplo 1.1,

Rango: 23 74 aos

2. Varianza y desviacin estndar


Miden la dispersin de los datos indicando en cuanto tienden a variar los datos
con respecto a la media.

Mg. Beatriz Castaeda S.

22

BIOESTADISTICA

2 =

( xi )2
i

N
n

S2 =

(x

x)

n1

x
1

N
n

2
i

2
i

2 Varianza Poblaciona l

n x

n1

Desviacin estndar

Varianza muestral

= 2

S=

S2

La varianza indica cuan representativa de los datos es la media aritmtica, ya


que una varianza pequea indica que los datos estn cerca de la media, en
cambio una varianza grande indica que los datos estn alejados de la media.
La varianza expresa la dispersin en unidades al cuadrado y la desviacin
estndar indica la tendencia de dispersin alrededor de la media en las mismas
unidades de los datos.

Ejemplo 1.8. Los siguientes son los niveles de hemoglobina (g/100ml) de 10


nios que reciben tratamiento para anemia hemoltica:
9,1 ; 10,0 ; 11,4 ; 12,4 ; 9,8 ; 8,3 ; 9,9 ; 9,1 ; 7,5 ; 6,7

x=

9,1 + 10,0 + ... + 6,7 94,2


=
= 9,42 g / 100ml
10
10

9,1 2 + 10,0 2 + ... + 6,7 2 10(9,42) 2


913,42 887,364
S =
=
= 2,895
9
9
2

Luego

S = 1,70 g/100ml

Mg. Beatriz Castaeda S.

23

BIOESTADISTICA

Los nios tienen en promedio 9,42 g/100ml de hemoglobina y esta tiende a


variar en 1,7g/100ml respecto a la hemoglobina promedio.

Coeficiente de Variacin: C .V . =

S
x 100
x

Indica la variabilidad de los datos en unidades porcentuales de media.


Esta medida nos indica cuan grande o pequea es la desviacin estndar.
Se utiliza para comparar la variabilidad de 2 o ms grupos de datos.

Por ejemplo para la hemoglobina de los nios C .V . =

1.7
x 100 = 18%
9.42

Calculo de la varianza para datos agrupados


k

S2 =

( x i x ) 2 ni

Donde:

n1

2
i

ni n x

Varianza muestral

n1

K: Nmero de intervalos
Xi: Punto medio de cada intervalo
ni: Frecuencia simple para el intervalo

Ejemplo 1.9. La siguiente tabla muestra la distribucin de edades de casos de


una cierta enfermedad del ejemplo 1.3 y cuadro 6
Edad (aos)
5 14
15 24
25 34
35 44
45 54
55 64
Total

Mg. Beatriz Castaeda S.

xi
9.5
19.5
29.5
39.5
49.5
59.5

ni
5
10
20
22
13
5
75

xi ni
47.5
195.0
590.0
869.0
643.5
297.5
2645.5

Xi2 ni
451.25
3802.50
17405.00
34325.50
31853.25
17701.25
105538.75

24

BIOESTADISTICA

x=

2645.5
= 35.27 aos
75

105538 .75 75( 35.27 )2


S =
= 165.42
74
2

C .V . =

S = 12.86 aos

12.86
x 100 = 36.5%
35.27

Los resultados nos indican que los pacientes en promedio tienen 35 aos y
que sus edades tienden a dispersase en aproximadamente 13 aos respecto
de la edad promedio, es decir, la dispersin de la edad es el 36,5% de la edad
promedio.

1.2.3. Medidas de forma


Indican la direccin en la dispersin de los datos respecto de su centro y
completan la descripcin de las distribuciones de frecuencia.

Asimetra
Indica la deformacin horizontal de las distribuciones de frecuencia con
respecto a la media aritmtica. Para una distribucin unimodal tenemos tres
situaciones:

a) La distribucin

es simtrica, en cuyo caso la media, mediana y moda

coinciden y las frecuencias simples para cada punto equidistante de la


media son iguales.

Mg. Beatriz Castaeda S.

25

BIOESTADISTICA

Mo =

= Me

Grfico 5. Distribucin simtrica


b) La distribucin es asimtrica, es decir, los datos se concentran a uno de los
extremos y aparecen con poca frecuencia hacia el otro extremo.

Asimetra Negativa

Me Mo

Asimetra Positiva

Mo Me x

Grfico 6. Distribuciones asimtricas

Coeficiente de asimetra de Pearson: S kP =

3 ( x Me )
S

Si SkP = 0, la distribucin es simtrica


Si S kP < 1 , la distribucin tiene una asimetra leve
Si 1 < S kP < 2 , la distribucin tiene asimetra moderada
Si S kP > 2 , la distribucin tiene una asimetra severa

Mg. Beatriz Castaeda S.

26

BIOESTADISTICA

Curtosis
Es una medida de la deformacin vertical de una distribucin de frecuencias, es
decir, nos indica el apuntamiento o achatamiento de la curva, lo cual est
relacionado con la dispersin de los datos.

Platicrtica

Mesocrtica

Leptocrtica

Grfico 7. Clasificacin de distribuciones segn curtosis

( x0.75 x0.25 )
2 ( x0.90 x0.10 )

Coeficiente de curtosis:

K=

Disribucin platicrtica:

k 0 , es decir, los datos estn ampliamente

esparcidos y la curva es aplanada.

Distribucin Mesocrtica: k 0.25 , esto ocurre cuando los datos tienen una
dispersin moderada. Por ejemplo en el caso de la distribucin normal
mesocrtica K = 0.263

Distribucin Leptocrtica: k 0.5 , esto ocurre cuando los datos estn


concentrados en un intervalo estrecho, es decir, tienen una dispersin
pequea.

Mg. Beatriz Castaeda S.

27

BIOESTADISTICA

PRACTICA DOMICILIARIA 1
1. Los siguientes datos son parte de los resultados de una investigacin
acerca del reuso de aguas residuales y su impacto en los cultivos. Aqu se
presentan los datos recopilados para el logaritmo del coliforme fecal en el
agua de irrigacin y la verdura para una muestra de 100 productos
agrcolas, los que fueron irrigados con agua de diferente calidad bacteriana.
Se indica tambin la procedencia, el tipo de crecimiento y la calificacin de
cada producto para el consumo humano.
La codificacin utilizada es:

Cuadro 7. Codificacin de categoras


Variable
Categora
Cdigo
Cieneguilla (agua de ro)
1
Procedencia San Juan (agua tratada)
2
(Proced)
San Martn (agua residual)
3
Callao (agua residual)
4
VBT (verdura bajo tierra)
1
Tipo de
Crecimiento VFT (verdura a flor de tierra) 2
(T.C.)
VTA (verdura de tallo alto)
3
1
Calificacin Aceptado
del producto Provisionalmente aceptado
2
(Calif-P)
Rechazado
3
Fuente: Evaluacin de Riesgos para la salud por el uso de aguas residuales en agricultura.
Anexo 3: Aspectos Microbiolgicos. CEPIS-OPS. Lima, Per. 1990.

Tabla 3. Data de la contaminacin bacteriana y calificacin de verduras


Caso Proced T.C. Logcfa logcfv Calif-P

1
2
3
4
5
6
7
8
9
10
11

1
2
3
3
3
3
3
3
3
3
3

1
1
1
1
1
1
1
1
1
1
1

1.30
5.48
7.70
7.60
7.60
8.20
8.10
7.56
8.10
7.70
8.10

0.47
2.20
2.20
0.48
0.30
1.76
0.30
0.92
2.78
2.90
2.45

Mg. Beatriz Castaeda S.

1
3
3
1
1
3
1
2
3
3
3

Caso

Proced

T.C.

51
52
53
54
55
56
57
58
59
60
61

3
3
3
3
3
3
3
3
3
3
3

2
2
2
2
2
2
2
2
2
2
2

Logcfa logcfv

7.56
8.10
8.20
7.70
8.20
8.10
7.60
8.13
8.13
7.70
8.13

0.79
2.24
4.72
2.60
5.20
0.66
2.17
0.95
4.11
2.75
4.11

Calif-P

2
3
3
3
3
1
3
1
3
3
3

28

BIOESTADISTICA

Caso Proced T.C. Logcfa logcfv Calif-P

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

4
4
4
4
4
4
4
4
4
4
4
4
4
4
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
3

1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2

7.70
7.78
7.90
7.81
9.96
7.70
7.60
7.60
7.70
7.70
8.96
7.78
7.70
7.60
1.90
2.36
1.90
1.90
3.48
2.36
1.30
1.30
2.36
2.36
1.30
3.48
1.30
3.48
5.48
4.34
5.48
5.48
4.34
8.13
7.56
8.10
8.20
7.56
8.10

2.17
0.73
0.40
3.13
2.30
2.14
4.47
3.01
2.14
0.30
3.14
0.50
0.34
4.20
0.41
0.73
0.30
1.02
0.30
1.64
0.36
0.34
0.30
0.64
0.43
2.84
0.30
0.86
1.62
3.14
1.23
1.46
3.14
2.27
3.20
3.28
4.20
1.07
3.28

3
2
1
3
3
3
3
3
3
1
3
1
1
3
1
2
1
1
1
2
1
1
1
1
1
3
1
2
3
3
2
2
3
3
3
3
3
3
3

Caso

Proced

T.C.

62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100

3
3
3
3
3
3
3
3
3
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
4
1
1
1
1
1
1
2
2
3
3
3
4
4
4

2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
3
3
3
3

Logcfa logcfv

8.10
7.70
8.20
7.70
8.10
7.70
8.10
7.60
8.13
7.78
7.90
7.81
7.78
7.60
7.70
8.96
7.90
8.96
7.70
7.90
7.70
7.70
7.70
7.81
7.81
1.30
1.30
3.48
1.30
1.90
2.36
5.48
4.34
8.20
7.60
7.70
7.60
7.70
7.81

2.10
2.52
5.14
2.85
3.94
3.17
0.64
0.69
3.38
2.52
0.69
1.59
1.21
0.63
0.54
2.61
2.27
2.21
0.49
3.69
1.97
1.66
1.84
1.61
3.02
0.85
0.85
0.30
0.30
0.30
0.36
1.52
2.37
1.04
2.11
3.10
0.30
1.28
0.30

Calif-P

3
3
3
3
3
3
1
2
3
3
2
2
2
2
1
3
3
3
1
3
3
3
3
2
3
1
1
1
1
1
1
2
3
2
3
3
1
3
1

Fuente: Evaluacin de Riesgos para la salud por el uso de aguas residuales en agricultura.
Anexo 3: Aspectos Microbiolgicos. CEPIS-OPS. Lima, Per. 1990

a) Obtener la distribucin de frecuencia cada variable. Asgnele ttulos.


b) Elaborar los siguientes grficos:

Mg. Beatriz Castaeda S.

29

BIOESTADISTICA

Histograma de frecuencias para logcfa y logcfv

Grfico de barras para procedencia

Grfico pastel para tipo de crecimiento

Grfico pastel para la calificacin del producto

c) Obtener las medidas de resumen para las variables cuantitativas (mnimo,


mximo, cuartiles, media, desviacin estndar, coeficiente de variacin).
Interpretar los resultados.
d) Obtener las tablas de frecuencia bivariante para
- Procedencia y calificacin del producto
- Tipo de crecimiento y procedencia de los productos.
e) Comparar el logcfv por tipo de crecimiento.
2. Los siguientes datos fueron obtenidos al aplicar una encuesta a una
muestra de personas a las que se les realiz una densitometra, con el
objeto de establecer la asociacin de variables con la densidad de masa
sea. Las variables consideradas fueron: Raza, Sexo, Edad, Contextura,
Ejercicio fsico a la semana (ejercicio), Nmero de cigarrillos al da
(cigarrillos), Tratamiento con cortisona (Tcortisona), Ingesta de lcteos
(lcteos), densidad de masa sea en g/cm (DMO).
Persona

Raza

1
2
3
4
5
6
7
8
9

Mestiza
Blanca
Negra
Blanca
Blanca
Mestiza
Negra
Mestiza
Blanca

Sexo Edad

F
F
F
M
F
F
M
F
F

42
36
28
51
47
25
53
44
70

Mg. Beatriz Castaeda S.

Contextura

Delgada
Gruesa
Gruesa
Mediana
Delgada
Delgada
Gruesa
Delgada
Mediana

Ejercicio Cigarrillos Tcortisona Lcteos

2
0
4
2
3
1
1
0
1

2
1
2
6
1
2
0
5
0

No
No
si
si
si
No
si
No
No

Mucho
Poco
Mucho
Nada
Nada
Poco
Poco
Nada
Mucho

30

DMO

0.79
0.89
1.12
0.73
0.69
0.99
0.84
0.74
0.78

BIOESTADISTICA

10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

Blanca
Blanca
Mestiza
Mestiza
Blanca
Negra
Negra
Blanca
Blanca
Negra
Blanca
Negra
Blanca
Blanca
Blanca
Blanca
Mestiza
Blanca
Negra
Blanca
Blanca

F
F
M
F
F
F
F
M
F
F
M
F
F
F
M
F
F
F
M
F
F

32
46
48
26
64
71
48
62
55
68
73
77
56
80
49
38
64
45
82
31
67

Gruesa
Delgada
mediana
Gruesa
Delgada
Delgada
Delgada
Gruesa
Gruesa
Mediana
Mediana
Delgada
Delgada
Delgada
Mediana
Gruesa
Gruesa
Gruesa
Mediana
Delgada
Gruesa

3
4
2
1
1
0
0
2
1
1
2
0
0
1
3
1
3
3
2
3
1

4
4
0
2
5
3
1
2
1
0
4
2
5
6
0
1
1
0
2
0
1

No
si
si
No
si
si
si
No
si
No
No
No
si
si
No
No
si
si
si
No
No

Mucho
Poco
Nada
Nada
Poco
Nada
Poco
Poco
Mucho
Mucho
Nada
Poco
Poco
Nada
Poco
Mucho
Mucho
Poco
Nada
Nada
Nada

a) Obtener la distribucin de frecuencia de raza, sexo, edad, contextura,


ejercicio semanal. Asgnele ttulos.
b) Elaborar los siguientes grficos:
-

Histograma de frecuencias para edad

Grfico de barras para raza

Grfico pastel para sexo

Grfico pastel para contextura

Grfico de barras para ejercicio semanal

c) Obtener las medidas de resumen para las variables cuantitativas (mnimo,


mximo, cuartiles, media, desviacin estndar, coeficiente de variacin) .
Interpretar los resultados.
d) Comparar la edad entre hombres y mujeres.
e) Comparar la DMO por raza.

Mg. Beatriz Castaeda S.

31

1.01
0.70
0.83
1.07
0.68
0.71
0.92
0.77
0.84
0.93
0.72
0.82
0.66
0.68
1.03
0.97
0.81
0.84
0.78
1.04
0.72

BIOESTADISTICA

1.2.4. MEDICIN DE DATOS NOMINALES


Proporcin
Una proporcin es la comparacin por cociente entre el nmero de elementos
de un subconjunto y el nmero de elementos del conjunto al que pertenece el
subconjunto. Indica que parte del todo es el subconjunto.

p=

a
a+b

Ejemplo:

p=

175 casos de cncer pulmonar


= 0,09
1956 casos de todos los tipos de cncer

Porcentaje
Un porcentaje es una proporcin multiplicada por 100. Indica la parte en
unidades por ciento, esta medida es ms fcil de asimilar y trasmitir que la
proporcin, en el ejemplo anterior
El 9% de los casos de cncer fueron de cncer pulmonar.

Razn
Una razn es la comparacin por cociente entre dos cifras de diferente o similar
naturaleza.

R=

a
b

Sean las siguientes razones:


R=

380 camas
= 4 camas / enfermera
95 enfermeras

Es un indicador de la magnitud de trabajo de las enfermeras


R = 10 hab / vivienda

Mg. Beatriz Castaeda S.

32

BIOESTADISTICA

A esta razn se suele denominar ndice de hacinamiento, nos indica cuan


densa es la poblacin por vivienda

R=

20 cirujanos
= 1 cirujano / 2 int ernistas .
40 int ernistas

Esta razn nos indica la relacin entre la cantidad de 2 clases de especialistas


en medicina.

R=

R1 18 alumnos / docente
=
= 1.8 R = 180%
R2 10 alumnos / docente

Esta razn compara dos razones y nos indica que los docentes del grupo 1
tienen 80% ms de intensidad de trabajo que los docentes del grupo 2, para la
interpretacin a la razn la hemos expresado en unidades porcentuales del
denominador.

MEDICION EPIDEMIOLOGICA
TASA
Una tasa es una comparacin por cociente entre un nmero de eventos
ocurridos en un tiempo y lugar dados y la poblacin que estuvo expuesta al
riesgo de que le ocurrieran dichos eventos en la misma poca y en ese mismo
lugar

Tasa =

a x base
a+b

La tasa es la expresin numrica del riesgo al que estuvo sometida la


poblacin.

Mg. Beatriz Castaeda S.

33

BIOESTADISTICA

Los datos que integran una tasa ocurrieron en un perodo anterior al actual y en
cierto modo permiten anticipar, con un determinado valor numrico, la
probabilidad de que exista ese riesgo para

la poblacin en perodos

inmediatos, particularmente si las condiciones de dicha poblacin se mantienen


estables.
En Epidemiologa, usualmente los eventos estn constituidos por casos de
enfermedad o defunciones por diversas afecciones.
Las tasas estn constituidas por tres elementos:
1) El numerador del cociente, que consiste en el nmero de veces que ocurri
el evento o suceso en estudio.
2) El denominador del cociente que es la poblacin expuesta al riesgo de que
le ocurra el fenmeno.
3) Una constante por la cual se multiplica el resultado del cociente. Debido a
que la divisin resulta en una cifra inferior a la unidad el resultado suele
multiplicarse por 100, 1.000, 10.000, o 100.000 para una mejor comprensin
y fcil lectura.

Tasas de uso frecuente


N de defunciones ocurridas en
Tasa anual bruta de mortalidad =

una regin y ao dado


x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

N de defunciones nios menores de un ao


Tasa de mortalidad inf antil =

ocurridas en una regin y ao dado


x 1000
N total de nacimientos vivos ocurridos en la
poblacinen de la misma regin y ao dado

Mg. Beatriz Castaeda S.

34

BIOESTADISTICA

N de nacimientos vivos ocurridos


Tasa anual bruta de natalidad =

en una regin y ao dado


x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

N de enfermos nuevos de una afeccin


Tasa de incidencia =

aparecidos en una regin y ao dado


x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

N de personas de una regin que tienen


Pr evalencia =

la enfermedad en un tiempo especificado


x 1000
Estimacin de personas en la poblacin
en la misma regin y tiempo especificado

Ejemplo 1.10
Cuadro 8. Casos con calcificaciones pulmonares en dos poblaciones
con fbrica de asbestos, segn distancia de los domicilios
a la respectiva fbrica
Poblacin A
Poblacin B
Distancia
Habitantes
Habitantes
(Km)
N
%
Casos
N
%
Casos
0 0,9
1 531 13,8 279
5 438
9,1
462
1,0 1,9
1 904 17,2
69
4 489
7,5
117
2,0 2,9
2 599 23,5 141
10 351 17,4
802
3,0 3,9
4 672 42,2
2
36 994 62,0
37
4,0 y ms
368
3,3 119
2 384
4,0
665
TOTAL
11 074 100,0 610
59 656 100,0 2083
Fuente: Centro Panamericano de Ecologa Humana y Salud. Evaluacin Epidemiolgica
de riesgos causados por agentes qumicos ambientales. Edicin de 1985. Mxico: OPS;
1985.
Con la informacin del cuadro obtenemos:
Tasa de A =

610
x1000 = 55,1 casos de calcificaciones / 1000 habi tan tes
11074

Mg. Beatriz Castaeda S.

35

BIOESTADISTICA

Tasa de B =

2083
x1000 = 34,9 casos de calcificaciones / 1000 habi tan tes
59656

Al comparar por cociente R =

Tasa de A
55,1
x100 =
x100 = 158%
34,9
Tasa de B

Lo que nos indica que los habitantes de la poblacin A tienen un riesgo 58%
mayor al de la poblacin B para tener calcificaciones pulmonares.

AJUSTE DE TASAS
Cuando dos poblaciones tienen diferente estructura de poblacin no es
apropiado comparar las tasas globales ya que est comparacin podra no ser
vlida debido a stas diferencias, lo que nos permite, adems explicar las
razones de la diferencia y las posibles causas del mayor riesgo en una de las
poblaciones.

El mtodo directo de ajuste de tasas plantea


1 Definir cul poblacin ser sometida a las condiciones de la otra
(Usualmente a la poblacin menor se le aplican las tasas especficas de la
mayor)
2 Con las tasas especficas de la poblacin mayor se calculan los casos
esperados de la poblacin menor y a partir de ellos se obtiene la nueva tasa
global como sigue:
Casos esperados = Poblacin x tasa
Constante
Ejemplo:

Casos esperados = 1531 x 85,0 = 130


1000

Mg. Beatriz Castaeda S.

36

BIOESTADISTICA

Cuadro 9. Tasas especficas de calcificaciones pulmonares


por distancias en dos poblaciones
Poblacin A
Poblacin B
Distancia
Habitantes
Habitantes
(Km)
N
Casos Tasa
N
Casos Tasa
0 0,9
1 531
279 182,2
5 438 462
85,0
1,0 1,9
1 904
69
36,2
4 489 117
26,1
2,0 2,9
2 599
141
54,3
10 351 802
77,5
3,0 3,9
4 672
2
0,4
36 994
37
1,0
4,0 y ms
368
119 323,4
2 384 665 278,9
TOTAL
11 074 610
55,1
59 656 2083
34,9
Fuente: Centro Panamericano de Ecologa Humana y Salud. Evaluacin
Epidemiolgica de riesgos causados por agentes qumicos ambientales. Edicin
de 1985. Mxico: OPS; 1985.

Cuadro 10. Casos esperados en poblacin A,


bajo condiciones de la poblacin B
Distancia
(Km)

Poblacin A
Habitantes

0 0,9
1,0 1,9
2,0 2,9
3,0 3,9
4,0 y ms

Tasas
Casos esperados en A
especificas bajo condiciones de B
de B

1 531
1 904
2 599
4 672
368

85,0
26,1
77,5
1,0
278,9

130
50
201
5
103

TOTAL
11 074
489
Fuente: Centro Panamericano de Ecologa Humana y Salud. Evaluacin
Epidemiolgica de riesgos causados por agentes qumicos ambientales. Edicin
de 1985. Mxico: OPS; 1985.
Tasa ajustada = Suma de casos esperados x constante
Poblacin
Ejemplo: Tasa ajustada =

489 x 1000 = 44,2


11074

Tasas iniciales
A
B
55,1 34,9

Tasas corregidas
A(ajustada) B
44,2
34,9

Mg. Beatriz Castaeda S.

37

BIOESTADISTICA

La comparacin inicial (55,1/34,9 = 1,58) nos estara indicando que la


poblacin A tiene un riesgo 58% mayor al de la poblacin B para tener
calcificaciones pulmonares.

La comparacin luego del ajuste (44,2/34,9 = 1,3) nos indica que si la poblacin
A estuviera sometida a condiciones de exposicin al asbesto iguales a las que
tiene B, el riesgo de tener calcificaciones pulmonares en A sera 30% mayor
que en la poblacin B, lo cual se explicara por la distribucin de la poblacin
segn distancia a la fbrica de asbestos.

Riesgo relativo (RR)


El riesgo relativo de una enfermedad (RR), es la razn de incidencia en
personas expuestas a un factor con respecto a la incidencia en las personas no
expuestas.
El riesgo relativo puede calcularse slo a partir de un estudio de cohorte o
prueba clnica en donde se identifica primero a un grupo de personas
expuestas a un factor y otro no expuesto, las que se evalan durante un tiempo
para determinar que personas desarrollan la enfermedad

Estudios de cohorte Incidencia acumulativa


Personas
Enfermos
No enfermos
Total

Expuestas No expuestas
A1
A0
N1 A1
N0 - A0
N1
N0

RR =

Mg. Beatriz Castaeda S.

Total
A
N-A
N

A1 / N 1
R EXP
=
A0 / N 0 R No Exp

38

BIOESTADISTICA

As para interpretar este coeficiente lo comparamos con la unidad, de manera


que
-

Si RR = 1, nos indica que el factor de exposicin no es un factor de


riesgo para la enfermedad, pues se tiene la misma incidencia o riesgo de
enfermedad para las personas expuestas que para las no expuestas.

Si RR > 1, nos indica que el factor de exposicin es un factor de riesgo


para la enfermedad, ya que para las personas expuestas se tiene mayor
incidencia de la enfermedad que para las personas no expuestas.

Si RR < 1, nos indica que el factor de exposicin es un factor de


proteccin para la enfermedad, ya que para las personas expuestas se
tiene menor incidencia de la enfermedad que para las no expuestas.

Estimacin intervlica
Para que podamos concluir, con certeza, que el factor considerado es un factor
de riesgo para la enfermedad, es necesario que el valor obtenido para el RR
sea significativamente mayor que 1, por ello para estar seguros de este
resultado se obtiene la estimacin intervlica al 95% de confianza para RR;
cuyos lmites se calculan con la siguiente expresin:

L=e

ln( RR ) 1.96

N 1 A1 N 0 A 0
+
N1A1
N0 A0

L: es el lmite de la estimacin intervlica

Mg. Beatriz Castaeda S.

39

BIOESTADISTICA

e = 2.7182

es el nmero neperiano

ln(RR):

es el logaritmo natural del RR

Si el intervalo obtenido tiene lmite inferior mayor que 1, entonces concluimos


que el factor considerado es un factor de riesgo para la enfermedad.

Si el intervalo obtenido tiene lmite inferior menor que 1, entonces no podemos


concluir que el factor considerado sea un factor de riesgo, porque con 95% de
probabilidad se est estimando que es posible que RR = 1, es decir que haya
la misma incidencia para los expuestos que para los no expuestos.

Ejemplo 1.15
Asuma que de 100 individuos expuestos 20 desarrollaron la enfermedad. En
un grupo de 200 individuos no expuestos, 25 desarrollaron la enfermedad. As
en un arreglo de 2x2 tenemos:
Individuos
Enfermos
No enfermos
Total

Expuestos No expuestos
20
25
80
175
100
200

Total
45
255
300

RR = (20/100) / (25/200) = 1.60


Este resultado nos indica que para los expuestos se tiene un 60% ms de
incidencia de la enfermedad que para los no expuestos.

Li = e

ln( 1.60 ) 1.96

100 20 200 25
+
100 ( 20 ) 200 ( 25 )

Mg. Beatriz Castaeda S.

= 0.935

40

BIOESTADISTICA

Ls = e

ln(1.60 ) + 1.96

10020 20025
+
100 ( 20 ) 200 ( 25 )

= 2.74

Luego el intervalo de confianza al 95% es:

0.935 2.74

Este resultado nos indica que no podemos concluir que el factor de exposicin
sea un factor de riesgo, pues la diferencia encontrada no es significativa.

Odds Ratio (OR)


En estudios de caso-control, en los cuales los investigadores determinan el
nmero de controles, no es apropiado estimar las tasas de incidencia. No
obstante puede realizarse un clculo de riesgo relativo, llamado Odds Ratio
(OR)
El Odds Ratio es el cociente entre la razn de expuestos a no expuestos en los
casos, y la razn de expuestos y no expuestos en los controles
Personas
Casos
Controles

Expuestos No expuestos
a
b
c
d

OR

Total
N1
N0

a b
axd
=
c d
b xc

Esta estimacin ser correcta si el grupo de control es seleccionado de manera


que refleja la distribucin de exposicin de la poblacin.

Mg. Beatriz Castaeda S.

41

BIOESTADISTICA

Aqu tambin, para interpretar este coeficiente debemos compararlo con la


unidad, de manera que
-

Si OR = 1, nos indica que el factor de exposicin no es un factor de


riesgo para la enfermedad, pues la relacin de expuestos a no expuesto
es la misma para casos y controles.

Si OR > 1, nos indica que el factor de exposicin es un factor de riesgo


para la enfermedad,

ya que la proporcin de casos que han sido

expuestos es mayor que la proporcin de controles que han sido


expuestos.
-

Si OR < 1, nos indica que el factor de exposicin es un factor de


proteccin para la enfermedad, ya que aqu la porcin de expuestos es
mayor en los controles que en los casos.

Estimacin intervlica
Para que podamos concluir, con certeza, que el factor considerado es un factor
de riesgo para la enfermedad, es necesario que el valor obtenido para el OR
sea significativamente mayor que 1, por ello para estar seguros de este
resultado se obtiene la estimacin intervlica al 95% de confianza para OR

L=e

ln( OR ) 1.96

1 1 1 1
+ + +
a b c d

donde

L:

es el lmite de la estimacin intervlica

e = 2.7182 :

es el nmero neperiano

ln(OR):

es el logaritmo natural del OR

Mg. Beatriz Castaeda S.

42

BIOESTADISTICA

Si el intervalo obtenido tiene lmite inferior mayor que 1, entonces concluimos


que el factor considerado es un factor de riesgo para la enfermedad.
Si el intervalo obtenido tiene lmite inferior menor que 1, entonces no podemos
concluir que el factor considerado sea un factor de riesgo, porque con 95% de
probabilidad se est estimando que es posible que OR = 1, es decir que haya
la misma proporcin de expuestos en los casos y controles.

Ejemplo 1.16
En un estudio de casos-control de dieta con frituras y cncer pancretico
(Norell et al 1986), los siguientes datos fueron obtenidos:

Cuadro 11. Exposicin a dieta con frituras para casos y Controles


Individuos
Casos
Controles
Total

Dieta con
frituras
53
53
106

No dieta con
frituras
43
85
128

Total
96
138
234

Fuente: Ahlbom, a y Norell, s. Introduction to Modern Epidemiology. Second


Edition. Epidemiology REources Inc. 1990

OR = 53/43 = 1.98
53/85
Este resultado nos indica que hubo 98% ms de exposicin a la dieta con
frituras para los casos que para los controles, lo que probablemente influy en
el desarrollo del cncer.
Estimacin intervlica:

Li = e

ln( 1.98 ) 1.96

1
1
1
1
+
+
+
53
43
53
85

Mg. Beatriz Castaeda S.

= 1.167
43

BIOESTADISTICA

LS = e

ln( 1.98 ) 1.96

1
1
1
1
+
+
+
53
43
53
85

Luego el intervalo de confianza al 95% es:

= 3.359
1.167 3.359

Este resultado nos indica que podemos concluir que la dieta con frituras es un
factor de riesgo para el desarrollo de cncer pancretico, pues la diferencia
encontrada es significativa.

Prctica domiciliaria 2
1. En un estudio para examinar la relacin entre clase socio-econmica y tipo
ms frecuente de uso de tarjetas de crdito, se entrevistaron a 1500
usuarios de tarjetas de crdito y se obtuvo la informacin que aparece en la
tabla siguiente:
Clasificacin
Uso ms frecuente de tarjeta de crdito
Socio-econmica Entretenimiento Adquisicin de bienes Total
Alta
36
39
75
Media alta
114
186
300
Media
174
426
600
Media baja
72
228
300
Baja
41
184
225
Total
437
1063
1500
a) Elabore un grfico para comparar el uso de tarjeta de crdito segn
clasificacin socio-econmica
b) Quines son los mayores usuarios de tarjeta de crdito?
c) Analice y compare el uso de tarjeta de crdito para entretenimiento

Mg. Beatriz Castaeda S.

44

BIOESTADISTICA

2. A continuacin aparecen las frecuencias porcentuales de concentracin de


plomo en la sangre de los trabajadores de una fbrica de pinturas
examinados en 1989 y otro en 1997.
Plomo en la
% de trabajadores
Sangre (g/dl)
1989
1997
10 19
11
38
20 29
12
15
30 39
14
13
40 49
15
15
50 59
17
10
60 69
13
7
70 79
10
1
80 90
8
1
N trabajadores
280
325
a) En cul de los dos aos tienden los trabajadores a presentar niveles
ms bajos de plomo en la sangre?
b) Elabore un grfico de frecuencias acumuladas para cada ao.
c) Obtenga los percentiles 10 y 90 para cada ao, compare e interprete.
d) Obtenga las media, coeficiente de variacin, y coeficiente de asimetra
para cada ao. Interprete.
e) Si plomo en la sangre mayor de 45 g/dl es indicador de riesgo de
enfermedades respiratorias y dao cerebral, calcule la tasa de
trabajadores en riesgo para cada ao. Interprete.
3. En un estudio realizado para evaluar el riesgo de infarto de miocardio (IM)
se sometieron a seguimiento un grupo de mdicos, a quienes se les
administr aspirina o placebo, obtenindose los siguientes resultados:
Mdicos
IM Sin IM Total
Tomaron Aspirina 139 10898 11037
Tomaron Placebo 239 10795 11034
Fuente: Dawson, B y Trapo R. Bioestadstica Mdica. 2 Edicin, Manual Moderno 1997 (28)

Mg. Beatriz Castaeda S.

45

BIOESTADISTICA

Obtenga el riesgo de infarto de miocardio por tomar aspirina. Interprete.


4. Compare e interprete las siguientes informaciones :
a) Para el ao 2000 se obtuvo
Tasa de mortalidad por 10000 hbt.
las tasas siguientes:
Ciudad
General
Infantil
A
35
80
B
42
60
b) En un estudio de casos-control
Antecedente familiar
para Artritis Reumatoide se Individuo
Total
Si
No
obtuvo la siguiente informacin.
Caso
95
55
150
Calcule el riesgo apropiado e Control
40
180
220
interprete.
c) Para el ao 2000 se obtuvo las
Tasa por 1000 horas-hombre
tasas siguientes:
Empresa Productividad Accidentes
A
500
40
B
350
60
d) En un estudio de casos-control
Consume agua potable
para Parasitosis se obtuvo la Individuo
Total
Si
No
siguiente informacin. Calcule
Caso
70
130
200
el
riesgo
apropiado
e Control
180
70
250
interprete.
5. Con el objeto de evaluar el riesgo al que estn expuestos los nios que
residen en Callao, con respecto a la contaminacin por plomo,

se ha

realizado la medicin de los niveles de plomo en sangre para una muestra


de nios de la zona, obtenindose los siguientes resultados:
Plomo
Numero
de nios
(g/dl)
40
5.0 5.5]
219
5.5 6.0]
286
6.0 6.5]
282
6.5 7.0]
206
7.0 7.5]
584
7.5 8.0]
343
8.0 8.5]

Mg. Beatriz Castaeda S.

46

BIOESTADISTICA

8.5 9.0]
Total

240
2200

a) Elabore el histograma y polgono de frecuencias.


b) Obtenga la media, desviacin estndar y coeficiente de variacin.
Interprete
c) El riesgo de la poblacin es evaluado: Bajo, si X0.90 7.5; Moderado, si:
X0.90 >7.5; pero X0.50< 7.5 y Alto, si X0.50 7.5. Segn este criterio, evaluar
el riesgo de los nios del Callao.
d) Calcule el grado de asimetra de la distribucin: Interprete.
e) Indique el porcentaje de nios para los que el nivel de plomo en sangre
excede a los 7.5 g/dl
6. Considere los siguientes datos que comparan la mortalidad por cncer en
dos pases para el ao 1986.

Edad
04
5 14
15 24
25 34
35 44
45 54
55 64
65 74
+ 75
Total

Pas A
Pas B
Poblacin
Poblacin
(miles)
Muertes
(miles)
Muertes
10541
494
18152
666
22431
667
33860
1165
23922
1287
39021
2115
21339
3696
42779
5604
18333
11198
33070
14991
15512
26180
22815
37800
10572
39071
22232
98805
6377
44328
17332
146803
2643
31279
11836
161381
131670
158200
241097
469330

a) Obtenga la tasa bruta de mortalidad para cada pas, compare.


b) Calcule las tasas especficas de mortalidad por rango de edad. Existe
alguna relacin entre las tasas de mortalidad y la edad?

Mg. Beatriz Castaeda S.

47

BIOESTADISTICA

c) Calcule las tasas de mortalidad ajustadas para el pas A, sujeto a las


condiciones del pas B. Interprete.

7. En una compaa trabajan 200 obreros y 12 empleados. Luego de las


negociaciones con el Sindicato de trabajadores, la compaa otorgar un
incremento de 20% a los obreros y de 15% a los empleados. Los ingresos
mensuales en promedio son de S/. 1200 para los obreros y de S/. 1800 para
los empleados. Calcule usted, la cantidad de dinero que debe disponer la
compaa para hacer efectivo el aumento.

8. Un socilogo desea comparar los grados de fertilidad de las mujeres de dos


grupos suburbanos de una ciudad. Seleccion dos muestras al azar de 100
mujeres cuyas edades estaban entre los 50 y 60 aos, en ambos grupos y
se registr el nmero de hijos que haba tenido cada mujer.
N de hijos N mujeres N mujeres
Por mujer
grupo A
grupo B
0
6
0
1
14
3
2
18
8
3
22
18
4
19
30
5
11
19
6
5
15
7
2
5
8
3
2
Total
100
100
a) Complete el grfico e interprete las tendencias sugeridas en ste.

Mg. Beatriz Castaeda S.

48

BIOESTADISTICA

35
30
25

Del grupo A
Del grupo B

20
15
10
5
0
0

b) Interprete las siguientes medidas de resumen y compare los grados de


fertilidad medidos por el nmero de hijos por mujer

Hijos por mujer para dos grupos suburbanos


Medida de
resumen Grupo A
Media
3.2
Desv. Est.
3.4
Mediana
3
Percentil 90
5

Grupo B
4.3
2.3
4
6

Bibliografa del captulo


1. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de
la Salud. 4 Edicin, Editorial Limusa S.A. de C.V. Grupo Noriega
Editores. Mxico 2004
2. AHLBOM,

A.

And

NORELL,

S.

Introduction

To

MODERN

EPIDEMIOLOGY. Epidemiology Resourses Inc. USA. 1990

Mg. Beatriz Castaeda S.

49

BIOESTADISTICA

3. DAWSON-SAUNDERS, B. And TRAPP, R. Bioestadstica Mdica. 2


Edicin. Manual Moderno, S.A. de C.V. Mxico. 2000
4. DAWSON-SAUNDERS, B. And TRAPP, R. Bioestadstica Mdica. 4
Edicin .Manual Moderno, S.A. de C.V. Mxico. 2004
5. ROTHMAN, K. Modern Epidemiology. Little, Brown and Company.
Boston/Toronto. 1986
6. MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas
a la Ingeniera. McGRAW-HILL. Mxico. 1996
7. Centro Panamericano de Ingeniera Sanitaria y Ciencias del Ambiente.
Evaluacin de Riesgos para la salud por el uso de aguas residuales en
agricultura. Anexo 3: Aspectos Microbiolgicos. CEPIS-OPS. Lima, Per.
1990
8. Centro Panamericano de Ecologa Humana y Salud. Evaluacin
Epidemiolgica de riesgos causados por agentes qumicos ambientales.
Edicin de 1985. Mxico: OPS; 1985
9. PAGANO, M y GAUVREAU, K. Fundamentos de Bioestadstica.
Thomson Learning. Mxico, 2000.

Mg. Beatriz Castaeda S.

50

BIOESTADISTICA

CAPITULO 2.

PROBABILIDAD

Es la medida de la posibilidad de que ocurra un hecho o evento.

Probabilidad

Subjetiva

Objetiva

Terica o
a priori

Frecuencial o
a posteriori

Grfico 8. Asignacin de probabilidades


Probabilidad Subjetiva
Es la medida que asignamos basados en nuestro criterio personal, experiencia,
corazonadas o deseos.

Esta forma de medicin no es factible de ser

trasmitida a otras personas.

Probabilidad Objetiva
Es la medida que asignamos basados en datos concretos y en la teora
matemtica. Esta forma de medicin se puede trasmitir a otras personas.

Definiciones
- Experimento aleatorio:
Todo procedimiento o actividad que genera dos o ms posibles resultados, por
ejemplo: Lanzar una moneda, observar la calidad de 3 productos

Mg. Beatriz Castaeda S.

51

BIOESTADISTICA

- Espacio muestral: , S
Conjunto formado por todos los resultados posibles de un experimento
aleatorio, por ejemplo dados l os siguientes experimentos:
- Al lanzar una moneda

= {c, s}

- Al observar la calidad de 3 productos

= {BBB,BBD,BDB,BDD,DBB,DBD,DDB,DDD }

Evento elemental: w
Resultado individual del experimento aleatorio, por ejemplo w = BBB

Evento o Suceso:
Un subconjunto del espacio muestral, ejem: A = {BBD, BDB, DBB }

lgebra de Eventos. Los eventos se enmarcan en la teora de Conjuntos por


lo cual al trabajar con los eventos son validas todas las propiedades y
operaciones definidas para los conjuntos,

Nomenclatura. Como los eventos tienen que ver con la ocurrencia de ciertos
resultados algunos tienen una denominacin particular que difiere de la
nomenclatura general de los conjuntos, de esta manera:
Si A = , A es un evento imposible
Si A = , A es un evento seguro
AB = AB,

se denomina evento interseccin, simultneo, conjunto o

producto de A y B, decimos que ocurren A y B


Si AB = , los eventos son excluyentes, disjuntos o incompatibles

Mg. Beatriz Castaeda S.

52

BIOESTADISTICA

A B, es el evento reunin, decimos ocurre A o B


Ac = A= A ,

es el evento complemento de A,

AA=

2.1. Funcin Probabilidad


La funcin probabilidad asigna a cada evento A definido en el espacio muestral
un real p llamado probabilidad de A.

A P ( A) = p
Donde p debe cumplir los tres axiomas siguientes:
1. P(A) 0 , para todo evento A definido en
2. P() = 1
3. Dados A1, A2, ., An,
mutuamente

. eventos definidos en , tales que son

excluyentes, es decir:

Ai Aj = , para todo par ij,

entonces.

P ( U Ai ) = P ( Ai )
i =1

Propiedades
P() = 0
P(Ac) = 1 P(A)
P(AUB) = P(A) + P(B) - P(AB)
0 P(A) 1

Mg. Beatriz Castaeda S.

53

BIOESTADISTICA

2.2. Asignacin de Probabilidad


- Probabilidad Frecuencial

P ( A) =

n( A)
n

Dadas n realizaciones de un experimento aleatorio, donde A es un resultado


obtenido, entonces la probabilidad de A es la frecuencia relativa
Ejemplo 2.1
La tabla presenta las reacciones de 400 ciudadanos con respecto a un nuevo
plan de impuestos de acuerdo con su filiacin partidaria

Afiliacin
partidaria
A
B
Otra
Total

A favor
120
50
50
220

Reaccin
Total
Neutral Se opone
20
20
160
30
60
140
10
40
100
60
120
400

Sean los eventos:


F: El ciudadano est a favor del nuevo plan de impuestos

P(F) = 220/400 = 0.55


AF: el ciudadano es de Afiliacin A y est a favor

P(AF) = 120/400 = 0.30

Probabilidad Terica
Se basa en el razonamiento matemtico, as dado un experimento con n()
resultados igualmente posibles y un evento A con n(A) resultados favorables
igualmente posibles, entonces:

Mg. Beatriz Castaeda S.

P ( A) =

n( A)
n( )
54

BIOESTADISTICA

Ejemplo 2.2: Lanzamiento de un dado


P(puntaje par) = 3 = 0.5
6
Ejemplo 2.3: Extraer una carta de un juego de naipes
P(un as) = 4 =0.077
52
Ejemplo 2.4: Al extraer dos objetos de una caja que contiene 8A y 6B
Sea el evento C: Se obtiene un A y un B
Los posibles resultados del experimento los podemos ilustrar con el siguiente
diagrama denominado diagrama de rbol

8A

6B

6
B

A
7
A

6
B

8
A

5
B

Grfico 9. Diagrama de rbol

C = {AB , BA}

n(C ) = n( AB ) + n( BA) = 8 x 6 + 6 x 8 = 96

n( ) = 14 x13 = 182

Luego

P (C ) =

96
= 0.527
182

Mg. Beatriz Castaeda S.

55

BIOESTADISTICA

2.3. Mtodos de Enumeracin y Conteo


1. Principio de multiplicacin
Si un proceso tiene dos etapas o su realizacin se puede conceptuar en 2
etapas, de las que la primera se puede realizar de m maneras y la segunda de
n maneras, entonces el proceso (1 y 2 etapa) puede realizarse de mxn
maneras. Se ilustra con el diagrama de rbol.

Ejemplo 2.5 Sea el experimento de lanzar 2 monedas.

C
n() = 2x2 = 4

= {cc, cs, sc, ss}

Ejemplo 2.6
Trasladarse de una ciudad A a otra ciudad C pasando por B, sabiendo que de
A a B hay 3 lneas de vehculos y de B a C hay 5 lneas.
n() = 3x5 = 15

Ejemplo 2.7
Extraer dos artculos de un lote en el que hay 5A y 10B
n() = 15 x 14

Mg. Beatriz Castaeda S.

56

BIOESTADISTICA

Este principio se puede generalizar a k etapas.

2. Principio de Adicin
Si un proceso A puede realizarse de nA maneras y un proceso B puede
realizarse de nB maneras, entonces si A y B son procesos que no pueden
realizarse u ocurrir simultneamente, el nmero de maneras en que se puede
realizar el proceso A o B ser nA + nB

Ejemplo 2.8
Sea el experimento de extraer un artculo de un lote que contiene 4b, 2n y 3 A.
Sean los eventos:
A: El artculo extrado es b
B: el artculo extrado es n
Entonces

n(A B) = 4 + 2 = 6

Ejemplo 2.9
Sea el experimento que consiste en extraer 2 objetos de un conjunto que
contiene 8 A, 5B y 4C. Sean los sucesos:
A1 : El primer objeto extrado es A
A2 : El segundo objeto extrado es A
A1 A2 = {AA, AB, AC, BA, CA }
n(A1 A2) = n(AA) +n(AB) + n(AC) + n(BA) + n(CA)
= 8 x 7 + 8 x 5 + 8 x 4 + 5 x 8 + 4x 8 = 200

Mg. Beatriz Castaeda S.

57

BIOESTADISTICA

3. Permutaciones u ordenamientos
Si se tiene un conjunto de n elementos, entonces el nmero de maneras
diferentes en que podemos presentarlos ordenadamente en lnea ser

N = n!

1 2 3 . . . n

Se elige de 1 en 1 y se coloca en cada lugar


1

n-1

n-1

N = n x n-1 x . . . x 2 x 1 = n!
el experimento sera similar al de extraer de uno en uno los elementos y
colocarlos en algn orden establecido.

Ejemplo 2.10
Un inspector visita 6 mquinas diferentes durante el da. A fin de impedir a los
operadores que sepan cuando inspeccionar, vara el orden de las visitas. de
cuntas maneras puede realizar las visitas
El nmero de maneras ser: 6! = 720

4. Variaciones o grupos ordenados


Cuando se tienen n elementos con los cuales queremos formar grupos
ordenados de r elementos diferentes cada vez, entonces el nmero de
maneras diferentes de hacerlo es:

Mg. Beatriz Castaeda S.

58

BIOESTADISTICA

N = n x n-1 x . . . x n (n-1) =

n!
( n r )!

Ejemplo 2.11
Placas con 3 nmeros y 2 letras deben construirse, si no se permite la
repeticin de dgitos y letras, cuntas placas se construyen con los dgitos 0,
1, 2, . , 9 y las letras A, B, ., E

El nmero de placas ser: N = (10 x 9 x 8) x (5 x 4)

4.

Combinaciones

Si de un conjunto con n elementos deseamos formar un grupo de r elementos


sin interesar el orden entre ellos, el nmero de maneras de formar el grupo es:

n
n!
N = =
r r !( n r )!
Ejemplo 2.12
Un mecanismo puede fallar en 15 partes diferentes, si falla en 3 partes, de
cuntas maneras puede suceder?

15
15!
= 455
N = =
3 3! 12!
Ejemplo 2.13
De un grupo de 7 personas se elige 3 para formar una comisin, luego el
nmero de maneras diferentes de formar la comisin ser:

7
N = = 35
3

Mg. Beatriz Castaeda S.

59

BIOESTADISTICA

Ejemplo 2.14
Un examen consiste de 10 preguntas cuyas respuestas son verdadero (V) o
falso (F) De cuntas maneras se puede contestar el examen marcando 3V y
7F
Este procedimiento lo podramos comparar con la accin de escoger 3
preguntas para responder verdadero y a las 7 restantes asignarle falso, luego:

10
N = = 120
3
5.

Particiones

El nmero combinatorio puede interpretarse de 2 maneras, as:


1) Indica el nmero de maneras en que se elige r elementos de un conjunto
que tiene n elementos.
2) Indica el nmero de maneras en que repartimos un conjunto de n
elementos en dos grupos uno con r y el otro con (n-r) elementos.
Luego si un conjunto tiene n elementos y lo queremos particionar en k grupos
con n1, n2, , nk elementos cada uno tal que
n1 + n2 + + nk = n
el nmero de maneras de hacer la particin es:
N =

n!
n1! n2 ! . . . nk !

Ejemplo 2.15
De cuntas maneras se puede distribuir un conjunto de 9 personas en 3
comisiones, la primera conformada por 3, la segunda por 4 y la tercera por 2
personas, respectivamente?

Mg. Beatriz Castaeda S.

60

BIOESTADISTICA

El nmero de maneras ser: N =

6.

9!
= 1260
3! 4! 2!

Permutaciones con repeticin

Si se tiene n elementos entre los que n1, n2, , nk elementos son similares
entre si y

n1 + n2 + + nk = n, entonces el nmero de maneras de

ordenarlos en lnea es:

N =

n!
n1! n2 ! . . . nk !

Ejemplo 2.16
Sean las letras a, a, b, b, b si las deseamos presentar en lnea en un orden
diferente cada vez, el nmero de maneras ser:

N =

5!
= 10
2! 3!

Si estas letras se hubieran distinguido con subndices, entonces el nmero de


maneras de ordenarlas en lnea sera:
5! = 120

7.

Ordenamiento en circulo

El nmero de maneras de ordenar en circulo n elementos es

N = (n-1)!

Ejemplo 2.17
Sean las letras a, b, c , entonces el nmero de maneras de ordenarlas en lnea
sera 3! = 6, pero en circulo es solo 2! = 2 porque:

Mg. Beatriz Castaeda S.

61

BIOESTADISTICA

abc, cab, bca se obtienen de rotar el ltimo al primer lugar y al presentarlas


en crculo se obtiene una misma disposicin como se puede apreciar en el
siguiente diagrama.

abc

cab

bca

lo mismo ocurre para acb,bac,cba

acb

bac

cba

Grfico 10. Ordenamiento en crculo

2.4. PROBABILIDAD CONDICIONAL


A un evento A que ocurre condicionado a la ocurrencia de otro evento B, se
denomina evento condicional de A dado B (A/B) y su probabilidad se calcula
como:

P( A / B) =

P ( AB ) n( AB ) , si P(B) > 0
=
P( B)
n( B )

Mg. Beatriz Castaeda S.

62

BIOESTADISTICA

Ejemplo 2.18
Con los datos del ejemplo 2.1, calculamos la probabilidad de que un ciudadano
este a favor del nuevo plan de impuestos dado que es de afiliacin partidaria A

Afiliacin
partidaria
A
B
Otra
Total

A favor
120
50
50
220

Reaccin
Total
Neutral Se opone
20
20
160
30
60
140
10
40
100
60
120
400

A: El ciudadano es de afiliacin A

P(A) = 160/400 = 0.40


AF: el ciudadano es de Afiliacin A y est a favor

P(AF) = 120/400 = 0.30


Entonces

P ( F / A) =

P ( AF ) 0.30 120
=
=
= 0.75
0.40 160
P ( A)

Consecuencias de la Probabilidad Condicional


1. P(AB) = P(B) P(A/B) = P(A) P(B/A)
El clculo depender de la informacin disponible (o del orden en que
ocurren los hechos)

P(Ac)

P(A)
P(AB)=P(A)P(B/A)

Ac

A
P(B/A)
B

Mg. Beatriz Castaeda S.

Bc

Bc
63

BIOESTADISTICA

Lo que se resume en la siguiente tabla

Cuadro 12. Probabilidad marginal y conjunta

B
BC
Prob.
marginal

Prob.
marginal
c
P(AB)
P(AB )
P(B)
c
c c
P(PAB ) P(A B )
P(Bc)
A

Ac

P(A)

P(Ac)

Elaboracin propia

2.

P(ABC) = P(AB) P(C/AB) = P(A) P(B/A) P(C/AB)

Como los eventos son conjuntos y la interseccin de conjuntos tiene la


propiedad asociativa y conmutativa, entonces el orden en que podemos escribir
ABC puede variar y as obtener otras formas de evaluacin de a probabilidad
conjunta del evento ABC como:
P(ABC) = P(ACB) =P(A) P(C/A) P(B/AC)
3. Independencia de eventos
Los sucesos A y B se consideran independientes cuando la ocurrencia de uno
no influye sobre la probabilidad de ocurrencia del otro; es decir, la probabilidad
de que ocurra A se mantiene invariante ante su ocurrencia condicionada a la de
B y viceversa.
Dos eventos A y B son independientes si y slo si

P(A) = P(A/B)
P(B) = P(B/A)
P(AB) = P(A) P(B)

Mg. Beatriz Castaeda S.

64

BIOESTADISTICA

Ejemplo 2.19
Calculamos la probabilidad de obtener

2 caras al lanzar dos veces una

moneda
P(cc) = P(c) P(c) = (1/2)(1/2) =

Probabilidad Total
Un evento de probabilidad total es un evento A que ocurre asociado a la
ocurrencia de n eventos Bi, tales que son mutuamente excluyentes y
colectivamente exhaustivos
BiBj = i j

Bi =

B2

B1

A
AC

P( A)=

B1
AB1
AcB1

B2
AB2
AcB2

P ( AB i ) =

Bn

...
A

...

Bn
ABn
AcBn

P (Bi )P ( A / Bi )

Probabilidad Condicional de Bayes


Si habiendo ocurrido un evento A nos preguntamos por la ocurrencia de un
evento Bj que ocurre en etapas previas a la ocurrencia de A, entonces a la

Mg. Beatriz Castaeda S.

65

BIOESTADISTICA

probabilidad de Bj condicionada al resultado A se denomina evento condicional


de Bayes

P (B

/ A)=

P ( AB

P(A)

Ejemplo 2.20
Para las fiestas navideas una tienda de regalos contrata a 3 empaquetadores.
Carmen empaqueta el 30% de los regalos vendidos y olvida quitar la etiqueta
con el precio en 1 de cada 20, Juan empaqueta el 40% de los regalos que
empaqueta Sandra y olvida quitar la etiqueta con el precio en 1 de cada 10; y
Sandra olvida quitar la etiqueta con el precio en 1 de cada 25.
a) Cul es la probabilidad de que un cliente reciba un regalo con la etiqueta
del precio?
b) Si un cliente se quej de que no fue quitada la etiqueta del regal que
compr, cul es la probabilidad de que el error haya sido cometido por Juan?.
Luego el proceso de empaquetar los regalos lo ilustramos con el siguiente
diagrama

Regalos

0.30
Carmen
0.05

E
Donde

Juan

Sandra

0.10

0.04

E: El regalo se qued con la etiqueta del precio

Mg. Beatriz Castaeda S.

66

BIOESTADISTICA

Como Juan y Sandra empaquetan el 70% de los regalos, entonces

J + S =0.7

Adems, Juan empaqueta el 40% de los regalos que empaqueta Sandra, es


decir,

0.4S + S = 0.7 , entonces S = 0.5


Luego Sandra empaqueta el 50% y Juan el 20% de los regalos.
Resumiendo la informacin en una tabla obtenemos:

Regalos
empaquetados
Con etiqueta
Sin la etiqueta
Total

Carmen Juan
0,015
0,285
0,30

Sandra Total

0,02 0,02
0,018 0,48
0.20 0.50

0,055
0,945
1,00

Sean los eventos

A: El cliente recibe un regalo con la etiqueta del precio


entonces

P(A) = 0.055

J: El regalo fue empaquetado por Juan

Por consiguiente

P ( J / A) =

P ( JA) 0,02
=
= 0,364
P ( A) 0,055

2.5. EVALUACIN DE PROCEDIMIENTOS DE DETECCIN


La bondad de un mtodo de deteccin es estimada sobre la base de una
muestra de individuos los cuales han sido sometidos a evaluacin por un
procedimiento aceptado, diferencindolos como sanos y enfermos. Estos
individuos al ser sometidos a la nueva prueba diagnstica pueden resultar

Mg. Beatriz Castaeda S.

67

BIOESTADISTICA

positivos o negativos a la prueba; resultados que podemos agrupar en una


tabla de 2 x 2
Prueba
aceptada
Enfermos
Sanos
Se define:

Prueba diagnstica
Positivo (+)
Negativo (-)
E + (PV)
E- (NF)
S+ (PF)
S- (NV)

TOTAL
E
S

Sensibilidad = E + x 100
E

Es la capacidad del mtodo para detectar a los enfermos, mide el porcentaje de


enfermos que el mtodo es capaz de detectar

Especificidad = S - x 100
S
Es la capacidad del mtodo para identificar a los que no tienen la enfermedad
Mide el porcentaje de sanos que el mtodo es capaz de identificar, es decir,
sanos que dan negativo a la prueba

Valor predictivo
Sobre la base de las estimaciones de la bondad de la prueba para
identificacin de sanos y enfermos, y teniendo en cuenta la prevalencia de la
enfermedad en determinada poblacin se calcula el valor predictivo positivo y
negativo

Poblacin
Enfermos
Sanos
TOTAL

Prueba diagnstica
Positivo (+)
Negativo (-)
P(E + )
P(E-)
P(S+)
P(S-)
P(+)
P(-)

TOTAL
P(E)
P(S)

Valor predictivo Positivo (VP+) = P(E+) X 100


P(+)
Mg. Beatriz Castaeda S.

68

BIOESTADISTICA

Mide la probabilidad de que una persona que result positiva a la prueba,


realmente tenga la enfermedad.

Valor predictivo Negativo (VP-) = P(S -) X 100


P(-)
Mide la probabilidad de que una persona que result negativa a la prueba,
realmente est sana.

Ejemplo 2.21
Se estima que el 1% de la gente de cierto vecindario tiene tuberculosis; una
placa de rayos X es usada con la gente para prevenirla de la enfermedad. De
experiencias anteriores se sabe que los rayos X tienen una sensibilidad del
99% y una especificidad del 90%.
a) Si la prueba a una persona resulta positiva, cul es la probabilidad de
que no tenga tuberculosis?
b) Si la prueba resulta negativa, cul es la probabilidad de que est
enferma?
Resumimos la informacin en la tabla resumen de probabilidades

Poblacin
Enfermos
Sanos
TOTAL

Prueba diagnstica
Positivo (+)
Negativo (-)
0.0099
0.0001
0.099
0.891
0.1089
0.8911

TOTAL
0.01
0.99

Luego:
Valor predictivo Positivo (VP+) = P(E+) X 100 = 0.0099 x 100 = 9.09%
P(+)
0.1089
Mg. Beatriz Castaeda S.

69

BIOESTADISTICA

Valor predictivo Negativo (VP-) = P(S-) X 100 = 0.891 x 100 = 99.99%


P(-)
0.8911
Ejercicios
1. Se examina de cncer a los residentes de una comunidad y los
resultados se clasifican de positivos si se sospecha que es maligno, y
como negativos si no hay indicios de que sea maligno. Si la sensibilidad
del mtodo diagnstico es del 98% y la especificidad del 85% y si el 5%
de la comunidad tiene cncer, cul es la probabilidad de que una
persona no tenga cncer si su examen resulta positivo?
2. Se sabe que el anlisis de glucosa en sangre en ayuno tiene una
sensibilidad y especificidad conocidas de 80% y 96%, respectivamente.
Segn los reportes mdicos el 90% de las personas que dan positivo al
anlisis de glucosa en orina tienen diabetes.
A una persona con resultado positivo para glucosa en orina, se le ha
hecho una prueba de glucosa sangunea en ayuno, si el resultado fue
positivo cul es la probabilidad de que tenga diabetes?.

Prctica domiciliaria 3

1. Tres personas solicitan un trabajo, los candidatos A y B tienen la misma


oportunidad de ganar, pero el candidato C tiene el doble de oportunidades
que cualquiera de los otros.
a) Cul es la probabilidad de que gane C?
b) Cul es la probabilidad de que A no gane?

Mg. Beatriz Castaeda S.

70

BIOESTADISTICA

2. En la Facultad de Psicologa se promueve la titulacin de todos los


pasantes, se inscriben 5 000 alumnos de los cuales 720 son irregulares, por
adeudar 1 materia, 397 no han realizado servicio social, 534 no han
acreditado el idioma, 180 , adems de no haber realizado su servicio social,
adeudan una materia y 70 que tambin no han realizado el servicio y no han
acreditado el idioma. Cul es la probabilidad de no alcanzar la titulacin si
se tiene alguno de los problemas anteriores?
3. Seis cartas se extraen de una baraja ordinaria.
a) Cul es la probabilidad de que consten de una pareja (dos ases, o dos
cincos, por ejemplo) y 4 cartas que no formen parejas?
b) y de que haya dos parejas y dos que no formen pareja?
4. En una fabrica se tienen dos mquinas que producen un determinado
artculo. La mquina 1 produce el 33,3% de los artculos. El 10% de los
artculos producidos por la mquina 1 son defectuosos, en tanto que la
mquina 2 produce 8% de defectuosos. Si de la produccin diaria (120
artculos) se elige 2 artculos para ser

inspeccionadas obtenga la

probabilidad de:
a) Que ambos artculos sean defectuosos
b) Dado que ambos resultaron defectuosos, uno haya sido producido por la
mquina 1 y el otro por la mquina 2.
5. Se sabe que una caja se ha llenado lanzando un dado y colocando en ella
blancas en nmero igual al obtenido en el lanzamiento del dado. A
continuacin se ha aadido bolas negras en nmero determinado por una
segunda tirada del dado. Se sabe tambin que el nmero de bolas en la

Mg. Beatriz Castaeda S.

71

BIOESTADISTICA

caja es 8. cul es la probabilidad de que la caja contenga exactamente 5


bolas blancas?
6. Una institucin ha desarrollado una prueba para la deteccin de hepatitis, e
indica que tiene 98% de sensibilidad y 95% de especificidad.
a) Una persona ha sido evaluada con la prueba y dio resultado positivo. Si
la prevalencia de la poblacin es del 5% Cul es el valor predictivo?
7. Un laboratorio desea utilizar esta prueba de deteccin y para evaluarla
aplica la prueba a 80 personas previamente diagnosticadas con hepatitis y a
120 personas sanas, obteniendo los siguientes resultados:
Prueba Diagnstica
Persona
Total
+
Con hepatitis
76
4
80
Sana
10
110
120
Con esta informacin estime la sensibilidad y especificidad de la prueba
y calcule nuevamente el valor predictivo para un resultado positivo.
c) Si el laboratorio realiza 3 mediciones para una persona resultando ++ - ,
cul es la probabilidad de que esta persona no tenga hepatitis?.
8. Se alinean al azar 6 fichas azules y 2 verdes
a) Cul es la probabilidad de que las 2 fichas verde queden juntas?
b) Cul es la probabilidad de que las 2 fichas verdes ocupen las
posiciones extremas?
9. Un nmero binario est compuesto slo de los dgitos 0 y 1. (Por ejemplo
1011, 1100, etc). Eso nmeros tienen un papel importante en el uso de los
computadores electrnicos. Supngase que un nmero binario est formado
por 6 dgitos. Supngase que la probabilidad de que aparezca un dgito

Mg. Beatriz Castaeda S.

72

BIOESTADISTICA

incorrecto es 0.05 y que los errores en dgitos diferentes son independientes


uno de otro. cul es la probabilidad de formar un nmero incorrecto?
10. En el departamento de fotocopiado de una universidad existen 3 copiadoras
que fueron adquiridas, al mismo tiempo, con las mismas caractersticas
tcnicas para una gran demanda de trabajo. Este tipo de copiadora est
fuera de servicio un 10% del tiempo de uso (por mantenimiento y
reparacin). Suponga la posibilidad de que ninguna de las fotocopiadoras,
cuando estn fuera de servicio, dependa de la condicin actual de las otras
dos. El funcionamiento de cada una es independiente entre s. Calcule la
probabilidad de que:
a) Las tres fotocopiadoras estn fuera de servicio
b) Una de las tres est fuera de servicio.
11. La irregularidad del corte de productos de papel aumenta a medida que las
hojas de la cuchilla se desgastan. Solo el 1% de productos cortados con
cuchillas nuevas tienen cortes irregulares, el 3% de los cortados con
cuchillas de filo promedio exhiben irregularidades y el 5% de los cortados
con cuchillas desgastadas presentan irregularidades. Si el 25% de las
cuchillas son nuevas, y del resto, el 80% tienen filo promedio:
a) Cul es la proporcin de productos que tendran cortes irregulares?
b) Cul

es

la

probabilidad

de

que

un

producto

que

presente

irregularidades haya sido cortado por una cuchilla de filo promedio?


12. Un estudiante se prepara para rendir un examen estudiando una lista de 10
problemas. El puede resolver con certeza 6 de estos problemas. Para el
examen el profesor selecciona al azar 5 problemas de la lista. cul es la

Mg. Beatriz Castaeda S.

73

BIOESTADISTICA

probabilidad de que el estudiante apruebe el examen si para ello debe


resolver al menos 3 de los problemas?
13. En un estudio reciente, de 1800 compaas se encontr que 49% de ellas
realizan estudios serios sobre la eficiencia de su publicidad, 61% llevan a
cabo pronsticos de ventas a corto plazo, 38% de ellas hacen ambas cosas
y 64% de las compaas realizan investigaciones sobre sus competidores.
Si el realizar investigaciones sobre sus competidores es independiente de la
realizacin de los otros estudios, estime:
a) La probabilidad de que una compaa realice estudios sobre la eficiencia
de su publicidad, haga investigaciones sobre los competidores pero no
lleve a cabo pronsticos de sus ventas a corto plazo.
b) La probabilidad de que lleve a cabo los tres tipos de actividad.
14. Una urna contiene 5 bolas negras y 4 blancas, la otra urna contiene 4
negras y 5 blancas. Se traslada una bola de la primera a la segunda urna y
a continuacin se extrae dos bolas de la segunda urna.
a) cul es la probabilidad de que sean blancas?
b) cul es la probabilidad de que sean blancas si se trasladan 2 bolas?
15. Considere el siguiente circuito
0.01

0.01
0.1

0.1
0.1

El circuito trabaja, si y slo si, existe una trayectoria de dispositivos en


funcionamiento de izquierda a derecha.

Mg. Beatriz Castaeda S.

74

BIOESTADISTICA

Suponga que los dispositivos fallan de manera independiente. En la figura


se indica la probabilidad de falla de cada dispositivo. Calcule la
probabilidad de que el circuito funcione.
16. Para la deteccin de osteoporosis se cuenta con una prueba diagnstica
que tiene 90% de sensibilidad y 95% de especificidad.
a) En cierta comunidad, cuya poblacin femenina mayor de 50 aos tiene
25% de prevalencia de osteoporosis. Las mujeres son sometidas a 2
evaluaciones consecutivas con la prueba diagnstica. Obtenga el valor
predictivo para el resultado ++ y el valor predictivo para el resultado - -.
b) Si una persona obtuvo un resultado + y un -, entonces es sometida a una
tercera evaluacin Cul es el valor predictivo si el tercer resultado es
negativo?
17. Por experiencias anteriores, la compaa ABC sabe que de un determinado
nmero de lotes adquiridos, el 60% de ellos no tiene defectuosos, el 25%
tiene slo un defectuoso, el 10% tiene 2 defectuosos

y el 5% tiene 3

defectuosos. Dicha compaa realiza un plan de muestreo de aceptacin de


lotes, que consiste en extraer una muestra de 3 artculos de cada lote que
desea inspeccionar, se acepta dicho lote si encuentra a lo ms un
defectuoso en la muestra. Cada lote tiene 50 artculos cul es la
probabilidad de aceptar un lote?
18. Un dispositivo de almacenamiento ptico utiliza un procedimiento de
recuperacin de error que requiere la lectura inmediata de cualquier dato
escrito en el dispositivo. Si la lectura no tiene xito despus de tres
operaciones de escritura, se elimina dicho sector del disco ya que es

Mg. Beatriz Castaeda S.

75

BIOESTADISTICA

inaceptable para el almacenamiento de datos. En la parte aceptable del


disco, la probabilidad de una lectura exitosa es 0.98. Suponga que las
lecturas son independientes. Cul es la probabilidad de eliminar una parte
aceptable del disco y marcarla como inaceptable para el almacenamiento
de datos?
19. Se saca 6 cartas sin restitucin de una baraja. Calcule la probabilidad de
que:
a) Las primeras 3 cartas sean reinas y las 3 ltimas sean reyes.
b) Slo las tres primeras cartas sean reinas.
c) Las tres primeras cartas sean reinas.
20. Suponga que se ha cargado un dado de manera que la probabilidad de que
ocurra un nmero determinado es proporcional al mismo. Se lanza dos
veces el dado; calcule la probabilidad de la suma de puntos sea 5.
21. Un procedimiento para detectar el paludismo tiene 98% de sensibilidad y el
10% de probabilidad de reportar paludismo cuando la persona no lo tiene. El
12% de la comunidad tiene paludismo.
a) Cul es la probabilidad de que la persona no tenga paludismo si su
examen resulta positivo?
b) Cul es la especificidad de la prueba?
22. Los jugadores A, B y C participan en el siguiente juego: De una caja que
contiene 10 bolas de las cuales 6 son negras y el resto rojas, cada uno
extrae una bola empezando por A, seguido por B, seguido por C, y as
sucesivamente, gana el primero que obtiene una bola roja. Hallar la
probabilidad de ganar para cada jugador si:

Mg. Beatriz Castaeda S.

76

BIOESTADISTICA

a) Las extracciones se hacen sin reposicin


b) Las extracciones se hacen con reposicin.
23. En un partido de voleibol 2 equipos juegan hasta que uno de ellos haya
ganado 3 sets. Se supone que el equipo A tiene 0.70 de probabilidad de
ganar el primer juego, 0.80 de ganar cualquier juego posterior si gano el
anterior y 0.40 si perdi el anterior. Calcular la probabilidad de que el
partido termine en 4 sets.
24. Los tiradores A, B y C disparan hacia un blanco y las probabilidades de que
cada uno acierte son 0.90, 0.70 y 0.80 respectivamente. Cul es la
probabilidad de que:
a) Dos de ellos acierten
b) Acierte A, si acertaron al menos 2 de los tiradores
25. Arturo llega tarde a su trabajo el 25% de las veces. Suele olvidar su
portafolio el 20% de las veces. Suponiendo que estos dos sucesos son
independientes, encuentre las siguientes probabilidades:
a) Que Arturo llegue tarde dos veces seguidas.
b) Que Arturo llegue tarde y sin portafolio
c) Que Arturo llegue a tiempo y con portafolio
d) Que habiendo llegado tarde no traiga portafolio
26. Se examina de cncer a los residentes de una comunidad para lo cual
pasan por el siguiente proceso de despistaje: se pasa por una primera
prueba que tiene 98% de sensibilidad y 85% de especificidad, si el individuo
resulta positivo a esta primera prueba pasa por una segunda prueba que

Mg. Beatriz Castaeda S.

77

BIOESTADISTICA

tiene 95% de exactitud tanto para los que tienen como para los que no
tienen cncer. Si el 2% de la poblacin tiene cncer, Cul es el valor
predictivo positivo y cul el valor predictivo negativo? Interprete.
27. Una empresa de servicios que elabora proyectos de Plan Maestro para
infraestructura de agua y desage de pueblos y ciudades, garantiza que el
90% de los proyectos que prepara son aceptados por las entidades que dan
la buena pro. Suponga que una institucin le encarga 5 proyectos.
a) Cul es la probabilidad de que ninguno de los proyectos sea
aprobado?
b) Cul es la probabilidad de que al menos dos de los proyectos sean
aprobados?
28. Siete equipos participan en un campeonato. Se otorgar trofeo a los
equipos que ocupen las 3 primeras posiciones. Una empresa de loteras
promueve un juego para los que acierte con los pronsticos y premiar a los
que hayan acertado con al menos 1 de las posiciones ganadoras. Si un
pronstico recibiera premio cul es la probabilidad de que hubiere acertado
con los equipos en slo dos de las posiciones?
29. Sean P(A) = 0.30,

P(B) = 0.78 y P(AB) = 0.16, encontrar P(AUB) y P(AB)

30. En el supuesto de que A, B y C son sucesos mutuamente excluyentes,


explicar porque no son admisibles ninguna de las siguientes asignaciones
de probabilidades:
i.

P(A) = 0.4, P(B) = 0.4, P(AUC) = 0.2

ii.

P(A) = 0.7, P(B) = 0.1, P(BC) = 0.3

Mg. Beatriz Castaeda S.

78

BIOESTADISTICA

Bibliografa del captulo


1. WAYNE, D. Bioestadstica base para el anlisis de las ciencias de la salud.
Limusa Wiley. Mxio 2004.
2. ELORZA H. Estadstica para ciencias del comportamiento. Harla S.A.,
Mxico. 1987
3. MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas a la
Ingeniera. McGRAW-HILL. Mxico. 1996
4. MEYER, P. L. Probabilidad y Aplicaciones Estadsticas. Addison-Wesley
Iberoamericana S.A., Buenos Aires Argentina. 1992
5. KAZMIER, L.J. Estadstica aplicada a la Administracin y Economa.
McGRAW-HILL, Mxico. 1996
6. PAGANO, M y GAUVREAU, K. Fundamentos de Bioestadstica. Thomson
Learning. Mxico, 2000.
7. MASON, R, LIND, D y MARCHAL, W. Estadstica para Administracin y
Economa. 10 Edicin, Alfaomega. Mexico 2003.

Mg. Beatriz Castaeda S.

79

BIOESTADISTICA

CAPITULO 3. VARIABLES ALEATORIAS Y


DISTRIBUCIONES DE PROBABILIDAD
3.1. Variable Aleatoria
Una variable aleatoria (v.a.) es una funcin X cuyo dominio es el espacio
muestral (), de un experimento aleatorio, y cuyo rango es un subconjunto no
vaci de nmeros reales.

X : R
w X (w) = x
En trminos aplicados la v.a. asigna a cada resultado del experimento un
nmero segn una caracterstica numrica de los eventos.

Ejemplo 3.1.
Sea el experimento de lanzar 3 monedas, entonces el espacio muestral de este
experimento es:
={ccc, ccs, csc, css, scc, scs, ssc, sss}
donde

c: cara

s: sello

Sea la v.a. X definida como

X: Nmero de caras observadas al lanzar 3 monedas


Entonces X asigna los siguientes valores a los resultados del experimento:

X(ccc) = 3

X(ccs) = 2

X(csc) = 2

X(css) = 1

X(scc) = 2

X(scs) = 1

X(ssc) = 1

X(sss) = 0

Luego el rango de X es

Mg. Beatriz Castaeda S.

RX = {0, 1, 2, 3}

x: 0, 1, 2, 3

80

BIOESTADISTICA

El rango de una v.a. tambin es denominado recorrido de la v.a. y se indica por


los valores que asigna la v.a. a los resultados del experimento.

Cada valor x real define un evento en el espacio muestral, es decir,


[X = x] A = { wi / X ( wi ) = x}
por ejemplo
[X = 0] {sss}
[X = 1] {css, scs, ssc}
[X = 2] {ccs, csc, scc}
[X = 3] {ccc}
[X = 5]
[X = -1]

Variable aleatoria discreta


Se dice que una v.a. X es discreta si su recorrido (Rx) es un conjunto
numerable de puntos. Esto es, se pueden anotar los valores posibles de X
como x1, x2, , xn, . En el caso finito la lista termina y en el caso infinito
numerable la lista contina indefinidamente.
El recorrido de una variable aleatoria discreta divide al espacio muestral en
conjuntos excluyentes y colectivamente exhaustivos.

Mg. Beatriz Castaeda S.

81

BIOESTADISTICA

Distribucin de probabilidad de una variable aleatoria discreta


(Funcin de cuanta o Funcin de probabilidad puntual)
La distribucin de probabilidad de una v.a. discreta se puede representar con
una frmula, tabla o grfica que proporciona las probabilidades asociadas a
cada valor posible de la variable aleatoria.

f(x) = P[X = x] = P( A = { wi / X ( wi ) = x} )
La funcin f para que sea funcin de cuanta debe cumplir con las siguientes
restricciones:

1) f(x) 0 x R

2)

f ( x ) = f ( x ) =1

x R x

Ejemplo 3.2.
Hallaremos la distribucin de probabilidad de la v.a. X, nmero de caras
observadas al lanzar 3 monedas.
1) Forma tabular
x
0
1
2
3
Suma

f(x)
1/8
3/8
3/8
1/8
1

2) Forma de funcin

1 / 8 , si x = 0, 3

f ( x ) = 3 / 8, si x = 1, 2
0 para otro valor x

Mg. Beatriz Castaeda S.

82

BIOESTADISTICA

3) Forma grfica

f(x)
3/8

1/8
0

Grfico 11. Funcin de cuanta de variable discreta

Variable aleatoria continua


Se dice que una v.a. X es continua

si puede tomar un nmero infinito y

continuo de valores dentro de un intervalo real, como por ejemplo el tiempo


utilizado para ejecutar una cierta tarea, el peso de un objeto, la duracin sin
fallas de un producto elctrico, etc.

Para asignar probabilidades a las v.a. continuas se parte del estudio emprico
de grandes muestras y de aproximar la curva del polgono de frecuencias con
una funcin matemtica a la que denominamos funcin de de densidad de
probabilidad.
En el siguiente grfico se muestra el histograma y polgono de frecuencias de
la edad de mujeres trabajadoras en el sector textil, el cual se buscar de
aproximar con un modelo matemtico.

Mg. Beatriz Castaeda S.

83

BIOESTADISTICA

Grfico 12

N de mujeres

Edad de mujeres trabajadoras en el


Sector Textil

12
10
8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (aos)

Distribucin de probabilidad de una variable aleatoria continua


(Funcin de densidad de probabilidad)
Una funcin f se denomina funcin de densidad de probabilidad si satisface las
condiciones siguientes:
1) f(x) 0 x R

2)

f ( x )x =1

3) Para cualquier intervalo, la probabilidad de X tome valor en el intervalo


se obtiene como el rea bajo la curva f(x), es decir;
b

P(a X b) =

f ( x ) x
a

Ejemplo 3.3.
Sea X la v.a. que mide la vida en horas de cierto tipo de lmpara de radio que
tiene funcin de densidad

Mg. Beatriz Castaeda S.

84

BIOESTADISTICA

100
si x > 100

f ( x) = x2
0
si x 100
Cul es la probabilidad de que una lmpara de radio de este tipo pueda durar
mximo 150 horas?

Luego deseamos calcular

150

150

150

100
100
100
100 100
=
+
= 1/ 3
P(X 150) = 2 x = 2 x =

x 100
150 100
x
100 x
Que representa el rea bajo la curva de densidad en el intervalo de 100 a 150

f(x)

1/3

100 150

Grfico 13. Funcin de densidad de variable contnua

Funcin de Probabilidad Acumulada o Funcin de Distribucin


Dada una v.a. X se denomina funcin de probabilidad acumulada o funcin de
distribucin a la funcin F que asigna a cada x real, la probabilidad de que la
v.a. tome valores menores o iguales a x

Mg. Beatriz Castaeda S.

85

BIOESTADISTICA

1) Si X es v.a. discreta, entonces


F(x0 ) = P(X x0 ) =

f ( x)

x x0

2) Si X es v.a. continua, entonces


x0

f ( x ) x

F(x0 ) = P(X x0 ) =

Ejemplo 3.4.
a) Para la v.a. X: Nmero de caras observadas al lanzar 3 monedas
F(2) = P(X 2) = P(X = 0) + P(X = 1) + P(X = 2) = 1/8 + 3/8 + 3/8 = 7/8
b) Para la v.a. X: vida en horas de las lmparas de radio de cierto tipo
F(150) = P(X 150) = 1/3
300

300

300

100
100
100
100 100
=
+
= 2/3
F(300) = P(X 300) = 2 x = 2 x =

x
x
x
300
100

100
100

Propiedades de la funcin de probabilidad acumulada F(x)


1. 0 F(x) 1
2. Si X es v.a. discreta F(x) es discontinua, no decreciente y tiene forma
escalonada.
3. Si X es v.a. continua F(x) es absolutamente continua, no decreciente y tal
que

F ( x )
= f ( x)
x

4. Si X es v.a. continua
P(a X b) = P(a < X b) = P(a X < b) = P(a < X < b) = F(b) F(a)
5. Si X es v.a. discreta
P(a X b) = P(a < X b) + P(X = a) = F(b) F(a) + f(a)

Mg. Beatriz Castaeda S.

86

BIOESTADISTICA

6. P(X > x0) = 1 P(X x0) = 1 F(x0)

3.2. Valor Esperado y Varianza


Media o Valor Esperado ( = E(X))
La media o valor esperado de una variable, si existe, es un valor nico y nos
indica el valor alrededor del cul toma medida la variable con mayor
probabilidad y por lo tanto es el valor que esperamos observar para esta
variable aleatoria.

1) Si X es v.a. discreta

= E(X ) =

x f (x)

x R x

2) Si X es v.a. continua

= E(X )=

x f ( x ) x

Si la suma o integral no son convergentes, decimos que la media o valor


esperado de X no existe o no est definida.
Ejemplo 3.5
a) Para la v.a. X: Nmero de caras observadas al lanzar 3 monedas

= E( X ) =

x =3

x f ( x)

= 0 (1/8) + 1(3/8) + 2 (3/8) + 3 (1/8) = 12/8 = 1.5

x =0

Es decir al lanzar 3 monedas se espera observar entre 1 y 2 caras (ver figura


11 en pg. 83)

b) Para la v.a. X: vida en horas de las lmparas de radio de cierto tipo

Mg. Beatriz Castaeda S.

87

BIOESTADISTICA

1
100

= E ( X ) = x 2 x = 100 x = ln x ]100
=
x
x

100
100
Es decir la media o valor esperado de la vida de las lmparas de radio de este
tipo no est determinada, no existe, puesto que la integral no es convergente.

Varianza y Desviacin estndar (2 = V(X); = V ( X ) )


La varianza y desviacin estndar son medias que indican la tendencia de
dispersin de la variable aleatoria con respecto a su media. Se calcula como la
media o valor esperado de de las desviaciones cuadrticas respecto a la
media.
1) Si X es v.a. discreta

= V ( X ) = E [( X ) 2 ] =

(x )

f (x)

x R x

Simplificando la expresin

2 = E(X 2 ) 2 =

f ( x) 2

x R x

2) Si X es v.a. continua

= V ( X ) = E[( X ) ] =
2

( x )

f ( x) x

Simplificando la expresin

= E( X ) =
2

f ( x ) x 2

Mg. Beatriz Castaeda S.

88

BIOESTADISTICA

Ejemplo 3.6.
a) Para la v.a. X: Nmero de caras observadas al lanzar 3 monedas

= 1.5
Obtenemos su varianza

2 = E( X 2 ) 2 =

f ( x) 2

x R x

= { 0 (1/8) + 1 (3/8) + 22 (3/8) + 32 (1/8) } - (1.5)2


= 24/8 2.25
= 0.75

2 = 0.87

Valor Esperado de una funcin de variable aleatoria


Si X es v.a. con f(x) funcin de cuanta o funcin de densidad de probabilidad y
si Y=G(X) es una funcin uno a uno de X, entonces el valor esperado de Y se
obtiene como:

1)

E (Y ) = E[G ( X )] =

G( x ) f ( x )

Si X es v.a. discreta.

2)

E (Y ) = E[G ( X )] =

G ( x ) f ( x ) x

Si X es v.a. continua.

Propiedades de valores esperados


1. Si X es v.a. con E(x) =

V(X) = 2 , luego

a) si G(x) = c, c constante real, entonces


b) Si G(x) = a + bx, entonces

Mg. Beatriz Castaeda S.

E[G(x)] = c;

E[G(x)] = a+b E(x);

V[G(x)] = 0

V[G(x)] = b2 V(x)

89

BIOESTADISTICA

2. Si X e Y son v.a., entonces


a) E(a X + b Y) = a E(X) + b E(Y)
b) V(a X + b Y) = a2 V(X) + b2 V(Y) +2ab Cov(X,Y)
Si X e Y son independientes Cov(X,Y) = 0, entonces
V(a X + b Y) = a2 V(X) + b2 V(Y)

Prctica domiciliaria 4

1. Sea

f(x) = (3/4) (1/4)x ,

x = 0, 1, 2, .......

a) Cul es el valor de P(X = 2)?


b) Calcule P(X > 2)
c) Obtenga E(X) y V(X)
2. El espesor de un entablado de madera (en pulgadas) que algn cliente
ordena, es una variable aleatoria que tiene la siguiente funcin de
distribucin acumulada:

F(x) =

0 , s x < 1/8
0.2 , s 1/8 < x < 1/4
0.9 , s 1/4 < x < 3/8
1 , s
x > 3/8

Determine las probabilidades siguientes:


a) P(X > 1/4)
b) P(X < 5/16)
c) P(X < 1/2)

Mg. Beatriz Castaeda S.

90

BIOESTADISTICA

3. En cierta ciudad, el consumo diario de energa elctrica (en millones de


kilowatt-hora) puede considerarse como una variable aleatoria que tiene la
siguiente densidad de probabilidad
f(x) =

x2 e-x/2
16

; si x > 0

y f(x) = 0 ; para otro valor de x

a) Obtenga el promedio y desviacin estndar del consumo de energa


elctrica para esta ciudad.
b) Si la planta de energa de esa ciudad tiene una capacidad diaria de 12
millones de kilowatt-hora, cul es la probabilidad de que este
abastecimiento de energa sea inadecuado un da cualquiera
4. En cierto juego se lanzan tres dados y un jugador apuesta sobre la salida
de un nmero que l elige. Si gana $1 cuando su nmero slo aparece en
un dado, $2 si aparece en dos dados, $3 si sale el nmero en los tres dados
y si pierde $1 cuando su nmero no sale en ninguno de los dados.
Determinar cuanto puede esperar ganar un jugador (en el sentido de
esperanza matemtica).
5. Sea X: El nmero de lanzamientos de una moneda hasta que aparece cara
a) Hallar P(X sea par),
b) Obtener el nmero esperado de lanzamientos y la varianza del nmero
de lanzamientos.
6. Las primeras 5 repeticiones de un experimento cuestan $10 cada una, y
todas las subsiguientes tienen un valor de $5 cada una. Suponer que el
experimento se repite hasta obtener el primer resultado exitoso. Si la
probabilidad de un resultado exitoso es siempre igual a 0.9 y si las

Mg. Beatriz Castaeda S.

91

BIOESTADISTICA

repeticiones son independientes, Cul es el costo esperado de la


operacin completa?
7. Se sabe que un lote contiene 2 artculos defectuosos y 8 no defectuosos. Si
estos artculos se inspeccionan al azar, uno despus de otro, cul es el
nmero esperado de artculos que se deben escoger para inspeccin a fin
de sacar todos los defectuosos?
8. La escala electrnica de un proceso de llenado automtico detiene la lnea
de produccin despus de haber detectado tres paquetes con un peso
menor que el especificado. Suponga que la probabilidad de llenar un
paquete con un peso menor es 0.001 y que cada operacin de llenado es
independiente.
a) Cul es el nmero promedio de operaciones de llenado antes de que se
detenga la lnea de produccin?
b) Cul es la desviacin estndar del nmero de operaciones de llenado
antes de que se detenga la lnea de produccin?
9. Un sistema tolerante a fallas que procesa transacciones para una compaa
de servicios financieros, utiliza tres computadoras por separado. Si la
computadora que est en operacin falla, cualquiera de la dos de reserva
puede ponerse de inmediato en lnea. Despus de que falla la segunda
computadora, la tercera puede ponerse en lnea de inmediato. Suponga que
la probabilidad de una falla durante cualquier transaccin es 10-8 y que las
transacciones pueden considerarse como eventos independientes.
a) Cul es el nmero promedio de transacciones previas a la falla de las
tres computadoras?

Mg. Beatriz Castaeda S.

92

BIOESTADISTICA

b) Cul es la varianza del nmero de transacciones previas a la falla de


todas las computadoras?
10.En cierto servicio telefnico, la probabilidad de que una llamada sea
contestada en menos de 30 segundos es 0.75. Suponga que las llamadas
son independientes.
a) Cul es la probabilidad de tener que llamar cuatro veces para obtener
la primera respuesta en menos de 30 segundos?
b) Hallar la funcin de cuanta del nmero de llamadas que es necesario
realizar para obtener la primera respuesta en menos de 30 segundos.
c) Calcular la probabilidad de que el nmero de llamadas sea superior a 3
11.El espesor de un recubrimiento conductor, en micrmetros (m), tiene una
funcin de densidad f(x) = 600 /x2 para 100 m < x < 120 m; 0 en otro
caso.
a) Calcule la media y la varianza del espesor del recubrimiento
b) Si el costo del recubrimiento es $ 0,50 por micrmetro de espesor en
cada pieza, cul es el costo promedio del recubrimiento por pieza?
c) Obtenga el percentil 75 del espesor del recubrimiento. Interprete.
12.Un blanco est formado por 2 crculos concntricos de radio 2 y 4 cm. Los
disparos que impactan en el crculo interior valen 4 puntos, los que impactan
en el anillo valen 2 puntos y los que impactan fuera del blanco valen cero
puntos. Sea X la v.a. que representa la distancia del impacto al centro del
blanco, tal que para determinado tirador tiene f.d.p.

f(x) = e-x/2 ;

Mg. Beatriz Castaeda S.

si x > 0

93

BIOESTADISTICA

a) Calcular la probabilidad de obtener 4 puntos al realizar un disparo.


b) Describir el espacio muestral para los puntajes observados luego de
realizar 2 disparos.
c) Calcular la probabilidad de obtener un total de 4 puntos al realizar 2
disparos.
d) Si Y es el puntaje total obtenido al realizar dos disparos, obtener el valor
esperado de Y.
13.Suponiendo que D la demanda diaria de un artculo, es una variable
aleatoria con la siguiente distribucin de probabilidad:

P(D=d) = k 2d ,

para d= 1,2,3,4

d!
a) Determinar el valor de k .
b) Calcular la demanda esperada.
c) Suponga que el costo de un artculo es de $3 y se vende por $5, y

cualquier artculo que no se venda al trmino del da debe desecharse


con una prdida total. Si un fabricante produce diariamente 3 artculos,
cul es su utilidad esperada?

Mg. Beatriz Castaeda S.

94

BIOESTADISTICA

3.3. DISTRIBUCIONES DE VARIABLES DISCRETAS


3.3.1. DISTRIBUCION DE BERNOULLI
El experimento de Bernoulli se caracteriza por tener dos posibles resultados a
los que usualmente se denominan xito y fracaso, por ejemplo
- Al lanzar una moneda resulta cara o sello.
- Al lanzar dos dados y observar si la suma de puntos es 7 o diferente de 7
- Al observar la reaccin de un paciente a un tratamiento este puede mejorar o
no mejorar
- Un paciente examinado puede tener fiebre o no tenerla.
- Un producto puede ser defectuoso o no defectuoso
- A la exposicin a un contaminante los individuos pueden desarrollar cierta
enfermedad o no desarrollarla

En cada uno de estos experimentos sea,

P(xito) = P

y P(fracaso) = 1-P = Q

Definamos la variable aleatoria

X : Nmero de xitos en el ensayo de Bernuolli


Entonces el recorrido es

x : 0, 1

1 P si x = 0
f ( x) =
si x = 1
P

La funcin de cuanta:

Luego E(X) = P

V(X) = P(1-P)

La distribucin de probabilidad de la v.a. X definida para un ensayo de Bernoulli


es conocida como la distribucin de Bernoulli.

Mg. Beatriz Castaeda S.

95

BIOESTADISTICA

3.3.2. DISTRIBUCION BINOMIAL


Sea un proceso que consiste en observar n pruebas independientes de
Bernoulli, es decir, que pueden tener 2 posibles resultados denominados xito
y fracaso, tales que para cada prueba se considera que

P(xito) = P ;

P(fracaso) = 1 P = Q

Luego la variable aleatoria definida como

X: Nmero de xitos en las n pruebas independientes


x: 0, 1, 2, ..., n (valores que puede asumir x)

Se denomina variable binomial y la funcin de cuanta esta dada por el


modelo:

n
f ( x) = P( X = x ) = P x (1 P)nx si x : 0, 1, 2, ..., n
x

= E( X ) = nP
2 =V( X ) = nP(1 P)
Ejemplo 3.7.
Un examen de opcin mltiple contiene 25 preguntas, cada una con 5
alternativas de respuestas. Suponga que un estudiante slo adivina las
respuestas.
a) Cul es la probabilidad de que el estudiante conteste de manera
correcta ms de 10 preguntas?

Mg. Beatriz Castaeda S.

96

BIOESTADISTICA

b) Si al examen se presentaran 200 estudiantes, con este mismo patrn de


respuesta cul es el nmero esperado de aprobados, si para aprobar
debe contestar de manera ms de 10 preguntas?
Si un estudiante elige al azar las respuestas, entonces
Para cada pregunta la respuesta es correcta (RC) o incorrecta (RI) con
probabilidades:
P(RC) = 1/5 = 0.20

P(RI) = 0.80

Y si X: Nmero de respuestas correctas entre las 25 preguntas del examen


Luego X es binomial ya que cuenta el nmero de xitos en n pruebas
independientes

25
f ( x ) = 0.20 x 0.80 25 x
x

si x : 0, 1, 2, ..., 25

Aplicando el modelo
a) P ( X > 10) = P ( X 11) =

25

25

11

x 0.20

0.80 25 x = 0.0056

b) En este caso se consideran 200 estudiantes que contestaran el examen,


donde cada uno puede aprobar (responder correctamente ms de 10
preguntas) o no aprobar, luego

P(aprobar) = 0.0056

Mg. Beatriz Castaeda S.

P(No aprobar) = 0.9944 para cada estudiante

97

BIOESTADISTICA

Como los estudiantes son independientes unos de otros al escoger las


respuestas, entonces la variable

Y: Nmero de estudiantes que aprueben el examen entre los 200 que lo

rindan

Es Binomial con n= 200 y P= 0.0056


Por lo tanto E(Y) = nP = 200x0.0056 =1.12
Se espera que slo uno de los 200 estudiantes apruebe el examen si responde
al azar adivinando las respuestas.

Ejercicio
Supngase que se sabe que la probabilidad de recuperacin de cierta
enfermedad es de 0,40. Si 15 personas contraen la enfermedad (considrese
esto como una muestra aleatoria), cul es la probabilidad de que
a) Tres o ms se recuperen?
b) Cuatro o ms se recuperen?
c) Cinco o ms se recuperen?
d) Menos de tres se recuperen?

Mg. Beatriz Castaeda S.

98

BIOESTADISTICA

3.3.3. DISTRIBUCION HIPERGEOMTRICA


El experimento consiste en extraer una muestra aleatoria de n elementos sin
reposicin, de un conjunto que contiene N elementos los cuales se clasifican
en dos categoras A y Ac, siendo T el nmero de elementos de clase A y (N -T)
el nmero de elementos de clase Ac

Poblacin

N
Ac

N T

P=T
N
Proporcin de elementos
A en la poblacin

Muestra

n
A

Ac

n-x

p=x
n
Proporcin de elementos
A en la muestra

Donde la v.a. X se define como

X : Nmero de elementos A en la muestra

x: 0, 1, 2, ., n

si y slo si n T

y n N -T

Luego como en este experimento no interesa el orden en la seleccin de


elementos, entonces las probabilidades asignadas para cada x son:

Mg. Beatriz Castaeda S.

99

BIOESTADISTICA

T N T


x
n
x

x : 0, 1, 2, ..., n si n T y n N T
f ( x) =
N

0 para otro valor x

Media y Varianza
= E( X ) = n

T
= nP;
N

T
N

2 = n

N T N n

= nP (1 P )
N N 1

N n

N 1

Ejemplo 3.8
Mecanismos de direccin defectuosos han sido montados por error en 3 de un
grupo de 9 misiles. No se sabe que misiles tienen los mecanismos defectuosos.
Si se toma una muestra al azar de 4 misiles cul es la probabilidad de que:
a) La muestra no contenga misiles defectuosos?
b) La muestra contenga 2 misiles defectuosos?

Considerando el enunciado definimos


X: Nmero de msiles con mecanismos defectuosos en la muestra
Luego X tiene distribucin hipergeomtrica y

a)

3 6

0 3
P ( X = 0) = = 0.238
9

3

b)

3 6

2 1
P ( X = 2) = = 0.214
9

3

Mg. Beatriz Castaeda S.

100

BIOESTADISTICA

Ejercicio
Ciertos componentes para ensamble se envan en lotes de 25 unidades, para
la aceptacin de un lote se seleccionan 3 componentes al azar y si ninguno de
ellos tiene defectos se acepta el lote. Cul es la probabilidad de que se acepte
el lote si contiene:
a) cinco defectuosos?
b) Dos defectuosos?

Aproximacin de la Distribucin Hipergeomtrica a la binomial


Si el muestreo es sin reposicin, tenemos que el comportamiento probabilstico
de X se aproxima al modelo Binomial cuando la poblacin es grande (es decir
N grande)

T N T


x
n
x

= n P x (1 P )n x
lim
x
; haciendo P = T/N
n
N

n
P ( X = x ) P x (1 P ) n x ;
x
N n
= nP ; 2 = nP (1 P )
nP (1 P )
N 1
n
Para N tal que
0 . 10 decimos que N es grande
N

Mg. Beatriz Castaeda S.

101

BIOESTADISTICA

Ejemplo 3.9
De un lote de 200 unidades de las cuales 10 son defectuosas se obtiene una
muestra aleatoria de tamao 4. Halle la probabilidad de que esta contenga un
artculo defectuoso.

Podemos definir la variable

X: Nmero de artculos defectuosos en la muestra


entonces

tiene distribucin hipergeomtica, pero se cumplen las

condiciones para aproximar a l binomial con n = 4 y P = 10/200 = 0.05, pues la


fraccin de muestreo
4
n
=
= 0.02 < 0.10
N 200

4
Luego P ( X = 1) = 0.05 (0.95) 3 =0.1715
1
Si calculamos la probabilidad exacta con el modelo hipergeomtrico

10 190

1 3

P ( X = 1) =
= 0.1739
200

4
El error de aproximacin es de 2,4 milsimas

Mg. Beatriz Castaeda S.

102

BIOESTADISTICA

3.3.4. DISTRIBUCIN DE POISSON


Este modelo es considerado cuando la medicin es el resultado de observar la
ocurrencia de un evento o hecho por unidad especificada de tiempo,
longitud, superficie o volumen, es decir,

X: Nmero de hechos por unidad especificada


Donde X: 0, 1, 2, .....
entonces,

f ( x) = P( X = x) = e

x
x!

= ; 2 =

es el nmero promedio o esperado de hechospor unidad especificada.


Este modelo es aplicable sobre todo cuando:
1. Las ocurrencias de los eventos en cada unidad de observacin son
independientes de las otras unidades.
2. Tericamente, debe ser posible un nmero muy grande de ocurrencias del
evento.
3. El promedio o valor esperado de eventos por unidad es una cantidad
constante y es proporcional al tamao de la unidad especificada

4. Si consideramos una unidad infinitesimalmente pequea, la probabilidad de


que el hecho ocurra ms de una vez es despreciable.

Ejemplo 3.10. El nmero promedio de averas semanales de una computadora


es 0,4 cul es la probabilidad de que la computadora trabaje sin averas
durante 2 semanas consecutivas.

Mg. Beatriz Castaeda S.

103

BIOESTADISTICA

Se conoce que = 0,4 averas /semana.


Se desea calcular
P(La computadora trabaje sin averas 2 semanas consecutivas) = P(X= 0)
Entonces definimos
X: Nmero de averas en la computadora cada dos semanas
con = 0,8 averas / 2 semanas

P ( X = 0) = e 0.8

0,8 0
= 0,449
0!

Ejercicio
Si el nmero promedio de accidentes graves por ao en una fbrica grande es
de cinco, encuentre la probabilidad de que en el ao en curso:
a) Haya exactamente siete accidentes.
b) Ocurran diez o ms accidentes.
c) No haya accidentes.
d) Haya menos de cinco accidentes

APROXIMACIN DE LA DISTRIBUCIN BINOMIAL A LA DISTRIBUCIN


DE POISSON
Cuando el nmero de pruebas n es grande y la probabilidad de xito p es
pequea
n 100

p 0,05

entonces las probabilidades binomiales se aproximan a las probabilidades de


poisson,

Mg. Beatriz Castaeda S.

104

BIOESTADISTICA

P( X = x )
Binomial (n,p)

P( X = x )

Poisson ( = np)

Es decir :
x
n x

n x
lim P (1 P )
= e
x!
x

, haciendo

= nP

Ejemplo 3.11.
El 3% de las personas que reciben un tratamiento para cierta enfermedad no
se recuperan. Si 180 pacientes con sta

enfermedad estn recibiendo el

tratamiento, cul es la probabilidad de que:


a) Ms de 10 no se recuperen
b) Todos se recuperen
c) Slo 3 no se recuperen
En este caso
X: Nmero de pacientes que no se recupera entre los 180 que recibe el
tratamiento
Luego X es binomial con n = 180 P = 0.03
Como n > 100 y P < 0.05 podemos aprximar a la Poisson con = nP =5,4

a) P(X > 10) = 1- P(X 10) = 1- 0.977 = 0.023


b) P(Todos se recuperen) = P( X = 0) = 0.005
c) P( X= 3) = 0.1185

Mg. Beatriz Castaeda S.

105

BIOESTADISTICA

Ejercicio
Una compaa de seguros halla que el 0.005% de la poblacin falleca cada
ao debido a cierto tipo de accidente, cul es la probabilidad de que tenga
que pagar a ms de 3 de 10 000 asegurados contra tales accidentes en un
ao?

3.4. DISTRIBUCIONES DE VARIABLES CONTINUAS


3.4.1. Distribucin Exponencial
Si X es v.a. continua con funcin de densidad de probabilidad (fdp)

e x ; si x > 0
f ( x) =
;
0
para
otro
valor
x

con > 0

decimos que X tiene distribucin exponencial con parmetro

Media y Varianza:

= ; 2 = 2 ; =

Relacin entre el modelo de Poisson y el Modelo Exponencial


La distribucin exponencial se aplica para el estudio de tiempos en procesos
de fenmenos de espera, y se relaciona con el modelo de Poisson, as:

Sea la v.a. con distribucin de Poisson con E(X) =


X: n de hechos ocurridos en un periodo de tiempo T
Entonces t: Tiempo transcurrido entre 2 hechos consecutivos
Tiene distribucin exponencial con parmetro

Mg. Beatriz Castaeda S.

106

BIOESTADISTICA

Ejemplo 3.14.
Sea la v.a.
X: n de llamadas que recibe una central telefnica en una hora,
Con = 20 llamadas/hora
Es decir esperamos que en cada hora la central telefnica reciba alrededor de
20 llamadas.

Luego la variable
T: El tiempo transcurrido entre 2 llamadas consecutiva
tiene distribucin exponencial con = 20

20 e 20 t ; si t > 0
f (t ) =
; t en horas
0 para otro valor t

1
60 min
de hora =
= 3 min
20
20

Es decir en promedio el tiempo transcurrido entre la recepcin una llamada y la


siguiente es de 3 minutos.
Si deseamos calcular

P(T > 5 min) = P(T > 1/12 h) =

20 e

20 t

dt = e 20 (1 / 12 ) = 0.189

1 / 12

P (Recibir 5 llamadas en 30 minutos) = P(X = 5) = e-10 105/5! = 0.038

Mg. Beatriz Castaeda S.

107

BIOESTADISTICA

3.4.2. DISTRIBUCIN NORMAL


Dada una variable aleatoria X con funcin de densidad de probabilidad

f ( x) =

1 x

; < x <

decimos que X tiene distribucin normal de media = y varianza = 2


Escribimos:

X es N(, 2)

Caractersticas
1. La distribucin es simtrica respecto a su media

Es decir P( X < - k ) = P( X > + k )

-k

+k

2. La media, mediana y la moda de la distribucin son iguales


= Me = Mo

Mo
Me

Mg. Beatriz Castaeda S.

108

BIOESTADISTICA

3. La distribucin es asinttica respecto al eje de abscisas


P( - < X < + ) = 0.683

68%

x
-

P( - 2 < X < + 2 ) = 0.9545

95%

X
- 2

+ 2

P( - 3 < X < +3 ) = 0.9973

99.7%

X
- 3

Mg. Beatriz Castaeda S.

+ 3

109

BIOESTADISTICA

Propiedades
1. Si X es N(x, x2), entonces
Y = a + b X es normal
Con

y = a + b x

2y = b2 x

2. Si X1, X2, ...Xn son n variables independientes cada una con distribucin
normal N(i, i2), entonces
Y = a1 X1 + a2 X2 + ...... + an Xn
Con

es normal

y = a1 1 + a2 2 + ..... + an n
2y = a12 12 + a22 22 + .... + an2 n2

3. Si X es N(x, x2), entonces

Z=

Se denomina variable estandarizada y tiene distribucin normal con

Z = 0

2Z = 1

Simbolizamos Z es N(0,1)

Mg. Beatriz Castaeda S.

110

BIOESTADISTICA

Uso de la tabla de la normal estndar

P( Z z )

Z
z

1) P(Z < -1.5) = 0.06681

6.7%
Z

-1.5

2) P(Z < 2.45) =0.99286

99.3%
Z

2.45

3) P(-1.5 < Z < 2.45) = P(Z < 2.45)- P(Z < -1.5)

= 0.99286 0.06681 = 0.926

92.6%
Z

-1.5
Mg. Beatriz Castaeda S.

2.45
111

BIOESTADISTICA

4) P(Z > 1.5) = P(Z < -1.5) = 0.06681

6.7%

6.7%
Z

1.5

-1.5
Ejemplo 3.15

1. En la realizacin de una prueba los alumnos tardan en promedio 2,1


minutos en examinar y comprender cada pregunta. Suponga que el tiempo
que se tardan se distribuye en forma normal y que la desviacin estndar
es de 0,6 minutos.
a) Qu porcentaje de los alumnos tardan entre 2,45 y 3,55 minutos?
b) Si el tema consiste de 5 preguntas qu porcentaje de los alumnos
comprender el tema en un lapso entre 5 y 15 minutos?
c) Qu tiempo necesitarn, para comprender el tema, el 10% ms hbil y
el 10% menos hbil?
Sea X: Tiempo utilizado para la comprensin de cada pregunta
X es Normal con = 2,1 minutos = 0,6 minutos, entonces
a) P(2,45 < X < 3,55) = 0.273

0.273

X
2,1

2,45

Z = 0.58

Mg. Beatriz Castaeda S.

3,55

Z= 2.42

112

BIOESTADISTICA

Luego el 27,3% de los alumnos tardan entre 2,45 y 3,55 minutos.

b) El tema consiste de 5 preguntas, entonces el tiempo para la


comprensin del tema ser la suma de tiempos para la comprensin de
cada pregunta, as

Y: Tiempo para la comprensin del tema

Y = X 1 + X2 + X3 + X 4 + X 5
Donde Xi es el tiempo para lo comprensin de la pregunta i, el cual es
independiente del tiempo utilizado para la comprensin de las otras
preguntas.
Por propiedad del modelo normal, entonces

Y es normal con y = 2,1 x 5 = 10,5 min utos y y = 5 x (0.6) 2 = 1.34 min utos

99.96%

5
Z = -4.10

10,5

15
Z = 3.36

Luego

P( 5 < Y < 15 ) 1

Mg. Beatriz Castaeda S.

113

BIOESTADISTICA

c) El tiempo que necesita para la comprensin del tema el 10% ms hbil


y el 10% menos hbil implica obtener las cuantilas del 10% y del 90%,
para lo cual obtenemos de las tablas las cuantilas de la normal estndar
y luego despejamos las cuantilas de la variable X

80%
10%

10%

X0.10
Z0.10 = -1.28

Z 0.10 =

X 0.10 10.5
= 1.28
1.34

Z 0.90 =

X 0.90 10.5
= 1.28
1.34

10.5

X0.90
Z0.90 = 1.28

X 0.10 = 8.78 min utos

X 0.90 = 12.22 min utos

Luego para la comprensin del tema el 10% de los alumnos ms hbiles


requiere mximo 8,78 minutos y el 10% menos hbil requiere mnimo 12,22
minutos
Ejercicio
las vidas tiles de las pilas de cierta marca estn distribuidas normalmente
con una media de 80 horas y una desviacin estndar de 10 horas. El
fabricante garantiza que reemplazar cualquier pila

Mg. Beatriz Castaeda S.

que falle antes de

114

BIOESTADISTICA

cumplirse la garanta. cunto tiempo debe dar de garanta de modo que no


ms del 5% de las pilas fallen antes de este tiempo?

APROXIMACIN DE LA DISTRIBUCIN BINOMIAL


A LA DISTRIBUCIN NORMAL
Dada una variable X con distribucin Binomial (n,p), donde p = 0.50.
Se cumple que las probabilidades de valores de X son simtricas para valores
alrededor de su media = np

Ejemplo: consideremos las funciones de cuanta para p =0,50


.375
.375

.375

.50
.25
0
n=2

.25
.25

.125

np = 1

n =3

.125

.063

np = 3/2

.25
.063

n=4

np = 2

x
0
Luego si

np > 5

np
y

n(1-p) > 5, por el Teorema del lmite Central (Pg.

129) la distribucin binomial se aproxima al modelo normal y las probabilidades

Mg. Beatriz Castaeda S.

115

BIOESTADISTICA

binomiales se pueden calcular de manera aproximada utilizando el modelo


2

normal con media = np y = np(1- p), de la siguiente manera:

P( X = xo ) P[ xo 0,5 < X < xo + 0,5]


Binomial

P( X xo )

Normal

factor de correccin
de continuidad

P[ X < xo + 0,5]

Binomial

P( X xo )
Binomial

Normal

P[ X > xo - 0,5]
Normal

P( x1 X x2 )

P[x1 0,5 X x2 + 0,5]

Binomial

Normal

Ejemplo 3.16.
Segn los archivos el 15% de los trabajadores de las plantas de cemento son
afectados por el slice, desarrollando neumoconiosis.
a) Si un organismo estatal selecciona, al azar, 16 trabajadores de una
planta de cemento para evaluar su estado de salud, cul es la
probabilidad de que a lo ms el 25% de los trabajadores, de la muestra,
haya desarrollado neumoconiosis? La planta tiene 500 trabajadores.

Mg. Beatriz Castaeda S.

116

BIOESTADISTICA

b) Cul sera la probabilidad en a) si se elige una muestra de 40


trabajadores para ser evaluados por el servicio de salud?

Sea

X: Nmero de trabajadores en la muestra que ha desarrollado la


neumoconiosis.
Como

n = 16 N = 500

la fraccin de muestreo n/N = 0.032 < 0.10

La distribucin de X se aproxima a la Binomial con n = 16 P = 0.15

Se desea calcular
P(A lo ms el 25% de la muestra haya desarrollado neumoconiosis)
= P(X 4) = 0.921
Esto es, se tiene 92% de probabilidad de que entre los 16 trabajadores
elegidos a lo ms 4 hayan desarrollado la enfermedad.

a) Si la muestra es de 40 trabajadores, entonces podemos aproximar la


probabilidad indicada con el modelo normal pues se cumple las
condiciones, es decir, nP = 40 x 0.15 = 6 y n(1-P) = 40 x 0.85 = 34 > 5

Luego X : Nmero de trabajadores en la muestra que ha


desarrollado la neumoconiosis.
Se aproxima a la normal con = nP = 6

y = nP (1 P ) = 2.26

Se desea calcular
P(A lo ms el 25% de la muestra haya desarrollado neumoconiosis)

Mg. Beatriz Castaeda S.

117

BIOESTADISTICA

= P ( X 10) P ( X 10.5) = P ( Z

10.5 6
) = P ( Z 1.99) = 0.9767
2.26

Esto es, se tiene 97% de probabilidad de que entre los 40 trabajadores


elegidos a lo ms 10 hayan desarrollado la enfermedad.

Ejercicio
En cierto pas en vas de desarrollo, el 30% de los nios est desnutrido. En
una muestra al azar de 80 nios de esta rea, cul es la probabilidad de que el
nmero de nios desnutridos sea
a) exactamente de 32?
b) menor de 20?
c) De 20 o ms?
d) Entre 15 y 20 inclusive?

PRACTICA DOMICILIARIA 5
1. El tiempo que transcurre entre llamadas a una empresa de artculos de
plomera tiene una distribucin exponencial con un tiempo promedio entre
llamadas de 15 minutos.
a) Cul es la probabilidad de que no haya llamadas en un lapso de 30
minutos?
b) Cul es la probabilidad de recibir al menos una llamada en un intervalo de
10 minutos?
c) Cul es la probabilidad de recibir la primera llamada entre 5 y 10 minutos
despus de haber abierto la empresa?

Mg. Beatriz Castaeda S.

118

BIOESTADISTICA

d) Calcule la dimensin de un intervalo de tiempo, de modo tal que la


probabilidad de recibir al menos una llamada en ese lapso sea 0.90.
2. Un cargamento de 120 alarmas contra robo contiene 20 defectuosas.
a) Si 25 de ellas son seleccionadas aleatoriamente y embarcadas por un
cliente, encuentre la probabilidad de que al cliente le toque 2
defectuosas.
b) Si 5 de ellas son seleccionadas aleatoriamente y embarcadas por un
cliente, encuentre la probabilidad de que al cliente le toque 2
defectuosas.
3. En un astillero el personal de servicio tcnico para reparaciones recibe en
promedio 3 pedidos de atencin por jornada de trabajo. Cada pedido es
atendido por un tcnico.

Si el servicio cuenta con 5 tcnicos cul es la

probabilidad de que en una jornada de trabajo no pueda atender a todos los


pedidos que recibe?
4. Un reloj de pared es alimentado por 3 pilas. Supngase que la vida de una
pila est normalmente distribuida con = 1200 horas y = 100 horas. El
reloj cesar de funcionar si se agota al menos 2 de sus pilas. Suponiendo
que las vidas de las pilas son independientes calcule la probabilidad de que
el reloj funcione ms de 1000 horas.
5. Una serie de ocho lmparas se conecta de tal forma que si una de ellas
falla, el sistema no funcionar. Si dos lmparas fallan:
a) Cul es la probabilidad de que la primera que se inspecciones, sea la
que haya fallado?

Mg. Beatriz Castaeda S.

119

BIOESTADISTICA

b) Cul es la probabilidad de encontrar las dos que fallan si se


inspeccionan cuatro de ellas?
c) cuntas lmparas se deben inspeccionar para tener un 70% de
probabilidad de encontrar las dos lmparas defectuosas?
6. Se ha encontrado que el nmero de fallas de transistores en un computador
electrnico en cualquier periodo de una hora ocurre a un promedio de una
falla de un transistor cada 10 horas. Se inicia cierto proceso que necesita 20
horas de tiempo de cmputo, en un computador que utiliza 8 transistores.
Encontrar la probabilidad de que el proceso anterior pueda completarse
exitosamente sin una falla. (Se supone que la mquina se considera
inoperante slo si fallan 3 o ms transistores.)
7. Una compaa alquila tiempo en computadora por periodo de t horas por lo
cual recibe S/.60 por hora. El nmero de veces que la computadora falla
durante t horas ocurre a una tasa de 0.8t y si la computadora falla x veces
durante t horas la reparacin tiene un costo de 5x soles. Cmo debera la
compaa elegir t en forma tal que maximice la utilidad esperada?
8. El nmero de personas que comen en un restaurante es aproximadamente
normal, con una media de 500 y una desviacin estndar de 40 por da.
a) En determinado da, cul es la probabilidad de que por lo menos haya 400
clientes?
b) Calcule la probabilidad de que 450 a 530 clientes coman en el restaurante.
c) Si el consumo promedio por cliente es de S/. 8 cul es el consumo diario
esperado?
d) Cul es la probabilidad de que el consumo exceda de S/. 4500

Mg. Beatriz Castaeda S.

120

BIOESTADISTICA

9. Una fbrica elabora artculos que necesitan de cierto componente que es


adquirido de un proveedor. De los componentes en almacn, usualmente el
5% es defectuoso.
a) Si el fabricante tiene 25 componentes en su almacn Cul es la
probabilidad de que pueda surtir un pedido de 22 artculos, sin tener que
pedir mas componentes?
b) S el fabricante tiene 108 componentes en su almacn Cul es la
probabilidad de que pueda surtir un pedido de 100 artculos, sin tener que
pedir mas componentes?
c) Si el porcentaje de componentes defectuosos fuera de 8%, cul es la
probabilidad de que pueda surtir un pedido de 70 artculos, si cuenta con 80
componentes en almacn?
10. Un proceso de fabricar tornillos se comprueba inspeccionando cada hora n
tornillos seleccionados aleatoriamente de los producidos en ese tiempo. Si
uno o ms tornillos son defectuosos, el proceso se detiene y se examina
con cuidado. Qu tan grande debe ser n si el fabricante desea que la
probabilidad de que el proceso sea detenido sea alrededor de 95%, cuando
el 10% de los tornillos que son producidos sean defectuosos?
11. Supngase que el 24% de los individuos de una poblacin tiene el grupo
sanguneo B. Para una muestra de tamao 20 extrada de esta poblacin,
encuentre la probabilidad de que
a) Se encuentren exactamente tres personas con el grupo sanguneo B
b) Se encuentren tres o ms personas con la caracterstica de inters.
c) Se encuentren menos de tres

Mg. Beatriz Castaeda S.

121

BIOESTADISTICA

d) Se encuentren exactamente cinco.


12. Suponga

que el nmero de errores en una superficie de grabacin

magntica ocurre a una tasa un defecto por cada 105 bits. Un sector de
datos est formado por 4096 bytes (un byte = 8 bits).
a) Cul es la probabilidad de que el sector tenga ms de un error?
b) Cul es la probabilidad de que de 8 sectores utilizados, mximo 2 sectores
tengan exactamente un error?
13. Los mensajes a una computadora utilizada como servidor lo hacen con una
tasa promedio de 10 mensajes por hora.
a) Determine el intervalo de tiempo necesario para que la probabilidad de
que no llegue ningn mensaje durante ese lapso de tiempo sea 0,90.
b) Cul es la probabilidad de que se reciba un mnimo de 15 mensajes
durante 2 horas consecutivas de trabajo?
14. El nmero de fallas de un instrumento de prueba, debido a las partculas
contaminantes de un producto, ocurre en promedio a 0.25 fallas por hora.
a) Cul es la probabilidad de que el instrumento no falle en una jornada
de 8 horas?
b) Calcule la probabilidad de que en 5 das de trabajo (jornada de 8 horas)
ocurran fallas mximo en 2 de estos das.
15. El tiempo de incapacidad por enfermedad de los empleados de una
compaa en un mes tiene una distribucin normal. Si el 40% ha tenido a lo
ms 95 horas y slo el 5% ha tenido tiempo de incapacidad mayor a 133
horas al mes.

Mg. Beatriz Castaeda S.

122

BIOESTADISTICA

Cul es la media y la desviacin estndar del tiempo de incapacidad


mensual para los empleados de la compaa?
16. En un estudio realizado en la ciudad de Lima se concluy, que el consumo
diario de agua por vivienda tiene distribucin normal con = 120 galones y

= 18 galones.
a) Qu porcentaje de viviendas tiene consumo mnimo de 100 galones
diarios?
b) Obtener la cantidad de agua que se consume como mximo en el 95% de
las viviendas.
17. Un fabricante de productos electrnicos espera que el 2% de las unidades
fallen durante el periodo de garanta.
a) Se hace un seguimiento de 18 unidades para determinar su desempeo
durante el tiempo de garanta Cul es la probabilidad de que a lo ms
una de las unidades falle durante el periodo de garanta?
b) Si se hace un seguimiento a 300 unidades, cul sera el nmero
mximo de unidades que fallara en el periodo de garanta con
probabilidad de 99%?
18. Un modelo de cierta marca de lavadora automtica se promociona
indicando que su duracin promedio es de 4,5 aos y que el 98% dura
hasta 7 aos sin descomposturas. Asumiendo distribucin normal
a) Cul es la desviacin estndar de la duracin?
b) Si la garanta cubre el reemplazo de la
adquirida,

qu

proporcin

del

total

lavadora hasta los 2 aos de


de

unidades

vendidas

ser

reemplazada?

Mg. Beatriz Castaeda S.

123

BIOESTADISTICA

c) Si un distribuidor ha recibido un lote de 20 lavadoras, cul es la


probabilidad de que tenga que pedir a la fbrica el reemplazo de a lo ms 2
lavadoras?
d) Si la fbrica despacha un cargamento de 150 lavadoras, cul es la
probabilidad de que tenga que reemplazar al menos 8 lavadoras?
19. Las remesas de ciertos productos son aprobadas si en una muestra
aleatoria de la misma el porcentaje de defectuosos es de hasta un 5%.
a) Se ha recibido una remesa de 50 productos, en la cual se tiene 10% de
defectuosos, cul es la probabilidad de que se acepte la remesa si se
extrae una muestra de 20 productos?
b) Si la remesa recibida es de 500 unidades con 8% de productos
defectuosos, cul es la probabilidad de que se rechace la remesa si se
extrae una muestra de 50 productos?
c) Si la remesa recibida es de 1000 unidades con 5% de productos
defectuosos, cul es la probabilidad de que se rechace la remesa si se
extrae una muestra de 120 productos?
20. Una compaa textil produce rollos de tela con un promedio de 2.2 defectos
por metro cuadrado.
a) Calcule la probabilidad de que un m2 no presentar ms de 4 defectos.
b) Si la tela se vende en cortes de 2m2 cada uno, Cul es el nmero
esperado de cortes con a lo ms 2 defectos, si se adquiere 25 cortes?
c) Cul es la probabilidad de tener al menos 10 cortes con mximo 2
defectos, si se compra 50 cortes?

Mg. Beatriz Castaeda S.

124

BIOESTADISTICA

21. En una gran planta manufacturera, los accidentes industriales serios


ocurren en forma aleatoria a razn de 1 por cada 10 das laborables.
a) Calcule la probabilidad de que no ocurra ms de un accidente serio en la
planta durante los prximos 30 das laborables.
b) Cul es la probabilidad de que slo en 3 de 40 meses, el registro de
accidentes haya superado a 4 accidentes por mes?
22. Un proceso de fabricacin de tubos electrnicos produce diariamente 1500
tubos, de los cuales el 4% son defectuosos.
a) Si se elige una muestra de 20 tubos cul es la probabilidad de que ms
del 10% de los tubos sean defectuosos?
b) Si se elige una muestra de 120 tubos, cul es la probabilidad de que
mximo 7.5% de la muestra sea defectuosa?
23. En general, el mantenimiento preventivo es ms barato que el que se lleva
una vez que el equipo falla, debido a que el mantenimiento preventivo se
puede efectuar en perodos de tiempo menos crticos. Una planta utiliza
3000 bombillas cuya duracin tiene una distribucin normal con una
duracin media de 500 horas y una desviacin estndar de 50 horas.
Para minimizar el nmero de bombillas que se funden durante el perodo de
operacin, todas las bombillas se cambian despus de un nmero
determinado de horas, con qu frecuencia se deben cambiar las bombillas
para que no ms del 1% de ellas se fundan entre los perodos de
reemplazo?
24. Un determinado antibitico se enva en cajas de 24 frascos. El farmacutico
sospecha que la cantidad de antibitico en algunos frascos es deficiente y

Mg. Beatriz Castaeda S.

125

BIOESTADISTICA

decide analizar el contenido de 5 frascos. Suponga que 6 de los 24 frascos


tienen cantidad deficiente de antibitico. Obtenga la probabilidad de que a lo
ms 2 de los frascos analizados tenga una cantidad deficiente de
antibitico.
25. Se considera que un proceso de produccin est bajo control estadstico si
la porcin defectuosa de la produccin es menor o igual a 0.10. Para
determinar si el proceso est fuera de control, se han sugerido dos planes:
I.

Se juzga el proceso como fuera de control si se encuentran dos o


ms unidades defectuosas en una muestra de 25

II.

Se juzga que el proceso est fuera de control si se encuentran dos o


ms unidades defectuosas en una muestra de 10

Evalu la eficiencia de estos dos planes con respecto a descubrir un proceso


que est produciendo 20% de unidades defectuosas.
26. Un comerciante recibe un envo de 50 televisores porttiles.
a) Para protegerse contra un mal envo, examinar una muestra de 10
televisores y aceptar el lote si observa mximo dos defectuosos. Suponga
que en el lote hay 5 aparatos defectuosos, cul es la probabilidad de
aceptar el lote?
b) Si recibe un lote de 300 televisores, de los cuales 30 son defectuosos; y
acepta el lote cuando en una muestra de 60 no ms de 5 son defectuosos
Cul es la probabilidad de aceptar el lote?
27. Un ingeniero industrial cree que el 30% de todos los accidentes industriales
en su planta se deben a que los empleados no siguen las disposiciones de
seguridad. Si esta suposicin es correcta, calclese aproximadamente la

Mg. Beatriz Castaeda S.

126

BIOESTADISTICA

probabilidad de que, entre 84 accidentes industriales, de 20 a 30 se deban a


esta causa.
28. Se enva un tcnico para hacer la instalacin de un sistema de
comunicacin especializado a una ciudad, slo si se han recibido tres o ms
pedidos. Suponga que los pedidos tienen una distribucin de Poisson con
media 0.25 por semana para una ciudad de 100 000 habitantes.
a) Cul es la probabilidad de que sea enviado el tcnico despus de un
periodo de 4 semanas?
b) Suponga que se hacen pedidos de una ciudad que tiene 800 000
habitantes, cul es la probabilidad de que el tcnico sea enviado
despus de un periodo de una semana?
29. La duracin de un lser semiconductor a potencia constante tiene una
distribucin normal con = 7000 horas y = 600 horas
a) Cul es la duracin, que excede el 90% de todos los laseres?
b) cul debera ser el tiempo de duracin promedio para que el 99% de
los laseres sea mayor de 10000 horas antes de que fallen?
c) Un producto contiene 3 lseres, y el producto falla si cualquiera de los
laseres falla. Suponga que los laseres fallan de manera independiente.
cul es la probabilidad de que el producto dure mas de 8050 horas?
30. El tiempo de vida de los reguladores de voltaje de los automviles tiene una
distribucin exponencial con un tiempo de vida medio de 6 aos. Una
persona compra un automvil que tiene una antigedad de 6 aos, con un
regulador en funcionamiento, y planea tenerlo por espacio de seis aos.

Mg. Beatriz Castaeda S.

127

BIOESTADISTICA

a) Cul es la probabilidad de que el regulador de voltaje falle en el lapso de 6


aos?
b) Si el regulador falla despus de 3 aos de haber efectuado la compra del
automvil y se remplaza, cul es el tiempo promedio que transcurrira
hasta que el regulador vuelva a fallar?
31. Supngase que durante un perodo de varios aos el nmero promedio de
muertes debidas a cierta enfermedad no contagiosa ha sido de diez. Si el
nmero de muertes debidas a esta enfermedad sigue la distribucin de
Poisson, cul es la probabilidad de que durante el ao que transcurre?
a) Mueran exactamente siete personas debido a la enfermedad?
b) Mueran diez o ms personas debido a la enfermedad?
c) Nadie muera debido a la enfermedad?

3.5. Distribucin de funciones de variables aleatorias


1. Propiedad del Modelo Normal
Si X1, X2, ...Xn son n variables independientes cada una con distribucin
normal N(i, i2), entonces

Y = a1 X1 + a2 X2 + ...... + an Xn
Con

es normal

y = a1 1 + a2 2 + ..... + an n
2y = a12 12 + a22 22 + .... + an2 n2

Mg. Beatriz Castaeda S.

128

BIOESTADISTICA

2. Teorema del lmite Central


Sean x1, x2, ., xn una sucesin de variables aleatorias independientes tales
que tienen la misma distribucin f(x), entonces la variable

X = xi
tiene distribucin que se aproxima al modelo normal conforme n crece

2x = V(xi)

x = E(xi)

Luego

Z=

X x

N (0,1) conforme n

Para esta aproximacin se asume n grande si n 30

3. Distribucin Ji-Cuadrado

f ( x) =

1
x ( k / 2 ) 1 e x / 2 ,
k/2
2 ( k / 2)

= E( X ) = K ;

para x > 0

2 =V ( X ) = 2 K

X2(K)

El parmetro K es denominado grados de libertad, y decimos que X es Jicuadrada con k grados de libertad ( X es

2
(k) )

Mg. Beatriz Castaeda S.

129

BIOESTADISTICA

Propiedades
a) Si Z es normal N(0, 1) , entonces

Z2 tiene distribucin Ji-Cuadrado

Z2

con un grado de libertad, y denotamos

es 2(1)

b) Si X es normal N(, 2) , entonces

X
Z =

es (21)

c) Si Y1, Y2, ., Yk

son variables aleatorias independientes cada una con

distribucin Ji- Cuadrado con ki grados de libertad entonces la variable


aleatoria

X = Y +Y + .... +Y
2
1

2
2

2
n

es

2
(r )

donde r = k i
1

d) Si X1, X2, ., Xk

son variables aleatorias independientes cada una con

distribucin normal N( , 2), entonces la variable aleatoria

x
Y = i


1
k

es (k2 )

Uso de tablas
Sea la v.a. Ji-Cuadrado con k = 12 , entonces
P(2(12) 14) = 0.70

0.70
0

Mg. Beatriz Castaeda S.

14

X2(12)

130

BIOESTADISTICA

Dada la probabilidad p = 0.90, ubicamos la cuantila X0.90 = 18.5

0.90
0

X2(12)

18.5

4. Distribucin t-Student

f ( x) =

[( k + 1) / 2]

k ( k / 2) [( x 2 / k ) + 1]( k +1) / 2

= E( X ) = 0 ;

2 =V ( X ) =

k
k2

para < x <

para k > 2

X
-t

+t

El parmetro K es denominado grados de libertad, y decimos que X es tStudent con k grados de libertad y denotamos:

X es t(k)

Propiedad
Si Z es normal N(0, 1) y Y es Ji-cuadrada con k grados de libertad, y si Z y Y
son variables independientes, entonces la variable

T=

Z
es t(k )
Y
k

Mg. Beatriz Castaeda S.

131

BIOESTADISTICA

Uso de tablas
Sea la v.a. t-Student con k = 12 , entonces
P(t(12) 1.782) = 0.90

0.90

t(12)

1.782

Dada la probabilidad p = 0.99, ubicamos la cuantila t0.99 = 2.681

0.98
0.01

0.01
-2.681

2.681

T(12)

5. Distribucin F
u/ 2

u + v u

x ( u / 2 )1

2 v
f ( x) =
,
( u+ v ) / 2
( u / 2) (v / 2) [( u / v ) x + 1]
= E( X ) =

v
;
v2

2 =

2v 2 ( u + v 2)
,
u(v 2)2 (v 4)

para 0 < x <

para v > 4

F(u,v)

Mg. Beatriz Castaeda S.

132

BIOESTADISTICA

Decimos que X tiene distribucin F con grados de libertad (u,v) y denotamos:


X es F(u,v)

Propiedad
Sean W y Y variables aleatorias Ji-Cuadrada con grados de libertad, u y v,
respectivamente, entonces el cociente

F=

W /u
es F( u ,v )
Y /v

Uso de tablas
Sea la

P(F(3,5) 0.415) = 0.25

v.a. F(3,5) , entonces

0.25

0.415

F(3,5)

Bibliografa del captulo


1. WAYNE, D. Bioestadstica base para el anlisis de las ciencias de la salud.
Limusa Wiley. Mxio 2004.
2. MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas a la
Ingeniera. McGRAW-HILL. Mxico. 1996
3. MEYER, P. L. Probabilidad y Aplicaciones Estadsticas. Addison-Wesley
Iberoamericana S.A., Buenos Aires Argentina. 1992
4. KAZMIER, L.J. Estadstica aplicada a la Administracin y Economa.
McGRAW-HILL, Mxico. 1996

Mg. Beatriz Castaeda S.

133

BIOESTADISTICA

CAPITULO 4. DISTRIBUCIONES DEL MUESTREO


Poblacin: Es el conjunto de elementos para los cuales deseamos estudiar
algunas de sus caractersticas.

Muestra. Es una parte o subconjunto de la poblacin

Muestra aleatoria. Es una muestra elegida de manera que no est influencia


por la subjetividad del investigador.

Muestreo aleatorio simple. Consiste en elegir la muestra de manera que cada


elemento de la muestra tiene la misma probabilidad de pertenecer a la muestra
y cada posible muestra tiene la misma probabilidad de ser elegida. Con este
proceso los elementos son elegidos por sorteo del conjunto de elementos que
constituyen la poblacin.
Para una poblacin finita de tamao N, tenemos que el nmero de posibles
muestras (k) sera:
K= Nn para muestreo con reposicin

N
K = para muestreo sin reposicin
n
El objetivo de elegir muestras es para estudiar en ella las caractersticas de
inters y luego sus resultados proyectarlos a la poblacin de la cual ha sido
extrada la muestra, proceso al cual se denomina inferencia estadstica. En
este sentido es necesario conocer como se relaciona la muestra con la
poblacin, por lo que estudiaremos las distribuciones del muestreo.

Mg. Beatriz Castaeda S.

134

BIOESTADISTICA

4.1. Variables del muestreo


El proceso de seleccin de muestras es un experimento aleatorio con el cual se
genera un espacio muestral constituido por todas las posibles muestras que se
pueden formar con los elementos de la poblacin.

= {( x1 ,..., x n )1 , ( x1 ,..., x n ) 2 ,....( x1 ,...., x n ) k }


En este espacio muestral se definen las variables aleatorias

Variable cuantitativa

x=

Media muestral

(x
=

x)2

n1

Varianza muestral

Variable es categrica
La poblacin se clasifica en 2 grupos de elementos para la caracterstica
analizada y cada elemento en la muestra es A o n o A segn la caracterstica
bajo observacin as definimos.
p=

x
proporcin de elementos A en la muestra
n

Interesa estudiar la distribucin de las variables x , S2 y p a las que


denominamos variables del muestreo

Definiciones:
1) Sea X una poblacin con distribucin f(x), media = , varianza = 2,
entonces si al elegir una muestra aleatoria se define la variable

Mg. Beatriz Castaeda S.

135

BIOESTADISTICA

Xi : El elemento i - simo de la muestra


Xi tiene la misma distribucin que la poblacin, es decir,
f(xi) = f(x) , E(Xi) = E(X) = ,

V(Xi) = V(X) = 2

2) Muestra aleatoria. Si X es una poblacin con distribucin f(x), media = ,


varianza = 2, se define como muestra aleatoria de la poblacin X al
conjunto de variables (X1, X2, . . . , Xn) tales que son independientes entre si
y tienen la misma distribucin que la poblacin.

4.2. DISTRIBUCIN DE LA MEDIA MUESTRAL


Sea la poblacin formada por las edades de 5 nios

Poblacin:
x1 = 2 aos x2 = 4 aos x3 = 6 aos
x4 = 8 aos x5 = 10 aos
Entonces:

= 6 aos

Media de la poblacin

2 = 8 aos2

Varianza poblacional

= 2,83 aos

Desviacin estndar de la poblacin

De esta poblacin seleccionaremos muestras de tamao 2


a) Por muestreo con reposicin
b) Por muestreo sin reposicin

Mg. Beatriz Castaeda S.

136

BIOESTADISTICA

a) Muestreo con reposicin:


Tabla 4. Relacin de muestras posibles para muestreo con reposicin
Muestra

Media
muestral

Elementos

Muestra

Elementos

Media
muestral

(x1 , x1)=(2,2)

14

(x3 , x4)=(6,8)

2
3
4
5
6
7
8
9
10
11
12
13

(x1 , x2)=(2,4)

3
4
5
6
3
4
5
6
7
4
5
6

15
16
17
18
19
20
21
22
23
24
25

(x3 , x5)=(6,10)

8
5
6
7
8
9
6
7
8
9
10

(x1 , x3)=(2,6)
(x1 , x4)=(2,8)
(x1 ,x5)=(2,10)
(x2 , x1)=(4,2)
(x2 , x2)=(4,4)
(x2 , x3)=(4,6)
(x2 , x4)=(4,8)
(x2 , x5)=(4,10)
(x3 , x1)=(6,2)
(x3 , x2)=(6,4)
(x3 , x3)=(6,6)

(x4 , x1)=(8,2)
(x4 , x2)=(8,4)
(x4 , x3)=(8,6)
(x4 , x4)=(8,8)
(x4 , x5)=(8,10)
(x5 , x1)=(10,2)
(x5 , x2)=(10,4)
(x5 , x3)=(10,6)
(x5 , x4)=(10,8)
(x5 , x5)=(10,10)

Fuente: Elaboracin propia

x = 6

x2 = 4

x = 2

Podemos apreciar resultados que no son casuales sino que siguen una
estructura esperada

x = 6=
Las muestras tienen media alrededor de la media de la poblacin

=4=
2
x

2
n

8
2

La dispersin de las medias muestrales depende de la varianza de la poblacin


y del tamao de muestra.

Mg. Beatriz Castaeda S.

137

BIOESTADISTICA

b) MUESTREO SIN REPOSICIN:


Tabla 5. Relacin de muestras posibles para muestreo sin reposicin

Muestra

Elementos

Media
muestral

(x1, x2)=(2,4)

(x1, x3)=(2,6)

(x1, x4)=(2,8)

(x1, x5)=(2,10)

(x2, x3)=(4,6)

(x2, x4)=(4,8)

(x2, x5)=(4,10)

(x3, x4)=(6,8)

(x3, x5)=(6,10)

10

(x4, x5)=(8,10)

Elaboracin propia

x = 6

x2 = 3

x = 1.73

Para muestreo sin reposicin se obtiene que

x = 6=
Las muestras tienen media alrededor de la media de la poblacin

=4=
2
x

2 N n

8 52

n N 1 2 4

La dispersin de las medias muestrales depende de la varianza de la


poblacin, del tamao de muestra y del tamao de la poblacin.
En los siguientes grficos se ilustra la distribucin de la media muestral

Mg. Beatriz Castaeda S.

138

BIOESTADISTICA

Grfico 14

Nmero de nios

Distribucin de las edades de los nios


(Poblacin)
1,2
1
0,8
0,6
0,4
0,2
0
2

10

Edad (aos)

Grfico 15

Nmero de muestras

Distribucin de la media muestral


(Muestreo con reposicin)
6
5
4
3
2
1
0
2

10

Media muestral

Grfico 16

Nmero de muestras

Distribucin de la media muestral


(Muestreo sin reposicin)
2.5
2
1.5
1
0.5
0
3

Media muestral

Mg. Beatriz Castaeda S.

139

BIOESTADISTICA

Distribucin de la media muestral (Resumen)


y varianza = 2 .Al tomar muestras de

Dada una poblacin con media =


tamao n

a) La media muestral x tiene distribucin Normal con

Media

x =

Varianza =
2
x

2
n

Para todo tamao de n, si la poblacin es normal


o para n grande si la poblacin no es normal, pero es infinita (n/N 0.10)

b) La media muestral x tiene distribucin Normal con

Media

x =

Varianza

2
x

2 N n

n N 1

Para n grande si la poblacin no es normal, pero es finita (n/N > 0.10)

95%

1.96 x

+ 1.96 x

El 95% de todas las muestras tiene x en este intervalo

Mg. Beatriz Castaeda S.

140

BIOESTADISTICA

Ejemplo 4.1
1) Se ha encontrado que despus de un periodo de entrenamiento, el tiempo
medio que requieren ciertas personas impedidas para realizar una tarea
particular es de 25 segundos con una desviacin estndar de 5 segundos.
Suponiendo distribucin normal para los tiempos, encuentre la probabilidad
de que una muestra de 25 personas proporcione una media:
a) De 26 segundos o ms
b) Entre 24 y 27 segundos
c) Mayor de 22 segundos.

Sea X: Tiempo requerido para ejecutar una tarea particular personas


rehabilitadas
X es normal con = 25 segundos y = 5 segundos
Entonces para una muestra de tamao n = 25
x es normal con x = = 25 segundos y x =

= 1 seg

a) P ( x 26) = P(Z 1) = 0.1587

0.1587
x

25

26
Z=1

Mg. Beatriz Castaeda S.

141

BIOESTADISTICA

b) P ( 24 < x < 27 ) = P(-1 < Z < 2)

0.81859
x

24

25

Z = -1

27
Z=2

c) P ( x > 22) = P(Z - 3) = 0.99865

0.99865

22
Z=-3

Ejercicios
1) Si las concentraciones de cido rico en hombres adultos y normales estn
distribuidas en forma casi normal con una media y una desviacin estndar
de 5.7 y 1 mg por ciento, respectivamente, encuentre la probabilidad de que
una muestra de tamao 9 proporcione una media:
a) Mayor de 6
b) Entre 5 y 6
c) Menor de 5.2

Mg. Beatriz Castaeda S.

142

BIOESTADISTICA

2) Para cierto sector grande de una poblacin, en un ao determinado,


supngase que el nmero medio de das de incapacidad es de 5.4 con una
desviacin estndar de 2.8 das. Encuentre la probabilidad de que una
muestra al azar de tamao 49 de dicha poblacin tenga una media:
a) Mayor de 6 das.
b) Entre 4 y 6 das.
c) Entre 4 y 5 das.

4.3. Distribucin de la varianza muestral


2
y varianza = .Al tomar muestras de

Dada una poblacin con media =


tamao n

(x
=

x)2

n1

la varianza muestral es tal que

E(S2) =

Si la poblacin es normal, entonces la distribucin de una funcin de S2 tiene


distribucin de probabilidad denominada Ji-Cuadrada, as:
X2 =

( n 1) S 2

es 2(n-1)

X2 tiene distribucin Ji-cuadrado con parmetro grados de libertad = n-1, este


modelo tiene forma asimtrica con

E(X2) = n -1

V(X2) = 2(n-1)

X2
0
Mg. Beatriz Castaeda S.

n-1

143

BIOESTADISTICA

Ejemplo 4.2
Para el ejemplo 4.1, previo, calcular la probabilidad de que la desviacin
estndar de la muestra sea mayor de 6 segundos

Como la distribucin de los tiempos para la ejecucin de la tarea es normal con


media = 25 seg

y = 5 seg

Entonces para una muestra de tamao n = 25 , tenemos que


2

X =

As

( n 1) S 2

es 2(24)

P(S > 6) = P(

( n 1) S 2

>

( 24) 6 2
) = P (2(24) > 34.56) = 0.079
2
5

0.10

p
0.05
(224 )

33.2 34.56 36.4

Interpolando obtenemos:
X . P
33.2 .. . 0.10
34.56 p
36.4 ... 0.05

entonces

Mg. Beatriz Castaeda S.

D . d
-3.20 .. 0.05
-1.84. p 0.05

Luego por regla de tres


p = 0.07875

144

BIOESTADISTICA

4.4. DISTRIBUCION DE LA PROPORCION MUESTRAL

Poblacin

N
Ac

P=T
N

N T

Proporcin de elementos A en la poblacin

Muestra

n
Ac

p=x
n

n-x

Proporcin de elementos A en la muestra


Donde:

X : Nmero de elementos A en la muestra


Luego la distribucin de p est asociada a la distribucin de X, as:

a) Para muestreo con reposicin


X es binomial con

E(X) = nP

V(X) = nP(1-P)

Como p = X/n, entonces

p = E(P) = E(X)/n = nP/n = P

2p = V(X) = V(X)/n = P(1-P)/n

b) Para muestreo sin reposicin


X es hipergeomtrica con

Mg. Beatriz Castaeda S.

E(X) = nP y

V(X) = nP(1-P) (N-n)/(N-1)

145

BIOESTADISTICA

Como p = X/n, entonces

p = E(P) = E(X)/n = nP/n = P

2p = V(X) = V(X)/n = P(1-P) (N-n)


n
(N-1)

Estos resultados nos llevan a resumir que

p = P

2 =

P (1 P ) N n

n
N 1

Es decir el promedio de la proporcin muestral p es la proporcin poblacional

P y su varianza est en funcin del tamao de muestra (n), de la proporcin


poblacional y del tamao poblacional.

Cuando para una muestra dada la poblacin es relativamente grande, esto es,
la fraccin de muestreo no pasa de la dcima parte de la poblacin

n
0.10 , decimos que la poblacin es grande o infinita y aproximamos a 1 el
N
factor de poblacin finita,

N n
1
N 1

As la varianza de la proporcin muestral se simplifica a la expresin:

2p =

P (1 P )
n

Mg. Beatriz Castaeda S.

146

BIOESTADISTICA

Para muestras grandes (n 30) la distribucin de la proporcin muestral es


aproximadamente normal

P
Para poblaciones finitas p es normal con

p = P

2 =

P (1 P ) N n

n
N 1

Para poblaciones infinitas p es normal con

p = P

2 =

P (1 P )
n

Ejemplo 4.3
1. Si en una poblacin de adultos el 15% estn sometidos a algn tipo de
dieta. Cul es la probabilidad de que en una muestra al azar de tamao
100, la proporcin de los que se encuentran sometidos a una dieta sea:
a) Mayor o igual a 0.20
b) Entre 0.10 y 0.20
c) No mayor de 0.12

Mg. Beatriz Castaeda S.

147

BIOESTADISTICA

Solucin:
n= 100 muestra grande, aproximamos a la normal con

p = 0. 15;

p = 0.0357

a) P(p 0.20) = P(Z (0.20-0.15)/0.0357) = P(Z 1.4) = 0.08076


b) P(0.10 < p < 0.20) = P(-1.4 < Z < 1.4) = 0.83848
c) P(p 0.12) = P(Z -0.84) = 0.20045
Ejemplo 4.4
En cierta ciudad se observa que el 20% de las familias tienen por lo menos un
miembro que sufre de algn malestar debido a la contaminacin atmosfrica.
En una muestra al azar de 150 familias se obtuvo p = 0.27. Si el valor del 20%
es correcto, cul es la probabilidad de obtener una proporcin de 0.27 o ms?

Solucin:
n= 150 muestra grande, aproximamos a la normal con

p = 0. 20;

p = 0.033

P(p 0.27) = P(Z (0.27-0.20)/0.033) = P(Z 2.12) = 0.017

Ejercicio.
El 60% de los empleados de una gran empresa faltaron a su trabajo debido a
enfermedad 3 o ms das en el ltimo ao. Si se extrae una muestra de 120 de
dichos empleados, cul es la probabilidad de que la proporcin de empleados
en la muestra que faltaron a su trabajo 3 o ms das debido a enfermedad est
entre 0.50 y 0.65?

Mg. Beatriz Castaeda S.

148

BIOESTADISTICA

PRACTICA DOMICILIARIA 6

1. Un diario local afirma que el 40% de las familias de la ciudad de Lima se


encuentra en situacin de extrema pobreza (ingreso familiar mximo de S/.
500 mensuales) y que slo el 1% de las familias percibe un ingreso mensual
superior a los S/. 3000 mensuales. Asumiendo distribucin normal.
a) Cules son el promedio y la desviacin estndar del ingreso mensual
por familia?
b) Qu porcentaje de familias se encuentran en situacin de pobreza
(ingreso familiar mximo S/. 1000 mensuales)
c) Al tomar una muestra de 40 familias calcule la probabilidad de que:
i) el ingreso promedio sea inferior a S/. 1000,
ii) La desviacin estndar de la muestra del ingreso sea inferior a S/.
500.
2. Supngase que en un proceso estndar para hacer cuerdas, la resistencia a
la ruptura es una variable aleatoria normal con media 45,4 kg y desviacin
estndar de 2,27 kg. Supngase que introducimos un nuevo proceso y que
se implanta siempre y cuando la resistencia a la ruptura media sea mayor
en al menos 10%. Suponiendo que en el nuevo proceso la resistencia a la
ruptura es normal con ms o menos la misma desviacin estndar que el
proceso antiguo, Qu tamao de muestra se debe escoger al examinar el
nuevo proceso, si se desea que slo se tenga el 5% de probabilidad de que
no se adopte el nuevo proceso an cuando produzca cuerdas con
resistencia a la ruptura media de 50,394 kg?

Mg. Beatriz Castaeda S.

149

BIOESTADISTICA

3. Se supone que el nmero de un tipo particular de bacteria en un mililitro de


agua potable, se distribuye normalmente con media de 115 y desviacin
estndar de 20.
a) Calcule la probabilidad de que en un mililitro de agua obtenida a partir de
una muestra aleatoria, contenga ms de 150 bacterias?
b) Se tomaron 80 muestras de un mililitro de agua, Cul ser la
probabilidad que el promedio de bacterias por muestra sea mayor a 120?
4. El volumen que una mquina de llenado automtico deposita en latas de
una bebida gaseosa tiene una distribucin normal con media 12,4 onzas de
lquido y una desviacin estndar de 0,1 onzas de lquido.
a) Si se desechan todas las latas que tienen menos de 12,1 o ms de 12,6
onzas de lquido, cul es la proporcin de latas desechadas?
b) Si se toma una muestra de 50 latas,cul es la probabilidad de que
i.

Se desechen a lo ms 2 latas?

ii. El volumen promedio de las latas de la muestra sea inferior a 12,35


onzas?
iii. La desviacin estndar del volumen de las latas de la muestra no
exceda a 0,12 onzas?
5. La fbrica de neumticos Caucho S.A. produce un tipo de neumticos que
tiene una vida til media de 80,000 km y una desviacin estndar de 8,000
km. Suponiendo que esta vida til est distribuida normalmente:
a) Cul es la probabilidad de que un neumtico dure ms de 96,000 km?

Mg. Beatriz Castaeda S.

150

BIOESTADISTICA

b) El fabricante garantiza que reemplazar gratis cualquier neumtico cuya


duracin sea inferior a x. determnese el valor de x de modo que tenga
que reemplazar slo el 1% de los neumticos.
c) Si un cliente adquiere 25 neumticos cul es la probabilidad de que la
duracin promedio de sus neumticos supere los 85,000 km?
6. Un fabricante de bombas de pozo profundo asegura que a lo sumo el 30%
de sus bombas requieren reparacin en los primeros 5 aos de operacin.
a) Si lo afirmado es verdad Cul es la probabilidad de que en una
muestra de 50 bombas, a lo ms 20 requieran reparacin?.
b) Cul debe ser el tamao de muestra si se desea tener una probabilidad
del 90% de que la proporcin de la muestra diferir a lo ms en 2% con
respecto a lo afirmado por el fabricante?
7. La Direccin de Salud Ambiental de una ciudad afirma que luego de un
programa de control se ha reducido la cantidad de contaminantes
atmosfricos, de manera que a lo ms el 5% de los das la contaminacin
excede a 200 microorganismos por metro cbico. Si lo afirmado es verdad
Cul es la probabilidad de que en 80 das de observacin, se encuentre
que en ms del 10% de los das se haya

obtenido ms de 200

microorganismos por metro cbico?


8. Segn los archivos el 15% de los trabajadores de las plantas de cemento
son afectados por el slice, desarrollando neumoconiosis.
a) Si un organismo estatal selecciona, al azar, 16 trabajadores de una
planta de cemento para evaluar su estado de salud cul es la

Mg. Beatriz Castaeda S.

151

BIOESTADISTICA

probabilidad de que a lo ms el 25% de los trabajadores, de la muestra,


haya desarrollado neumoconiosis? La planta tiene 500 trabajadores.
b) Cul es la probabilidad en a) si se elige una muestra de 40
trabajadores para ser evaluados por el servicio de salud?
9. Para decidir acerca de un proyecto de remodelacin de un sector de una
ciudad, el Municipio decide seleccionar una muestra de viviendas de este
sector y si el 40%

o ms estn

en mal estado se proceder a la

remodelacin en caso contrario esta remodelacin no se har. Cul es la


probabilidad de que se haga la remodelacin si:
a) El sector tiene 50 viviendas de las cuales el 20% est en mal estado y
se elige una muestra de 10 viviendas.
b) El sector tiene 500 viviendas de las cuales el 60% est en mal estado y
se elige una muestra de 20 viviendas.
10. Los precios que las diferentes farmacias cobran por un determinado
antibitico tienen una distribucin aproximadamente normal con una media
de $8,50 y una desviacin estndar de $2,00. Si se elige una muestra de 10
farmacias,
a) cul es la probabilidad de qu el precio medio del antibitico supere los
$10?
b) cul es la probabilidad de que la desviacin estndar del precio sea
inferior a $2,50.
11. El 75% de los trabajadores expuestos al asbesto desarrollan asbestosis. Si
examinamos a una muestra de 80 trabajadores expuestos al asbesto Cul

Mg. Beatriz Castaeda S.

152

BIOESTADISTICA

es la probabilidad de que menos de 55 trabajadores en la muestra haya


desarrollado asbestosis?
12. Una red de televisin pretende que su pelcula del lunes por la tarde tenga
regularmente el 36% del total de espectadores. Si esto es cierto, cul es la
probabilidad de que entre 400 espectadores llamados por telfono en tardes
de los lunes estn mirando dicha pelcula ms de 30%?.
13. De los alumnos de una universidad, el 40% fuma.
a) Se elige una muestra de 6 para conocer sus opiniones sobre el cigarro.
Encuentre la probabilidad de que: i)ninguno de ellos fume, ii) a lo ms
dos fumen.
b) Si se elige una muestra de 50 encuentre la probabilidad de que: i) Por lo
menos la mitad de los 50 fume, ii) Slo 15 fumen.

Bibliografa del captulo


1. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de la
Salud. 4 Edicin, Editorial Limusa S.A. de C.V. Grupo Noriega Editores.
Mxico 2004
2. MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas a la
Ingeniera. McGRAW-HILL. Mxico. 1996
3. MEYER, P. L. Probabilidad y Aplicaciones Estadsticas. Addison-Wesley
Iberoamericana S.A., Buenos Aires Argentina. 1992
4. KAZMIER, L.J. Estadstica aplicada a la Administracin y Economa.
McGRAW-HILL, Mxico. 1996

Mg. Beatriz Castaeda S.

153

BIOESTADISTICA

5. MASON, R, LIND, D y MARCHAL, W. Estadstica para Administracin y


Economa. 10 Edicin, Alfaomega. Mexico 2003.

CAPITULO 5. ESTIMACIN
Proceso mediante el cual usando datos de una muestra se obtienen medidas
aproximadas de los parmetros poblacionales.

Estimacin puntual
Consiste en proporcionar un nico valor como aproximacin del parmetro.

Estimacin intervlica
Consiste en proporcionar un intervalo para el cual se tiene una probabilidad,
llamada confianza, de que el valor del parmetro est incluido en l.

5.1. Estimacin Puntual


Para obtener una estimacin puntual utilizamos una medida de la muestra a la
cual se denomina estimador y tiene la caracterstica de tomar valores alrededor
del parmetro que se desea estimar

Parmetro

Estimador
n

Media poblacional:

= x =

n
n

Varianza poblacional : 2

2 = S 2 =

Proporcin poblacional; P

P = p

Mg. Beatriz Castaeda S.

(x

x)2

n1

154

BIOESTADISTICA

1 2 = x 1 x 2

Diferencia de medias: 1- 2

P1 P2 = p1 p2

Diferencia de proporciones: P1 - P2
5.2. Estimacin intervlica

Para una estimacin intervlica, usamos los datos de la muestra para obtener
los lmites del intervalo de manera que tengamos una probabilidad (1-) de
que el intervalo contiene al parmetro poblacional, as por ejemplo
Sabemos que la media muestral toma valores alrededor de la media
poblacional.

95%

1.96 x

+ 1.96 x

El 95% de todas las muestras tiene x en este intervalo


Luego para el 95% de las muestras el intervalo obtenido con lmites

L = x 1 . 96

incluir entre sus valores el valor de la media poblacional

95%

1.96 x

Mg. Beatriz Castaeda S.

x 1.96 x

x
x + 1.96 x

x + 1.96 x

155

BIOESTADISTICA

Mg. Beatriz Castaeda S.

156

BIOESTADISTICA

5.2.1. Estimacin intervlica para la media poblacional ()


A) Si la varianza poblacional (2) es conocida
Para todo tamao de muestra de poblacin normal o
Para muestra grande (n 30) de cualquier poblacin

L = x Z 1 / 2

donde Z1-/2 es la cuantila 1-/2 de la normal estndar.


B) Si la varianza poblacional (2) es desconocida
Para muestras grandes

L = x Z 1 / 2

S
n

donde Z1-/2 es la cuantila 1-/2 de la normal estndar.


C) Si la varianza poblacional (2) es desconocida
Para muestra pequea de poblacin normal

L = x t 1 / 2

S
n

donde t1-/2 es la cuantila 1-/2 de la t-Student con n-1 grados de libertad


Ejemplo 5.1.
En un experimento diseado para estimar el nmero promedio de latidos por
minuto del corazn para cierta poblacin, se encontr que el nmero promedio
de latidos por minuto de 49 personas fue de 90 con una desviacin estndar

Mg. Beatriz Castaeda S.

157

BIOESTADISTICA

de 10. Obtenga un intervalo de 90% de confianza para estimar el nmero


promedio de latidos por minuto.
Se desea estimar el promedio ( )
Para una muestra de

n =49 personas

x = 90 latidos / minuto

y S = 10 latidos / minuto

Entonces como la muestra es grande n > 30

L = x Z 1 / 2

S
n

para una confianza

1 - = 0.90 ,

Z0.95 = 1.645

Luego
Li = 90 1.645

10
= 87.65
49

y Ls = 90 + 1.645

10
= 92.35
49

Con 90% de confianza se estima que para esta poblacin el promedio de


latidos por minuto es entre 88 y 92 latidos.

Ejemplo 5.2.
Una muestra de 16 nias de 10 aos de edad proporcion un peso medio de
35,8 kg. y una desviacin estndar de 6 kg. Suponiendo que la distribucin de
los pesos es normal, encuentre un intervalo de confianza 90% para estimar el
peso medio de las nias de 10 aos.

n = 16 nias de 10 aos ;

x = 35,8 kg ;

S = 6 kg

Se desea estimar el peso medio de las nias de 10 aos ()


Entonces como la muestra es pequea n < 30 y la poblacin es normal

Mg. Beatriz Castaeda S.

158

BIOESTADISTICA

L = x t 1 / 2

S
n

para una confianza

1 - = 0.90 ,

Li = 35.8 1.753

6
= 33.17
16

t0.95 (15) = 1.753

y Ls = 35.8 + 1.753

6
= 38.42
16

Con 90% de confianza estimamos que el peso medio de las nias de 10


aos est entre 33,17 kg y 38.42 kg

Error de muestreo y Tamao de muestra


e= x

error de estimacin puntual

1-

x +E

_
E
Grfico 17. Error de muestreo y cota superior
Entonces a

E = Z1 / 2

se denomina precisin o mximo error de estimacin


puntual con probabilidad o confianza (1- )

Mg. Beatriz Castaeda S.

159

BIOESTADISTICA

De aqu obtenemos que el tamao de muestra necesario para estimar la


media de una poblacin con una confianza (1 - ) de tener un

error

mximo E, es:

Z 12 / 2 2
n=
, Si la poblacin es grande o infinita
E2

Si la poblacin es finita, entonces

Z 12 / 2 2
E2
n=
Z 12 / 2 2
1 +
N E2

n0
=
;
n0
1+
N

E = Z 1 / 2

N n

n N 1
2

Z 12 / 2 2
n0 =
E2

Ejemplo 5.3.
El administrador de un hospital desea estimar el peso de los bebs nacidos en
su hospital, cun grande debe tomarse una muestra de los registros de
nacimientos si el administrador desea que el error mximo sea de 100 gr. con
una confianza de 99%?. La desviacin estndar de los pesos se ha estimado
en 200 gr.
Como deseamos determinar tamao de muestra (n)

Z 12 / 2 2
n=
E2
Error :

E = 100 gr

Mg. Beatriz Castaeda S.

Desv. Est. : S = 200 gr

160

BIOESTADISTICA

Confianza :
Luego

1 - = 0.99

n=

Z0.995 = 2.575

2.575 ( 200) 2
100 2

= 26.52 27

Ejemplo 5.4.
El mantenimiento de cuentas de crdito puede resultar demasiado costoso si el
promedio de compra por cuenta baja de cierto nivel. El gerente de un almacn,
con 500 cuentas de crdito, desea estimar el promedio de la cantidad
comprada por mes por sus clientes y acepta un error de no ms de $ 2,50 al
95% de confianza. cuntas cuentas debe seleccionar del archivo de la
compaa, s la desviacin estndar de las compras se estima en $15

Z12 / 2 2
Primero calculamos n0 =
E2
Error :

E = $2.50

Desv. Est. : S = $15.00

Confianza :

1 - = 0.95

Luego

1.96 2 15 2
n0 =
= 138.29 139
2.5 3

Como la poblacin es finita, entonces

Mg. Beatriz Castaeda S.

Z0.975 = 1.96

n=

139
= 109
1 + 139 / 500

161

BIOESTADISTICA

5.2.2. Estimacin Intervlica para la Varianza poblacional


Para muestras de poblacin normal
X2 =

( n 1) S 2

es

2
(n-1)

Luego para una probabilidad 1- se tiene:

/2

/2

1-

2 / 2

esto es

12 / 2

2(n-1)

P ( / 2 < (2n1) < 1 / 2 ) = 1

Al remplazar la expresin Ji-cuadrado en funcin de la muestra tenemos

( n 1) S 2
= 1
P / 2 <
<

/
2
2

por equivalencia obtenemos la expresin

( n 1) S
( n 1) S
= 1
P
< 2 <
2
2

1 / 2
/2

As los lmites para la estimacin intervlica de la varianza muestral con


confianza 1- corresponden

Mg. Beatriz Castaeda S.

162

BIOESTADISTICA

Li =

( n 1) S

2
1 / 2

Ls =

( n 1) S

2 / 2

5.2.3. Estimacin intervlica para la Proporcin poblacional (P)

Para muestra grande (n 30), los lmites para la estimacin intervlica de P se


obtienen como sigue:

a) Para muestras de poblacin grande o infinita

L = p Z 1 / 2

p(1 p )
n

b) Para muestras de poblacin finita


L = p Z 1 / 2

p(1 p ) N n

n
N 1

Ejemplo 5.5.
Para una muestra de 200 pacientes, con enfermedades pulmonares, tratados
con cierto medicamento se obtuvo que el medicamento fue efectivo en 180 de
ellos. Construya un intervalo de 95% de confianza para estimar la efectividad
del medicamento.
Aqu deseamos estimar

P: Proporcin de pacientes en los que el medicamento es efectivo


Es aceptable suponer que la poblacin es grande. Luego si en la muestra

p = 180/200 = 0.90

Mg. Beatriz Castaeda S.

163

BIOESTADISTICA

Asumiendo una confianza

1 - = 0.95,

Z0.975 = 1.96

Entonces obtenemos los lmites para la estimacin intervlica

0.90(0.10)
0.90(0.10)
= 0.858 y
Ls = 0.90 + 1.96
= 0.942
200
200
As concluimos que: con 95% de confianza se estima que el porcentaje de
Li = 0.90 1.96

pacientes en los que el medicamento sera efectivo es entre el 86% y 94%.

Ejemplo 5.6.
Una muestra de tamao 400 seleccionada de entre los 2000 alumnos que
haban consultado el servicio de salud de una universidad el ao pasado indic
que 80 tenan enfermedad de naturaleza psicosomtica.
a) Obtenga una estimacin intervlica con 95% de confianza para el
porcentaje de alumnos que tenan enfermedad psicosomtica.
b) Proporcione una estimacin, con 95% de confianza, para el nmero de
alumnos que consultaron el servicio de salud y tenan enfermedad
psicosomtica.
De la muestra:

n = 400

p = 80/400 = 0.20

a) Se desea estimar el porcentaje de alumnos con enfermedad psicosomtica


Como

n/N = 400/2000 = 0.20 ;

Luego

L = p Z1 / 2

Si (1-) = 0.95 ,

Mg. Beatriz Castaeda S.

asumimos poblacin finita

p(1 p ) N n

n
N 1
Z0.975 = 1.96

164

BIOESTADISTICA

Li = 0.20 1.96

0.2( 0.8) 1600

= 0.165
400 1999

Ls = 0.20 1.96

0.2( 0.8) 1600

= 0.235
400 1999

A partir de esta muestra se estima con 95% de confianza que el porcentaje


de alumnos consultantes que tuvieron enfermedad psicosomtica fue entre
el 16,5% y el 23,5%
b) Se desea estimar el nmero de alumnos con enfermedad psicosomtica
Como la proporcin poblacional

P = T/N

T = NP

Luego la estimacin puntual

T = N P = Np =

2000x0.20 = 400 alumnos

Para la estimacin intervlica del total, los lmites se obtienen


L (T) = N L(P)
Li(T) = 2000x0.165 = 330
Ls(T) = 2000x0.235 = 470
De los 2000 alumnos que consultaron el servicio de salud, con 95% de
confianza estimamos entre 330 y 470 tuvieron enfermedad de naturaleza
psicosomtica .

Mg. Beatriz Castaeda S.

165

BIOESTADISTICA

Error de muestreo y Tamao de muestra


e= pP

error de estimacin puntual

1-

P-E

.
p

P
e

p
P+E
_

E
Grfico 18. Error de muestreo al estimar la proporcin poblacional
Entonces para poblaciones grandes o infinitas

E = Z 1 / 2

P (1 P
n

se denomina precisin o mximo error de


estimacin puntual con probabilidad o confianza
(1- )

De aqu obtenemos que el tamao de muestra necesario para estimar la media


de una poblacin con una confianza (1 - ) de tener un error mximo E, es:

n=

Z 12 / 2 P (1 P )
E2

, Si la poblacin es grande o infinita

Si la poblacin es finita, entonces

E = Z 1

Mg. Beatriz Castaeda S.

/2

P (1 P ) N n

n
N 1

166

BIOESTADISTICA

Z 12 / 2 P (1 P )
2
n0
E
;
n=
=
n0
Z 12 / 2 P (1 P
1+
1 +
2
N
N E

Z 12 / 2 P (1 P )
n0 =
E2

Ejemplo 5.7.
El Director de un hospital desea saber que porcentaje de los pacientes dados
de

alta

estn

inconformes

con

los

cuidados

recibidos

durante

su

hospitalizacin.
a) Cun grande debe ser la muestra si se piensa que aproximadamente
el 25% de pacientes est inconforme y se desea tener una precisin del
5% al 95% de confianza?
b) Cun grande debe ser la muestra si se considera que el error mximo
deseado es de 0.05 para una confianza del 95% y no se dispone de
alguna otra informacin.

Deseamos determinar el tamao de muestra para estimar la proporcin de


pacientes inconformes (P)
a) Si asumimos poblacin grande

Z12 / 2 P (1 P )
n=
E2

como se sospecha que P 0.25


entonces para

E = 0.05

Mg. Beatriz Castaeda S.

1- = 0.95

( Z0.975 = 1.96)

167

BIOESTADISTICA

1.96 2 (0.25)(0.75)
n=
= 288
0.05 2
b) Para la determinacin del tamao de muestra como no tenemos referencia
de P, consideremos que fijado E y la confianza (1-) la expresin para n es
una funcin cuadrtica de P y toma su valor mximo para P =0.50
As calculamos n asumiendo

P =0.50,
lo que proporcionar la muestra
ms grande que garantice una
precisin E con confianza 1-

P
0

0.50

n=

1.96 2 (0.50)(0.50)
= 384
0.05 2

5.2.4. Estimacin intervlica para la diferencia de medias


A) Si las varianza poblacionales 12 y 22 son conocidas
Para muestras de cualquier tamao de poblaciones normales o para
muestras grandes (n1 30 y n2 30) en general

L = ( x 1 x 2 ) Z1 / 2 x1 x 2

donde

x1 x 2

Mg. Beatriz Castaeda S.

12
n1

22
n2

168

BIOESTADISTICA

B) Si las varianza poblacionales son desconocidas


Para muestras grandes (n1 30 y n2 30)

L = ( x 1 x 2 ) Z 1 / 2 S x1 x 2
S x1 x 2 =

donde

s 12
s 22
+
n1 n 2

C) Si las varianzas poblacionales son desconocidas,

pero son semejantes

(12 = 22). Para muestras pequeas (n1 < 30 y n2 <30) de poblaciones


normales

L = ( x 1 x 2 ) t1 / 2 S x1 x 2
donde

S x1 x 2 =

( n1 1) S12 + ( n2 1) S 22
n1 + n2 2

1
1
1
1
+
= Sc
+
n1 n2
n1 n2

t1-/2 es la cuantila 1- /2 de la t-Student con n1 + n2 -2 grados de libertad


(t(n1+n2 -2))

Ejemplo 5.8.
En grupo de investigadores del cncer de mama reuni los siguientes datos en
cuanto al tamao de los tumores:

Mg. Beatriz Castaeda S.

169

BIOESTADISTICA

Tipo de tumor
A
B

n
41
36

Construya un intervalo

(cm)
3.85
2.80

S(cm)
1.95
1.70

de confianza del 95% para la diferencia entre las

dimensiones del promedio de estos dos tipos de tumor. Interprete.


Como las muestras son grandes, entonces

L = ( x 1 x 2 ) Z 1 / 2 S x1 x 2
Luego obtenemos

S x1 x 2 =

s12 s22
+
=
n1 n2

1.95 2 1.70 2
+
= 0.416
41
36

Como 1 - = 0.95, entonces Z0.975 = 1.96


As

L = (3.85 2.80) 1.96 (0.416) = 1.05 0.815

Li = 0.235 cm

Ls = 1.865 cm

Con 95% de confianza estimamos que la dimensin promedio del tumor tipo
A es mayor que la del tipo B entre 0.24 cm y 1.87 cm
Los tumores de mama tipo A en promedio tienen mayor tamao que los
tumores tipo B
Ejemplo 5.9.
Con el objeto de comparar dos programas de capacitacin de obreros en un
trabajo de precisin, se incluyeron 20 obreros en un experimento. De stos, se
tomaron 10 al azar y fueron entrenados con el mtodo 1, el resto fue
capacitado con el mtodo 2. Despus de completar sus respectivos cursos de

Mg. Beatriz Castaeda S.

170

BIOESTADISTICA

capacitacin, los obreros fueron sometidos a una prueba de tiempo y ejecucin


que expresaba la velocidad en el tiempo (minutos) de ejecucin de dicho
trabajo. De obtuvieron los siguientes datos:

Mtodo 1: 15

20

11

23

16

21

18

16

27

24

Mtodo 2: 23

31

13

19

23

17

28

26

25

28

Suponiendo

poblaciones con

distribucin normal y

varianzas

iguales,

construya un intervalo de 95% de confianza para estimar la diferencia entre


las medias de ejecucin entre los dos mtodos. Interprete resultados.
De las muestras obtenemos
Mtodo
1
2

n
10
10

x (min)
19.1
22.3

S (min)
4.8
5.9

Luego como las muestras son pequeas y las poblaciones son normales,
asumimos que las varianzas no difieren significativamente por lo que
obtenemos los lmites como:

L = ( x 1 x 2 ) t1 / 2 S x1 x 2
Primero calculamos

S x1 x 2 =

( n1 1) S 12 + ( n2 1) S 22
n1 + n2 2

1
1
9(4.8 2 ) + 9(5.9) 2
+
=
10 + 10 2
n1 n2

1
1
+
= 2.405
10 10

Para la confianza 0.95 , obtenemos t0.975(18) = 2.101


Luego L = (19.1 22.3) 2.101 (2.405) = - 3.2 5.05

Mg. Beatriz Castaeda S.

171

BIOESTADISTICA

Li = - 8.25

Ls = 1.85

Este resultado nos indica que al 95% de confianza no podemos concluir que los
obreros capacitados con el mtodo 1 sean en promedio ms veloces que los
capacitados con el mtodo, pues el intervalo incluye al 0, y por lo tanto no haya
diferencia entre las medias.

Ejercicio
Ocho personas obesas se pusieron a dieta durante un mes. Se observ
mediante anlisis clnicos la cantidad de triglicridos al comienzo y al final del
mes.
Persona

: A

Triglicrido inicial: 310

295

287

305

Triglicrido final

251

249

259

: 263

270

323

277

299

233

267

242

265

Estime la reduccin de triglicridos, debido a la dieta. Utilice un intervalo de


confianza del

95%. Interprete sus resultados. Qu suposiciones deben

hacerse?

5.2.5. Estimacin intervlica para la diferencia de proporciones

(P1 - P2)

Para muestras grandes (n1 30 y n2 ( 30) en las que

p1: la proporcin en la muestra 1

Mg. Beatriz Castaeda S.

p2: la proporcin en la muestra 2

172

BIOESTADISTICA

Los lmites para la estimacin intervlica de la diferencia de proporciones


poblacionales las obtenemos como:

L = ( p1 p2 ) Z 1 / 2 S p1 p 2
donde

S p 1 p 2 =

p1 (1 p1 ) p2 (1 p2 )
+
n1
n2

Ejemplo 5.10.
En un

estudio diseado para conocer los efectos

secundarios de dos

medicamentos, se encontr que de los 50 animales a los que se les dio el


medicamento A, 11 de ellos mostraron efectos secundarios no deseables;
mientras que de los 50 animales que recibieron el medicamento B slo 8
mostraron efectos secundarios no deseables. Obtenga un intervalo de
confianza 0.95 para la diferencia entre las proporciones.

De la muestras obtenemos:

S p 1 p 2 =

p1 = 11/50 = 0.22

p2 = 8/50 = 0.16

0.22(1 0.22) 0.16(1 0.16)


+
= 0.078
50
50

Para el 95% de confianza

L = (0.22-0.16) 1.96(0.078) = 0.06 0.15 ;

Mg. Beatriz Castaeda S.

Li = 0.09

Ls = 0.21

173

BIOESTADISTICA

Con el medicamento

A obtuvo mayor proporcin de casos con efectos

secundarios no deseables que con el medicamento B, pero al 95% de


confianza esta diferencia no es significativa.

PRACTICA DOMICILIARIA 7
1. Una gran tienda desea estimar con una confianza de 98% y un error
mximo de 5 soles la verdadera media de las compras mensuales de sus
clientes de cuenta corriente. cul debera ser el tamao de muestra si se
sabe que la desviacin estndar es de 15 soles?
2. Cul es el tamao de muestra que se requiere para estimar la proporcin
de das en los que la contaminacin atmosfrica excede los 200
microorganismos por metro cbico, si se desea tener un error mximo de
6% con una confianza de 95%? No se tiene informacin previa de la
proporcin.
3. El mantenimiento de cuentas de crdito puede resultar demasiado costoso
s el promedio de compra por cuenta baja de cierto nivel. El gerente de un
almacn desea estimar el promedio de cantidad comprada por mes por sus
clientes que usan cuenta de crdito, con un error de no ms de $ 2,50 y una
confianza de 95%. cuntas cuentas se deben seleccionar del archivo de la
compaa si la desviacin estndar de las cuentas de crdito es de $ 7,50
4. En una conferencia de prensa, una alta autoridad anuncia que el 90% de los
habitantes adultos de un pas estn a favor de cierto proyecto econmico
del Gobierno. Una muestra aleatoria de 625 adultos indica que 55% estn

Mg. Beatriz Castaeda S.

174

BIOESTADISTICA

en favor del proyecto. Con 95% de confianza estime la proporcin de


ciudadanos adultos que estn a favor del proyecto. Interprete el resultado
con respecto al anuncio de la autoridad.
5. Se ha medido el contenido de nicotina de 36 cigarrillos de una determinada
marca. A continuacin se resumen los resultados obtenidos:
x : Contenido de nicotina de un cigarrillo, medido en miligramos
x = 756 miligramos
(x - x) = 315
Obtngase un intervalo de confianza 0.95 para estimar el contenido
promedio de nicotina de los cigarrillos de esta marca.
6. Se seleccion una muestra aleatoria de 30 docentes de entre los profesores
de una USE con el objeto de estimar la experiencia docente media de ellos.
Los resultados obtenidos en la muestra (medidos en aos) fueron:
3, 4, 4, 6, 2, 3, 4, 6, 2, 4, 6, 4, 3, 4, 4, 7, 3, 4, 5, 6, 1, 6, 4,
5, 4, 3, 2, 4, 3, 4
Utilizando la informacin anterior, obtngase un intervalo de confianza 0,99
para estimar la experiencia docente media de los profesores de la USE.
7. Se seleccion una muestra de 100 familias de una comunidad de 5000
familias. La muestra dio un ingreso familiar anual medio de S/. 15 000 y una
desviacin estndar de S/. 200. Obtngase un intervalo de confianza 0,90
para el ingreso total anual de la comunidad.
8. Para estimar la cantidad total de depsitos a la vista, un banco comercial
selecciona una muestra aleatoria de 400 cuentas. La muestra da una media
de $5000 y una desviacin estndar de $ 1000. Suponiendo que el banco

Mg. Beatriz Castaeda S.

175

BIOESTADISTICA

tiene 12000 cuentas a la vista, obtngase un intervalo de confianza 0,99


para la cantidad total en depsitos a la vista en el banco.
9. Una muestra aleatoria de 100 alumnos varones de un colegio estatal indica
que 15 alumnos practican deportes en forma activa.
a)

Obtngase un intervalo de confianza 0.90 para estimar la proporcin de


alumnos varones del colegio que practican un deporte activamente.

b)

Si el colegio tiene 1200 alumnos varones, para la misma confianza


estime el nmero de alumnos que practican deportes en forma activa.

10.El Director de Asuntos Estudiantiles de una Universidad est considerando


una nueva poltica en relacin con las residencias estudiantiles. Antes de
tomar su decisin final, desea seleccionar una muestra aleatoria de
estudiantes para estimar la proporcin de los que estn a favor de la nueva
poltica. qu tamao muestral se requiere para asegurar que el riesgo de
sobrepasar un error de 0,10 es slo 0,05?.

La universidad tiene 8 000

estudiantes.
11.Una muestra de tamao 400 seleccionada de los alumnos que haban
consultado el servicio de salud de una universidad durante el ao pasado
indic que 80 tenan enfermedad de naturaleza psicosomtica.
a) Con qu grado de confianza puede afirmarse que de 16 a 24 por ciento
de todos los alumnos que consultaron el servicio de salud el ao pasado
tenan una enfermedad psicosomtica?
b) Supngase que 2000 alumnos consultaron el servicio de salud el ao
pasado. Con la informacin de la muestra obtenga una estimacin

Mg. Beatriz Castaeda S.

176

BIOESTADISTICA

intervlica para el nmero de estos alumnos que tenan una enfermedad


de naturaleza psicosomtica
12.Doscientos cincuenta y seis pacientes que sufren de una cierta enfermedad
fueron tratados con un nuevo medicamento. Este medicamento cur a 128
pacientes con qu grado de confianza puede afirmarse que la efectividad
del medicamento est entre 45% y 55%.
13.Suponga que la concentracin de oxigeno disuelto OD para una corriente de
una planta industrial en un punto A se distribuye normalmente con varianza
0.5 (mg/lt) pero con media desconocida. Si se toma una muestra de tamao
n = 10, que arroja los siguientes resultados en mg/lt: 1.8, 2.0, 2.1, 1.7, 1.2,
2.3, 2.5, 2.9, 1.6, 2.2.
a) Estime la media con un intervalo de 99.5% de confianza. Interprete su
significado. Con dicho nivel de confianza que puede decirse de la
magnitud del error.
b) Si el ingeniero no est satisfecho con la longitud del intervalo calculado
en a), y desea reducir su longitud en un 10% conservando el nivel de
confianza del 99.5%, en cuanto debe aumentar el tamao de la muestra?

Bibliografa del captulo


1. WAYNE, D. Bioestadstica base para el anlisis de las ciencias de la salud.
Limusa Wiley. Mxio 2004; pp 658-65.
2. MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas a la
Ingeniera. McGRAW-HILL. Mxico. 1996

Mg. Beatriz Castaeda S.

177

BIOESTADISTICA

3. MASON, R., LIND, D. y MARCHAL, W. Estadstica para Administracin y


Economa. Alfaomega, Colombia. 2003
4. PAGANO, M y GAUVREAU, K. Fundamentos de Bioestadstica. Thomson
Learning. Mxico, 2000.

Mg. Beatriz Castaeda S.

178

BIOESTADISTICA

CAPITULO 6.

PRUEBAS DE HIPTESIS

6.1. Principios bsicos de prueba de hiptesis

6.1.1. Definicin
Una prueba de hiptesis es un procedimiento estadstico con el cual, utilizando
la informacin que proporciona una o ms muestras aleatorias, tomamos la
decisin de rechazar o

no rechazar un supuesto (hiptesis) acerca de la

poblacin o poblaciones de donde se ha elegido la muestra, asumiendo un


riesgo (probabilidad de error) de equivocarnos al tomar la decisin.

Para realizar el proceso de prueba de hiptesis es necesario que primero se


considere de manera clara lo que se desea probar y expresarlo de manera
escrita, lo cual luego debe ser indicado en trminos de medidas estadsticas de
la variable o caracterstica de la poblacin bajo estudio.

6.1.2.Elementos de una prueba de hiptesis


1) Hiptesis nula y alterna
Al realizar el proceso de prueba de hiptesis los supuestos deben ser
formulados de una manera adecuada para poder aplicar los procedimientos
estadsticos; por ello se debe plantear dos hiptesis, denominadas hiptesis
nula (Ho) e hiptesis alterna (H1)

Mg. Beatriz Castaeda S.

179

BIOESTADISTICA

Hiptesis nula (Ho). Es la hiptesis que el procedimiento estadstico somete a


prueba, se formula como un supuesto de no diferencia o igualdad para el valor
poblacional, o como un supuesto de no asociacin entre dos variables

Ejemplo 6.1.
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es de 5%

H0: P = 0.05

El nivel promedio de glicemia en pacientes


con diabetes tipo II del distrito de Catacaos
es 210 mg %

H0: = 210 mg%

La prevalencia de parasitosis intestinal en los


nios preescolares del asentamiento humano
la Esperanza es igual a la de los nios preescolares del distrito de San Isidro.

H 0: P 1 = P 2

Hiptesis alterna (H1)


Esta hiptesis sirve para contrastar la hiptesis nula, usualmente, se formula
como un supuesto de diferencia, lo cual incluye un amplio rango de valores,
desde una diferencia pequea hasta una diferencia relativamente grande

Ejemplo 6.2.
El porcentaje de pacientes que refiere efectos
adversos al ingerir ciprofloxacina es menor
del 5%
El nivel promedio de glicemia en pacientes
con diabetes tipo II del distrito de Catacaos
es mayor de 210 mg %

H1: P < 0.05

H1: > 210 mg %

La prevalencia de parasitosis intestinal en los

Mg. Beatriz Castaeda S.

180

BIOESTADISTICA

H1: P1 > P2

nios pre-escolares del asentamiento humano


la Esperanza es mayor que la de los nios preescolares del distrito de San Isidro.

Los supuestos planteados en las investigaciones nos llevan a formular


hiptesis de diferencia, y nosotros para el manejo estadstico lo
indicaremos como la hiptesis alterna (H1) y a la complementaria que
lleve la igualdad la indicaremos como hiptesis nula (H0).

Ejemplo 6.3
Se ha desarrollado un nuevo medicamento y deseamos probar que este es
ms eficaz que uno antiguo porque suponemos que el porcentaje de pacientes
curados es significativamente mayor con el medicamento nuevo que con el
antiguo.
Entonces:
H 0:

El medicamento nuevo es igual o


menos eficaz que el antiguo

H0: Pnuevo Pantiguo

H 1:

El medicamento nuevo es ms
eficaz que el antiguo

H1: Pnuevo > Pantiguo

Planteamiento de una hiptesis


Para considerar el planteamiento de las hiptesis tomaremos como ejemplo el
planteamiento de hiptesis para la media poblacional.
Sea el valor verdadero de la media de una poblacin o universo y k un valor
especfico; la hiptesis que se va a contrastar tomar una de las 3 formas
siguientes:

Mg. Beatriz Castaeda S.

181

BIOESTADISTICA

1. = k, significa que el valor verdadero de la media poblacional es igual a


un valor especfico k
2. k, significa que el valor verdadero de la media poblacional es mayor
o igual a un valor especfico k
3. k, significa que el valor verdadero de la media poblacional es menor
o igual a un valor especfico k.

En cada una de las proposiciones anteriores, la hiptesis que se habr de


comprobar es la hiptesis nula (H0). Esta hiptesis nula, tambin llamada de
nulidad, afirma que no existe diferencia significativa entre un estado actual
general del universo

con uno particular, como se ha establecido en la

hiptesis.

Si se rechaza la hiptesis nula (H0), esto

implica que se acepta alguna

descripcin alterna del estado del universo. Siempre existir una alternativa,
llamada hiptesis alterna o alternativa (H1), asociada con cualquier hiptesis
nula propuesta.

La aceptacin o rechazo de una hiptesis implica el rechazo o aceptacin


respectiva de la otra alternativa. O sea que estos dos eventos son mutuamente
excluyentes y completamente exhaustivos.

Las formas en las cuales se pueden presentar tanto las hiptesis nulas como
las alternativas son las siguientes:

Mg. Beatriz Castaeda S.

182

BIOESTADISTICA

Hiptesis nula (H0)

Hiptesis alternativa (H1)

1. H0: = k

H 1: k

(alternativa bilateral)

2. H0: k

H 1: < k

(alternativa unilateral)

3. H0: k

H 1: > k

(alternativa unilateral)

2) Decisin
Al realizar el proceso de prueba de hiptesis y utilizar la informacin que
proporciona una muestra, sta nos puede indicar una de dos posibles
decisiones: rechazar o no rechazar la hiptesis nula (H0).

Rechazar H0 a favor de H1. Significa que la diferencia encontrada en la


muestra respecto a lo planteado en H0 es tan grande que ya no es probable
que se deba al azar del muestreo, sino a que en la poblacin existe esta
diferencia, es decir se cumple H1.

No rechazar H0 . Significa que la diferencia encontrada en la muestra con


respecto a lo planteado en H0 es pequea y puede deberse al azar del
muestreo, por ello se dice que no hay razones suficientes para rechazar la
hiptesis nula.

3) Estadstica de la prueba
Una vez formuladas las hiptesis se debe considerar la utilizacin de la
muestra para la comprobacin de stas, es decir, el uso de una medida de la

Mg. Beatriz Castaeda S.

183

BIOESTADISTICA

muestra cuyos valores esperados se encuentren relacionados con lo expresado


en las hiptesis de manera que nos pueda servir como un indicador de la
concordancia de la muestra con una de las hiptesis planteadas.

Ejemplo 6.4
Se piensa que la vitamina C puede disminuir los niveles del colesterol srico, y
que esta disminucin en promedio es mayor de 50 mg. por 100 ml. Para
confirmar se evala una muestra de 40 personas (con niveles elevados de
colesterol) antes y despus de un tratamiento de un mes bajo un rgimen de
500 mg. diarios de vitamina C.
Entonces las hiptesis estadsticas son formuladas de la siguiente manera:

H0: 50

H1: > 50

Estas hiptesis son referidas al valor de la disminucin promedio (), por lo que
la medida de la muestra relacionada con estas hiptesis es la media muestral
( x ), ya que la media muestral se distribuye alrededor de la media poblacional,
segn el modelo normal.

De manera que si la hiptesis nula (H0) fuera cierta, esperaramos que la media
de la muestra, x , tome valor alrededor de 50 o menos; en cambio, si la

Mg. Beatriz Castaeda S.

184

BIOESTADISTICA

hiptesis alterna (H1) fuera la correcta, entonces esperaramos que x tome


valor alrededor de un valor mayor que 50; grficamente tenemos:

H0

50

H1

> 50

As para la toma de decisin se considera una medida de la muestra, que est


muy relacionada con las hiptesis planteadas, pero como los valores a
observar para la muestra estn sujetos al azar del muestreo, entonces las
decisiones se establecen sobre la base del comportamiento probabilstico de la
medida calculada a partir de la muestra, por ello la Estadstica ha construido
medidas, usando los datos de la muestra, para las cuales se pueda utilizar los
modelos tericos de probabilidad con los que se pueda realizar el proceso de
comparacin.

Ejemplo 6.5
Siguiendo con el ejemplo anterior, tenemos que:

H0: 50

H1: > 50

La Estadstica propone calcular la medida estandarizada de la media de la


muestra en lugar de usar directamente a la media muestral.

Mg. Beatriz Castaeda S.

185

BIOESTADISTICA

Z=

x 0
S
n

cuya distribuci n es N (0,1) si H 0 es cierta

Para nuestro ejemplo, como 0 = 50, al reemplazar en la expresin Z


obtenemos:

Z=

x 50
;
S
n

cuya distribucin es N(0,1) si H 0 es cierta

De manera que si la hiptesis nula (H0) fuera cierta, esperaramos que Z tome
un valor alrededor de 0 menor que 0; en cambio, si la hiptesis alterna (H1)
fuera la correcta, entonces esperaramos que Z tome valor alrededor de un
valor mayor que 0; grficamente tenemos:

Si x 50

Si x > 50

Cmo se aprecia en la expresin Z para la estadstica de la prueba, sta se ha


construido en funcin del valor planteado en H0; por lo que la prueba, como ya
se dijo anteriormente, ha sido diseada para comprobar la hiptesis nula.
Segn las hiptesis formuladas, y teniendo en cuenta los requisitos estadsticos
que se deben cumplir (tamao de muestra, distribucin probabilstica de la

Mg. Beatriz Castaeda S.

186

BIOESTADISTICA

poblacin, relacin de independencia entre los grupos, etc), La Estadstica ha


diseado expresiones diversas cuya distribucin probabilstica se asocia a un
modelo de probabilidad, por lo que a las pruebas se les denomina con el
nombre del modelo que sigue o se aproxima a tener la estadstica de la prueba.

Ejemplo 6.6
1. Prueba Z para la media
H0 : = 0
H0 : 0
Estadstica de la prueba:

Z=

x 0
S
n

Esta prueba es aplicable slo si la muestra es grande (n 30)

2. Prueba T para la media


H0 : = 0

H0 : 0

T =

Estadstica de la prueba:

x 0
S
n

Esta prueba es aplicable para muestras pequeas (n < 30) de poblacin


normal.

3. Prueba Z para la proporcin


H0 : P = P0

H1 : P P 0

Estadstica de la prueba:

Z=

p P0
P0 (1 P0 )
n

Esta prueba es aplicable slo si la muestra es grande (n 30)

Mg. Beatriz Castaeda S.

187

BIOESTADISTICA

4) Regin crtica y regin de no rechazo


Al elegir muestras aleatorias de tamao n de una poblacin, debido al azar del
muestreo, algunas muestras tendrn medidas que sern concordantes o
favorecern a la hiptesis nula (H0) y otras sern concordantes o favorecern a
la hiptesis alterna (H1). As para la toma de decisin se considera una medida
de la muestra, que est muy relacionada con las hiptesis planteadas, y a su
recorrido esperado se divide en dos regiones excluyentes y complementarias
llamadas Regin crtica o de rechazo y Regin de no rechazo.

Ejemplo 6.7
Para probar las hiptesis

H0: 50

H1: > 50

Si consideramos como estadstica para la prueba a la cantidad Z

Z =

x 50
S
n

y eligiramos a 2 como el punto de divisin de su recorrido esperado


tendramos

Si x 50

Si x > 50

Regin de no Rechazo

Mg. Beatriz Castaeda S.

Regin de Rechazo (RC)

188

BIOESTADISTICA

Luego como se aprecia en la figura hemos dividido al recorrido de Z en dos


regiones, de manera que si la media de la muestra x es mayor que 50 y su
valor estandarizado (Z) es mayor que 2, rechazamos H0 a favor de H1, pues el
resultado de la muestra es concordante con H1; en cambio si x es cercano a
50 y su valor estandarizado (Z) es menor que 2, nosotros no podemos rechazar
H0 , pues la diferencia

encontrada es pequea

(no significativa) y podra

deberse al azar del muestreo.

Regin de no rechazo: Conjunto de resultados muestrales que son


concordantes o favorecen a la hiptesis nula, indicando que la diferencia
encontrada en la muestra con respecto a lo planteado en H0 es pequea (no
significativa) y puede deberse al azar del muestreo.

Regin crtica o regin de rechazo (R.C.): Conjunto de resultados muestrales


que son concordantes o favorecen a la hiptesis alterna, indicando que la
diferencia encontrada en la muestra con respecto a lo planteado en H0 es
grande (significativa) y ya no es posible que se deba al azar del muestreo sino
a que realmente hay diferencias.

5) Tipos de error
Al tomar una decisin sobre la base de la informacin que proporciona una
muestra, como desconocemos la situacin real de la poblacin, corremos el
riesgo de equivocarnos. As al no rechazar H0 cuando esta es verdadera no
cometemos error, en cambio si rechazamos H0 cuando es verdadera

Mg. Beatriz Castaeda S.

189

BIOESTADISTICA

cometemos un error. De manera similar si H0 es falsa (H1 es verdadera) y la


muestra nos indica no rechazar H0 cometemos un error en cambio si la muestra
nos indicara rechazar no cometemos error.

Poblacin

H0
Verdadera

H0
Falsa

H1
verdadera

La muestra indica
No rechazar H0
(no error)

Rechazar H0
(error tipo I)

No rechazar H0
(error tipo II)

Rechazar H0
(no error)

Grfico 19. Tipos de error en la toma de decisin


Luego en el proceso de prueba de hiptesis estamos expuestos a cometer 2
errores posibles

Error Tipo I = Rechazar H0 cuando H0 es verdadera


Error Tipo II = No rechazar H0 cuando H0 es falsa, es decir, H1 es
verdadera

6) Nivel de significancia y Potencia de la Prueba


En el proceso de toma de decisin se tiene por objeto que las probabilidades
de cometer error sean pequeas; as se denomina a la probabilidad de
cometer error Tipo I y a la probabilidad de cometer error tipo II, es decir,

Mg. Beatriz Castaeda S.

190

BIOESTADISTICA

= P(error tipo I) = P(Rechazar H0 cuando H0 es verdadera)


a la probabilidad tambin se denomina nivel de significancia de la prueba

o tamao de la regin crtica, y el investigador la debe fijar por


adelantado, segn el riesgo que est dispuesto a correr, de rechazar una
situacin que en la realidad es cierta.

= P(error tipo II) = P(No rechazar H0 cuando H0 es falsa)


A (1 - ) se denomina potencia de la prueba y es la probabilidad de rechazar
H0 cuando sta es falsa, es decir, cuando H1 es verdadera, esto es:

1 - =P[Rechazar H0 cuando H0 es falsa (H1 verdadera)] = Potencia de la


prueba
La potencia de la prueba mide la probabilidad de detectar las diferencias, es
decir, detectar que H1 es verdadera y es utilizada al considerar la
determinacin del tamao de muestra necesario para probar las hiptesis.

Para calcular las probabilidades y es necesario que las hiptesis sean


formuladas para valores especficos de los parmetros de la poblacin,

Ejemplo 6.8
Continuando con el ejemplo anterior consideremos para la hiptesis alterna un
valor mayor que 50, por ejemplo 60, luego las hiptesis quedan especificadas
como:

Mg. Beatriz Castaeda S.

191

BIOESTADISTICA

H0: = 50

H1: = 60

Entonces la distribucin de la media muestral podra ser alrededor de 50 si H0


es verdadera o alrededor de 60 si H0 es falsa (H1 es verdadera), grficamente
tenemos:

H0

1-

H1

1-
x

= 50
Regin de no rechazo

= 60
Regin crtica o de rechazo (R.C.)

Grfico 20. Probabilidad de error tipo I () y de error tipo II ()

= P(Rechazar H0 cuando H0 es verdadera)


= P( x se encuentre en la Regin de rechazo, cuando H0 es verdadera)

= P( x > c; cuando = 50)

= P(No rechazar H0 cuando H0 es falsa, es decir, H1 es verdadera)


= P( x se encuentre en la Regin de no rechazo, cuando H1 es verdadera)
= P( x c; cuando = 60)
Observamos que las probabilidades y han quedado determinadas por el

punto de corte (c) y se encuentran relacionadas entre si, de manera que si


cambiamos el punto de corte una disminuye y la otra crece, y viceversa.

Mg. Beatriz Castaeda S.

192

BIOESTADISTICA

7) Nivel crtico (p) de una prueba estadstica


El nivel crtico (p) es la probabilidad mnima con la que se podra rechazar la
hiptesis nula (H0) sobre la base de los resultados obtenidos en la muestra,
bajo el supuesto de que la hiptesis nula es verdadera (Conover W.J.

Practical Nonparametric Statistics. Pg.80)

p = P(rechazar H0 con los resultados obtenido en la muestra observada,


cuando H0 es verdadera)
Este valor p es la principal estadstica utilizada en la prueba de hiptesis. El
cual indica la probabilidad, asumiendo que la hiptesis nula fuera verdadera, de
que los datos observados se alejen del valor planteado en la hiptesis nula en
la magnitud observada o en una magnitud mayor, slo debido a la casualidad o
el azar. El valor p es calculado partiendo del modelo estadstico que se
considera que describe el patrn de comportamiento de las observaciones
cuando el azar es la nica causa para su variabilidad (Kenneth J. Rothman:

Modern Epidemiology pg 116).

Ejemplo 6.9
Para las hiptesis formuladas anteriormente

H0: 50

H1: > 50

Supongamos que la muestra observada proporcion los resultados siguientes


para la media y desviacin estndar:
n = 40 ;

x = 58 ;

S = 16

Mg. Beatriz Castaeda S.

193

BIOESTADISTICA

Deseamos saber si esta media muestral difiere significativamente con respecto


a la reduccin promedio de 50 mg por 100 ml propuesta en H0, luego
calculamos p, la probabilidad de que la media de la muestra tome un valor tan
grande o mayor que 58, asumiendo que la verdadera media es igual a 50.

p = P( x 58 cuando = 50) o en trminos de la estadstica Z

x 0
58 50
= P(Z 3.16) = 0.00079
P

16 / 40
S/ n

Grficamente tenemos:

p = 0.00079
Z

50
As

58

3.16

p = 0.00079 0.008 < 0.001

Este valor

p se interpreta

para tomar la decisin, as tenemos que la

probabilidad de obtener una media muestral mayor o igual a 58, cuando la


media de la poblacin es 50, es casi improbable (p < 0.001); por lo que
concluimos que la diferencia es altamente significativa e indicadora de que la
disminucin promedio del nivel de colesterol srico es mayor de 50 mg por 100
mL.

Mg. Beatriz Castaeda S.

194

BIOESTADISTICA

Cuadro 13. NIVEL CRTICO DE UNA PRUEBA ESTADSTICA:


INTERPRETACIN *
Nivel crtico
p > 0.05
0.01 < p 0.05

0.001 < p 0.01


p 0.001

Interpretacin

Conclusin

Indica que la diferencia encontrada


es no significativa y puede deberse
al azar del muestreo
Indica que la diferencia encontrada
es significativa y que probablemente ya
no se deba al azar del muestreo
Indica que la diferencia encontrada
es muy significativa y probable-mente
se deba a que hay diferencias en la
poblacin
Indica que la diferencia encontrada
es altamente significativa y probablemente se deba a que hay diferencias
en la poblacin

No rechazar H0
No hay evidencia suficiente
para rechazar.
Rechazar H0 a favor de H1
hay evidencia suficiente
para rechazar
Rechazar H0 a favor de H1
hay evidencia suficiente
para rechazar
Rechazar H0 a favor de H1
hay evidencia suficiente
para rechazar

* Si para la realizacin de la prueba de se ha pre-fijado un nivel de significancia

, entonces para tomar la decisin se compara p con , de manera que

Si p > , entonces no se puede rechazar la hiptesis al nivel establecido


Si p , entonces se rechaza la hiptesis nula para el establecido.

Mg. Beatriz Castaeda S.

195

BIOESTADISTICA

Resumen
En esta unidad Ud. ha recibido las bases para la realizacin de una prueba de
hiptesis estadstica, la cual ser una herramienta muy til para la
comprobacin de los supuestos planteados en las investigaciones en las que
Ud, participe. A continuacin se presenta un esquema resumido del
procedimiento a seguir para la realizacin de una prueba de hiptesis

PROCEDIMIENTO A SEGUIR PARA LA REALIZACIN DE UNA


PRUEBA DE HIPOTESIS

1. Defina con claridad los supuestos que se plantean en la


investigacin
2. Identifique la o las poblaciones bajo estudio
3. Identifique el tipo de la variable en estudio, relacionada
con las suposiciones.
4. Plantee las hiptesis nula y alternativa.
5. Elija la prueba estadstica apropiada para la prueba de las
hiptesis planteadas.
6. Pre-determine el nivel de significancia para la regin de
rechazo
7. Calcule la estadstica de la prueba con
obtenidos para este fin

los datos

8. Obtenga el nivel crtico para el resultado obtenido con la


muestra
9. Tome la decisin comparando el nivel crtico (p) con el
nivel de significancia ()

Mg. Beatriz Castaeda S.

196

BIOESTADISTICA

Ejercicio Aplicativo
RENDIMIENTO ESCOLAR Y DESARROLLO VISOMOTOR EN HIJOS DE
MADRES ADOLESCENTES
Silvestre N, Villena A. Gonzles G, Instituto de Investigaciones de la Altura.
Dpto. de Ciencias Fisiolgicas. Universidad Peruana Cayetano Heredia.
(Revista Mdica Herediana 7. Suplemento 1, 1996. pg 6)
El objetivo del presente estudio fue determinar el desarrollo visomotor y el
rendimiento escolar en hijos de madres adolescentes y compararlos con los
observados en hijos de madres adultas. La muestra estuvo constituida por 59
nios de 7-8 aos de edad, mestizos que residen en la ciudad, hijos de madres
adolescentes, y 73 nios de 7-8 aos de edad, hijos de madres adultas ( > 20
aos). El desarrollo visomotor fue evaluado utilizando la prueba de Bender. El
rendimiento escolar fue analizado en base al porcentaje de nios de cada
grupo que desaprob el ao escolar ( 10).

La prueba de Bender se basa en el nmero de errores que tiene un nio


cuando trata de reproducir nueve figuras que le han sido mostradas.

Los hijos de madres adolescentes tuvieron el mayor nmero de errores (6,34


0,38; media ES) en la prueba de Bender cuando se les compara con los
resultados en hijos de madre adulta (4,75 0,24; p < 0.001)

El 13,8% de hijos de madres adolescentes desaprobaron el ao escolar a


diferencia del 4,3% observado en hijos de madre adulta (p <0.01)

Mg. Beatriz Castaeda S.

197

BIOESTADISTICA

En conclusin, los hijos de madres adolescentes tienen un retardo en el


desarrollo visomotor y un menor rendimiento escolar que los hijos de madres
adultas
Para esta investigacin identifique
1) Poblacin o poblaciones bajo estudio

2) Variables de inters y su tipo

3) Hiptesis del estudio

4) Hiptesis estadsticas

5) Interpretacin del nivel crtico

Mg. Beatriz Castaeda S.

198

BIOESTADISTICA

6.2. PRUEBAS ESTADSTICAS


6.2.1. PRUEBAS PARAMETRICAS Y PRUEBAS NO PARAMETRICAS
Segn los requisitos exigidos para tener en consideracin la distribucin de la
estadstica de la prueba, las pruebas estadsticas se han dividido en dos
grandes grupos denominados Pruebas paramtricas y pruebas no paramtricas

Pruebas paramtricas son aquellas en las que el inters se centra en probar


una hiptesis acerca de uno o ms parmetros de la poblacin, adems lo
bsico de estos procedimientos es que se debe conocer la distribucin de la
poblacin de la cual proviene la muestra (usualmente el modelo normal)
Pruebas no paramtricas son aquellos procedimientos que prueban hiptesis
que no son afirmaciones acerca de parmetros de la poblacin, sino ms bien
plantea determinados comportamientos para la poblacin, o aquellos para los
cuales no se exige que la poblacin tenga una distribucin conocida (WAYNE,
D. Bioestadstica base para el anlisis de las ciencias de la salud. Limusa
Wiley. Mxio 2004; pp 658-659)
Cuadro 14. PRUEBAS PARAMTRICAS
Nmero de
Grupos

Uno

Dos

Variable
de inters
cuantitativa

Media :
Varianza: 2

Prueba Estadstica
Prueba Z
Prueba T
Prueba Ji-Cuadrado

Categrica

Proporcin: P

Prueba Z

cuantitativa

Categrica

K
(K 3)

Parmetro
Poblacional

cuantitativa

Medias: 1, 2 Prueba de comparacin


de medias: Prueba Z o T
Media de la
diferencia: d Prueba - datos apareados
Prueba de comparacin
Varianzas:
de varianzas
Prueba F
2 1 , 2 2
Prueba de comparacin
Proporciones: de proporciones
P 1, P 2
Prueba Z
Prueba de comparacin
Medias :
de medias
Anlisis
de
Varianza
1, 2, ..., k
(Prueba F)
Prueba de Bartlet para
Varianzas:
2
2
2
1, 2, ..., k comparacin de varianzas

Elaboracin propia

Mg. Beatriz Castaeda S.

199

BIOESTADISTICA

Cuadro 15. PRUEBAS NO PARAMTRICAS


Nmero de
Grupos

Variable
de inters

Hiptesis

Prueba Estadstica

Prueba de bondad de
Distribucin de la ajuste
Cuantitativa, poblacin tiene
Ordinal o
un modelo deter- Prueba Ji-Cuadrado *
categrica
minado
Prueba de Kolmogorov
Smirnov

Uno
Ordinal o
cuantitativa
Categrica

Dos

Ordinal o
cuantitativa
Categrica

Ordinal
cuantitativa

K
(K 3)
Categrica

Mdicin de efec- Prueba del signo*


to antes-despus
(observaciones
Prueba de Wilcoxon*
apareadas)
Prueba de McNemar *
Comparacin de
mediciones
(grupos indepen- Prueba de
Mann-Whitney *
dientes)
Comparacin de Prueba exacta
proporciones
de Fisher *
Comparacin de
mediciones
Prueba
(grupos indepen- Wallis*
o dientes
Comparacin de
mediciones
(grupos dependientes)
Comparacin de
Proporciones:
P1j, P2j, ..., Pkj

de

Kruskal-

Prueba de Friedman*
Prueba de comparacin
de proporciones o de
homogeneidad
Prueba Ji-Cuadrado

Comparacin de
tratamientos
(Observaciones Prueba de Cochran *
relacionadas)
* Estas pruebas no son desarrolladas en este curso
Elaboracin propia

Mg. Beatriz Castaeda S.

200

BIOESTADISTICA

6.2.2. PRUEBAS PARAMETRICAS


6.2.2.1. Pruebas de Hiptesis para la media poblacional ()
Prueba Z para la media ()
Datos:
La muestra consiste de n valores cuantitativos,

independientes de una

poblacin

Requisitos:
1) La muestra es aleatoria
2) Muestra grande de cualquier poblacin o muestra de cualquier tamao si
la poblacin tiene distribucin normal.
3) Varianza poblacional 2 conocida.

Hiptesis:
a) H0: = 0

H1: 0

b) H0: 0

H1: > 0

c) H0: 0

H1: < 0

Estadstica de la prueba

Z=

x 0
/ n

Z tiene distribucin normal N(0,1) si H0 es verdadera.

Regla de decisin
a) Rechazar H0 al nivel , si

Mg. Beatriz Castaeda S.

Z < -Z1-/2

Z > Z1-/2

201

BIOESTADISTICA

/2

/2

Z
-Z1-/2
R.C.

b) Rechazar H0 al nivel , si

Z1-/2

R.C.

Z > Z1-

Z
0
c) Rechazar H0 al nivel , si

Z1-
R.C.

Z < -Z1-

-Z1-
R.C.

Nota
Si la varianzas 2, es desconocida, entonces, slo cuando la muestra sea
grande (n 30 ), la estadstica Z se obtendr como

Z =

x 0
S/ n

Mg. Beatriz Castaeda S.

202

BIOESTADISTICA

Ejemplo 6.10.
Se llev a cabo un estudio sobre nutricin en un pas en desarrollo. El objetivo
del estudio fue determinar si los habitantes de una regin rural tenan un
consumo diario mnimo de 2000 caloras, que cubriera sus requerimientos
bsicos para la supervivencia. Una muestra de 500 adultos campesinos report
un consumo medio diario de caloras de 2015 con una desviacin estndar de
210 caloras.
De acuerdo a los objetivos propuestos, planteamos hiptesis para el consumo
promedio diario de caloras en la regin:

H0: = 2000

H1: > 2000

Recordemos que plantear que el consumo medio diario de la poblacin es de


2000 caloras, implica que el 50% de la poblacin consume menos de 2000
caloras y que el otro 50% consume ms de 2000 caloras, por ello para que la
mayora de la poblacin tenga un consumo diario mnimo de 2000 caloras, el
promedio debera ser mayor de 2000 caloras (ver grfico)

50% 50%

= 2000

> 2000

Como la muestra es grande calculamos

Mg. Beatriz Castaeda S.

203

BIOESTADISTICA

Z =

x
S /

2015 2000
210 / 500

Para este valor de Z, calculado con

= 1 . 598

la informacin de la muestra,

obtenemos el nivel crtico p para la toma de decisin:

p = 0.0548
Z
1.598

p = P(Z 1.598) = 0.0548 > 0.05


lo que

indica que el consumo promedio diario de caloras no difiere

significativamente de 2000 caloras ( p >0.05), por lo que no podemos


concluir que la mayora de la poblacin, de esta regin, tenga consumo
diario mnimo de 2000 caloras.

Prueba T para la media ()


Datos:
La muestra consiste de n valores cuantitativos independientes de una
poblacin normal

Requisitos:
1) La muestra es aleatoria
2) Muestra pequea (n < 30) procedente de una poblacin normal.
3) Varianza poblacional 2 desconocida.

Mg. Beatriz Castaeda S.

204

BIOESTADISTICA

Hiptesis:
a) H0: = 0

H1: 0

b) H0: 0

H1: > 0

c) H0: 0

H1: < 0

Estadstica de la prueba

T =

x 0
S/ n

T tiene distribucin t-Student con n-1 grados de libertad [ t(n-1) ], si H0 es


verdadera.

Regla de decisin
a) Rechazar H0 al nivel , si

T < -t1-/2

T > t1-/2

/2

/2

T
-t1-/2
R.C.

b) Rechazar H0 al nivel , si

t1-/2
R.C.

T > t1-

T
0

Mg. Beatriz Castaeda S.

t1-
R.C.

205

BIOESTADISTICA

c) Rechazar H0 al nivel , si

t < -t1-

-t1-
R.C.

Ejemplo 6.11.
Un laboratorio farmacutico conduce una investigacin relativa a la eficacia de
una vacuna contra el sarampin. La variable considerada es los ttulos de
anticuerpos en suero producidos por la vacuna.
La vacuna producida por otro laboratorio reporta un ttulo promedio

de

anticuerpos de 1.9.
Para probar si la nueva vacuna es ms eficaz que la vacuna antigua, se aplic
la vacuna a 16 voluntarios y se obtuvo los siguientes resultados:
1.2, 3.0, 2.5, 2.4, 1.9, 1.8, 1.5, 2.6, 2.7, 3.1, 1.7, 2.3, 2.2, 2.4, 2.2, 2.1

Luego aqu planteamos las hiptesis

H0: El ttulo promedio del anticuerpo de esta nueva vacuna es igual al de


la vacuna antigua. ( = 1.9)

H1: El ttulo promedio del anticuerpo de esta nueva vacuna es mayor que
la de la vacuna antigua ( > 1.9)
Como la muestra es pequea, con los datos se ha se comprobado que la
distribucin de los ttulos del anticuerpo tienen distribucin normal, por lo tanto
para probar las hiptesis utilizaremos la prueba T

Mg. Beatriz Castaeda S.

206

BIOESTADISTICA

Luego calculamos la media, desviacin estndar y la estadstica T para realizar


la prueba de las hiptesis.

x = 2.225

T=

x 0
S/ n

S = 0.518

2 .225 1 .9
= 2 .51
0 .518 / 16

Para el valor calculado de

obtenemos el nivel crtico

distribucin t-Student con 15 grados de libertad.

p utilizando la

t (15 )

p = 0.012

t (15 )
2.51
Este

resultado nos indica que los datos son

concordantes con un valor

promedio mayor a 1.9, pues la diferencia encontrada es muy significativa (p =


0.012).
Luego podramos concluir que la nueva vacuna produce ttulos de anticuerpos
significativamente mayores que los producidos por la vacuna antigua.

Mg. Beatriz Castaeda S.

207

BIOESTADISTICA

Resumimos las pruebas de hiptesis para la media poblacional en la siguiente


tabla

Cuadro 16. PRUEBA DE HIPTESIS PARA LA MEDIA POBLACIONAL

Prueba

a) H0: = 0

H1: 0

b) H0: 0

H1: > 0

c) H0: 0

H1: < 0

Requisitos
Varianza 2 conocida
-Todo n de poblacin
Normal
n
grande
de
cualquier
poblacin

Estadstica
de la prueba

Distribucin
Decisin:
Rechazar H0
de
La estadstica Al nivel si
Si H0 es cierta

x 0
Z=
/ n

Normal
N(0,1)

Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-

Varianza
2
desconocida
- n grande (n > 30)
de cualquier poblacin

x 0
Z =
S/ n

Normal

a) Z < -Z1-

N(0,1)

Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-

Varianza
2
desconocida
- n < 30 de poblacin
Normal

x 0
T=
S/ n

t-Student

a) T < -t1-/2
T > t1-/2
b) T > t1-
c) T < -t1-

Mg. Beatriz Castaeda S.

t(n -1)

a) Z < -Z1/2

/2

208

BIOESTADISTICA

6.2.2.2. Prueba Ji-Cuadrado para la varianza 2


Datos:
La muestra consiste de n valores cuantitativos independientes de una
poblacin normal.

Requisitos:
1) La muestra es aleatoria
2) La poblacin es normal.

Hiptesis:
a) H0: 2 = 20

H1: 2 20

b) H0: 2 20

H1: 2 > 20

c) H0: 2 20

H1: 2 < 20

Estadstica de la prueba:

X =
2

(n 1) S 2

02

X2 tiene distribucin Ji-cuadrado

2( n 1)

, si H0 es verdadera.

Regla de decisin:
si X2 < 2 / 2

a) Rechazar H0 al nivel ,

X2 > 12 / 2

/2

/2

X2

2 / 2

R.C.

Mg. Beatriz Castaeda S.

12 / 2

R.C.

209

BIOESTADISTICA

b) Rechazar H0 al nivel ,

si

X2 >

12

X2

12

R.C.
si X2 < 2

c) Rechazar H0 al nivel ,

X2

R.C.
Ejemplo 6.12.
Para que un medicamento sea eficaz contra cierta enfermedad debe tener
cierta concentracin del principio activo definida con exactitud. Por esta razn
la concentracin

de dichos medicamentos debe tener un valor medio de

acuerdo a lo especificado en su envase y, adems, la variacin de la


concentracin debe ser

pequea. De no ser as las farmacias estaran

expendiendo medicamentos que podran tener concentraciones peligrosamente


elevadas

o que podran

tener una concentracin tan baja que los hara

ineficaces.

Un fabricante de cierto medicamento registra en sus envases que su producto


tiene una concentracin del principio activo de 5 0.1 mg/cc.

Mg. Beatriz Castaeda S.

210

BIOESTADISTICA

Esta afirmacin nos llevara a plantear que la distribucin de la concentracin


de este

medicamento sera normal con media = 5 y desviacin

estndar

= ( 0.1) /3 = 0.033
grficamente tendramos:

99.7%

X
5
y

4.9
3 = 0.1

5.1
3 = 0.1

Es decir si 3 = 0.1, se garantizara que el 99.7% de los productos tendran


una concentracin en el rango de 4.9 a 5.1 mg/cc.

Para verificar la concentracin del medicamento estaramos interesados en


probar dos hiptesis para la concentracin del medicamento, esto es:

a) La concentracin promedio es 5 mg/cc


H 0: = 5

H 1: 5

b) La variabilidad de la concentracin del medicamento es 0.033 mg /cc


H0: 2 (0.033) 2

Mg. Beatriz Castaeda S.

H1: 2 > (0.033) 2

211

BIOESTADISTICA

se tom una muestra de 8 envases para los cuales se obtuvo las siguientes
concentraciones en mg /cc

4.94, 5.09, 5.03, 4.90, 4.95, 5.04, 5.02, 4.93


Como la eleccin de la prueba para las hiptesis formuladas acerca de la
media, en el caso de muestras pequeas, depende de que se conozca la
varianza de la poblacin; primero probaremos las hiptesis para la varianza

De la muestra observada obtenemos:

n=8;

Luego

x = 4.9875;

S2 = 0.00439;

S=0.0663

(n 1) S 2 7(0.00439)
X =
=
= 28.21
20
(0.033) 2
2

Para el valor calculado de

X2

obtenemos el nivel crtico

distribucin Ji-Cuadrado con 7 grados de libertad.

p utilizando la

2( 7)

p < 0.001

2( 7)
28.21
como P < 0.001, entonces se rechaza H0 a favor de H1
Luego, este resultado nos indica que la diferencia encontrada es muy grande y
que es casi improbable que se deba a la variabilidad del muestreo por lo que

Mg. Beatriz Castaeda S.

212

BIOESTADISTICA

concluimos: Que el fabricante de este medicamento est elaborando el

producto con una concentracin cuya variabilidad es mucho mayor que


la especificada en sus envases (desviacin estndar = 0.033 mg/cc), pues
la diferencia encontrada es altamente significativa (p < 0.001)

Entonces, como se ha rechazado el valor supuesto para la varianza, la prueba


de las hiptesis para la media la realizaremos utilizando la prueba T para
muestras pequeas con varianza poblacional desconocida.

H 0: = 5
De los datos de la muestra tenemos:

T=

x 0
S/ n

H 1: 5

4.9875 5
= 0.533
0.0663 / 8

Para el valor calculado de

obtenemos el nivel crtico

distribucin t-Student con 7 grados de libertad.

p utilizando la

t (7)

p > 0.25
2

t (7)
- 0.533
Por ser una prueba de alternativa bilateral

p > 0.50 > 0.05

Este resultado nos indica que los datos son concordantes con el valor 5 para la
media poblacional, ya que la diferencia encontrada es pequea y es altamente
probable que se deba al azar del muestro.

Mg. Beatriz Castaeda S.

213

BIOESTADISTICA

Concluimos que no podemos rechazar lo especificado por el fabricante para la


concentracin media del medicamento (5 mg/cc), pues no hay evidencia
suficiente (p > 0.05)

En resumen concluimos que esta muestra nos indica que el fabricante


debera corregir la variabilidad de la concentracin del medicamento para
que cumpla con las especificaciones.

6.2.2.3. Prueba Z para una proporcin poblacional (P)


Datos:
Muestra que consiste de n resultados de observaciones independientes, cada
resultado puede estar en una de dos categoras pero no en ambas.

Requisitos:
1. Las n observaciones son mutuamente independientes
2. Cada resultado de las n observaciones tiene probabilidad P de
pertenecer a la categora 1
3. La muestra es grande
4. La poblacin es infinita, es decir la muestra(n) es mximo el 10% de la
poblacin(N) (n 0.10 N)

Hiptesis:
a) H0: P = P0

H 1: P P 0

b) H0: P P0

H 1: P > P 0

c) H0: P P0

H 1: P < P 0

Mg. Beatriz Castaeda S.

214

BIOESTADISTICA

Estadstica de la prueba:

p P0

Z=

Z es N(0,1), si H0 es verdadera

P0 (1 P0 )
n

Regla de decisin
a) Rechazar H0 al nivel , si

Z < -Z1-/2

Z > Z1-/2

/2

/2

Z
-Z1-/2
R.C.
b) Rechazar H0 al nivel , si

Z1-/2

R.C.

Z > Z1-

Z
0
c) Rechazar H0 al nivel , si

Z1-
R.C.

Z < -Z1-

-Z1-
R.C.

Nota
Si la poblacin es finita, es decir, la muestra (n) es mayor al 10% de la
poblacin (N) (n > 0.10 N), entonces la estadstica Z se obtendr como

Mg. Beatriz Castaeda S.

215

BIOESTADISTICA

p P0

Z =

P0 (1 P0 ) N n

n
N 1

Ejemplo 6.13.
Luego de la realizacin de un programa de inmunizacin contra la rubola, se
inform que la inmunizacin haba tenido una cobertura del 50% de los nios
de primaria. Una institucin supervisora sospecha que se ha sobre valorado la
cobertura del programa, por lo que aplic una encuesta a 500 nios de
primaria, revelando que 150 nios haban sido inmunizados. Al 5% de
significancia podremos decir que estos resultados validan lo afirmado acerca
de la cobertura del programa de inmunizacin?
Luego la proporcin en la muestra es

P = 150 = 0.30
500

Aqu planteamos las hiptesis

H1: P < 0.50

H0: P = 0.50

Calculamos la estadstica Z
Z =

p P0
=
P 0 (1 P 0 )
n

0 . 30 0 . 50
= 8 . 944
0 . 50 ( 0 . 50 )
500

Calculamos el nivel crtico

p = P(Z < -8.944) 0


Este resultado nos indica la diferencia es tan grande que es improbable que
pueda deberse al azar del muestreo, por lo que para cualquier nivel de
significancia elegido se estara rechazando la hiptesis nula, es decir,

Mg. Beatriz Castaeda S.

216

BIOESTADISTICA

concluimos que se ha sobre valorado la cobertura del programa de


inmunizacin.

6.2.2.4.

Pruebas de Hiptesis para


poblacionales (1, 2)

la comparacin de medias

Prueba Z para la diferencia de medias (1 - 2)


Datos:
Una muestra de tamao n1 (x1, x2, ....., xn1) de la poblacin 1 y una muestra de
tamao n2 (x1, x2, ....., xn2) de la poblacin 2

Requisitos:
1) Ambas son muestras aleatorias de su poblacin correspondiente.
2) Las poblaciones 1 y 2 son independientes
3) Las muestras son grandes (n1 30; n2 30) de cualquier poblacin o
son de cualquier tamao si la poblaciones son normales.
4) Las varianzas poblacionales 21, 22 son conocidas

Hiptesis:
a) H0: 1 = 2

H1: 1 2

H0: 1 - 2 = 0

H1: 1 - 2 0

b) H0: 1 2

H1: 1 > 2

H0: 1 - 2 0

H1: 1 - 2 > 0

c) H0: 1 2

H1: 1 < 2

H0: 1 - 2 0

H1: 1 - 2 < 0

Mg. Beatriz Castaeda S.

217

BIOESTADISTICA

Estadstica de la prueba
( x1 x 2 )

Z =

12
n1

22
n2

Z tiene distribucin normal N(0,1) si H0 es verdadera.

Regla de decisin
a) Rechazar H0 al nivel , si

Z < -Z1-/2

Z > Z1-/2

/2

/2

Z
-Z1-/2
R.C.
b) Rechazar H0 al nivel , si

Z1-/2

R.C.

Z > Z1-

Z
0
c) Rechazar H0 al nivel , si

Z1-
R.C.

Z < -Z1-

-Z1-
R.C.

Mg. Beatriz Castaeda S.

218

BIOESTADISTICA

Nota
Si las varianzas 21, 22 son desconocidas, entonces slo cuando las
muestras sean grandes (n1 30, n2 30), la estadstica Z se obtendr
como

Z =

( x1 x2 )
S 12
S 22
+
n1
n2

Ejemplo 6.14.
Un epidemilogo desea comparar dos vacunas para la rabia. Las personas que
previamente haban recibido dichas vacunas se dividieron en dos grupos. El
grupo 1 recibi una dosis de refuerzo de la vacuna del tipo 1 y el grupo 2
recibi una dosis de refuerzo de la vacuna tipo 2. Las respuestas de los
anticuerpos se registraron dos semanas despus. Las medias, desviaciones
estndar y tamaos de las muestras para los dos grupos fueron los siguientes:

Grupo

Tamao de
La muestra

1
2

30
49

Media
x
4.5
2.5

Desv. est.
s
2.5
2.0

Nivel de significancia pre-fijado = 0.01


(Enunciado adaptado de Bioestadstica. 3ra edicin de Daniel, W pg. 250)

Para realizar la comparacin planteamos las hiptesis:

H0: No existe diferencia en la efectividad de las dos vacunas utilizadas


para dosis de refuerzo.

1 = 2

Mg. Beatriz Castaeda S.

219

BIOESTADISTICA

H1: Existe diferencia en la efectividad de las dos vacunas utilizadas para


dosis de refuerzo.

1 2
Por ser muestras grandes y no contar con las varianzas poblacionales,
calculamos

Z=

( x1 x 2 )
S12 S 22
+
n1 n2

4.5 2.5
( 2.5) 2 ( 2.0) 2
+
30
49

= 3.71

Para este valor de Z, calculado con la informacin de la muestra, obtenemos el


nivel crtico p para la toma de decisin:

p = 0.0001
2
3.71
p = P (Z 3.71) = 0.0001
2

Z
p = 0.0002 < 0.001

Comparamos este valor p con el nivel de significancia pre-determinado = 0.01

Luego como p < 0.01


Concluimos que esta muestra es una evidencia de que existe diferencia en la
efectividad de las dos vacunas utilizadas para dosis de refuerzo (p < 0.001)

Mg. Beatriz Castaeda S.

220

BIOESTADISTICA

Prueba T para la diferencia de medias (1 - 2)


Datos:
Una muestra de tamao n1 (x1, x2, ....., xn1) de la poblacin 1 y una muestra de
tamao n2 (x1, x2, ....., xn2) de la poblacin 2. La variable es cuantitativa.

Requisitos:
1) Ambas son muestras aleatorias de su poblacin correspondiente.
2) Las poblaciones 1 y 2 son independientes
3) Muestras pequeas de poblaciones son normales.
4) Las varianzas poblacionales

2 1 ,

22 son desconocidas, pero se

suponen semejantes.

Hiptesis:
a) H0: 1 = 2

H1: 1 2

H0: 1 - 2 = 0

H1: 1 - 2 0

b) H0: 1 2

H1: 1 > 2

H0: 1 - 2 0

H1: 1 - 2 > 0

c) H0: 1 2

H1: 1 < 2

H0: 1 - 2 0

H1: 1 - 2 < 0

Estadstica de la prueba

T=

( x1 x2 )
;
1 1
Sp
+
n1 n2

con S2p =

(n1 1)S12 + (n2 1)S22


n1 + n2 2

dondeSp2 es la estimacin de la varianza comn


T tiene distribucin t-Student con n1+n2 -2 grados de libertad [ t(n1+n2-2)], si H0
es verdadera.

Mg. Beatriz Castaeda S.

221

BIOESTADISTICA

Regla de decisin
a) Rechazar H0 al nivel , si

T < -t1-/2

T > t1-/2

/2

/2

T
-t1-/2
R.C.
b) Rechazar H0 al nivel , si

t1-/2
R.C.

T > t1-

T
0
c) Rechazar H0 al nivel , si

t1-
R.C.

t < -t1-

-t1-
R.C.

Nota
Si no se cumple el requisito de que las varianzas sean semejantes (es
decir 21 22 ), entonces la estadstica T se obtendr como:
T =

( x1 x 2 )
S 12 S 22
+
n1 n2

En este caso la estadstica T tiene distribucin aproximadamente t-Student con


grados de libertad modificados, dados por

Mg. Beatriz Castaeda S.

222

BIOESTADISTICA

v=

S 12 S 22

n +n
2
1

( ) +( )
S 12

n1

n1 + 1

S 22

n2

n2 + 1

Ejemplo 6.16
Con el objeto de determinar si la privacin del sueo tiene algn efecto sobre la
frecuencia de la onda alfa del electroencefalograma de las personas, a veinte
personas voluntarias se dividi al azar en dos grupos. Las personas del grupo
A se sometieron a un perodo de privacin del sueo de 10 das, mientras que
las del grupo B sirvieron de control. Al trmino del perodo experimental, se
registr la frecuencia de la onda alfa componente de los electroencefalogramas
de las personas. Los resultados fueron los siguientes:
Grupo A:

10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4

Grupo B:

11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9

Nivel de significancia pre-fijado = 0.01


(Enunciado adaptado de Bioestadstica. de Daniel, W , pp 240-241; obra citada)
Para determinar la presencia del efecto de la privacin sensorial planteamos
las hiptesis:

H0: No existe diferencia en la frecuencia de la onda alfa para las personas


sometidas a privacin del sueo respecto a las que no fueron sometidas a
la privacin.

A = B

Mg. Beatriz Castaeda S.

223

BIOESTADISTICA

H1: Existe diferencia en la frecuencia de la onda alfa para las personas


sometidas a privacin del sueo respecto a las que no fueron sometidas a
la privacin.

A B
Por ser muestras pequeas y no contar con las varianzas poblacionales, antes
de aplicar la prueba T para comparacin de medias, con los datos obtenidos
para el nivel alfa en cada grupo, se debe comprobar si estas muestras validan
los requisitos de poblacin normal y varianzas semejantes, lo cual es aceptado
(los procedimientos y resultados de estas pruebas sern presentados en la
secciones 6.2.26- ejemplo 6.19 y 6.2.3.1 ejemplo 6.20)

Como se cumplen los requisitos de poblaciones normales y varianzas


semejantes aplicaremos la prueba T sin correccin de los grados de libertad,
luego calculamos
Grupo

Tamao de
La muestra

A
B

10
10

Media
x
10.28
11.08

Desv. est.
S
0.5978
0.4590

Varianza comn

(n 1 1)S 12 + (n 2 1)S 22
9(0.5978 ) 2. + 9(0.459 ) 2
S =
=
= 0.284
n1 + n2 2
18
2
p

Y la estadstica T

( x1 x2)

T =
S

1
1
+
n1
n2

Mg. Beatriz Castaeda S.

10 . 28 11 . 08
0 . 284

1
1
+
10
10

= 3 . 357

224

BIOESTADISTICA

Para el valor calculado de

obtenemos el nivel crtico

distribucin t-Student con 18 grados de libertad.

p utilizando la

t (18 )

p < 0.005
2

t (18 )
-3.357
Por ser una prueba de alternativa bilateral

p < 0.01

Luego concluimos que esta muestra es una evidencia de que existe diferencia
en la frecuencia de la onda alfa para las personas sometidas a privacin
sensorial respecto a las que no fueron sometidas a la privacin, es decir, que la
privacin sensorial en las personas tienen efecto sobre la frecuencia de la
onda alfa de las personas (p < 0.01)

Resumimos las pruebas de hiptesis para la comparacin de medias


poblacionales en el cuadro N 15

Mg. Beatriz Castaeda S.

225

BIOESTADISTICA

Caudro 17. PRUEBA DE HIPTESIS PARA DIFERENCIA DE MEDIAS


a) H0: 1 - 2 = 0
b) H0: 1 - 2 0
c) H0: 1 - 2 0
Requisitos
Prueba
(Grupos
independientes)
Varianzas 21, 22
conocidas
Z
-Todo n1, n2 de poblaciones normales
- n1 30, n2 30 de
cualquier poblacin

Varianzas 21, 22
desconocidas
- n1 30, n2 30 de
cualquier poblacin

H1: 1 - 2 0
H1: 1 - 2 > 0
H1: 1 - 2 < 0

( x1 x 2 )

Normal

Decisin:
Rechazar H0
Al nivel si
a) Z < -Z1-/2
Z > Z1-/2

12 22
+
n1 n 2

N(0,1)

b) Z > Z1-

( x1 x 2 )

Normal

c) Z < -Z1-
a) Z < -Z1-/2
Z > Z1-/2

S 12 S 22
+
n1 n 2

N(0,1)

b) Z > Z1-

Estadstica
de la prueba

Z=

Z =

c) Z < -Z1-

( x1 x 2 )

Varianzas 21, 22
desconocidas, pero
semejantes

T =

- n1 < 30, n2 < 30 de


poblaciones normales

( n1 1) S + ( n 2 1) S
n1 + n 2 2

Sp
S 2p =

( x1 x 2 )

S 12 S 22

n +n
2
1

b) T > t1-
c) T < -t1-

n1

S 22

b) T > t1-

c) T < -t1-

( ) +( )
S 12

n1 + 1
t-Student t(v)

Mg. Beatriz Castaeda S.

2
2

a) T < -t1-/2
T > t1-/2

S 12 S 22
+
n1 n2

Varianzas 21, 22
Desconocidas y diferentes

v =

1
1
+
n1 n 2

t(n1 + n2 -2)

T =

- n1 < 30, n2 < 30 de


poblaciones normales

a) T < -t1-/2
T > t1-/2

2
1

t-Student

Distribucin de
la estadstica
Si H0 es cierta

n2

n2 + 1

226

BIOESTADISTICA

6.2.2.5. Prueba para la media de la diferencia (datos apareados)


Comparacin de mediciones para datos apareados
Un mtodo que suele utilizarse para averiguar la efectividad de un tratamiento
o procedimiento experimental es el que usa observaciones relacionadas que se
obtienen de muestras no independientes. Una prueba de hiptesis basada en
este tipo de datos se conoce como prueba de comparaciones apareadas.

El objetivo en las pruebas de comparaciones apareadas es eliminar un


nmero mximo de fuentes de variacin externa, haciendo a las parejas
semejantes con

respecto a las dems variables

inherentes a los

elementos de estudio, que podran hacer variar el resultado esperado al


margen del efecto del tratamiento.

Las observaciones relacionadas o apareadas podran

obtenerse de varias

formas. Los mismos individuos pueden registrarse antes y despus de recibir


algn tratamiento. Parejas de gemelos o hermanos pueden ser asignados al
azar para que reciban dos tratamientos, de tal manera que los miembros de
una sola pareja reciban tratamientos distintos. Al comparar dos mtodos de
anlisis, el material que va a analizarse se divide en partes iguales, de modo
que una de las partes se analice mediante un mtodo y la otra por otro mtodo.
O bien, se forman parejas combinando individuos respecto a alguna
caracterstica, como por ejemplo edad y sexo.

Mg. Beatriz Castaeda S.

227

BIOESTADISTICA

En lugar de llevar a cabo el anlisis con observaciones individuales, se


utiliza como variable de inters la diferencia entre pares individuales de
observaciones.
Hiptesis
a) H0: d = d0

H1: d d0

b) H0: d d0

H1: d > d0

c) H0: d d0

H1: d < d0

La estadstica de la prueba puede ser la

Z=

d d0
Sd / n

o la

T=

d d0
Sd / n

segn el cumplimiento de los requisitos, antes indicados, para la aplicacin de


las pruebas Z y T para la media.

Ejemplo 6.17
Doce personas participaron en un experimento para estudiar la efectividad de
cierta dieta, combinada con un programa de ejercicio, en la reduccin de los
niveles de colesterol en suero en al menos 10 unidades. La tabla muestra los
niveles de colesterol en suero para las 12 personas al principio del programa
(Antes) y al final del mismo (Despus).
Diferencia
Colesterol en suero
Persona Antes (X1) Despus (X2)
di
1
201
193
8
2
231
236
-5
3
221
216
5
4
260
233
27
5
228
214
14

Mg. Beatriz Castaeda S.

228

BIOESTADISTICA

6
7
8
9
10
11
12

237
326
235
240
267
284
209

216
296
195
207
247
260
201

21
30
40
33
20
24
8

(Enunciado adaptado de Bioestadstica. 3ra edicin de Daniel, W pg. 255-256)


La hiptesis del estudio sera:

La dieta combinada con el

programa de ejercicios es efectiva para

reducir los niveles de colesterol en suero en al menos 10 unidades


Las hiptesis estadsticas sern formuladas como:

H0: d 10

La dieta combinada con el programa de ejercicios no es


efectiva para reducir los niveles de colesterol en suero en al
menos 10 unidades

H1: d > 10

La dieta combinada con el programa de ejercicios

es

efectiva para reducir los niveles de colesterol en suero en al


menos 10 unidades

Para las diferencias obtenemos

d = 18.75 ;

S d = 13.11

Como la muestra es pequea y la varianza poblacional desconocida


utilizaremos la prueba T para la media de las diferencias, asumiendo que las
diferencias tienen distribucin normal (este requisito debe ser probado con los

Mg. Beatriz Castaeda S.

229

BIOESTADISTICA

datos utilizando la prueba de bondad de ajuste que se desarrollar ms


adelante en la seccin 6.2.2.1)

T =

d d0
Sd / n

18 . 75 10
= 2 . 312
13 . 11 / 12

Para el valor calculado de

obtenemos el nivel crtico

distribucin t-Student con 11 grados de libertad.

p utilizando la

t (11)

p = 0.0206

t (11)
2.312
Luego podemos concluir que la muestra es una evidencia significativa (p <
0.025) de que esta dieta combinada con un programa de ejercicio es efectiva
para reducir los niveles de colesterol en suero en al menos 10 unidades.

6.2.2.6. Prueba de comparacin de varianzas


Datos:
Una muestra de tamao n1 de la poblacin 1 y una muestra de tamao n2 de la
poblacin 2

Requisitos:
1) Ambas muestras son aleatorias de sus respectivas poblaciones
2) Las poblaciones 1 y 2 son independientes y cada una tiene distribucin
normal con varianzas 21 y 22 respectivamente.

Mg. Beatriz Castaeda S.

230

BIOESTADISTICA

Hiptesis:
a) H0 : 21 = 22

H 1 : 2 1 2 2

b) H0 : 21 22

H1 : 21 > 22

c) H0 : 21 22

H 1 : 2 1 < 2 2

Estadstica de la Prueba

S12
F = 2
S2
Si H0 es cierta, F tiene distribucin F(n1-1, n2-1) ; donde n1 -1 y n2 1 son los
grados de libertad del numerador y denominador.

Regla de decisin
a) Rechazar H0 al nivel ,

si F < F2

F > F1 2

/2

/2

F
F2

F1 2

R.C.
b) Rechazar H0 al nivel ,

si

R.C.

F > F1

F
F1

R.C.

Mg. Beatriz Castaeda S.

231

BIOESTADISTICA

c) Rechazar H0 al nivel ,

si F < F

F
F

R.C.

Ejemplo 6.18
De dos hospitales se tomaron muestras de tamao 10 de los pesos de recin
nacidos para probar si la dispersin de los pesos es la misma para los dos
hospitales. Los resultados obtenidos son los siguientes:
Hospital 1: 3.625, 3.430, 3.000, 3.625, 3.625, 3.150, 3.360, 3.230, 3.950, 3.400
Hospital 2: 3.800, 3.500, 3.350, 3.250, 4.100, 3.900, 3.900, 4.000, 3.670, 3.600

x 1 = 3.4395

S21 = 0.07696

n1 = 10

x 2 = 3.707

S22 = 0.07949

n2 = 10

Deseamos probar las hiptesis

H 0 : 21 = 22
Luego

H 1 : 21 22

F = 0.07696 = 0.968
0.07949

Si = 0.05, entonces para F(9,9), obtenemos las cuantilas /2

F0.025(9,9) = 0.2448

Mg. Beatriz Castaeda S.

y 1-/2

F0.975(9,9) = 4.03

232

BIOESTADISTICA

0.025
0.025

0.2448

R.C.

0.968

F(9,9)

4.03

R.C.

Luego concluimos que la dispersin de los pesos de los recin nacidos es la


misma para los dos hospitales, pues la diferencia encontrada no es
significativa.

Ejemplo 6.19
En el ejemplo 6.16, para poder aplicar la prueba T para comparar las medias
de dos grupos, uno de los requisitos que deben cumplir los datos es que las
varianza de ambos grupos sean semejantes, requisito que probaremos con la
prueba F

Hiptesis:

H 0 : 2 A = 2B

H 1 : 2 A 2B

Donde:

A es el grupo de personas a las que se someti a un periodo de privacin


sensorial de 10 das

B es el grupo control
Variable:

Frecuencia

de

la

onda

alfa,

componente

de

los

electroencefalogramas para cada persona

Mg. Beatriz Castaeda S.

233

BIOESTADISTICA

Los resultados obtenidos fueron:


Grupo A:

10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4

Grupo B:

11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9

Grupo

Tamao de
La muestra

A
B

10
10

Media
x
10.28
11.08

Desv. est.
S
0.5978
0.4590

Luego calculamos la estadstica F para la comparacin de varianzas.


Luego

F = (0.5978)2 = 1.696
(0.4590)2

Si = 0.05, entonces para F(9,9), obtenemos las cuantilas /2

F0.025(9,9) = 0.2448

y 1-/2

F0.975(9,9) = 4.03

Luego no se puede rechazar la hiptesis de igualdad de igualdad de varianzas,


por lo que podemos asumir que se cumple el requisito de varianzas semejantes
y que las diferencias encontradas

es probable que se deban al azar del

muestreo.

Mg. Beatriz Castaeda S.

234

BIOESTADISTICA

6.2.2.7 Prueba Z para comparacin de proporciones poblacionales


Datos:
Dos muestras que consisten de n1 y n2 resultados de observaciones
independientes. Para cada muestra los resultados pueden estar en una de dos
categoras pero no en ambas.

Requisitos:
1. Los n1 resultados de la muestra de la poblacin 1 son mutuamente
independientes y de igual manera los n2 resultados de la muestra de la
poblacin 1 tambin son mutuamente independientes.
2. Cada resultado de las n1 observaciones de la muestra de la poblacin 1
tiene probabilidad P1 de estar en la categora 1 y Cada resultado de las
n2 observaciones de la muestra de la poblacin 2 tiene probabilidad P2
de estar en la categora 1.
3. Las muestras son grandes (n1 30 y n2 30)
4. Las poblaciones son infinitas (n1 0.10 N1 y n2 0.10 N2), es decir las
muestras son a lo ms el 10% de la poblacin correspondiente

Hiptesis:
a) H0: P1 P2 = 0

H 1: P 1 P 2 0

b) H0: P1 P2 0

H 1: P 1 P 2 > 0

c) H0: P1 P2 0

H 1: P 1 P 2 < 0

Estadstica de la prueba

Z=

Mg. Beatriz Castaeda S.

p1 p 2
Sp1 p2

235

BIOESTADISTICA

Z es N(0,1), si H0 es verdadera

p(1 p ) p(1 p )
+
n1
n2

S p1 p2 =

Donde:

Si H0 es verdadera, es decir, las proporciones son iguales P1 = P2 = P


y existe una proporcin comn (P). la cual estimamos como:

p =

x1 + x2
n1 + n2

siendo x1 y x2 las observaciones que estn en la categora 1, para cada


muestra.

p1 =

x1
n1

p2 =

x2
n2

Regla de decisin
a) Rechazar H0 al nivel , si

Z < -Z1-/2

Z > Z1-/2

/2

/2

Z
-Z1-/2
R.C.
b) Rechazar H0 al nivel , si

Z1-/2

R.C.

Z > Z1-

Z
0

Mg. Beatriz Castaeda S.

Z1-
R.C.

236

BIOESTADISTICA

c) Rechazar H0 al nivel , si

Z < -Z1-

-Z1-
R.C.

Ejemplo 6.20
En el Ejercicio aplicativo, los investigadores tenan por objeto comparar el
desarrollo visomotor y el rendimiento escolar de hijos de madres adolescentes
con el de los hijos de madres adultas.
El desarrollo visomotor fue evaluado utilizando la prueba de Bender (Nmero
de errores que tiene el nio cuando trata de reproducir nueve figuras que le han
sido mostradas).
El rendimiento escolar fue analizado sobre la base del porcentaje de nios de
cada grupo que desaprob el ao escolar.

Luego para realizar la comparacin, las hiptesis estadsticas planteadas han


sido:
1) Para la comparacin del desarrollo visomotor

H0: 1 = 2
El promedio de errores de la prueba de Bender para hijos de madres
adolescentes es igual al promedio de los hijos de madres adultas.

H1: 1 > 2
El promedio de errores en la prueba de Bender es mayor para hijos de
madres adolescentes que para los hijos de madres adultas ( lo que indica un
retardo en el desarrollo vasomotor)

Mg. Beatriz Castaeda S.

237

BIOESTADISTICA

2) Para la comparacin del rendimiento escolar

H 0: P 1 = P 2
El porcentaje de nios que desaprob el ao escolar es igual para los hijos
de madres adolescentes que para los hijos de madres adultas.

H 1: P 1 > P 2
El porcentaje de nios que desaprob el ao escolar es mayor para los hijos
de madres adolescentes que para los hijos de madres adultas. (lo que indica
menor rendimiento escolar)

La tabla siguiente resume los resultados obtenidos


Grupo

Muestra Media de DE de la media Porcentaje de


n
desaprobados
(SE = S/n)
Errores( x )

Madres adolescentes

59

6.34

0.38

13.8% (8)*

Madres adultas

73

4.75

0.24

4.3% (3)*

* Observamos un error en la informacin presentada pues el 13,8% de 59


es 8,142 nios, luego el nmero de nios desaprobados de hijos de
madres adolescentes fue 8 (13.6%).

De igual manera el 4,3% de 73 es 3.139, luego el nmero de nios


desaprobados para hijos de madres adultas es 3 (4,1%)

Por disponer de muestras grandes, tanto para la comparacin de medias como


para la comparacin de proporciones se utiliz la correspondiente prueba Z.

Mg. Beatriz Castaeda S.

238

BIOESTADISTICA

1) Para realizar la prueba de hiptesis para comparar las medias,


calculamos la estadstica Z:

Z=

( x1 x 2 )
2
1

2
2

S S
+
n1 n 2

6.34 4.75
0.38 + 0.24
2

= 3.53

Luego el nivel crtico p = P(Z 3.53) = 0.00021 < 0.001


Es decir la diferencia encontrada es altamente significativa, por lo que se
puede concluir que los hijos de madres adolescentes tienen un retardo
en el desarrollo visomotor respecto al de los hijos de madres adultas
2) Para realizar la prueba de hiptesis de comparacin de proporciones,
calculamos la estadstica Z:

p =

Sp1 p2 =

x1 + x2
8+ 3
=
= 0 . 083
n1 + n2
59 + 73

p(1 p) p(1 p)
0.083 (0.917) 0.083 (0.917)
+
=
+
= 0.048
n1
n2
59
73

Z =

p1 p2
0 . 136 0 . 041
=
= 1 . 979
S p1p2
0 . 048

Luego el nivel crtico p = P(Z 1.979) = 0.02385 < 0.05

Es decir, la diferencia encontrada es significativa, por lo que se puede


concluir que los hijos de madres adolescentes tienen menor rendimiento
escolar que los hijos de madres adultas.

Mg. Beatriz Castaeda S.

239

BIOESTADISTICA

6.2.3 PRUEBAS NO PARAMETRICAS


6.2.3.1. Prueba de Bondad de ajuste de Kolmogorov Smirnov
Esta prueba es una alternativa a la prueba de bondad de ajuste Ji-Cuadrado,
preferida cuando la muestra es pequea; desde que la prueba de Kolmogorov
es exacta an para muestras pequeas, mientras que la prueba Ji-Cuadrado
requiere de muestras suficientemente grande para que la distribucin JiCuadrado sea una buena aproximacin de la distribucin de la estadstica de la
prueba. En general la prueba de Kolmogorv es ms potente que la prueba JiCuadrado en la mayora de las situaciones. (Conover. Practical Nonparametric
Statistics. 2ed, pg 346)

Datos:
Una muestra de tamao n de observaciones de una variable, las cuales son
ordenadas en una tabla de frecuencias absolutas y relativas acumuladas como
sigue:
Frecuencia Frecuencia relativa
Variable X Observada
Acumulada (pi)

X1
X2
:
XK
Toral

n1
n2
:
nk
n

p1 = n1/n
p2 = (n1 + n2)/n
:
PK = 1

Requisitos:
1) La muestra es aleatoria
2) La variable es de tipo numrico.

Mg. Beatriz Castaeda S.

240

BIOESTADISTICA

Hiptesis:
H0: La variable tiene distribucin sigue el modelo f*(x)
H1: La distribucin de la variable difiere del modelo f*(x)

Estadstica de la prueba:
Para los valores Xi, observados en la muestra, se obtiene sus probabilidades
acumuladas correspondientes con el modelo f*(x) propuesto en la hiptesis
nula [Pi = P(X Xi)]. La estadstica de la prueba viene a ser D, la mayor
diferencia absoluta entre la probabilidad acumulada terica y la frecuencia
relativa acumulada (probabilidad acumulada estimada)

D = mxima{ Pi pi }
Decisin:
Rechazar H0 al nivel , si

D > W1

W1 es la cuantila 1- de la estadstica de la prueba de Kolmogorov-Smirnorv


(Tabla 6) **
** Si el modelo propuesto en H0 es el modelo normal, entonces utilizar la Tabla
7, elaborada por Lilliefors, exclusivamente para el modelo normal.

Ejemplo 6.21.
En el ejemplo 6.16. se plante la comparacin de medias del nivel alfa
componente de los electroencefalogramas para 2 grupos de personas, el grupo
A formado por personas que haban sido sometidas a un periodo de privacin
sensorial por 10 das y el grupo B formado

por controles. Los registros

obtenidos fueron:

Mg. Beatriz Castaeda S.

241

BIOESTADISTICA

Grupo A:

10.2, 9.5, 10.1, 10.0, 9.8, 10.9, 11.4, 10.8, 9.7, 10.4

Grupo B:

11.0, 11.2, 10.1, 11.4, 11.7, 11.2, 10.8, 11.6, 10.9, 10.9

Para que la aplicacin de la prueba T sea vlida debe comprobarse que las
muestras validan que la distribucin de los niveles alfa, para cada grupo tiene
distribucin normal

Luego planteamos dos hiptesis:


1)

H0: Los registros del nivel alfa para las personas del grupo A tienen
distribucin normal

H1: La distribucin de los registros del nivel alfa para las personas del
grupo A no tienen distribucin normal

2)

H0: Los registros del nivel alfa para las personas del grupo B tienen
distribucin normal

H1: La distribucin de los registros del nivel alfa para las personas del
grupo B no tienen distribucin normal

Procedemos a realizar la prueba de Bondad de ajuste de Kolmogorov para


cada caso.
1) Luego para los registros del grupo A obtenemos sus frecuencias
relativas acumuladas (pi) y sus probabilidades acumuladas (Pi) con el
modelo normal, utilizando los valores estimados para la media = 10.28 y
la desviacin estndar= 0.5978

Mg. Beatriz Castaeda S.

242

BIOESTADISTICA

XA

pi

9.5
9.7
9.8
10
10.1
10.2
10.4
10.8
10.9
11.4

0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1

zi =

xi x
SA

-1.30
-0.97
-0.80
-0.47
-0.30
-0.13
0.20
0.87
1.04
1.87

Pi = P(Z zi)

Di = Pi - pi

0.095983
0.165967
0.211003
0.319755
0.381668
0.446771
0.579547
0.807811
0.850164
0.969503

0.004017
0.034033
0.088997
0.080245
0.118332
0.153229
0.120453
0.007811
0.049836
0.030497

D = mxima{ Pi pi } = 0.153229

Los valores Pi los hemos obtenido de la tabla de la distribucin


acumulada para la normal estandarizada, calculando previamente los
valores estandarizado Zi, para cada valor X

En la tabla de Lilliefors del Test estadstico para normalidad (Tabla 7),


obtenemos, para n = 10 y nivel de significancia = 0.05

W0.95 =

0.258

2) Luego para los registros del grupo B obtenemos sus frecuencias


relativas acumuladas (pi) y sus probabilidades acumuladas (Pi) con el
modelo normal, utilizando los valores estimados para la media = 11.08 y
la desviacin estndar= 0.4590

Mg. Beatriz Castaeda S.

243

BIOESTADISTICA

XB

pi

10.1
10.8
10.9
11
11.2
11.4
11.6
11.7

0.1
0.2
0.4
0.5
0.7
0.8
0.9
1

zi =

xi x
SB

Pi = P(Z zi)

Di = Pi - pi

0.01638
0.27092
0.34747
0.43082
0.60312
0.75715
0.87137
0.91161

0.08362
0.07092
0.05253
0.06918
0.09688
0.04285
0.02863
0.08839

-2.14
-0.61
-0.39
-0.17
0.26
0.70
1.13
1.35

D = mxima{ Pi pi } = 0.09688
Luego como se aprecia, para ambos casos se acepta que la distribucin de los
registros del nivel alfa tiene distribucin normal, ya

que las diferencias

mximas obtenidas 0.153229 y 0.09688 son menores que la cuantila 0.95 de la


tabla de Lilliefors.

Por lo tanto es valido aplicar la prueba T para comparar las medias.

Ejemplo 6.22.
Consideremos nuevamente el ejemplo 6.16
Doce personas participaron en un experimento para estudiar la efectividad de
cierta dieta, combinada con un programa de ejercicio, en la reduccin de los
niveles de colesterol en suero en al menos 10 unidades. La tabla muestra los
niveles de colesterol en suero para las 12 personas al principio del programa
(Antes) y al final del mismo (Despus).
Colesterol en suero
Diferencia
Persona Antes (X1) Despus (X2)
di
1
201
193
8
2
231
236
-5
3
221
216
5

Mg. Beatriz Castaeda S.

244

BIOESTADISTICA

4
5
6
7
8
9
10
11
12

260
228
237
326
235
240
267
284
209

233
214
216
296
195
207
247
260
201

27
14
21
30
40
33
20
24
8

La hiptesis del estudio sera:

La dieta combinada con el

programa de ejercicios es efectiva para

reducir los niveles de colesterol en suero en al menos 10 unidades


Las hiptesis estadsticas sern formuladas como:

H0: d 10

La dieta combinada con el programa de ejercicios no es


efectiva para reducir los niveles de colesterol en suero en al
menos 10 unidades

H1: d > 10

La dieta combinada con el programa de ejercicios

es

efectiva para reducir los niveles de colesterol en suero en al


menos 10 unidades
Para las diferencias obtenemos

d = 18.75 ;

S d = 13.11

Como la muestra es pequea y la varianza poblacional desconocida, para


probar las hiptesis para la media de las diferencias se consider la prueba T
para la media, asumindose que las diferencias tienen distribucin normal; pero
este requisito debe ser probado con los datos obtenidos, por lo que ahora
probaremos las hiptesis

Mg. Beatriz Castaeda S.

245

BIOESTADISTICA

H0: La variable diferencia tiene distribucin normal


H1: La distribucin de la variable diferencia no sigue el modelo normal
Luego para las diferencias obtenemos sus frecuencias relativas acumuladas
(pi) y sus probabilidades acumuladas (Pi) con el modelo normal, utilizando los
valores estimados para la media = 19.73 y la desviacin estndar= 13.28

di

pi

-5
5
8
14
20
21
24
27
30
33
40

0.0833
0.1667
0.3333
0.4167
0.5000
0.5803
0.6667
0.7500
0.8333
0.9167
1.0000

di d
Sd
-1.812
-1.049
-0.820
-0.820
-0.362
0.095
0.172
0.400
0.629
0.858
1.087

zi =

Pi = P(Z zi)

Di = Pi - pi

0.0350
0.1471
0.2061
0.2061
0.3585
0.5380
0.5681
0.6556
0.7354
0.8046
0.8615

0.0483
0.0196
0.0439
0.1272
0.0581
0.0380
0.0152
0.0111
0.0146
0.0287
0.0552

D = mxima{ Pi pi } = 0.1272
Los valores Pi los hemos obtenido de la tabla de la distribucin acumulada para
la normal estandarizada.
En la tabla de Lilliefors del

Test estadstico para normalidad (Tabla 7),

obtenemos

Para n = 12 y nivel de significancia = 0.05

W0.95 = 0.242

Luego entonces, como D < 0.242, no podemos rechazar la hiptesis de que las
diferencias tienen distribucin normal, por lo cual la prueba T aplicada para la
prueba de hiptesis para la media de la diferencia es vlida, pues se cumplen
los requisitos exigidos para su aplicacin.

Mg. Beatriz Castaeda S.

246

BIOESTADISTICA

Tabla 6: CUANTILAS DE LA PRUEBA DE KOLMOGOROV SMIRNOV

n
1
2
3
4
5

.80
.900
.684
.565
.493
.447

.90
.950
.776
.636
.565
.509

p
.95
.975
.842
.708
.624
.563

.98
.990
.900
.785
.689
.627

(Prueba bilateral)
.99
n .80
21 .226
.995
22 .221
.929
23 .216
.829
24 .212
.734
25 .208
.669

.90
.259
.253
.247
.242
.238

6
7
8
9
10

.410
.381
.358
.339
.323

.468
.436
.410
.387
.369

.519
.483
.454
.430
.409

.577
.538
.507
.480
.457

.617
.576
.542
.513
.489

26
27
28
29
30

.204
.200
.197
.193
.190

.233
.229
.225
.221
.218

.259
.254
.250
.246
.242

.290
.284
.279
.275
.270

.311
.305
.300
.295
.290

11
12
13
14
15
16
17
18
19
20

.308
.296
.285
.275
.266
.258
.250
.244
.237
.232

.352
.338
.325
.314
.304
.295
.286
.279
.271
.265

.391
.375
.361
.349
.338
.327
.318
.309
.301
.294

.437
.419
.404
.390
.377
.366
.355
.346
.337
.329

.468
.449
.432
.418
.404
.392
.381
.371
.361
.352

31
32
33
34
35
36
37
38
39
40

.187
.184
.182
.179
.177
.174
.172
.170
.168
.165
1.07
n

.214
.211
.208
.205
.202
.199
.196
.194
.191
.189
1.22
n

.238
.234
.231
.227
.224
.221
.218
.215
.213
.210
1.36
n

.266
.262
.258
.254
.251
.247
.244
.241
.238
.235
1.52
n

.285
.281
.277
.273
.269
.265
.262
.258
.255
.252

Aproximacin para n > 40

.95
.287
.281
.275
.269
.264

p
.98
.321
.314
.307
.301
.295

.99
.344
.337
.330
.323
.317

1 . 63
n

Fuente: CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY & SONS. New
York. 1980. pp 462.

Mg. Beatriz Castaeda S.

247

BIOESTADISTICA

Tabla 7: Cuantilas del test estadstico para normalidad de Lilliefors


P
n

0.80
0.300
0.285
0.265
0.247
0.233
0.223
0.215
0.206
0.199
0.190
0.183
0.177
0.173
0.169
0.166
0.163
0.160
0.142
0.131

0.85
0.319
0.299
0.277
0.258
0.244
0.233
0.224
0.217
0.212
0.202
0.194
0.187
0.182
0.177
0.173
0.169
0.166
0.147
0.136

0.90
0.352
0.315
0.294
0.276
0.261
0.249
0.239
0.230
0.223
0.214
0.207
0.201
0.195
0.189
0.184
0.179
0.174
0.158
0.144

0.95
0.381
0.337
0.319
0.300
0.285
0.271
0.258
0.249
0.242
0.234
0.227
0.220
0.213
0.206
0.200
0.195
0.190
0.173
0.161

0.99
0.417
0.405
0.364
0.348
0.331
0.311
0.294
0.284
0.275
0.268
0.261
0.257
0.250
0.245
0.239
0.235
0.231
0.200
0.187

> 30

0.736
n

0.768
n

0.805
n

0.886
n

1.031
n

4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
25
30

Fuente: CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY & SONS. New
York. 1980. pp 463.

Mg. Beatriz Castaeda S.

248

BIOESTADISTICA

6.2.3.2 Prueba Ji-Cuadrado para comparacin de proporciones


(Prueba de Homogeneidad)
Datos:
Hay r grupos o poblaciones en total, y una muestra aleatoria es elegida de cada
poblacin. Sea ni que representa el nmero de observaciones en la i-sima
muestra proveniente de la poblacin i, para i: 1,2,3, ...., r
Cada observacin en cada una de las muestras puede ser clasificada dentro de
una de las c categoras diferentes de la caracterstica bajo estudio.

Si nij es el nmero de observaciones provenientes de la i-sima muestra que


caen en la categora j, entonces:

ni = ni1 + ni2 + .... + nic


Los datos son arreglados en la siguiente tabla de contingencia de r x c

Poblacin o
Caracterstica
Grupo
Categora1 Categora 2 .......... Categora c Totales
1
n11
n12
..........
n1c
n1
2
n21
n22
n2c
n2
.........
r
nr1
nr2
nrc
nr
Totales
C1
C2
Cc
n
El total de observaciones de todas las muestras reunidas es denotado por n

n = n1 + n2 + ..... + nr
el nmero total de observaciones en la j-sima categora es denotado por Cj.
Esto es, Cj es el nmero total de observaciones en la categora j provenientes
de todas las muestras reunidas en un solo grupo. Por ejemplo

C2 = n12 + n22 + ...... + nr2


Mg. Beatriz Castaeda S.

249

BIOESTADISTICA

Requisitos:
1) Cada muestra es una muestra aleatoria
2) Los resultados de las muestras son

independientes de muestra a

muestra
3) Cada observacin puede ser clasificada slo en una de las c categoras
de la caracterstica bajo estudio.

Hiptesis:

H0: La proporcin de elementos en cada categora es la misma para todos los


grupos o poblaciones (Los grupos son homogneos)

P1j = P2j = ...... = Prj

para cada categora j

H1: Para 2 o ms grupos hay diferente proporcin de elementos en una o ms


categoras

Pij Pkj

para alguna categora j


y para algn para de poblaciones i , k

Estadstica de la prueba:
r

X =
2

i = 1 j =1

(n

ij

E ij
E ij

nij

E
i =1 j = 1

ij

Si H0 es verdadera, la distribucin aproximada de X2 para muestras grandes es


la Ji-Cuadrado con (r-1) x (c-1) grados de libertad.

Mg. Beatriz Castaeda S.

250

BIOESTADISTICA

Donde:
Si H0 es verdadera, entonces P1j = P2j = ...... = Prj = Pj

para cada categora j

Es decir, existe una proporcin comn Pj de elementos en la categora j, la


cual puede ser estimada como

P j = Cj
n
As para la muestra del grupo i , esperaramos ni x Pj = ni Cj elementos en la
categora j
n

Eij = ni Cj
n

Luego a

Se denomina frecuencia o nmero esperado de elementos en la categora j


para la muestra muestra del grupo o poblacin i.

Regla de decisin:
Rechazar H0 al nivel ,

si

X2 >

12

X2
.

12

R.C.

Observaciones:
1) Si alguna de las frecuencias esperadas Eij es pequea, la aproximacin
a la distribucin Ji-Cuadrado, puede ser pobre. Cochran establece que si

Mg. Beatriz Castaeda S.

251

BIOESTADISTICA

cualquiera de las Eij es menor que 1 o si ms del 20% de las Eij es


menor que 5, la prueba no es aplicable.

2) Si r y c no son tan pequeos, y si parece que las Eij pueden ser tan
pequeas como 1, sin perjuicio de comprometer la validez de la prueba,
varias categoras pueden ser combinadas para eliminar las frecuencias
esperadas pequeas. Cuales categoras deberan ser combinadas es
problema de juicio. Generalmente, las categoras son combinadas solo
si ellas son similares en algn aspecto, tal que la hiptesis mantiene su
significado.

3) Para el caso particular en que se comparan dos grupos para una


variable con dos categoras (r = 2 y c =2), los datos quedan resumidos
en una tabla de 2x2

Poblacin
Poblacin 1
Poblacin 2
Total

Variable
Categora 1 Categora 2 Total
a
b
N1
c
d
N2
C1
C2
n

la estadstica de la prueba se reduce a:

n(ad bc ) 2
X =
n 1 n 2 C1 C 2
2

La distribucin aproximada de X2 es la Ji-Cuadrado con 1 grado de


libertad

Mg. Beatriz Castaeda S.

252

BIOESTADISTICA

Correccin de Yates. Las frecuencias observadas en una tabla de


contingencia son discretas y, de este modo, dan lugar a una estadstica
discreta, X2, la que ha sido aproximada por la distribucin Ji-Cuadrado
que es continua. Yates propuso una correccin para mejorar la
aproximacin, a esta estadstica se denomina X2 corregida y se obtiene
como:

2
corregida

n( ad bc (n / 2)) 2
n 1 n 2 C1 C 2

Si la muestra es pequea n < 20

o si

20 < n < 40 y si cualquier

frecuencia esperada es menor que 5, no debe utilizarse los resultados


de la prueba Ji-Cuadrado para llegar a conclusiones acerca de las
diferencias entre las proporciones por lo que se sugiere utilizar la Prueba
Exacta de Fisher. (Daniel,W. Bioestadstica, 4 Edicin, pg 597; obra
citada)

Ejemplo 6.23
Con el objeto de comparar la distribucin por grupo sanguneo de las personas
portadoras crnicas de cierto antgeno con la distribucin de grupos
sanguneos de los no portadores, se tom una muestra de 150 portadores y
200 no portadores obteniendo los siguientes resultados para el grupo
sanguneo:

Mg. Beatriz Castaeda S.

253

BIOESTADISTICA

Grupo sanguneo

Portadores No portadores Total

72

92

164

54

77

131

16

25

41

AB

14

150

200

350

Total

(Enunciado adaptado de Bioestadstica. 4 edicin de Daniel, W. pp 641-642, obra citada)


ra

Luego formulamos las hiptesis estadsticas

H0: No hay diferencia, en la distribucin por grupo sanguneo, entre portadores


y no portadores.

H1: Hay diferencias en las distribuciones de grupos sanguneos de los


portadores y no portadores.

Para realizar la prueba obtenemos las frecuencias esperadas y luego


calculamos la estadstica X2
FRECUENCIAS ESPERADAS

Grupo sanguneo Portadores No portadores


O
70
94
A
56
75
B
18
23
AB
6
8
Total
150
200

X =
2

i =1 j = 1

(n

ij

E ij
E ij

Mg. Beatriz Castaeda S.

i =1 j =1

nij

Total
164
131
41
14
350

72 2
62
n=
+ ... + 350 = 1.6289
E ij
70
8

254

BIOESTADISTICA

Como r =2 grupos y c = 4 categoras, entonces en la distribucin Ji-cuadrado


con 3 grados de libertad obtenemos el valor crtico p
p = P[ 2( 3) 1.6289] = 0.6258
Este resultado nos indica que la diferencia encontrada no alcanza significancia
estadstica y que es muy probable que se deba al azar del muestreo, por lo
que no podemos rechazar la hiptesis de no diferencia en la distribucin de
grupos sanguneos.

Para complementar el anlisis se puede acompaar de un grfico comparativo


de porcentajes por categoras como el siguiente

Grfico 21
Grupo sanguineo de Portadores y
No portadores de antigeno
60%
40%
20%
0%
O
Portadores
No portadores

AB

Grupo sanguneo

Fuente: Daniel, W. Bioestadstica, obra citada


Elaboracin propia

En conclusin, no se ha encontrado diferencia significativa, en la


distribucin por grupo sanguneo, para portadores y no portadores del
antgeno (p > 0.05)

Mg. Beatriz Castaeda S.

255

BIOESTADISTICA

6.2.3.3. Prueba de Independencia Ji-Cuadrado


Datos:
Una muestra aleatoria de tamao n es obtenida de una poblacin. Las
observaciones en la muestra son clasificadas de acuerdo a 2 caractersticas o
variables nominales. Usando la primera caracterstica cada observacin es
clasificada en una de las r categoras de la variable y usando la segunda
caracterstica cada observacin es clasificada en una las c categoras de sta
segunda variable.
Sea nij el nmero de observaciones en la categora i de la primera variable y
en la categora j de la segunda variable. Las frecuencias nij son arregladas en
una tabla de contingencia de r x c como sigue:
Caracterstica
Caracterstica y
x
Categora1 Categora 2 .......... Categora c Totales
Categora 1
n11
n12
..........
n1c
R1
Categora 2
n21
n22
..........
n2c
R2
.........
..........
..........
..........
..........
..........
Categora r
nr1
nr2
..........
nrc
Rr
Totales
C1
C2
..........
Cc
n
El nmero total de observaciones en la fila i es designado por Ri y el nmero
total de observaciones en la columna j es designado por Cj (enfatizando que
estas cantidades son aleatorias, no fijadas). La suma de las observaciones en
todas las casillas es n el tamao de muestra.

Requisitos
1) La muestra de n observaciones, es una muestra aleatoria (cada
observacin es independiente de las otras para ser clasificada en las
categoras i,j de las variables consideradas)

Mg. Beatriz Castaeda S.

256

BIOESTADISTICA

2) Cada observacin puede ser clasificada dentro de una de las r


categoras de acuerdo con una de las caractersticas y dentro de una de
las c categoras de acuerdo a la segunda caracterstica.

Hiptesis
H0: Las variables son independientes
(Es decir cada observacin puede ser clasificada en una categora de una
variable independientemente de la categora en que fue clasificada de
acuerdo a la otra variable).

H1: Existe asociacin o dependencia entre las variables


(Es decir una observacin que es clasificada en una categora de una
variable tiende a ser clasificada en determinada categora de acuerdo a la
otra variable).

Prueba Estadstica

Sea

E ij =

Ri Cj
n

El nmero esperado de observaciones en la celda i,j , entonces la estadstica


de la prueba esta dada por:

X2 =

i =1 j =1

(n

ij E ij

E ij

nij

E
i =1 j =1

ij

Si H0 es verdadera, la distribucin aproximada de X2 para muestras grandes es


la Ji-Cuadrado con (r-1) x (c-1) grados de libertad.

Mg. Beatriz Castaeda S.

257

BIOESTADISTICA

Regla de decisin:
Rechazar H0 al nivel ,

si

X2 > 12

X2
12

R.C.
Las observaciones indicadas en la seccin 6.2.3.2 para la prueba Ji-Cuadrado
de comparacin de proporciones tambin se deben tener en cuenta para la
aplicacin de esta prueba.

Ejemplo 6.24
Con el objeto de verificar la suposicin de que la fabricacin de cierto producto
est

asociado con alteraciones respiratorias, a 500 trabajadores de una

empresa que fabrica el producto

se evalu respecto a la presencia de

sntomas de alteraciones respiratorias y se los clasific a su vez de acuerdo al


nivel de exposicin al producto. Los resultados se presentan en la tabla
siguiente:
Presencia de
sntomas
S
No
Total

Nivel de exposicin
Alto
Medio
Bajo
185
33
17

Total
235

120
305

265
500

73
106

72
89

(Enunciado adaptado de Bioestadstica. 3ra edicin de Daniel, W pg. 485-486)

Mg. Beatriz Castaeda S.

258

BIOESTADISTICA

Las hiptesis estadsticas son formuladas como:


H0: Las alteraciones respiratorias son independientes de la exposicin al

producto.
H1: Las alteraciones respiratorias estn asociadas a la exposicin al
producto
Obtenemos las frecuencias esperadas y calculamos la estadstica X2 de la
prueba
FRECUENCIAS ESPERADAS

Presencia de
sntomas
S
No
Total

X2 =

Nivel de exposicin
Alto
Medio
Bajo
143.35
49.82
41.83

Total

161.65
305

265
500

56.18
106

47.17
89

235

185 2
332
172
1202
732
722
+
+
+
+
+
500 = 61.356
143.35 49.82 41.83 161.65 56.18 47.17

Obtenemos el valor crtico, p, de la prueba en la distribucin

2( 2)

As P[ ( 2) 61.3556] < 0.0005


2

Luego, podemos concluir que

estos datos son una evidencia de que la

presencia de alteraciones respiratorias esta asociada a la exposicin al


producto.

Ejemplo 6.25
Un psiclogo clnico toma una muestra de 200 pacientes que sufren ansiedad y
las clasifica de acuerdo a su restablecimiento y al tratamiento por medio de
terapia; obteniendo los siguientes datos:

Mg. Beatriz Castaeda S.

259

BIOESTADISTICA

Tratamiento
Restablecimiento
Con terapia curados No curados Total
Tratados
140
20
160
No tratados
10
30
40
Total
150
50
200
Con esta informacin se desea evaluar si existe relacin entre el tratamiento y
la curacin

de los pacientes. (Elorza, H. Estadstica para ciencias del

comportamiento. Pg 414, obra citada)

Luego, planteamos las hiptesis:

H0: El restablecimiento de los pacientes es independiente del tratamiento


H1: Existe relacin entre el tratamiento y el restablecimiento de los
pacientes.
Con los datos obtenidos calculamos el X2

n(ad bc ) 2
200(140 x30 20 x10 ) 2
X =
=
= 66.67
n 1 n 2 C1 C 2
150 x50 x160 x 40
2

corregida

n ( ad bc (n / 2) )2
n1 n2 C1 C2

200( 140 x 30 20 x 10 100)2


150 x 50 x 160 x 40

Obtenemos el valor crtico, p, de la prueba en la distribucin


As tanto para el X2 como para el X2corregido se obtienen
Luego, podemos concluir que
tratamiento

con

terapia

est

= 63.375

2(1)

p < 0.0005

estos datos son una evidencia de que el


significativamente

relacionado

con

el

restablecimiento del paciente (p < 0.0005).

Mg. Beatriz Castaeda S.

260

BIOESTADISTICA

Prctica Domiciliaria 8
1. Una muestra aleatoria de 40 hombres que trabajan en un proyecto de
construccin de un complejo residencial indica que 6 hombres no utilizan
cascos de proteccin.
a) Establezca un intervalo de confianza 98% con respecto a la proporcin
verdadera de hombres que no utilizan cascos de proteccin.
b) Si hay 1150 hombres trabajando en la construccin, con 95% de
confianza estime el nmero de los que no utilizan los cascos de
proteccin.
2. Se hicieron determinaciones de hemoglobina en 14 animales expuestos a
un compuesto qumico nocivo. Se registraron los siguientes valores: 15.6,
14.8, 14.4, 16.6, 13.8, 14.0, 17.3, 17.4, 18.6, 16.2, 14.7, 15.7, 16.4,
13.9.
a) Construya un intervalo de 95% de confianza para la media. Interprete
b) Construya un intervalo de 90% para la varianza. Interprete
3. Una compaa transnacional instituy recientemente un programa de
seguridad en el trabajo para reducir el tiempo perdido debido a accidentes
de trabajo. En los 48 meses siguientes a la implantacin del programa el
tiempo perdido a causa de accidentes de trabajo promedi 91 horas por
mes con una desviacin estndar de 14 horas. En los 50 meses anteriores
al programa de seguridad el tiempo perdido debido a accidentes promedi
108 horas por mes con desviacin estndar de 12 horas. Son estos datos
una evidencia de que el programa de seguridad ha sido efectivo para

Mg. Beatriz Castaeda S.

261

BIOESTADISTICA

reducir en mas de 10 horas

el tiempo perdido debido a accidentes de

trabajo?
4. Se informa que despus de una campaa de seguridad vial slo el 2% de
los vehculos que se detienen en una autopista interestatal no han sido
sometidos a una revisin de seguridad.
a) Si se detienen 16 vehculos, encuentre la probabilidad de que a lo ms 2
no satisfagan las normas de seguridad.
b) Si de un da se eligiera una muestra de 200 automviles para verificar la
revisin de seguridad cul es la probabilidad de que al menos el 5% de
los automviles detenidos no haya pasado la revisin?
c) Si en la muestra elegida result que 12 automviles no pasaron la
revisin de seguridad Qu concluira Ud. Acerca de la informacin
proporcionada?
d) Si en la autopista circulan aproximadamente 8000 automviles cada da,
obtenga una estimacin con 90% de confianza para el nmero de
automviles que no han pasado la revisin?
5. El peso de los pescados atrapados por un barco es aproximadamente
normal con una media de 4.5 kilos y una desviacin estndar de 0.5 kilos. Si
los peces pesan menos de 3 kg la embarcacin ser multada con una
suspensin de un mes.
a) Qu porcentaje de los peces que pesca tendr peso mximo de 3
kilos?
b) Cul es la probabilidad de que una muestra de 50 peces atrapados
proporcione una media de a lo ms 4,3 kg.?

Mg. Beatriz Castaeda S.

262

BIOESTADISTICA

c) Si una muestra de 10 peces proporciona los siguientes pesos:


3.7, 3.9, 3.5, 2.8, 5.1, 4.2, 4.4, 2.1, 5.5, 2.6
d) Corroboran estos datos lo afirmado acerca del peso de los peces.
6. Un inspector encargado del control de la contaminacin de ros, mares y
lagos, sospecha que cierta poblacin estaba usando un ro como basurero
de desperdicios semitratados. Para verificar su sospecha tom muestras
aleatorias del agua despus de la ciudad. Las observaciones de oxgeno
disuelto en partes por milln (ppm) son:
Oxgeno Disuelto (ppm)
[4.5 - 4.8
[4.8 - 5.2
[5.2 - 5.5
[5.5 - 5.8
[5.8 - 6.5
[6.5 - 7.0
Total

Nmero de muestras
5
8
12
10
11
9
55

a) Estime el porcentaje de muestras tienen al menos 5 ppm de oxgeno


disuelto.
b) Si antes de la ciudad el ro tena un promedio de oxgeno disuelto de 5
ppm con una desviacin tpica de 0.5 ppm, interprete estos resultados
comparndolos con los obtenidos en las muestras tomadas despus de
la ciudad.
7. La supervivencia de muchos programas de televisin depende de su grado
de popularidad. Una empresa que se dedica a medir la popularidad de los
programas de televisin report que un determinado programa capta el 20%
de los televidentes. Para verificar la informacin anterior se tomo una

Mg. Beatriz Castaeda S.

263

BIOESTADISTICA

muestra aleatoria de n = 1000 televidentes de los cuales y = 184 ven el


programa.
a) Constituyen los datos anteriores evidencia suficiente para contradecir el
reporte.
b) Estime con 95 % de confianza la proporcin de televidentes que ve el
programa

8. El nmero de fallas de un instrumento de prueba, debido a las partculas


contaminantes de un producto, ocurre en promedio a 0.25 fallas por hora.
a) Cul es la probabilidad de que el instrumento no falle en una jornada
de 8 horas?
b) Calcule la probabilidad de que en 5 das de trabajo (jornada de 8 horas)
ocurran fallas mximo en 2 de estos das.
c) Se observ el nmero de fallas diarias del instrumento durante un
periodo de 40 das obtenindose los siguientes resultados:
N de fallas:
N de das:

0
3

1
8

2
10

3
9

4
5

5
3

6
1

7
1

Son estos datos una evidencia de que el promedio de fallas diarias es


superior a lo especificado? Calcule el nivel crtico de la prueba.
9. El fabricante de una mquina empacadora de jabn en polvo afirma que su
mquina puede llenar las cajas con el peso requerido con un rango de
llenado de no ms de 0,6 onzas.
a) Si la distribucin del peso de llenado es normal, al tomar 16 cajas de 48
onzas, cul es la probabilidad de que el peso medio de llenado en la
muestra supere las 49 onzas?, Cul es la probabilidad de que la

Mg. Beatriz Castaeda S.

264

BIOESTADISTICA

varianza del peso de llenado en la muestra sea a lo ms de 0,015


onzas2?
b) Una muestra de 8 cajas de 48 onzas proporcion un peso medio de
49,6 onzas y una varianza de 0,018 onzas2. Considera Ud. que estos
resultados contradicen la afirmacin del fabricante?. Use = 0,05
c) c) Use estos resultados para encontrar un intervalo del 90% de confianza
para el recorrido o rango de la cantidad empacada al usar la mquina
del fabricante.
10. Los raitings de pblico televidente han vuelto a los productores y
patrocinadores muy sensibles a las afirmaciones acerca del auditorio que ve
un programa dado. Una estacin de televisin afirma que su noticiero de las
6 p.m. es visto por el 50% del auditorio de en su rea de cobertura.
a) Si lo afirmado es verdad, cul es la probabilidad de que en una muestra
de 25 televidentes no ms del 40% vea el noticiero?
b) Una empresa que desea comprar tiempo de publicidad durante el
noticiero desea validar la afirmacin de la transmisora De qu tamao
debe ser la muestra seleccionada por la empresa si desea que la
precisin de su estimacin sea de 5% con 90% de confianza?
c) Suponga que se toma una muestra aleatoria de 100 televidentes y 38
indican que ven el noticiero de las 6 p.m. Es sta evidencia suficiente
de que la afirmacin de la estacin transmisora es falsa?. Proporcione el
nivel crtico de la prueba.

Mg. Beatriz Castaeda S.

265

BIOESTADISTICA

11. En una muestra aleatoria de 500 adultos residentes en cierta ciudad, se


encuentra que 385 estn a favor de aumentar el lmite de velocidad en las
autopistas a 120 km/h,

mientras que en otra muestra de 400 adultos

residentes en otra ciudad vecina se encuentra que 267 estn a favor del
aumento del lmite de velocidad. Estos datos indican que existe una
diferencia en el apoyo al

aumento del lmite de velocidad entre los

residentes de ambas ciudades? Utilice = 0.05. Encuentre el nivel crtico


de esta prueba.
12. La toma de decisiones participativa ha sido una estrategia administrativa
que se ha adoptado como un medio para mejorar la eficiencia y la
participacin de los individuos en las organizaciones. Se entrevist a dos
grupos de empleados, los cuales difieren substancialmente en el nivel de
participacin permitida por su patrn, y se les pregunt si estaban o no
satisfechos con su empleo actual. De 110 empleados de un grupo en el cual
se ha fomentado la participacin del empleado, 77 afirmaron que estaban
satisfechos de sus empleos. En tanto que 52 de 125 empleados de un
grupo en el que no se permite la participacin del empleado, afirmaron que
estaban satisfechos con su empleo.
Proporcione una estimacin intervlica para la diferencia en la proporcin de
empleados satisfechos con sus trabajos, y determine una cota superior para
el error de estimacin. Interprete.
13. Se compara el tiempo que tarda en reconocerse un conocido producto
comercial al usar dos colores distintos en los anuncios publicitarios. Se
obtienen los siguientes resultados (en segundos) cuando se aplica la prueba

Mg. Beatriz Castaeda S.

266

BIOESTADISTICA

a una muestra aleatoria de 8 persona, las que son expuestas a ambos


anuncios en orden aleatorio
Persona:
Anuncio 1:
Anuncio 2:

1 2 3 4
1 3 2 1
4 2 3 3

5 6 7
2 1 3
1 2 3

8
2
3

a) A que conclusiones se puede llegar al nivel del 5% de significancia?


b) Obtenga un intervalo de confianza 98% para la media de la diferencia de
tiempos. Interprete el resultado.
14. Un fabricante de calculadoras electrnicas afirma que menos del 1% de su
produccin es defectuosa. Se toma una muestra aleatoria de 1200
calculadoras y se encuentran 8 unidades defectuosas. Utilizando = 0.05,
determine si esto es evidencia suficiente para apoyar la afirmacin del
fabricante.

15. Una prueba diseada para estimar la confianza en s mismo se aplic a 16


nios crnicamente enfermos y a 21 nios sanos. Las calificaciones medias
y desviaciones estndar fueron las siguientes:

x
Nios enfermos
Nios sanos

22.5
26.9

S
4.1
3.2

a) Puede concluirse, a partir de estos datos que los nios crnicamente


enfermos tienden, en promedio a obtener menores calificaciones en la
prueba que los nios sanos?. Proporcione el nivel crtico de la prueba.
b) Obtenga una estimacin del 95% de confianza para la diferencia de las
calificaciones promedio en cada grupo.

Mg. Beatriz Castaeda S.

267

BIOESTADISTICA

16. El sistema de enfriamiento de un submarino nuclear est formado por un


ensamble de tuberas soldadas por donde circula un lquido refrigerante.
Las especificaciones requieren que la resistencia de la soldadura sea mayor
o igual que 150 psi.
a) Suponga que los ingenieros de diseo deciden probar la hiptesis H0:
= 150 contra H1: > 150. Explique porque esta eleccin de hiptesis
alternativa es mejor que H1: < 150.
b) Al tomar una muestra de 20 soldaduras se tiene que x = 153.7 psi y S =
11.3 psi. Qu conclusiones pueden obtenerse con respecto a la
hiptesis del inciso a)? Utilice = 0.05.
c) Obtenga una estimacin intervlica para la varianza de la poblacin.
17. Se plane una encuesta para determinar que porcentaje de los estudiantes
de

secundaria

de

un

sistema

escolar

metropolitano

han

fumado

regularmente marihuana. Si no se cuenta con una estimacin de estudios


anteriores, no puede extraerse una muestra piloto y se desea un coeficiente
de confianza de 0.95 de que la precisin de la estimacin ser de 4%, cul
debera ser el tamao de muestra?
18. Varios investigadores desean saber si pueden concluir que dos poblaciones
de nios difieren en cuanto a la edad media a la cual pudieron caminar por
s solos. Se reunieron los datos siguientes (las edades estn en meses):

Poblacin A: 9.5, 10.5, 9.0, 9.75, 10.0, 13.0, 10.0, 13.5, 10.0, 9.5, 10.0, 9.75
Poblacin B:12.5, 9.5, 13.5,13.75, 12.0,13.75, 12.5, 9.5, 12.0,13.5,12.0, 12.0

Mg. Beatriz Castaeda S.

268

BIOESTADISTICA

a) Qu concluiran los investigadores? Sea = 0.05.


b) Obtenga una estimacin intervlica del 95% de confianza para la
diferencia entre las edades promedio para las dos poblaciones.
19. Un fabricante afirma que al menos el 95% de las piezas que ha surtido para
cierta fbrica cumple con las especificaciones. Se examina una muestra de
200 de un lote que contiene 1000 piezas y se encuentra que 15 de ellas
son defectuosas.
a) Puede decirse que los datos proporcionan evidencia suficiente para
rechazar la afirmacin del fabricante? cul es el valor crtico de la
prueba?
b) Con confianza de 95%, proporcione una estimacin intervlica para la
proporcin de piezas que cumple con las especificaciones en el lote.

Bibliografa del captulo


1. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de la
Salud. 4 Edicin, Editorial Limusa S.A. de C.V. Grupo Noriega Editores.
Mxico 2004
2. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de la
Salud. 3 Edicin, Editorial Limusa S.A. Mxico 1991
3. CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY &
SONS. New York. 1980.
4. MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas a la
Ingeniera. McGRAW-HILL. Mxico. 1996

Mg. Beatriz Castaeda S.

269

BIOESTADISTICA

5. ROTHMAN, K. MODERN EPIDEMIOLOGY. LITTLE, BROWN AND


COMPANY.Boston/Toronto. 1986
6. ELORZA H. Estadstica para ciencias del comportamiento. Harla S.A.,
Mxico. 1987
7. MASON, R., LIND, D. y MARCHAL, W. Estadstica para Administracin y
Economa. Alfaomega, Colombia. 2003
8. RENDIMIENTO ESCOLAR Y DESARROLLO VISOMOTOR EN HIJOS DE

MADRES ADOLESCENTES. Silvestre N, Villena A. Gonzles G, Instituto de


Investigaciones de la Altura, Departamento de Ciencias Fisiolgicas.
Universidad Peruana Cayetano Heredia. (Revista Mdica Herediana 7.
Suplemento 1, 1996. pg 6)

Mg. Beatriz Castaeda S.

270

BIOESTADISTICA

8. REFERENCIAS BIBLIOGRAFICAS
1. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de la
Salud. 4 Edicin, Editorial Limusa S.A. de C.V. Grupo Noriega Editores.
Mxico 2004
2. DANIEL, W. BIOESTADSTICA, Base para el Anlisis de las ciencias de la
Salud. 3 Edicin, Editorial Limusa S.A. Mxico 1991
3. AHLBOM, A. And NORELL, S. Itroduction To MODERN EPIDEMIOLOGY.
Epidemiology Resourses Inc. USA. 1990
4. CONOVER, W.J. Practical Non parametric Statistics 2ed. JOHN WILEY &
SONS. New York. 1980.
5. DAWSON-SAUNDERS, B. And TRAPP, R. Bioestadstica Mdica. 2
Edicin. Manual Moderno, S.A. de C.V. Mxico. 2000
6. DAWSON-SAUNDERS, B. And TRAPP, R. Bioestadstica Mdica. 4
Edicin .Manual Moderno, S.A. de C.V. Mxico. 2004
7. Centro Panamericano de Ingeniera Sanitaria y Ciencias del Ambiente.
Evaluacin de Riesgos para la salud por el uso de aguas residuales en
agricultura. Anexo 3: Aspectos Microbiolgicos. CEPIS-OPS. Lima, Per.
1990
8. Centro

Panamericano

de

Ecologa

Humana

Salud.

Evaluacin

Epidemiolgica de riesgos causados por agentes qumicos ambientales.


Edicin de 1985. Mxico: OPS; 1985
9. PAGANO, M y GAUVREAU, K. Fundamentos de Bioestadstica. Thomson
Learning. Mxico, 2000

Mg. Beatriz Castaeda S.

271

BIOESTADISTICA

10.ELORZA H. Estadstica para ciencias del comportamiento. Harla S.A.,


Mxico. 1987
11.OSTLE, B. ESTADSTICA APLICADA, Tcnicas de la Estadstica Moderna,
cuando y donde aplicarlas. Editorial LIMUSA WILEY. Mxico, 1973.
12.ROTHMAN, K. MODERN EPIDEMIOLOGY. LITTLE, BROWN AND
COMPANY.Boston/Toronto. 1986
13.MONTGOMERY, D y RUNGER, G. Probabilidad y Estadstica aplicadas a la
Ingeniera. McGRAW-HILL. Mxico. 1996
14.MEYER, P. L. Probabilidad y Aplicaciones Estadsticas. Addison-Wesley
Iberoamericana S.A., Buenos Aires Argentina. 1992
15.KAZMIER, L.J. Estadstica aplicada a la Administracin y Economa.
McGRAW-HILL, Mxico. 1996
16.MASON, R., LIND, D. y MARCHAL, W. Estadstica para Administracin y
Economa. Alfaomega, Colombia. 2003
17.RENDIMIENTO ESCOLAR Y DESARROLLO VISOMOTOR EN HIJOS DE

MADRES ADOLESCENTES. Silvestre N, Villena A. Gonzles G, Instituto de


Investigaciones de la Altura, Departamento de Ciencias Fisiolgicas.
Universidad Peruana Cayetano Heredia. (Revista Mdica Herediana 7.
Suplemento 1, 1996. pg 6)

Mg. Beatriz Castaeda S.

272

BIOESTADISTICA

Anexo
RESUMEN DE ESTIMACION Y PRUEBA DE HIPOTESIS

Mg. Beatriz Castaeda S.

273

BIOESTADISTICA

Cuadro 16. ESTIMACION POR INTERVALO


Requisitos

Parmetro

Media

Varianza 2 conocida
-Todo n de poblacin Normal
- n grande de cualquier
poblacin
Varianza 2 desconocida
- n grande (n > 30) de
cualquier poblacin
Varianza 2 desconocida
- n < 30 de poblacin
Normal

Varianza

Proporcin

Intervalo de confianza
(1- )

La poblacin es normal

Poblacin grande
Muestra grande

L = x Z 1 / 2
L = x Z 1 / 2

n
S
n

S
n
(n 1) S 2
Ls =
2 / 2

L = x t 1 / 2
Li =

( n 1) S 2

12 / 2

L = p Z1 / 2

P
Poblacin finita
Muestra grande

L = p Z1 / 2

p(1 p)
n

p(1 p) N n

n
N 1

Tamao de muestra

Poblac. grande
Z12 / 2 S 2
n=
E2
Poblac. finita
n0
n=
n
1+ 0
N
2
Z
S2
n0 = 1 / 22
E

Poblac grande.

Z 12 / 2 p(1 p)
n0 =
E2
n=

n0
Poblac finita
n0
1+
N

Elaboracin del autor

Mg. Beatriz Castaeda S.

274

BIOESTADISTICA

Parmetro

Intervalo de confianza (1- )

Requisitos
2

Diferencia de
medias

1 - 2

Varianzas 1, 2 conocidas
-Todo n1, n2 de poblaciones
normales.
-n1 30, n2 30 en general
Varianzas 21, 22
desconocidas
- n1 30, n2 30

P1 P2

n1

22
n2

s12 s22
+
n1 n2

L = ( x 1 x 2 ) t1 / 2 S x1 x 2

-n1<30, n2< 30 de poblaciones


normales

Muestras grandes
poblacin.

x x =

L = ( x 1 x 2 ) Z 1 / 2 S x1 x 2 S x x =

Varianzas 21, 22
Desconocidas

Diferencia de
Proporciones

L = ( x 1 x 2 ) Z 1 / 2 x1 x 2

12

de

cada

S x1 x 2 =

( n1 1) S12 + ( n2 1) S 22
n1 + n2 2

1
1
+
n1 n2

L = ( p1 p2 ) Z 1 / 2 S p1 p 2
S p 1 p 2 =

p1 (1 p1 ) p2 (1 p2 )
+
n1
n2

Elaboracin del autor

Mg. Beatriz Castaeda S.

275

BIOESTADISTICA

Cuadro17. PRUEBA DE HIPTESIS


HIPOTESIS

H0: = 0
a) H1: 0
b) H1: > 0
c) H1: < 0

Estadstica
de la prueba

Varianza 2 conocida
-Todo n de poblacin Normal
- n grande de cualquier poblacin
Varianza 2 desconocida
- n grande (n > 30) de
poblacin

x 0
/ n
x 0
Z =
S/ n
x 0
Z=

cualquier

Varianza 2 desconocida
- n < 30 de poblacin Normal

T=

Normal
N(0,1)
Normal
N(0,1)
t-Student
t(n -1)

S/ n

a)
b)
c)

H0: = 20
H1: 2 20
H1: 2 > 20
H1: 2 < 20

Requisitos

Distribucin de
La estadstica
Si H0 es cierta

H0: P = P0
a) H1: P P0
b) H1: P > P0
c) H1: P < P0
H0: P1 = P2
a) H1: P1 P2
b) H1: P1 > P2
c) H1: P1 < P2

La poblacin es normal

Muestra grande

X =
2

Z =

Muestras grandes de poblaciones Z =


independientes

Mg. Beatriz Castaeda S.

(2n 1)

(n 1) S 2

02
p P0

1
1

+
P (1 p )
n 2
n1

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-
a) T < -t1-/2 T > t1-/2
b) T > t1-
c) T < -t1-
a) X2 < 2 / 2 X2 > 12 / 2

12
c) X2 < 2

b) X2 >

Normal

P0 (1 P0 ) N n

n
N 1
p1 p 2

Decisin:
Rechazar H0
Al nivel si
a) Z < -Z1-/2 Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-

; p=

N(0,1)
x1 + x 2
n1 + n 2

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-
a) Z < -Z1-/2 Z > Z1-/2
b) Z > Z1-
c) Z < -Z1-
Z es N(0,1)

276

BIOESTADISTICA

de
poblaciones
H0: 12 = 220 Muestras
2
2
independientes,
cada
una con
a) H1: 1 2 0
2
2
b) H1: 1 > 2 0 distribucin normal.
c) H1: 12 < 220
Varianzas 21, 22 conocidas

a)H0: 1- 2 = 0
H1: 1 - 2 0
b)H0: 1 - 2 0
H1: 1- 2 > 0
c)H0: 1 - 2 0
H1: 1 - 2 < 0

-Todo n1, n2 de poblaciones


normales
- n1 30, n2 30 de cualquier
poblacin
Varianzas 21, 22 desconocidas

S12
F= 2
S2
Z=

Z=

- n1 30, n2 30 de cualquier
poblacin

Varianzas 21, 22 desconocidas y


diferentes

2
1

- n1 < 30, n2 < 30 de poblaciones


normales

Normal

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-

2
2

+
n1 n 2

N(0,1)

( x1 x 2 )

Normal

S12 S 22
+
n1 n2
T =

S p2 =

T =

a) F < F2 F > F1 2
b) F > F1
c) F < F

( x1 x 2 )

Varianzas 21, 22 desconocidas,


pero semejantes
- n1 < 30, n2 < 30 de poblaciones
normales

F(n1-1, n2-1)

N(0,1)

( x1 x 2 )
1
1
Sp
+
n1 n2

( n1 1) S + ( n2 1) S
n1 + n2 2

( x1 x 2 )
S12 S 22
+
n1 n2

T es t(v)

es t ( n1+ n 2 2 )

2
1

c) T < -t1-
2

a) T < -t1-/2 T > t1-/2

( ) +( )
n1

n1 + 1

S2

a) T < -t1-/2 T > t1-/2


b) T > t1-

2
2

S12 S 22

+
n1 n2

v= 2 2
2
S1

a) Z < -Z1-/2 Z > Z1-/2


b) Z > Z1-
c) Z < -Z1-

n2

n2 + 1

b) T > t1-
c) T < -t1-

Elaboracin del autor

Mg. Beatriz Castaeda S.

277

Potrebbero piacerti anche