Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Pág.
INDICE 2
INTRODUCCIÓN 5
Capítulo 1. LA DISTRIBUCIÓN NORMAL Y EL TEOREMA DEL LÍMITE
CENTRAL 6
1.1 Distribución normal 6
1.2 Distribución normal estándar 7
1.3 Propiedad reproductiva de la distribución normal 9
1.4 Teorema del límite central 10
1.5 Ejercicios resueltos 13
1.6 Ejercicios propuestos 29
Capítulo 2. DISTRIBUCIONES MUESTRALES 33
2.1 Distribución muestral de la media 37
2.2 Distribución muestral del total (conocida la media) 39
2.3 Distribución de la diferencia de medias muestrales 40
2.4 Distribución muestral de la proporción 43
2.5 Distribución muestral del total (conocida la proporción) 47
2.6 Distribución muestral de la diferencia de proporciones 48
2.7 Ejercicios resueltos 52
2.8 Ejercicios propuestos 73
Capítulo 3. DISTRIBUCIONES ESPECIALES 77
3.1 Distribución Chi-cuadrado 77
3.2 Distribución t de student 86
3.3 Distribución muestral de la media (n < 30) 92
3.4 Distribución de la diferencia de medias muestrales con varianzas
desconocidas pero iguales 93
3.5 Distribución F de Snedecor 94
3.6 Distribución de la razón de dos varianzas muestrales 98
3.7 Ejercicios resueltos 100
2
3.8 Ejercicios propuestos
119
Capítulo 4. ESTIMACIÓN PUNTUAL 122
4.1 Estimadores. Propiedades 123
4.2 Métodos de Estimación Puntual 130
4.3 Método de Máxima Verosimilitud 130
4.4 Método de los Momentos 132
4.5 Método de los mínimos cuadrados 133
4.6 Ejercicios resueltos 135
4.7 Ejercicios propuestos 152
Capítulo 5. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 155
5.1 Intervalo de confianza para la media y tamaño de muestra 160
5.2 Intervalo de confianza para el total (conocida la media) 162
5.3 Intervalo de confianza para la proporción y tamaño de muestra 164
5.4 Intervalo de confianza para el total (conocida la proporción) 167
5.5 Intervalo de confianza para la diferencia de medias 168
5.6 Intervalo de confianza para la diferencia de proporciones 170
5.7 Intervalo de confianza para la media (n < 30) 173
5.8 Intervalo de confianza para la varianza 175
5.9 Intervalo de confianza para la razón de varianzas 177
5.10 Intervalo de confianza para la diferencia de medias (n y m <30) 179
5.11 Ejercicios resueltos 187
5.12 Ejercicios propuestos 235
Capítulo 6. CONTRASTE DE HIPÓTESIS ESTADÍSTICAS PARAMÉTRICAS 245
6.1 Prueba de hipótesis para la media (con varianza conocida) 251
6.2 Prueba de hipótesis para la media (con varianza desconocida) 258
6.3 Prueba de hipótesis acerca de una varianza 263
6.4 Prueba de hipótesis para la razón de varianzas 270
6.5 Prueba de hipótesis acerca de dos medias (varianzas conocidas) 276
6.6 Prueba de hipótesis acerca de dos medias (varianzas desconocidas) 281
6.7 Prueba de hipótesis para la proporción 290
3
6.8 Prueba de hipótesis para la diferencia de proporciones 293
6.9 Ejercicios resueltos 299
6.10 Ejercicios propuestos 348
Capítulo 7. PRUEBA DE HIPÓTESIS NO PARAMÉTRICAS 355
7.1 Uso de la distribución Chi-cuadrado. Test de independencia 356
7.2 Test de bondad de ajuste 362
7.3 Test de Wilcoxon 364
7.4 Test de signos 367
7.5 Test de la mediana 374
7.6 Ejercicios resueltos 379
7.7 Ejercicios propuestos 395
REFERENCIAS BIBLIOGRÁFICAS 398
Apéndice 400
Tabla 1. Distribción acumulativa normal estándar 401
Tabla 2. Distribución acumulativa chi-cuadrado 403
Tabla 3. Distribución acumulativa T de student 407
Tabla 4. Distribución acumulativa F 408
Tabla 5. De Wilcoxon para n < 40 y a = 0.05 o 0.01 409
Tabla 6. Valores críticos para la prueba del signo S 409
4
INTRODUCCIÓN
La ciencia económica para poder realizar las mediciones económicas recurre permanentemente a la inferencia
estadística, ya que las deducciones y conjeturas económicas acerca de los parámetros están basadas en muestras
aleatorias tratadas por esta disciplina.
Con el propósito de poder contribuir al proceso de enseñanza aprendizaje de la estadística para economistas en
la Universidad Nacional del Callao (UNAC), hemos creído conveniente elaborar un “Texto de problemas de
inferencia estadística” que de manera sencilla ayude a estudiantes de la especialidad a desarrollar competencias
conceptuales y procedimentales, mediante la asimilación de la terminología propia de la estadística, así como las
correspondientes aplicaciones a la economía.
El texto consta de siete capítulos. En el primero, se desarrolla la distribución normal y el teorema del límite central;
el capítulo dos, presenta las distribuciones muestrales para muestras grandes (n > 30) y en el capítulo tres, se
desarrollan las distribuciones muestrales especiales ligadas a muestras pequeñas (n < 30) como la chi-cuadrado,
t de student y F.
En los capítulos cuatro y cinco se desarrollan los temas relacionados a la estimación puntual y la estimación por
intervalos de confianza respectivamente.
En el capítulo seis, se desarrollan los contrastes de hipótesis estadísticas paramétricas, poniendo especial énfasis
en la determinación del valor-P (probabilidad mínima para rechazar la hipótesis nula) usado en los cálculos
computacionales modernos. Finalmente, en el capítulo siete se presentan las pruebas de hipótesis no
paramétricas.
Gratitud eterna a nuestra querida UNAC, por el continuo apoyo ofrecido para alcanzar estos logros que permiten
sistematizar conocimientos e incorporar temas para la discusión en clases. El reconocimiento especial a los
estudiantes de economía de la FCE-UNAC, ya que gracias a su esfuerzo y comprensión en los últimos años se
han puesto en práctica los resultados de este modesto trabajo.
5
-(^-M)2
O/T2
- OT < X < OT
2—
Notación.- una notación muy común para la distribución normal es: X ~ N(p , o )
varianza o2 ”.
Características geométricas.-
• La gráfica tiene forma acampanada, con centro en p.
6
• Es una función creciente en el intervalo (- ro , p).
• Es una función decreciente en el intervalo (p , ro).
• Tiene sus puntosde inflexión en p - o y p + o.
Características estadísticas.-
• Media: E (X) = p
• Varianza: V (X) = o2
• Si X ~ N(p , o ). Entonces,la variable aleatoria Y = a + b X también se
22
distribuye normalmente con media: E(Y) = a + bp y varianza: V(Y) = b o . Es decir: Y ~ N(a + bp , b2 o2 )
• Si X ~ N(p , o2 ) el cálculo de probabilidades se efectúa realizando el proceso de estandarización siguiente:
Z = (X - p ) / o ~ N(0, 1) y decimos que la v.a. Z tiene distribución normal estándar.
DISTRIBUCIÓN NORMAL
M -11
= Z040 =-0.25 ^ M = 10.5 Rpta.
16
Si X = ingreso de los trabajadores ~ N(1000, 200 ), Z = (X - 1000)/ 200 ~ N(0, 1).
Para determinar cuántos de los n = 2000 trabajadores tienen ingresos en los intervalos dados, primero se
determina la probabilidad P y después multiplica por n. Se pide:
a) P = P(X < 600) = P
X -1000 600 -1000
<■
= P(Z < -2.0) = O(-2.0) =
200 200 0.02275
Luego nP = 0.02275 x 2000 = 45.5 trabajadores Rpta.
Interpretación: 46 trabajadores (2.28%) tienen ingreso menor a S/. 600.
b) P = P(850 < X < 1300) = P
850-1000 X-1000 1300 -1000
< < -------------------------------------------------------
200
200
200
= P(-0.75 < Z < 1.5) = O(1.5) - O(-0.75) = 0.93319 - 0.22663 = 0.70656
Distribución del ingreso Normal, Media = 1000, Desv.Est.=200
0.0020
0.0015
re
!S
c 0.0010 &
0.0005
0.0000
850 1000 1300
X = ingreso
Luego nP = 0.70656 x 2000 = 1413.12 trabajadores Rpta.
Interpretación: alrededor de 1413 trabajadores (70.66%) tienen ingreso entre S/. 850 y 1300.
6. El volumen de negociaciones diarias (en millones de nuevos soles) para las acciones comercializadas en la
bolsa de Lima tiene distribución normal con media |i= 800 y desviación estándar o = 100. En un período de
60 días, calcule e interprete:
a) ¿En cuántos días el volumen de negociaciones es de 600 o menos millones?
b) ¿En cuántos días el volumen de negociaciones es mayor de 900 millones?
17
Solución
Si X = volumen diario de negociaciones en millones de S/. ~ N(800, 100 )
^ Z = (X - 800)/ 100 ~ N(0, 1).
Para determinar en cuántos de los n = 60 días el volumen de las negociaciones está en los intervalos dados,
primero se determina la probabilidad P y después multiplica por n. Se pide:
a) P = P(X < 600) = P{X_800 < 600_800] = P(Z < -2.0) = O(-2.0) =
^ 100 100 )
0.02275
Luego nP = 0.02275 x 60 = 1.4 días Rpta.
Interpretación: en alrededor de 1.4 días (2.28%) el volumen de negociaciones es de 600 o menos millones de
nuevos soles.
b) P = P(X > 900) = P { X _ 800 > 900 _ 800 ] = P(Z > 1.0) = 1 - O(1.0) =
^ 100 100 )
= 1 - 0.84134 = 0.15866. Luego nP = 0.15866 x 60 = 9.5días Rpta. Interpretación: en alrededor de 9.5 días
(15.87%) el volumen de negociaciones es mayor de 900 millones de nuevos soles.
7. El peso de los pernos fabricados se distribuye normalmente con media |i= 80 gr. y desviación estándar o = 5
gr. Si se almacenan 2000 pernos, calcule e interprete ¿qué cantidad de pernos pesan: a) menos de 70
gramos? y b) entre 75 y 90 gramos?
Solución
Si X = peso de los pernos ~ N(80, 52) ^ Z = (X - 80)/ 5 ~ N(0, 1).
Para determinar cuántos de los n = 2000 pernos tienen un peso en los intervalos dados, primero se determina la
probabilidad P y después multiplica por n. Se pide:
í X _ 80 70 _ 80^
a) P = P(X < 70) = P ----------------- < --------------- = P(Z < -2.0) = O(-2.0) = 0.02275
v5 5 )
Luego nP = 0.02275 x 2000 = 46 pernos Rpta.
Interpretación: alrededor de 46 pernos (2.28%) pesan menos de 70 gramos.
b) P = P(75 < X < 90) = P
75 - 80 X - 80 90 - 80
< < -------------------------------------
5 5 5
18
= P(-1 < Z < 2) =
= 0(2.0) - 0(-1.0) = 0.97725 - 0.15866 = 0.81859.
Distribución del peso de los pernos Normal, Media=80, Desv.Est.=5
X = peso
Resultado gráfico en Minitab Luego nP = 0.81859 x 2000 = 1637 pernos Rpta.
Interpretación: alrededor de 1637 pernos (81.86%) pesan entre 75 y 90 gramos.
8. El tiempo necesario para terminar un examen se distribuye normalmente con media |i= 80 minutos y
desviación estándar o = 10 minutos. En un curso de 60 alumnos, calcule e interprete cuántos alumnos
terminan el examen:
a) ¿en una hora o menos?
b) ¿en más de 60 minutos, pero en menos de 75 minutos?
c) ¿Cuántos alumnos no terminan el examen, si éste dura 90 minutos?
Solución
Si X = tiempo para terminar un examen ~ N(80, 10 )
^ Z = (X - 80)/ 10 ~ N(0, 1).
Para determinar cuántos de los n = 60 alumnos terminan el examen en los intervalos dados, primero se determina
la probabilidad P y después multiplica por n. Se pide:
( X — 80 60— 80
a) P = P(X < 60) = P ^ J = P(Z < -2.0) = 0(-2.0) = 0.02275.
Luego nP = 0.02275 x 60 = 1.4 alumnos Rpta.
19
Interpretación: alrededor de 1.4 alumnos (2.28%) terminan el examen en una hora o menos.
b) P = P(60 < X < 75) = P
60 - 80 X - 80 75 - 80
< < ------------------------------------
10 10 10 _ = 0(-0.50) - 0(-2.0) = 0.30854 - 0.02275 = 0.28579.
Resultado gráfico en Minitab
= P(-2 < Z < -0.5) =
Distribución tiempo duración examen Normal, Media=80, Desv.Est.=10
23
satisfactorio se requiere un claro de diámetro de cuando menos 0.02 mm, ¿en qué proporción de los casos el
ajuste no será satisfactorio? Interprete el resultado. (claro del diámetro = diámetro del casquillo - diámetro del
tapón) Solución
Sean: T = diámetro del tapón ~ N(24.9, 0.032) y
C = diámetro del casquillo ~ N(25, 0.042)
Si X = claro del diámetro = C - T, usando la propiedad reproductiva de la distribución normal se tiene que:
|ix = E(X) = E(C - T) = E(C) - E(T) = 25.0 - 24.9 = 0.10
o2x = V(X) = V(C - T) = V(C) + V(T) = 0.0009 +0.0016 = 0.0025 = 0.052.
Luego: X = claro del diámetro = C - T ~ N(0.10, 0.052)
^ Z = (X - 0.10)/ 0.05 ~ N(0, 1).
Que el ajuste no sea satisfactorio implica que X < 0.02. Entonces:
P(X < 0.02) = P{X~010 < 0 02~0101 = p(Z < .1.8) = o(-1.6) = 0.0548 ^ 0.05 0.05 J
Rpta.
Interpretación: en alrededor del 5.48% de los (ó en 548 de cada 10000) ensambles el tapón no se ajusta al
casquillo.
14. Las pastillas metálicas cilindricas que se utilizan en un reactor se fabrican en serie y puede suponerse que
sus longitudes siguen una distribución normal con media 0.290 cm. y desviación estándar 0.016cm. Nueve
de estas pastillas deben ajustarse, extremo con extremo, en un recipiente que ocupa una longitud no mayor
de 2.670 cm. Si las nueve pastillas se ensamblan al azar, ¿qué proporción de estos no se ajustará en el
espacio requerido? Interprete el resultado.
Solución
Sean: Xi = diámetro de las pastillas ~ N(0.29, 0.0162) y
L = longitud del recipiente con 9 pastillas = E X..
i=1
Por la propiedad reproductiva de la distribución normal, se tiene que:
9 9 9
E(L) = E(EX ) = EE(X) = E0.29 = 9 x 0.29 = 2.61 cm.
i=1 i=1 i=1
24
9
9
9
V(L) = V( jX, ) = jV(X) = Y0 0162 = 9 x 0 0162 = 0.002304 cm2.
i=1
i=1
i=1
Luego:
9
L = longitud del recipiente con 9 pastillas = jX ~ N(2.61, 0.0002304)
i=1
^ Z = (L - 2.61)/ 0.048 ~ N(0, 1).
Las 9 pastillas no se ajustan al espacio requerido si L > 2.67. Por lo tanto:
P(L > 2.67) = 1 - P(L < 2.67) = 1 - P
( L - 2.61 2.67 - 2.61 < -----
^ 0.048 0.048
= 1 - P(Z < 1.25) = 1 - 0(1.25) = 1 - 0.89435 = 0.10565 Rpta. Interpretación: en alrededor del 10.56% de los
(ó en 1056 de cada 10000) recipientes con 9 pastillas, éstas no se ajustan en el espacio requerido.
15. Suponga que las variables aleatorias X1 , X2 , .... , X50 representan la vida útil de 50 tubos electrónicos; los
mismos que se usan de la siguiente manera: tan pronto como falla el primer tubo, empieza a funcionar el
segundo y cuando falla el segundo empieza a funcionar el tercero, etc. Suponga que los Xi, i = 1, 2, ...., 50
tienen distribución exponencial con parámetro X = 1/500. ¿Cuál es la probabilidad que el tiempo de
funcionamiento de los 50 tubos esté comprendido entre 20 000 y 30 000 horas? Interprete el resultado.
Solución
Sea Xi = tiempo de funcionamiento del tubo i ~ Exponencial (X = 1/500) Entonces |i = E(Xi) = 1/ X = 500 , o 2 = 1/
X2 = 5002] i = 1, 2, .., 50.
Sea Y50 = tiempo de funcionamiento de los 50 tubos =
50
= X + X2 + ................................................+ X=Y X,
i=1
Entonces, por el teorema del límite central la probabilidad solicitada es: P(20 000 < Y 50 < 30 000) =
50
P
<
1.41)
25
= 0(1.41) - 0(-1.41) = 0.92073 - 0.07927 = 0.84146 Rpta.
Interpretación: en alrededor del 84.15% de los (ó en 8415 de cada 10000) tiempos de funcionamiento de 50 tubos
estará comprendido entre 20 000 y 30 000 horas.
16. Las botellas de aceite vegetal “Primor” tienen un contenido medio de 1 litro y una desviación estándar de 0.04.
Para la distribución se acomodan en cajas de 36 botellas, Calcule e interprete la probabilidad que una caja
contenga más de 36.6 litros.
Solución
Sea Xi = contenido de las botellas de aceite ~ [p = 1, o = 0.04 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
36
L2 -L- J- Y —
36
= *1 + X + ........................ + Xx = 2 X,
Entonces, por el teorema del límite central la probabilidad solicitada es:
36.6 - 36x1
P(Y36 > 36.6) = 1 - P(Y36 < 36.6) = 1 - P
36
2 X - 36x1
1=1 <
0.04V36 0.04V36
= 1 - P(Z < 2.5) = 1- 0(2.5) = 1 - 0.99379 = 0.00621 Rpta. Interpretación: alrededor del 0.62% de las (ó en 62
de cada 10000) cajas con 36 botellas de aceite el contenido es de más de 36.6 litros.
17. En una ciudad grande el 20% de los hogares no tiene desagüe. Si se eligen 100 hogares al azar, calcule e
interprete la probabilidad de que más de 30 hogares no tengan desagüe.
Solución
Sea Xi = 1, si el hogar no tiene desagüe ~ Bernoulli [p = 0.20]
Sea Y100 = el total de hogares sin desagüe, entre los 100 elegidos =
100
= X + X2 + ..................................+ X100 =2X ~ B[n = 100, p = 0.20] ó N[np = 20, npq =
i=1
16]
Entonces, por el teorema del límite central la probabilidad solicitada es:
1
26
P(Y1
00
>
30)
f 100
2 X -100x0.20
P
P(Y100
\
<
30)
<
30 -100x0.20
yj0.20x0.80 y¡100 ^0.20x0.80 V1o0
= 1 - P(Z < 2.5) = 1- 0(2.5) = 1 - 0.99379 = 0.00621 Rpta. Interpretación: en alrededor del 0.62% de los (ó en
62 de cada 10000) grupos de 100 hogares escogidos, más de 30 hogares no tienen desagüe.
18. Un lote de 10 000 pavos tiene un peso medio de 7 Kg. y una desviación estándar de 0.15 Kg. Este lote debe
ser entregado a los vendedores minoristas a razón de 100 cada uno. ¿Cuál es la probabilidad de que un
vendedor cualquiera de estos tomados al azar, reciba un peso total de menos de 697 kilos? Interprete su
resultado.
Solución
Sea Xi = peso de los pavos ~ [^ = 7, o = 0.15 Kg.]
100
Sea Y100 = peso total de los 100 pavos = X + X2 + ............................................... +X100 = 2 X
i=1
Entonces, por el teorema del límite central la probabilidad solicitada es:
f 100
P(Y100 < 697) = P
2 X -100x7
A
<
697 -100x7
0.15V100 0.15>/ÍÓ0
= P(Z < -2.0) = 0(-2.0) = 0.02275 Rpta.
Interpretación: alrededor del 2.28% de los (ó 228 de cada 10000) vendedores minoristas recibe un peso total
menor a 697 Kg.
19. La Constructora “Techito” estima que el peso promedio de las personas que vivirán en un edificio de
apartamentos es de 68 Kg., con una desviación estándar de 15 Kg. De acuerdo con la estimación, instala en
el edificio un ascensor para 36 personas con capacidad máxima de 2700 Kg. Si la estimación es correcta,
calcule e interprete la probabilidad de que un cupo completo exceda la capacidad del ascensor.
Solución
1
1
27
Sea Xi = peso de las personas ~ [p = 68, G = 15 Kg.]
36
Sea Y36 = peso total de las 36 personas = X1 + X2 + ............................... + X36 = V X,
Entonces, por el teorema del límite central la probabilidad solicitada es: P(Y36 > 2700) = 1 - P(Y36 < 2700) = 1 - P
36
V X - 36x68
V' 2700 - 36x68
i =1 <
15>/36 15>/36
= 1 - P(Z < 2.8) = 1- 0(2.8) = 1 - 0.99744 = 0.00256 Rpta. Interpretación: alrededor del 0.26% de los (ó en 256
de cada 10000)cupos
completos del ascensor con 36 personas exceden su capacidad máxima de 2700 Kg.
20. Las botellas de ron “Pepito” tienen un contenido medio de 2 litros y una desviación estándar de 0.018. Para la
distribución se acomodan en cajas de 36 botellas, Calcule e interprete la probabilidad que una caja contenga
más de 72.36 litros.
Solución
Sea Xi = contenido de las botellas de ron ~ [p = 2, g = 0.018 lts.]
Sea Y36 = contenido por caja de las 36 botellas =
36
X + X2 + ...................................... +X36 =V X,
Entonces, por el teorema del límite central la probabilidad solicitada es: P(Y 36 > 72.36) = 1 - P(Y36 < 72.36) = 1 -
P
36
V X - 36x2
V' 72.36 - 36x2
0.018>/36 0.018>/36
= 1 - P(Z < 3.33) = 1- 0(3.33) = 1 - 0.99957 = 0.00043 Rpta. Interpretación: alrededor del 0.04% de las (ó en
4 de cada 10000) cajas con 36 botellas de ron contienen más de 72.36 litros.
1
1
28
EJERCICIOS PROPUESTOS
1. Sea Z una variable aleatoria con distribución normal estándar [Z ~ N(0, 1)]. Hallar las probabilidades siguientes:
a) P(Z < 2.15)
b) P(0.80 < Z < 1.96)
c) P(-2.45 < Z < 1.65)
d) P(-2.75 < Z < -0.65)
e) P(Z > -1.38)
f) P(-2.57 < Z < 0)
g) P(0 < Z < 2.33).
2. Sea Z una variable aleatoria normal estándar [Z ~ N(0, 1)]. Hallar el valor de z para los casos siguientes:
a) O(z) = 0.8665
b) O(z) = 0.9222
c) O(z) = 0.9972
d) el área entre -z y z es 0.99
e) el área a la izquierda de z es 0.05
f) el área a la derecha de z es 0.025
3. El contenido en las botellas de cierta gaseosa tiene distribución normal con media |i= 1000 ml. y desviación
estándar o = 5 ml. Calcule e interprete la probabilidad de que una botella de gaseosa tenga:
a) Entre 990 y 1005 ml.
b) Menos de 985 ml.
4. El precio que pagan los hogares por el kilo de pescado en una gran ciudad tiene distribución normal con media
|i= S/. 12 y desviación estándar o = S/. 0.80. Calcule e interprete la probabilidad de que el precio pagado por
el kilo de pescado:
a) Sea menor de S/. 10.
b) Se encuentre entre S/. 10.50 y 13.50.
c) Por arriba de que precio paga el 10% superior de los consumidores.
29
5. El tiempo que dura la atención a los clientes de un negocio se distribuye normalmente con media p= 30 minutos
y desviación estándar o = 4 minutos. Calcule e interprete la probabilidad de que el tiempo de atención a los
clientes:
a) dure entre 25 y 40 minutos.
b) Entre que limites simétricos alrededor de p dura el 95% de las atenciones.
6. El peso de las cajas de mango se distribuye normalmente con media p= 20 Kg. y desviación estándar o = 0.5
Kg. Si se almacenan 2000 cajas, calcule e interprete ¿qué cantidad de cajas pesan:
a) menos de 19 kilos?
b) entre 19.5 y 21 kilos?
7. El peso de los huevos de gallina producidos por una avícola se distribuye normalmente con media p= 65 gr. y
desviación estándar o = 5 gr. Si se almacenan 2000 huevos, calcule e interprete ¿qué cantidad de huevos
pesan:
a) Menos de 70 gramos?
b) Entre 55 y 60 gramos?
8. La duración de ciertos focos eléctricos tiene distribución normal con media p= 1000 horas y desviación estándar
o = 200 horas. Si compra 2000 de estos focos, calcule e interprete:
a) ¿Cuántos focos durarán menos de 600 horas?
b) ¿Cuántos focos durarán entre 850 y 1300 horas?
9. El volumen de ventas diarias de bolsas de azúcar de la comercializadora “Yapatera” tiene distribución normal
con media p= 800 bolsas y desviación estándar o = 100. En un período de 60 días, calcule e interprete:
a) ¿En cuántos dias el volumen de ventas es de 600 o menos bolsas de azúcar?
b) ¿En cuántos dias el volumen de ventas es mayor de 900 bolsas de azúcar?
10. Sean X1 y X2 variables aleatorias independientes distribuidas normalmente con
22
p1 = 50; p2 = 35; = 10; °2 = 6. Si: Y = X1 - X2. Calcule e interprete:
a) La media y la varianza de Y
b) P [10 < Y < 25]
30
11. Sean X1, X2 y X3 variables aleatorias independientes distribuidas normalmente
2 2 _2
con p1 =10; p2 = 15; p3 = 12; a1 = 3; a2 = 4; a3 = 6. Sí: Y = X1 + 2 X2 - X3
Calcule e interprete:
a) P [20 < Y < 40]
b) P [Y < 18]
12. Los teléfonos celulares A y B tienen una duración (en días) que son N(2190,
22
200 ) y N(2878, 250 ) respectivamente. Si se prueba la vida de cada uno de los teléfonos correspondientes a cada
una de las marcas, ¿cuál es la probabilidad que los A duren un año o más que los B? Interprete su resultado.
13. En una ciudad grande el 20% de hogares no tiene agua. Si se escogen 100 hogares, calcule e interprete la
probabilidad que más de 30 no tengan agua.
14. Al lanzar una moneda 100 veces, calcule e interprete la probabilidad de obtener entre 40 y 60 caras.
15. Las cajas con limón tienen un peso medio de 20 Kg. y una desviación estándar de 750 gr. Calcule e interprete
la probabilidad de que el peso de 410 cajas recibidas al azar y cargadas en un camión, supere su capacidad
máxima que es de 8,250 kg.
16. Los pesos de los sacos de algodón Pima cosechados tienen una media de 50 kilos y una desviación estándar
de 1.4 kilos. Calcule e interprete la probabilidad de que el peso de 100 paquetes seleccionados al azar sea
menor de 4975 kilos.
17. Las cajas con naranja tienen un peso medio de 15 Kg. y una desviación estándar de 0.5 kilos. Calcule e
interprete la probabilidad de que el peso de 400 cajas tomadas al azar sea menor de 5,980 kg.
18. Un lote de 10 000 pollos para parrilla tiene un peso medio de 1 Kg. y una desviación estándar de 0.05 Kg. Este
lote debe ser entregado a las pollerías a razón de 100 cada una. ¿Cuál es la probabilidad de que una pollería,
cualquiera
31
de estas tomada al azar, reciba un peso total de menos de 98.5 kilos? Interprete su resultado.
19. Los pesos de los paquetes recibidos en las tiendas Ripley tienen una media de 580 libras y una desviación
estándar de 80 libras. Calcule e interprete la probabilidad de que el peso de 49 paquetes recibidos al azar y
cargados en un montacargas, supere su capacidad de 30 000 libras.
20. Un lote muy grande de cajas con palta tiene un peso medio p = 20 Kg. y una desviación estándar o = 0.5 Kg.
Este lote debe ser entregado a los supermercados a razón de 100 cajas cada uno. Calcule e interprete ¿la
probabilidad de que un supermercado cualquiera, reciba un peso total de menos de 1 990.2 Kg.?
32
Capítulo 2. DISTRIBUCIONES MUESTRALES
“¿Hace falta remarcar que un país que no conoce su demografía, tampoco conoce su economía? No se puede
saber lo que un país
produce y ahorra si se ignora esta cosa fundamental: la población .....................................
En un país donde no se puede contar a los hombres, menos aún se puede contar la producción. Se desconoce el
primero de sus factores: el factor humano, el factor trabajo..”
José Carlos Mariátegui
CONTENIDO
n
A1-1 e
= ----------------- , Xi = 0, 1, 2, 3, ........ ; V i = 1, 2, .... , n .
n i ± 5555 i 111
n-x'
i=1
Rpta.
Ejemplo 2.-
Si se toma una m.a. de tamaño n, de una población X con distribución N(p , o ), hallar la función de probabilidad
conjunta (función de verosimilitud) para dicha muestra.
Solución:
35
2 2 Como la v.a. X ~ N(p , o ), entonces Xi ~ N(p , o ) y su función de probabilidad
está dada por: fX (Xt) =
1
e
<X‘-^)2/2ff2;-®< X. <w, V i = 1, 2, 3, ....
n.
\12K<J
Luego la función de densidad conjunta (función de verosimilitud) será:
fx,X 2,....Xn (X1, X2,...., Xn ) = fX (X, )fX (X2)... .fX (Xn ) =
1 2 2
e -(X1 -,u) /2a
¡Ina2
1 -(X 2 -,u)2/2ct2
e
lina2
[...]
-(X„ -M)2/2a2
\2na
2na
2 -I (Xi -^)1/20'1
e i=1 ;-ro < x < V i = 1, 2, 3, .... , n. Rpta.
Estadístico.- es una variable aleatoria que depende sólo de la muestra observada.
Así, si X1 , X2 , .... , Xn es una m.a. de una población X, entonces la media muestral
2
(X) y la varianza muestral (s ) son estadísticos. Donde:
IX,
X = -!=!— n
y
52 = -i=1
I (X - X )2
n -1
Distribución muestral.- es la distribución de probabilidad de un estadístico.
Error estándar de un estadístico.- es la desviación estándar de la distribución muestral de un estadístico.
Error relativo de un estadístico.- es el coeficiente de variación de la distribución muestral de un estadístico.
Teorema 1.- Sea X1 , X2 , .... , X una muestra aleatoria de tamaño n de una
población X, con media E(X) = p y varianza Var (X) = o . Sea X = —— la
n
media muestral, entonces: E( X) = ^ y a\ = Var(X) =
a
n
Teorema 2.- Sea X1 , X2 , .... , Xn una muestra aleatoria sin reemplazo de tamaño n de una población X de tamaño
N, con media E(X) = E(Xi ) = p y varianza Var (X)
= Var (Xi) = o2.
Entonces: E( X) = ^ y
2 ^ a2f N-n ] S2f N-n
a=Var( X)=-1 _ 1=n I -Ñ~,
1
e
1
36
N
Donde: S2 = — -------------------- , representa la cuasivarianza poblacional y el factor
2
X ( x,-m)
'2 _ i=1
N -1
N -1
se llama factor de corrección para poblaciones finitas (f.c.p.f.) el mismo que
es descartado cuando la fracción de muestreo (f )
A continuación presentamos las distribuciones muestrales de la media, del total (conocida la media), de la
diferencia de medias muestrales, de la proporción, del total (conocida la proporción) y de la diferencia de
proporciones. Todas ellas de suma importancia en el diario quehacer de muchos campos de la investigación
científica, ya que como estudiaremos más adelante, van a permitir la determinación de intervalos de confianza y
la verificación de hipótesis para los parámetros poblacionales.
2.1 DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Teorema 3.- Si X1 , X2 , .... , X es una muestra aleatoria de tamaño n de una población X, con media E(X) = p y
varianza Var (X) = o . Entonces, por el
Este teorema es válido para cualquier población finita o infinita, discreta o continua, cuando el tamaño de la
muestra n > 30. Si la población es normal, se cumple cualquiera sea el tamaño n de la muestra.
Cuando la población es finita de N elementos y el muestreo es sin reemplazo, la variables aleatorias X i no son
independientes, entonces la distribución de X es hipergeométrica, con:
37
Teorema 4.- Si X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n extraida sin reemplazo de una población X
finita de tamaño N, con media E(X) = p y varianza
n
_ XX
Var (X) = o2. Entonces, la media muestral X = —— tiene aproximadamente
n
distribución normal con media p y varianza — = Var(X) =
n
—
N -1
. Y la
variable aleatoria Z = —(X ^ ^ tiene aproximadamente distribución N(0, 1).
—N-n
Jn \¡ N -1 Ejemplo 3.-
En Lima Metropolitana la botella de aceite “primof’ de un litro tiene un precio promedio de S/. 5.00 y una desviación
estándar de S/. 0.40. Si se toman muestras aleatorias de 50 precios, se pide calcular e interpretar: a) la
probabilidad que el precio promedio muestral se encuentre entre S/. 4.85 y 5.10; b) la probabilidad que el precio
medio muestral sea inferior a S/. 4.80; y c) dentro de que límites simétricos alrededor del precio promedio
verdadero se encontrará el 95 % de los precios promedios muestrales.
Solución.-
Como datos del problema se tiene que: p = S/. 5.00 , o = S/. 0.40 y n = 50.
2
— = Var(X) = — = (0.40)2 / 50 = 0.0032 ^ — = 0.057. S/. n
Luego: X ^ N(5.00;0.0032) y Z = (X^ ^ N(0,1). Nos piden:
a) P(4.85 < X < 5.10) = P
4.85 - 5.00 X - 5.00 5.10 - 5.00
< < -----------------------------------------------------
.057 0.057 0.057 J
= P(-2.63 < Z < 1.75) = ^ (1.75) - ^ (-2.63) =
= 0.95994 - 0.00427 = 0.95567 Rpta.
Interpretación.- el 95.567% de los precios promedios muestrales de las botellas de aceite “primof’ de un litro, se
encuentran entre S/. 4.85 y 5.10, para muestras de 50 precios.
b) P(X < 4.80) = p(X - 5 00 < 4 80 - 5 00) = p(z < -3.51) = 0.00022
0.057 0.057
38
J
Interpretación.- el 0.022% de los precios promedios muestrales de las botellas de
aceite “primor” de un litro, será inferior a S/. 4.80, para muestras de 50 precios.
c) Sean 5.00 - E y 5.00 + E los límites simétricos alrededor de la media p = S/.
5.00, dentro de los cuales estará el 95 % de las X . Entonces:
— - F F
0.95 = P(5.00 - E < X < 5.00 + E) = P( --------------------------< Z <--------- ) =
0.057 0.057
= .—i
0.057
0.057
—| = 0.975 0.057 J
F
^ ^ = Z0975 = 1.96 — F = 1.96(0.057) = 0.11. Luego los límites serán:
5.00 - E= 5.00 - 0.11 = S/. 4.89 y 5.00 + 0.11 = S/. 5.11. Es decir:
0.95 = P(4.89 < X < 5.11)
Interpretación.- el 95 % de los precios promedios muestrales de las botellas de aceite “primof’ de un litro, se
encuentran entre S/. 4.89 y 5.11 alrededor de p = S/. 5.00, para muestras de 50 precios.
2.2 DISTRIBUCIÓN MUESTRAL DEL TOTAL (conocida la media)
En muchas situaciones vamos a estar interesados en efectuar estimaciones de un total poblacional, conocida la
media muestral, para lo cual se tiene que tener presente lo siguiente:
N
2X
Sí el promedio poblacional es: u = i 1
n
El total de la población se define como: X = 2 X = NU
i=1
el cual es estimado por: X=NU = NX
Utilizando la propiedad reproductiva de la distribución normal, el teorema central del límite y los operadores
esperanza y varianza para el estimador de total, llegamos al resultado siguiente:
X = NU = NX — N(Nu, NV2) y z = NXN- Nu ~ N(0, 1)
Donde la varianza del estimador del total está dada por:
39
2
• Var( X) = Var( Np) = Var( NX) = N 2Var( X) = N2— = N2 —, si la
n
fracción de muestreo f = n / N < 0.05 , o
2 1\T
• Var(X) = Var(Np) = Var(NX) = N2Var(X) = N—2 = N2 ——n , si
n N -1
la fracción de muestreo f = n / N > 0.05.
2.3 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES
Esta distribución va a surgir cuando estemos interesados en efectuar la comparación de las medias de dos
poblaciones. Por ejemplo: comparar el precio promedio poblacional de un bien o servicio en la ciudad X (p X ) y el
precio promedio poblacional del mismo bien o servicio en la ciudad Y (pY ). O comparar los ingresos promedios,
ventas promedios, los rendimientos promedios, etc. no sólo entre ciudades, sino también entre grupos.
Esta comparación se formula así: ¿Serán iguales los precios promedios de un bien o servicio en las ciudades X e
Y (o en las ciudades 1 y 2)? Que es idéntico a plantearse ¿pX = pY o pX - pY = 0? o también ¿p1 = p2 o p1 - p2 = 0?
Es decir, que esta comparación se reduce a conocer la diferencia de medias poblacionales, la misma que va a
requerir tomar muestras aleatorias de ambas poblaciones y estudiar el comportamiento de la media muestral en
cada una de ellas, de la siguiente manera:
• Sea X1 , X2 , .... , Xn es una muestra aleatoria de tamaño n, de una población X de tamaño N, con media E(X) =
pX y varianza Var (X) = —. Sabemos que la
1L,X i
media muestral X = —— tiene aproximadamente distribución normal:
n
X ^ N(Px —X). Donde: —X = —- o —X = Var(X) = — fN^^ (1)
n n ^ N -1J
Sea Yi , Y2 , .... , Ym una muestra aleatoria de tamaño m, de una población Y de
tamaño M, con media E(Y) = pY y varianza Var (Y) =—. Sabemos que la
m
media muestral Y = —— tiene aproximadamente distribución normal: m
40
Y ^ N(UY ,ar) . Donde:
aY =
a
a.
aT = Var(Y) = m o m
(M — m i M — 1
De (1) y (2) tenemos que X - Y es una variable aleatoria con media:
= E(X — Y ) = E(x)—E(Y ) = Ux —U =Ux —
UY
(2)
y vananza:
a\_T = Var(X — Y ) = Var(X) + Var(Y ) = a2 +a
_2 2 = °L + °
a x—Y 1
.2
n
m
a 2x ( N—n
n
N—1
al (M — m ^
M—1
(3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene que:
x -y ~ n( Ux —UY , a2—y ) y Z =
X — Y — (ux — UY))
a
N(0 , 1)
X —Y
donde ax_r se obtiene a partir de (3).
o
y
Sintetizamos lo expuesto hasta aquí en el teorema 5.
Teorema 5 - Si X y Y son las medias de dos muestras aleatorias (de tamaños n y m) de dos poblaciones X e Y,
con medias pX y pY , y varianzas Var (X) =a2x y Var (Y) =a2, respectivamente, entonces la distribución muestral de
la diferencia de medias es aproximadamente normal N( u x — UY , O2^) y la variable aleatoria
ry X — Y — (UX — UY)) ry X — Y — (UX — UY))
Z = ------------- , —— o Z =, ) = tiene
a a a
\ x! r lx
rN — n ^ -2
nia
-1+-
v
N—1ym
M—mM—1
\\ n m \¡ n
aproximadamente distribución normal estándar N(0 , 1).
Si n y m son mayores o iguales que 30, la aproximación a la normal para la diferencia de medias muestrales es
óptima.
Si las poblaciones X e Y son normales, el teorema se cumple para cualesquier tamaño de muestra.
Ejemplo 4.-
Ciertas bolsas de café tienen un peso medio de 500 gr. y una desviación estándar de 20 gr. Cierto día de
producción se toman independientemente dos muestras al azar sin reposición, con n = 500 y m = 800. ¿Cuál es
la probabilidad que los pesos medios
41
de las dos muestras difieran a) en más de 2 gr.? y b) en menos de 1gr.? Interpretar los resultados.
Solución.-
Sea X la muestra de tamaño n = 500 bolsas de café, con p X = 500 gr. y ax = 20 gr. Sea Y la muestra de tamaño m
= 800 bolsas de café, con pY = 500 gr. y aY = 20 gr.
_2 2 oq2 0(")2
—
Luego: —x-r = —X- — = 500 - 500 = 0, — = =
n m 500 800
1.3 y -x-r = 114 gr.
_- X-r-0
Además, X - Y ~ N(0, 1.3) y Z = —— ~N(0 , 1). Nos piden:
a) P (| X - Y|> 2 )=1 -P( X - Y|< 2 ) = 1 - P(-2 < X- Y < 2)
=
=1-P
-2-0X-Y-0 2-0) , _, ^
< ------------------------------ < --------- I = 1 - P(-1.75 < Z <
1.14 1.14 1.14 J
1.75) =
=1- (1.75) - 4 (-1.75)] = 1 - (1.75) - 1 + 4 (1.75)] =
= 2 - 2 4 (1.75) = 2 - 2 (0.95994) = 0.08012 Rpta.
Interpretación.- en el 8.01% de las comparaciones, para muestras de 500 y 800 bolsas de café respectivamente,
las diferencias de pesos medios serán mayores a 2 gramos.
b) P ( X - Y| < 1 ) = P( -1 < X- Y < 1) =
=P
r-1 - 0 X - Y - 0 1 - 0
< --------------------------------------------------------------------- < ----------- I = P(-0.88 < Z < 0.88) =
1.14 1.14 1.14 J
= 4(0.88) - 4(-0.88) = 0.81057 - 0.18943 = 0.62114 Rpta.
Interpretación.- en el 62.11% de las comparaciones, para muestras de 500 y 800 bolsas de café respectivamente,
las diferencias de pesos medios serán menores de 1 gramo.
42
2.4 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
En muchos estudios vamos a estar interesados en clasificar los datos cualitativos o cuantitativos de la población
en dos clases distintas (población dicotómica o binomial) tales como: éxitos y fracasos; hombres y mujeres; a favor
y en contra; aprueba y desaprueba; jóvenes (menores de x años) y adultos (de x años y más); caras y sellos;
empleados y desempleados; etc.
En este caso, se desea estimar la proporción de unidades (P) o el número total de unidades (A) en la población
que poseen una cierta característica o atributo que cae dentro de una clase definida. Por ejemplo, se desea
estimar:
- El porcentaje (o número) de personas que consumen un cierto producto.
- El porcentaje (o número) de clientes que compran más de 10 000 dólares mensuales.
- El porcentaje (o número) de ciudadanos que está a favor de un personaje. Notación: Además de la notación
usada anteriormente, si se define la v.a. Bernoulli:
Xi = 1, si la unidad estadística observada posee la característica de interés (éxito).
Xi = 0, si la unidad estadística no posee la característica de interés (fracaso).
A = E X y P = — ------------------------------------- representan el número total de unidades (A) y la
N
i=1
proporción (P) de unidades en la población que poseen una cierta característica.
Suponga que se extrae una muestra aleatoria simple de tamaño n de la población binomial, entonces la proporción
muestral p definida como:
Entonces:
N
N
n
X
i=1
estima a P.
n
n
43
n
X = Z X = número de éxitos en la muestra es una v.a. Binomial (n, P). La
i=1
proporción muestral p, es una media muestral de v.a. Bernoulli con E(X i ) = P y V(Xi ) = P Q; representa la
proporción de éxitos en la muestra y estima a la proporción de éxitos en la población P. Es decir, que p tiene el
mismo comportamiento de una media muestral X. Por lo tanto:
E(p) = E
n
Z*.
i=1
n
1n 1n 1
- Z E( X,) = - Z P = -(nP) = P
n~í n~-- n
Var( p) = Var
n
I.*.
i=1
n
n
Var(Z X,)
i=1
n
(propiedad de la varianza)
n n
ZVar(X,) Z PQ
n
1 __________________ =nPQ = PQ= ,
n2 n2 np
Z*i
Luego:
=1
X
í
P.
v
n
1
y
Si el muestreo se efectúa sin reemplazo de una población binomial finita, la distribución muestral de p sigue la
distribución hipergeométrica y su varianza requiere el factor de corrección para poblaciones finitas (salvo que la
fracción de muestreo f = n/N sea menor del 5%, donde no se utiliza). Entonces:
44
p—P
7 - F ~ wn i ^
\PQ i n í N — n"]
l N — 1J
Ejemplo 5.-
Según el Censo Nacional de Talla en Escolares de 1999 1 la desnutrición crónica en el Perú era del 27.9%. Si se
toma una muestra al azar sin reposición, de n = 1500 niños y niñas. Calcule e interprete la probabilidad que: a) la
desnutrición crónica muestral se encuentre entre 26 y 30%? y b) dentro de que límites simétricos alrededor de la
proporción verdadera de desnutridos crónicos se encontrará el 95% de las proporciones muestrales.
Solución.-
El mencionado Censo tiene los siguientes datos:
N = 2 059 426 niños y niñas censados como casos válidos = tamaño de la población.
N
X = ^ Xt = 574 314 niños y niñas desnutridos crónicos.
i=1
N
YX
„ ^iX 574,314 J
P = — --------= — = --------------------- = 0.279 = proporción censal de niños y niñas con
N N 2'059,426
desnutrición crónica.
Q = 0.721 = proporción censal de niños y niñas sin desnutrición crónica. n = 1500 niños y niñas = tamaño de la
muestra.
Como la fracción de muestreo n/N es menor de 0.05, entonces, la proporción muestral:
y
1 Ministerio de Educación. Nutrición y Retardo en el Crecimiento. Resultados del II Censo Nacional de Talla en
Escolares 1999. Lima, Perú, Noviembre de 2000.
45
n
1.x,
P=
n
X
n
P, ^0) = N (0.279; 0.0001341)
nJ
Z = p-P = P - 0279 = P - 0279 ~ N(0, 1)
PQ
n
0.0001341 0.0116
Se pide calcular:
a) P ( 0.26 < p < 0.30 ) = P
0.26 - 0.279 ^ p - 0.279 ^ 0.30 - 0.279 0.0116 “ 0.0116 “ 0.0116
= P( -1.64 < Z < 1.81 ) = 4 (1.81) - 4 (-1.64) =
= 0.96485 - 0.05050 = 0.91435 Rpta.
Interpretación.- en el 91.44 % de las muestras de 1500 niños y niñas a nivel nacional, el porcentaje de desnutridos
crónicos, se encuentra entre el 26 y 30 %.
b) Sean 0.279 - E y 0.279 + E los límites simétricos alrededor de la proporción verdadera P = 0.279 , dentro de
los cuales estará el 95 % de las p. Entonces:
- E E
0.95 = P(0.279 - E < p < 0.279 + E) = P( _____________ < Z < ______ ) =
0.0116
0.0116
=4
E
0.0116
-4
- E 0.0116
= 24
E
0.0116
E
0.0116
= 0.975
E
0.0116
= Z0975 = 1.96 ^ E = 1.96(0.0116) = 0.023 . Luego los límites serán:
0.279 - E = 0.279 - 0.023 = 0.256 y 0.279 + 0.023 = 0.302 . Es decir:
0.95 = P(0.256 < p < 0.302 )
Rpta.
Interpretación.- en el 95 % de las muestras de 1500 niños y niñas a nivel nacional, la proporción de desnutridos
crónicos se encontrará entre 0.256 y 0.302 alrededor de la proporción verdadera P = 0.279.
46
y
(1)
Suponga que se extrae una muestra aleatoria simple de tamaño n2 de la población binomial 2, de tamaño N2 con
una proporción de éxitos igual a P2. Sea X2 el número de éxitos en la muestra de tamaño n2 , entonces la
proporción muestral de
X
éxitos p2 , definida como p2 = —2 estima a P2 y para n2 suficientemente
2 n2
grande tiene aproximadamente distribución normal:
48
-2 \ ^ _2 _
p.. ^ N(p2,-p2). Donde: - =
P.
2 PQ.
o -pp = —
n
P
Np n2
V N2 -1 y
(2)
• Siendo pi y p2 variables aleatorias independientes, cuyas distribuciones están dadas en (1) y (2) tenemos que p 1
- p2 es una variable aleatoria con media:
^-Pp = E(P1 - P.) = )-E(PP)=Ap! -Ap2 = P - P2
y varianza:
°p, - p = Var(P1- p.)=Var(P1)+VaKp.)=° + -pP
-2 =P1Q^+ PpQp P1Q1
P1- PP
n
1
'2
n
N1- n1
.N -1
+
P.QP
N2 - n2 v np -1 y
(3)
Además, por la propiedad reproductiva de la distribución normal, de (1) y (2) se tiene que:
pi - p2 ~ N(P1 - Pp , op _ p2) y z =
p1 - P2 - (P1 - P2)
-
Pi-Pp
donde -Pi _ se obtiene a partir de (3).
N(0 , 1)
Sintetizamos lo expuesto hasta aquí en el teorema 6.
Teorema 6- Si p1 y p2 son las proporciones de dos muestras aleatorias (de tamaños n 1 y n2 ) de las poblaciones
binomiales 1 y 2, respectivamente, entonces la distribución muestral de la diferencia de proporciones p 1 - p2 ~
N(P1 - P2 , -p p )
y la variable aleatoria
Z=
p1 - p2 - (P1 - P2) ¡PQ , PpQp ] n «P
z=
p1 - pP - (P1 - P2)
V
y
n
normal estándar N(0 , 1).
o
49
Si ni y n2 son mayores o iguales que 30, la aproximación a la normal para la diferencia de proporciones muestrales
es óptima.
Ejemplo 6.-
Una empresa que trabaja en ciudades grandes, considera que el nivel de aceptación de su producto en los hogares
de la ciudad 1 es de un 35% y en la ciudad 2 de un 30%. Si se toma una muestra aleatoria de 400 hogares de
cada ciudad. ¿Cuál es la probabilidad que la diferencia de proporciones muestrales de hogares que prefieren el
producto en ambas ciudades sea menor al 8%? Interpretar el resultado.
Solución.-
P1 = 0.35 = proporción de hogares que prefiere el producto en la ciudad 1.
Q1 = 1 - P1 = 0.65 = proporción de hogares que no prefiere el producto en la ciudad
1.
P2 = 0.30 = proporción de hogares que prefiere el producto en la ciudad 2.
Q2 = 1 - P2 = 0.70 = proporción de hogares que no prefiere el producto en la ciudad
2.
n1 = n2 = 400 hogares (tamaño de la muestra en ambas ciudades)
Considerando que ambas ciudades son grandes y que las correspondientes fracciones de muestreo son menores
al 5% (f = n / N < 0.05) se tiene que:
Pi - P2 ~ N(P1 - P2 , aP - )
3. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución de Pareto, con parámetro
B, hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra.
f(X1,X2,....,Xn) = fx(X1)fx(x¿....fx(Xn) = [pxqx ] [p"qx ] [-...] [p'’qx ]
n n
^ X n— ^ X
pi=1 q i=1 , xi = 0 y 1; V i = 1, 2, .... , n . Rpta.
Solución
Rpta.
52
Solución
Si la variable aleatoria. X ~ Pareto (B), entonces cada Xi ~ Pareto (B) y su función de
BXB
probabilidad es: fx(xi) = ^+1, Xi > Xo, Vi =1,2, . .,n. Donde:
B = Coeficiente de Pareto > 0.
Xo = Ingreso mínimo.
Luego la función de probabilidad conjunta o de verosimilitud será:
f (^ , ^ _ xn ) = fX (x)fX (x2)--------------------------fX (xn ) =
BX0B
XB+1
BXOB
XB+1
[...]
BXOB
XB+1
BnXn
nXB
; X > X0, Vi = 1,2,....,n
, Rpta.
4. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución log-normal, con parámetros
p y o , hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra.
Solución
2 2 Como la variable aleatoria X ~ LN (p , o ), entonces cada Xi ~ LN (p , o ) y su
función de probabilidad esta dada por: fX ( X7 ) =
r(lnxi-^)2/2ff2;x > 0, V i =
x,v 2na
1, 2, ...., n.
Luego la función de densidad conjunta o de verosimilitud será:
f (x , , xn ) = fX (x\)fX (x2) -------------- fX (xn ) =
1
1 __ e~ (>n X\~M)2 /2 j2
1 ____ e~o* x2 -^f/2o-2
X2\¡2K<J
[....]
1 _e~(ln xn -M)2/2J2
x „v2nj
n
i=1
x.
2KJ
(ln x¡ -^)2/2j2 e i=1
2 -S ; x > 0, V i = 1, 2, 3,.... , n. Rpta.
53
1
5. Las botellas de aceite para motor de carros tienen un contenido medio de 2.0 litros y una desviación estándar
de 0.12 litros. Si se toma una muestra aleatoria de 36 botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 1.96 y 2.03 litros.
b) ¿Dentro de qué límites simétricos caerá el 95 % de las medias muestrales alrededor de la media poblacional?
Solución
Los datos del problema son: p = 2.0 lts., o = 0.12 lts. y n = 36 botellas.
2
— = Var(X) = — = (0.12)2 / 36 = 0.0004 ^ — = 0.02 lts.
n
Luego: X ^N(^—2) = N(2.00, 0.0004) y Z = (X ^N(0,0 . Nos piden:
. ^ ^ tt" J 1.96-2.00 X -2.00 2.03 -2.00^ „
a) P(1.96 < X < 2.03) = P ---------------------------- < -------------- < ----------------------- = P(-2.0 <Z <
^ 0.02 0.02 0.02 ) v
15)
= 4 (1.5) - 4 (-2.0) =
= 0.93319 - 0.02275 = 0.91044 Rpta.
Distribución contenido medio de aceite
Normal, Media=2, Desv.Est.=0.02 lts.
X = media muestral
Resultado gráfico en Minitab
54
Interpretación.- en el 91.04% de las (ó en 9104 de cada 10000) muestras de 36 botellas de aceite para motor de
carro de dos litros, el contenido medio está entre 1.96 y 2.03 litros.
b) Sean 2.00 - E y 2.00 + E los límites simétricos alrededor de la media p = 2.0 lts., dentro de los cuales estará
el 95 % de las X . Entonces:
—E E
0.95 = P(2.00 - E < X < 2.00 + E) = P( --------------------------< Z < ------- ) =
0.02 0.02
E
0.02
—E
= 4 ------------- |— 4 1 = 24 ---------- |—1 ^4
0.02
E
0.02 y
E | = 0.975.-.
0.02 y
E
= Z0975 = 1 96 ^ E = 1.96 x 0.02 = 0.039 lts. Luego los límites serán:
0.02
2.00 - E = 2.00 - 0.039 = 1.961 lts. y 2.00 + 0.039 = 2.039 lts. Es decir:
0.95 = P(1.961 < X < 2.039) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 36 botellas de aceite para motor de carro
de dos litros, el contenido medio está entre 1.961 y 2.039 lts. alrededor de p = 2.0 lts.
6. Una estación de servicio de una ciudad grande ha encontrado que sus ventas semanales de petróleo tienen
un promedio de 15 galones por cliente con una desviación estándar de 2.8. Para una muestra aleatoria de 49
clientes, calcule e interprete:
a) La probabilidad de que la compra promedio semanal de petróleo sea menor de 14 galones;
b) ¿Dentro de qué límites simétricos caerá el 99% de las medias muestrales alrededor de la media poblacional?
Solución
Los datos del problema son: p = 15 glns., o = 2.8 glns. y n = 49 clientes.
2
a2 = Var(X) = — = (2.8)2 / 49 = 0.16 = 04 glns.
n
55
Entonces: X ^ N(^,a|) = N(15, 0.16) y Z = (X^ ^15) ^ N(0, 1). Nos piden:
0.4
a) P( X < 14) = P
X -15 14 -15
< -----------------------
A
v 0.4 0.4 y
= P(Z < -2.5) = ^ (-2.5) = 0.00621 Rpta.
Interpretación.- en el 0.621% de las (ó en 62 de cada 10000) muestras de 49 clientes de petróleo, la compra media
es menor a 14 galones.
b) Sean 15 - E y 15 + E los límites simétricos alrededor de la media p = 15 glns., dentro de los cuales caerá el
99 % de las X . Entonces:
0.99 = P(15 - E < X < 15 + E) = P(— < Z <E) =
0.4 0.4
E
-E
= (/> —1-^ 1 = 2^ —1-1
^0.4) \ 0.4J \0.4J ^
E
í
E
— 1 = 0.995.-.
v 0.4 )
E
^j- = Z0995 = 2.575 ^ E = 2.575 x 0.4 = 1.03 glns. Luego los límites serán:
15 - E = 15 - 1.03 = 13.97 glns. y 15 + 1.03 = 16.03 glns. Es decir:
0.99 = P(13.97 < X < 16.03) Rpta.
Distribución compra media de petróleo
Normal, Media=15, Desv.Est.=0.4
X = media muestral
Resultado gráfico en Minitab
56
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 49 clientes de petróleo, la venta media
se encuentra entre 13.97 y 16.03 glns. alrededor de p = 15 glns.
7. La compañía “Yapatera” vende bolsas de azúcar con un contenido medio de 5 kilos y una desviación estándar
de 0.2 kilos. Si se toma muestras al azar de 36 bolsas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra supere los 5.1 kilos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 90% de los pesos medios
muestrales?
Solución
Los datos del problema son: p = 5 Kg., o = 0.2 Kg. y n = 36 bolsas.
2
— = Var(X) = — = (0.2)2 / 36 = 0.0011 ^ — = 0033 Kg. n
Entonces: X ^ N(^—2) = N(5, 0.0011) y Z = (5) ^ N(0, 1). Se pide:
a) P( X > 5.1) = P
X-5 5.1 - 5
>
v 0.033 0.033 y
= P(Z > 3.03) = 1 - ^ (3.03) =
= 1 - 0.99878 = 0.00122 Rpta.
Interpretación.- en el 0.12% de las (ó en 12 de cada 10000) muestras de 36 bolsas de azúcar, el peso medio
supera los 5.1 kilos.
b) Sean 5 - E y 5 + E los límites simétricos alrededor de la media p = 5 Kg., dentro de los cuales caerá el 90 %
de las X. Entonces:
0.90 = P(5 - E < X< 5 + E) = P(—^- <Z < —^) =
0.033 0.033
E
0.033
-E
= (f> -------------- 1-^ I = 2^ -------------------------- 1-1
0.033
E
0.033
E | = 0.95.-.
0.033
E
= ^5 = 1.645 ^ E = 1.645 x 0.033 = 0.054 Kg. Luego los límites serán:
0.033
57
5 - E = 5 - 0.054 = 4.946 Kg. y 5 + 0.054 = 5.054 Kg. Es decir:
0.90 = P(4.946 < X < 5.054) Rpta.
Interpretación.- en el 90% de las (ó en 9000 de cada 10000) muestras de 36 bolsas de azúcar, el contenido medio
se encuentra entre 4.946 y 5.054 Kg. alrededor de p = 5 Kg.
8. En Lima el precio promedio al consumidor del kilo de arroz es p = S/. 3.20 con una desviación estándar o =
S/. 0.25. Si se selecciona una muestra aleatoria de 100 consumidores de arroz, calcule e interprete:
a) La probabilidad que el precio medio muestral del arroz sea mayor a S/. 3.25 el kilo.
b) ¿Dentro de que límites simétricos caerá el 95% de los precios medios muestrales alrededor de la media
poblacional?
Solución
Los datos del problema son: p = S/. 3.20, o = S/. 0.25. y n = 100 consumidores.
2
— = Var( X) = — = (0.25)2 / 100 = 0.000625 ^ — = S/. 0.025 n
Entonces: X ^ N(M—) = N(3.20, 0.000625) y Z = (Xq—^ N(0, 1). Se pide:
( Y — ^ 9D ^ ^
a) P(X> 3.25) = P ------------------------------ — > — = P(Z > 2.0) = 1 - 4 (2.00) =
l 0.025 0.025 J
= 1 - 0.97725 = 0.02275 Rpta.
Interpretación.- en el 2.28% de las (ó en 228 de cada 10000) muestras de 100 consumidores de arroz, el precio
medio del kilo es mayor a S/. 3.25.
b) Sean 3.20 - E y 3.20 + E los límites simétricos alrededor de la media p = S/. 3.20, dentro de los cuales caerá el
95 % de las X . Entonces:
—E E
0.95 = P(3.20 - E < X< 3.20 + E) = P( ----------------------------------- < Z< ----------) =
0.025 0.025
58
E
0.025
—E
= 4 --------------- |—4 -------------- | = 24 -----------|—1 ^4
0.025
E
0.025
E | = 0.975.
0.025
E
= ^^75= 196 ^ E = 1.96 x 0.025 = S/. 0.05. Luego los límites serán:
0.025
3.20 - E = 3.20 - 0.05 = S/. 3.15 y 3.20 + 0.05 = S/. 3.25. Es decir:
0.95 = P(3.15 < X <3.25) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 100 consumidores de arroz, el precio
medio del kilo se encuentra entre 3.15 y 3.25 nuevos soles alrededor de p = S/. 3.20.
9. La compañía “La negrita” vende latas de café con un contenido medio de 195 gramos y una desviación
estándar de 6 gramos. Si se toman muestras al azar de 25 latas. Calcule e interprete:
a) La probabilidad de que el peso medio de la muestra sea menor de 192 gramos.
b) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 99.73% de los pesos medios
muestrales?
Solución
Los datos del problema son: p = 195 gr., o = 6 gr. y n = 25 latas.
2
a2 = Var(X) = — = (6)2 / 25 = 1.44 ^ = 1.2 gr.
n
Entonces: X ^N(^,,O\) = N(195, 1.44) y Z = (X^ ^95) ^ N(0, 1). Se pide:
— ( X —195 192 —1951
a) P( X < 192) = P -------------------------------- < ------------------ = P(Z < -2.5) = 4 (-2.50) = 0.00621
V 1 .2 1 .2 y
Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 25 latas de café, el peso medio es menor
192 gr.
b) Sean 195 - E y 195 + E los límites simétricos alrededor de la media p = 195 gr, dentro de los cuales caerá el
99.73 % de las X. Entonces:
59
- — —
0.9973 = P(195 - E < X < 195 + E) = P(------------------ < Z <—) =
1.2 1.2
E
V
1.2
-E
= (/> — 1-^ — 1 = P4 — 1-1
V
1.2
E
í
V
1.2
V
E | = 0.99865
1.2 y
E
— = Z0 99865 = 3 . 0 ^ E = 3 x 1.2 = 3.6 gr. Luego los límites serán:
195 - E = 3.6 - 0.05 = 191.4 gr. y 195 + 3.6 = 198.6 gr. Es decir:
0.9973 = P(191.4 < X < 198.6) Rpta.
Interpretación.- en el 99.73% de las (ó en 9973 de cada 10000) muestras de 25 latas de café, el peso medio se
encuentra entre 191.4 y 198.6 gr. alrededor de p = 195 gr.
10. Se sabe que en la ciudad A el gasto medio mensual en arbitrios es de S/. 250, con una desviación típica de
S/. 60; mientras que en la ciudad B dicho gasto medio mensual es de S/. 235, con una desviación típica de
S/. 50. En una auditoría para determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma
una muestra al azar de 300 hogares de cada ciudad. Calcule e interprete la
probabilidad de que:
a) El gasto medio mensual en arbitrios en la ciudad B sea mayor que en la ciudad
A.
b) El gasto medio mensual en arbitrios en la ciudad A sea al menos S/. 25 más
que el gasto medio mensual en arbitrios en la ciudad B.
Solución
Los datos del problema son: pA = S/. 250, oA = S/. 35 y nA = 300 hogares.
pB = S/. 235, oA = S/. 20 y nB = 300 hogares. Luego:
= Var (XA) = - = = 12.00 y -P = Var (XB) = - = = 8.33
a ^ B n
300 B 300
60
—
4.51. Luego:
XA - XB ^ N (MA - MB ,—X -X ) = N(15, 20.33) y Z
A B
Se pide:
a) P( XB > XA ) = P( XA < XB ) = P( XA - XB
< 0) =
Interpretación.- en el 0.04% de las (ó en 4 de cada 10000) muestras de 300 hogares de cada ciudad, el gasto
medio mensual en arbitrios en la ciudad B será mayor que en la ciudad A.
Interpretación.- en el 1.32% de las (ó en 132 de cada 10000) muestras de 300 hogares de cada ciudad, el gasto
medio mensual en arbitrios en la ciudad A será al menos S/. 25 más que el gasto medio mensual en arbitrios en
la ciudad
B.
11. Dos fábricas A y B productoras de bombillas afirman que el promedio de duración de ellas es de 1980 y 1950
horas, respectivamente, con desviaciones típicas de 90 y 100 horas. Si se seleccionan 100 bombillas al azar
de cada fábrica, calcule e interprete la probabilidad de que:
a) Las bombillas B tengan una duración media menor de 1930 horas.
b) Las bombillas B tengan una duración media mayor que la duración media de las bombillas A.
P f ( Xa - Xb -15) < 0-15 'I
4.51 4.51 )
P(Z < -3.33) = 4 (-3.33) = 0.00043 Rpta.
b) P(Xa - Xb > 25) = 1 - P (Xa - Xb < 25) = 1 - P
XA - XB -15 < 25 -15 ' v 4.51 4.51 )
1 - P(Z < 2.22) = 1 - 4 (2.22) = 1 - 0.98679 = 0.01321 Rpta.
61
Solución
Los datos del problema son: pA = 1980 horas, OA = 90 horas y nA = 100 bombillas.
PB = 1950 horas, OB = 100 horas y nB = 100 bombillas. Luego:
_ _2 _ 2 a\ =Var(XA) = a = (90)2 / 100 = 81 y a\ =Var(XB) = a = (100)2 / 100 =
A nA B nB
100
a) XB ^ N(p al ) = N(1950, 81) y Z = (Xb -1950) ^ n(0, 1). Se pide:
B 9
- C X -1950 1930-1950^
P( —b < 1930) = P —B ------------------------------------< -------------------- = P(Z < -2.22) =
v9 9
_ ---------- > N
n
í
Q,
PQ
n
= N(0.60; 0.0012) y
Z _ q—0.60 ~ 0, 1). Se pide calcular límites simétricos.
0.0346
Sean 0.60 - E y 0.60 + E los límites simétricos alrededor de la proporción verdadera Q = 0.60, dentro de los cuales
estará el 95 % de las proporciones muestrales de mujeres q. Entonces:
0.95 = P(0.60 - E < q < 0.60 + E) = P(
-E
0.0346
<Z<
E
0.0346
)=
=4
E
0.0346
-4
-E
0.0346
_ 24
E
0.0346
E ' 0.0346,
_ 0.975,
67
E
= Z0 975 = 1.96 ^ E = 1.96(0.0346) = 0.068. Luego los límites serán:
0.0346
0.60 - E = 0.60 - 0.068 = 0.532 y 0.60 + 0.068 = 0.668. Es decir:
0.95 = P(0.532 < q < 0.668) Rpta.
Interpretación.- en el 95% de las (ó en 9500 de cada 10000) muestras de 200 clientes de las tiendas Saga, el
porcentaje de clientes mujeres está entre 53.2% y 66.8% alrededor de la proporción verdadera Q = 0.60.
17. En Lima el 60% de los hogares consume mantequilla. Si se toma una muestra aleatoria de 1000 hogares.
Calcule e interprete:
a) La probabilidad que menos del 57% de los hogares consuma mantequilla.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de hogares que consume mantequilla,
estará el 99% de las proporciones muestrales.
Solución
Los datos del problema son: P = 0.60 = proporción de hogares que consume mantequilla, Q = 0.40 y n = 1000
hogares.
Asumiendo un número muy grande de hogares en Lima, la distribución de la proporción muestral de hogares que
consume mantequilla p es:
X
nn
p= = ------ > N P,— I = N(0.60; 0.00024) y
n
7 P—P P—060 p — 0.60 , . .
Z = . ------------------- = - = — ----------- ~ N(0, 1). Se pide calcular:
íPQ V0Q155 0.0155 V ' F
n
í
a) P (p < 0.57 ) = P
P — 0.60 ^ 0.57 — 0.601 =
v 0.0155 0.0155 )
= P(Z < - 1.94) = 4 (-1.94) = 0.02619 Rpta.
Interpretación.- en el 2.62 % de las (ó en 262 de cada 10000) muestras de 1000 hogares, menos del 57% de los
hogares consume mantequilla.
b) Sean 0.60 - E y 0.60 + E los límites simétricos alrededor de la proporción verdadera P = 0.60, dentro de los
cuales cae el 99 % de las proporciones muestrales de hogares que consume mantequilla p. Entonces:
68
0.995
E
^ = Z0995 = 2.575 ^ E = 2.575(0.0155) = 0.04. Luego los límites serán:
0.60 - E = 0.60 - 0.04 = 0.56 y 0.60 + 0.04 = 0.64. Es decir:
Interpretación.- en el 99% de las (ó en 9900 de cada 10000) muestras de 1000 hogares de Lima, el porcentaje de
hogares que consume mantequilla está entre 56% y 4% alrededor de la proporción verdadera P = 0.60.
18. Dos empresas producen cierto artículo, la empresa A produce por término medio 20% de defectuosos,
mientras que la empresa B produce un 30% de defectuosos. Si se extrae una muestra aleatoria de 300 y 150
artículos respectivamente, calcule e interprete la probabilidad de que el porcentaje de artículos defectuosos
producidos por la empresa B difiere de los defectuosos producidos por la empresa A en 2% o menos.
Los datos del problema son:
PA = 0.20 = proporción de artículos defectuosos producidos por la empresa A.
QA = 0.80 = proporción de artículos buenos producidos por la empresa A.
PB = 0.30 = proporción de artículos defectuosos producidos por la empresa B.
QB = 0.70 = proporción de artículos buenos producidos por la empresa B. n A = 300 y nB = 150 artículos.
Considerando que ambas empresas producen gran número de artículos y que las correspondientes fracciones de
muestreo son menores al 5% (f = n / N < 0.05) se tiene que:
0.99 = P(0.56 < p < 0.64)
Rpta.
Solución
Pb - Pa ~ N(Pb - Pa ; — _pA )
Con media: ¡J.n — p = PB - PA = 0.30 - 0.20 = 0.10
' pA pE
T * 2
Y varianza: a„
PAQA , PEQE _ (0 2)(0.8) | (0.3)(0.7)
0.0019. Luego:
n 300 150
69
pB - pA ~ N(0.10 ; 0.0019) y Z = PB PA (PB PA ) = PB PA 010 ~ N(0 ,
PP ( ) 0.044 (
' a.-pa
1)
Se pide calcular:
í
P (pb - pa < 0.02) = P
pB -pA -0.10^0.02-0.10^ =
0.044 0.044 )
= PZ < -1.82) = ^ (-1.82) = 0.03438 Rpta.
Interpretación.- en el 3.44% de las (ó en 344 de cada 10000) comparaciones, para muestras de 300 artículos de
la empresa A y 150 de la empresa B, el porcentaje de artículos defectuosos producidos por la empresa B difiere
de los defectuosos producidos por la empresa A en 2% o menos.
19. En una ciudad se sabe que la preferencia de las mujeres por un diario es del 20% y para los hombres de un
25%. Si se toma una muestra aleatoria de 200 mujeres y 100 hombres, calcule e interprete la probabilidad de
que el porcentaje de mujeres que prefiere el diario difiera del porcentaje de hombres que lo prefiere en 8% o
más.
Solución
Los datos del problema son:
PM = 0.20 = proporción de mujeres que prefiere el diario.
QM = 0.80 = proporción de mujeres que no prefiere el diario.
PH = 0.25 = proporción de hombres que prefiere el diario.
QH = 0.75 = proporción de hombres que prefiere el diario. nM = 200 mujeres y nH = 100 hombres.
Considerando que el número de mujeres y hombres en la ciudad es grande y que las correspondientes fracciones
de muestreo son menores al 5% (f = n / N < 0.05) se tiene que:
P
M - ph ~ N(PM - PH ; alM- )
Con media: p = PM - PH = 0.20 - 0.25 = -0.05
Pa - Pb T2
PM - PH n t, nu 200 100
2 _PmQm+_ PHQH _ (0.2)(0.8) , (0.25)(0.75)
Y varianza: a2 „ = 7 + v 7 = 0.0027. Luego:
nM nH
70
pM - pH ~ N(-0.05 ; 0.0027) y Z = PM PH (-M -H ) = PM PH + 0 05 ~ N(0 ,
ap -p 0.052
M H
1)
Se pide calcular:
P (pm - ph > 0.08) = - f PM - pH + 0 05 > 0^08+-0.051 = P(Z > 2.50) =
^ 0.052 0.052 )
= 1 - ^ (2.50) = 1 - 0.99379 = 0.00621 Rpta.
Interpretación.- en el 0.62% de las (ó en 62 de cada 10000) muestras de 200 mujeres y 100 hombres, el porcentaje
de mujeres que prefiere el diario difiere del porcentaje de hombres que lo prefiere en 8% o más.
20. Considere que los niveles de preferencia de un determinado artículo en la ciudad A es de un 30% de hogares
y en la ciudad B de un 35%; si se seleccionan muestras aleatorias de 250 hogares de la ciudad A y 150
hogares de la B, calcule e interprete la probabilidad de que el % de hogares que prefiere el artículo en la
ciudad A difiere de los que lo prefieren en la ciudad B en 7% o más.
Solución
Los datos del problema son:
PA = 0.30 = proporción de hogares que prefiere el artículo en la ciudad A.
QA = 0.70 = proporción de hogares que no prefiere el artículo en la ciudad A.
PB = 0.35 = proporción de hogares que prefiere el artículo en la ciudad B.
QB = 0.65 = proporción de hogares que no prefiere el artículo en la ciudad B. n A = 250 y nB = 150 hogares.
Considerando que en ambas ciudades hay un gran número de hogares y que las correspondientes fracciones de
muestreo son menores al 5% (f = n / N < 0.05) se tiene que:
pA - pb ~ N(PA - pb ; o* - „„ )
Con media: ^ = PA - PB = 0.30 - 0.35 = -0.05
Pa - Pb T2
PA - PB n nD 250 150
2 _-AQA^_-BQB_ (0.3)(0.7) , (0.35X0.65)
Y varianza: <rn n = A + B =—: ------ : ------ 1—: -------- : ------- = 0.0024. Luego:
Pi - P° nrn
i n
lA nB
71
pA - pB ~ N(-0.05 ; 0.0024) y Z = PA PB (P PB ) = PA PB + 0 05 ~ N(0 .
PP() ' —PA—PB 0049 (
1)
Se pide calcular:
P (pa - pb > 0.07) = Pí PA — PB + 0 05 > 0 07 + 0 051 = p(z > 2.45) = l 0.049 0.049 J
= 1 - 4 (2.45) = 1 - 0.99286 = 0.00714 Rpta.
Interpretación.- en el 0.71% de las (ó en 71 de cada 10000) muestras de 250 hogares de la ciudad A y 150 hogares
de la ciudad B, el % de hogares que prefiere el artículo en la ciudad A difiere de los que lo prefieren en la ciudad
B en 7% o más.
72
2.8 EJERCICIOS PRPUESTOS
1. Si se toma una muestra aleatoria de tamaño n, de una población X con distribución geométrica, con parámetro
p, hallar la función de probabilidad conjunta (o de verosimilitud) para dicha muestra.
2. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución binomial negativa, con parámetros ry p, hallar la función de
probabilidad conjunta (o de verosimilitud) para dicha muestra.
3. Si se toma una muestra aleatoria de tamaño n, de una población X con
distribución exponencial, con parámetro X, hallar la función de probabilidad conjunta (o de verosimilitud) para dicha
muestra.
4. Las botellas de la bebida “Rica Kola” familiar tienen un contenido medio de 2.5 litros y una desviación estándar
de 0.1 litros. Si se toma una muestra aleatoria de 36 botellas, Calcule e interprete la probabilidad que:
a) Las botellas tengan una media de llenado entre 2.46 y 2.53 litros.
b) ¿dentro de qué límites simétricos caerá el 99 % de las medias muestrales alrededor de la media poblacional?
5. En Lima el precio promedio al consumidor del kilo de mango es p = S/. 2.20 con una desviación estándar o =
S/. 0.20. Si se selecciona una muestra aleatoria de 100 consumidores de mango, calcule e interprete la
probabilidad:
a) que el precio medio muestral sea mayor a S/. 2.25 el kilo.
b) ¿Dentro de que límites simétricos caerá el 95% de las medias muestrales alrededor de la media poblacional?
6. Las cajas con mango tienen un peso medio de 20 Kg. y una desviación estándar de 0.75 Kg. Si se cargan 400
cajas al azar en un camión, calcule e interprete la probabilidad de que:
a) El peso total de las cajas supere la capacidad máxima del camión que es de 8,040 Kg.
b) El peso medio de las cajas sea menor a 19.92 Kg.
c) ¿Dentro de que límites simétricos alrededor de la media poblacional caerá el 95% de las medias muestrales?
73
7. En una gran ciudad el promedio de empleados para establecimientos pequeños es de 10 y la desviación
estándar de 5 empleados. Para una muestra aleatoria de 36 establecimientos pequeños extraídos sin
reemplazo, calcule e interprete:
a) La probabilidad que el promedio muestral de empleados sea menor que 8.
b) ¿Dentro de que límites simétricos del promedio poblacional caerá el 95% de las medias muestrales de
empleados por establecimientos pequeños?
8. Una empresa eléctrica fabrica focos cuya duración tiene distribución normal con media de 1500 horas y
desviación estándar de 50 horas. En una muestra aleatoria de 16 focos, calcule e interprete la probabilidad
que:
a) La duración promedio de los focos menor de 1475 horas.
b) ¿Dentro de que límites simétricos de la duración media poblacional caerá el
95% de las duraciones medias muestrales?
9. Dos fábricas A y B que embolsan café, afirman que el promedio en las bolsas es de 495 y 490 gramos,
respectivamente, con desviaciones típicas de 5 y 6 gramos. Si se seleccionan 36 bolsas al azar de cada
fábrica, calcule e interprete la probabilidad de que:
a) El contenido medio de las bolsas A sea mayor de 497 gramos.
b) El contenido medio de las bolsas A sea menor que el contenido medio de las bolsas B.
10. Uno de los principales fabricantes de tv compra cables a dos compañías. Los cables de la compañía A tienen
una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B tienen una
vida media de 6.7 años con una desviación estándar de 0.7 años. Si se toman m.a. de 34 cabless de A y 40
de B, calcule e interprete la probabilidad de que la vida media de los cables A sea
de al menos un año más que la vida media de los B.
11. En una empresa de gaseosas la producción media de los varones es de 52 lts. Con una desviación estándar
de 7 lts. y la producción media de las mujeres es de 48 lts. con una desviación estándar de 5 lts. Si se toma
una muestra aleatoria de 40 trabajadores hombres y 40 mujeres. Calcule e interprete la probabilidad que la
producción media de los varones resulte menor que la producción media de las mujeres.
74
12. En una universidad la edad promedio de los alumnos del turno de la mañana es de 22 años con una desviación
estándar de 3 años, mientras que los del turno de la noche tienen una edad media de 28 años con una
desviación estándar de 5 años. Si se toma una muestra aleatoria de 50 alumnos de cada turno, calcule e
interprete la probabilidad de que la edad promedio de los alumnos de la mañana es superior a la edad media
de los de la noche.
13. El 60% de los ciudadanos esta de acuerdo con la gestión presidencial. Si se toma una muestra aleatoria de
500 ciudadanos, calcule e interprete:
a) La probabilidad de que más del 65% esté de acuerdo con la gestión presidencial.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de ciudadanos esta de acuerdo con la
gestión presidencial, esta el 95% de las proporciones muestrales.
14. En Lima el 60% de los hogares usa gas como combustible para cocinar. Si se toma una muestra aleatoria de
1000 hogares. Calcule e interprete:
a) La probabilidad que más del 65% de los hogares use gas.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de hogares que usa gas, estará el 99%
de las proporciones muestrales.
15. En Lima el 30% de los hogares compra periódicos y/o revistas. Si se toma una muestra aleatoria de 1000
hogares. Calcule e interprete:
a) La probabilidad de que más del 34% de hogares compre periódicos y/o revistas.
b) ¿Dentro de que límites simétricos alrededor de la proporción verdadera caerá el 99.73% de las proporciones
muestrales de hogares que compra periódicos y/o revistas?
16. El 70% de empleados públicos es casado. Si se toma una muestra aleatoria de 64 empleados, calcule e
interprete:
a) La probabilidad de que más del 85% esté casado.
b) Dentro de que límites simétricos, alrededor de la verdadera proporción de empleados públicos casados, estará
el 95% de las proporciones muestrales.
75
17. El 70 % de las compras con tarjeta de crédito en tiendas Ripley son superiores a $200. Si se seleccionan
muestras aleatorias de 100 compras; Calcule e interprete:
a) La probabilidad que las muestras tengan entre 65% y 80 % de compras mayores que $200?
b) ¿Entre que límites simétricos del porcentaje de compras mayores de $200 en la población caerá el 99% de los
porcentajes muestrales?
18. Dos empresas producen equipos de sonido, la empresa A produce por término medio 10% de defectuosos,
mientras que la empresa B produce un 20%. Si se extrae una muestra aleatoria de 400 y 200 unidades
respectivamente, calcule e interprete la probabilidad de que el porcentaje de equipos defectuosos producidos
por la empresa A difiere de los defectuosos producidos por la empresa B en 7% o menos.
19. En un estudio pasado se determinó que el porcentaje de hombres que está de desacuerdo con la construcción
de un gimnasio era del 12%, mientras que el porcentaje de mujeres en desacuerdo era del 10%. Si se toma
una muestra aleatoria de 100 hombres y 100 mujeres, calcule e interprete la probabilidad de que el porcentaje
de hombres en desacuerdo sea al menos 3% mayor que el de las mujeres.
20. En cierta ciudad se sabe que el 25% de los hombres y el 30% de las mujeres están familiarizados con un
producto. Si se toma una muestra aleatoria de 200 hombres y 200 mujeres, calcule e interprete la probabilidad
de que el porcentaje de hombres familiarizados con el producto sea mayor que el de mujeres.
76
Capítulo 3. DISTRIBUCIONES ESPECIALES
“El informar mal, utilizando material estadístico, podría llamarse manipulación estadística, y resumiéndolo en una
sola palabra (aunque no sea muy buena), estadisticulación”
Darrell Huff
CONTENIDO
y representada en la figura 2.
a
Flg, 2
Note que p[x > x2a J = 1 — a
Puesto que existe una distribución chi-cuadrado diferente para cada valor de r, resulta impráctico proporcionar
tablas de áreas completas. En lugar de esto, la tabla 2 de la distribución acumulativa chi-cuadrado, presenta un
resumen de la información más esencial acerca de la distribución. En el encabezado de la columna de la izquierda,
dice grados de libertad (G.L.) y cada fila de esta tabla corresponde a una distribución chi-cuadrado particular, con
sus probabilidades (p) en la parte superior de esta tabla.
En la hoja de cálculo Excel se determina las probabilidades y los valores de chi-cuadrado así:
a) DISTR.CHI: devuelve la probabilidad de una variable aleatoria continua siguiendo una distribución chi
cuadrado de una sola cola. La distribución chi cuadrado está asociada con la prueba chi cuadrado.
Sintaxis: pISTR.CHI(x;grados de libertad)
X es el valor al que desea evaluar la distribución.
Grados_de_libertad es el número de grados de libertad = r.
Observaciones :
• Si uno de los argumentos no es numérico, DISTR.CHI devuelve el valor de error #¡VALOR!.
• Si el argumento x es negativo, DISTR.CHI devuelve el valor de error #¡NUM!.
• Si el argumento grados_de_libertad no es un entero, se trunca.
• Si el argumento grados_de_libertad < 1 o grados_de_libertad > 10 A10, DISTR.CHI devuelve el valor de error
#¡NUM!
• DISTR.CHI se calcula como DISTR.CHI = P(X>x), donde X es una variable aleatoria chi cuadrado. El cálculo es
el complemento de la mayoría de tablas.
Ejemplo:
DISTR.CHI(18,307;10) es igual a 0,050001
80
b) PRUEBA.CHI.INV: devuelve para una probabilidad dada, de una sola cola, el valor x de la variable aleatoria
siguiendo una distribución chi cuadrado.
Si el argumento probabilidad = p = DISTR.CHI(x;...), entonces PRUEBA.CHI.INV(probabilidad,...) = x.
Sintaxis: PRUEBA.CHI.INV(probabilidad;grados de libertad)
Probabilidad es una probabilidad asociada con la distribución chi cuadrado.
Grados_de_libertad es el número de grados de libertad.
Observaciones
• Si uno de los argumentos no es numérico, PRUEBA.CHI.INV devuelve el valor de error #¡VALOR!.
• Si el argumento probabilidad < 0 o probabilidad > 1,
PRUEBA.CHI.INV devuelve el valor de error #¡NUM!.
• Si el argumento grados_de_libertad no es un entero, se trunca.
• Si el argumento grados_de_libertad < 1 o grados_de_libertad > 10 A10, PRUEBA.CHI.INV devuelve el valor de
error #¡NUM!.
PRUEBA.CHI.INV usa una técnica iterativa para calcular la función. Dado un valor de probabilidad,
PRUEBA.CHI.INV reitera hasta que el resultado tenga una exactitud de ± 3x10 A-7. Si PRUEBA.CHI.INV no
converge después de 100 iteraciones, la función devuelve el valor de error #N/A.
Ejemplo:
PRUEBA.CHI.INV(0,05;10) es igual a 18,3070290368475 Ejemplo 1.-
Si X ~ Xl. Usando la tabla 2, de Ji-cuadrado, hallar el x2a correspondiente para:
81
a) P(X < x2a ) = 0.05, si r = 15 g.l.
Se busca en la tabla 2, 15 g.l. en el margen izquierdo y se intercepta con la probabilidad 0.05 de las columnas y
se obtiene x2a = x205 15 = 7.26 Rpta.
b) P(X < x2a ) = 0.99, si r = 21 g.l.
Procediendo como en a) se obtiene entonces x2a = xl99 21 = 38.9 Rpta. Ejemplo 2.-
Si X es una variable aleatoria x20. Calcular:
a) P[X < 10.9]; b) P[ X > 31.4 ]; c) P[ 10.9 < X < 31.4 ]
Solución
Para obtener las probabilidades solicitadas, en la fila de 20 g.l de la tabla 2 se buscan los valores dados para X y
se leen las probabilidades (acumuladas menores que) correspondientes en el encabezamiento de las columnas
así:
a) P[X < 10.9] = P[X< x02.05J = 0.05 Rpta.
b) P[ X > 31.4 ] =1 — P[X <31.4J = 1 — P[X < x0295J = 1 - 0.95 = 0. 05
Rpta.
c) P[ 10.9 < X < 31.4 ] = P[X < 31.4 ] - P[X < 10.9 ] =
= p[x < x¿95 J— p[x < x02M J
= 0.95 - 0.01 = 0.94 Rpta.
Ejemplo 3.-
Si X es X123. Hallar P(X > 20).
Solución
P(X > 20) = 1 - P(X < 20) = 1 - p
Como en la tabla 2, de chi cuadrado, para 13 grados de libertad, no se encuentra el valor 20, pero éste se
encuentra entre los valores 19.8 (con probabilidad 0.90) y 22.4 (con probabilidad 0.95) para hallar p interpolamos
de la siguiente manera:
82
P
19.8 0.90
22.4 -19.8 20 -19.8
20 p ^ = ---------------
0.95 - 0.90 P - 0.90
22.4 0.95
^ 52 = —02— ^ 52 P - 46.8 =0.2 ^ P = 0.9038
P - 0.90
P(X > 20) = 1 - 0.9038 = 0.0962 Rpta.
Ejemplo 4.-
Si X es una variable aleatoria con distribución x2 5. Hallar a y b tal que:
P[a < X < b] = 0.95 y P[ X < a ] = 0.025
Solución
Para r = 25 g.l., a= x0.025,25 = 13 1 Rpta.
0.95 = P[a < X < b] = P[X < b] - P[X < a] = P[X < b] - 0.025
Luego: P[X < b] = 0.975 . b = x2.975, 25 = 40.6 Rpta.
Veamos a continuación algunos teoremas importantes relacionados con la distribución chi-cuadrado y de mucha
importancia para la construcción de intervalos de confianza y pruebas de hipótesis.
Teorema 1- Si la variable aleatoria X ~ N(p, a2), entonces la variable aleatoria, Y = Z2 =
(X -p)2/a2 es una x2.
S Xi 2 /- \r
Sabemos que X = — --------------- ~ N (p , —) y por lo tanto Z = - --------------------- —— es
n n a
N(0,1) entonces, Z2 = ^X—P12— ~ x1 .
a2
Ejemplo 5.-
Si X ~ N(12, 5). Calcule e interprete P[13.55 < (X - 12)2 < 19.20 ]
83
Solución
Como X ~ N (12, 5) entonces la variable aleatoria Y =
(X -12 )2
Luego:
P[13.55 < (X - 12)2 < 19.20 ] = p
13.55 ^ (X-12)2 ^ 19.20' 5 “ 5 < 5
= P[2.71 < < 3.84 ] = P[< 3.84 ] - P[< 2.71 ] =
= 0.95 - 0.90 = 0.04 Rpta.
Interpretación: el 4% de las desviaciones al cuadrado, de los valores observados de X ~ N (12, 5) con respecto a
su media 12, estarán comprendidos entre 13.55 y 19.20.
5
Teorema 2.- (Propiedad Reproductiva de la Chi-Cuadrado)
Sean X2,X2,...,X2 variables aleatoria chi-cuadrados dependientes con
grados de libertad r1, r2, ... , rp respectivamente, entonces la variable aleatoria:
X 2 = X2 + X22 +... + X2
p
Sigue una distribución chi-cuadrado con grado de libertad igual a r = I r
i=1
Teorema 3.- Sea X1, X2, ..., Xn, una muestra aleatoria de una variable aleatoria X ~ N (p, j2). Entonces, la variable
aleatoria:
n
Y = I(xi -P)2/j2 ~ x'‘n
i=1
Distribución de la Varianza Muestral
Teorema 4.- Sea X1, X2, ... , Xn una muestra aleatoria de tamaño n de una población normal con media p y varianza
j2. Sea X y S2 la media muestral y varianza muestral respectivamente, entonces:
a) Las variables aleatorias X y S2 son independientes.
n
I (x, - X )2
1
(n -1)^ 2
b) La función de la varianza muestral x2 =- -------------------- — = — ---------------- x^j
j2 j2
84
Demostración.- Demostraremos sólo la parte b)
n
É (x, —
Sabemos que la variable aleatoria — ------------------------------- tiene una distribución x2n,
a2
puesto que cada término (xi - ¿)/a son variables aleatorias normales estándar e independientes (teorema 3).
Consideremos:
É(X, —ü = ÉKX — X )+(X—¿)J2
i=1 i=1
n n n
= É (X, — X )2 + É (X — ü) + 2(X — U)É(X, — X)
i=1 i=1 i=1
n
= É(X, — X )2 + n(X —üf
i=1
Dividiendo entre a1 y ordenando tenemos:
n n
É (X —ü)1 É (X—X12 (x-ü> (n 1^ (X~üf
= + = z +
a2 a2 a2/n a2 a2/n
Dado que (X - ü)2/(a2/n) tiene una distribución X2. Además, como X y S2
n
son independientes, y É(X, Ü a2 tiene una distribución x2n, por la
,=1
propiedad aditiva de la chi-cuadrado, concluimos que la distribución de
(n — 1)S 2 ~
-—r— es Xn—i
Ejemplo 6.-
Suponga que X1, X2, ....................... ,X10 es una muestra aleatoria de una variable
aleatoria normal estándar. Calcule e interprete:
(^
a) P 2.56 <É X2 < 18.3 y b) P(S2 < 1.88)
v 1=10 y
Solución
22
a) Como las v.a Xi ~ N(0, 1), entonces X i ~ Xx y por lo tanto
10
É X,2 ~ X2
85
tiene una distribución t, con r grados de libertad, y su función de densidad de probabilidades está dada por:
3 http://es.wikipedia.org/wiki/William Sealy Gosset; revisado en agosto de 2012.
86
Notación: decir que la variable aleatoria T, tiene distribución t con r grados de libertad, se denota como T ~ tr.
Media y Varianza:
La media y la varianza de la v. a. T con r grados de libertad son:
E(T) = p T = 0 ,r>1
r
Var(T) r>2
= aT = , r - 2
Observe que la distribución de la variable aleatoria T, queda completamente determinada sólo por el parámetro r.
Por lo tanto, hay una distribución t correspondiente a cada grado de libertad. En la figura 3 se presenta la función
de densidad de la variable aleatoria T, para diferentes grados de libertad. En la misma figura se da, la gráfica de
la normal estándar.
N«M)
Flg. 3.
La distribución t es simétrica alrededor de la media p T = 0 y varía de menos infinito a más infinito. Es muy similar
a la distribución normal estándar, ya que ambas varían de - ro a ro, son simétricas y centradas alrededor de p =
0, es decir su media es cero, pero la distribución t tiene mayor dispersión que la
87
distribución normal estándar, esto se observa de la varianza a r =
r-2
que
se aproxima a 1 cuando el grado de libertad r es grande (r ^ <x>).
Por lo tanto, la distribución t, se aproxima a la distribución normal estándar cuando el grado de libertad r es
suficientemente grande. En la práctica se trata a la distribución t, como N(0,1) cuando r > 30.
Función de Distribución Acumulativa de Probabilidades.- El cálculo de probabilidades para la v.a. t, se efectúa
utilizando los valores de la función de distribución acumulativa menor o igual que, los que han sido reproducidos
en la Tabla 3 del Anexo, utilizando la hoja de cálculo Excel.
Así tenemos que, la probabilidad que la variable aleatoria T con distribución t r (con 1 < r < 30) sea menor o igual
a un valor constante ta, representada por:
a
0<a<1
Está dada por:
í
a
P[T < ta] = j-V(<)d< = J
r
Í
rnr
1+-
r+1
~Y
dt = a
cuya representación gráfica la podemos ver en la fig. 4.
• P[ T < -a ] = 1 - P[ T < a ]
Ejemplo 8.-
Sea T una variable aleatoria que tiene una distribución t con varianza a2 = 5.
Calcular: P[-2.015 < T < 2.571]
Solución
2r5
Como aT = --------------- = —, entonces r = 5 y T ~ t5 . Luego:
r-2 3
P [- 2.015 < T < 2.571] = P[T < 2. 571] - P[T < - 2. 015 ] =
= P[T < 2. 571] - [1 - P[T < 2. 015 ] =
Buscando las probabilidades en la tabla 3 y reemplazando se tiene:
= P [T < t0.975 ] - {1 - P[T < t0.95 ]} =
= 0.975 - [ 1 - 0.95 ] =
= 0.975 - 0.05 = 0.925 Rpta.
Ejemplo 9.-
Sea T una variable aleatoria que tiene una distribución t con 23 grados de libertad. Hallar el valor de a tal que: P[
| T | < a ] = 0.95
91
Solución
0.95 = P [ | T | < a ] = P[-a < T < a ] =
= P[T < a] - P[T < - a]
= P[ T < a ] - [ 1 - P[T < a ]
=2P[T<a]-1
^ P[ T < a ] = 0.975 ^ En la tabla 3, a = t0.975 , 23 = 2.069 Rpta.
3.3 DISTRIBUCIÓN MUESTRAL DE LA MEDIA (n < 30)
En el acápite 2.1 vimos la distribución muestral para la media, con muestras grandes (n > 30), la misma que se
aproximaba a la distribución normal. Sin embargo, cuando las muestra son pequeñas (n < 30) la aproximación es
hacia la distribución t de student, tal como veremos a continuación.
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con distribución N(p, j2), en
acápites anteriores hemos visto que:
X-p
1. La variable aleatoria Z= ---------------------------------- ~ N(0,1).
j/V n
2. La variable aleatoria x2 = ——1)S— ~ x2n-1 (teorema 4).
j
3. X y S2 son variables aleatorias independientes (teorema 4).
Usando la definición de la variable aleatoria T, tenemos que:
Ejemplo 9.-
Si Xy S2 son la media y la varianza de una muestra aleatoria de tamaño 17 de una distribución N(p, o ). Hallar la
constante C tal que:
92
-
-C<
4(X -M)
S
<C
= 0.95
Solución
(X - n (X “^N17
T7 1 K1 \ T f+
En el problema propuesto, T = --------------------------------------------------------- t16. Entonces:
S S
0.95 = -
-C<
4(X -M)
S
<C
=-
Cfn < (x-m) 17 <^/17~ 4 < S < 4
=-
=-
4
< t16 <
CV17
t16 <
CV17 4
4
- {1 --
=-
t16 <
t16 <
CV17 4
4
--
t16 < -
CV 17
4
0.95 = 2 -
t16 <
C, 17
4
-
t\6 <
4
= 0.975
C/17
4
= t = 2 12
2.12
'16,0.975
C =2.0567
Rpta.
3.4 DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS MUESTRALES, CON VARIANZAS DESCONOCIDAS
PERO IGUALES
Si se toma dos muestras aleatorias independientes de dos poblaciones normales X e Y, con varianzas
desconocidas pero iguales a2X = a2 Y = a2 así:
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con distribución N(Mx, a2). Sea
también Y1, Y2, ..., Ym una muestra aleatoria de tamaño m de una variable aleatoria Y, con distribución N(p Y, a2).
De acuerdo a lo estudiado en acápites anteriores se tiene que:
1. La distribución de la variable aleatoria
Z = (x-Y)-(mx MY) = (x-Y)-(mx MY) ~ n (o 1 )
í + a2 V n m
2. La variable aleatoria:
U=
(n -
I)S
S (X, - X >
X _ i=1
a
a
x.
93
}
1
U es independiente de X e Y.
3. La variable aleatoria:
V Jm - 1)S? ^(Y Y) ~ x2
V es independiente de X, Y y S^.
4. Por la propiedad reproductiva de la distribución chi-cuadrado, la v.a. :
U + V = (n 1)SX + (m 1)Sy ~ x2 2
^ ^ n +m —2
Con los resultados encontrados en (1) y (4); siendo las variables Z normal estándar y U + V chi-cuadrado e
independientes; usando la definición de la variable aleatoria T se obtiene la distribución de la diferencia de medias
muestrales X - Y siguiente:
(X — Y) — (PX — tl> )
a]l ^
Z
z \ n m
T=
U+V
(n — 1)S2 + (m — 1)S2
la2
<n + m — 2 \ n + m— 2
Simplificando:
(X — Y )—(px — pY )
T= t
■ l(n — 1)SX +(m — 1)S2 fT^T ~ n+ m - 2 Vn+m—2 \¡n m
tiene distribución t con n + m - 2 grados de libertad. Observe que esta variable aleatoria depende de las medias y
las varianzas muestrales.
3.5 DISTRIBUCIÓN F DE SNEDECOR
Esta distribución fue descubierta por Fisher, de allí la denominación F y redescubierta por Snedecor. Es muy
utilizada para comparar las varianzas de dos variables aleatorias independientes distribuidas normalmente.
94
Definición.- Sea U y V dos variables aleatorias independientes que tienen distribuciones chi-cuadrado, con r1 y r2
grados de libertad, respectivamente.
U/r
Entonces, la variable aleatoria:
F=
tiene una distribución F con r 1 y r 2 grados de libertad y su función de densidad de probabilidades está dada por:
fF (x) =
r
x2
r
r
'2
2
(Xr1 + r2 ) 2
=0
en otros casos
La distribución F depende de los parámetros r 1 y r2 en ese orden. r1 = grados de libertad en el numerador, y r2 =
grados de libertad en el denominador.
En la figura 6 se muestra la función de densidad de probabilidades de la variable aleatoria F para tres pares
diferentes de grados de libertad.
Fig. 6
Las distribuciones F son una familia de distribuciones asimétricas hacia la derecha. Existe una distribución F
separada para cada par de valores de sus parámetros r 1 y r2.
r
1 1 '2
2
95
Notación: decir que la variable aleatoria F tiene distribución F con r 1 y r2 grados de libertad, se denota como F ~ F
r2.
Media y Varianza.-
La media y la varianza de la v. a. F con r1 y r2 grados de libertad son:
MF = e(f ) =
r2 - 2
r2 > 2
^ = Var(F)= y - , r2 > 4
r1 (r2 - 2)2(r2 - 4)’
r
2
Función de Distribución Acumulativa de Probabilidades
El cálculo de probabilidades para v.a. F, se efectúa utilizando la Tabla 4 de distribución acumulativa F, las mismas
que han sido elaboradas utilizando la función de distribución acumulativa de probabilidades que en la mayoría de
los casos son del tipo de acumulación menor o igual que.
La probabilidad que la variable aleatoria F ~ F sea menor o igual que una constante f a está dada por: P\F
< fa ] = f/a fF (x) dx = a
J0
Estas probabilidades se presentan en tablas de F. Como la distribución depende de los dos parámetros r1, y r2, se
necesita una tabla con tres entradas para tabular el valor de F que corresponde a diferentes probabilidades y
valores de r1 y r2.
Para valores de a < 0.50 , se obtiene usando la siguiente igualdad
a=P
< F„
=P
V/r
>
U / r1 f«,,„
=1-P
V / r2 1
^ < ---------------
P
V/r
<
U / r1
—1—a
(1)
1V/r
Pero, — =-------- 2 ~F „ tiene distribución F con r2 y r1 g.l.
r2 1
F U/r
P
V / r2 U / r
< f—a,
a,r2,r
=1—a
(2)
Igualando (1) y (2), se tiene que:
1
2
1
2
Ejemplo 10.-
Sea F una variable aleatoria que tiene una distribución F con r 1 y r2 grados de libertad. Hallar :
a) P[F > 15.0], con r1 = 7, r2 = 4
b) P[F < 3.69], con r1 = 5, r2 = 8
c) P[F < 0.0358 ], con r1 = 3, r2 = 6
d) Hallar los valores a y b tales que:
97
P[ F < b ] = 0.975 y P[a < F < b] = 0.95 . Con ri = 7, =5
Solución
Usando la tabla F:
a) P[F > 15.0 ] = 1 - P[F < 15.0 ] = 1 - P[F < f0.99, 7, 4 ] =1 - 0.99 = 0.01 Rpta.
b) P[F < 3.69 ] = P[F < f0.95,5, 8 ] = 0.95 Rpta.
1
c) P[F < 0.0358] = P
11
— > --------------
F 0.0358
=1-P
F
< 27.9
=1-P
0.99, 6, 3
= 1 - 0.99 = 0.01 Rpta.
d) P[F < b] = 0.975 ^ b = f0.975, 7, 5 = 6.85 Rpta.
0.95 = P[a < F < b] = P[F < b] - P[F < a] = 0.975 - P[F < a] ^ P[F < a] = 0.025
P[F < a] = P
r 1 11 \ 1 11
—> =1-P —<
_Fa_ _Fa_
P
11
—<
F
a
= 0.975.
= 0.025
1/F ~ F
5, 7
1
Luego: = f0975 5 7 = 5.29, de donde a = 0.189 Rpta.
a' ’ ’
3.6 DISTRIBUCIÓN DE LA RAZÓN DE DOS VARIANZAS MUESTRALES
Si se toman dos muestras aleatorias independiente de las poblaciones normales X e Y, encontraremos la
distribución de probabilidades para la razón de varianzas muestrales de la siguiente manera.
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n de una variable aleatoria X ~ N(pX,(r2x). Sea Y1, Y2, ..., Ym
una muestra aleatoria de tamaño m de una variable aleatoria Y con distribución N{^ Y,a^). Entonces, la variable
aleatoria,
98
„=(n—M g(X- X)2
a
X
a
X
x.
De modo similar, la variable aleatoria,
V=
a
a
x
m—1
Además, las dos variables aleatorias chi-cuadrado U y V son independientes por que X e Y son independientes.
Entonces, usando la definición de la variable aleatoria F, tenemos que la variable aleatoria:
2
99
3.7 EJERCICIOS RESUELTOS
2
1. Si X ~ X con 15 grados de libertad, hallar:
a) P(X > 27.5).
b) P(7.26 < X < 25.0).
c) P(X < 23.5).
d) Hallar a y b tal que P(X < a) = 0.025 y P(a < X < b) = 0.95.
Solución
Para obtener las probabilidades solicitadas, en la fila de 15 g.l de la tabla 2 se buscan los valores dados para X y
se leen las probabilidades (acumuladas menores que) correspondientes en el encabezamiento de las columnas
así:
a) P[X > 27.5] = 1 - P(X < 27.5) = 1- P[X <x¿„5] = 1 - 0.975 = 0.025 Rpta.
b) P[7.26 < X < 25.0] = P[X < 25.0 ] - P[X < 7.26] =
= P [ X < X095 ]-P [X < x„0.„5 ] =
= 0.95 - 0.05 = 0.90 Rpta.
Distribución chi-cuadrado con 15 g.l.
v 18 18 ,
0.05 = P
Luego: a = 9.81. Además: 0.95 = P
=P
X20 <
20a 18,
20S 20b
<-
18
18
=P
2 20b
X2
V ° < 18 y
20a
18
20b
18
= X20, 0.05 = 10.9.
X2 0 . 0 =31.4 .
Luego: b = 28.26. Entonces: 0.90 = P (9.81 < S < 28.26) Rpta. Interpretación.- en las muestras de tamaño 21, de
una población X N(u, 18 ), el 90% central de las varianzas muestrales (S ) se encuentra entre 9.81 y 28.26.
3. De una población X: N(u, 18), se extrae una muestra aleatoria de tamaño n = 21.
Calcule e interprete:
21
a) P [208.7 < ^ (X i - p)2 < 638.7]
102
b) P (9.77 < S2 < 30.78)
Solución
a) Se sabe que para muestras de una población normal se cumple que:
n
£ ( X -vf
-+xl ■■■ —
21
£( X -tf
^x21 .
a2 18
Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 18 y se construye una xh así:
21
P [208.7 < £ (X i - |i)2 < 638.7] = P
208.7
^8~
£( x-»y
<
i=1
18
<
638.17
18
= P [11.6 < X21 < 35.5] = P[x221 < 35.5] - P[x22 < 11.6] = 0.975 - 0.05 = 0.925.
Interpretación.- en el 92.5% de las muestras de tamaño 21, de una población X N(u, 18 ), las sumas de
desviaciones al cuadrado, de los valores observados con respecto a la media poblacional |i, se encuentran entre
208.7
y 638.7.
b) Se sabe que:
. (n -1)S2 v 2
a
^Xn-i entonces,
(21 -1)S2 20S2
18
18
^X20
Multiplicando en la probabilidad solicitada por 20/18 se tiene una xlo así:
P (9.77 < S2 < 30.78) = P
A20x9.77 20S2 20x30.78 A
18
<
18
<
18
= P[10.9 < x221 < 34.2] = P[x220 < 34.2] - P[x2 < 10.9] = 0.975 - 0.05 = 0.925.
Interpretación.- en el 92.5% de las muestras de tamaño 21, de una población X N(u, 18 ), las varianzas muestrales
(S ) se encuentra entre 9.77 y 30.78.
4. Suponga que el número de horas semanales que las amas de casa ven TV tiene distribución normal con una
varianza de 3. Al escoger una muestra de 17 amas de casa y registrar el número de horas a la semana que
ven TV, calcule e
103
interprete la probabilidad de que la varianza muestral de los tiempos obtenidos sea mayor que 5.4 (horas) .
Solución
Sean X = número de horas semanales que las amas de casa ven TV, n = 17 y o 2
= 3.
c , (n-1)S2 2 (17-1)S2 16S2 2
Se sabe que: --------------------- 2 --------> X -x entonces, r---------------------- = —: ---- >
n Xl6
a 3 3
Multiplicando en la probabilidad solicitada por 16/3 se tiene una yf 6 así:
P (S2 > 5.4) = 1 - P (S2 < 5.4) = 1 - -
f 16S2 16x5.4^
< ----------------------
v3 3 y
= 1 - P[X\6 < 28 8] = 1 - 0.975 = 0.025 Rpta.
Interpretación.- en el 92.5% de las muestras de 17 amas de casa, las varianzas muestrales (S ) del número de
horas semanales que ven TV es mayor que 5.4 (horas)2.
5. La duración de los transistores fabricados por una compañía tienen una media de 2000 horas y una desviación
típica de 60 horas. Se selecciona 10 transistores al azar, calcule e interprete la probabilidad que la desviación
típica muestral se encuentre entre 50 y 70 horas.
Solución
Sean X = duración de los transistores, p = 2000, o2 = (60)2 = 3600 y n = 10.
c , (n-1}S2 2 (10-1)S2 S2 2
Se sabe que: --------------- 7 -------- > y, entonces, ----------- — = ---------- >yQ
4 a2 -1 3600 400 X9
T
Resultado gráfico en Minitab
c) P(T < 1.53) = p Solución
Como en la tabla 3, T de student, para 18 grados de libertad, no se encuentra el valor 1.53, pero éste se encuentra
entre los valores 1.33 (con probabilidad 0.90) y 1.734 (con probabilidad 0.95) para hallar p interpolamos de la
siguiente manera:
Ta P
1.33 0.90
1.734 -1.33 1.53 -1.33
1.53 p ^ = ----------------
0.95 - 0.90 p - 0.90
1.734 0.95 ^ 8.08 = 02 ^ 8.08p-7.272 = 0.2 ^ p = 0.9248
p - 0.90
Luego: P(T < 1.53) = 0.9248 Rpta.
d) 0.95 = P(-t0 < T < te) = P(T18 < te ) - P(T18 < -te) =
= P(T18 < te ) - [1 - P(T18 < te)] = 2 P(T18 < te ) - 1 ^ P(T18 < te ) = 0.975 ^ to = T18, 0.975 = 2.101 Rpta.
Resultado gráfico en Minitab 108
T
9. Un inspector investiga las acusaciones contra la fábrica de ron “Pepito” porque no llena bien sus envases.
Una muestra de 25 botellas de ron indica una desviación típica S = 0.18 litros. Calcule e interprete la
probabilidad de que el promedio muestral difiera de su media poblacional p en menos de 0.085 litros. Solución
Datos: n = 25, S = 0.18 lts. Se pide hallar -(|X - — < 0.085)
24
Se sabe que: T = X—— ^ t ,, entonces: T = —X—= X—— ^ t.
S/4— 0.18/V25 0.036
Para obtener la probabilidad solicitada se divide dentro de la desigualdad por
0.036 y se construye una T24 así:
- (| X-—< 0.085) = -
X- —
0.036
<
0.085
0.036
= -( T41 < 2 361) =
= P(-2.131 < T24 < 2.131) = P(T24 < 2.131) - P(T24 < -2.131) =
= P(T24 < 2.131) - [1 - P(T24 < 2.131)] =
= 2 P(T24 < 2.131) - 1 = 2p - 1 _. (1)
Como en la tabla 3, T de student, para 24 grados de libertad, no está el valor 2.131, pero éste se encuentra entre
los valores 2.064 (con probabilidad 0.975) y
2.492 (con probabilidad 0.99) para hallar p interpolamos de la siguiente manera:
109
Ta P
2.064 0.975
2.492 - 2.064 2.131 - 2.064 0.067
2.131 p ^ ^ 28.53 =
0.990 - 0.975 p - 0.975 p -0.975
2.492 0.990 ^ 28.53p - 27.817 = 0.067 ^ p = 0.9774
Reemplazando p = 0.9774 en (1) se tiene que:
P(|X-u|< 0.085) = 2 (0.9774) - 1 = 0.9548 Rpta.
Interpretación.- en el 95.48% de las muestras de 25 botellas de ron “Pepito”, el promedio muestral difiere de su
media poblacional p en menos de 0.085 litros.
10. De una población X ~ N(10, 100) se extrae una muestra aleatoria de tamaño 10 y de una población Y ~ N(20,
40) se extrae una m.a. de tamaño 10. Determine el
valor de la constante a tal que: P (a Sy < X - 10) = 0.95. Donde X es la media muestral de las X y SY es la desviación
estándar muestral de las Y.
Solución
Para resolver el problema es necesario construir una distribución T de student. Con la muestra de tamaño 10 de
la población X, se tiene que: X ^N(10, 10). X-10
Entonces: Z = —-r= --------------------- >N(0,1).
VÍ0
(10 1)S2
Con la muestra de la población Y se tiene que: x2 = —^ Y ^ X9 Con los resultados anteriores construimos una
variable T así:
Z
T = . ------------------ se distribuye como una T con los grados de libertad de la chi-
Já
cuadrado. Reemplazando Z y la xl en la expresión anterior se obtiene:
X-10
T M ^
9S2 / 40 S7
9
110
Para hallar el valor de la constante a solicitada, la probabilidad dada se adecúa a la distribución t de student antes
construida, así:
0.95 = P(a SY < X - 10) = P (X - 10 > a Sy ) = 1 - P (X - 10 < a Sy )
^ 0.05 = P (X - 10 < a Sy) = P
'2(X-10) *2a'
V Sr
= P(T9 < 2a)
J
Luego: 2a = T9, 0 05 = - T9, 0.95 = -1.833 ^ a = -0.9165 Rpta.
11. Para analizar el tiempo de atención por clienta en las tiendas de pantalones
“Ricas y apretaditas”, se tomó una muestra aleatoria sin reemplazo de 25
22
atenciones con lo cual se obtiene S = 2.25 minutos . Calcule e interprete la probabilidad de que el tiempo promedio
muestral de atención a las clientas difiera de su media poblacional |i en menos de 0.57 minutos.
Solución
Datos: n = 25, S2 = 2.25 minutos2. Se pide hallar P (|X- — < 0.57^
24
Se sabe que: T = X — ^ tn_ 1, entonces: T = -X—— = X—— ^ t,
S/Vn 1.5/V25 0.3
Para obtener la probabilidad solicitada se divide dentro de la desigualdad por 0.3
y se construye una T24 así:
P (| X-—< 0.57 ) = P
X- —
0.3
<
0.57
0.3
= P(|Tm| < 1.9) =
= P(-1.9 < T24 < 1.9) = P(T24 < 1.9) - P(T24 < -1.9) =
= P(T24 < 1.9) - [1 - P(T24 < 1.9)] = 2 P(T24 < 1.9) - 1 = 2p - 1 _. (2)
Como en la tabla 3, T de student, para 24 grados de libertad, no tiene el valor 1.9, pero éste se encuentra entre
los valores 1.711 (con probabilidad 0.95) y
2.064 (con probabilidad 0.975) para hallar p interpolamos así:
la P
1.711 0.95
1.9 p
2.064 0.975 ^
2.064 -1.711 1.9 -1.711 0.189
----------------------------------------- = -------------------- ^ 14.12 = --------------
0.975 - 0.95 p - 0.95 p - 0.95
14.12p - 13.414 = 0.189 ^ p = 0.9634 111
Reemplazando p = 0.9634 en (2) se tiene que:
P (| X-^< 0.57) = 2 (0.9634) - 1 = 0.9268 Rpta.
Interpretación.- en el 92.68% de las muestras de 25 atenciones en las tiendas de pantalones “Ricas y apretaditas”,
el tiempo promedio muestral de atención a las clientas difiere de su media poblacional p en menos de 0.57 minutos.
12. De una población X: N(0, H) se extrae una m.a. de tamaño 7 y de una población Y: N(0, 1/3) se extrae una
m.a. de tamaño 9. Determine el valor de la constante a
tal que: P (a x > SY) = 0.01. Donde x es la media muestral de las X y SY es la desviación estándar de las Y.
Solución
Para resolver el problema es necesario construir una distribución T de student. Con la muestra de tamaño 7 de la
población X, se tiene que: X ^N(0, 1/28).
X—0 —
Entonces: Z = . = 2>/7X ^N(0,1).
VT/28
(9—1)S2
Con la muestra de la población Y se tiene que: x2 = ^ Y = 24S2 ^ XX
Con los resultados anteriores construimos una variable T así: z
T = . ------------------ se distribuye como una T con los grados de libertad de la chi-
Já
cuadrado. Reemplazando Z y la xl en la expresión anterior se obtiene:
2yflX _ 3.055X
1 = W= S > '8
Para hallar el valor de la constante a solicitada, la probabilidad dada se adecúa a la reciente distribución t de
student construida, así:
0.01 = P (a x > Sy) = 1 - P (X /Sy < 1/a)
^ 0.99 = P ( X /Sy < 1/a) = P
^3.055X 3.055 ^
< ------------------------
SY a
V J
= P(T8 < 3.055/a)
Luego: 3.055/a = T8, 0.99 = 2.896 ^ a = 1.055 Rpta.
112
13. Para analizar el N° de libros encuadernados diariamente por una máquina automática, se seleccionó una
muestra aleatoria de 25 días con lo cual se obtiene S = 8 libros. Calcule e interprete la probabilidad de que el
número medio muestral de libros encuadernados difiera de su media poblacional |i en a lo más 4 libros.
Solución
Datos: n = 25 días, S = 8 libros. Se pide hallar P (| X - — < 4)
Se sabe que: T = X — > 1, entonces: T =
X — = X—— > /
24
S/vn 8/V25 1.6
Para obtener la probabilidad solicitada se divide dentro de la desigualdad entre
1.6 y se construye una T24 así:
P (|X-—< 4) = P
X- —
1.6
4 < — 1.6
= P(| Tm| < 2.5) =
V
= P(-2.5 < T24 < 2.5) = P(T24 < 2.5) - P(T24 < -2.5) =
= P(T24 < 2.5) - [1 - P(T24 < 2.5)] = 2 P(T24 < 2.5) - 1 = 2(0.99) - 1 = 0.98
Rpta.
Interpretación.- en el 98% de las muestras de 25 días de encuadernación cada una, el número medio muestral de
libros encuadernados difiere de su media poblacional ^ en a lo más 4 libros.
14. De una población X: N(p, o2), se extrae una m.a. de n+1 observaciones. Encontrar c tal que el estadístico c( X
- Xn+1)/S tenga distribución t. Donde X y
S es la media y la desviación estándar muestral obtenidas con las n + 1
observaciones.
Solución
Para hallar la constante c es necesario construir una distribución T de student.
- <J2
Con la muestra dada se tiene que: X ^ N(p, ) y Xn+1 ^ N(p, o2).
n+1
Por la propiedad reproductiva de la distribución normal, se tiene que:
X - Xn+1 ^ N[0, o2(n +2)/(n + 1)]. Puesto que las correspondientes medias se restan y las varianzas se suman.
113
Entonces: Z =- X X"+1 0
n +1
■\Ja2(n + 2)/(n +1) Vn+2
X - X,
n+1
—^(0,1).
Como S la desviación estándar muestral obtenidas con las n + 1 observaciones,
2
entonces la chi-cuadrado es: x2 = —2—— X2+i
a
Con los resultados anteriores construimos una variable T así:
T=
z
G.L
se distribuye como una T con los grados de libertad de la chi-
cuadrado. Reemplazando Z y la x^+i en la expresión anterior se obtiene:
T=
n +1
í Tr
n+2
X - X,
n+1
J_
n +1
nS2
a
í n(n + 2)
X - X,
n+1
S
—— t.
n+1
Comparando el resultado anterior con la expresión dada, se tiene que: Rpta.
c=
n +1
n(n + 2)
15. Si F ~ f con 7 y 8 grados de libertad, hallar:
a) P(F7,8 > 3.50)
b) P(F7,8 < 0.268)
c) P(0.1462 < F7,8 < 4.53)
d) Hallar c y d tal que P(F7,8 < c) = 0.025 y P(c < F7,8 < d) = 0.95 Solución
Para obtener las probabilidades solicitadas en la tabla 4, ubicarse en la gran casilla formada por la intercepción
de la columna 7 (G.L. numerador) y la fila 8 (G.L. denominador) se busca el valor dado de F y se leen las
probabilidades acumuladas menores que correspondientes, en la intercepción de la línea del valor dado de F (en
la fila 8) con la columna P así:
a) P(F7,8 > 3.50) = 1 - P(F7,8 < 3.50) = 1 - 0.95 Rpta.
b) P(F7,8 < 0.268) = P
r 1 1 ^
> --------------------
F7 g 0.268
= P(F8,7 > 3.73) = 1 - P(F8,7 < 3.73) =
= 1 - 0.95 = 0.05 Rpta.
114
Para valores de 0 < F < 1 les corresponde probabilidades P = a < 0.50 y se u sa la relación: a, ,.2 =
J 1-a, r2, r
Como el valor de F7,8 = 0.268 no se encuentra en la intercepción de la columna 7 y la fila 8 de la Tabla 4, se toma
el inverso de F7,8 que es otra distribución F8,7 (con los grados de libertad permutados). En la intercepción de la
columna 8 y la fila 7 de la Tabla 4 se busca el valor 3.73 y le corresponde la probabilidad 0.95.
c) P(0.1462< F7,8 < 4.53) = P(F7,8 < 4.53) - P(F7,8 < 0.1462)
= P(F78 < 4.53) - P
, ) lF7,8 0.268 j
= P(F7,8 < 4.53) - P(F8,7 > 3.73)
= P(F7,8 < 4.53) - [1 - P(F8,7 < 3.73)]
= 0.975 - [1 - 0.95] = 0.925 Rpta.
d) Hallar c y d tal que P(F7,8 < c) = 0.025 y P(c < F7,8 < d) = 0.95
Si P(F7,8 < c) = 0.025 entonces c = /7 8 0025 = ------------------------------------------ 1 ---- = —— = 0.204
f8,7,0.975 4.90
Rpta.
Si 0.95 = P(c < F7,8 < d) = P(F7,8 < d) - P(F7,8 < c) = P(F7,8 < d) - 0.025 Luego: P(F7,8 < d) = 0.975 entonces d
= F7,8,0.975 = 4.53 Rpta.
16. Si muestras aleatorias independientes de tamaño n 1 = n2 = 8 provienen de
poblaciones normales con la misma varianza. Calcule e interprete la probabilidad que la varianza de la primera
muestra sea al menos 4 veces más grande que la otra.
Solución
Dado que las varianzas son iguales, para obtener la probabilidad solicitada se
222
emplea la distribución siguiente: F = —y—y = ^ fn -h„ -i = F7, 7
S 2 ^1 S 2 12
2 1 2 f C*2 ^
-1r > 5 = P(F7,7 > 5) = 1 - P(F7,7 < 5) =
lS 2 J
p(-12 > 5S 2 )= P
= 1 - 0.975 = 0.025 Rpta.
115
Interpretación.- en el 2.5% de las (ó en 25 de cada 1000) muestras de tamaño 8 de cada población, la varianza
de la primera muestra es al menos 4 veces más grande que la segunda.
17. Si muestras aleatorias independientes de tamaño n 1 = 6 y n2 = 8 provienen de poblaciones normales con la
misma varianza. Calcule e interprete la probabilidad que la varianza de la primera muestra sea menor que
seis veces la segunda.
Solución
Para hallar la probabilidad solicitada se emplea la propuesta del problema 16.
P(S;- < 6S2 )=P
2
ST < 6 v S 2y
j=1
=-
7
9 x4£ X2
,=1
9
7*3£ Y;
j=1
>
9 x3
= P(F7,9 > 3.86) = 1 - P(F7,9 < 3.86) = 1 - p = 1 - 0.991 = 0.009 Rpta.
Como en la tabla 4 de la distribución F, para 7 y 9 grados de libertad, no está el valor 3.86, pero éste se encuentra
entre los valores 5.61 (con probabilidad 0.99) y 6.88 (con probabilidad 0.995) para hallar p interpolamos así:
Fa P
5.61 0.99
5.86 p
6.88-5.61 5.86-5.61 0.25
^ 254 =
0.995 - 0.99 p - 0.99 p - 0.99
6.88 0.995 ^ 254 p - 251.46 = 0.25 ^ p = 0.991
Interpretación.- en el 0.9% de las (ó en 9 de cada 1000) muestras de tamaño 7
7 9
de la población X y 9 de la población Y, 4£ Xi > 9£y/.
,=1 ;=1
19. Dos compañías A y B fabrican transistores. La duración para los fabricados por A tienen una desviación
estándar de 40 horas, en tanto que los B tienen una desviación estándar de 50 horas. Se toma una muestra
de 8 transistores de A y
7
117
16 de B. Calcule e interprete la probabilidad que la varianza de la primera muestra sea mayor 4.23 veces que la
segunda.
Solución
Datos: oA = 40 horas, oB = 50, nA = 8 transistores y nB = 16.
Para obtener la probabilidad solicitada se emplea la distribución F siguiente:
F = S>¿ = ^402 = 064-AU =F
SB af SB 502 . SB fnA-1,nB-1 7,15
SX 225 ^ cSl
SS^^100 = 2 25 SF ^ fnX-n, -1 = F11'7
Adecuando la probabilidad solicitada al resultado anterior se obtiene:
P(SX < 16S, ) = P
2
% < 16 -2
=P
S2
2.25 -X- < 2.25x1.6
Si
V^ Y J
= P(F11,7 < 3.6) = 0.95 Rpta.
Interpretación.- en el 95% de las (ó en 950 de cada 1000) muestras de tamaño 12 de la población X y 8 de la
población y, la varianza muestral de las X es menor o igual que 1.6 veces que la varianza muestral de las y.
118
3.7 EJERCICIOS PROPUESTOS
1. Si X ~ X con 25 grados de libertad, hallar:
a) P(X < 46.9).
b) P(11.5 < X < 44.3).
c) P(X > 37.7).
d) Hallar a y b tal que P(X < a) = 0.05 y P(a < X < b) = 0.90.
2. De una población X N(u, 18 ), se extrae una muestra aleatoria de tamaño n = 25. Calcule e interprete:
a) P [ 0.011 < ( x - |i )2 < 3.614 ]
b) ¿Entre que valores se encontrará el 95 % central de las varianzas muestrales?
3. De una población X ^ N(^ , 20 ), se extrae una muestra aleatoria de tamaño n = 30. Calcule e interprete:
30
a) P [354 < ^(X, - —)2 < 876 ]
i=1
b) P ( 11.04 < S2 < 31.52 )
4. Se sabe que los pesos de ciertas latas de atún se distribuyen normalmente con una desviación estándar de 2
gramos. Si se toma una muestra de 12 latas, calcule e interprete la probabilidad de que la varianza de la
muestra sea menor que 8.5
(gr.)2.
5. La duración de los focos producidos por una compañía tienen una media de 1500 horas y una desviación
típica de 80 horas. Se seleccionan 23 focos al azar, calcule e interprete la probabilidad de que la desviación
estándar muestral se encuentre entre 60 y 100 horas.
6. La duración de transistores fabricados por una compañía tienen distribución normal con una media de 2000
horas y una desviación típica de 60 horas. Se selecciona 10 transistores al azar, calcule e interprete la
probabilidad que la varianza muestral se encuentre entre 2500 y 4900 (horas) .
7. De una población X: N(u, 18), se extrae una muestra aleatoria de tamaño n = 25. Calcule e interprete:
25
a) P [327.5 < ^ (X i - |i)2 < 978.8 ]
i=1
119
b) P (8.18 < S2 < 32.25).
8. De una población X ^ N(p, 10) se extrae una m.a. de tamaño n = 10 y de una población Y ^ N(p, 15) se extrae
una m.a. de tamaño m = 8. Calcule e interprete:
( 10 — ^
a) P 30.1 (X - X)2 < 190.0
V i=1 J
( 8 A
b) P 32.7 <^ Y -v)2 < 201.0
V i=1 J
9. Si T ~ t con 23 grados de libertad, hallar:
a) P(T < -1.714)
b) P(-1.319 < T < 2.5)
c) P(T > 1.319)
d) Hallar a y b tal que P(T < -t0) = 0.05 y P(-t0 < T < t0) = 0.90.
10. Un inspector investiga las acusaciones contra una fábrica de gaseosas porque no llena bien sus envases.
Una muestra de 16 botellas de gaseosa indica una desviación típica S = 0.18 litros. Calcule e interprete la
probabilidad de que el promedio muestral difiera de su media poblacional p en menos de 0.096 litros.
11. De una población X: N(0, H) se extrae una muestra aleatoria de tamaño 10. Determine el valor de la constante
k tal que: P (k x > SX) = 0.05. Donde x es la media muestral de las X y S X es la desviación estándar muestral
de las X.
12. Para analizar el tiempo de atención por cliente en un establecimiento grande, se
tomó una muestra aleatoria sin reemplazo de 25 atenciones con lo cual se obtiene
22
un tiempo promedio de 7.5 minutos y una varianza S = 2.25 minutos . Calcule e interprete la probabilidad de que
el promedio muestral difiera de su media poblacional en menos de 0.513 minutos.
13. De una población X: N(p, o2), se extrae una muestra aleatoria de n+1
observaciones. Encontrar c tal que el estadístico c(x - Xn+1 )/S tenga
distribución t. Donde x y S es la media y la desviación estándar muestral obtenidas con las n primeras
observaciones.
14. Una inspectora de calidad investiga las acusaciones contra una fábrica de cerveza porque no llena bien sus
envases. Una muestra de 25 latas de cerveza indica un
contenido medio x =33.2 onzas y S = 2.25 onzas. Calcule e interprete la probabilidad de que el promedio muestral
difiera de su media poblacional en menos de 0.929 onzas.
120
15. Si F ~ f con 10 y 12 grados de libertad, hallar:
a) P(F < 0.212)
b) P(0.276 < F < 4.30)
c) P(F > 3.37)
d) Hallar c y d tal que P(F < c) = 0.05 y P(c < T < d) = 0.90.
16. Si muestras aleatorias independientes de tamaños n1 = n2 =8 provienen de poblaciones normales con la misma
varianza. Calcule e interprete la probabilidad que la varianza de la primera muestra sea mayor que 5 veces la
segunda.
17. Si muestras aleatorias independientes de tamaño n1 = 6 y n2 = 8 provienen de poblaciones normales con la
misma varianza. Calcule e interprete la probabilidad que la varianza de la primera muestra sea 5 veces más
grande que la segunda
18. Sea X1 , X2 , .... , X7 e Y1 , Y2 , .... , Y9 muestras aleatorias independientes de distribuciones normales, ambas
con media cero y varianza uno. Calcule e
interprete: P
2I Xf > 7^ YJ
i=1 J=1
19. Dos compañías A y B fabrican transistores. La duración para los fabricados por A tiene una desviación estándar
de 40 horas, en tanto que los B tienen una desviación estándar de 50 horas. Se toma una muestra de 10
transistores de A y 10 de B. Calcule e interprete la probabilidad que la varianza de la muestra A sea al menos
dos veces más grande que la B.
20. Dos compañías A y B fabrican focos. La duración de los fabricados por A tiene una desviación típica de 40
horas, en tanto que los B tienen una desviación estándar de 50 horas. Se toma una muestra aleatoria de 10
focos de A y 10 de B. Calcule e interprete la probabilidad que la varianza de la muestra A sea mayor que tres
veces la varianza de la muestra B.
121
Capítulo 4. ESTIMACIÓN PUNTUAL
“Lo que escucho lo olvido, lo que veo lo recuerdo, pero lo que hago lo entiendo”Confucio
CONTENIDO
2
nE dln f (x;ú
_ de _
Si la varianza de un estimador insesgado ú satisface la desigualdad de Cramer y Rao como una igualdad, este es
un estimador insesgado de varianza mínima o eficiente.
Ejemplo 7.-
Demostrar que la proporción muestral p es un estimador insesgado de varianza mínima de la proporción
poblacional P, de una variable aleatoria X con distribución de Bernoulli.
Solución.-
Suponga que se extrae una muestra aleatoria simple de tamaño n de la población X con distribución de Bernoulli.,
entonces:
n
EX
p = — ------------------------------------------------------ , estima a P.
n
La proporción muestral p, es una media muestral de v.a. Bernoulli con E(X i > = P y V(Xi > = PQ; representa la
proporción de éxitos en la muestra y estima a la proporción de éxitos en la población P. Luego:
128
E(p) = E
n
Y*,
n
1n 1n 1
- Y e( x, ) = - Y - = -(»-)=-
«“T n~~- n
Es decir que la proporción muestral p es un estimador insesgado de la proporción poblacional P. Veamos si es de
varianza mínima.
Var(p) = Var
n
Y*,
n
n
Va* Y X ,)
n
(propiedad de la varianza)
YVa*X,) Y-Q
,=1
,=1
n
n
n-Q _ -Q
nn
• Hallemos la cota inferior de Cramer - Rao, B(P):
i) f(x; P) = P x (1 - P) 1 - x , x = 0 , 1
ii) ln f(x; P) = x ln P + (1 - x) ln (1 - P)
d x 1 - x x --
iii) —ln f (x; -) = ----------------------------------- = --------------
d- - 1 - - -(1 - -)
iv) E
d
d-
ln f (x; -)
2
II
1
2
x
i
-2(1 - -)2
Var(X) _ -Q _ 1
-2Q2 ~ -2Q2 ~ -Q
v) B(-) =
-Q
rd^ 2 1 n
nE —ln f (x; -) d- n l -Q \
= Var (p)
Dado que la Var (p) es igual a la cota inferior de Cramer-Rao B(P), p es un estimador de varianza mínima para P.
Como la proporción muestral p es un estimador insesgado y de varianza mínima para P, es un estimador eficiente.
1
1
1
129
4.2 MÉTODOS DE ESTIMACIÓN PUNTUAL
Entre los principales métodos de estimación puntual se tiene:
El método de máxima verosimilitud (que busca maximizar la probabilidad de que ocurra la muestra observada)
El método de los momentos (en el que se iguala los correspondientes momentos poblacionales y muestrales).
El método de los mínimos cuadrados ordinarios (que busca minimizar la varianza de los errores en el modelo de
regresión lineal).
A continuación presentamos cada uno de estos métodos de estimación.
4.3 MÉTODO DE MÁXIMA VEROSIMILITUD
El método consiste en seleccionar como Estimador Máximo Verosímil 4 (EMV) puntual del parámetro 9, al
estimador ú que maximiza la probabilidad de obtener la muestra realmente observada. Dicha probabilidad está
representada por la función de probabilidad conjunta de la muestra y recibe la denominación de función de
verosimilitud.
Procedimiento.-
Sea X1, X2, .... , Xn una m. a. de X, una variable aleatoria con función de probabilidad f(x; 9) que depende del
parámetro 9, y sean x1 , x2 , .... , xn , los valores observados. Para hallar el EMV del parámetro desconocido 9 se
procede de la siguiente manera:
1) Hallar la función de verosimilitud, que representa la probabilidad de obtener la muestra observada, y se define
así:
n
V(9) = f (x1 , x2 , .... , xn ; 9) = f (x1 ; 9) f (x2 ; 9) .... f (xn ; 9) = ^ f (xt;ú)
i=1
2) El método de máxima verosimilitud consiste en tomar como estimación el valor ú que hace máxima la función
de verosimilitud V(9). Sabemos que si
4 http://buscon.rae.es/drae/ Real Academia Española © Todos los derechos reservados. Vigésima segunda edición
(2001). Verosímil: 1. Adj. Que tiene apariencia de verdadero. 2. Adj. Creíble por no ofrecer carácter alguno de
falsedad.
130
ú hace máxima a V(0), también hace máxima a su logaritmo ln V(9). Para convertir el producto en suma, se toma
la función:
n
L = ln V(9) = £ ln f (x, ;ú)
i =1
3) Se toma derivadas parciales de L con respecto a 0, se iguala a cero y se obtiene Ú. Es decir:
8L ^ 5ln f (x,;ú) a ^. .
5ú = £ —=0 ^ ú = F (x1 • X2 • ... •x" »
Si la distribución tiene r parámetros desconocidos 91 , 02 , .... , 0r ; se toma derivadas parciales con respecto a
cada parámetro y en lugar de una ecuación tendremos las r ecuaciones:
8L = o , 8L = o , .... , 8L = o
8ÚX 8Ú2 86r
a partir de las cuales se obtiene los estimadores Ú1 , Ú 2 , .... , Ú r .
Ejemplo 8.-
Hallar el estimador de máxima verosimilitud para el parámetro P (proporción o
probabilidad de éxito) de la distribución X de Bernoulli.
Solución.-
i) La función de probabilidad de la v.a. X Bernoulli es:
f (x; P) = P x (1 - P) 1 - x , x = 0 , 1 ; 0 < P < 1
ii) Sea X1 , X2 , .... , Xn una m. a. de X, cuyos valores observados son x1 , x2 , .... , xn. Entonces:
f (x;P) = PXi (1 -P)1-Xi , xi = 0 , 1 ; i = 1, 2, .... , n
iii) La función de verosimilitud V(P) está dada por:
V(P) = f (x1 , x2 , .... , xn ; P) = f (x1 ; P) f (x2 ; P) .... f (xn ; P) =
nn
= n f (x; P) = nPXi (! - P)1-Xi = P£ Xi (! - P) Xi
iv) L = ln V(P) = £ x ln P +
i=1
n
n—
1
n
ln(1 - P)
1
1
131
n
n
n
v) — = — ------------------------ —
dP P1—P
dL £x n—£x
dL_ i=1 i=1
i=1
1—P
i=1
n
£*
Luego:
P=p
i=1
Rpta.
n
Estimador muestral que sabemos es un estimador eficiente de la proporción poblacional P.
4.4 MÉTODO DE LOS MOMENTOS
La idea básica de este método consiste en igualar los momentos muestrales con los correspondientes momentos
poblacionales. Recordemos la siguiente definición.
Definición-
Sea X una v.a. con función de probabilidad puntual p(x) en el caso discreto o función de densidad f(x) en el caso
continuo. Se denomina momento de orden k (k e N) o momento poblacional de orden k a E(X ), es decir:
E(Xk) = £xkp(x) en el caso discreto, y
si esas esperanzas existen.
Dada una muestra aleatoria X1 , X2 , .... , X , el momento muestral de orden k
Definición-
Sea X1 , X2 , .... , Xn , una m.a. de una distribución con función de probabilidad o función de densidad que depende
de m parámetros 01, 02, ...., 0m. Los estimadores de momentos de 01, 02, ...., 0m son los valores ú 1, ú 2, .... , ú m
que se obtienen igualando m momentos poblacionales con los correspondientes momentos muestrales. En
general, se obtienen resolviendo el siguiente sistema de ecuaciones:
*
E(Xk) = | xkf (x)dx en el caso continuo
n
,=1 ,=1
n n n
aYX, + bY X'2 =Y*,Y, (2)
,=1 ,=1 ,=1
Cuya solución proporciona los siguientes estimadores: de b y a:
n
Y XX + nXY
b = ^= ---------------------------------------- y a=y-bx
Yx,2+«X2
,=1
Cuando se reemplaza los resultados muestrales se obtiene: Y = a + b>X,
134
4.6 PROBLEMAS RESUELTOS
n
Z(x, - y)2
1. Demostrar que la varianza muestral a2 = 52 = — -------------------------------------- es un estimador
n -1
2
insesgado de la varianza poblacional o .
Solución
Sabemos que: Z (x, - X)2 =Z xj - nx2
i=1
i=1
Hallando la esperanza de la varianza muestral se tiene:
E (a2) = E(s2) = E
n
Z (x, - X)2
,=1
E
V i=1
n
nn
Z,xj - nx 2| £^x2 I-nE(x2)
y _ V ,=1
n -1
n -1
n -1
V y
nE(x?)-nE(x2)_ nfy(x,) + (E(x, ))2 j- [V(x) + (E(x))2 j}
n -1 n -1
ni a2 + /j2 - a— - /j2
n -1
Es decir que: E(a2) = E(s2) =
22 na2 -a2
n -1
(n - 1)a2
=a
n
n
Z(x, - x)2
Luego a2 = s2 = -"-1 -------------------------------- es estimador insesgado de la varianza poblacional
n -1
2
o.
2. La primera observación de una muestra aleatoria de tamaño n, podría utilizarse como un estimador de la
media poblacional. ¿Es éste un estimador: a) insesgado? y b) eficiente?
Solución
Por definición de muestra aleatoria se sabe que: X1, X2 , ...., Xn son n variables aleatorias independientes con:
E(Xi) = p, V(Xi) = o .
Si J = x1, entonces:
a) E(J) = E(x1) = p, luego J = x1 es un estimador insegado de p.
135
n
n
2
b) Como Xi es un estimador insesgado, entonces ECM (Xi) = V(Xi) = G .
n
ZX
X=
i=1
Pero, n también es un estimador insesgado de p, con
- _ /T2
ECM (X) = V (X) = — n .
Comparando los errores cuadráticos medios de ambos estimadores, se tiene que:
ECM (X1) > ECM(X) luego Xi no es un estimador eficiente de u, ya que X es un estimador más eficiente.
3. Las cajas de un cereal producido por una fábrica deben tener un contenido de 16 onzas (una libra). Un
inspector toma una muestra aleatoria simple que arroja los siguientes pesos en onzas: 15.7, 15.7, 16.3, 15.8,
16.1, 15.9, 16.2, 15.9, 15.8, 15.6.
a) ¿Cuál es la estimación puntual del peso medio poblacional de las cajas de cereal?
b) ¿Cuál es la estimación puntual de la varianza poblacional del peso de las cajas?
Solución
a) El estimador puntual de la media poblacional es la media muestral y su
estimación es la siguiente:
n 10
Z X, ZX
A ^Z ' Z ' 15.7 +15.7 +.... +15.6 159 _
u=X= = ----------------------------------- = ---------- = 15.9 onzas.
n 10 10 10
b) El estimador puntual de la varianza poblacional es la varianza muestral y su
estimación es:
n n 10
Z(X - X)2 ZX,2 - nX2 ZX2 -10X2
—2 = S2 = ^ =1 -i = 1 -
n -1 n -1 10 -1
n 10
Z X2 =Z X2 = 15.72 +15.72 +.... +15.62 = 2528.58.
,=1 ,=1
Reemplazando en la expresion de la varianza muestral se obtiene:
136
10
yx2 -10x2 / x2
2 02 Ti 2528.58-10x(15.9)2 .
72 = S = — ----------------------------------------- =------------------------ V ----- — = 0.0533 (onzas)2.
10 -1 9
4. En una encuesta de opinión a 1000 adultos para conocer su opinión acerca de la economía. Las respuestas
fueron las siguientes:
OPINION: ADULTOS
son
2n n
estimadores insesgados, ya que son medias muestrales con 2n y n observaciones muestrales respectivamente.
Luego, será mejor estimador el que tenga menor varianza.
Teniendo en cuenta que E(Xi) = p y Var(Xi) = o , por definición de muestra aleatoria, hay que hallar sus varianzas
y compararlas.
f 2n \ 2n 2n
V (X1) = V
E X,
=1
EV(X,) E°-
=1
=1
2na a
2n
VJ
n
(2n) (2n) (2n)2
2n
V (X 2) = V
A
E X,
,=1
n
VJ
nn
EV(X,)
22 na a
n
n
n
n
Se observa que V(Xx) < V(X2). Por lo tanto, Xj es el mejor estimador de p. Rpta.
2
1
1
139
7. Sea X1s X2, ...........................................,Xn, una muestra aleatoria de una variable aleatoria X con
distribución uniforme en el intervalo [a, a + 1].
a) Demuestre que la media muestral x = á es un estimador sesgado de a.
b) Calcule el error cuadrático medio del estimador á = x.
Solución
1
a) Como la variable aleatoria X tiene distribución uniforme en el intervalo [a, a + 1], entonces f (x) =
=1, a < X < a + 1. Así mismo,
á +1 -á
E( X) = E( X , ) =
á + á +1 2á +1
2
2
y V (X) = V (X, )= (á +1 -á)2 = 1
Si á = x, entonces:
E(á) = E( x) = E
fn \
EX,
i=1
n
VJ
nn
£E(X,) Y
=1
=1
n
12
2á +1
2 2á +1 1
-------------- = ------------= á + —
n22
12
Luego: á = x es un estimador sesgado de a. Rpta.
b) El error cuadrático medio del estimador á = x esta dado por:
ECM (á) = V (á) + [á - E(á)]
(b)
V (á) = V (X) = V
n
EX
YV(X) n
1
n
n
12n2 12n
n
VJ
Reemplazando la varianza de á y la esperanza de á en (b) se tiene:
Rpta.
2
1 f1Y 1 1 1 + 3n
+ á— á+—1 = + —=
12 n V2 12 n 4 12n
8. Sea Xi , X2 , .... , X7 una muestra aleatoria de una población con media p y varianza a . Considere los siguientes
estimadores de p:
Ó, = (X1 + X2 + .... + X7 ) / 7 ; 4 = ( 2 X1 - X6 + X4 ) / 2
a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de p?
Solución
2
1
2
a) Por definición de muestra aleatoria E(Xi) = p y Var(Xi) = o . Luego:
140
^ _ E(X1) + E(X 2 ) + .... + E(X 7 ) A + A + ....^ _ 7 A _ ^
2E(X1) - E(X6 ) + .E(X4 ) _ 2 A + A - A _ 2 A _
EíQ \
9 2' 2 2 2 A
28 + B2
ECM (P2) = V (B?) + B-E(/?2)
=6+
B-
B
54 + 4B2
El estimador B es mejor estimador de B que fi2 si se cumple que:
ECM (B) < ECM (B2)
28 + B2 54 + 4B2
4
252 + 9 B2 < 216 + 16 B2
36 < 7 B2 — 7 B2 > 36
|B|>
6yfl
~T.
Si
i B<
6V7
7
el estimador B2 es mejor estimador de B queB. Rpta.
11. Si y $2 son estimadores independientes insesgados de un parámetro desconocido 9 , con varianzas conocidas
—2 y — respectivamente:
a) Demostrar que ú = a + (1 - a) ú2 también es un estimador insesgado de
, para cualquier valor de a.
b) Encontrar el valor de a que minimiza la varianza de 9.
Solución
a) Si y ú2 son estimadores independientes insesgados del parámetro desconocido 9 , entonces: E( ) = 9 y E( ú 2) =
9. Luego:
E( ú) = E[a + (1 - a ) Ú2 ] = a E( Ó,) + (1 - a) E( Ú2) =
= a 9 + (1 - a ) 9 = 9.
Por lo tanto 9 es un estimador insesgado de 9 , para cualquier valor de a.
b) Se tiene como datos: V() = —2 y V(ú2) = a\. Luego, la varianza del estimador es:
V(6) = V[a 61 + (1 - a ) 4] = a2 V(^) + (1 - a)2 V(d2)
Reemplazando la varianza de los estimadores se obtiene:
V( ú) = a2 —2 + (1 - a)2 —2 = f(a)
142
2
2
2
2
—>
—>
f”(a) = —r( = 272 + 2722.
Para hallar el valor de a que minimiza la varianza del estimador ú, se toma la derivada parcial de V( () con respecto
a a y se iguala a cero. Así:
f’(a) = dV() = 2a + 2(1 - a)722 (-1) = 0 da
Para resolver la ecuación anterior se divide entre 2 en ambos miembros y se tiene:
a^2 - (1 - a 72 = 0 ^ a^2 + aa\ = ^ a= 2
2
2 , punto
71 ^ 7 2
crítico.
_ d'np) _
da2
Reemplazando el punto crítico encontrado en f”(a) se tiene que:
f’(a) = 272 + 2 72 > 0 ^ a es un mínimo para la V( ú ).
72
2—^ minimiza la varianza de (. Rpta.
Por lo tanto el valor a =
2 2
7 +72
12. Sea X una variable aleatoria con media p y varianza G . Dadas dos muestras aleatorias de tamaños n 1 y n2
con medias muestrales X y X2 respectivamente.
a) Demostrar que: X = aX + (1 - a)X2 , 0 < a < 1, es un estimador insesgado de P.
b) Asumiendo que X y X2 son independientes, hallar el valor de a que minimiza la varianza de X.
Solución
Se sabe que la media muestral es un estimador insesgado de la media poblacional. Entonces: E( X) = P y E(X) =
P.
Además, la varianza de la media muestral es igual a la varianza poblacional
72 7
entre el tamaño de la muestra. Luego: V (Xx) = — y V (X2) = —.
n n
a) E( X) = E[ aX + (1 - a)X2 ] = a E( X) + (1 - a) E( X2) =
= a p + (1 - a) p = p.
Entonces, X es un estimador insesgado de p. L.Q.Q.D.
143
b) V( x) = V[ aX + (1 - a)x2 ] = a2 V( X) + (1 - a) 2 V( x2) =
Reemplazando la varianza de las medias muestrales se obtiene:
_2 2 V( x) = a2 — + (1 - a)2 — = f(a)
n2
«1
Para hallar el valor de a que minimiza la varianza del estimador x, se toma la derivada parcial de V( x) con respecto
a a y se iguala a cero. Así:
f’(a) = dV (x) = 2a — + 2(1 - a) — (-1) = 0 da n n2
Para resolver la ecuación anterior se divide entre 2o2 en ambos miembros y se tiene:
a 1-a n,
- = 0 ^ an2 + an1 = n1 ^ a = ----------------------------------------------------------1—, punto crítico.
n n2 n+n2
j2i
f.(a) = d2Vtx) = 2 al + 2 al.
da n1 n2
Reemplazando el punto crítico encontrado en f”(a) se tiene que:
a2 a2
f”(a) = 2— + 2— > 0 ^ a es un mínimo para la V( x).
n2
»1
n _
Por lo tanto el valor a = —1— minimiza la varianza de x. Rpta.
n+n2
13. En base a una muestra aleatoria de tamaño n de una distribución Poisson con parámetro X, se pide:
a) Determinar el estimador máximo verosímil del parámetro X.
b) Es eficiente el estimador obtenido para el parámetro X ?
Solución
Sea X1, X2, .... , Xn, una m.a. de una distribución X ~ Poisson(X ). Entonces:
Xx. e~X
f (Xi, X) = ----------------------------- , Xi = 0, 1, 2, .................... Además: E(Xi) = X = Var (Xi).
x: !
La función de verosimilitud es:
Xxi eXZxi e-nX
V(X) = f(X1, X2, X3 ,., Xn) = n ^ n
TT xt !
i=1
i=1 xt!
n
144
L = Ln V(X) = Ln
XEX e-nX
nX!
,=1
L = E X LnX - nX Ln e - ln n X != EX LnX - nX- E ín X
,=1 1 1 ,=1 ,=1
a) Determinación del estimador de X:
n n
EX EX
1
a T ¿—t a ^—í 1 _
—=—n=0 ^ X = — ---------- = x Rpta.
dX X n
b) ¿Es eficiente el estimador de X?
Será eficiente si es insesgado y de varianza mínima.
. E(X) = i Ee(X ) =1E X= nX = X
n “1 n “1 n
A _________________________
Por lo tanto X = x es un estimador insesgado para X .
A
• Es de varianza mínima si: V( X) = B(X)
A - V(X) = - n
B(X) =
nE
d
JX
ln f (x,X)
X „-X
f(X, X) =
Xe
X!
ln f(X, X) = X ln X - X ln e - ln X ! = X ln X - X - ln X !
— ln f(X,X) = X -1 =(X -X) dX X X
a
dX
ln f (X,X)
y
(X -X)2
X^~
E
a dx■
1
1
X1
ln f (X,X) = — E( X X)2 = — V (X) =^=
X2
X2
X2 X
Luego:
1 XAX
B(X)== X = V (X) =X. 1 i n n
n
X
Por lo tanto X = x es un estimador de varianza mínima.
145
n
n
n
n
1
2
2
A
Como X = x es un estimador insesgado y de varianza mínima, es un estimador eficiente para X .
14. En base a una muestra aleatoria de tamaño n de la distribución geométrica determine el estimador máximo
verosímil del parámetro p.
Solución
Sea Xi, X2, .... , Xn, una m.a. de una variable X ~ Geométrica (p). Entonces: fX(X,) = p(1 -p)X-i ; Xt = 1,2,3,.... Vi =
1,2,3,....,n Luego la función de verosimilitud será:
V(p) = f (X1, X2,...., Xn) = nP(1 - P)X'-1 = Pn (1 - i
Mx -
i=1
1
n
X
-
n
1
fn\
sp
n(
-
p)
XI
Xi
-
K
L = Ln V(p) = Ln = nLnp +
V ,=1 y
dLn
n
1.X,
-n
i=1
dpp1-p
=0
p=
n
n
Mx,
1
X
Rpta.
15. En base a una muestra aleatoria de tamaño n de una distribución normal N(^, o ) se pide:
a) Determinar el estimador máximo verosímil de |i y o .
b) Es eficiente el estimador del parámetro |i?
Solución
Sea X1, X2, .... , Xn, una m.a. de una distribución X ~ N(p , o ) . Entonces:
¡2na2
La función de verosimilitud es:
n
V(p,a2) = f(X1, X2, X3 ,..., Xn) = n-
V X- -M)2
2; ; -ro<X,. ; Vi = 1,2,....,n
-1 ? r( Xi -m)
¿
?2a
\2na
1
2no2
n1n
2 r^M (Xi -M)2
e2a ,=1
L = Ln V(p,a2) = Ln
2na
nn
2 .s?M( X M
146
A
n
---- >
1
1
i =1
= n[Ln1 -Ln (a22^]-^E(x, -j)2 Ln
L = — Lna2 - —Ln2n - E(X -j)2
2 2 2a2 '
a) Determinación del estimador de p
8L1
n
1
8j 2a2
(2) (-1) E (X, -j) = 0
n n
Luego: E (X - j) = 0 ó E X, - nj = 0
Por lo tanto:
E x.
A Au 1
p = — ------------------------------------ = X Rpta.
n
Determinación del estimador de o
2
8L
a
n +-^ E (X , -j)2 = 0
2a2 2(a2)2 tí
1
2(a2)2 tT
n
E ( X, - J)
E (X, -J)2
n
2a2
,=1
n
2(a2)2
2a2
E ( x, -j)2
a2 = ^-
n
b) ¿Es eficiente el estimador de p?
Será eficiente si es insesgado y de varianza mínima.
n
EX 1
1
i-1
1
. E( X) = -ií— = 1 EE X, = 1E E( X,) = nJ=j n n “f n^ n
Por lo tanto p = X es un estimador insesgado para p. Es de varianza mínima si: B(j) =- 1
f(X,j ) =
nE
1
¡a2 2^
88j
ln f (x j)
-1 f X -j
2Va
Ln f(X,j) = Ln1-LnV a 2n -
X-j
Ln e
a
147
e
n
n
—>
A
---- >
---- >
A
2
e
2
V
Rpta.
_2
=V (X) = — n
= - Ln Va 2n -
2
' X-a V a .
ln / (X, A) =-^(2)( X -A)(-1) = (X-A o A 2a2 a2
B(A) =
1
1
1
ff2
nE
2 n n
r (x -a) 1 (a2)
1
1
X
1
)
Xo = Ingreso mínimo.
La función de verosimilitud es:
n B n nB
V(B) = f(X1, X2, . ..,Xn) = ñBX0 - 0
^B+1 n
B
i=1 Xi J I v^B+1
i=1
n X,B
n nB
L = Ln V(B) = Ln
BnX,
nXiB
B+1
n
= n LnB * nB LnX0 - (B * 1)Z Ln Xt
,=1
=1
0Tn ^ n ^
= - * nLnX0 -ZLnXt = 0 ^ - = ZLnXt - nLnX0 ^
,=1 B ,=1
n n n n
^ g = ZLnX,-ZLnXo =ZLn(X, /Xo)
i=1
i=1
i=1
2
1
A
n
148
t, n
i = — --------------------------------------------------------------------------------------------------------------------------- Rpta.
2^ (X, / X„)
7=1
17. En base a una muestra aleatoria de tamaño n de una distribución Lognormal con
2
parámetros (p, G ). Se pide:
a) Determinar el estimador máximo verosímil de los parámetros p y G .
b) Se sabe que el ingreso familiar anual (en miles de soles) tiene aproximadamente distribución Lognormal.
Determine una estimación de p con los ingresos de 20 familias escogidas al azar siguientes:
10 50 40 8 12 15 10 25 14 32
18 61 16 9 11 19 21 27 25 30
Solución
Sea X1, X2, .... , Xn, una m.a. de una variable X ~ Lognormal (p, G ). Entonces:
fx (X,) =
1
X > 0, V i = 1, 2, ...., n.
TT7
Luego la función de verosimilitud será:
n
V(p, G2) = f (X1, X2,...., Xn ) = n
,.1 X,f2.
na
riX
2n<j
2 -£( L n X, -p)2/272
e ¿=1
; X > 0, V i = 1, 2, 3, .... , n.
¿=1
L = Ln V(p,o2) = Ln
rrX
2n7
2 -£(LnX¡ -p)2/272
e ¿=1
¿=1
Ln1 - Ln, X + ñ [ Ln1 - Ln (72n)] L— 2 (LnX - pf Ln
2 272
¿=1
1
L = -2LnX -n Ln^2- 'ñLn2n - 2(LnX -p)
n
1
a) Determinación del estimador de p
5p 2G2
n
(2)(-1) 2(LnX,-p) = 0
e
1
e
n
e
n
n
1
1
1
149
Luego: I(LnX. -y) = 0 ó ILnXi -ny = 0
=1
A I L”X>
Por lo tanto: p= — ---------------- Rpta.
n
Determinación del estimador de o SLn 1 ^
+ ------------------------------------------------ I(LnX -A)2 = 0 ^
Sa2 2^2 2(^2)2 i=1
n
„ I (LnX, -¡i?
- 1 I(LnX,-„)2- n ■ 111 -2(CT2)2
2(a2)2 ti 2a2 n 2^
n
A I(LnXi -v)2
Por lo tanto: a2 = — ------------------------------ Rpta.
n
b) Estimación de u con los ingresos de las 20 familias:
n
I LnX
A Ln10 + Ln50 + Ln40 +.... + Ln25 + Ln30
u = — -------------------------- = ---------------------------------------------------------------------- = 2.9538 Rpta.
n 20
18. Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos para el parámetro A, de la
distribución de Poisson.
Solución
Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ Poissón (A) Como hay un solo parámetro a estimar,
basta plantear una ecuación basada en el primer momento.
Es decir, M1’ = E (X).
Sabemos que para la distribución Poisson E(X) = A. Entonces:
nn
IX, IX,
M'. = — ------------------- = E(X) = X ^ X = —--------- = X Rpta.
n n
19. Sea X una variable aleatoria con distribución uniforme en el intervalo [-a , 3a]. Hallar el estimador de a por el
método de los momentos, basado en una muestra aleatoria de tamaño n de X.
Solución
n
n
150
Sea X1s X2, .... , Xn, una muestra aleatoria de una variable X ~ uniforme en el intervalo [ -a , 3 a ]. Como el único
parámetro es a, basta plantear una ecuación basada en el primer momento.
Es decir, M1’ = E (X).
Sabemos que para la distribución uniforme en el intervalo [a, b], E(X) = (a +
b)/2. Luego: en el intervalo [ -a , 3a ], E(X) = a. Por lo tanto:
nn
IX, IX
M[=— ---------------------- = E(X) = a ^ a = —= X Rpta.
n n
20. Basados en una muestra aleatoria de tamaño n, hallar el estimador de momentos
2
para los parámetros p y o de la distribución de normal.
Solución
Sea X1, X2, .... , Xn, una muestra aleatoria de una variable X ~ N(p, o ). Como la distribución tiene dos parámetros,
es necesario igualar los dos momentos muestrales y poblacionales correspondientes. Es decir:
Mi’ = E (X) ................................................................................... (1)
M2’ = E (X2) .... (2)
222
En la distribución normal E (X) = p y E (X) = o+ p . Reemplazando en las ecuaciones anteriores se tiene:
nn
IX, IX
En (1): M\ = — ----------------------- = E(X) = p ^ pi = — --- = X Rpta.
n n
n
-2
IX,2
En (2): M2 = ü = E( X2) = a2 + p2
n
Como la media muestral es un estimador de la media poblacional p, la reemplazamos en la expresión anterior
para hallar el estimador de o .
n
2
IX,:
_2 . 2 —.2 1 t^2 i=1
a+p=a+X =
n
n n n
IX2 IX2 - nX2 I(X, - X)2
^a2 =-i=i ----------------------------------X2 =ü ------------------ = -i=1 ------------------------- Rpta.
n n n
151
4.7 PROBLEMAS PROPUESTOS
1. Si X1, y X2 son variables aleatorias independientes con: E(X1) = 4, E(X2) = 2, V(X0 = 8 y V(X2) = 4. Siendo 0X
= 2X1 - 3 X2 y 02 = 3 X2 - X1 dos estimadores de Q, ¿cuál de los estimadores es más eficiente?
2. Suponga que tiene una muestra de tamaño n de una población X con E(X) = |i y
el mej or estimador de |i?
3. Los pesos netos (grs.) en una muestra aleatoria simple de diez latas de conserva fueron los siguientes: 159,
162, 159, 158, 156,157, 157, 163, 158, 161
a) ¿Cuál es la estimación puntual del peso neto medio poblacional de las latas de
b) ¿Cuál es la estimación puntual de la desviación estándar poblacional del peso neto de las latas de conserva?
4. Realizada una encuesta de opinión, a una muestra aleatoria simple de 800
ciudadanos, en la pregunta, ¿Está usted de acuerdo con la gestión del Alcalde de
la ciudad? 260 responden que Sí, 440 que No y el resto No sabe/No opina.
a) ¿Cuál es la estimación puntual de la proporción de la población que Si está de acuerdo con la gestión del
Alcalde de la ciudad?
b) ¿Cuál es la estimación puntual de la proporción de la población que No está de acuerdo con la gestión del
Alcalde de la ciudad?
5. Sea X1, X2, .... , X10 una muestra aleatoria de una población con media |i y
varianza a . Considere los siguientes estimadores de |i:
= (X1 + X2 + .... + X10 ) / 10 ; 4 = ( X1 + 3 X5 - X10 ) / 3
a) ¿Son estimadores insesgados? y b) ¿Cuál es mejor estimador de |i?
6. Sean ú 1 y ú 2 dos estimadores de 9 con E (ú 1) = 9 , E (ú 2) = 9/3, Var (ú 1 ) = 8, Var (9 2 ) = 2. ¿Cuál es mejor
estimador de 9 ? ¿por qué?
n-2
n
Donde:
a = Límite inferior del intervalo de confianza. b = Límite superior del intervalo de confianza.
k = una constante positiva que corresponde al valor de la distribución del estimador para una probabilidad 1 - a.
1 - a = Nivel de confianza (probabilidad de que el parámetro poblacional este comprendido en el intervalo) cuyo
valor se toma de 0.90, 0.95 o 0.99.
Ejemplo 1.-
Sí 1 - a = 0.95 se dice que se tiene un intervalo de confianza del 95% y que la probabilidad de que el intervalo
contenga el verdadero valor del parámetro es del 95%. Es decir, que si para muestras distintas y bajo el mismo
procedimiento se construye el intervalo repetidamente, 95 de cada 100 de estos intervalos, contendrá el parámetro
y 5 de ellos no.
Se puede pensar que 1 significa certeza, seguridad y a significa riesgo. La seguridad menos el riesgo, es decir 1
- a da, por lo tanto, el coeficiente de confianza de nuestras afirmaciones.
En el caso anterior, se tiene una confianza de que 95 de cada 100 intervalos que se extraigan como muestra,
contendrán el verdadero valor del parámetro. Pero una vez determinado el intervalo, es decir, una vez calculados
numéricamente los extremos, ya no debe hablarse en términos de confiabilidad ni en términos probabilísticos,
pues la situación pasa a ser completamente determinística. De tal manera, asociado a un intervalo de confianza
ya calculado, se tiene una probabilidad 0 ó 1 de que contenga al parámetro a estimar y no hay otra opción, ya que
lo contiene o no lo contiene.
156
Resumiendo, los extremos del intervalo son variables aleatorias, mientras que el
parámetro a determinar es constante.
Los pasos a seguir para construir intervalos de confianza para un parámetro, son:
1. Fijar el nivel de confianza 1 - a que se desea en la estimación.
2. Extraer la muestra y calcular el o los estadísticos necesarios.
3. Determinar la distribución muestral (normal estándar Z, t, chi cuadrado, F, etc.) que tiene el estadístico
empleado, el mismo que debe ser una función del estimador y del parámetro, es decir f (ú, 9).
4. Conocida la distribución del estadístico y el nivel de confianza, se establece la relación: 1 - a = P[ d1 < f (é?, 9)
< d2 ]. Donde d1 y d2 son valores obtenidos de acuerdo a la distribución muestral.
5. Dentro de la probabilidad se trabaja las desigualdades de modo tal que al centro quede el parámetro 9 y en los
extremos los límites inferior y superior de confianza buscados, dependiendo del estimador y de los valores d 1
y d 2.
Se verán los casos paramétricos, es decir aquellos en los que se tiene conocimiento
del tipo de distribución de la población o del estimador (Bernoulli, Binomial,
Poisson, Normal, t, chi-cuadrado, F, etc.) los mismos que estudiamos en los capítulos
Trabajaremos primero un Caso General con muestras grandes (n > 30) los intervalos de confianza para la media
^, la proporción P, la diferencia de medias ^X - ^Y, la diferencia de proporciones P1 - P2, los totales conocida la
media y la proporción, ya que sus estimadores tienen distribución normal y la determinación de los intervalos de
confianza para cada uno de ellos es similar.
Q-Q
Es decir, que sí é? ~ N[9, crj ] entonces: Z = --------------- N ( 0, 1 ). Así tenemos:
2 y 3.
Media:
X ^ N(M,a2 /n)
y
1).
157
Dif. Medias: X - Y ~ N( juX - pY , a2x_T) y Z =
X - Y - (Ax -Ay))
a
N(0 , 1)
X -Y
n
SX
X
Proporción: p = — --------------- = — ^ N
nn
P,
n
Z=
p-P
~\PQ
]n
N(0, 1)
Total:
A = NP = Np ^ N(NP, N2a2p ) y
Np - NP Z = Np—— ~ N(0, 1)
Na „
Dif. Proporc.: p1 - p2 ~ N(P1 - P2 , a2^_p2) y Z =
p1 - p2 - (P1 - P2)
a
p1 - P2
1)
Para todos ellos, dado un nivel de confianza 1 - a es posible hallar:
N(o
1 - a = P [ - Z0 < Z < Z 0 ]
(1)
Donde los valores Z0 son simétricos, de modo tal que centralizan la probabilidad 1 - a y se determinan como Z0 =
Z a , cuyos valores son ubicados en la tabla de la
distribución normal estándar. Así tenemos:
y
2
1-a 1 - a/2 Zo = Z “
1-“
2
o.9o o.95 Zo = Zo.95 = 1.645
0-0
Reemplazando la v.a. Z = -------------------- en (1) y trabajando con la desigualdad buscando
a.^
1
2
2
2
2
159
Dif. Medias :
Dif. Proporc. :
PX-PY m
( X - Y) - Z_ — rx-Y , (X - Y) + Z_ — rr_f _ 2 2 _
P - P2 m
(P1 - P2) - — rp1 - p2 , (?1 - P2) - Z — rp1 - p2 _ 2 2 _
5.1 INTERVALO DE CONFIANZA PARA LA MEDIA Y TAMAÑO DE MUESTRA
Sea Xi, X2, .................................. ,X„ una muestra aleatoria de tamaño n de una población X
distribuida con media p desconocida y varianza r2 conocida.
Sabemos que el estimador de la media poblacional p, es la media muestral Jf, y que para n suficientemente grande
(n > 30) por el teorema central del límite:
X ^ N(p,r /n) y
Entonces, para un nivel de confianza 1 - a, se tiene que: 1 - a = P [ - z0 < Z < z0 ] = P
Z = (X p ~ N(0, 1). r/\ n
i-— r/\ n i—
v 2 r ' ^n 2 y
Trabajando como en el caso general y dejando al centro de la desigualdad el
parámetro poblacional p , se obtiene:
f \
1 - a = P X - Z — r <p< X + Z
v 2 n 1-2 -'¡n y
A partir del cual se deduce el intervalo de confianza para la media poblacional p siguiente:
confianza.
160
Donde el error de estimación E para la media es:
E=± Z
a
ó E = ±Z
a \N - n
2
o2 = varianza de la variable en estudio. Si se desconoce se estima con una muestra pasada o reciente (S2).
161
E = \X - |i| = error máximo permisible.
• Si la fracción inicial de muestreo f = n0 / N < 0.05 ó n0 < 0.05N ^ n = n0.
• Si f = n0 / N > 0.05 es necesario el factor de corrección para poblaciones finitas y se ajusta el tamaño de muestra
así:
Ejemplo 3
En el estudio de mercado del ejemplo 2, para estimar la venta promedio mensual de una nueva marca de
gaseosas, ¿Qué tamaño de muestra debe tomarse, si se desea que X difiera de |x en menos de S/. 30, con el 95
% de confianza?
Solución
Datos: S = 120, E = \X - |i| = S/. 30 y según la tabla de la distribución normal estándar, al 95% de confianza: Z =
Z0. 975 = 1.96
Entonces:
Z2a2 1.962x1202 ^ ,
nn = —— = ---------------------------------- = 61 tiendas. Rpta.
0 E2 302
5.2 INTERVALO DE CONFIANZA PARA EL TOTAL (conocida la media)
Sea X1, X2, ............................. , X una muestra aleatoria de tamañazo n de una población X
de tamaño N, distribuida con media ^ desconocida y varianza a 2 conocida.
Sabemos que el estimador del total poblacional X = N|j, , es NI, y que para n suficientemente grande (n > 30) por
el teorema central del límite:
X = Nfi = NX ^ n(Nu, N2a2) y Z = NX
n
N^ ~ N(0, 1)
al 100(1 - a ) % de confianza.
Observe que si se quiere construir intervalos de confianza para el total poblacional, basta con multiplicar por N los
límites encontrados para la media poblacional; y viceversa, si se conoce el intervalo de confianza para el total
poblacional, entonces dividirlo entre N para determinar los intervalos para la media poblacional.
Ejemplo 4
En el ejemplo 2, si el número de tiendas de la cadena es 1000, calcule e interprete un intervalo de confianza del
95% para determinar el monto total mensual de las ventas de la nueva marca de gaseosas en la cadena de
tiendas. Solución
163
En el ejemplo 2, se ha determinado que la verdadera venta media mensual de gaseosas en la cadena de tiendas
es: ^ € [960.80, 1039.20] S/. con el 95% de confianza.
Entonces, para hallar los límites de confianza para la real venta total mensual de gaseosas, se multiplica a los
límites anteriores por 1000. Es decir,
T = N € [(1 000x 960.8) , (1 000x1039.2)]
T = N € [960 800, 1 039 200] S/. con el 95% de confianza.
Interpretación: el monto total mensual por la venta de gaseosas se encuentran entre S/. 960 800 y 1 039 200 con
el 95% de confianza.
5.3 INTERVALO DE CONFIANZA PARA LA PROPORCIÓN Y TAMAÑO DE MUESTRA
Sea X1, X2, ............................. ,Xn una muestra aleatoria de tamañazo n de una población
binomial X con parámetro P.
Sabemos que el estimador de la proporción poblacional P , es la proporción muestral p, y que para n
suficientemente grande (n > 30) por el teorema central del límite:
Trabajando como en el caso general y dejando al centro de la desigualdad la proporción poblacional P, se obtiene:
n
n
n
Entonces, para un nivel de confianza 1 - a, se tiene que:
(
p—P
p
1 - a = P [ - Z0 < Z < Z0 ] = P— 7 < ------ < 7
n
n
con el 100 (1 - a ) % de confianza.
2*2
Como los valores poblacionales P y Q = 1 - P se desconocen, se estiman mediante p y q =1 - p, resulta entonces
el intervalo de confianza para la proporción poblacional P siguiente:
Pe
Pe al 100 (1 - a ) % de conf.
\pq \N-n * Z \pq \N-n p-Zi-rJ n \¡N-r p + Z1-rl n Vn- 1 J
Z2 PQ
E2
Donde:
Z = valor de la abscisa de la distribución normal estándar para un nivel de confianza (1 - a) dado.
P = proporción de éxitos para la variable en estudio. Si se desconoce se estima con una muestra pasada o reciente
(p). Q = 1 - P.
E = |p - P| = error máximo permisible.
• Si la fracción inicial de muestreo f = n0 / N < 0.05 ó n0 < 0.05N ^ n = n0.
• Si f = n0 / N > 0.05 es necesario el factor de corrección para poblaciones finitas y se ajusta el tamaño de muestra
así:
a
V
165
Ejemplo 5
El auditor de una dependencia gubernamental de protección del consumidor, quiere determinar la proporción de
reclamos sobre pólizas de enfermedades que paga el seguro, en un plazo de dos meses de haber recibido el
reclamo. Se selecciona una muestra aleatoria de 200 reclamos y se determina que 80 fueron pagados en un plazo
de 2 meses después de recibidos. a) Calcule e interprete un intervalo del 99 % de confianza para la proporción
real de reclamos pagados dentro de ese plazo de dos meses; y b) Con un 95% de confianza, ¿qué tamaño de
muestra (reclamos) será necesario si desea cometer un error máximo del 5%?
Solución
a) n = 200, X = 80, 1 - a = 0.99, Z0 = Z 0.995 = 2.5 75
p = proporción muestral de reclamos pagados en el plazo de dos meses.
X 80
p = —= ---------------- = 0.4, q = 1 - p = 0.6
n 200
El intervalo de confianza para la verdadera proporción poblacional P de reclamos pagados en plazo de dos meses,
es:
P-Z aJ— , P + Z « 2 ^ n 1-i
Pe
Reemplazando valores se tiene:
confianza.
Si las muestras se toman sin reposición de una población finita de tamaño N, debe emplearse el factor de
corrección por finitud y el intervalo será:
NP e
Np — N7
\pq \N — n n] N — 1
, Np + N7
\pq \N — n n v N — 1
al 100 (1 - a ) % de
confianza.
a
1
1
2
V
y
a
a
2
2
167
Observe que si se quiere construir intervalos de confianza para el total poblacional, basta con multiplicar por N los
límites encontrados para la proporción poblacional; y viceversa, si se conoce el intervalo de confianza para el total
poblacional, entonces dividirlo entre N para determinar los intervalos para la proporción poblacional. Ejemplo 6
En el problema 6, si en la dependencia gubernamental de protección del consumidor hay 5 000 reclamos sobre
pólizas de enfermedades que paga el seguro, en un plazo de dos meses de haber recibido elreclamo.
Calcule e
interprete un intervalo del 99% de confianza para el total verdadero de
reclamos pagados dentro de ese plazo de dos meses.
Solución
En el ejemplo 6, se ha determinado que la verdadera proporción de reclamos, sobre pólizas pagadas dentro del
plazo de dos meses de haber recibido el reclamo, se encuentra entre 0.311 y 0.489 con el 99% de confianza.
Entonces, para hallar los límites de confianza para el total de reclamos pagados dentro del plazo de dos meses,
se multiplica a los límites anteriores por 5 000. Es decir,
A = N P e [(5 000 x 0.311), (5 000 x 0.489)]
A = N P e [1 555, 2 445 ] con el 99% de confianza. Rpta.
Interpretación: el verdadero total de reclamos, sobre pólizas pagadas dentro del plazo de dos meses de haber
recibido el reclamo, se encuentra entre 1 555 y 2 445 reclamos con el 99% de confianza.
5.5 INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS
Sea X1, X2, ............................ ,Xn una muestra aleatoria de tamañazo n de una población X de
tamaño N, distribuida con media ^ X desconocida y varianza ai^ conocida.
Sea también Y1, Y2, ................................. ,Ym una muestra aleatoria de tamañazo m de una
población X de tamaño M, distribuida con media ^ Y desconocida y varianza a2 conocida.
Sabemos que el estimador de la diferencia de medias poblacionales ^X - es la diferencia de medias muestrales X
- Y , y que para n y m suficientemente grandes (n y m > 30) por el teorema central del límite:
168
X - Y ~ n( AX -VY , -Y) yZ=
X - Y - (Ax -Ay))
u
N(0 , 1)
X -Y
Entonces, para un nivel de confianza 1 - a, se tiene que:
1 - a = P [- Zo < Z < Zo] = P
r- z < X - Y - (PX-MY ) < z ^
V2
u
X-Y
2J
Trabajando como en el caso general y dejando al centro de la desigualdad el parámetro poblacional px - pY, se
obtiene:
1-a=P
(X - Y) - Z, a UX-Y <MX -MY< (X - Y) + Z a UX-Y
A partir del cual se deduce el intervalo de confianza para la diferencia de medias poblacionales p x - pY siguiente:
(X - Y) - Z a UX-Y , (X - Y) + Z a UX-Y
<Z
a
P1 — P2
2y
Trabajando como en el caso general y dejando al centro de la desigualdad la proporción poblacional P 1 - P2 se
obtiene:
1-a=P
(P1 — P2) — Z a ap1 — P2 <P1 — P2 < (P1 — P2) + Z a ap1 — P2
A partir del cual se deduce el intervalo de confianza para la diferencia de proporciones poblacionales Pi - P2
siguiente:
conf.
Donde a „ = a „ se obtiene a partir de:
P1— Pl Pl—P1 r
a = PQ , PQ2
P1 — P2 ■'
óa
_ PQ1
P1 — P2
N — «11 P2Q2
— i y «2
N2 — n2 1
N — 1 v n2 1 y
Como los proporciones poblacionales P1 , Q1 , P2 y Q2 se desconocen, se
x X
estiman con las proporciones muestrales px = —, q1 = 1 - p1 , p2 = —2 y q2
X
«1
= 1 - p2 , resultando entonces:
a = m + P^ o
1 2 V n1 n2
a
_ pq
P1 —P 2
«1
N1 — «1 ,N1 — 1
+
P2^2
N2 — «2
N—1vN21y
a
1
2
2
2
171
Ejemplo 8
Una empresa de estudios de mercado quiere estimar las proporciones de hombres y mujeres que conocen un
producto promocionado a escala nacional. en una muestra aleatoria de 100 hombres y 200 mujeres se determina
que 20 hombres y 60 mujeres están familiarizados con el artículo indicado. a) Calcular el intervalo de confianza
de 95 % para la diferencia de proporciones de hombres y mujeres que conocen el producto. b) ¿Son iguales las
proporciones de hombres y mujeres que conocen el producto?
Solución
Sea el grupo 1, el referido a los hombres y el grupo 2, a las mujeres.
a) El intervalo de confianza para la diferencia de proporciones de hombres (P 1 ) y de mujeres (P2 ) que conocen
el producto, P1 - P2 está dado por:
P - P2 e
(P1 - P2) - a ap1 - p2 , (P1 - P2) + a ap
(1)
Si 1 - a = 0.95, entonces Z0 = 1.96
Como: n1 = 100, X1 =20, n2 = 200 y X2= 60
2
2
X 20 _ X 60 _
Entonces: p =—1 = -------------------- = 0.20 y p =—2 = ------ =0.30
n 100 n 200
^ = M + P2Q2 (0.20)(0.80 | (0.30)(0.70) _QQ515
P1 - P2 ]¡ n n v 100 200 .
Z^a^-Pi = 1 96 (0.0515) = 0.1009 Reemplazando valores en (1) se tiene que:
P1 - P2 e [(0.20 - 0.30) - 0.1009 ; (0.20 - 0.30) + 0.1009] = [0.10 ± 0.1009]
P1 - P2 e [-0.2009 ; 0.0009] con el 95% de confianza. Rpta.
Interpretación: la diferencia de proporciones de hombres (P1) y de mujeres (P2) que conocen el producto, está
entre -0.2009 y 0.0009 con el 95% de confianza.
b) La pregunta ¿Son iguales las proporciones de hombres y mujeres que conocen el producto? implica preguntar
¿P1 = P2? o también ¿P1 - P2 = 0?
172
La diferencia P1 - P2 = 0 está incluida en el intervalo de confianza construido en a), puede ser cero, es decir P1 -
P2 = 0 o P1 = P2.
Por lo tanto, las proporciones de hombres y mujeres que conocen el producto son iguales. Rpta.
Veamos a continuación la construcción de intervalos de confianza para la media poblacional y la diferencia de
medias poblacionales, cuando se trabaja con muestras pequeñas (n < 30), donde es necesario utilizar la
distribución t de student. El proceso de construcción es idéntico a los determinados anteriormente.
5.7 INTERVALO DE CONFIANZA PARA LA MEDIA (n < 30)
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con distribución N(u, a 2), con
varianza desconocida, al estudiar la distribución t de student vimos que para muestras pequeñas, n < 30, la variable
aleatoria:
r-X-u i
T = ---------------------------------------------------------------------¡= ~ tn-1
S l4n
Esta variable aleatoria depende de valores conocidos con la información muestral, entonces, dado un nivel de
confianza 1 - a es posible hallar:
1 - a = P [ - t0 < T < te ] ...................................................................................... (1)
Donde los valores t0 son simétricos, de modo que centralizan la probabilidad 1 - a y se determinan como t0 = t a ,
cuyos valores son ubicados en la tabla
1 , n-1
2
de la distribución t de student.
X-u
Reemplazando la variable aleatoria T = ------------------------------ -¡= en (1) y trabajando con la
SNn
desigualdad buscando dejar al centro el parámetro u , la probabilidad queda como:
X -u
1 - a = P [- t0 < T < t0 ] = P [ - t0 < < t0]
S lv n
Multiplicando por el error estándar del estimador S Ia/2 en la desigualdad:
173
1 - a = P [- t0 S /\fn < X — M < t0 S /-Jn ]
Restando el estimador X en la desigualdad
1 - a = P [- X - t0 S U¡n < - m < - X + t0 S U[n ] Multiplicando por (-1) y manteniendo el sentido de la desigualdad,
se tiene:
1 - a = P [ X - t0 S /\fn < m < X + t0 S /\fn ]
A partir del cual se obtiene el intervalo de confianza para el parámetro M ,
M e [ X - t0 S/-Jñ , X + t0 S/ --Jn ] con el 100 (1 - a )% de confianza.
El intervalo de confianza para el total NM se determina multiplicando el intervalo de confianza para la media M por
el tamaño de la población N, obteniéndose:
Nm e [N X - Nt0 S / \¡n ; N X + Nt0 S /-■¡n ] con el 100 (1 - a )% de
confianza.
Ejemplo 9
Una Universidad grande (12 000 alumnos) quiere estimar el número promedio de días de enfermedad de los
estudiantes durante un año
académico; una muestra de 25 estudiantes indica que x =5.2 días yS = 3.1
días.
Calcule e interprete intervalos de confianza del 95% Para: a) el verdadero número medio de días de enfermedad
de los estudiantes, y b) el verdadero número total de días que los estudiantes se enferman en un año.
Solución
N = 12 000 alumnos, n = 25, x = 5.2 días y S = 3.1 días
Para 1 - a = 0.95 , t0 = t24 , 0.975 = 2.064
a) El intervalo de confianza para la media M está dado por:
M e [X - t0 S^jn , X + t0 S/afn ]
Reemplazando valores tenemos:
31 31
m e [5.2 - 2.064 x -¿= , 5.2 + 2.064 x ^=] = [5.2 ± 1.28]
a/25 a/25
Por lo tanto: M e [3.92 ; 6.48] días con el 95% de confianza.
Rpta.
174
Interpretación: en la Universidad el verdadero número medio de días de enfermedad de los estudiantes en el año,
se encuentra entre 3.92 y 6.48 días con el 95% de confianza.
b) Para hallar el intervalo de confianza para el total se multiplica por N = 12 000 el intervalo de confianza para la
media encontrado en a) y se obtiene:
Total = Np e [12 000 (3.92) , 12 000 (6.48) ]
Por lo tanto:
Total = Np e [47,040 ; 77,760 ] días con el 95% de confianza.
Rpta.
Interpretación: el verdadero número total de días que los estudiantes se enferman en un año, se encuentra entre
47,040 y 77,760 días con el 95% de confianza.
5.8 INTERVALO DE CONFIANZA PARA LA VARIANZA
Al estudiar la distribución chi-cuadrado determinamos que si X1, X2, ... , Xn es una muestra aleatoria de tamaño n
de una población normal con media p y varianza a2, entonces:
La función de la varianza muestral x2 = ———— x2n_x
a2
Esta variable aleatoria depende de valores conocidos con la información muestral, entonces, dado un nivel de
confianza 1 - a es posible hallar:
1 - a = P [ a < x2 < b ] ........................................................................................ (2)
Los valores a y b son valores chi-cuadrados, obtenidos en la tabla 2, con n - 1 grados de libertad, centralizando la
probabilidad 1 - a y se determinan como:
2
a = x « n_1, — y
2
b = x\ ^
n _1, 1 ---------
2
los mismos que son ubicados en la tabla 2, de la distribución chi - cuadrado.
1 )s ^
Reemplazando la v.a. x2 = - --------------------------- - — en (2) y trabajando con la desigualdad
a2
buscando dejar al centro el parámetro q2, la probabilidad queda como:
(n _ !)£ 2
1 - a = P [ a < x < b ] = P [ a < ---------------------------- ^— < b ]
175
a2
2
Dividiendo entre (n - 1) S tenemos:
1-a=P
a 1 b
(n -1)S2 a2 (n -1)S2
Tomando el inverso dentro de la probabilidad y buscando mantener el sentido de la desigualdad, se tiene que:
^2 i\o2'
1-a=P
(n - 1)S2 ^ a2^(n - 1)S2 b
a
Luego se tiene que el intervalo de confianza para la varianza a2, está dado por:
confianza.
Un intervalo de confianza para la desviación estándar a se obtiene sacando raíz cuadrada a cada uno de los
límites del intervalo anterior, entonces:
ae
(n - 1)S2 (n - 1)S2
b
a
\(n - 1)S2
72
l(n - 1)S2
72
Xn-1,1-a / 2 \ Xn-1,a/2
al 100(1 - a)% de
confianza
Ejemplo 10
Para el ejemplo 9, en la Universidad grande se estudia el número de días que los estudiantes se enferman durante
el año académico, una muestra de 25 estudiantes indica que x = 5.2 días y S = 3.1 días.
Calcule e interprete intervalos de confianza del 95% para la varianza y la desviación estándar del número de días
que los estudiantes se enferman.
Solución
El intervalo de confianza para la varianza está dado por:
a2 e
(n - 1)S2 (n - 1)S2
b
a
Como n = 25 y 1 - a = 0.95, entonces:
2 _ A ,, 1 __ ,„2
2
a = X = 12 4
a x24,0.025 12.4
y
b = x2 = 39 4
b x24,0.975 3 9 .4
177
S2
Multiplicando en la desigualdad por se tiene que:
S
S2
o
1 - a = P [ c -f < -f < d -f ]
S2
o2 2 o2
SX oX SX
SX <
S2 oY
a
<
<
1S
X
c S2
]
F
1#
S2
a SY
n-1, m-1, —
Entonces, el intervalo de confianza para la razón de varianzas o\ / o2, está dado por:
o2 / o2 o2 / o2
Sx / Sy Sx / Sy S2/ S2 _ S2/ S2
d’c F’F al 100 (1 - a)% de
111a,,a
n-1,m-1,1-— n-1,m-1,—
_22_
o
X
e
o
conf.
Ejemplo 11
Se hacen 16 ensayos para cada uno de los tratamientos X e Y, con las siguientes varianzas maestrales S\ = 35 y
S2 = 10. a) Calcule e interprete un intervalo del 95% de confianza para o\ / o2 b) ¿Son iguales las varianzas
poblacionales de X e Y?
Solución
a) El intervalo de confianza solicitado es:
o
o
e
1
(N X
<N
SX/ S¡ 1
_d’ c
2
2
2
178
35110 35110
;
2.86 0.349
= [1.22; 10.03] con el 95% de confianza. Rpta.
Interpretación: la razón de varianzas de las poblaciones X e Y se encuentra entre 1.22 y 10.03 con el 95% de
confianza.
b) Preguntar si ¿Son iguales las varianzas poblacionales de X e Y? es similar a
o2
preguntar si ¿ a2x = o2 ? o también si ¿ -—- = 1?
oY
Ejemplo 12
Se compararon dos marcas de cigarrillos, X e Y, respecto a su contenido medio de nicotina en miligramos; dos
muestras aleatorias de 21 cigarrillos de cada marca, dieron estos resultados:
X = 14.3, n = 21, Sx = 2.9 y Y = 15.7, m = 21, Sy = 3.8.
180
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre los contenidos medios de
nicotina para las dos marcas de cigarrillos. b) ¿Son iguales los contenidos medios de nicotina?
Solución
a) Primero determinamos si las varianzas son iguales con el intervalo de confianza
a
para la razón de varianzas: -X- e
s2/s2. s2/ s2
d
Datos: n = m = 21, S2 = 2.92 = 8.41, S2 = 3.82 = 14.44. Como 1 - a = 0.95,
entonces d = F20 , 20 , 0.975 = 2.46 y c = F20 , 20 , 0.025 = 1/ F20 , 20 , 0.975 = 1/ 2.46 =
0.407.
Reemplazando valores en el intervalo se tiene que:
"8.41/14.44 8.41/14.44
aL e
aY
2.46 0.407
= [0.24; 1.43] con el 95% de confianza.
2
Dado que el intervalo toma el valor 1, es decir aX. = 1, entonces a2x = a2.
a Y
Considerando que las muestras son pequeñas y que las varianzas del contenido de nicotina son iguales, el
intervalo de confianza para la diferencia entre los contenidos medios de nicotina para las dos marcas de cigarrillos
está dado por:
r ,v _ _ (n _ 1)SX + (m _ 1)SY 1 1
px - Py e [ (X - Y ) + te + ]
\| n + m _ 2 \¡n m
Datos del problema:
X = 14.3, n = 21, Sx = 2.9 y Y = 15.7, m = 21, SY = 3.8.
Como n = m = 21, ^ los grados de libertad de la t son n + m - 2 = 21 + 21 - 2 = 40
Si 1 - a = 0.95, ^ t0 = t40 , 0.975 = 2.021.
Reemplazando valores en la fórmula para el intervalo de confianza, tenemos que: px - PY e [(14.3 - 15.7) + 2.021
,/(21 _1)(Z9)2 + (21 _ 1)(3g ]
v 21 + 21 _ 2 v 21 21
^ p x - Py e [ (14.3 - 15.7) + 2.021(1.0431) ] ^ p x - Py e [ -1.40 + 2.11 ]
Por lo tanto:
p x - pY e [-3.51 , 0.71] mg. de nicotina con el 95% de confianza. Rpta.
181
c
aY
Interpretación: la diferencia entre los contenidos medios de nicotina para las marcas de cigarrillos X e Y se
encuentra comprendida entre -3.51 , 0.71 mg. con el 95% de confianza.
b) Responder a la pregunta ¿Son iguales los contenidos medios de nicotina en los cigarrillos X e Y? implica
preguntar ¿M X = MY? o también ¿M X - MY = 0?
La diferencia M X - MY = 0 está incluida en el intervalo de confianza construido en
a), es decir M X - MY = 0 o M X = MY. Por lo tanto, los contenidos medios de nicotina en los cigarrillos X e Y son
iguales. Rpta.
B) Caso de varianzas heterogéneas (a2x í a])
Sea X1, X2, ..., Xn una muestra aleatoria de tamaño n, de una variable aleatoria X con distribución N(m x, a'2x). Sea
también Y1, Y2, ..., Ym una muestra aleatoria de tamaño m de una variable aleatoria Y, con distribución N(m y, a2).
Si las varianzas son diferentes, se cumple que:
T = (X - Y )-{Mx - My ) t = ~ H
\l n m
(SL+Sp2
vn n2 ¡
Donde: H = —-—5 ---------------------- —t (valor entero) representa los grados de libertad.
f <?2\ f v2\
S2
V n1 y
+
S2
V n2 y
n -1 n2 -1
Esta variable aleatoria depende de valores conocidos con la información muestral, entonces, dado un nivel de
confianza 1 - a es posible hallar:
1 - a = P [ - t0 < T < t0 ] ............................................................................ (5)
Los valores t0 son simétricos, de modo tal que centralizan la probabilidad 1 - a y se determinan como t0 = t „
, cuyos valores son ubicados en la tabla 3
1—-, H 2
de la distribución t de student.
(X-Y)-(M —M ) Reemplazando la variable aleatoria T = --------- , —— en (5)
\l n m
tenemos:
182
1 - a = P [- to < T < to] = P [- to < (X ~ Y^ 7* } i to]
\nm
Trabajando con la desigualdad buscando dejar al centro el parámetro ^ X - M*Y, de manera similar a los intervalos
anteriores, la probabilidad queda como:
-2 -2 -2 -2
1-a=P[ (X - Y ) - to ^ - My < (X - Y ) + tM - ^ + ^ ]
L0
nm \l n m
A partir del cual se tiene que el intervalo de confianza para la diferencia de medias poblacionales ^ X - ^Y está dado
por:
-- -
^X - ^Y e [(X - Y ) + to —— + — ] al ioo(1- a )% de confianza.
\\ n m
Ejemplo 12
En un estudio para determinar si hay diferencia en el salario semanal de los hombres y las mujeres de una gran
empresa, se toma una muestra de 18 hombres encontrándose un promedio de S/. 42o y una desviación estándar
de S/. 5o, mientras que en una muestra de 15 mujeres se encontró un promedio de S/. 36o y una desviación
estándar de S/. 9o. Se pide:
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre los salarios medios semanales
de hombres y mujeres.
b) ¿Son iguales los salarios medios semanales de hombres y mujeres? Solución
a) Primero determinamos si las varianzas de los salarios son iguales con el
(\2 I C*2
2 o2 / o2
intervalo de confianza para las varianzas: —^ e —— ; - — M H M
—M L d c _
Datos: nn = 18, XH = S/. 42o, = 5o2 = 25oo, nM = 15,
XM = S/. 36o, -2 = 9o2 = 81oo. Como 1 - a = 0.95,
entonces d = F17 , 14 , o.975 = 2.9o y c = F17 , 14 , o.o25 = 1/ F14 , 17 , o.975 = 1/ 2.75 =
o.364.
Reemplazando valores en el intervalo se tiene que:
183
o
H
o
M
2500/8100
2.90
2500/8100
0.364
= [0.11; 0.85] con el 95% de
confianza.
Dado que el intervalo no toma el valor 1, es decir
o
o
± 1, entonces o„ í
M
o
M■
Considerando que las muestras son pequeñas y que las varianzas de los salarios semanales de hombres y
mujeres son diferentes, el intervalo de confianza del 95% para la diferencia de los salarios medios de hombres y
mujeres está dado por:
M h - Mm £ [(XH - XM ) + t0
+-
M
]
HM
Donde t0 = tH, 0.975 = t20, 0.975 = 2.086.
f n2 o2 ^2 SH | SM
Donde: H =
V nH
n
My
2222
H
S
M
^2500 8100^2 18 + 15 J
^2500^2 f8100^2
= 20.98 = 20
v 2H y 2
|V My
nH - 1 nM - 1
18
18 -1
15
15 -1
Reemplazando valores en el intervalo de confianza propuesto, se tiene:
M H - MM £ [(420 - 360) + 2.086 x 2500 + 8100 ] = [60 + 54.35]
V 18 15
Por lo tanto: M H - MM £ [5 65 ; 114.35] S/. con el 95 % de confianza. Rpta.
Interpretación: la diferencia entre los salarios medios semanales de hombres y mujeres se encuentra comprendido
entre S/. 5.65 y S/. 114.35 con el 95% de confianza.
b) Responder a la pregunta ¿Son iguales los salarios medios semanales de hombres y mujeres? implica responder
si ¿M H = MM? o también ¿M H - MM =
0?
La diferencia M H - MM = 0 no está incluida en el intervalo de confianza construido en a), es decir M H - MM ^ 0 o M
H ^ MM. Por lo tanto, los salarios medios semanales de hombres y mujeres son diferentes. Rpta.
184
2
E
2
V
V
INTERVALOS DE CONFIANZA PARA UN SOLO PARÁMETRO
I.C. PARA LA MEDIA POBLACIONAL: ^
Caso Intervalo
Caso Intervalo
(n - 1)S2 (n - 1)S2
2 2,2XaXa
La muestra es aleatoria de una población normal.
oe (1 -- ,n-1) (-,«-1)
I22_
Caso Intervalo
p + Z aM
1jJ\' n
La muestra es aleatoria y su tamaño es grande (n >
30)
Z02 pq n0
«0 = Z0V - n = «0 «0 = , — n = ---------------------------- 0—t
0 E 1 «0 0 E -1
+ T + «0
N N
185
INTERVALOS DE CONFIANZA PARA DOS PARÁMETROS
22
2
1
2
2
2
Dos muestras aleatorias independientes de q e
l
q2 F ’F
poblaciones normales.
1^11 R 1 1
1 - ,n-1,w-1 —,n-1,w-1
_22_
186
5.11 PROBLEMAS RESUELTOS
1. Demostrar que:
a) Las desigualdades |i - E < x < |i + E, son equivalentes a | x - |i | < E
b) Si 1 -a= P(-Z1—a/2 < Z < Z1—«/2) y Z =
entonces:
f ^
1 -a = P X - Z a^<M< X + Z a
1—2 Vn 1—W n y
l
Solución
a) En la desigualdad: |i - E < x < |i + E se resta |i en cada miembro y se obtiene:
1 x - |i 1 < E
a
1— f «Jñ y
2. Se desea estimar el peso total de una partida de 10,000 naranjas. Para ello se
selecciona una muestra aleatoria de 41 naranjas, la cual da una media de 200
gramos y una desviación estándar de 25 gramos. Calcule e interprete intervalos
de confianza del 95 % para:
187
—>
a) El verdadero peso promedio (p), el peso total (Np) y la varianza verdadera
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de p en menos de 13 gr. con el 99 % de
confianza?
Solución
Datos: N = 10000 naranjas, n = 41, X = 200 gr. S = 25 gr. 1 - a = 0.95
a) Para hallar el intervalo de confianza para la media y el total, si 1 - a = 0.95 ^ en la Tabla 1, Zo = Z0.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresión:
Reemplazando en (1) se tiene:
p e [200 - 7.64 ; 200 + 7.64] = [192.36 ; 207.64] gr. con el 95% de
confianza. Rpta.
Interpretación.- con el 95% de confianza, el verdadero peso medio de las naranjas se encuentra entre 192.36 y
207.64 gr.
Para hallar el intervalo de confianza para el Total (Np) se multiplica los límites de la media por N = 10000, así:
Total = Np e 10000 [192.36 ; 207.64] = [1’923600 ; 2’076400] gr. con el 95% de confianza. Rpta.
Interpretación.- con el 95% de confianza, el verdadero peso total de las naranjas se encuentra entre 1’923600 y
2’076400 gr.
El intervalo de confianza para la varianza está dado por:
2
(o ) de los pesos de las naranjas.
(1)
Donde el error de estimación para la media es:
(n _ 1)S2 (n _ 1)S2 a e ---------------------------------- , ------------
b a
Como n = 41 y 1 - a = 0.95, entonces en la Tabla 2:
a = x2 = 24.4 y b = x2 = 59.3
a x 40,0.025 24.4 y b x 40,0.975 593
a X40,0.025
(1)
Donde el error de estimación para la media es:
a
2
189
E = Z „ °= 2.575^ = 4.83 ml.
!-a 'jn A/4T
Reemplazando en (1) se tiene:
|i e [745 - 4.83 ; 745 + 4.83] = [740.17 ; 749.83] ml. con el 99% de
confianza. Rpta.
Interpretación.- con el 99% de confianza, el verdadero contenido medio de las botellas de gaseosa se encuentra
entre 740.17 y 749.83 ml.
b) El intervalo de confianza para la varianza está dado por:
o2 e
(n - 1)S2 (n - 1)S2
b
a
Como n = 41 y 1 - a = 0.99, entonces en la Tabla 2:
a -^40,0.005 20.7
y
b -^40,0.995 66 8
y
b=x2 = 99 7
b x74,0.975 "./
Se tiene además la desviación estándar muestral S = 2.7
Reemplazando valores en el intervalo de confianza para la varianza, se tiene
que:
a2 e
(75 _ 1)(2.7)2 (75 _ 1)(2.7)2
L 99.7 52.1
Por lo tanto:
a2 e [5.41 ; 10.35] (galones)2 con el 95% de confianza. Rpta.
Interpretación: con el 95% de confianza, la varianza de la gasolina comprada se encuentra entre 5.41 y 10.35
(galones)2.
Za
d) El tamaño de muestra está dado por: n0 =
E2
Donde: | x - p | = E = 0.5 galones, 1 - a = 0.95 ^ en la Tabla 1, Z = Z0.975 = 1.96 y S = 2.7. Reemplazando en la
fórmula para n se tiene:
a
2
191
1.962 2.72 _
n = ñ— = 112 clientes. Rpta.
o o.52
Interpretación.- para estimar el consumo medio de gasolina con el 95% de confianza y un error máximo de o.5
galones se requiere una muestra de 112 clientes.
5. Un proceso está programado para embolsar la cantidad media de 25o gramos de café. Se toma una muestra
aleatoria de 36 bolsas, resultando una media de 246.5 gramos y una desviación típica de 12 gramos.
a) Construya un intervalo de confianza del 95% para el verdadero peso medio de las bolsas con café.
b) ¿Se puede afirmar que no se está cumpliendo con el contenido medio en las bolsas?
c) Construya un intervalo de confianza del 95% para la verdadera varianza de
22
los pesos de las bolsas con café. ¿aceptaría usted que o = 25o gr por bolsa? Solución
Datos: |i = 25o gr., n = 36 bolsas, X = 246.5 gr., S = 12 gr., 1 - a = 0.95
a) Para hallar el intervalo de confianza para la media, si 1 - a = 0.95 ^ En la Tabla 1, Zo = Zo.975 = 1.96.
El intervalo de confianza para la media se obtiene con la expresión:
He
(1)
Donde el error de estimación para la media es:
E = Z a—= 196 4^ = 3 92 gr.
1- Vn
2 V36
Reemplazando en (1) se tiene:
|i e [246.5 - 3.92 ; 246.5 + 3.92] = [242.58 ; 25o.42] gr. con el 95% de
confianza. Rpta.
Interpretación.- con el 95% de confianza, el verdadero contenido medio de las bolsas con café se encuentra entre
242.58 y 25o.42 gr.
b) No se puede afirmar que no se está cumpliendo con el contenido medio en las bolsas de café, puesto que |i
= 25o gr., está en el intervalo de confianza obtenido en a).
192
c) El intervalo de confianza para la varianza está dado por:
a2 e
(n — 1)S2 (n — 1)S2 b a
Como n = 36 y 1 - a = 0.95, entonces en la Tabla 2:
2 _ on ¿ i _ ,„2
a X35,o.o25 2o.6
y
b X35,o.975 5 3 .2
y
b X35,0.975 5 3 .2
Interpretación.- para estimar el depósito medio a la vista, con el 95% de confianza y un error máximo de $ 150 se
requiere una muestra de 171 cuentas.
7. De un área de la ciudad en la que habitan 500 familias se extrae una muestra aleatoria de 50 familias,
obteniéndose los siguientes datos sobre el número de hijos por familia:
Hijos por familia (Xi) 3 4 5
0 1 2
Familias (ni) 7 4 3
20 10 6
Interpretación.- para estimar la proporción de hogares que están a favor de la reducción del precio del gas
doméstico, con el 95% de confianza y un error máximo del 5% se requiere una muestra de 35o hogares
consumidores de gas.
9. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana (con 1’4oo ooo hogares) indica
que el 3o.5 % de los hogares compra periódicos y revistas.
a) Determine un intervalo de confianza del 95 % para la proporción y otro para el total de hogares limeños que
compra periódicos y revistas.
b) ¿Aceptaría Ud. que menos del 25 % de hogares limeños compra periódicos y revistas?
c) Con un error del 2.5 % y una confianza del 95 %. ¿Qué tamaño de muestra es necesario para estimar la
proporción de hogares que compran periódicos y revistas?
Solución
Datos: N = 1’400,000 hogares, n = 1,000, p = o.3o5, q = 1 - p = o.695.
a) Para determinar el intervalo de confianza para la proporción de hogares que compra periódicos y revistas, si
1 - a = 0.95 ^ En la Tabla 1, Zo = Zo.975 =
1.96.
Si p = o.3o5 es la proporción muestral de hogares que compra periódicos y revistas, entonces el intervalo de
confianza para la verdadera proporción poblacional P de hogares que compra periódicos y revistas, es:
Pe
p—Z m pq, P+Z «
2«n2
Se desecha el factor de corrección para poblaciones finitas porque la fracción de muestreo n/N < o.o5.
Reemplazando valores se tiene:
P E [o.3o5 - 1.96 ; o.3o5 + 1.96 .j™.®5]
v 1ooo v 1ooo
P E [o.3o5 - o.o29 ; o.3o5 + o.o29]
Por lo tanto: P E [o.276 ; o.334] con el 95% de confianza. Rpta.
199
Interpretación.- la verdadera proporción (porcentaje) de hogares que compra periódicos y revistas en Lima
Metropolitana, se encuentra entre 0.276 y 0.334 (27.6% y 33.4%) con el 95% de confianza.
Para hallar el intervalo de confianza para el Total (NP) de hogares que compra periódicos y revistas, se multiplica
los límites de la proporción por N = 1’400,000 hogares, así:
Total = NP e 1’400,000 [0.276 ; 0.334] = [386,400 ; 467,600] hogares con el 95% de confianza. Rpta.
Interpretación.- el total de hogares que compra periódicos y revistas en Lima Metropolitana, se encuentra entre
386,400 y 467,600 hogares, con el 95% de confianza.
b) No aceptaría que menos del 25 % de hogares limeños compra periódicos y revistas, puesto que se encuentra
entre 27.6% y 33.4% (ver la parte a).
c) Datos: p = 0.305, q = 0.695, E = |p - P| = 0.025 y según la Tabla 1 de la distribución normal estándar, al 95% de
confianza: Z = Z0. 975 = 1.96. Reemplazando en la fórmula para el tamaño de muestra se tiene:
Z2 pq 1.962 x0.305x0.695
nn = —— = ---------------------------------------------------- = 1,303 hogares. Rpta.
0 E2 (0.025)2 5 F
Interpretación.- para estimar la proporción de hogares que compra periódicos y revistas, con el 95% de confianza
y un error máximo del 2.5% se requiere una muestra de 1,303 hogares.
10. Una muestra aleatoria de 500 compradores de un centro comercial se encontró que 300 compran alimentos
y bebidas.
a) Calcule e interprete un intervalo del 99% de confianza para la proporción verdadera de compradores que
adquieren alimentos y bebidas.
b) Con un 99% de confianza, ¿qué tamaño de muestra será necesario si desea cometer un error máximo del 4%?
Solución
Datos: n = 500 compradores, X = 300 compran alimentos y bebidas.
200
a) Para hallar los límites de confianza para la proporción de compradores que adquieren alimentos y bebidas, si
1 - a = 0.99 ^ En la Tabla 1, Zo = Z0.995 = 2.575.
Si p = proporción muestral de compradores que adquieren alimentos y bebidas, X 300
entonces: p = — = --------------------------= 0.60, q = 1 - p = 0.40.
n 500
El intervalo de confianza para la verdadera proporción poblacional P de compradores que adquieren alimentos y
bebidas, es:
PG
, P + Z “
P-Z
2«n2
Se desecha el factor de corrección para poblaciones finitas, asumiendo un número grande de compradores, tal
que la fracción de muestreo n/N < 0.05. Reemplazando valores se tiene:
™ ™ ~ /0.60x0.40 ~rrrr Í0.65x0.35 n
P e [0.60 - 2.575 J ----------------------------------- ; 0.60 +2.575 J --------------- ]
V 500 V 1000
P e [0.60 - 0.056 ; 0.60 + 0.056]
Por lo tanto: P e [0.544 ; 0.656] con el 99% de confianza. Rpta.
Interpretación.- con el 99% de confianza, la verdadera proporción (porcentaje) de compradores que adquieren
alimentos y bebidas en el centro comercial, se encuentra entre 0.544 y 0.656 (54.4% y 65.6%).
b) Datos: p = 0.60, q = 0.40, E = |p - P| = 0.04 y según la Tabla 1 de la distribución normal estándar, al 99% de
confianza: Z = Z0. 995 = 2.575.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
Z2 pq 2.5752 x0.60x0.40 _
nn = —^ ------------------------------------------------------ = 995 compradores. Rpta.
0 E (0.04)2
Interpretación.- para estimar la proporción de compradores que adquieren alimentos y bebidas en el centro
comercial, con el 99% de confianza y un error máximo del 4% se requiere una muestra de 995 compradores.
11. Se tomó una muestra aleatoria de 800 mujeres casadas en Lima y se encontró que 560 están a favor del uso
de la píldora del día siguiente.
201
a) Calcule e interprete un intervalo del 95% de confianza para la verdadera proporción de mujeres casadas que
están a favor del uso de la píldora del día siguiente.
b) Con el 95 % de confianza, ¿Qué tamaño de muestra debe tomarse, si se desea un error máximo del 3%?
Solución
Datos: n = 800 mujeres casadas, X = 560 a favor del uso de la píldora del día siguiente.
a) Para hallar los límites de confianza para la proporción de mujeres casadas que están a favor del uso de la
píldora del día siguiente, si 1 - a = 0.95 ^ En la Tabla 1, Zo = Z0.975 = 1.96.
Si p = proporción muestral de mujeres casadas que están a favor del uso de la
píldora del día siguiente, entonces: p = X=560 = 0.70, q = 1 - p = 0.30.
n 800
El intervalo de confianza para la verdadera proporción poblacional P de mujeres casadas que están a favor del
uso de la píldora del día siguiente, es:
Pe
p z \pq p + Z
p-Z «A —, p + Z «
i-2 V n 1-2
Se desecha el factor de corrección para poblaciones finitas, asumiendo un número grande de mujeres casadas
en Lima, tal que la fracción de muestreo n/N < 0.05.
Reemplazando valores se tiene:
P e [0.70 - 1.96,1°™ ; 0.70 + 1.96 J015*0” ]
V 800 v 800
P e [0.70 - 0.032 ; 0.70 + 0.032]
Por lo tanto: P e [0.668 ; 0.732] con el 95% de confianza. Rpta.
Interpretación.- la verdadera proporción (porcentaje) de mujeres casadasque
están a favor del uso de la píldora del día siguiente en Lima, se encuentra entre 0.668 y 0.732 (66.8% y 73.2%)
con el 95% de confianza.
b) Datos: p = 0.70, q = 0.30, E = |p - P| = 0.03 y según la Tabla 1 al 95% de
confianza: Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
202
Z2 pq 1.962 xo.7oxo.3o _ .
n = —= ----------------------------------------- Ó ------- = 896 muieres casadas. Rpta.
o E2 (o.o3)2
Interpretación.- con el 95% de confianza y un error máximo del 3% para estimar la proporción de mujeres casadas
que están a favor del uso de la píldora del día siguiente, se requiere una muestra de 896 mujeres casadas.
12. Una “Encuesta de Opinión” realizada a 1000 ciudadanos de Lima Metropolitana (con 5.5 millones de
ciudadanos) indica que el 19.5 % de los ciudadanos juega la tinka.
a) Determine un intervalo de confianza del 95 % para la proporción y otro para el total de ciudadanos limeños que
juegan la tinka.
b) Con un error del 3.5 % y una confianza del 95 %. ¿Cuál sería el tamaño de muestra necesario para estimar la
proporción de ciudadanos que juega la tinka?
Solución
Datos: N = 5’500,000 ciudadanos, n = 1,000, p = o.195, q = 1 - p = o.8o5.
a) Para determinar el intervalo de confianza para la proporción de ciudadanos limeños que juegan la tinka, si 1
- a = 0.95 ^ En la Tabla 1, Zo = Zo.975 =
1.96.
Si p = o.195 es la proporción muestral de ciudadanos limeños que juegan la tinka, entonces el intervalo de
confianza para la verdadera proporción poblacional P de ciudadanos limeños que juegan la tinka, es:
Pe
pq i z
p Z \ p
P ~ Z a J ,p + Z a
2 'i n 1-2
Se desecha el factor de corrección para poblaciones finitas porque la fracción de muestreo n/N < o.o5.
Reemplazando valores se tiene:
^ ^ o.195xo.8o5 , /o.3o5xo.695 n
P e [o. 195 - 1.96J ---------------------------------------- ; o.195 + 1.96J --------------------- ]
V 1ooo v 1ooo
P e [o.195 - o.o25 ; o.195 + o.o25]
Por lo tanto: P e[o.17 ; o.22] con el 95% de confianza. Rpta.
Interpretación.- con el 95% de confianza la verdadera proporción (porcentaje) de ciudadanos limeños que juegan
la tinka, se encuentra entre o.17 y o.22 (17% y 22%).
203
Para hallar el intervalo de confianza para el Total (NP) de ciudadanos limeños que juegan la tinka, se multiplica
los límites de la proporción por N = 5’500,000 ciudadanos, así:
Total = NP e 5’500,000 [0.17 ; 0.22] = [935,000 ; 1’210,000] ciudadanos con el 95% de confianza. Rpta.
Interpretación.- el total de ciudadanos limeños que juegan la tinka, se encuentra entre 935,000 y 1’210,000
ciudadanos, con el 95% de confianza.
b) Datos: p = 0.195, q = 0.805, E = |p - P| = 0.035 y según la Tabla 1 de la distribución normal estándar, al 95%
de confianza: Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
Z2 Pq 1.962 *0.195*0.805
n = —= -----------------------------------------------Ó -------- = 492 ciudadanos. Rpta.
0 E2 (0.035)2
Interpretación.- para estimar la proporción de ciudadanos limeños que juegan la tinka, con el 95% de confianza y
un error máximo del 3.5% se requiere una muestra de 492 ciudadanos.
13. En una muestra aleatoria de 600 compradores de un centro comercial se encontró que 360 están a favor de
un horario más amplio para las compras.
a) Calcule e interprete un intervalo del 95% de confianza para la proporción
verdadera de compradores que están a favor de un horario más amplio para las compras.
b) ¿Esta evidencia es suficiente para concluir que menos de 2/3 de los
compradores están a favor de un horario más extenso? Explique.
c) Con un 95% de confianza, ¿qué tamaño de muestra será necesario si desea cometer un error máximo del
4.5%?
Solución
Datos: n = 600 compradores, X = 360 están a favor de un horario más amplio para las compras.
a) Para hallar los límites de confianza para la proporción de compradores que están a favor de un horario más
amplio para las compras, si 1 - a = 0.95 ^ En la Tabla 1, Zo = Z0.975 = 1.96.
204
Si p = proporción muestral de compradores que están a favor de un horario más
amplio para las compras, entonces: p = X=360 = 0.60, q = 1 - p = 0.40.
n 600
El intervalo de confianza para la verdadera proporción poblacional P de compradores que están a favor de un
horario más amplio para las compras, es:
Pe
No se considera el factor de corrección para poblaciones finitas, asumiendo un número grande de compradores
en el centro comercial, tal que la fracción de muestreo n/N < 0.05.
Reemplazando valores se tiene:
„™™ ^ 0.60x0.40 , _ 0.60x0.40 n
P e [0.60 - 1.96 J ------------------------------- ; 0.60 + 1.96 J----------------- ]
V 600 V 600
P e [0.60 - 0.039 ; 0.60 + 0.039]
Por lo tanto: P e [0.561 ; 0.639] con el 95% de confianza. Rpta.
Interpretación.- la verdadera proporción (porcentaje) de compradores que están a favor de un horario más amplio
para las compras en el centro comercial, se encuentra entre 0.561 y 0.639 (56.1% y 63.9%) con el 95% de
confianza.
b) Se puede concluir que menos de 2/3 de los compradores están a favor de un horario más extenso, puesto que
P se encuentra entre 0.561 y 0.639 (ver parte
a).
c) Datos: p = 0.60, q = 0.40, E = |p - P| = 0.045 y según la Tabla 1 al 95% de confianza: Z = Z0. 975 = 1.96.
Reemplazando en la fórmula para el tamaño de muestra se tiene:
Z2 pq 1.962 x0.60x0.40
nn = —; -------------------------------------------= 455 compradores. Rpta.
0 E2 (0.045)2
Interpretación.- con el 95% de confianza y un error máximo del 4.5% para estimar la proporción de compradores
que están a favor de un horario más amplio para las compras en el centro comercial, se requiere una muestra de
455 compradores.
205
14. En un estudio para determinar el gasto medio mensual en arbitrios en las ciudades A y B, se toma una muestra
al azar de 2oo hogares de A arrojando un gasto medio de S/. 25o y una desviación estándar de 15. Una
muestra al azar de 18o hogares de la ciudad B da una gasto medio de 235 y una desviación estándar
a) Determine un intervalo de confianza del 99 % para la diferencia del gasto medio en las ciudades A y B.
b) ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B? Solución
Datos: nA = 2oo, X A = 25o, SA = 15, nB = 18o, X B = 235, SB = 1o.
a) Un intervalo de confianza para la diferencia del gasto medio mensual en arbitrios en las ciudades A y B viene
dado por:
Reemplazando valores en (1):
MA - MB E [(25o - 235) - 2.575 (1.3o) ; (25o - 235) + 2.575 (1.3o)] = [15 ± 3.34] Luego: MA - MB E [11.66; 18.34] S/.
con el 95% de confianza. Rpta. Interpretación: con el 99% de confianza, la diferencia del gasto medio mensual en
arbitrios en las ciudades A y B se encuentra entre S/. 11.66 y 18.34.
b) Responder a la pregunta ¿Es diferente el gasto medio mensual en arbitrios en las ciudades A y B? implica
responder si ¿m A ^ MB? o también ¿mA - MB ^ o?
Si apreciamos el intervalo de confianza construido en a) m a - MB no puede ser cero, es decir mA - MB ^ 0 o ma ^
MB. Por lo tanto, el gasto medio mensual en arbitrios en ambas ciudades es diferente. Rpta.
15. Un departamento de producción desea determinar si hay diferencia en el rendimiento entre el turno diurno (A)
y el nocturno (B). Una muestra aleatoria de 8o obreros del turno diurno alcanza una producción media de 94.3
partes por
de 1o.
22
(1)
Si 1 - a = 0.99, entonces: Zo = Z o.995 = 2.575
206
hora, con una desviación estándar de 14 partes por hora, mientras que otra muestra de 60 obreros de la noche
alcanza un promedio de 89.7 partes por hora, con una desviación estándar de 17. Se pide:
a) Calcule e interprete un intervalo de confianza del 95% para la verdadera diferencia de rendimientos medios de
ambos turnos.
b) ¿Son diferentes los rendimientos medios de ambos turnos? ¿^A ^ ^B? Explique
Solución
Datos: nA = 80, XA = 94.3 partes por hora, SA = 14, nB = 60, XB = 89.7, SB = 17.
a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado
Reemplazando valores en (1):
- M'ü e [(94.3 - 89.7) - 1.96 (2.7) ; (94.3 - 89.7) + 1.96 (2.7)] = [4.6 ± 5.3] Luego: ^,A - ^,B e [-0.7; 9.9] partes
por hora con el 95% de confianza. Rpta. Interpretación: con el 95% de confianza, la diferencia de rendimientos
medios del turno diurno y nocturno se encuentra entre -0.7 y 9.9 partes por hora.
b) Responder a la pregunta ¿Son diferentes los rendimientos medios de ambos turnos? Es responder si ¿^, A ^
^,B? o también ¿^,A - ^,B ^ 0?
Si apreciamos el intervalo de confianza construido en a) ^, A - ^,B toma el valor cero, es decir ^,A - ^,B = 0 o ^A = ^,B.
Por lo tanto, los rendimientos medios de ambos turnos no son diferentes. Rpta.
16. El departamento de marketing desea determinar si hay diferencia entre las ventas mensuales realizadas por
hombres y mujeres. Una muestra aleatoria de 60 hombres alcanza un promedio de 78 artefactos mensuales,
con una desviación
por:
22
(1)
Si 1 - a = 0.95, entonces: Z0 = Z 0.975 = 1.96
207
estándar de 15; mientras que otra muestra de 50 mujeres arroja una venta media de 85 artefactos mensuales, con
una desviación estándar de 10 artefactos. Se pide:
a) Construya un intervalo del 95% de confianza para la verdadera diferencia de las ventas medias realizadas por
hombres y mujeres.
b) ¿Son diferentes las ventas medias realizadas por hombres y mujeres? ¿p h ^
Pm?
Solución
Datos: nh = 60, X h = 78 artefactos, Sh = 15, nm = 50, X m = 85, Sm = 10.
a) Un intervalo de confianza para la diferencia de las ventas medias realizadas por hombres y mujeres viene
dado por:
Reemplazando valores en (1):
Mh - Mm e [(78 - 85) - 1.96 (2.4) ; (78 - 85) + 1.96 (2.4)] = [-7 ± 4.7]
Luego: Mh - Mm e [-11.7; -2.3] artefactos con el 95% de confianza. Rpta. Interpretación: con el 95% de confianza,
la diferencia de las ventas medias mensuales de hombres y mujeres se encuentra entre -11.7 y -2.3 artefactos.
b) Responder a la pregunta ¿Son diferentes las ventas medias realizadas por hombres y mujeres? implica
responder si ¿Mh ^ Mm? o también ¿Mh - Mm ^ 0?
Si apreciamos el intervalo de confianza construido en a) Mh - Mm no puede ser cero, es decir Mh - Mm ^ 0 o Mh
^ Mm. Por lo tanto, si es diferente la venta medias mensual de artefactos entre hombres y mujeres. Rpta.
17. Para determinar el precio medio del kilo de pollo en las ciudades A y B, se toma una muestra al azar de 120
hogares de A arrojando un precio medio de S/. 6.50 y una desviación estándar de S/ 0.70. Una muestra al
azar de 100 hogares de la ciudad B da una precio medio de S/. 6.75 y una desviación estándar de S/. 0.90.
22
(1)
Si 1 - a = 0.95, entonces: Z0 = Z 0.975 = 1.96
208
a) Calcule e interprete un intervalo de confianza del 95 % para la diferencia del precio medio del pollo en las
ciudades A y B.
b) ¿Es diferente el precio medio del pollo en las ciudades A y B?
Solución
Datos: nA = 120 hog., XA = S/. 6.50, SA = 0.70, nB = 100, XB = 6.75, SB = 0.90.
a) Un intervalo de confianza para la diferencia de rendimientos medios viene dado
Reemplazando valores en (1):
MA - MB e [(6.50 - 6.75) - 1.96 (0.11) ; (6.50 - 6.75) - 1.96 (0.11)] = [-0.25 ± 0.22]
Luego: MA - MB e [-0.47; -0.03] S/. con el 95% de confianza. Rpta. Interpretación: con el 95% de confianza, la
diferencia del precio medio del pollo en las ciudades A y B se encuentra entre S/. -0.47 y -0.03.
b) Responder a la pregunta ¿Es diferente el precio medio del pollo en las ciudades A y B? es responder si ¿m A
^ pB? o también ¿mA - MB ^ 0?
Si apreciamos el intervalo de confianza construido en a) m a - MB no toma el valor cero, es decir m a - MB ^ 0 o ma
^ MB. Por lo tanto, el precio medio del pollo en ambas ciudades es diferente. Rpta.
18. Muestras del pago mensual a los obreros en las ciudades 1 y 2 proporcionan los siguientes datos:
a) Construya un intervalo del 95 % de confianza para la diferencia entre los pagos medios a los obreros de las
dos ciudades.
209
por:
(1)
Si 1 - a = 0.95, entonces: Z0 = Z 0.975 = 1.96
(1)
Si 1 - a = 0.95, entonces Z0 = Z 0975 = 1.96. Además:
X 200 _ _X, 160
P1 = — = ^= 040 ^ q1 = 060 y P2 = —
= = 0
32 ^
q2
n 500 n 500
0.68
0. = P&+ P2q*_ (0.40)(0.60) | (°.32)(°.68) _ Q Q3Q
P1 -P2 ] n n v 500 500 .
Z0 — _,2 = 1.96 (0.030) = 0.059
Reemplazando valores en (1) se tiene que:
P1 - P2 e [(0.40 - 0.32) - 0.059 ; (0.40 - 0.32) + 0.059] = [0.08 ± 0.059] P1 - P2 e [0.021; 0.139] con el 95% de
confianza. Rpta.
216
2
2
Interpretación: la diferencia de proporciones de hombres (P 1) y de mujeres (P2) que les gusta el nuevo perfume,
está entre o.o21 y o.139 con el 95% de confianza.
b) La pregunta ¿Son diferentes las verdaderas proporciones de hombres y mujeres que dijeron que les gustaba
el nuevo perfume? implica preguntar si ¿P1 ^ P2? o también ¿P1 - P2 ^ 0?
La diferencia P1 - P2 = o no está incluida en el intervalo de confianza construido en a), no puede ser cero, es decir
P1 - P2 ^ o o P1 ^ P2. Por lo tanto, si son diferentes las proporciones de hombres y mujeres que les gusta el nuevo
perfume. Rpta.
25. Es ampliamente conocido que no cualquiera coopera respondiendo a cuestionarios de los entrevistadores
puerta por puerta. En un experimento para determinar si las mujeres son más cooperadoras que los hombres,
se obtuvieron los siguientes resultados: Hombres: n1 = 175, X1 = 85; Mujeres: n2 =
25o, X2 = 15o.
a) Determine un intervalo de confianza del 99 % para la diferencia de mujeres y hombres cooperadores.
b) ¿Es diferente la proporción de mujeres y hombres cooperadores?
Solución
Sean: grupo 1 = hombres y grupo 2 = mujeres.
Datos: n1 = 175, X1 = 84, n2 = 25o y X2 = 15o
a) El intervalo de confianza para la diferencia de proporciones de mujeres (P2) y de hombres (P1) que coopera
respondiendo a cuestionarios de los entrevistadores puerta por puerta, P2 - P1 está dado por:
P2 - P1 e
(p2 - p1) - Z a°p, - p , (P2 - p1) - Z a ^ p
(1)
Si 1 - a = 0.99, entonces Zo = Z o.995 = 2.575. Además:
a = — = 8
1 ^ = 048 ^ q1 = o52 y p2 = —
= =
°.60 ^ q2
n 175 n2 25o
o.4o
2
2
217
_ =_ = PA,P2q2_ 1(0.48)(0.52) (0.60)(0.40) _
P2_P1 P1_P2 \ n n2 Í 175 250 .
Z0ap¡_pi = 2.575 (0.049) = 0.126
Reemplazando valores en (1) se tiene que:
P1 - P2 e [(0.60 - 0.48) - 0.126; (0.60 - 0.48) + 0.126] = [0.12 ± 0.126]
P1 - P2 e [-0.006; 0.246] con el 99% de confianza. Rpta.
Interpretación: con el 99% de confianza, la diferencia de proporciones de mujeres (P2) y de hombres (P1) que
coopera respondiendo a cuestionarios de los entrevistadores puerta por puerta, está entre -0.006 y 0.246.
b) La pregunta ¿Es diferente la proporción de mujeres y hombres cooperadores? implica preguntar si ¿P2 ^ P1?
o también ¿P2 - P1 ^ 0?
La diferencia P2 - P1 = 0 está incluida en el intervalo de confianza construido en a), puede ser cero, es decir P 2 -
P1 = 0 o P2 = P1. Por lo tanto, no es diferente la proporción de mujeres y hombres que cooperan respondiendo a
cuestionarios de los entrevistadores puerta por puerta. Rpta.
26. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de verano “Burberry”. De una
muestra de 250 mujeres menores de 40 años, 150 estuvieron interesados, mientras que de 250 mujeres de
40 años a más, sólo 120 mostraron interés.
a) Calcule e interprete un intervalo del 95 % de confianza para la diferencia entre las verdaderas proporciones de
mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Burberry”.
b) ¿Existe diferencia entre la proporción de mujeres menores de 40 años y las de 40 años a más que mostraron
interés por los polos de verano “Burberry”? Explique.
Solución
Sean: grupo 1 = mujeres menores de 40 años y grupo 2 = mujeres de 40 años a más.
Datos: n1 = 250, X1 = 150, n2 = 250 y X2 = 120
a) El intervalo de confianza para la diferencia de proporciones de mujeres menores de 40 años (P 1) y las de 40
años a más (P2) que mostraron interés por los polos de verano “Burberry”, P1 - P2 está dado por:
218
P1 - P e
(P1 - P2) - a. % -P2 , (P - P2) + ^a ^p
22
(1)
Si 1 - a = 0.95, entonces Z0 = Z 0 975 = 1.96. Además:
X 150 _ _ X 120 _
P1 = — = —= 0 60 ^ q1 = 040 y P2 = —2 = — = 048 ^ q2 =
n 250 n 250
0.52
^ = PA + P2^= (0.60X0.40) , (0.48)(0.52) = Q Q443
P1 - P2 }¡ n n V 250 250 .
Z0G = 1.96 (0.0443) = 0.087
P1 P2 vy
n -1 n -1 10 -1
S = 0.231 onzas. Otros datos: n = 10 cajas, 1 - a = 0.90.
a) Para hallar el intervalo de confianza para la media se usa la distribución T n-1 de student (n < 30), si 1 - a =
0.90 ^ en la Tabla 3, to = t9, 0.95 = 1.8 3 3.
221
El intervalo de confianza para la media se obtiene con la expresión:
M e [X - t0 S/afn , X + t0 S¡4ñ ]
Reemplazando valores tenemos:
0 231 0 231
u e [15.9 - 1.833 x , 15.9 + 1.833 x -.= ] = [15.9 ± 0.134]
a/10 a/10
Por lo tanto: u e [15.766 ; 16.034] onzas con el 90% de confianza.
Rpta.
Interpretación: el verdadero peso medio de las cajas de cereal, se encuentra entre 15.766 y 16.034 onzas, con el
95% de confianza.
b) El intervalo de confianza para la varianza está dado por:
(n - 1)S2 (n - 1)S2
e
b a
Como n = 10, S = 0.231 y 1 - a = 0.90, entonces en la Tabla 2:
a = x«2;005 = 3.33 y b = x92,095 = 16.9
Reemplazando valores en el intervalo de confianza para la varianza, se tiene que:
, T(10 - 1X0.231)2 (10 - 1X0.231)2
2
a e -------------------------------------------------------------------------, ------------------------
16.9 3.33
Por lo tanto: a2 e [0.0284; 0.1442] (onzas)2 con el 90% de confianza.
Rpta.
Interpretación: con el 90% de confianza, la varianza del peso de las cajas de cereal se encuentra entre 0.0284 y
0.1442 (onzas)2.
29. Los pesos netos (grs.) de una muestra aleatoria de 10 latas de leche fueron los siguientes:
259, 262, 259, 258, 256, 257, 257, 263, 258, 261 Calcule e interprete intervalos de confianza del 95 % para
la media poblacional y la varianza poblacional de los pesos netos.
Solución
El promedio y la varianza muestral de los empleados por establecimiento es:
222
67o858 - io(259)2
5.3333 (gr.)2
n -1
n -1
io -1
S = 2.31 gr. Otros datos: n = io cajas, 1 - a = 0.95.
a) Para hallar el intervalo de confianza para la media se usa la distribución Tn-1 de student (n < 3o), si 1 - a = 0.95
^ en la Tabla 3, to = t9, o975 = 2.262.
El intervalo de confianza para la media se obtiene con la expresión:
U e [ X - to S z\/n , X + to S z\/n ]
Reemplazando valores tenemos:
231 231
u e [259 - 2.262 x -.= , 259 + 2.262 x -.= ] = [259 ± 1.65]
a/IO a/ÍO
Por lo tanto: u e [257.35; 26o.65] gr. con el 95% de confianza.
Rpta.
Interpretación: el verdadero peso medio de las de leche, se encuentra entre 257.35 y 26o.65 gramos, con el 95%
de confianza.
b) El intervalo de confianza para la varianza está dado por:
Reemplazando valores en el intervalo de confianza para la varianza, se tiene que:
Por lo tanto: a2 e [2.53; 17.79] (gramos)2 con el 95% de confianza.
Rpta.
Interpretación: con el 95% de confianza, la varianza del peso de las latas de leche se encuentra entre 2.53 y 17.79]
(gramos)2.
2 2
a2£ (n - 1)S (n - 1)S
b a
Como n = io, S = 2.31 y 1 - a = 0.95, entonces en la Tabla 2:
a y b x9, o.975 l-9^
-^o.o^
2 2
a2e (io-1)(2.31) (io-1)(2.31)
19.o
2.7o
223
30. De un área de la ciudad en la que habitan 1000 familias se extrae una muestra aleatoria de 20 familias y se
recolecta información sobre el número de personas
(X) por familia, obteniéndose la siguiente información:
20 20
£ x, = 105 £ X,2 = 763
7=1 i=1
Calcule e interprete intervalos de confianza del 99 % para el(la) verdadero(a):
a) Número medio de personas por familia. ¿Aceptaría usted que el tamaño medio de las familias es de 6 personas?
b) Número total de personas en el área.
c) La varianza del número de personas por familia en el área.
d) Para estimar en el futuro el número medio de personas por familia, con un margen de error máximo de 0.6
personas y una confianza del 99 % ¿qué tamaño mínimo de muestra será necesario?
Solución
Con la información dada se determina el promedio y la varianza muestral de los
empleados por establecimiento así:
20
£ x,
7 105
X = — --------------- = ------- = 5.25 persona por familia.
n 20
20 20
£ (X - X)2 £ X2 - nX2 _
S2 = 7 ' = ^ = _____________ 763 -20(525)2 = 11.145 (personas)2
n -1 n -1 20 -1
S = 3.34 personas. Otros datos: N = 1000 familias, n = 20, 1 - a = 0.99.
a) Para hallar el intervalo de confianza para la media se usa la distribución T n.1 de student (n < 30), si 1 - a =
0.95 ^ en la Tabla 3, t0 = t19, 0.995 = 2.861.
El intervalo de confianza para la media se obtiene con la expresión:
M e [ X - t0 S z\/n , X + t0 S z\/n ]
Reemplazando valores tenemos:
3 34 3 34
u e [5.25 - 2.861 x -.== , 5.25 + 2.861 x -.= ] = [5.25 ± 2.14]
a/20 V20
Por lo tanto: u e [3.11 ; 7.39] personas con el 99% de confianza.
Rpta.
224
Interpretación: en el área de la ciudad el verdadero número medio de personas por familia, se encuentra entre
3.11 y 7.39 con el 99% de confianza.
b) Para hallar el intervalo de confianza para el total (Np) se multiplica los límites de la media por N = 1000, así:
Total = Np e 1000 [3.11 ; 7.39] = [3110 ; 7390] personas con el 99% de confianza. Rpta.
Interpretación.- con el 99% de confianza, el verdadero total de personas en el área de la ciudad se encuentra entre
3110 y 7390 personas.
c) El intervalo de confianza para la varianza está dado por:
(n _ 1)S2 (n _ 1)S2
e
b a
Como n = 20, S = 3.34 y 1 - a = 0.99, entonces en la Tabla 2:
a = X19,0.005 = 6.84 y b = X19,0.995 = 38.6
Como f = n0 / N = 205 / 1000 = 0.205 > 0.05 es necesario ajustar el tamaño de muestra así:
225
S 205 „
n = ------------------------- = ---------- —— = 170 familias Rpta.
p
1 + S> 1+-205
N 1000
Interpretación.- para estimar el número medio de personas por familia, con el 99% de confianza y un error máximo
de 0.6 personas, se requiere de 170 familias.
31. Muestras del pago semanal a los obreros (1) y obreras (2) proporcionan los siguientes datos: n 1 = 15, X1 = $
135, S1 = $ 25 y n2 = 15, x 2 = $ 125, S2 = $ 15. Calcule e interprete intervalos de confianza del 95% para:
a) La razón de varianzas de los pagos semanales a obreros y obreras. ¿Son iguales las varianzas de los pagos
semanales a obreros y obreras?
b) La diferencia entre los pagos medios semanales a obreros y obreras. ¿Son diferentes los pagos medios
semanales a obreros y obreras? Explique.
Solución
a2
a) Intervalo de confianza para la razón de varianzas: —y e
a2 2
S 2/ S 22. S 12/ S 22
d’c
Datos: n1 = n2 = 15, S2 = 252 = 625, S2 = 152 = 225. Como 1 - a = 0.95, entonces en la tabla 4: d = F 14, 14, 0.975 =
2.98 y c = F14, 14, 0.025 = 1/ F14, 14, 0.975 = 1/ 2.98 = 0.336.
Reemplazando valores en el intervalo se tiene que:
"625/225 . 625/225 2.98 ; 0.336
Interpretación.- con el 95% de confianza, la razón de varianzas de los pagos semanales a obreros y obreras, se
encuentra entre 0.93 y 8.27.
Preguntar sí: ¿Son iguales las varianzas de los pagos semanales a obreros y
£e
= [0.93; 8.27] con el 95% de confianza.
2
obreras? Es similar a preguntar sí: ¿ a\ = a\ o ^ = 1? La respuesta es sí, ya
a
que el intervalo para la razón de varianzas toma el valor 1, es decir —= 1,
entonces af = (las varianzas de los pagos semanales a obreros y obreras son iguales)
226
b) Considerando que las muestras son pequeñas y que las varianzas de los pagos semanales a obreros y obreras
son iguales, el intervalo de confianza para la diferencia entre los de los pagos semanales a obreros y obreras
está dado por:
Datos del problema:
ni = 15, xi = $ 135, Si = $ 25 y no = 15, x 2 = $ 125, S2 = $ 15.
Los grados de libertad de la t son nL + n2 - 2 = 15 + 15 - 2 = 28.
Si 1 - a = 0.95, ^ En la tabla 3, t0 = t28, 0975 = 2.048.
Reemplazando valores en la fórmula para el intervalo de confianza, tenemos que:
„ o» r J ■”* jí4 ]
^ ^ - ^,2 e [10 + 2.048(7.53) ] ^ - ^,2 e [10 + 15.42 ]
Por lo tanto:
^ - ^,2 e [-5.42 ; 25.42] $ con el 95% de confianza. Rpta.
Interpretación: la diferencia entre los pagos semanales a obreros y obreras, se encuentra comprendida entre $ -
5.42 y 25.42 con el 95% de confianza.
Preguntar sí, ¿Son diferentes los pagos medios semanales a obreros y obreras? Es similar a preguntar sí: ¿^L ^
^2 o - ^2 ^ 0? La respuesta es no, ya que el intervalo para su diferencia de medias toma el valor cero, es decir, ^ -
^2 = 0 o = ^2. Entonces, los pagos medios semanales a obreros y obreras son iguales.
32. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para secretarias, aprenden
taquigrafía por dos métodos diferentes y luego se les somete a pruebas de dictado. Se encuentra que el grupo
1 obtiene en promedio 123 palabras por minuto con una desviación estándar de 15 palabras, mientras que el
grupo 2 promedia 110 palabras por minuto con una desviación estándar de 10 palabras. Calcule e interprete
intervalos de confianza del 99 % para:
a) La verdadera razón de varianzas de los 2 grupos. ¿Son heterogéneas las varianzas de ambos grupos?
b) La diferencia de medias de palabras por minuto de ambos métodos. ¿Es diferente el promedio de palabras por
minuto para los dos métodos?
227
Solución
Datos: n1 = 16, X1 = 123, S1 = 15 y n2 = 16, x 2 = 110, S2 = 10.
.2
a) Intervalo de confianza para la razón de varianzas: —y e
S2/ S2. Sj2 / S2
d
Í e a2
= [0.55; 9.15] con el 99% de confianza.
Si: m = n2 = 16, S2 = 152 = 225, S2 = 102 = 100. Como 1 - a = 0.99, entonces en la tabla 4: d = F15, 15, 0.995 =
4.07 y c = F15, 15, 0.005 = 1/ F15, 15, 0.995 = 1/ 4.07 =
0.246.
Reemplazando valores en el intervalo se tiene que:
225/100 225/100
;
4.07 0.246
Interpretación.- con el 99% de confianza, la razón de varianzas de las palabras por minuto de ambos grupos, se
encuentra entre 0.55 y 9.15.
Preguntar sí: ¿Son heterogéneas las varianzas de ambos grupos? Es similar a
a^
preguntar sí: ¿aj2 ^ a2 o -j- ^ 1?
a2
Por lo tanto:
u - u2 e [o.6 ; 25.4] palabras por minuto con el 95% de confianza. Rpta.
Interpretación: la diferencia de medias de los dos métodos, se encuentra comprendida entre o.6 y 25.4 palabras
por minuto con el 95% de confianza.
Preguntar sí, ¿Es diferente el promedio de palabras por minuto para los 2 métodos? Es similar a preguntar sí: ¿ui
^ u2 o u - U2 ^ 0? La respuesta es sí, ya que el intervalo para su diferencia de medias no toma el valor cero, es
decir, u - U2 ^ o o u ^ U2. Entonces, el promedio de palabras por minuto para ambos métodos sí es diferente.
33. Para determinar el costo medio de la enseñanza en las universidades 1 y 2, se toma una muestra al azar de
21 alumnos de la universidad 1 arrojando un costo medio de S/. 675 y una desviación estándar de S/ 9o. Una
muestra al azar de 21 alumnos de la universidad 2 da una costo medio de S/. 65o y una desviación estándar
de S/. 5 o. Calcule e interprete intervalos de confianza del 95% para:
a) La razón de varianzas de los costos de enseñanza en las universidades 1 y 2. ¿Son diferentes las varianzas
de los costos de enseñanza en las 2 universidades?
b) La diferencia del costo medio de la enseñanza en las 2 universidades. ¿Son diferentes los costos medios de la
enseñanza en las universidades 1 y 2?
Datos: nL = 21, xi = S/. 675, Sl = 9o y n2 = 21, x 2 = 65o, S2 = 5o.
a2 ^2 jg2 S21S2
a) Intervalo de confianza para la razón de varianzas: -y- e — ---—; —------—
a d c
Si: nL = n2 = 21, S2 = 9o2 = 8ioo, S22 = 5o2 = 25oo. Como 1 - a = 0.95,
entonces en la tabla 4: d = F2o, 2o, o.975 = 2.46 y c = F2o, 2o, o.o25 = 1/ F2o, 2o, o.975 = 1/
2.46 = o.4o7.
Reemplazando valores en el intervalo se tiene que:
Solución
8ioo/25oo
2.46
8ioo/25oo
o.4o7
[1.32; 7.96] con el 95% de confianza.
229
Interpretación.- con el 95% de confianza, la razón de varianzas de los costos de enseñanza en las universidades
1 y 2, se encuentra entre 1.32 y 7.96.
Preguntar sí: ¿Son diferentes las varianzas de los costos de enseñanza en las 2
universidades? Es similar a preguntar sí: ¿ — 12 + <j\ o — + 1?
—
La respuesta es sí, ya que el intervalo para la razón de varianzas no toma el valor
1, es decir —^ ^ 1, entonces j2 ^ — (las varianzas de los costos de enseñanza j2
en las 2 universidades son diferentes o heterogéneas)
b) Considerando que las muestras son pequeñas y que las varianzas de los costos de enseñanza en las 2
universidades son diferentes, el intervalo de confianza para la diferencia de medias de los costos de
enseñanza en las 2 universidades está dado por:
Io2 o2
r, x IS 1 S O
M1 - M2 e [(X1 - x 2) + t0 J— + —]
I n1 n2
100/16 100/16
e --------------- ; -----------
5.32 0.188
[1.17; 33.24] con el 99% de confianza.
231
La respuesta es sí, ya que el intervalo para la razón de varianzas no toma el valor
1, es decir —^ ^ 1, entonces — ^ — (las varianzas de los pesos de las bolsas a2
con detergente de ambas máquinas son diferentes o heterogéneas)
b) Considerando que las muestras son pequeñas y que las varianzas de los pesos de las bolsas con detergente
de ambas máquinas son diferentes, el intervalo de confianza para la diferencia de medias de los pesos de las
bolsas con detergente de ambas máquinas está dado por:
P1 - p.2 e [(X1 - x 2) + t0
S2 s
+■
n
n
]
—+—
Donde: H =
V n1
n
A100 16 Y
v ü +12 J
V n1 J
n -1
-+
^2 V n2 J
n2 - 1
100
ü
2
= 14.43 = 14
16
12
12 -1 12 -1
Reemplazando valores en el intervalo de confianza propuesto, se tiene: p 1 - p2 e [(505 - 495) + 2.977 x ^100 +16 ]
= [10 + 9.26]
Por lo tanto: p1 - p2 e [0.74 ; 19.26] gr. con el 99 % de confianza. Rpta.
Interpretación: con el 99% de confianza, la diferencia de los pesos medios de las bolsas con detergente de ambas
máquinas se encuentra comprendido entre 0.74 y 19.26 gramos.
Preguntar sí: ¿Son diferentes los pesos medios de las bolsas con detergente de ambas máquinas? Es similar a
preguntar sí: ¿p1 ^ p2 o p1 - p2 ^ 0? La respuesta es sí, ya que el intervalo para su diferencia de medias no toma
el valor cero, es decir, p1 - p2 ^ 0 o p1 ^ p2. Entonces, los pesos medios de las bolsas con detergente de ambas
máquinas sí son diferentes.
2
2
2
232
35. Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración en Km; dos muestras
aleatorias de 16 llantas de cada marca, dieron estos resultados:
n1 = 16, X1 = 49,658, S1 = 2,150 y n2 = 16, x 2 = 48,125, S2 =
1,875.
Calcule e interprete intervalos de confianza del 99% para:
a) La razón de varianzas de la duración de las llantas de ambas marcas. ¿Son diferentes las varianzas de la
duración de las llantas de ambas marcas?
b) La diferencia de las duraciones medias de las llantas de ambas marcas. ¿Son diferentes las duraciones medias
de las llantas de ambas marcas?
Solución
Datos: n1 = 16, X1 = 49,658, S1 = 2,150 y n2 = 16, x 2 =
48,125, S2 = 1875.
a,2
a) Intervalo de confianza para la razón de varianzas: —^ e
a2
S 2/ S 2. S 12/ S 22
d
Si: n1 = n2 = 16, S2 = 4’622,500, S2 = 3’515,625. Como 1 - a = 0.99, entonces en la tabla 4: d = F15, 15, 0.995 = 4.07
y c = F15, 15, 0.005 = 1/ F15, 15, 0.995 = 1/
4.07 = 0.246.
Reemplazando valores en el intervalo se tiene que:
"4622500/3515625 4622500/3515625
.2
a 22 '
= [0.32; 5.34] con el
4.07 0.246
99% de confianza.
Interpretación.- con el 99% de confianza, la razón de varianzas de la duración de las llantas de ambas marcas, se
encuentra entre 0.32 y 5.34.
Preguntar sí: ¿Son diferentes las varianzas de la duración de las llantas de ambas
a2
marcas? Es similar a preguntar sí: ¿a 12 + a\ o ^ + 1?
a2
234
5.12 PROBLEMAS PROPUESTOS
1. Demuestre que:
a) Las desigualdades p - E < x < p + E, son equivalentes a | x - p | < E
b) Si 1 -a = P(-tx_an < T < ^a/2) y T = (x- u)4ñ/s entonces:
1 s _ s.
1 -a = P( x - ti_a/2^ <u< x + h-a 12^)
-Jn \¡n
2. Se desea estimar el peso total de una partida de io,ooo manzanas. Para ello se selecciona una muestra aleatoria
de 5o manzanas, la cual da una media de 3oo gramos y una desviación estándar de 25 gramos. Calcule e
interprete intervalos de confianza del 95 % para:
a) El verdadero peso medio de las manzanas y el peso total (Np,).
b) La verdadera varianza (o ) de los pesos de las manzanas.
c) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de p en menos de 8 gramos con el 95 %
3. Se toma una muestra al azar de 45 alumnos, sin reposición de una clase de estadística de 221 alumnos que
dan una calificación final media de 7o puntos y una desviación típica de 9 puntos. Determine el intervalo de
confianza del 95 % para la media y la varianza de las calificaciones.
4. Un proceso está programado para embolsar la cantidad media de 5oo gramos de frejol. Se toma una muestra
aleatoria de 36 bolsas, resultando una media de 496.5 gramos y una desviación típica de 12 gramos.
a) Construya un intervalo de confianza del 95% para el verdadero peso medio de las bolsas de frejol. ¿Se puede
afirmar que no se está cumpliendo con el contenido medio en las bolsas de frejol?
b) ¿Qué tamaño de muestra debe tomarse, si se desea que X difiera de p en menos de 3 gramos con el 95 % de
confianza?
c) Construya un intervalo de confianza del 95% para la verdadera varianza de los pesos de las bolsas con frejol.
5. Una universidad grande quiere estimar el número medio de días de enfermedad de los estudiantes durante un
año; una muestra de 5o estudiantes indica que
235
x = 3.2 días y S = 5.2 días. Calcule e interprete intervalos de confianza del 95% para:
a) La media p y la varianza o .
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de p en menos de 10 gr. con el 95 % de
confianza?
6. Una muestra de 50 animales experimentales reciben una cierta clase de ración por un período de 2 semanas.
Sus aumentos de pesos arrojan los valores x = 480 gr. y S = 30 gr. Calcule e interprete intervalos de confianza
del 99% para:
a) La media p y la varianza o .
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de p en menos de 13 gr. con el 99 % de
confianza?
7. Se acaba de lanzar al mercado una nueva marca de cigarrillos; un estudio en 35 cigarros, para determinar su
contenido medio de nicotina dio x = 25.4 mg. y S =
1.9 mg. Calcule e interprete intervalos de confianza del 95% para:
a) El verdadero contenido medio p de nicotina y la verdadera varianza (o ) del contenido de nicotina.
b) ¿Qué tamaño de muestra debe tomarse, si se desea que x difiera de p en menos de 13 mg. con el 95 % de
confianza?
8. De los 500 establecimientos pequeños de una ciudad, se ha tomado una muestra aleatoria de 50, obteniéndose
los siguientes datos sobre el número de empleados por establecimiento:
Empleados por establecimiento (Xi) 3 4 5
0 1 2
Establecimientos (ni) 15 4 3
10 12 6
Tipo de Errores
• Error tipo I: se comete al rechazar la hipótesis nula Ho cuando ésta es verdadera.
g = Nivel de significación = P (Error Tipo I) = P [Rechazar Ho / Ho es verdadera
Los valores más comunes de a son 0.05 y 0.01; porque el error debe ser bajo. Si tuviéramos un nivel de confianza
del 95% entonces, el nivel de significación sería del 5%. Significaría que en 5 de cada 100 pruebas nos estaríamos
equivocando al rechazar Ho cuando esta es cierta.
• Error de tipo II: se comete cuando se acepta una hipótesis Ho siendo esta falsa. La probabilidad de cometer este
error la denotamos con la letra p.
P = P [Aceptar Ho / Ho es falsa ]
248
Decisión
Ho es verdadera Ho es falsa
(muestral)
Los errores tipo I y tipo II se relacionan. Una disminución en la probabilidad de uno, por lo general tiene como
resultado un aumento en la probabilidad del otro.
La decisión de aceptar o rechazar la hipótesis bajo consideración H0 se hace basándose en pruebas de muestras,
por ello escogemos una función ú de las n observaciones, ú = G(X1, X2, .... , Xn ) como estadística de prueba, cuya
distribución por muestreo sea conocida en el supuesto (tentativo) que la hipótesis nula H 0 : 9 = 90 es cierta.
Las reglas de decisión sobre la aceptación o rechazo de H0 , se hace respecto al rango de 9 y un resultado
particular ú de la muestra. Esto se hace hallando un valor ú C llamado valor crítico de la estadística de prueba (a
veces hay más de un valor crítico) la cual divide al rango de ú en dos regiones: la región crítica o de rechazo (R,C)
y la región de aceptación (R.A). Si ú e R.C. rechazamos H0. Si ú e R.A. aceptamos H0.
Región Crítica o de Rechazo
Es la región que contiene lo valores para los cuales se rechaza la hipótesis H0 bajo consideración. Es la región
del rango de ú que de acuerdo con una prueba prescrita, conduce al rechazo de la hipótesis bajo consideración.
249
Región de Aceptación
Es la región que contiene lo valores para los cuales se acepta la hipótesis H 0 bajo consideración.
Pasos para el Contraste de Hipótesis
1. Formular las hipótesis de acuerdo al problema.
H0 : 9 = 90
H1 : 9 ^ 90 o 9 < 90 o 9 > 90
2. Escoger el nivel de significación a.
3. Escoger la prueba estadística apropiada (Z, t, chi-cuadrado, F, etc.) cuya distribución por muestreo sea conocida
en el supuesto tentativo de que H0 es cierta. Esta prueba estadística, debe ser función del estimador y del
parámetro, al igual que en la construcción de intervalos de confianza.
4. Establecer la región crítica. Para ello tomar en cuenta la distribución de la prueba estadística escogida.
5. Calcular el valor de la prueba estadística, con la información de una muestra aleatoria de tamaño n y bajo el
supuesto que H0 es cierta.
6. Conclusión: Si el valor calculado de la prueba estadística pertenece a la región
crítica, entonces rechazamos H0 y aceptamos H1. En caso contrario, si el valor
calculado de la prueba estadística pertenece a la región de aceptación, entonces
aceptamos H0 y rechazamos H1.
A continuación, utilizando los resultados de las distribuciones muestrales y de los intervalos de confianza, veremos
la aplicación de las pruebas de hipótesis para los parámetros poblacionales como la media, diferencia de medias,
la varianza, la igualdad de varianzas, la proporción y la diferencia de proporciones. Cuyas estadísticas de prueba
van a estar referidas a distribuciones como la normal estándar, t de student, chi cuadrado y F respectivamente.
Veamos cada una de ellas.
250
6.1 PRUEBA DE HIPÓTESIS PARA LA MEDIA (con varianza conocida)
Sea X la media de una muestra aleatoria de tamaño n seleccionada de una
2
población con media U y con varianza a supuestamente conocida.
Si la población es normal N(U, a ), entonces, la distribución de la estadística
X es exactamente normal N(u, a2/n). Si la población no es normal, para
cualquier valor de n > 30, la distribución de X es aproximadamente normal N(u, a /n). Si se necesita el factor de
corrección para poblaciones finitas se usa (N -n) / (n-1)
Entonces, la estadística para la prueba acerca de U con varianza a conocida es:
Z = X U, cuya distribución es exacta o aproximadamente normal estándar a/4 n
N(0,1), según sea la población normal o no.
Si se supone verdadera la hipótesis nula: Ho: U = uo, la estadística especificada
1•' ry X—Llr.
por esta hipótesis es entonces: Z =
a/y n
A. Prueba bilateral o de dos colas
1. Hipótesis: Ho: u = Uo , H1: u ^ U0
2. Escoger el nivel de significación: a
X—U
3. Estadística de prueba: Z = j=, cuya distribución es normal N(0,1).
a /a ln
4. Región crítica: determinar el valor Z1-a/2 tal que la probabilidad de rechazar H0 cuando se supone verdadera sea:
P[Z <—Z1—a/2 ] = a/2 O P[Z > Z1—a/2 ]=a/2
En consecuencia, la región crítica en el rango de variación de Z es:
R.C. = {Z <—Z1—a/2 O Z > Z1—a/2 }
Por otro lado, la probabilidad de aceptar H0 cuando se supone verdadera es:
P[— Z1—a/2 — Z — Z1—a/2 ] = 1 — a
vn An
o equivalentemente si u se encuentra en el intervalo de confianza (I.C.) del ioo(1
a) % para u: uo e IC. =
x- Z
a
l-a/2
\¡n
, x+ Zj_
a
a /2
Por tanto, se rechaza Ho con riesgo a, si x g R.A. o si u g IC.
Nota: Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad
mínima para rechazar Ho), a partir del valor Zcalc, de manera que:
254
• Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
• Para cola a la derecha: P = P[Z > Zcalc]
• Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < a, entonces, se rechaza H0. Se acepta H0, en caso contrario. Ejemplo 3.-
Un proceso de empaquetar un producto está controlado, si el peso medio del producto empaquetado es 400 gr.
Si en una muestra aleatoria de 100 paquetes del producto se ha encontrado que el peso medio es de 395 gramos.
Suponga que el peso de los productos empaquetados se distribuye normalmente con desviación estándar de 20
gramos.
a) ¿Se podría concluir que el proceso está fuera de control al 5% de significación? Halle P-valor.
b) Construya un intervalo de confianza del 95% para el peso medio del producto empaquetado. ¿Aceptaría usted
que p = 400 gr. (proceso controlado)?
Solución
a) Sea X la variable aleatoria definida como el peso de los paquetes del producto.
Se supone que la distribución de X es N(p, (20)).
1. Hipótesis: H0: p = 400 (proceso controlado) H1: p ^ 400 (proceso fuera de control).
2. Nivel de significación: a = 0.05.
3. Estadística de prueba: Población normal con varianza conocida, la estadística es
X- p
Z = j= cuya distribución es normal N(0,1).
7/4 n
4. Región crítica: Si la hipótesis nula H0 es cierta, para a = 0.05 y la alternativa
bilateral, en la distribución de Z = (7- 400)/(20/a/100) , se encuentra el valor crítico: Z1-a/2 = Z0.975 = 1.96
Luego, la región crítica en la variable Z está dada por:
RC = {Zc,k <-1.96 o Zc„k > 1.96}
5. Cálculos, de los datos se tiene: n = 100, x = 395, 7 = 20
Entonces:
255
7 _ x-V _ 395 - 400 _ 0 ^
Z
calc = = = 2'5
a/\l n 2
6. Decisión: Puesto que Zcaic = -2.5 e R.C., debemos rechazar H0 y concluir con un 5% de significación que el
proceso de empaquetado no está controlado. P-valor = P[|Z| > |-2.5|] = P[|Z| > 2.5] = 2 P[Z < -2.5] = 2(0.00621) =
0.01242. Como el valor-P = 0.01242 < a = 0.05 se rechaza Ho y se acepta Hi: p ^ 400 y se concluye también con
un 5% de significación que el proceso de empaquetado no está controlado.
Nota: En el rango de variación de X, la región crítica es:
R.C. = {X< 400 -1.96x2 o X> 400 +1.96x2} = {X < 396.08 o X> 403.92}
Por el hecho que x = 395eR.C., se debe rechazar H0 y concluir con un riesgo de 5 % que el proceso de
empaquetado no está controlado.
Cálculos utilizando Minitab (versión 15.0 en español)
Del menú escoger Estadísticas ^ Estadísticas básicas ^ 1Z Z de 1 muestra y aparece la Ventana Z de 1 muestra
(prueba e intervalo de confianza) siguiente:
256
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 100 y en Media: 395 (la media muestral).
Escribir la Desviación estándar: 20.
Nota: Si los datos muestrales aparecen en una columna, se escoge Muestras en columnas: y se ingresa dicha
columna. Lo que sigue es igual para ambos casos. Seleccionar Realizar prueba de hipótesis y escribir en Media
hipotética: 400. Escoger Opciones... ^ Nivel de confianza: 95.0. Escoger en Hipótesis alterna: no es igual a. Luego
escoger Aceptar y Aceptar En la hoja de Sesión aparecen los resultados siguientes:
Z de una muestra
Media del
Error
N Media estándar IC de 95% Z P
100 395.00 2.00 (391.08, 398.92) -2.50
0.012
Aparecen los resultados antes obtenidos: Zcalc = -2.5, el valor-P = 0.012 y el intervalo de confianza del 95% para
la media |i obtenido a continuación en b).
b) El intervalo de confianza del 95% para el peso medio u del producto empaquetado viene dado por:
UG
X -Z a a,x+z a a
1- *Jñ 1- *Jñ
2 2
(1)
Datos: n = 100, X = 395, o = 20, 1 - a = 0.95 ^ En la Tabla 1, Zo = Z0.975 = 1.96.
El error de estimación para la media es:
E = Z aa= 1.96-í^ = 3.92 gr. i-|Vn a/100
Reemplazando en (1) se tiene:
|i e [395 - 3.92 ; 395 + 3.92] = [391.08 ; 398.92] gr. con el 95% de confianza. No se acepta que u = 400 gr. porque
no pertenece al intervalo de confianza, por lo tanto, se debe rechazar H0 y concluir con un 95 % de confianza que
el proceso de empaquetado no está controlado.
257
6.2 PRUEBA DE HIPÓTESIS PARA LA MEDIA (con varianza desconocida)
Población no normal
Si la población no tiene distribución normal y si la varianza es desconocida, para probar hipótesis acerca de la
media M, sólo si, el tamaño de la muestra es grande
X-u
(n > 30), se suele utilizar la estadística: Z = --------------------------------------------------- N(0,1)
—/a n
Luego, las regiones críticas de las pruebas de Ho: M = M0 contra cualquiera de las tres alternativas H1: M > M0 o
H1: M < M0 o H1: M ^ M0 son las mismas (aproximadamente) de la sección anterior.
Población normal
22
Si la población tiene distribución normal N(M,J ), donde M y — son parámetros desconocidas, para 2 < n < 30 la
estadística de la prueba acerca de la media M es:
x-
T = M ^
1 n-1
S/.,/n ^
Si se supone verdadera la hipótesis nula, Ho: M = Mo , la estadística
especificada por esta hipótesis es: T = X
S /a n
Nota: La estructura de la prueba es idéntica que en el caso de — conocida , salvo que el valor de — se estima por
S y la distribución normal estándar se sustituye por la distribución t de Student con n-1 grados de libertad.
A. Prueba bilateral o de dos colas
1. Hipótesis: Ho: M = Mo, H1: M ^ M0
2. Escoger el nivel de significación: a
3. Estadística de prueba: T = X M ^ t ,
san
4. Región crítica: determinar los valores ± t1_a/2,n_1, tales que la probabilidad de rechazar Ho cuando se supone
verdadera sea:
258
P(T < t1-a/2,n-1) =a/2 O P(T > t1-a/2,n-1) = a/2 .
X p
5. Hallar Tcalc =------------------ ^ con la información muestral y suponiendo que Ho es
S/Vn
cierta.
6. Decisión: se rechaza H0 con riesgo igual a a, si Tcafc eRC.(o si Tcafc £R.A.). No se rechaza H0 en caso contrario.
Si se rechaza Ho se dice que la prueba es significativa con riesgo igual a.
B. Prueba unilateral de la cola derecha
1. Hipótesis: Ho: p = po, H1: p > p0
2. Escoger el nivel de significación: a
3. Estadística de prueba: T = X p ^ t ,
S/-:¡n
4. Región crítica: determinar el valor t1-a, n-1 tal que la probabilidad de rechazar H0 cuando se supone verdadera
sea:
P [T > tx_a n_j | : p = p verdadera] = a
En consecuencia, la región crítica en el rango de variación de T es:
RC. = {T > t1-a,n-1}
La región de aceptación es: R.A. = {T < t1-a, n-1}.
x— u
5. Hallar Tcalc =------------------ ^ con la información muestral y suponiendo que Ho es
S/Vn
cierta.
6. Decisión: se rechaza H0 con riesgo igual a a, si Tcafc eRC.(o si Tcafc &R.A.). No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hipótesis: Ho: p = po , H1: p < p0
259
2. Escoger el nivel de significación: a
3. Estadística de prueba: T = X U ^ t ,
S/^¡n
4. Región crítica: determinar el valor -11—a, n—1 tal que la probabilidad de rechazar H0 cuando se supone verdadera
sea:
P [T < —t^ n_j | H0 : u = Uo verdadera] = a En consecuencia, la región crítica en el rango de variación de T es:
R.C = {T < -t1 - a, n -1}
Media del
Error 95 % Límite
N Media Desv.Est. estándar inferior T P
25 304.50 10.00 2.00 301.08 2 25 0.017
(n — 1)S2
a
que resulta de la muestra aleatoria, se usa para la prueba
de H0, contra una alternativa unilateral o bilateral.
A. Prueba bilateral o de dos colas
2
1. Hipótesis: Ho: o = a0,
2. Escoger el nivel de significación: a
H1: o2 *
3. Estadística de prueba: X =
2 _ (n — 1)S2
a
^X,
n—1
4. Región crítica: determinar los valores X^,n—1 y X^_a/2,n—1, tales que la probabilidad de rechazar la hipótesis
nula H0 cuando se supone verdadera sea: P[X2 < Xa/2,n—1 ] =a/2 O P[X2 >Xa/2,„—1] = a/2
2 2 2 2 La Región crítica de la prueba es: RX. = {X < X«/2,n-1 o X > X1—a/2,n—1 }
cierta.
6. Decisión: se rechaza H0 con riesgo igual a a, si Xcaic eR.C.(o si xlah £RA.). No se rechaza H0 en caso contrario.
Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es
a.
264
2
B. Prueba unilateral de la cola derecha
1. Hipótesis: Ho: o2 = 7q , H1: g2 > 7
2. Escoger el nivel de significación: a
_ _ ir' 1 , 2 (n - 1)S2 2
3. Estadística de prueba: x = i > Xn-
2> _2
7
4. Región crítica: determinar el valor 71-a,n-1 tal que la probabilidad de rechazar H0 cuando se supone verdadera
sea: P[x" >X12-a,n-1] = a
* * 2 O
La Región crítica de la prueba es: R.C. = {X > Xi-a n-1}
X1-a, n-1
La región de aceptación es: R.A. = {X < x^ n-1 }
5. Hallar xlaia =
(n - 1)S2
con la muestra y suponiendo que Ho es cierta.
6. Decisión: se rechaza H0 con riesgo igual a a, Xcalc e RC (o si Xcalc *RA). No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hipótesis: Ho: o2 = 7q , H1: o2 < 7q
2. Escoger el nivel de significación: a
_ _ ir' 1 , 2 (n - 1)S2 2
3. Estadística de prueba: x = i > Xn-
7
4. Región crítica: determinar el valor xa n-\ tal que la probabilidad de rechazar H0 cuando se supone verdadera
sea:
265
1
1
P[X2 <X2a, n-1 ] = a
* * 2 2 La Región crítica de la prueba es: R.C. = {X < Xa n-i}
(n - 1)S2
a
con la muestra y suponiendo que Ho es cierta.
6. Decisión: se rechaza H0 con riesgo igual a a, Zcalc eR C (o si Xlalc *R A ).
No se rechaza H0 en caso contrario.
Nota: Regla de decisión con el Intervalo de Confianza
La prueba de la hipótesis nula Ho: o2 = ag contra H1: o2 ^ a2^ a un nivel de
significación dado a, equivale al calcular el intervalo de confianza (I.C.) del 100(1 -
2 • 2 2* 2
a)% para el parámetro o y luego rechazar la hipótesis nula Ho: o = a0 si es que a0
* IC. Caso contrario, si a2^ e I.C. se “acepta” la hipótesis nula Ho: o2 = a02.
Nota: Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad mínima para rechazar Ho), a
partir del valor xlah, de manera que:
• Para dos colas:
Si Xlalc < n - 1 — P = 2 P[ X„2-1 < Xlalc ]
Luego, la región crítica es: R.C. {X2 < 2.70 o X2 > 19.02}
5. Cálculos: De los datos de la muestra resulta S = 6.77, entonces,
2 _ (n - 1)S2 _ 9S2_ 9(6.77) _1.0,
Xcalc 444.
6. Decisión: Como xlak = 15.23 g R.A. se acepta H 0 a2 = 4 y concluimos que la desviación estándar es de 2 mm.
con el 5% de significación. Rpta.
Como la prueba es bilateral y Xcalc = 15.23 > n - 1 = 9 el valor-P se obtiene así:
P = 2 {1 - P[X2-1 < Xcalc]} = 2 {1 - P[X9 < 15.23]} = 2 {1 - x} ........................................ (1)
Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no está el valor 15.23, pero éste se encuentra
entre los valores 14.7 (con probabilidad 0.90) y 16.9 (con
probabilidad 0.95) se determina p interpolando de la siguiente manera:
267
X2a
14.7
15.23
P
0.90
x
16.9 -14.7 15.23 -14.7
44 =
0.53
0.95 - 0.90 x - 0.90 x - 0.90
16.9 0.95 ^ 44x - 39.6 = 0.53 ^ x = 0.912
Reemplazando x = 0.9815 en (1) se obtiene:
P = P-valor = 2{1 - 0.912} = 0.176 Rpta.
Como el valor-P = 0.176 > a = 0.05 se acepta H0 : a2 = 4. Por lo tanto, se concluye también con un 5% de
significación que la desviación estándar es de 2 mm.
Cálculos utilizando Minitab
En la Ventana de Datos (Hoja de trabajo), columna C1 definir la variable Longitud (de los tornillos) e ingresar los
10 valores de la muestra.
Del menú escoger Estadísticas ^ Estadísticas básicas ^ a 2 1 varianza y aparece la Ventana 1 varianza siguiente:
En vez de ingresar desviación estándar, escoger ingresar varianza.
Como los datos muestrales aparecen en la columna C1 Longitud, se escoge Muestras en columnas: y se
selecciona en dicho recuadro la columna C1 Longitud.
268
Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y escribir el Tamaño de muestra:
y la Varianza de la muestra: correspondientes. Lo que sigue es igual para ambos casos.
Seleccionar Realizar prueba de hipótesis y escribir en Varianza hipotética: 4. Escoger Opciones... ^ Nivel de
confianza: 95.0. Escoger en Hipótesis alterna: no
es igual a. Luego escoger Aceptar y Aceptar
En la hoja de Sesión aparecen los resultados siguientes:
Prueba e IC para una varianza: Longitud
Método
Hipótesis nula Sigma-cuadrado = 4
Hipótesis alterna Sigma cuadrado no = 4
El método estándar se utiliza sólo para la distribución normal.
El método ajustado se utiliza para cualquier distribución continua.
Estadísticas
Variable N Desv.Est. Varianza Longitud 10 2.60 6.77
Intervalos de confianza de 95%
IC para IC para
Variable Método Desv.Est. varianza
Longitud Estándar (1.79, 4.75) (3.20, 22.55) Ajustado (1.93, 3.98) (3.73, 15.85)
Pruebas
Variable Método Chicuadrada GL Valor P
Longitud Estándar 15.23 9.00 0.170
Ajustado 26.47 15.65 0.084
Aparecen los resultados antes obtenidos: Xllc = 15.23, el valor-P = 0.17
(ligeramente diferente al 0.176 encontrado con aproximación usando la Tabla 2) y el intervalo de confianza del
95% para la varianza analizado a continuación.
Nota.-
Si se construye el intervalo de confianza del 95% para la varianza o , éste resultará ser: o 2 e [3.20; 22.55] mm2
con el 95% de confianza.
En consecuencia, se acepta H0 :a2 = 4 porque pertenece al intervalo de confianza.
Por lo tanto, se concluye también que la desviación estándar es de 2 mm. con un 95% de confianza.
269
6.4 PRUEBA DE HIPÓTESIS PARA LA RAZÓN DE VARIANZAS
Sean S2 y Sl las varianzas de dos muestras aleatorias independientes de tamaños respectivos n1 y n2, escogidas
de dos poblaciones normales con varianzas respectivas a\ y a\ . Entonces, la estadística,
F = SU ^ f
o2 / 2 J n1-1,n2-1
S 2 1j 2
tiene distribución de probabilidad F con grados de libertad n 1 - 1 y n2 - 1. Esta estadística se utiliza para probar
igualdad de varianzas.
Si se supone verdadera la hipótesis nula Ho: —2 = — o a\ l a\ = 1, la
S2
estadística de la prueba es: F = ^ fn -1,n -1
S 2 1 ,2
S2
Su valor Fcalc = que resulta de dos muestras aleatorias, se utiliza para
S 2
f
1—a, n 1—1, n 2—1
La región de aceptación es: R.A. = {F < f1—an —1 „ —1 }
I ¡ i
S2
5. Hallar Fcalc = —^ con la muestra y suponiendo que Ho es cierta.
ST
6. Decisión: se rechaza H0 con riesgo igual a a, Fcah gR.C. (o si Fcalc &RA.) No se rechaza H0 en caso contrario.
C. Prueba unilateral de la cola izquierda
1. Hipótesis: Ho : j\ = J2
2. Escoger el nivel de significación: a
H : J2 < J2
S2 / j2
3. Estadística de prueba: F = 7^—\ ^ fn 1—1,^—1
s 22/j2
271
4. Región crítica: determinar el valor /a,n t,n t tal que la probabilidad de rechazar H0 cuando se supone verdadera
sea:
P[F < L,n -1,n -1] = a La Región crítica de la prueba es: R.C. = {F < / , , }
1 2 a nt nt
La región de aceptación es: R.A. = {F > /a,n t,n t}
S2
5. Hallar Fcalc = —^ con la muestra y suponiendo que Ho es cierta.
S 2
4. Región crítica: para a = 0.05 y la prueba unilateral derecha, f 7,5, 0.95 = 4.88 es:
R.C. = {F > 4.88}
5. Cálculos: con los datos de la muestra se obtiene:
S2 4125
S2 = 4.125, S 22 = 2 y Fcalc = = — = 2.0625
6. Decisión. Como Fcah = 2.0625 e R.A. se acepta Ho y concluimos que la
varianza de los diámetros con el nuevo proceso no es menor que conel proceso
antiguo, sino las dos varianzas son iguales con el 5% de significación.
Nota.-
• Si se construye el intervalo de confianza del 95% para la razón de varianzas, éste
resultará ser: a\ / a\ e [0.301; 10.91] con el 95% de confianza.
Entonces, se acepta que a\ / a\= 1, porque pertenece al intervalo de confianza.
Por lo tanto, se concluye que = a\ con el 95% de confianza, es decir que la
varianza de los diámetros con el nuevo proceso es igual a la del proceso antiguo.
• Para hallar el valor-P, como Fcah = 2.0625 > 1 se obtiene así:
273
P = 2 P[f7,5 > 2.0625] = 2{1 - P[f7,5 < 2.0625]} > 0.10 (en Excel = 0.4428).
Rpta.
Ya que en la Tabla 4, de la distribución F, para 7 y 5 grados de libertad la probabilidad acumulada hasta 2.0625
es menor a 0.95 (en Excel es 0.7786).
Como P = 0.4428 > a = 0.05, se acepta la hipótesis nula y se concluye también con el 5% de significación, que la
varianza de los diámetros con el nuevo proceso no es menor que con el proceso antiguo, sino las varianzas son
iguales.
Cálculos utilizando Minitab
En la Ventana de Datos (Hoja de trabajo), en la columna C1 definir la variable diámetro Antiguo-1 e ingresar los 8
valores de la muestra y en la columna C2 definir la variable diámetro Nuevo-2 e ingresar los 6 valores de la
muestra.
Del menú escoger Estadísticas ^ Estadísticas básicas ^ O21 O22 2 varianzas y
aparece la Ventana 2 varianzas siguiente:
Como los datos muestrales aparecen en las columnas C1 y C2, se escoge Muestras en diferentes columnas y se
selecciona en el recuadro de Primera: la columna C1 Antiguo-1 y en el recuadro de Segunda: la columna C2
Nuevo-2.
Nota: si ya se tienen los cálculos muestrales, habilitar la opción Datos resumidos y escribir el Tamaño de muestra:
y la Varianza: (de la muestra) correspondiente a la Primera: y Segunda: muestra. Lo que sigue es igual para ambos
casos.
274
Escoger Opciones... ^ Nivel de confianza: 95.0. Colocar un Título: (del gráfico) Varianza antigua vs Varianza
nueva. Luego escoger Aceptar y Aceptar En la hoja de Sesión aparecen los resultados siguientes:
Prueba de varianzas iguales: Antiguo-1, Nuevo-2
Intervalos de confianza de Bonferroni de 95% para desviaciones estándares
N Inferior Desv.Est. Superior
Antiguo-1 8 1.27062 2.03101 4.65199
Nuevo-2 6 0.82920 1.41421 4.04599
Prueba F (distribución normal)
Estadística de prueba = 2.06, valor p = 0.443
Prueba de Levene (cualquier distribución continua) Estadística de prueba = 1.25, valor p = 0.286
Aparecen los resultados antes obtenidos: Fcalc = 2.0625 y el valor-P = 0.4428. Si se
observan los intervalos de confianza de Bonferroni, en la gráfica de Varianza antigua vs Varianza nueva, se puede
apreciar que estos se entre cruzan, indicando que las varianzas (y desviaciones estándar) son iguales.
275
6.5 PRUEBA DE HIPÓTESIS ACERCA DE DOS MEDIAS (con varianzas conocidas)
Sean X1 y X 2 las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas
respectivamente de dos poblaciones independientes, con medias p 1 y p2 y varianzas y a\ conocidas.
Si las dos poblaciones son normales, entonces, las estadísticas X 1 y X 2 tienen respectivamente distribución
normal N(p1, af,/n1) y N(p2, a^,/n2) para n1 > 2, y n2 > 2. Entonces: X1 - X 2 tiene distribución normal N(p1 - p2;
ajVn1+ a^/n2).
Si las dos poblaciones no son normales, pero n1 y n2 son suficientemente grandes (n 1 >30 y n2 > 30), entonces,
X1 - X 2 tiene aproximadamente distribución normal N(p1 - p2; a2/n1+ a2/n2).
Según sean las dos poblaciones normales o no, la estadística de prueba es:
Z = X1 -X2 -(V1 -V2) - N(0,1). a a 2
\ n1 + n 2
Si suponemos verdadera la hipótesis nula H0: p1 = p2 ó p1 - p2 = 0, la
Xi - X2
estadística de prueba es: Z = ^ N(0,1)
a 2 a 22
]¡ n1 + n2
X1 - X 2
Su valor Zcalc = =que resulta de dos muestras independientes, se
2 2 n + n2
1 2 \ 1
utiliza para probar Ho: p1 = p2 contra cualquiera de las hipótesis alternativas
H1: V1 ^ V2 ó H1: V1 > V2 ó H1: V1 < V2
La estructura de la prueba es similar a los casos descritos usando la distribución Z.
A. Prueba bilateral o de dos colas
Si se prueba H0: p1 = p2 o p1 - p2 = 0, contra H1: p1 ^ p2 o p1 -p2 ^ 0, la región
crítica en el rango de variación de Z es:
R.C = {Z < - Z1-a/2 o Z > Z1-a/2}
276
B. Prueba unilateral de la cola derecha
Si se prueba H0: ^1 = ^2 o ^1 - ^2 = 0, contra H1: ^1 > ^2 o ^1 - ^2 > 0, la región
critica en la variación de Z es:
R.C. = {Z > Z1-a }
C. Prueba unilateral de la cola izquierda
Si se prueba Ho: ^1 = ^2 o ^1 - ^2 = 0, contra H1: ^1 < ^2 o ^1 - ^2 < 0, la región
critica en la variación de Z es:
Nota 1.- Cuando las hipótesis son de la forma:
1) H0: ^1 - ^2 = d0 contra H1: ^1 - ^2 ^ d0
2) H0: ^1 - ^2 = d0 contra H1: ^1 - ^2 > d0
3) H0: ^1 - ^2 = d0 contra H1: ^1 - ^2 < d0
La estadística de la prueba es:
Cuya distribución es aproximadamente normal N(0, 1) según sean las dos poblaciones normales o no.
Se rechaza H0 con riesgo igual a a, si Zcah eRC.(o si Zcalc &R.A.). No se rechaza H0 en caso contrario.
Se usa el intervalo de confianza I.C. al 100(1- a)% para la diferencia de medias ^1 - ^2, a fin de verificar si las
medias son iguales (cuando se cumple que ^1 - ^2 = 0 e
I.C.) o su diferencia asume un valor determinado (si ocurre que ^1 - ^2 = d0 e I.C.).
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad mínima para rechazar Ho), a
partir del valor Zcalc, de manera que:
• Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
• Para cola a la derecha: P = P[Z > Zcalc]
• Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < a, entonces, se rechaza H0. Se acepta H0, en caso contrario.
R.C. = {Z < - Z1-a }
^ _ X1 - X 2 - d 0
Nota 2.-
277
Ejemplo 7.-
Un fabricante quiere comparar los tiempos de proceso de dos marcas de máquinas A y B, para fabricar un tipo de
artículo. Al observar dos muestras aleatorias de 60 artículos procesados por A y B respectivamente, encuentra
que las medias respectivas son 1,230 y 1,190 segundos. Suponga a A = 120 y aB = 90 segundos.
a) Al nivel de significación del 5%, ¿se puede inferir que la máquina B es más rápida que la máquina A? Hallar el
valor P.
b) Al nivel de significación del 5%, ¿se puede inferir que la media de B es menor que la media de A en menos de
7 segundos? Hallar el valor P.
Solución
Sean XA y XB los tiempos de proceso con las máquinas A y B respectivamente y p A, pB sus medias respectivas.
Se desconocen las distribuciones de probabilidades de XA y XB, pero las muestras son grandes (n A = nB = 60 >
30). Para determinar si la máquina B es más rápida que la A, se comparan sus tiempos promedios de proceso: PA
> PB.
a) 1. Hipótesis: H0: pA = pB contra H1: pA > pB
2. Nivel de significación: a= 0.05.
3. Estadística de prueba.- si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística
apropiada es:
Z = XA ~ XB ^ N(0,1)
GA ! GB
Ín A nB
Media del
Error
Muestra N Media Desv.Est. estándar
1 60 1230 120 15
1190.0 90.0
2 60 12
+«-2
2 02 (« -1) Si + («2 -1)S2
donde el estimador de la varianza común a es: Sc _ - ------------------------------- -- --------------------
«+«-2
Si la hipótesis nula H0: ft_ ft es verdadera, entonces, la estadística.
T _ X1 - X 2 ^ t
ísT^K '+”2-2
2
«1 «2
Su valor: t _______________________ X1 X2
calc
V
(« -1) S12 + («2 -1)S22 f 1 1 ^
+
V «1 «2 J
«+«-2
que resulta de dos muestras aleatorias, se usa para probar H0 con una alternativa unilateral o bilateral.
282
La estructura de la prueba es similar a la usada con la distribución de t.
1. Prueba bilateral o de dos colas
Si se prueba H0: /^= contra H: la región crítica es el intervalo;
RC. = <~t\-a/2, n1+n2-2 0 T > ^-a/2, nj+n2-2 }
2. Prueba unilateral de cola a la derecha
Si se prueba H0: }\= ^ contra H : M > ^ la región crítica es el intervalo
R.C. = {T >Í!-a.n+„2-2 }
3. Prueba unilateral de cola a la izquierda
Si se prueba H0: ¡\= contra H : /A <^2 la región crítica es el intervalo.
RX. = {T <-tl_anl +„2-2 }
Ejemplo 8
Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración en Km; dos muestras aleatorias
de 16 llantas de cada marca, dieron estos resultados:
n1 = 16, X1 = 49,658, S1 = 2,150 y n2 = 16, x 2 = 48,125, S2 =
1,875.
Con el 1% de significación, probar si son diferentes las duraciones medias de las llantas de ambas marcas. Hallar
el valor-P.
Solución
Datos: n1 = 16, X1 = 49,658, S1 = 2,150 y n2 = 16, x 2 = 48,125, S2 = 1875.
• Primero se debe probar si las varianzas de las duraciones de las llantas de ambas marcas son iguales o no.
Hipótesis: H0 : af = a\, Hx :ol ^&l, a = 0.01
Estadística de prueba: siendo las poblaciones normales y suponiendo verdadera la hipótesis nula Ho, para n 1 =
16 y n2 = 16, la estadística de prueba es:
S2
F=—^f
1 £ 2 ^ f 15,15
283
Región crítica, para a = 0.01 y la prueba bilateral, en la Tabla 4 de la distribución F, se obtiene los valores críticos:
f15, 15, 0.995 = 4.07; f15, 15, 0 005 = 1 / 4.07 = 0.246.
Entonces: R.C. = {F < 0.246 o F > 4.07}
S2 21502
Cálculos: con los datos de la muestra se obtiene: F, = ^ = 1.31
calc S2 18752
Decisión: como Fcah = 1.31 e R.A. se acepta Ho y concluimos que las
varianzas de las duraciones de las llantas de ambas marcas son iguales, con el 1% de significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas — Estadísticas básicas — a21 a22 2 varianzas
y aparece la Ventana 2 varianzas.
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra: 16 y 16, así como la Varianza: (de la muestra)
4622500 y 3515625 correspondiente a la Primera: y Segunda: muestra respectivamente.
Escoger Opciones... — Nivel de confianza: 95.0. Luego escoger Aceptar y Aceptar. En la hoja de Sesión aparecen
los resultados siguientes:
Prueba de varianzas iguales
H + 12 J
= 14.43 = 14
V «1 J | V «2 J « - 1 « - 1
100
n
16
12
12 -1 12 -1
Región crítica, para a = 0.01 y la prueba bilateral, en la Tabla 3: t 14, 0.995 = 2.977
R.C. = {T < -2.977 o T > 2.977}
Datos del problema:
n1 = 12, X1 = 505, S2 = 100 y n = 12, x 2 = 495, S22 = 16.
T_
calc
X1 - X2 _ 505 - 495 _
+ - «1 «2
100 16
>12 +12
= 3.22
Decisión: como tcalc = 3.22 G R.C. se rechaza Ho y se acepta Hx:ft . Se
concluye que los pesos medios de las bolsas con detergente de ambas máquinas sí son diferentes, al 1% de
significación.
• Para dos colas: P = 2P[T14 > 3.22] = 2[1 - P(T30 < 3.22)] = 2[1 - 0.9969] =
0.0062
Como el valor-P (hallado interpolando en T) = 0.0062 < a = 0.01 se rechaza Ho y se concluye también que los
pesos medios de las bolsas con detergente de ambas máquinas son diferentes, al 1% de significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas ^ Estadísticas básicas ^ 2t t de 2 muestras y aparece la Ventana t de 2 muestras
(prueba e intervalo de confianza).
Habilitar la opción Datos resumidos y escribir el Tamaño de muestra:, la Media: y la Desviación estándar:
correspondiente a la Primera: y Segunda: muestra respectivamente. No seleccionar Asumir varianzas iguales.
Escoger Opciones... ^ Nivel de confianza: 99.0. En Diferencia de la prueba:
dejar el 0. Escoger en Hipótesis alterna: no es igual a. Luego escoger Aceptar y Aceptar. En la hoja de Sesión
aparecen los resultados siguientes:
289
2
2
Prueba T de dos muestras e IC
Muestra
1
2
N Media 12505.0
12 495.00
Media Desv.Est.
10.0
4.00
Media del Error estándar 2.9 1.2
Diferencia = mu (1) - mu (2)
Estimado de la diferencia: 10.00
IC de 99% para la diferencia: (0.74, 19.26)
Prueba T de diferencia = 0 (vs. no =): Valor T = 3.22 Valor P = 0.006 GL = 14
Aparecen los resultados antes obtenidos tcalc = 3.22, los grados de libertad igual a 14 y el valor-P = 0.006 < a =
0.01 y se concluye también que los pesos medios de las bolsas con detergente de ambas máquinas son diferentes,
al 1% de significación.
6.7 PRUEBA DE HIPÓTESIS PARA LA PROPORCIÓN
Suponga que se dispone de una muestra aleatoria de n observaciones, obtenida de una población con una
proporción p de éxitos (elementos que poseen un atributo particular). Si el número de observaciones de la muestra
es grande y la proporción muestral observada es p, para realizar contrastes acerca de p se sigue los siguientes
pasos:
1. Hipótesis: H0: p = p0
H1: p Í p0 o H1: p > p0, o H1:p < p0,
2. Escoger el nivel de significación: a
3. Estadística de prueba: Z = P—P — N(0, 1)
290
Donde p
X # de éxitos en la muestra
proporción de elementos que
n
n
poseen un atributo particular en la muestra.
6. Decisión: se rechaza H0 con riesgo igual a a, Zcalc gR.C. (o si Zcalc &R.A.). No se rechaza H0 en caso contrario.
Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad mínima para rechazar Ho), a
partir del valor Zcalc, de manera que:
• Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
• Para cola a la derecha: P = P[Z > Zcalc]
• Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < a, entonces, se rechaza H0. Se acepta Ho, en caso contrario. Ejemplo 10
Una muestra aleatoria de 800 clientes de supermercados, 378 fueron capaces de decir el precio correcto de un
artículo inmediatamente después de ponerlo en el carro. Contrastar, al nivel de significación del 10%, la hipótesis
nula de que al menos la mitad de los compradores son capaces de decir el precio correcto, frente a la alternativa
de que la proporción poblacional es menor de la mitad. Asimismo, hallar el p-valor.
Denotemos por p la proporción poblacional de compradores capaces de decir el precio correcto en estas
circunstancias. Queremos contrastar las hipótesis:
Solución
• H0: p > p0 = 0.50 Hi: p < 0.50
a = 0.10 — Za —Z1-a —Z0.90 —128
La región crítica es R.C. = {Z < -1.28}
Datos: p0 = 0.50, n = 800, X = 378 p = 378/800 = 0.4725
El estadístico del contraste es, entonces,
Z„, = = ^í72^50 = -1.56
291
Decisión: como Zcalc = -1.64 e R.C. se rechaza la hipótesis nula con el 10% de significación. Se concluye que
menos de la mitad de los compradores son capaces de decir el precio correcto.
• P = P[Z < Zcalc] = P[Z < -1.56] = 0(-1.56) = 0.05938 Rpta.
Como el valor-P = 0.06 < a = 0.10 se rechaza la hipótesis nula y se concluye también que menos de la mitad de
los compradores son capaces de decir el precio correcto, con el 10% de significación.
Cálculos utilizando Minitab
Del menú escoger Estadísticas ^ Estadísticas básicas ^ 1P 1proporción y aparece la Ventana 1 proporción (prueba
e intervalo de confianza).
Habilitar la opción Datos resumidos y escribir el Número de eventos: 378 (número de éxitos) y el Número de
ensayos: 800 (tamaño de la muestra).
Nota: Si los datos muestrales aparecen en una columna (1 para cada éxito y 0 para cada fracaso), se escoge
Muestras en columnas: y se ingresa dicha columna. Lo que sigue es igual para ambos casos.
Marcar Realizar prueba de hipótesis y escribir en Proporción hipotética: 0.50. Escoger Opciones... ^ Nivel de
confianza: 90. Escoger en Hipótesis alterna: menor que. Seleccionar Utilice la prueba y el intervalo basado en la
distribución normal. Luego escoger Aceptar y Aceptar. En la hoja de Sesión aparecen los resultados siguientes:
Prueba e IC para una proporción
Prueba de p = 0.5 vs. p < 0.5
Límite
Muestra X N Muestra p superior 90% Valor Z Valor P
1 378 800 0.472500 0.495121 -1.56 0.060
Uso de la aproximación normal.
Aparecen los resultados antes obtenidos Zcab = -1.56 y el valor-P = 0.06 < a = 0.10 entonces se rechaza la
hipótesis nula y se concluye también que menos de la mitad de los compradores son capaces de decir el precio
correcto, con el 10% de significación.
292
6.8 PRUEBA DE HIPÓTESIS PARA LA DIFERENCIA DE DOS PROPORCIONES
Contrastar las hipótesis: Ho: p1 = p2 = p o p1 - p2 = 0 Contra:
H1: p1 < p2 o H1: p1 > p2 o H1: p1 ± P2
H1: p1 - p2 ± 0 o H1: p1 - p2 > 0 o H1: p1 - p2 < 0
Donde: p1 y p2 son parámetros, siendo estos parámetros las proporciones de éxito de dos poblaciones binomiales.
La estadística de prueba en la cual se basa los criterios de decisión es la variable aleatoria: ~ p 2;
que tiene distribución normal, esto se cumple para
muestras grandes la cual se aproxima a la distribución normal estándar.
Z=
P1 ~ P2 ~ (p1 ~ P2 ) Iaa , P2
N(0, 1)
n
Si se selecciona muestras aleatorias independientes de tamaño n 1 y n2 de una población binomial, se calcula la
proporción de éxitos px y p2 de cada
X
muestra: px = —1
y
X2
p2 = —2. Donde:
n “2
X1: Es el número de éxitos en la muestra de tamaño n 1 X2: Es el número de éxitos en la muestra de tamaño n 2 El
valor de la normal estándar Z, cuando Ho es verdadera y n 1, n2 son grandes
es:
Z=
p 1 ~ p 2
IAA , P2^2
p\ ~ p 2
pq
1 1
—+ —
n1 n2
Para calcular Z, se estima el valor de p que aparece dentro del radical así:
X, + X2 ^
p=
n + n2
Entonces el valor de la estadística Z, es: Zcalc =
1- p
p1 ~ p 2
pq
1 1
—+—
n1 n2
Luego usando los puntos críticos de la curva normal estándar se puede hallar
la región crítica para cada hipótesis alternativa.
293
PASOS PARA PROBAR LA HIPOTESIS DE DOS PROPORCIONES, CUANDO LAS MUESTRAS SON
GRANDES:
1. Ho: p1 = p2 o p1 - p2 = 0
H1: puede ser una de las alternativas.
H1: p1 < p2 O H1: p1 > p2 O
H1: p1 - p2 < 0 O H1: p1 - p2 > 0 O
2. Escoger un nivel de significación a.
3. La estadística de prueba es la variable aleatoria Pp - P2, que tiene una distribución aproximadamente normal
cuando n1 y n2 son grandes. Es decir:
H1: p1 ^ P2 H1: p1 - p2 í 0
2=
p 1 -p 2
N(0, 1)
,l2
n
Suponiendo que Ho es verdadera.
4. Región Critica:
• R.C. = {Z < Za/2 = - Z1- a/2 o Z > Z1- a/2 } para H1: p1 ^ P2
• R.C. = {Z > Z1-a}
• R.C. = {Z < Za = -Z1-a}
5. Para los cálculos se halla:
para H1: p1 > p2 para H1: p1 < p2
X1
X
y
P=
X1 + X 2
n + n2
Luego: 2 cala =
P1 - P 2
1 1
—+—
n1 n2
6. Decisión: Rechazar: Ho; si Z pertenece a la región crítica; en caso contrario aceptar Ho.
Método del valor P (o P-valor o sig o Probab, etc.)
Otra forma de establecer la regla de decisión, es calculando el valor P (probabilidad mínima para rechazar Ho), a
partir del valor Zcalc, de manera que:
• Para dos colas: P = P[|Z| > |Zcalc|] = P[Z < -|Zcalc|] + P[Z > |Zcalc|] = 2 P[Z < -|Zcalc|]
• Para cola a la derecha: P = P[Z > Zcalc]
• Para cola a la izquierda: P = P[Z < Zcalc]
>
1
2
Si el valor de P < a, entonces, se rechaza Hp. Se acepta Ho, en caso contrario.
294
Ejemplo 11
De una muestra aleatoria de 203 anuncios publicitados en revistas británicas, 52 eran humorísticos. De una
muestra aleatoria independiente de 270 anuncios publicados en revistas americanas, 56 eran humorísticos.
Contrastar, frente a una alternativa bilateral, la hipótesis nula de que las proporciones de anuncios cómicos de las
revistas británicas y americanas son iguales, con el 5% de significación. Hallar p-valor.
Solución
Sea las proporciones poblacionales de anuncios humorísticos en revistas británicas y americanas: p1 y p2,
entonces se desea probar las hipótesis:
• Ho: p1 = p2 y H1: p1 ^ p2 con a = 0.05 ^ Z1 - a/2 = Z0.975 = 196
La región crítica es R.C. = {Z < -1.96 o Z > 1.96}
* _ —1 _ 52
Datos: n1 = 203, X1 = 52, 56
203
= 0.256, n2 = 270, X2 = 56,
—7
P2 = 2
270
= 0.207, p =
—1 + — 2
n + n2
52 + 56
108
20)3+ 270 473
= 0.228 y
0.772
El estadístico del contraste es:
7 =
7 calc
p1 - p 2
1 1
—+—
0.256 - 0.207 1
0.228x0.772
+ ----------------
203 270
= 1.25
Decisión: como Zcalc = 1.25 e R.A. no se rechaza la hipótesis nula con el 5% de significación. Se concluye que las
proporciones de anuncios cómicos de las revistas británicas y americanas son iguales.
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = = 2 P[Z < -1.25] =
= 2 0(-1.25) = 2 (0.10565) = 0.2113 Rpta.
La hipótesis nula de que las proporciones poblacionales de anuncios humorísticos son la misma puede rechazarse
para niveles de significación mayores que 20.8%.
Como el valor-P = 0.2113 > a = 0.05 no se rechaza la hipótesis nula y se concluye también que las proporciones
de anuncios cómicos de las revistas británicas y americanas son iguales, con el 5% de significación.
295
1
1
Cálculos utilizando Minitab
Del menú escoger Estadísticas — Estadísticas básicas — 2P 2proporciones y aparece la Ventana 2 proporciones
(prueba e intervalo de confianza).
Habilitar la opción Datos resumidos y escribir para la Primera: y Segunda: muestra en Eventos: 52 y 108 (número
de éxitos) y en Ensayos: 203 y 403 (tamaño de la muestra).
Nota: Si los datos muestrales aparecen en diferentes columnas (1 para cada éxito y 0 para cada fracaso), se
escoge Muestras en diferentes columnas: y se ingresa dichas columnas en Primera: y Segunda:. Lo que sigue es
igual para ambos casos.
Escoger Opciones. — Nivel de confianza: 95. Dejar Diferencia de la prueba: 0.0. Escoger en Hipótesis alterna: no
es igual a. Seleccionar Utilice el cálculo agrupado de p para la prueba. Luego escoger Aceptar y Aceptar. En la
hoj a de Sesión aparecen los resultados siguientes:
Prueba e IC para dos proporciones
Muestra X N Muestra p
1 52 203 0.256158
2 56 270 0.207407
Diferencia = p (1 ) - p (2)
Estimado de la diferencia: 0. 0487502
IC de 95% para la diferencia: (-0.0283508, 0.125851)
Prueba para la diferencia = 0 vs. no = 0: Z = 1.25 Valor P =
0.211
v _ p - Po c \Po% V n
PRUEBAS DE HIPÓTESIS PARA DOS PARÁMETROS
P.H. PARA LA IGUALDAD DE VARIANZAS POBLACIONALES Ho : j2 = j\
S S¡
—— t
+
«1
Con: H =
S. + — S n
H
2Y
n -1
+
2y
^sp2
v n2 y «2 - 1
Tc > t1 - a Tc < ta |Tc| > t1 - a/2
O
N
E
in
P
O
PQ
L
A
1 CI
0
N
A
L
E
in
E
0
CP
-
a
2
II
0
P.H. PARA LA DIFERENCIA DE PROPORCK
7 _ p1 - p2 - p0 C ÍA& , p2q2 \ n n2
298
6.9 PROBLEMAS RESUELTOS
1. Las bolsas de cierta marca de gelatina indican un contenido medio de 250 gramos. Se toma una muestra
aleatoria de 36 bolsas, resultando una media de
246.5 gramos y una desviación típica de 12 gramos.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en las bolsas? Hallar p-valor.
22
b) ¿Aceptaría usted que o ^ 250 gr por bolsa? Use a = 0.05. Halle p-valor. Solución
a) Sea X la variable aleatoria definida como el peso de las bolsas de gelatina.
1. Hipótesis: Ho: = 250 gr. H1: ^ 250
2. Nivel de significación: a = 0.05.
3. Estadística de prueba: para muestras grandes (n > 30) es:
x-ft
Z _ j= cuya distribución es N(0,1).
J / \ l«
4. Región crítica: para a = 0.05 y la alternativa bilateral, en la Tabla 1 de la distribución normal estándar, se
encuentra el valor crítico: Z1-a/2 = Z0.975 = 1.96
Luego, la región crítica en la variable Z está dada por:
RC _{Zca,c <-1.96 O Zcac > 1%}
5. Cálculos, de los datos se tiene: n = 36, x _ 246.5, J _ S _ 12, = 250.
Entonces:
„ _x-ft_ 246.5-250 _
_ -------------------------------------------------------------- _ -------- — --------- _ -1. 75
J 12
calc
\l« a/36
6. Decisión: Puesto que Zcalc = -1.75 e R.A., no debemos rechazar H0 y
concluir con un 5% de significación que se está cumpliendo con el
contenido medio en las bolsas de gelatina.
• P-valor = P[|Z| > |-1.75|] = P[|Z| > 1.75] = 2 P[Z < -1.75] = 2(0.04006) =
0.0801.
299
Como el valor-P = 0.0801 > a = 0.05 no se rechaza Ho y se concluye también con un 5% de significación que
se está cumpliendo con el contenido medio en las bolsas de gelatina. b) Para verificar la hipótesis acerca de la
varianza, se siguen los siguientes pasos:
1. Hipótesis : H0: o2 = 250 H1: o2 ^ 250
2. Nivel de significación: a = 0.05
3. Estadística de prueba: población normal, con n = 36, y suponiendo verdadera la hipótesis H0, la estadística de
prueba es:
2 (n - 1)S2 (n - 1)S2 2
1 = ^2- = 250
4. Región crítica: Para a = 0.05 y para un contraste bilateral, en la tabla 2 de chi-cuadrado se encuentran los
siguientes valores críticos:
Xa/2,n-1 = X0.025,35 = 20.6 y 11-a/2,n-1 = X0.975.35 = 53.2
Luego, la región crítica es: R.C. {X2 < 20.6 o X2 > 53.2}
22
5. Cálculos: De los datos de la muestra resulta S = 12 = 144, entonces,
^ = 35(144) = 20.2
calc 250 250 250
22
6. Decisión: Como %ca!c = 20.2 e R.C. se rechaza H0: o = 250 y concluimos
que la varianza de las bolsas de gelatina es diferente a 250 gr 2 por bolsa, con el 5% de significación.
• Como la prueba es bilateral y Xcalc = 20.2 < n - 1 = 35 el valor-P se obtiene así:
P = 2 P[ x2_1 < Xcalc ] = 2 P[ X325 < 20.2] = 2 x (1)
Como en la tabla 2, de chi-cuadrado, para 35 grados de libertad, no está el valor 20.2, pero éste se encuentra
entre los valores 18.5 (con probabilidad
0.01) y 20.6 (con probabilidad 0.025) se determina x interpolando de la siguiente manera:
Xp
18.5 0.01
206
20.2 x ^ -18 5 = 202 -18 5 ^ 140 =
0.025 - 0.01 x - 0.01 x - 0.01
300
20.6 0.025 ^ 140 x - 1.40 = 1.70 ^ x = 0.02214
Reemplazando x = 0.02214 en (1) se obtiene:
P = P-valor = 2{0.02214} = 0.0443 Rpta.
Como el valor-P = 0.0443 < a = 0.05 se rechaza H0: o2 = 250. Por lo tanto, se concluye también con un 5% de
significación que la varianza de las bolsas de gelatina es diferente a 250 gr2 por bolsa.
2. En un estudio para determinar si ha disminuido el tiempo de vida (en horas) del artículo producido por una
empresa, se tomó una muestra aleatoria de 31 artículos, encontrándose los resultados siguientes: x = 45020
horas y S = 171 horas.
a) Aceptaría usted que el verdadero tiempo promedio de vida de los artículos de
la empresa es menor de 45 090 horas. Use a = 0.01 y determine p-valor.
b) ¿Aceptaría usted que o ^ 200 horas por artículo? Use a = 0.05. Halle p-valor. Solución
a) Sea X la variable aleatoria definida como el tiempo de vida del artículo.
1. Hipótesis: H0: m = 45090 horas H1: m < 45090
2. Nivel de significación: a = 0.01.
3. Estadística de prueba: para muestras grandes (n > 30) es:
X-u
Z = j= cuya distribución es N(0,1).
j / \ ¡n
4. Región crítica: para a = 0.01 y la alternativa unilateral izquierda, en la Tabla 1 de la distribución normal estándar,
se encuentra el valor crítico:
Za = -Z1-a ^ Z0.01 = -Z0.99 = -2.33.
Luego, la región crítica está dada por: R.C = {Zcalc < -2.33}
5. De los datos se tiene: n = 31, x = 45020, j = S = 171, m = 45090.
7 x-M 45020 - 45090 Entonces: Z . = -- = ------------- ¡=— = -2.28 e R.A.
j/,.fn 171A/3I
6. Decisión: se acepta H0, se concluye al 1% de significación que el tiempo promedio de vida de los artículos de
la empresa es igual a 45 090 horas.
• P-valor = P = P[Z < -2.28] = 0.0113. Rpta.
301
Como P = 0.0113 > a = 0.01 se acepta Ho y se concluye también con a =
0.01.que el tiempo medio de vida de los artículos de la empresa es de 45 090 horas.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos:
1. Hipótesis: Ho: o = 200 — o2 = 40000 H1: o ^ 200 — H1: o2 ^
40000
2. Nivel de significación: a = 0.05
3. Estadística de prueba: población normal, con n = 31, y suponiendo verdadera H0, la estadística
de prueba es:
2 2
2 (n ~ 1)S (31 ~ 1)S 2
1 =-40üar ^X»
4. Región crítica: Para a = 0.05 y para un contraste bilateral, en la tabla 2 de chi-cuadrado se encuentran los
siguientes valores críticos:
Xa!2,n-1 = X0.025,30 = 168 y X1~a/2,n~1 = X0.975.30 = 470
Luego, la región crítica es: R.C. {X2 < 16.8 o X2 > 47.0}
22
5. Cálculos: De los datos de la muestra resulta S = 171 = 29 241, entonces,
2 _ (n~ 1)S2 _ 30S2 _ 30(29241) _21 g Xcalc 40000 40000 40000 .
6. Decisión: Como x2caic =21.9 e R.A. no se rechaza H0: o = 200 y
concluimos que la desviación estándar del tiempo de vida de los artículos de la empresa es igual a 200 horas, con
el 5% de significación.
Como la prueba es bilateral y Xcalc 21 .9 < n - 1 = 30 el valor-P se obtiene así:
P = 2 P[X„2~1 < x'caic ] = 2 P[X320 < 21.9] = 2 x (1)
Como en la tabla 2, de chi-cuadrado, para 30 grados de libertad, no está el valor 21.9, se determina x interpolando
de la siguiente manera:
X2 P
20.6 0.10
219 x 23.4~20.6 _ 21.9~20.6 ^ = 1.3
0.20 ~ 0.10 x ~ 0.10 x ~ 0.10
302
23.4 0.20 ^ 28 x - 2.8 = 1.3 ^ x = 0.1464
Reemplazando x = 0.1464 en (1) se obtiene:
P = P-valor = 2{0.1464} = 0.2928 Rpta.
Como el valor-P = 0.2928 > a = 0.05 se acepta H0: o = 200. Por lo tanto, se concluye también con un 5% de
significación que la desviación estándar del tiempo de vida de los artículos de la empresa es igual a 200 horas.
3. Un proceso está programado para embolsar la cantidad media de 500 gramos de sal. Se toma una muestra
aleatoria de 41 bolsas, resultando una media de 495 gr. y una desviación típica de 12 gr.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en las bolsas de sal? Halle p-valor.
22
b) ¿Aceptaría usted que o < 200 gr por bolsa? Use a= 0.01. Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el contenido de salen las bolsas.
1. Hipótesis: Ho: L = 500 gr. H1: L ^ 500
2. Nivel de significación: a = 0.05
3. Estadística de prueba: para muestras grandes (n > 30) es:
X- Ll
Z = j= cuya distribución es N(0,1).
j / \ ¡n
4. Región crítica: para a = 0.05 y la alternativa bilateral, en la Tabla 1 de la normal estándar, se encuentra el valor
crítico: Z1-a/2 = Z0.975 = 1.96 Luego, la región crítica en la variable Z está dada por:
RC = {Zcalc <-1.96 o Zcalc > 196}
5. De los datos se tiene: n = 41, x = 495, j = S = 12, l = 500.
TJ + 7 x-L 495 - 500
Entonces: Z . = -------------------------------------------------------- = -2.32 e R.C.
j/4ñ 12/V3T
6. Decisión: se rechaza H0 y se acepta H1: L ^ 500, se concluye al 5% de significación que no se está cumpliendo
con el contenido medio en las bolsas de sal.
• P-valor = P[|Z| > |-2.32|] = P[|Z| > 2.32] = 2 P[Z < -2.32] = 2(0.01017) =
0.02034. Rpta.
303
Como P = 0.02034 < a = 0.05 se rechaza Ho y se concluye también con a =
0.05. que no se está cumpliendo con el contenido medio en las bolsas de sal.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes
pasos:
1. Hipótesis: H0: o2 = 200 gr2 H1: o2 < 200 gr2
2. Nivel de significación: a = 0.01
3. Estadística de prueba: población normal, con n = 41, y suponiendo verdadera H0, la estadística
de prueba es:
2
2 («- 1)S (41 - 1)S2 2
1 _ -J- _ 200 X
4. Región crítica: Para a = 0.01 y para un contraste unilateral izquierdo, en la tabla 2 de chi-cuadrado se encuentran
el valor crítico siguiente:
Xa,«-1 _ X0.01, 40 _ 22.2
Luego, la región crítica es: R.C. {X2 < 22.2}
22
5. Cálculos: De los datos de la muestra resulta S = 12 = 144, entonces,
2 _(« -1)S2 _ 40S2 _ 40(144) _2gg Xcalc 200 200 200 .
22
6. Decisión: Como %caic = 28.8 e R.A. no se rechaza H0: o = 200 y
concluimos que la varianza del contenido en las bolsas de sal es igual a 200 gr 2, con el 1% de significación.
Como la prueba es unilateral a la izquierda el valor-P se obtiene así:
P = P[X-1 < X^íaic ] = P[X40 < 28.8] = x (1)
Como en la tabla 2, de chi-cuadrado, para 30 grados de libertad, no está el valor 28.8, se determina x interpolando
de la siguiente manera:
XP
26.5 0.05
29 1 -26 5 _ 28 8-26 5 ^ 52 = 2 3
28.8 x ^
0.10 - 0.05 x - 0.05 x - 0.05
29.1 0.10 ^ 52 x - 2.6 = 2.3 ^ x =
0.0942
Reemplazando x = 0.0942 en (1) se obtiene: P = P-valor = 0.0942 Rpta.
304
Como el valor-P = 0.0942 > a = 0.05 se acepta H0: o2 = 200. Por lo tanto, se concluye también con el 1% de
significación, que la varianza del contenido en las bolsas de sal es igual a 200 gr .
4. Una muestra de 50 animales experimentales reciben una cierta clase de ración por un período de 2 semanas.
Sus aumentos de pesos arrojan los valores x = 420 gr. y S = 60 gr.
a) ¿Hay razón para creer que el aumento de peso neto medio poblacional es mayor a 410 gr? Use a = 0.01. Halle
p-valor.
222
b) Con a = 0.01 ¿Será rechazada la hipótesis o = 2500 gr a favor de o >
2500? Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el aumento de peso en los animales.
1. Hipótesis: H0: p = 410 gr. H1: p > 410
2. Nivel de significación: a = 0.01
3. Estadística de prueba: para muestras grandes (n > 30) es:
x-p
Z = j= cuya distribución es N(0,1).
j / \ ¡n
4. Región crítica: para a = 0.01 y la alternativa unilateral derecha, en la Tabla 1 de la normal estándar, se encuentra
el valor crítico: Z1-a = Z099 = 2.33 Luego, la región crítica en la variable Z está dada por:
RC = {Zrat > 2.33}
5. De los datos se tiene: n = 50, x = 420, á = S = 60, p = 410.
x-p 420 - 410
t- , 7
Entonces: Z, = -------------------------------- = -------------- 1=- = 1.18 e R.A.
j /Jn 60/A/50
6. Decisión: no se rechaza H0: p = 410 y se concluye al 1% de significación, que el aumento de peso neto medio
de los animales es igual a 410 gr.
P = P[Z > 1.18] = 1 - P[Z < 1.18] = 1 - 0.881 = 0.119 Rpta.
Como valor-P = 0.119 > a = 0.01 no se rechaza Ho y se concluye también con a = 0.01, que el aumento de peso
neto medio de los animales es igual a 430 gr.
305
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos:
1. Hipótesis: H0: o2 = 2500 gr2
H1: o2 > 2500 gr2
2. Nivel de significación: a = 0.01
3. Estadística de prueba: población normal, con n = 50, y suponiendo verdadera H0, la estadística
de prueba es:
2 (n - 1)S2 (50 - 1)S2 2
1 = -j- = 2500 ^
4. Región crítica: Para a = 0.01 y para el contraste unilateral derecho, en la tabla 2 de chi-cuadrado se encuentran
el valor crítico siguiente:
11-a,n-1 =^0.99, 49 = 749
2500
2500
2500
= 70.6
6. Decisión: Como x2calc = 70.6 e R.A. no se rechaza H0: o = 2500 y se
concluye que la varianza del aumento del peso neto de los animales es igual a 2500 gr , con el 1% de significación.
Como la prueba es unilateral a la derecha el valor-P se obtiene así:
P = P[ 12-1 > xLc ] = P[I49 > 70.6] = 1 - P[I49 < 70.6] = 1 - x
(1)
Como en la tabla 2, de chi-cuadrado, para 49 grados de libertad, no está el valor 70.6, se determina x interpolando
de la siguiente manera:
x2 p
70.2 0.975
74.9 - 70.2 70.6 - 70.2 _
70.6
x
0.99 - 0.975 x - 0.975
313.3 =
0.4
x - 0.975
74.9 0.99 ^ 313.3 x - 305.5 = 0.4 ^
Reemplazando x = 0.9763 en (1) se obtiene:
P = P-valor = 1 - 0.9763 = 0.0237 Rpta.
x = 0.9763
306
Como el valor-P = 0.0237 > a = 0.01 se acepta H0: o2 = 2500. Por lo tanto, se concluye también con el 1% de
significación, que la varianza del aumento del peso neto de los animales es igual a 2500 gr .
5. Una universidad grande quiere estimar el número medio de días de enfermedad de los estudiantes durante
un año; una muestra de 50 estudiantes indica que x = 3.2 días y S = 5.2 días.
a) ¿Hay razón para creer que el verdadero número medio de días de enfermedad
es diferente a 6 días? Use a = 0.05. Halle p-valor.
22
b) Con a = 0.01 ¿Será rechazada la hipótesis o = 50 a favor de o < 50? Halle
p-valor.
Solución
a) Sea X la variable aleatoria definida como el número de días de enfermedad de los estudiantes durante un
año.
1. Hipótesis: H0: p = 6 días H1: p ^ 6
2. Nivel de significación: a = 0.05
X~u
3. Estadística de prueba: para n > 30 es: Z = j= — N(0,1).
a/\n
4. Región crítica: para a = 0.05 y la alternativa bilateral, en la Tabla 1 de la normal estándar, se encuentra el valor
crítico: Z1-a/2 = Z0.975 = 1.96 Luego, la región crítica en la variable Z está dada por:
RC = {Zcalc <~1.96 o Zac > 1.96}
5. De los datos se tiene: n = 50, x = 3.2, a = S = 5.2, p =
6.
Entonces: Z , = x p = 3 2 ^ = ~3.81 e R.C. a/^Jn 5.2A/50
6. Decisión: se rechaza H0 y se acepta H1: p ^ 6, se concluye con el 5% de significación, que el número medio de
días de enfermedad de los estudiantes es diferente a 6 días (de acuerdo a los resultados estimados es de 3.2
días).
307
• P = P[|Z| > |-3.81|] = P[|Z| > 3.81] = 2 P[Z < -3.81] = 2(0.000) = 0.000.
Rpta.
Como P = 0.000 < a = 0.05 se rechaza Ho y se concluye también con a =
0.05. que el número medio de días de enfermedad de los estudiantes es diferente a 6.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos:
1. Hipótesis: H0: o2 = 50 días2 H1: o2 < 50 días2
2. Nivel de significación: a = 0.01
3. Estadística de prueba: población normal, con n = 50, y suponiendo verdadera H0, la estadística
de prueba es:
, _ (n - 1)S2 _ (50 - 1)S2 ,
X j2 50 ^X«
4. Región crítica: para a = 0.01 y el contraste unilateral izquierdo, en la tabla 2 de chi-cuadrado se encuentran el
valor crítico siguiente:
Xa,n-1 = X0.01, 49 = 28.9
2
Luego, la región crítica es: R.C. {X < 28.9}
22
5. Cálculos: De los datos de la muestra resulta S = 5.2 = 27.04, entonces,
2 _ (n - 1)S2 _ 49S2 _ 49(27.04) _ 26 Xcalc 50 50 50 .
22
6. Decisión: Como xcah = 26.5 e R.C. se rechaza H0: o = 50 y concluimos
que la varianza del número de días de enfermedad de los estudiantes es diferente a 50 días , con el 1% de
significación (de acuerdo a los resultados estimados es de 27.04 días ).
Como la prueba es unilateral a la izquierda el valor-P se obtiene interpolando: P = P[x2-1 < Xcalc ] = P[X49 < 26.5]
= 0.0041
Como el valor-P = 0.0041 < a = 0.01 se rechaza H0: o = 50. Por lo tanto, se concluye también con el 1% de
significación, que la varianza del número de días de enfermedad de los estudiantes es diferente a 50 días 2.
308
6. Las calificaciones de diez estudiantes en un examen de estadística fueron: 43, 61, 67, 70, 74, 76, 79, 85, 94
y 81. Suponga que estas calificaciones proceden de una población normal.
a) Ponga a prueba H0: p = 70 contra H1: p ^ 70, con un nivel de significación del 5%. Halle p-valor.
22
b) Ponga a prueba H0: o = 500 contra H1: o ^ 500, con un nivel de
significación de 0.05. Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como las calificaciones de los alumnos.
1. Hipótesis: H0: p = 70 H1: p ^ 70
2. Nivel de significación: a = 0.05.
3. Estadística de prueba: T _ x ^ L
S /Jñ
4. Región crítica: para a = 0.05 y la alternativa bilateral, se encuentra el valor crítico en la Tabla 3: t1-a/2, n-1 = t0.975,
9 = 2.262
Luego, la región crítica en la variable T es: R.C = {T < -2.262 o T > 2.262}
5. Cálculos, con los datos se obtiene: n = 10, x = 73, S = 14.08 y p = 70
x- 73 - 70
t-. , T
Entonces: Tcalc _ ----------------------------- _---------------------- ¡= = 0.67
S !^¡n 14.08/a/1ü
6. Decisión: puesto que Tcalc = 0.67 e R.A., se acepta H0 y se concluye con un 5% de significación que la nota
promedio de los alumnos es de 70 puntos.
Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T9| > |0.67|] = 2 P[T9 > 0.67] = 2{1 - P[T9 < 0.67]} = 2 (1 - 0.75) = 0.50 Rpta.
Ya que en la tabla 3, T de student, para 9 grados de libertad, al valor 0.67 =
0.70, le corresponde una probabilidad acumulada de 0.75.
Como el valor-P = 0.50 > a = 0.05, se acepta Ho: p = 70 y se concluye también, con un 5% de significación, que
la nota promedio de los alumnos es de 70 puntos.
309
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos:
1. Hipótesis: H0: o2 = 500 H1: o2 ^ 500
2. Nivel de significación: a = 0.05
3. Estadística de prueba: población normal, con n = 10, y suponiendo verdadera H0, la estadística
de prueba es:
2 (n - 1)S2 (10 - 1)S2 2
1 = -j- = -500 -----------------------------------------
4. Región crítica: Para a = 0.05 y para un contraste bilateral, en la tabla 2 de chi-cuadrado se encuentran los
siguientes valores críticos:
2 2 2 1a/2,n-1 = 10.025,9 = 270 y 11-a/2,n-1
10.
975.9
19.0
Luego, la región crítica es: R.C. {X2 < 2.70 o X2 > 19.0}
5. Cálculos: De los datos de la muestra resulta S2 = 14.082 = 198.25, entonces,
2 _ (n- 1)S2 _9S^ 9(198.25) _35?
1calc 500 500 500 .
22
6. Decisión: Como 1calc = 3.57 e R.A. no se rechaza H0: o = 500 y se
concluye que la varianza de las notas de los alumnos es igual a 500 puntos , con el 5% de significación.
Como la prueba es bilateral y 1^alc = 3.57 < n - 1 = 9 el valor-P se obtiene así:
P = 2 P[ 12-1 < 1calc ] = 2 P[ 192 < 3.57] = 2 x (1)
Como en la tabla 2, de chi-cuadrado, para 9 grados de libertad, no está el valor 3.57, se determina x interpolando
de la siguiente manera:
X2 P
3.33 0.05
3.57
x
4.17 - 3.33 3.57 - 3.33
16.8 =
0.10 - 0.05 x - 0.05
4.17 0.10 ^ 16.8 x - 0.84 = 0.24 ^
Reemplazando x = 0.064 en (1) se obtiene:
P = P-valor = 2{0.064} = 0.128 Rpta.
0.24 x - 0.05
x = 0.064
310
Como el valor-P = 0.128 > a = 0.05 se acepta H0: o2 = 500. Por lo tanto, se concluye también con un 5% de
significación, que la varianza de las notas de los alumnos es igual a 500 puntos .
7. Los pesos de los paquetes de arroz embolsado es de 15 Kg. Una muestra aleatoria de 8 paquetes da una
media de 15.3 Kg. y una desviación típica de 1.211 Kg. Suponga que los pesos se distribuyen normalmente.
a) Con una significación del 5 % pruebe si el verdadero peso medio de los
paquetes de arroz es distinto de 15 Kg. Halle p-value.
22
b) Ponga a prueba H0: o = 5 contra H1: o ^ 5, con un a = 0.05. Halle p-valor. Solución
a) Sea X la variable aleatoria definida como el peso de los paquetes de arroz.
1. Hipótesis: H0: p = 15 H1: p ^ 15
2. Nivel de significación: a = 0.05.
3. Estadística de prueba: T = X p ^ t,
7
S/Jn
4. Región crítica: para a = 0.05 y la alternativa bilateral, se encuentra el valor crítico en la Tabla 3: t 1-a/2, n-1 = t0.975,
7 = 2.365
Luego, la región crítica en la variable T es: R.C = {T < -2.365 o T > 2.365}
5. Cálculos, con los datos se obtiene: n = 8, x = 15.3, S = 1.211 y p = 15
Entonces: Tcalc = x p = 163—15 = 0.70 S/Jn 1.211A/8
6. Decisión: puesto que Tcalc = 0.70 e R.A., se acepta H0 y se concluye con un 5% de significación que el peso
medio de los paquetes de arroz es igual a 15 Kg.
Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T7| > |0.70|] = 2 P[T7 > 0.70] = 2{1 - P[T7 < 0.70]} = 2 (1 - 0.75) = 0.50 Rpta.
Ya que en la tabla 3, T de student, para 7 grados de libertad, al valor 0.70, le corresponde una probabilidad
acumulada cercana a 0.75.
311
Como el valor-P = 0.50 > a = 0.05, se acePta Ho: p = 15 y se concluye también, con un 5% de significación, que
el Peso medio de los Paquetes de arroz es igual a 15 Kg.
b) Para verificar la hiPótesis acerca de la varianza, se siguen los siguientes Pasos:
1. HiPótesis: Ho: o2 = 5 H1: o2 í 5
2. Nivel de significación: a = 0.05
3. Estadística de Prueba: Población normal, con n = 8, y suPoniendo verdadera H0, la estadística de Prueba
es:
2 (n - 1)S2 (8 - 1)S2 2
— Zi
Z-J
G 5
4. Región crítica: Para a = 0.05 y Para un contraste bilateral, en la tabla 2 de chi-cuadrado se encuentran los
siguientes valores críticos:
Za/2,n-1 — Z0.025,7 — 169 y Z1-a/2,n-1 — Z0.915.1 — 160
Luego, la región crítica es: R.C. {X2 < 1.69 o X2 > 16.0}
22
5. Cálculos: De los datos de la muestra resulta S = 1.211 = 1.467, entonces,
2 _ (n-1)S2_ 7S2_ 7(1.467) _
ZcaIc 5 5 5.
22
6. Decisión: Como zaaiC = 2.05 e R.A. no se rechaza H0: o =5 y se
concluye que la varianza de los Pesos de los Paquetes de arroz es igual a 5
Kg , con el 5% de significación.
Como la Prueba es bilateral y Zlc = 2.05 < n - 1 = 7 el valor-P se obtiene así:
P = 2 P[ Z2-1 < zL ] = 2 P[ Z72 < 2.05] = 2 x (1)
Como en la tabla 2, de chi-cuadrado, Para 7 grados de libertad, no está el valor 2.05, se determina x interPolando
de la siguiente manera:
X P
1.69 0.025
2 17
2.05 x ^ -1 69 -2 05 -1 69 ^ 19.2 =
0.36
x - 0.025
0.05 - 0.025 x - 0.025
312
2.17 0.05 ^ 19.2 x - 0.48 = 0.36 ^ x = 0.044
Reemplazando x = 0.044 en (1) se obtiene:
P = P-valor = 2{0.044} = 0.088 Rpta.
Como el valor-P = 0.088 > a = 0.05 se acepta H0: o = 5. Por lo tanto, se concluye también con un 5% de
significación, que la varianza de los pesos de los paquetes de arroz es igual a 5 Kg .
8. Se prueba una muestra aleatoria de 5 fusibles de cierta marca para determinar el punto medio de ruptura. Los
puntos de ruptura medidos en amperes fueron: 28, 32, 30, 24 y 36.
a) ¿Hay razón para creer que el verdadero punto medio de ruptura es mayor de 22 amperes? Use a = 0.01. Halle
p-valor.
2 2 9
b) Con a = 0.01, ¿Será rechazada la hipótesis o = 30 amp a favor de o < 30? Halle p-valor.
Solución
a) Sea X la variable aleatoria definida como el punto de ruptura de los fusibles.
1. Hipótesis: H0: p = 22 amperes H1: p > 22
2. Nivel de significación: a = 0.01.
3. Estadística de prueba: T = X L ^ t,
S/4ñ
4. Región crítica: para a = 0.01 y la alternativa unilateral derecha, se encuentra el valor crítico en la Tabla 3: t 1-a, n-
1 = t0.99, 4 = 3.747
Luego, la región crítica en la variable T es: R.C = {T > 3.747}
5. Cálculos, con los datos se obtiene: n = 5, x = 30, S = 4.472 y p=
22
Entonces: Tcalc =±JL = 30 ~22 = 4.0
S Hn 4.472 A/5
6. Decisión: puesto que Tcalc = 4.0 e R.C., se rechaza H0 y se concluye con el 1% de significación que el punto
medio de ruptura es mayor de 22 amperes.
• Siendo la prueba unilateral derecha, entonces p-valor = P es:
P = P[T4 > Tcalc] = P[T4 > 4.0] = {1 - P[T4 < 4.0]} = (1 - 0.9915) = 0.0085 Rpta.
313
Ya que en la tabla 3, T de student, para 4 grados de libertad, no está el valor 4.0, se interpola y obtiene una
probabilidad acumulada de 0.9915.
Como el valor-P = 0.0085 < a = 0.01, se rechaza Ho: p = 22 y se concluye también, con el 1% de significación,
que el punto medio de ruptura de los fusibles es mayor de 22 amperes.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos:
1. Hipótesis: H0: o2 = 30 amp2 H1: o2 < 30
2. Nivel de significación: a = 0.01
3. Estadística de prueba: población normal, con n = 5, y suponiendo verdadera H0, la
estadística de prueba es:
2 2
X2 = (n~ 1)S = (5~1)S ,
X a2 30 ^X4
4. Región crítica: Para a = 0.01 y para un contraste de la cola izquierda, en la tabla 2 de chi-cuadrado se encuentra
el siguiente valor crítico:
Xa, n ~1 = X0.01.4 = °.297
Luego, la región crítica es: R.C. {X2 < 0.297}
2
5. Cálculos: De los datos de la muestra resulta S = 20, entonces,
2
x2 _ (n ~1)S _4S^4(20)_267
Xcaic 30 30 30 .
22
6. Decisión: Como %calc = 2.67 e R.A. no se rechaza H0: o = 30 y se
concluye que la varianza de los puntos de ruptura de los fusibles es igual a 30 amp , con el 1% de significación.
• Como la prueba es unilateral izquierda y x2caic = 2.67, el valor-P se obtiene así:
P = P[Xl~1 < Xcaic ] = P[X42 < 2.67] = 0.3857 Rpta.
Ya que en la tabla 2, de chi-cuadrado, para 4 grados de libertad, no está el valor 2.67, se interpola y obtiene una
probabilidad acumulada de 0.3857 Como el valor-P = 0.3857 > a = 0.01 se acepta H0: o2 = 30. Por lo tanto, se
concluye también con el 1% de significación, que la varianza de los puntos de ruptura de los fusibles es igual a 30
amp2.
314
9. Un fabricante sostiene que sus autos consumen en promedio 2.50 galones de gasolina cada 100 Km. Un
vendedor de la compañía comprueba el consumo de gasolina de 25 autos y encuentra que el consumo medio
es de 2.61 galones cada 100 Km. con una desviación estándar de 0.25 galones.
a) ¿puede dudarse de lo sustentado por el fabricante? Use a = 0.01. Halle p- valor.
b) ¿Será rechazada la hipótesis o ^ 0.38? Use a = 0.01. Halle p-valor.
Solución
a) Sea X la variable definida como el número galones consumidos cada 100 Km.
1. Hipótesis: H0: p = 2.5 galones H1: p ^ 2.5
2. Nivel de significación: a = 0.01.
3. Estadística de prueba: T = x A ^ L,
S/4ñ
4. Región crítica: para a = 0.01 y la prueba es bilateral, se encuentra el valor crítico en la Tabla 3: t 1-a/2, n-1 = t0.995,
24 = 2.797
Luego, la región crítica en la variable T es: R.C = {T < -2.797 o T > 2.797 }
5. Cálculos, con los datos se obtiene: n = 25, x = 2.61, S = 0.25 y p =
2.5
Entonces: Tcalc = *ZJL = 261 - 2.50 = 2.2 S Uín 0.25/ a/25
6. Decisión: puesto que Tcalc = 2.2 e R.A., no se rechaza H0 y se concluye con el 1% de significación que el
consumo medio de gasolina en los autos es de 2.5 galones cada 100 Km. y no puede dudarse de lo sustentado
por el fabricante.
Siendo la prueba bilateral, entonces p-valor = P es:
P = P[|T24| > |2.2|] = 2 P[T24 > 2.2] = 2{1 - P[T24 < 2.2]} = 2 (1 - 0.98) = 0.04
Rpta.
Ya que en la tabla 3, T de student, para 24 grados de libertad, no está el valor
2.2, se interpola y obtiene una probabilidad acumulada de 0.98.
315
Como el valor-P = 0.04 > a = 0.01, no se rechaza Ho: p = 2.5 y se concluye también, con el 1% de significación,
que el consumo medio de gasolina en los autos es de 2.5 galones cada 100 Km.
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos:
1. Hipótesis: H0: o2 = 0.38 galones2 H1: o2 ^ 0.38
2. Nivel de significación: a = 0.01
3. Estadística de prueba: población normal, con n = 5, y suponiendo verdadera H0, la
estadística de prueba es:
2 (n - 1)S2 (25 - 1)S2 2
1 = -j*- = -¡03F- ^j24
4. Región crítica: Para a = 0.01 y para un contraste bilateral, en la tabla 2 de chi-cuadrado se encuentran los
siguientes valores críticos:
Xa/2,n-1 = %0.005,24 = 9.89 y 11-a/2,n-1 = ^0.995.24 = 456
Luego, la región crítica es: R.C. {X2 < 9.89 o X2 > 45.6}
22
5. Cálculos: De los datos de la muestra resulta S = 0.25 = 0.0625, entonces,
2 _ (n - 1)S2 _ 24S2 _ 24 (0.0625) _3 95 Xcalc 0.38 0.38 0.38 .
22
6. Decisión: Como xaah = 3.95 e R.C. se rechaza H0: o = 0.38 y se
concluye que la varianza del consumo de gasolina en los autos por cada 100 Km. es diferente a 0.38 galones ,
con el 1% de significación.
• Como la prueba es bilateral y tic = 3.95 < n - 1 = 24 el valor-P se obtiene así:
P = 2 P[Z„2-1 < Xcalc ] = 2 P[ 1224 < 3.95] = 2 (0.00) = 0.000
Ya que en la tabla 2, de chi-cuadrado, para 24 grados de libertad, el valor 3.95, tiene una probabilidad acumulada
menor de 0.0005 = 0.000 Como el valor-P = 0.000 < a = 0.01 se rechaza H0: o2 = 0.38. Por lo tanto, se concluye
también con el 1% de significación, que la varianza del consumo de gasolina en los autos por cada 100 Km. es
diferente a 0.38 galones .
316
10. Una muestra de 25 clientes de cierta gasolinera indica que el número medio de galones comprados a la
semana es de x = 14.3 y la desviación estándar de S = 2.7 galones.
a) Con el 5 % de significación. ¿Hay razón para creer que el verdadero número medio de galones comprados a la
semana por cliente es menor de 15.6? Determine el p-valor.
b) Con a = 0.05 ¿Aceptaría usted que o > 4.1? Determine el p-valor.
Solución
a) Sea X la variable definida como el número de galones de gasolina comprados a la semana por un cliente.
1. Hipótesis: H0: p = 15.6 galones H1: p < 15.6
2. Nivel de significación: a = 0.05.
3. Estadística de prueba: T _ x ^ L,
S/4ñ
4. Región crítica: para a = 0.05 y la prueba de la cola izquierda, se encuentra el valor crítico en la Tabla 3: t a, n-1 =
-t1-a, n-1 ^ t005, 24 = -t0.95, 24 = -1.711. Luego, la región crítica en la variable T es: R.C = {T < -1.711}
5. Cálculos, con los datos se obtiene: n = 25, x = 14.3, S = 2.7 y p =
15.6
143—156 = -2.41
Entonces: Tcalc _ _
S /,fn 2.7 / a/25
6. Decisión: puesto que Tcalc = -2.41 e R.C., se rechaza H0 y se concluye con el 5% de significación, que el
consumo medio semanal de gasolina por cliente es menor a 15.6 galones.
Siendo la prueba unilateral izquierda, entonces p-valor = P es:
P = P[T24 < -2.41] = 1 - P[T24 < 2.41] = 1 - 0.987 = 0.013 Rpta.
Ya que en la tabla 3, T de student, para 24 grados de libertad, no está el valor 2.41, se interpola y obtiene una
probabilidad acumulada de 0.987.
Como el valor-P = 0.013 < a = 0.05, rechaza Ho: p = 15.6 y se concluye también, con el 5% de significación, que
el consumo medio semanal de gasolina por cliente es menor a 15.6 galones.
317
b) Para verificar la hipótesis acerca de la varianza, se siguen los siguientes pasos:
1. Hipótesis: Ho: o2 = 4.1 galones2 H1: o2 > 4.1
2. Nivel de significación: a = o.o5
3. Estadística de prueba: población normal, con n = 25, y suponiendo verdadera Ho, la estadística
de prueba es:
^2 //ir i\c2
2 (n - 1)S2 (25 - 1)S2 2
X --J- - “41 ----------------------------------------------------- >X24
4. Región crítica: Para a = o.o5 y para un contraste unilateral derecho, en la tabla 2 de chi-cuadrado se encuentran
el siguiente valor crítico:
X1-a,n-1 — X0.95, 24 — 364
2
Luego, la región crítica es: R.C. {X > 36.4}
22
5. Cálculos: De los datos de la muestra resulta S = 2.7 = 7.29, entonces,
2 _ (n - 1)S2 _ 24S2 _24 (7.29)
Xcalc 41 41 41 .
22
6. Decisión: Como Xaah = 42.7 e R.C. se rechaza H0: o = 4.1 y se concluye
que la varianza de las compras de gasolina por cliente es mayor de 4.1 galones , con el 5% de significación.
• Como la prueba es unilateral derecha el valor-P se obtiene así:
P = P[ xL-i > Xcalc ] = P[X24 > 42.7] = 1 - P[ X24 < 42.7] = 1- 0.99 = 0.01 Ya que en la tabla
2,de chi-cuadrado, para 24 grados de libertad, el valor
42.7, tiene una probabilidad acumulada cercana a 0.99.
Como el valor-P = 0.01 < a = 0.05 se rechaza H0: o = 4.1. Por lo tanto, se concluye también con el 5% de
significación, que la varianza de las compras de gasolina por cliente es mayor de 4.1 galones .
11. Se compararon dos marcas de llantas de automóvil, 1 y 2, respecto a su duración en Km. Dos muestras
aleatorias de 31 llantas de cada marca, dieron estos resultados:
xi = 46300, ni = 31, Si = 5000 y x 2 = 48100, n2 = 31, S2 = 6100. ¿Son diferentes las duraciones medias de las
llantas de ambas marcas? Use a =
0.01. Determine p-valor.
318
Solución
Sean X1 y X2 la duración (en Km.) de las llantas marca 1 y 2 resPectivamente y Mi, m 2 sus resPectivas medias.
Se desconoce la distribución de Probabilidades de X1 y X2, Pero las muestras son grandes (n1 = n2 = 31 > 30).
Para determinar si son diferentes las duraciones medias de las llantas de ambas marcas, se comParan sus
duraciones medias: m1 í
1. HiPótesis: H0: m1 = M2 contra H1: m1 í M2
2. Nivel de significación: a= 0.01.
3. Estadística de Prueba.- si se suPone verdadera la hiPótesis Ho y Para muestras grandes, la estadística
aProPiada es:
z - X1 - X 2 ^ N(0,1)
¡ai
J— + —
\l n1 n2
4. Región Crítica. Para a= 0.01 y la alternativa bilateral, en la Tabla 1 de la normal estándar, se encuentra el valor
crítico: Z1-a/2 = Z0995 = 2.575
Luego, la región crítica en la variable Z está dada Por:
RC = {Zcalc < -2.575 o Zcalc > 2.575}
5. Cálculos, de los datos se tiene:
n1 = 31, X1 = 46300, S1 = 5000 y n2 = 31, x2 = 48100, S2 =
6100.
^o^ , S2 S72 50002 61002
E.S. = Error estándar = — + — — J ---------------- 1 -------------- = 1416.61
]¡n n2 \¡ 31 31
_ X1 - x 2 _ 46300 - 48100 _
Z 7 — ----------- — -------------------------— —1.2/
caIc ES 1416.61
6. Decisión: ya queZcalc = -1.27 e R.A., no se rechaza Ho y se concluye con el
1% de significación, que la duración media de las llantas marca 1 y 2 es la
misma.
• El valor P Para la Prueba bilateral es:
P = P[|Z| > |-1.27|] = P[|Z| > 1.27] = 2P[Z < -1.27] = 2(0.10204) = 0.2041 RPta.
319
Como P = 2041 > a = 0.01 no se rechaza Ho y se concluye también que la duración media de las llantas de marcas
es la misma, con el 1% de significación.
12. Muestras del pago por hora para los choferes de camiones en las ciudades 1 y 2 proporcionan los siguientes
datos:
X1
n1 = 35, = $ 5.30, S1 = $ 0.16 y n2 = 40, x 2 = $ 5.40, S2 = $
0.15.
Con un nivel de significación del 1 %, probar si el pago medio por hora a los choferes de camión de la ciudad 1 es
menor que el pago medio por hora a los choferes de camión de la ciudad 2. Hallar p-valor.
Solución
Sean X1 y X2 el pago por hora a los choferes de camión en las ciudades 1 y 2 respectivamente y p 1, p2 sus
respectivas medias. Se desconoce las distribución de probabilidades de X1 y X2, pero las muestras son grandes
(n1 y n2 > 30). Para probar si el pago medio por hora a los choferes de camión de la ciudad 1 es menor que el
pago medio por hora a los choferes de la ciudad 2, se compara: p 1 < |^2.
1. Hipótesis: H0: p1 = p2 contra H1: p1 < p2
2. Nivel de significación: a= 0.01.
3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada
es:
4. Región Crítica. Para a= 0.01 y la alternativa unilateral izquierda, en la Tabla 1 de la normal estándar, el valor
crítico es: Za = -Z1-a ^ Z001 = -Z0.99 = -2.33. Luego, la región crítica está dada por: R.C = {Z calc < -2.33}
5. Cálculos, de los datos se tiene:
X1 = $ 5.30, m = 35, S1 = $ 0.16 y x 2 = $ 5.40, n2 = 40, S2 = $
0.15.
X1 - X 2
^ N(0, 1)
320
tt J S2 S2 0.162 0.152
E.S. = Error estandar = — + — —J ---------- 1 ----------- = 0.036
]¡n n v 35 40
_-X-1 ~x2 _ 5.30~5.40 _
Z j — ----------------------------------------------------------- — ------------------- — —2. /8
calc ES 0.036
6. Decisión: ya que Zcaic = -2.78 e R.C., se rechaza Ho y se concluye con el 1% de significación, que el pago
medio por hora a los choferes de camión de la ciudad 1 es menor que el pago medio por hora a los choferes
de la ciudad 2.
• El valor P para la prueba unilateral izquierda es:
P = P[Z < -2.78] = 0.0027 Rpta.
Como P = 0.0027 < a = 0.01 se rechaza Ho y se concluye también que el pago medio por hora a los choferes de
camión de la ciudad 1 es menor que el pago medio por hora a los choferes de la ciudad 2, con el 1% de
significación.
13. En un estudio para determinar el gasto medio semanal en alimentos en los hogares de las ciudades 1 y 2, se
toma una muestra al azar de 200 hogares de la ciudad 1 arrojando un gasto medio de S/. 150 y una desviación
estándar de 35. Una muestra al azar de 180 hogares de la ciudad 2 da una gasto medio de 140 y una
desviación estándar de 30. Probar si es diferente el gasto medio semanal en alimentos en las ciudades 1 y 2.
Use a = 0.05. Hallar p-valor.
Solución
Sean X1 y X2 el gasto semanal en alimentos en los hogares de las ciudades 1 y 2 respectivamente y p 1, p2 sus
respectivas medias. Se desconoce la distribución de probabilidades de X1 y X2, pero las muestras son grandes (n1
y n2 > 30). Para determinar si es diferente el gasto medio semanal en alimentos en ambas ciudades, se comparan
sus gastos medios: p1 ^ p2.
1. Hipótesis: H0: p1 = p2 vs H1: p1 ^ p2
2. Nivel de significación: a= 0.05.
3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada
es:
Z — X ~X2 ^ (0,1)
¡ai
J— + —
\ n1 n2
321
4. Región Crítica. Para a= 0.05 y la alternativa bilateral, en la Tabla 1 de la normal estándar, se encuentra el valor
crítico: Z1-a/2 = Z0.975 = 1.96
Luego, la región crítica en la variable Z está dada por:
RC = {Zcalc < -1.96 o Zcalc > 196}
5. Cálculos, de los datos se tiene:
n1 = 200, X1 = 150, S1 = 35 y n = 180, x 2 = 140, S2 = 30.
tt J S2 S2 352 302 _
E.S. = Error estándar = — + — = J 1 ----------------------- = 3.34
]¡n n2 \¡ 200 180
=x1 -x 2 =150 ~140 = 2.99
calc ES 3.34
6. Decisión: ya que Zcalc = 2.99 e R.C., se rechaza Ho y se concluye con el 5% de significación, que el gasto
medio semanal en alimentos en las ciudades 1 y 2 es diferente.
• El valor P para la prueba bilateral es:
P = P[|Z| > |2.99|] = P[|Z| > 2.99] = 20(-2.99) = 2(0.00139) = 0.00278 Rpta.
Como P = 0.00278 < a = 0.05 se rechaza Ho y se concluye también que el gasto medio semanal en alimentos de
ambas ciudades es diferente, con el 5% de significación.
14. Se compararon los gastos mensuales (S/.) en educación en las ciudades 1 y 2; muestras aleatorias de 200
familias de la ciudad 1 y 150 de la ciudad 2, dieron
estos resultados: n1 = 200, X1 = 160, S1 = 60 y n2 = 150, X2 = 150,
S2 = 50.
Use a = 0.05, para determinar si el gasto medio mensual en educación de la ciudad 1 es mayor que el gasto medio
mensual en educación de la ciudad 2. Hallar el p-valor.
Solución
Sean X1 y X2 el gasto mensual en educación realizado por las familias de las ciudades 1 y 2 respectivamente y p 1,
p2 sus respectivas medias. Se desconoce las distribución de probabilidades de X 1 y X2, pero las muestras son
grandes (n1 y n2 > 30). Para determinar si el gasto medio mensual en educación de la ciudad
322
1 es mayor que el gasto medio mensual en educación de la ciudad 2, se comparan sus gastos medios: p 1 > p2.
1. Hipótesis: H0: p1 = p2 contra H1: p1 > p2
2. Nivel de significación: a= 0.05.
3. Estadística de prueba: si se supone verdadera la hipótesis Ho y para muestras grandes, la estadística apropiada
es:
Z = X1 - X 2 ^ N(0,1)
J2 J22
+
J
\| n1 n2
4. Región Crítica. Para a= 0.05 y la alternativa unilateral derecha, en la Tabla 1 de la normal estándar, se encuentra
el valor crítico: Z1-a = Z0.95 = 1.645.
Luego, la región crítica en la variable Z está dada por: RC = { Z calc > 1.645}
5. Cálculos, de los datos se tiene:
m = 200, X = 160, S1 = 60 y n2 = 150, X2 = 150, S2 = 50.
, J S2 S22 /602 502 coo
E.S. = Error estándar = — + — = J +---------------------- = 5.89
yn n V200 150
x1 - x 2 200 -150
Z , = —----------------------------------------------------------- - = ----------------- = 1.70
calc ES 5.89
^ N(0,1)
RC = {Zcalc < -2.575 o Zcalc > 2.575}
Rpta.
324
Como P = 0.01596 > a = 0.01 se acepta Ho y se concluye también que el costo medio mensual de la enseñanza
en ambas universidades es igual, con el 1% de significación.
16. La producción de 13 obreros de la jornada diurna, dio un promedio de 82 piezas con una desviación estándar
de 10, mientras que para 11 obreros de la jornada nocturna, dio un promedio de 74 con una desviación
estándar de 7. Con el 5% de significación (a = 0.05), probar si:
a) ¿Son heterogéneas las varianzas de ambos turnos? Halle p-valor.
b) ¿Es diferente la producción media de los dos turnos? Halle p-valor.
Solución
Sean X1 y X2 las variables que representan el número de piezas producidas en los turnos diurno (1) y nocturno (2)
respectivamente. Asumiendo que las dos poblaciones se distribuyen normalmente con varianzas desconocidas y
las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son heterogéneas, para según ello
probar si las medias son diferentes.
Datos: n1 = 13, X = 82, S1 = 10 y n2 = 11, X2 = 74, S2 = 7.
a) 1. Hipótesis: H0: j\ = j H1: j\ ± j\
2. Nivel de significación: a = 0.05
3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis nula cierta, para n 1 = 13 y n2 = 11,
la estadística de prueba es:
S2
F=—^f
1 r>2 ^ f 12,10
S2
4. Región crítica. Para a = 0.05 y la prueba bilateral en la Tabla 4, los valores críticos F son: f12, 10, 0.025 = 1/
f10, 12, 0.975 = 1/ 3.37 = 0.297 y f12, 10, 0.975 = 3.62.
R.C. = {F < 0.297 o F > 3.62}
5. Cálculos: con los datos de la muestra se obtiene:
2
4. Región crítica. Para a = 0.05 y la prueba bilateral en la Tabla 4, los valores críticos F son: f15, 15, 0.025 = 1/
f15, 15, 0.975 = 1/ 2.86 = 0.35 y f15, 15, 0.995 = 2.86.
R.C. = {F < 0.35 o F > 2.86}
5. Cálculos: con los datos de la muestra se obtiene:
S2 = 81, S2= 25 y Fcak —
S2 _ 81
Sí ~ 25
= 3.24
6. Decisión. Como Fcalc = 3.24 e R.C. se rechaza Ho y concluimos que las
varianzas de los pesos de las latas con café de ambas máquinas son diferentes (heterogéneas), con el 5% de
significación.
• El valor P para la prueba bilateral y como Fcah = 3.24 > 1 se obtiene así:
P = 2 P[f15,15 > 3.24] = 2 {1 - P[f15,15 < 3.24]} = 2{1 - x} ...................................... (1)
Como en la Tabla 4 de la distribución F, para 15 y 15 grados de libertad, no está el valor 3.24, pero éste se
encuentra entre los valores 2.86 (con probabilidad 0.975) y 3.52 (con probabilidad 0.99) para hallar x se interpola
así:
Ea
2.86 0.975
P
3.24 x ^
3.52 0.99 ^
3.52~2.86 3.24 ~ 2.86
44 =
0.38
x~ 0.975
0.99 ~ 0.975 x~ 0.975 44 x - 42.9 = 0.38 ^ x = 0.984 Reemplazando x = 0.984 en (1) se tiene:
P = 2 {1 - 0.984} = 0.032 Rpta.
Como P = 0.032 < a = 0.05, se rechaza la hipótesis nula y se concluye también que las varianzas de los pesos de
las latas con café de ambas máquinas son diferentes (heterogéneas), con el 5% de significación.
328
b) A continuación se prueba si el peso medio de las latas con café de la máquina 2, es mayor que el peso medio
de las latas con café de la máquina 1.
1. Hipótesis: H0: p1 = p2 y H1: p2 > p1
2. Nivel de significación: a = 0.01
3. La estadística de prueba cuando las varianzas son heterogéneas es:
T=
X 2 - X1
S , S22
^ ¡23
n,
Donde: H =
V n1
+-
S.
2V
n
2 J S222
n
^81 + 25 ^2 16 +
V n1 J + V n2 J
a81 ^2 16
^25 ^2
16 J
= 23.45 = 23
n2 -1
-+-
16 -1 16 -1
4. Región crítica, para a = 0.01 y la prueba unilateral derecha, en la Tabla 3 el valor crítico es: t 23, 0.99 = 2.50.
Entonces: R.C. = {T > 2.50}
5. Con la información muestral: n1 = 16, X1 = 495, S1 = 9, n2 = 16, X2 = 505, S2 = 5; y bajo el supuesto que Ho es
cierta se determina:
X-x
2 1
t =-
calc
i
S2+^2
S2
505 - 495
JO5
V16 16
= 3.89
n1 n2
6. Decisión: como tcalc = 3.89 e R.C. se rechaza Ho y se concluye con el 1% de significación, que el peso medio
de las latas con café de la máquina 2 es mayor que el peso medio de las latas con café de la máquina 1.
• Para la cola del lado derecho:
P = P[T23 > 3.89] = 1 - P[T23 < 3.89] < 0.0005 (en Excel 0.0004) Rpta.
Ya que en la Tabla 3 de la T, para 23 grados de libertad, la probabilidad acumulada hasta 3.89 es mayor a 0.9995
(en Excel es 0.9996).
Como el valor-P < 0.0005 < a = 0.01 se rechaza Ho y se concluye también que el peso medio de las latas con café
de la máquina 2 es mayor que el peso medio de las latas con café de la máquina 1, con el 1% de significación.
329
18. En un colegio de secundaria, el cociente de inteligencia de 15 alumnos del turno diurno, dio un promedio de
112 con una desviación estándar de 6; mientras que para 15 estudiantes del turno nocturno, dio un promedio
de 105 con una desviación estándar de 15. Con el 1% de significación pruebe sí:
a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor.
b) ¿Son diferentes los cocientes medios de inteligencia de los 2 turnos? Halle p-
valor.
Solución
Sean X1 y X2 las variables que representan el cociente de inteligencia de los alumnos del turno diurno (1) y del
turno nocturno (2) respectivamente. Asumiendo que las dos poblaciones se distribuyen normalmente con
varianzas desconocidas y las muestras son pequeñas (n1 y n2 < 30) primero se prueba si las varianzas son
heterogéneas, para según ello probar si son diferentes los cocientes medios de inteligencia de los 2 turnos.
Datos: n = 15, X = 112, S1 = 6 y n2 = 15, X2 = 105, S2 = 15.
a) 1. Hipótesis: H0: a\ = J H1: a\ ^ J
2. Nivel de significación: a = 0.01
3. Estadística de prueba: suponiendo las poblaciones normales y la hipótesis
nula cierta, para n1 = n2 = 15, la estadística de prueba es:
S2
F=—^f
1 r>2 ^ f 14,14
S2
4. Región crítica. Para a = 0.01 y la prueba bilateral en la Tabla 4, los valores críticos F son: f14, 14, 0.005 = 1/
f14, 14, 0.995 = 1/ 4.30 = 0.233 y f14, 14, 0.995 = 4.30.
R.C. = {F < 0.233 o F > 4.30}
5. Cálculos: con los datos de la muestra se obtiene:
S2 36
S2= 36, S2= 225 y Fcalc = ^ = 0.16
6. Decisión. Como Fcah = 0.16 e R.C. se rechaza Ho y concluimos que las
varianzas de los cocientes de inteligencia de los 2 turnos son diferentes (heterogéneas), con el 1% de significación.
330
• El valor P para la prueba bilateral y como Fcalc = 0.16 < 1 se obtiene así:
P = 2 P[f14,14 < 0.16] = 2 P[1/ f14,14 > 1/ 0.16] = 2 P[f14,14 > 6.25] =
= 2 {1 - P[f14,14 < 6.25]} < 0.01 (en Excel 0.0016). Rpta.
Ya que en la Tabla 4 de la F, para 14 y 14 grados de libertad, la probabilidad acumulada hasta 6.25 es mayor a
0.995 (en Excel es 0.9992).
Como P < 0.01 < a = 0.01, se rechaza la hipótesis nula y se concluye también que las varianzas de los cocientes
de inteligencia de ambos turnos son diferentes (heterogéneas), con el 1% de significación.
b) A continuación se prueba si son diferentes los cocientes medios de inteligencia de los 2 turnos.
1. Hipótesis: H0: p1 = p2 y H1: p1 ^ p2
2. Nivel de significación: a = 0.01
3. La estadística de prueba cuando las varianzas son heterogéneas es:
T=
X1 - X 2 \S¿ S[
+
^ tH = ^18
Donde: H =
rSl
n1
+-
S.
22
n
2J
a36 225
1 ---------------
15
S12 2
S22 2
v
"36 ^2
V n1 J + V n2 J
15
-+-
15 J '225'
IT
15 -1 15 -1
= 18.37 = 18
4. Región crítica, para a = 0.01 y la prueba bilateral, en la Tabla 3 el valor crítico es: t 18, 0995 = 2.878. Entonces:
R.C. = {T < -2.878 o T > 2.878}
5. Con la información muestral: n1 = 15, X = 112, S1 = 6, n2 = 15, X2 = 105, S2 = 15; y bajo el supuesto que Ho
es cierta se determina:
X-X
1 2
t =-
calc
i
Si + S2 n1
S22
n
112-105 /36 225
VT5+ IT
= 1.68
6. Decisión: como tcalc = 1.68 e R.A. se acepta Ho y se concluye con el 1% de significación, que los cocientes
medios de inteligencia de los 2 turnos son iguales.
2
331
• Para dos colas: P = 2P[T18 > 1.68] = 2[1 - P(T18 < 1.68)] = 2[1 - x] (1)
En la Tabla 3, T de student, con 18 grados de libertad, no está el valor 1.68, se determina x interpolando así:
la P
1.330 0.90
, _ 1.734-1.330 1.68-1.330 > o no 0.35
1.68 x ^ ^ 8.08 =
0.95 - 0.90 X - 0.90 X - 0.90
1.734 0.95 ^ 8.08x - 7.272 = 0.35 ^ x = 0.943
Reemplazando x = 0.943 en (1) se obtiene:
P-valor = 2[1 - 0.943] = 0.114 Rpta.
Como el valor-P = 0.114 > a = 0.01 no se rechaza Ho y se concluye también que los cocientes medios de
inteligencia de ambos turnos son iguales, con el 1% de significación.
19. Muestras del sueldo de hombres (1) y mujeres (2) de una compañía proporcionan los siguientes datos:
n1 = 20, X = $ 540, S1 = $ 16 y n2 = 20, X2 = $ 530, S2 = $ 15.
a) ¿Son heterogéneas las varianzas de los sueldos de ambos grupos? Use a =
0.01. Halle p-valor.
b) Con un nivel de significación del 5%, probar si el sueldo medio de las mujeres es menor que el de los hombres.
Hallar p-valor.
Solución
Sean X1 y X2 las variables que representan el sueldo de los hombres (1) y de las
mujeres (2) respectivamente. Asumiendo que las dos poblaciones se distribuyen
normalmente con varianzas desconocidas y las muestras son pequeñas (n 1 y n2 < 30) primero se prueba si las
varianzas son heterogéneas, para según ello probar si el sueldo medio de las mujeres es menor que el de los
hombres.
Datos: n1 = 20, X = $ 540, S1 = $ 16 y n2 = 20, X2 = $ 530, S2 = $ 15.
a) 1. Hipótesis: H0: al = a\ H1: a\ í a\
2. Nivel de significación: a = 0.01
332
3. Estadística de Prueba: suPoniendo las Poblaciones normales y la hiPótesis nula cierta, Para n 1 = n2 = 20, la
estadística de Prueba es:
S2
S2
F = 7^ ^ f 19,19
2
4. Región crítica. Para a = 0.01 y la Prueba bilateral en laTabla 4, los valores
críticos F son: f19, 19, 0.005 = 1/ f19, 19, 0.995 = 1/ 3.43 =0.292 yf19, 19, 0.995=
3.43.
R.C. = {F < 0.292 o F > 3.43}
5. Cálculos: con los datos de la muestra se obtiene:
S2 = 256, S22 = 225 y Fcalc = % = 256 = 1.14
1 2 J calc S2 225
'2
6. Decisión. Como Fcalc = 1.14 e R.A. no se rechaza Ho y concluimos que
las varianzas de los sueldos de ambos gruPos son iguales (homogéneas), con el 1% de significación.
• El valor P Para la Prueba bilateral y como Fcah = 1.14 > 1 se obtiene así:
P = 2 P[f19,19 > 1.14] = 2 {1 - P[f19,19 < 1.14]} > 0.10 (en Excel 0.778). RPta.
Ya que en la Tabla 4 de la F, Para 19 y 19 grados de libertad, la Probabilidad acumulada hasta 1.14 es menor a
0.95 (en Excel es 0.611).
Como P > 0.10 > a = 0.01, no se rechaza la hiPótesis nula y se concluye también que las varianzas de los sueldos
de ambos gruPos son iguales (homogéneas), con el 1% de significación.
b) A continuación se Prueba si el sueldo medio de las mujeres es menor que el de los hombres.
1. HiPótesis: H0: mi = M2 y H1: m2 < Mi
2. Nivel de significación: a = 0.05
3. La estadística de Prueba cuando las varianzas son homogéneas es:
X 2 - X1
T = ^ t = t
T ' *20+20-2 *38
J— +
\J n1 n2
n
Donde: H =
V n1
^ S2^2
+-
S.
2Y
n
2J
S22 2
^625 225^2 ~2^ +10)
^625 ^2
V n1 J | V n2 J n -1 n2 -1
a225^2
= 31.11 = 31
20
20
-+-
20 -1 20 -1
4. Región crítica, para a = 0.05 y la prueba bilateral, en la Tabla 3 el valor crítico es: t31, 0.975 = 2.04. Entonces:
R.C. = {T < -2.04 o T > 2.04 }
5. Con la información muestral: n1 = 20, X1 = 402, S1 = 25 y n2 =
20, x2 = 385, S2 = 15; y bajo el supuesto que Ho es cierta se
determina:
tcalc
X - X2
S2 + S2 n1
S22
n
402 - 385 /625 225
i 20 + 20
= 2.61
6. Decisión: como tcalc = 2.61 e R.C. se rechaza Ho y se concluye con el 5% de significación, que los gastos
medios mensuales en seguridad particular de las empresas comerciales de ambas ciudades son diferentes.
Para dos colas: P = 2P[T31 > 2.61] = 2[1 - P(Ts1 < 2.61)] = 2[1 - x] (1)
336
En la Tabla 3, T de student, con 31 grados de libertad, no está el valor 2.61, pero éste se encuentra entre los
valores 2.453 (con probabilidad 0.99) y 2.744 (con probabilidad 0.995) para hallar x se interpola así:
Ta P
2.453 0.990
2.744-2.453 2.610-2.453 0
2.61 x ^ ^ 58.2 =
0.995 - 0.990 x - 0.990
0.157
x - 0.990
2.744 0.995 ^ 58.2 x - 57.618 = 0.157 ^ x = 0.993
Reemplazando x = 0.993 en (1) se obtiene:
P-valor = 2[1 - 0.993] = 0.014 Rpta.
Como el valor-P = 0.014 < a = 0.05 se rechaza Ho y se concluye también que los gastos medios mensuales en
seguridad particular de las empresas comerciales de ambas ciudades son diferentes, con el 1% de significación.
21. Una “Encuesta de Opinión” realizada en 1000 hogares de Lima Metropolitana (con 1’700 000 hogares) indica
que el 30.5 % de los hogares compra periódicos y revistas. Aceptaría Ud. que menos del 34 % de hogares
limeños compra periódicos y revistas? Use a = 0.05. Halle p-valor.
Solución
Denotemos con p la proporción (%) poblacional de hogares que compra periódicos y revistas. Se quiere contrastar
las hipótesis si menos del 34 % (0.34) de hogares limeños compra periódicos y revistas.
1. Hipótesis: H0: p > p0 = 0.34, H1: p < 0.34
2. Nivel de significación: a = 0.05
3. Estadística de prueba: Z = p P0 ^N(0,1)
P0 qp V n
4. Región crítica, para a = 0.05 y la prueba unilateral izquierda, en la Tabla 1 el valor crítico es: Z a = -Z1-a = -Z0.95
= -1.645. Entonces: R.C. = {Z < -1.645}
5. Con la información muestral: n = 1000, p = 0.305 y bajo el supuesto que Ho: p = p0 = 0.34 es cierta, se determina:
337
Z„, = 4-Et = 0Í305=031 = -2.33
p 0q 0 0.34x0.66
n
1000
6. Decisión: como Zcalc = -2.33 e R.C. se rechaza la hipótesis nula y se concluye
con el 5% de significación, que menos del 34 % (p < 0.34) de hogares limeños compra periódicos y revistas (la
estimación muestral indica que es el 30.5%).
• P = P[Z < Zcalc] = P[Z < -2.33] = 0(-2.33) = 0.0099 Rpta.
Como el valor-P = 0.0099 < a = 0.05 se rechaza la hipótesis nula y se concluye también que menos del 34 % de
hogares limeños compra periódicos y revistas, con el 5% de significación.
22. Una “Encuesta de Opinión” realizada en 800 hogares de Lima Metropolitana (con 1.7 millones de hogares)
644 hogares indicaron que tienen abastecimiento de agua de la red pública dentro de la vivienda. ¿Aceptaría
usted que la verdadera proporción de hogares que tienen abastecimiento de agua de la red pública dentro de
la vivienda difiere de 0.75 (75%)? Use a = 0.01. Halle p-valor. Solución
Denotemos con p la proporción (%) poblacional de hogares que tienen abastecimiento de agua de la red pública
dentro de la vivienda. Se quiere contrastar las hipótesis si la proporción de hogares que tienen abastecimiento de
agua de la red pública dentro de la vivienda difiere de 0.75 o 75% (p ^ 0.75).
1. Hipótesis: H0: p = p0 = 0.75, Hj: p ^ 0.75
2. Nivel de significación: a = 0.01
4. Región crítica, para a = 0.01 y la prueba bilateral, en la Tabla 1 el valor crítico es: Z 1-a/2 = Z0.995 = 2.575.
Entonces: R.C. = {Z < -2.575 o Z >
3. Estadística de prueba: Z = ————> N (0,1)
2.575}
5. Con la información muestral: n = 800, X = 644, —
X 644
0.805 y
n 800
bajo el supuesto que Ho: p = p0 = 0.75 es cierta, se determina:
338
Z = p-p± = 0.805 - 0.75 = 3.59
¡p0q0 0.75x0.25
V-n v 800
6. Decisión: como Zcalc = 3.59 e R.C. se rechaza la hipótesis nula y se concluye con el 1% de significación, que
la proporción de hogares que tienen abastecimiento de agua de la red pública dentro de la vivienda difiere de
0.75 o 75% (la estimación muestral señala que es 0.805 o el 80.5%).
• Como la prueba es bilateral, el valor-P se determina así:
P = P[|Z| > |Zcalc|] = P[|Z| > 3.59] = 20(-3.59) = 2(0.00017) = 0.00034 Rpta.
Como el valor-P = 0.00034 < a = 0.01 se rechaza la hipótesis nula y se concluye también que la proporción de
hogares que tienen abastecimiento de agua de la red pública dentro de la vivienda difiere de 0.75 o 75%, con el
1% de significación.
23. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima Metropolitana, 400 indicaron que hay
problemas de seguridad. ¿Indica esta evidencia que más del 75 % de los ciudadanos limeños perciben que
hay problemas de seguridad? Use el nivel de significación de 0.05. Halle p-valor. Explique el error tipo II.
Solución
Denotemos con p la proporción (%) poblacional de ciudadanos de Lima Metropolitana que indican que hay
problemas de seguridad. Se quiere contrastar las hipótesis si más del 75 % (p > 0.75) de los ciudadanos limeños
perciben que hay problemas de seguridad.
1. Hipótesis: H0: p = p0 = 0.75, H1: p > 0.75
2. Nivel de significación: a = 0.05
P-p
0
3. Estadística de prueba: Z = ^N(0,1)
P0 qp V n
4. Región crítica, para a = 0.05 y la prueba unilateral derecha, en la Tabla 1 el valor crítico es: Z 1-a = Z0.95 = 1.645.
Entonces: R.C. = {Z > 1.645}
339
5. Con la información muestral: n = 500, X = 400, p = — =------------------------------------- = 0.80 y bajo
n 800
el suPuesto que Ho: P = p0 = 0.75 es cierta, se determina:
p - p0 _ 0 80 - 0 75 oco
7 _ =
calc \pq /0.75x0.25 .
]¡~ñ~ \ 500
6. Decisión: como Zcalc = 2.58 e R.C. se rechaza la hiPótesis nula y se concluye con el 5% de significación, que
más del 75 % (p > 0.75) de los ciudadanos limeños perciben que hay problemas de seguridad (la estimación
muestral señala que es 0.80 o el 80%).
• Como la Prueba es unilateral derecha, el valor-P se determina así:
P = P[Z > Zcalc] = P[Z > 2.58] = 1 - 0(2.58) = 1 - 0.99506 = 0.00494 Rpta.
Como el valor-P = 0.00494 < a = 0.05 se rechaza la hipótesis nula y se
concluye también que más del 75 % (p > 0.75) de los ciudadanoslimeños
perciben que hay problemas de seguridad, con el 1% de significación.
• Error tipo II.- consiste en aceptar Ho (que el 75% de los ciudadanos limeños Percibe que hay Problemas de
seguridad) cuando es falsa (este Porcentaje realmente es de más del 75%).
24. Se tomó una muestra aleatoria de 300 compradores en un centro comercial y se encontró que 182 están a
favor de un horario más amplio para las compras. ¿Esta evidencia es suficiente para concluir que menos del
65 % de los compradores están a favor de un horario más extenso? Use un nivel de significación de 0.05.
Halle p-valor.
Solución
Denotemos con P la ProPorción (%) Poblacional de comPradores en el centro comercial que resPonden que están
a favor de un horario más amPlio Para las compras. Se quiere probar las hipótesis si menos del 65 % (p < 0.65)
de los compradores están a favor de un horario más extenso en el centro comercial.
1. Hipótesis: H0: p = p0 = 0.65, H1: p < 0.65
2. Nivel de significación: a = 0.05
340
f—f
3. Estadística de prueba: Z — 0
^N(0,1)
fo qo
Vn
4. Región crítica, para a = 0.05 y la prueba unilateral izquierda, en la Tabla 1 el valor crítico es: Z a = -Zi-a = -Z0.95 =
-1.645. Entonces: R.C. = {Z < -1.645}
X 182
5. Con la información muestral: n = 300, X = 182, f — — — ---------------------------------------- = 0.607 y
n 300
bajo el supuesto que Ho: p = p0 = 0.65 es cierta, se determina:
7 _p — po _ 0 607 — 0 65 = _i
calc— ¡Potfo _ |0.65xo.35 '
v 300
6. Decisión: como Zcalc = -1.56 e R.A. no se rechaza la hipótesis nula y se concluye con el 5% de significación,
que el 65 % (p = 0.65) de los compradores están a favor de un horario más extenso en el centro comercial.
• Como la prueba es unilateral izquierda, el valor-P se determina así:
P = P[Z < Zcalc] = P[Z < -1.56] = 0(-1.56) = 0.05938 Rpta.
Como el valor-P = 0.05938 > a = 0.05 no se rechaza la hipótesis nula y se concluye también que el 65 % (p = 0.65)
de los compradores están a favor de un horario más extenso en el centro comercial, con el 5% de significación.
25. De una muestra aleatoria de 500 ciudadanos entrevistados en Lima Metropolitana, 375 indicaron que no están
de acuerdo con el servicio militar obligatorio.
¿Indica esta evidencia que menos del 80 % de los ciudadanos no están de acuerdo con el servicio militar
obligatorio? Use el nivel de significación de 0.01. Halle p-valor.
Solución
Denotemos con p la proporción (%) poblacional de ciudadanos entrevistados que responden que indican que no
están de acuerdo con el servicio militar obligatorio. Se quiere probar las hipótesis si menos del 80% (p < 0.80) de
los ciudadanos no están de acuerdo con el servicio militar obligatorio.
1. Hipótesis: H0: p = p0 = 0.80, H1: p < 0.80
2. Nivel de significación: a = 0.01
341
3. Estadística de prueba: Z — P P0 ^N(0,1)
ÍM0
4. Región crítica, para a = 0.01 y la prueba unilateral izquierda, en la Tabla 1 el valor crítico es: Z a = -Z1-a = -Z0.99
= -2.33. Entonces: R.C. = {Z < -2.33}
X 375
5. Con la información muestral: n = 500, X = 375, p — — — ---------------------------------- = 0.75 y bajo
6. Decisión: como Zcalc = -2.80 e R.C. se rechaza la hipótesis nula y se concluye con el 1% de significación, que
menos del 80% (p < 0.80) de los ciudadanos no están de acuerdo con el servicio militar obligatorio.
• Como la prueba es unilateral izquierda, el valor-P se determina así:
P = P[Z < Zcalc] = P[Z < -2.80] = 0(-2.80 ) = 0.00256 Rpta.
Como el valor-P = 0.00256 < a = 0.01 se rechaza la hipótesis nula y se concluye también que menos del 80% (p
< 0.80) de los ciudadanos no están de acuerdo con el servicio militar obligatorio, con el 1% de significación.
26. A fin de determinar el nivel de aceptación de una revista de negocios, se entrevistaron dos grupos de
empresarios: de Lima Metropolitana (1) y del Resto del País (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280; Resto del País (2): n2 = 1200, X2 =
Con a = 0.05 ¿Son diferentes las verdaderas proporciones de empresarios “limeños” y “no limeños” que aceptan
la revista de negocios? Determine p- valor.
Sean p1 y p2, las proporciones poblacionales de empresarios de Lima Metropolitana (1) y del Resto del País (2)
que aceptan la revista de negocios. Entonces, se desea probar si son diferentes las verdaderas proporciones de
empresarios “limeños” y “no limeños” que aceptan la revista de negocios.
n 500
el supuesto que Ho: p = p0 = 0.80 es cierta, se determina:
Zcalc — ^ — ^-0^ = -2.80
300.
Solución
342
1. Hipótesis: Ho: p1 = p2 y H1: p1 ± p2
2. Nivel de significación: a = 0.05
3. Estadística de prueba: Z = P1 . P2 (p P2) ^ N(0, 1)
p1 qr p2 q2
+
\¡ n1 n2
4. Región crítica, para a = 0.05 y la prueba bilateral, en la Tabla 1 el valor crítico es: Z 1-a/2 = Z0.975 = 1.96. Entonces:
R.C. = {Z < -1.96 o Z > 1.96}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n1 = 800,
X, 280 X9 300
X1 = 280, p, =—^ = ------------------------- = 0.35, n2 = 1200, X2 = 300, p7 = = --------
1 n 800 2 n 1200
X1 + X2 _ 280 + 300 _ 580
= 0.25, P = — ----------------- = ------------------- = ---------- = 0.29 y á = 0.71; se determina:
n + n 800 +1200 2000
Zcalc = . A ^ _ = , 0 3^- 0 25 _ = 4.83
pq
1 1
—+—
n1 n2
0.29 x0.71
11
-+■
800 1200
6. Decisión: como Zcalc = 4.83 e R.C. se rechaza la hipótesis nula con el 5% de significación. Se concluye que
son diferentes las verdaderas proporciones de empresarios “limeños” y “no limeños” que aceptan la
revista de negocios.
• P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -4.83] =
=2 0(-4.83) < 0.0001 (en Excel 0.0000014). Rpta.
Ya que en la Tabla 1 de la distribución normal estándar, la probabilidad
acumulada hasta -4.83 es menor a 0.0001 (en Excel es 0.00000068).
Como P < 0.0001 < a = 0.01, se rechaza la hipótesis nula y se concluye también que son diferentes las verdaderas
proporciones de empresarios “limeños” y “no limeños” que aceptan la revista de negocios, con el 5% de
significación.
27. En una muestra aleatoria de 400 adultos, 220 están de acuerdo con la gestión presidencial. Mientras que en
una muestra de 600 jóvenes, 300 están de acuerdo con la gestión presidencial. ¿Se puede afirmar que la
verdadera proporción de adultos que está de acuerdo con la gestión presidencial, es mayor que la proporción
de jóvenes que está de acuerdo con dicha gestión? Use a = 0.05. Halle p-valor.
Solución
343
Sean p1 y p2, las proporciones poblacionales de adultos (1) y de jóvenes (2) que están de acuerdo con la gestión
presidencial. Entonces, se desea probar si la verdadera proporción de adultos que está de acuerdo con la gestión
presidencial, es mayor que la proporción de jóvenes que está de acuerdo con dicha gestión.
1. Hipótesis: Ho: p1 = p2 y H1: p1 > p2
2. Nivel de significación: a = 0.05
3. Estadística de prueba: Z = — 1 . — 2 (—1 —2) ^ N(0, 1)
pA P^
+
Í n1 n2
4. Región crítica, para a = 0.05 y la prueba unilateral derecha, en la Tabla 1 el valor crítico es: Z 1-a = Z0.95 = 1.645.
Entonces: R.C. = {Z > 1.645}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n 1 = 400,
X 220 X9 300
X1 = 220, p, =—^ = ------------------------- = 0.55, n2 = 600, X2 = 300, p7 = = --------- =
1 n 400 2 n 600
* X1 + X2 220 + 300 520
0.50, p = —1 -------------------- 2 = ------------------ = --------- = 0.52 y q = 0.48; se determina:
n + n2 400 + 600 1000
Zcalc = . P~-^ , = . 0"5 -050 , = 1.55
pq
1 1
—+—
n1 n2
0.52 x0.48
11
+ --------------
400 600
6. Decisión: como Zcalc = 1.55 e R.A. no se rechaza la hipótesis nula con el 5% de significación. Se concluye que
son iguales las verdaderas proporciones de adultos y de jóvenes que están de acuerdo con la gestión
presidencial.
Para la prueba es unilateral derecha:
P = P[Z > Zcalc] = P[Z > 1.55] = 1 - 0(1.55) = 1 - 0.93943 = 0.06057 Rpta. Como P = 0.06057 > a = 0.05, se “acepta”
la hipótesis nula y se concluye también que son iguales las verdaderas proporciones de adultos y de jóvenes que
están de acuerdo con la gestión presidencial, con el 5% de significación.
28. De los alumnos de la UNAC se toma una muestra aleatoria de 300 mujeres, 150 de las cuales están a favor
de la titulación con tesis. En una muestra de 200 hombres, 120 indican que están a favor de lo mismo. ¿Se
puede afirmar que hay una diferencia significativa entre las verdaderas proporciones de alumnos y alumnas
que están a favor de la titulación con tesis? Use a = 0.01. Halle p-valor
344
Solución
Sean p1 y p2, las proporciones poblacionales de estudiantes hombres (1) y mujeres (2) que están a favor de la
titulación con tesis. Entonces, se desea probar si son diferentes las verdaderas proporciones de alumnos y
alumnas que están a favor de la titulación con tesis.
1. Hipótesis: Ho: p1 = p2 y H1: p1 ^ p2
2. Nivel de significación: a = 0.01
3. Estadística de prueba: Z = P1 . P2 (P1 P2) ^ N(0, 1)
pa +
\| n1 n2
4. Región crítica, para a = 0.01 y la prueba bilateral, en la Tabla 1 el valor crítico es: Z 1.a/2 = Z0.995 = 2.575.
Entonces: R.C. = {Z < -2.575 o Z > 2.575}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n 1 = 200, X1 = 120, p, = =120 = 0.60, n2 =
300, X2 = 150, p2 = = 150 =
1 n 200 2 n 300
0.50,
X+ 120 +150 270
p = — ---------------- = ---------------- = -------- = 0.54 y á = 0.46; se determina:
n+n 200+300 500
060 - 0 50
z^ = _&^ = . , = 2.20
Pá
11
—+—
n1 n2
0.54 x0.46
11
1 ---------------
200 300
6. Decisión: como Zcalc = 2.20 e R.A. no se rechaza la hipótesis nula con el 1% de significación. Se concluye que
son iguales las verdaderas proporciones de alumnos y alumnas que están a favor de la titulación con tesis.
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.20] =
= 2 0(-2.20) = 2 (0.0139) = 0.0278 Rpta.
Como P = 0.0278 > a = 0.01, se “acepta” la hipótesis nula y se concluye también que son iguales las verdaderas
proporciones de alumnos y alumnas que están a favor de la titulación con tesis, con el 1% de significación.
29. Una empresa desea determinar la proporción de hogares que adquiere su
producto en las ciudades 1 y 2. Una muestra al azar de 600 hogares en cada
345
ciudad arroja que 288 lo adquiere en la ciudad 1 y 252 en la ciudad 2. ¿Será la ProPorción de hogares que adquiere
el Producto en la ciudad 2 menor que la proporción de hogares que adquiere el producto en la ciudad 1? Use a =
0.01. Halle P-valor.
Solución
Sean p1 y p2, las proporciones poblacionales de hogares que adquiere el producto en las ciudades 1 y 2
resPectivamente. Entonces, se desea Probar si la verdadera proporción de hogares que adquiere el producto en
la ciudad 2 menor que la proporción de hogares que adquiere el producto en la ciudad 1.
1. Hipótesis: Ho: p1 = p2 y H1: p2 < p1
2. Nivel de significación: a = 0.01
3. Estadística de prueba: Z = p2 . p 1 (p2 p1) ^ N(0, 1)
Afr , Mu
V n1 n2
4. Región crítica, para a = 0.01 y la prueba unilateral, en la Tabla 1 el valor crítico es: Z a = -Z1-a = -Z099 = -2.33.
Entonces: R.C. = {Z < -2.33}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n 1 = 600,
*1- 288-.,o 252 _
X1 = 288, pl == ----------------------------- = 0.48, n2 = 600, X2 = 252, p2
n 600 n2 600
X + X7 288 + 252 540 _
0.42, p = — = = = 0.45 y Q = 0.55; se determina:
n + n2 600 + 600 1200
Z = . p2 -p1 _ = . 0 42 - 048 _ = -2.09
J calc
1 1
—+—
n n2
0.45 x0.55
11
-------- 1 -----
600 600
6. Decisión: como Zcalc = -2.09 e R.A. no se rechaza la hipótesis nula con el 1% de significación; y se concluye
que las verdaderas proporciones poblacionales de hogares que adquiere el producto en las ciudades 1 y 2
son iguales.
Para la prueba es unilateral izquierda:
P = P[Z < Zcalc] = P[Z < -2.09] = 0(-2.09) = 0.01831 Rpta.
Como P = 0.01831 > a = 0.01, se “acepta” la hipótesis nula y se concluye también que las proporciones
poblacionales de hogares que adquiere el producto en las ciudades 1 y 2 son iguales, con el 5% de significación.
346
30. Se entrevistaron dos grupos de mujeres respecto a su interés por los polos de verano “Sol y mar”. De una
muestra de 250 mujeres menores de 40 años, 150 estuvieron interesados, mientras que de 250 mujeres de
40 años a más, sólo 120 mostraron interés. Con el 5% de significación, ¿existe diferencia entre la proporción
de mujeres menores de 40 años y las de 40 años a más que mostraron interés por los polos de verano “Sol y
mar”? Halle p-valor.
Solución
Sean p1 y p2, las proporciones poblacionales de mujeres menores de 40 años (1) y las mujeres de 40 años a más
(2) que muestran interés por los polos de verano “Sol y mar”. Entonces, se desea probar si son diferentes ambas
proporciones .
1. Hipótesis: Ho: p1 = p2 y H1: p1 ^ P2
2. Nivel de significación: a = 0.05
3. Estadística de prueba: Z = P1 . P2 (P1 P2) ^ N(0, 1)
m , P2 q2
\¡ n1 n2
4. Región crítica, para a = 0.05 y la prueba bilateral, en la Tabla 1 el valor crítico es: Z1-a/2 = Z0.975 = 1.96. Entonces:
R.C. = {Z < -1.96 o Z > 1.96}
5. Bajo el supuesto que Ho es cierta y con la información muestral: n 1 = 250,
X1 = 150, pj = = 150 = 0.60, n2 = 250, X2 = 120, p2 = = 120 =
n 250 n2 250
n ,0 „ X1 + X2 150 +120 270 A n
0.48, p = —1 ------------------ 2 = -------------------- = -------- = 0.54 y q = 0.46; se determina:
n + n2 250 + 250 500
060
Z. = -Jpí-p^ = . -048 - = 2.69
pq
1 1
—+—
n1 n2
0.54 x0.46
11
-+■
250 250
6. Decisión: como Zcalc = 2.69 e R.C. se rechaza la hipótesis nula con el 5% de significación; y se concluye que
son diferentes las verdaderas proporciones de mujeres menores de 40 años y las de 40 años a más que
mostraron interés por los polos de verano “Sol y mar”.
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -2.69] = 2 0(-2.69) = 2 (0.00357) = 0.00714. Como P = 0.00714 <
a = 0.05, se rechaza la hipótesis nula y se concluye también que son diferentes las verdaderas proporciones .
347
6.10 PROBLEMAS PROPUESTOS
1. Un proceso está programado para embotellar la cantidad media de 750 mililitros de gaseosa. Se toma una
muestra aleatoria de 41 botellas, resultando una media de 745 ml. y una desviación típica de 12 ml.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en las botellas de gaseosa? Halle p-valor.
22
2. ¿Aceptaría usted que o < 200 ml por botella? Use a = 0.05. Halle p-valor. Un proceso está programado para
embolsar la cantidad media de 250 gramos
de café. Se toma una muestra aleatoria de 36 bolsas, resultando una media de
253.5 gramos y una desviación típica de 13 gramos.
a) ¿Se puede afirmar que el contenido medio en las bolsas de café es mayor de
250 gramos? Use a = 0.05. Halle p-valor.
2 2
b) ¿Aceptaría usted que o ^ 250 gr por bolsa? Use a = 0.05. Halle p-valor.
3. Un proceso está programado para embolsar la cantidad media de 500 gramos de
frejol. Se toma una muestra aleatoria de 35 bolsas, resultando una media de
496.5 gramos y una desviación típica de 15 gramos.
a) Al 5% de significación ¿se puede afirmar que el contenido medio en las
bolsas de frejol es menor de 500 gramos? Halle p-valor.
2 2
b) ¿Aceptaría usted que o > 300 gr por bolsa? Use a = 0.05. Halle p-valor.
4. Se tiene la siguiente prueba de hipótesis: Ho: p > 100 y H1: p < 100.
Una muestra de 50 elementos produce una media muestral de 95.5 y una desviación estándar muestral de 12.
a) Realice la prueba de hipótesis usando a = 0.05. Halle p-valor.
22
b) Ponga a prueba H0: o = 120 contra H1: o ^ 120, use a = 0.05. Halle p-valor.
5. Un proceso está programado para embolsar la cantidad media de 1000 gramos de lenteja. Se toma una muestra
aleatoria de 36 bolsas, resultando una media de
996.5 gramos y una desviación típica de 10 gramos.
a) Al 5% de significación ¿se puede afirmar que no se está cumpliendo con el
contenido medio en la bolsa? Halle p-valor.
2 2
b) ¿Aceptaría usted que o ^ 250 gr por bolsa? Use a = 0.05. Halle p-valor.
348
6. Los pesos de diez estudiantes (en Kg.) fueron: 60, 44, 66, 71, 75, 75, 80, 84, 93 y 82. Suponga que estos pesos
proceden de una población normal.
a) Ponga a prueba H0: p = 70 Kg. contra H1: p ^ 70, con un a = 0.05. Halle p- valor.
b) Ponga a prueba H0: o2 = 80 Kg2 contra H1: o2 > 80, use a = 0.05. Halle p- valor.
7. Los pesos netos (grs.) de las bolsas de detergente es de 250. Una muestra aleatoria de 10 bolsas dio estos
pesos: 248, 251, 248, 247, 245, 246, 246, 252, 247, 250.
a) Será la media poblacional de los pesos netos menor a 250gr. Use a = 0.01. Halle p-valor.
22
b) Ponga a prueba H0: o = 15 contra H1: o ^ 15, con un a = 0.05. Halle p-valor.
8. Las latas de duraznos de la Compañía “La dulzura” deben contener un peso neto de 16 onzas, pero hay una
gran variabilidad. Una muestra aleatoria de seis latas revela los pesos netos siguientes en onzas: 15.1, 16.1,
15.8, 15.4, 16.1 y 15.1.
a) Use a = 0.01 para determinar si el verdadero peso neto de las latas de
duraznos es menor de 16 onzas. Determine p-valor.
22
b) ¿Aceptaría usted que o < 1.25 gr por bolsa? Use a = 0.05. Halle p-valor.
9. Se prueba una muestra aleatoria de 9 bolsas de cierta marca para determinar el peso medio de llenado. Los
pesos de las bolsas, en onzas, fueron: 18, 22, 25, 20, 19, 26, 21, 24 y 23.
a) ¿Hay razón para creer que el verdadero peso medio de llenado es mayor de 18
onzas? Use a = 0.01. Halle p-valor.
22
b) ¿Será rechazada la hipótesis o > 3.5 onzas ? Use a = 0.05. Halle p-valor.
10. Los pesos en kilos de una muestra aleatoria de 8 cajas de galleta son: 14.6, 12.5, 15.3, 16.1, 14.4, 12.9, 13.7
y 14.9. Suponiendo que los pesos se distribuyen normalmente.
a) Con una significación del 5 % pruebe si el peso medio de las cajas de galleta
es distinto de 14 Kg. Halle p-valor.
22
b) Ponga a prueba H0: o = 5 contra H1: o ^ 5, con un nivel de significación de
0.05. Halle p-valor.
349
11. Un departamento de producción desea determinar si hay diferencia en el rendimiento entre el turno diurno y
el nocturno. Una muestra aleatoria de 80 obreros del turno diurno alcanza una producción media de 94.3
partes por hora, con una desviación estándar de 14 partes por hora, mientras que otra muestra de 60 obreros
de la noche alcanza un promedio de 89.7 partes por hora, con una desviación estándar de 17. Se pide probar
si es diferente el rendimiento medio de ambos turnos. Use a = 0.05. Hallar p-valor.
12. En un estudio para determinar el costo medio de los televisores en las ciudades A y B, se toma una muestra
al azar de 200 hogares de A arrojando un costo medio de $ 250 y una desviación estándar de 15. Una muestra
al azar de 180 hogares de la ciudad B da una costo medio de $ 235 y una desviación estándar de 10.
Con a = 0.01, probar si el costo medio de los televisores en las ciudades A es mayor que el costo medio de los
televisores en la ciudad B. Hallar p-valor.
13. El departamento de marketing desea determinar si hay diferencia entre las ventas mensuales promedio
realizadas por hombres y mujeres. Una muestra aleatoria de 80 mujeres arroja una venta media de 95
artefactos mensuales, con una desviación estándar de 14 artefactos, mientras que otra muestra de 60
hombres alcanza un promedio de 89 artefactos mensuales, con una desviación estándar de
17.
Con a = 0.05, ¿son diferentes las ventas medias realizadas por hombres y mujeres (p m ^ Hh)? Determine el p-
valor.
14. En un estudio para determinar el gasto medio mensual de los hogares en frutas para las ciudades A y B, se
toma una muestra al azar de 100 hogares de A arrojando un gasto medio de S/. 82 y una desviación estándar
de 15. Una muestra al azar de 100 hogares de la ciudad B da una gasto medio de 75 y una desviación
estándar de 10.
Use a = 0.01, para probar si el gasto medio mensual en frutas en la ciudad B es menor que el gasto medio en A.
Halle p-valor.
15. Se comparan dos marcas de cigarrillos, 1 y 2, respecto a su contenido de nicotina en miligramos; dos muestras
aleatorias de 40 cigarrillos de la marca 1 y 50 de la
350
marca 2, dieron estos resultados: X1 = 14.3, n1 = 40, S1 = 2.9 y x 2 =
15.7, n2 = 50, S2 = 3.8. ¿Es diferente el contenido medio de nicotina de las dos marcas? Use a = 0.01.
Halle p-valor.
16. Dos máquinas embotellan jugo independientemente. Mediante muestra aleatoria sin reemplazo de botellas
tomadas de cada máquina se han obtenido los siguientes resultados sobre el contenido de las botellas (en
ml.):
n1 = 16, X1 = 495, S1 = 5 y n2 = 16, X2 = 505, S2 = 7.
a) ¿Son diferentes las varianzas de los contenidos de las botellas con jugo de ambas máquinas? Use a = 0.05.
Halle p-valor.
b) ¿Son diferentes los contenidos medios de las botellas con gaseosa de ambas máquinas? Use a = 0.01 y
determine p-valor.
17. Se ha llevado a cabo un estudio para analizar los gastos mensuales en publicidad (en dólares) realizado por
las empresas comerciales de dos ciudades. Mediante muestras aleatorias sin reemplazo tomadas
independientemente en cada ciudad se han obtenido los siguientes resultados:
n1 = 20, X1 = $ 950, S1 = 95 y n2 = 18, X2 = $ 850, S2 = 60.
a) ¿Son heterogéneas las varianzas de los gastos mensuales en publicidad de ambas ciudades? Use a = 0.01.
Halle p-valor.
b) Con un nivel de significación del 5 %, probar si los gastos mensuales en publicidad de las empresas de la ciudad
1 es mayor que el de las empresas de la ciudad 2. Hallar p-valor.
18. Dos grupos (de 16 alumnas cada uno) escogidos al azar de una escuela para secretarias, aprenden taquigrafía
por dos métodos diferentes y luego se les somete a pruebas de dictado. Se encuentra que el grupo 1 obtiene
en promedio 123 palabras por minuto con una desviación estándar de 15 palabras, mientras que el grupo 2
promedia 110 palabras por minuto con una desviación estándar de 10 palabras. Con el 1% de significación
probar si:
a) ¿Son heterogéneas las varianzas de ambos grupos? Halle p-valor.
b) ¿Es diferente el promedio de palabras por minuto para los dos métodos? Halle p-valor.
351
19. Se ha llevado a cabo un estudio para analizar los gastos mensuales (S/.) en alquiler de local realizado por las
empresas comerciales de dos ciudades grandes. Mediante muestras aleatorias sin reemplazo tomadas
independientemente en cada ciudad se han obtenido los siguientes resultados:
ni = 20, xi = 938, Si = 96 y n2 = 20, x 2 = 856, S2 = 62.
a) ¿Son diferentes las varianzas de los gastos mensuales en alquiler de ambas ciudades? Use a = 0.05. Halle p-
valor.
b) Con un nivel de significación del 5 %, probar si los gastos mensuales en alquiler de las empresas de la ciudad
1 es menor que el de las empresas de la ciudad 2. Hallar p-valor.
20. Dos máquinas embolsan diariamente detergente de manera independiente. Mediante muestras aleatorias sin
reemplazo de 12 bolsas de cada máquina se han obtenido los siguientes resultados sobre el peso de las
bolsas (en gramos):
ni = 12, xi = 505, Si = 10 y n2 = 12, x 2 = 495, S2 = 4.
Con el 1% de significación probar si:
a) ¿Son diferentes las varianzas de los pesos de las bolsas con detergente de
ambas máquinas? Halle p-valor.
b) ¿Son diferentes los pesos medios de las bolsas con detergente de ambas
máquinas? Halle p-valor.
21. De una población de 100,000 fumadores de cigarro, se selecciona una muestra aleatoria de 800 fumadores y
se encuentra que 240 tienen preferencia por la marca A. ¿Esta evidencia es suficiente para concluir que más
del 25 % de los fumadores de cigarro prefieren la marca A? Use un nivel de significación del 1%. Halle p-
valor.
22. En una muestra aleatoria de 500 de los 100 000 ciudadanos de un distrito se encontró que 200 están de
acuerdo con la gestión del alcalde. Indica esta evidencia que menos del 45% de los ciudadanos están de
acuerdo con la gestión del alcalde. Use un nivel de significación del 5%. Halle p-valor.
23. De una muestra aleatoria de 500 hombres entrevistados, 125 indicaron que ven fútbol los lunes en la noche
por televisión. ¿Indica esta evidencia que más del 20 % de los televidentes hombres ven el fútbol los lunes
por la noche? Use el nivel de significación de 0.01. Halle p-valor.
352
24. En una muestra aleatoria de 600 de los 20000 hogares de un distrito se encontró que 240 consumen leche.
Indica esta evidencia que menos del 45% de los hogares consumen leche. Use un nivel de significación del
5%. Halle p-valor. Explique el error tipo I.
25. De una muestra aleatoria de 800 ciudadanos entrevistados en Lima Metropolitana, 200 indicaron que no están
de acuerdo con el voto electrónico. ¿Indica esta evidencia que más del 20 % de los ciudadanos no están de
acuerdo con el voto electrónico? Use el nivel de significación de 0.01. Halle p-valor.
26. Se entrevistaron a hombres y mujeres respecto a su interés por una nueva marca de perfume. En una muestra
aleatoria de 400 hombres y 600 mujeres, 220 hombres y 300 mujeres dijeron que les gustaba el nuevo
perfume. Con el 1% de significación, ¿existe diferencia entre las verdaderas proporciones de hombres y
mujeres que dijeron que les gustaba el nuevo perfume? Halle p-valor.
27. De los alumnos de la UNAC se toma una muestra aleatoria de 600 hombres, 300 de las cuales están a favor
del cambio curricular. En una muestra de 400 mujeres, 240 indican que están a favor de lo mismo. ¿Se puede
afirmar que es menor la proporción de hombres que están a favor del cambio curricular, que la proporción de
mujeres a favor del cambio curricular? Use a = 0.01. Halle p- valor.
28. A fin de determinar el nivel de aceptación de la gestión presidencial, se entrevistaron dos grupos de
ciudadanos: de Lima Metropolitana (1) y del Resto del País (2), se obtuvieron los siguientes resultados:
Lima M. (1): n1 = 800, X1 = 280; Resto del País (2): n2 = 1200, X2 =
300
Con a = 0.05 ¿Existe diferencia entre las verdaderas proporciones de “limeños” y “no limeños” que están de
acuerdo con la gestión presidencial? Determine p- valor.
29. Se entrevistaron dos grupos de mujeres respecto a su interés por la compra de casacas de cuero. De una
muestra de 300 mujeres de 40 años a más, 75 estuvieron interesadas, mientras que de 200 mujeres menores
40 años, 80 mostraron interés. Con el 5% de significación, ¿será mayor la proporción de
353
mujeres menores de 40 años interesadas en la compra de casacas de cuero, que la proporción de las de 40 años
a más interesadas en dicha compra. Halle p-valor.
30. En una muestra aleatoria de 400 jóvenes, 220 están de acuerdo con la suscripción de los Tratados de Libre
Comercio (TLC’s). Mientras que en una muestra de 600 adultos, 300 están de acuerdo con la suscripción de
TLC’s.
a) ¿Está Ud. de acuerdo que más del 50% de jóvenes está de acuerdo con la suscripción de TLC’s? Use a = 0.01.
Halle p-valor.
b) ¿Se puede afirmar que hay una diferencia significativa entre las verdaderas proporciones de jóvenes y adultos
que están de acuerdo con la suscripción de TLC’s? Use a = 0.05. Halle p-valor.
354
Capítulo 7. PRUEBAS DE HIPÓTESIS NO PARAMÉTRICAS
“Ser culto, es el único modo de ser libre” José Martí
CONTENIDO
frecuencias observadas, suponiendo que Ho es cierta, es decir que A y B son independientes. Las frecuencias
esperadas se muestran en la tabla de contingencia pxq siguiente:
Esp. B1 Bj Bc z
eu eic
Ai ei1 Oi.
efi efc
Af ef1 Of.
2
-a,(f -1)(c-1)
357
2
La región de aceptación es: R.A. = {X < X\-a(/-1)(c-1) }
f c (O -e)2
5. Hallar Xlalc = con las tablas anteriores.
<=1 j=1 ej
6. Decisión: se rechaza H0 con riesgo igual a a, si Xlalc G R C (o si X2Caic £ R.A.). No se rechaza H0 en caso contrario.
Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es a.
Ejemplo 1
En un estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC, el año 2012, se
usa el índice de masa corporal (peso/talla ) para determinar la condición del peso del alumno (delgado, normal o
con sobrepeso) y ver si existe alguna relación de dependencia con el sexo (hombre o mujer) del estudiante.
Los resultados observados obtenidos con el SPSS v21, se muestran en la siguiente tabla:
Tabla de contingencia CONDICIÓN DEL PESO * SEXO Valores Observados
SEXO
Total
CONDICIÓN DEL PESO Hombre Mujer
Delgado 0 7 7
Normal 33 66 99
Sobrepeso 5 9 14
Total 38 82 120
Con el 5% de significación probar si hay una relación de dependencia entre la condición del peso del alumno y su
sexo (género).
Solución
1. H0: La condición del peso de los estudiantes es independiente del género de este. (NO existe relación entre
la condición del peso y el género del estudiante).
H1: La condición del peso de los estudiantes depende del género de este (Existe relación entre la condición del
peso y el genero del estudiante).
358
2. Nivel de significación: a = 0.05
3. Estadística de prueba: x2 = LL
i=1 j=1
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
XLÁ/-1)(C-1) = X 295,2 = 5.99. Entonces, R.C. = {X2 > 5.99}
SEXO
CONDICIÓN DEL Total
PESO Hombre Mujer
Delgado 2.2 4.8 7
Normal 31.4 67.6 99
Sobrepeso 4.4 9.6 14
Total 38 82 120
Los valores esperados se obtienen con los totales observados así: Hombre-delgado = 7x38 / 120 = 2.2; Mujer-
delgada = 7x82 / 120 = 4.8 Hombre-normal = 99x38 / 120 = 31.4; Mujer-normal = 99x82 / 120 = 67.6 Hombre-
sobrep = 14x38 / 120 = 4.4; Mujer-sobrep = 14x82 / 120 = 9.6
2
359
i _ff(Ol ~ej )^(0-2.2)2 (7 -4.8)2 (33 -31.4)2
ZI ^ 2.2 4.8 31.4
(66 - 67.6)2 (5 - 4.4)2 (9 - 9.6)2
+ - ------------------------------ —+ - ------------- —+ - -------------— = 3.45
67.6 4.4 9.6
6. Decisión: como xlaic =3.45 eR.A., con el 5% de significación no se rechaza
H0, por lo tanto la condición del peso de los estudiantes es independiente del género de este. (NO existe relación
entre la condición del peso y el género del estudiante).
Estando definidas las variables sexo y condición del peso, los resultados en el programa SPSS se obtienen así:
Analizar ^ Estadísticos descriptivos ^ Tablas de contingencia. En la
ventana de Tablas de contingencia, ingresar en Filas: la variable condición del peso y en Columnas: la variable
sexo.
En Estadísticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los
resultados son la Tabla de contingencia de valores observados y las Pruebas de chi-cuadrado siguientes:
Pruebas de chi-cuadrado
Delgado 0 7 7
Normal 33 66 99
Sobrepeso 5 9 14
Todo 38 82 120
a,k-p-
-a, k-p-1
k (O -e )2
5. Hallar %calc = X—— con la anterior tabla de frecuencias.
e,
7=1
6. Decisión: se rechaza H0 con con el 100 a% de significación, si xlak G RC. No se rechaza H0 en caso contrario.
Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es a.
Ejemplo 2
Con el fin de estudiar si un dado está o no equilibrado, se arroja el dado 300 veces en forma independiente,
obteniéndose los siguientes resultados:
Resultado 1 2 3 4 5 6
Oi 55 42 53 46 47 57
ei 50 50 50 50 50 50
363
2 (O - e, )2 _ (55 - 50)2 (42 - 50)2 (53 - 50)2 (46 - 50)2 +
Xcalc tf e 50 50 50 50
(47 - 50)2 (57 - 50)2 „ ^
+ - --------------------------------------------- —+ - ------------ — = 3.44
50 50
6. Decisión: como xlaic = 3 44 e R.A., con el 5% de significación no se rechaza H0, por lo tanto, se concluye que
el dado está equilibrado.
7.3 TEST DE WILCOXON
Es una prueba de RANGOS CON SIGNOS propuesta por Wilcoxon (1945) y se usa para contrastar una hipótesis
referida al valor de la mediana de la población (Me). Para la verificación de la hipótesis no se hace ningún supuesto
sobre la distribución de la población y las observaciones X i requieren al menos una escala de intervalo ya que la
prueba toma la diferencia entre cada valor muestral y el valor hipotético de la mediana.
Los pasos a seguir en la prueba son:
1. Hipótesis: Ho: Me = Me0
H1: Me ^ Me0 o Me < Me0 o Me > Me0
2. Escoger el nivel de significación: a
3. Estadística de prueba: W = suma de los rangos positivos
4. Región crítica: buscar los valores críticos en la Tabla 5, de Wilcoxon para n < 40 y a = 0.05 o 0.01.
5. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto que Ho es cierta, mediante el
siguiente procedimiento:
a) Hallar las diferencias di = Xi - Me0 con el signo correspondiente. Si alguna diferencia es cero, la observación
asociada se elimina y el tamaño efectivo de la muestra disminuye.
b) Ranquear las diferencias di en forma ascendente, sin tomar en cuenta el signo (en valor absoluto). Si dos o
más diferencias son iguales se asume el rango promedio de esas diferencias empatadas.
c) Asignar los signos de las diferencias di a sus respectivos rangos.
d) Obtener la suma de los rangos para las diferencias positivas y para las negativas por separado. La suma de los
rangos positivos = Wcalc, es el
364
valor calculado del estadístico de prueba y sirve para hallar el valor-P y compararlo con el nivel de significación a.
e) Si el tamaño de muestra es grande el valor-P se obtiene mediante la aproximación a la distribución Normal
con:
6. Decisión: se rechaza H0 con el 100 a% de significación, si W calc eR.C. No se rechaza H0 en caso contrario. Si
se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es a.
Otra forma de establecer la regla de decisión, es calculando el valor P, a partir del valor Z calc, de manera que:
• Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]
• Para cola a la derecha: P = P[Z > Zcalc]
• Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < a, se rechaza H0. En caso contrario, se acepta H0.
Ejemplo 3
Una muestra de los salarios semanales (S/.) de 15 obreros arroja los siguientes resultados: 303, 297, 375, 273,
321, 413, 233, 285, 276, 329, 306, 290, 380, 305 y 250. Probar si la mediana de los salarios es diferente de S/.
300. Use a = 0.05.
Solución
1. Hipótesis: Ho: Me = 300
2. Nivel de significación: a = 0.05
3. Estadística de prueba: W = suma de los rangos positivos
4. Región crítica: para n = 15 y a = 0.05, en la tabla 5, de Wilcoxon la región crítica es: R.C. = {W < 25 o W > 95}
^ R.A. = {25 < W < 95}
5. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto que Ho es cierta, mediante el
siguiente procedimiento:
Hi: Me ^ 300
365
Rangos con signo
Obreros Salarios Diferencias di = Xi Rango de
(Xi) - 300 |di| (+) (-)
1 303 3 1.5 1.5
2 297 -3 1.5 1.5
3 375 75 13 13
4 273 -27 9 9
5 321 21 7 7
6 413 113 15 15
7 233 -67 12 12
8 285 -15 6 6
9 276 -24 8 8
10 329 29 10 10
11 306 6 4 4
12 290 -10 5 5
13 380 80 14 14
14 305 5 3 3
15 250 -50 11 11
Total 67.5 52.5
Wcalc = suma de los rangos positivos = 67.5
6. Decisión: como W calc = 67.5 e R.A., con el 5% de significación no se rechaza Ho y por lo tanto la mediana de
los salarios es de S/. 300.
Para la aproximación a la distribución normal, con n = 15 se obtiene:
_n(n +1)_ 15(16) _ _ ,'n(n + 1)(2n +1) _ ¡15(16)(31) _ „ ^
MW " 60 y a’' 17^61
4 " 4 y 24 24
(W ± 0 5) -MW (67 5 ~ 0 5) ~ 60 = 0.40. Para dos colas, el valor-P es: a
= = w 17.61
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < -0.40] = 2(0.3446) = 0.69.
Como el valor-P = 0.69 > a = 0.05, con el 5% de significación no se rechaza H 0.
En el programa Minitab, definir la variable salarios con sus datos. Escoger del menú Estadísticas ^ No paramétricos
^ 1W Wilcoxon de 1 muestra. Al abrir la ventana de diálogo, en Variables: seleccionar Salarios, en Mediana de la
prueba: escribir 300 (mediana hipotética) y en Hipótesis alterna: escoger no es igual a. Finalmente escoger
Aceptar, tal como se aprecia a continuación:
366
Intervalo de
Mediana Confianza confianza
N estimada lograda Inferior Superior
Salarios (Xi) 15 304.0 95.0 281.0 339.0
Como la mediana hipotética cae en el intervalo de confianza, también se acepta que la mediana de los salarios es
S/. 300.
7.4 TEST DE SIGNOS
Es una prueba basada en los signos que surgen de la diferencia de comparar los datos de una población con
respecto a su mediana o entre sí (en investigación de mercados para identificar la preferencia hacia una de dos
marcas de un producto).
367
PRUEBA PARA COMPARAR LOS VALORES CON LA MEDIANA
Los pasos a seguir en la prueba son:
1. Hipótesis: Ho: Me = Meo
Hi: Me ^ Me0 o Me < Me0 o Me > Me0
2. Escoger el nivel de significación: a
3. La estadística de prueba S = número de veces que se repite el signo menos frecuente. S se basa en la
distribución Binomial con probabilidad de éxito ' ya que la probabilidad que un valor sea mayor o menor que
la mediana es 'A
4. Región crítica: buscar el valor crítico en la Tabla 6, de valores críticos para la prueba del signo S: n < 25 y a =
O.Oi o 0.05. La hipótesis nula se rechaza si S es menor o igual al valor de la tabla.
5. Determinar S = número de veces que se repite el signo menos frecuente, con la información muestral y bajo el
supuesto que Ho es cierta, mediante el siguiente procedimiento:
a) Aplicar un signo más (+) a cada valor observado en la muestra mayor que la mediana hipotética Me 0 y un signo
menos (-) a cada valor menor. Si algún valor es igual a la mediana hipotética Me0, no se aplica signo alguno
y el tamaño efectivo de la muestra disminuye.
b) Hallar Scalc = número de veces que se repite el signo menos frecuente, es el valor calculado del estadístico de
prueba y sirve para hallar el valor-P y compararlo con el nivel de significación a.
c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante la aproximación Normal de la Binomial
S = X = número de veces que se repite el signo menos frecuente con p = q = 0.5.
Si S = X ^ N(0.5n, 0.25n) entonces Zcalc = (X + 0 5) 05n ^ N(0, i)
0.5V n
6. Decisión: se rechaza H0 con el i00 a% de significación, si Scalc eR.C. No se
rechaza H0 en caso contrario. Si se rechaza Ho se dice que la prueba es significativa con riesgo cuyo valor es a.
Otra forma de establecer la regla de decisión, es calculando el valor P, a partir del valor Z calc, de manera que:
368
• Para dos colas: P = P[|Z| > |Zcaic|] = 2 P[Z < -|Zcaic|]
• Para cola a la derecha: P = P[Z > Zcalc]
• Para cola a la izquierda: P = P[Z < Zcalc]
Si el valor de P < a, se rechaza H0. En caso contrario, se acepta H0.
Ejemplo 4
Para la muestra de los salarios semanales (S/.) de 15obreros del ejemplo 3,
siguientes: 303, 297, 375, 273, 321, 413, 233, 285, 276,329, 306,290, 380, 305 y
250. Probar si la mediana de los salarios es diferente de S/. 300. Use a = 0.05. Solución
1. Hipótesis: Ho: Me = 300
H1: Me ^ 300
2. Nivel de significación: a = 0.05
3. Estadística de prueba: S = número de veces que se repite el signo menos frecuente.
4. Región crítica: para n = 15 y a = 0.05, en la tabla 6 de valores críticos para la prueba del signo, la región crítica
es: R.C. = {S < 3} ^ R.A. = {S > 3}
5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es cierta, mediante el siguiente
procedimiento:
Obreros Salarios
(Xi) Signo Diferencia Xi - 300
1 303 +
2 297 -
3 375 +
4 273 -
5 321 +
6 413 +
7 233 -
8 285 -
9 276 -
10 329 +
11 306 +
12 290 -
13 380 +
14 305 +
15 250 -
369
Scaic = número de veces que se repite el signo menos frecuente = 7.
6. Decisión: como Scalc = 7 e R.A., con el 5% de significación no se rechaza H 0 y por lo tanto la mediana de los
salarios es de S/. 300.
Para la aproximación a la distribución normal de S = X = número de veces que se repite el signo menos frecuente,
con n = 15, p = q = 0.5 se obtiene:
(X + 0.5) - 0.5n (7 + 0.5) - 0.5x15
= ----------------------- -= -------- = -------- J-t= ---------- = 0.00
0.5^/n 0.5^15
Para dos colas, el valor-P es:
P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|] = 2 P[Z < 0.0] = 2(0.5000) = 1.0000.
Como el valor-P = 1.00 > a = 0.05, con el 5% de significación no se rechaza Ho.
En el programa Minitab, definir la variable salarios con sus datos. Escoger del menú Estadísticas ^ No paramétricos
^ 1± Señal de 1 muestra.
Al abrir la ventana de diálogo, en Variables: seleccionar Salarios, en Mediana de la prueba: escribir 300 (mediana
hipotética) y en Hipótesis alterna: escoger no es igual a. Finalmente escoger Aceptar, tal como se aprecia a
continuación:
Intervalo de
Confianza confianza
N Mediana lograda Inferior Superior Posición
Salarios 15 303.0 0.8815 285.0 321.0 5
0.9500 279.4 326.0 NLI
0.9648 276.0 329.0 4
Como la mediana hipotética cae en el intervalo de confianza, también se acepta que la mediana de los salarios es
S/. 300.
PRUEBA PARA COMPARAR LOS VALORES ENTRE SI
En investigación de mercados sirve para identificar la preferencia hacia una de dos marcas de un producto (se
asigna signo positivo cuando la preferencia es por la marca de interés y signo negativo en caso contrario), también
para hacer comparaciones entre los valores de los grupos A y B (asignando signo positivo cuando el valor de A
es superior al valor de B y signo negativo en caso contrario, si son iguales se descarta las observaciones y n
disminuye).
Probar si las preferencias son iguales para ambas marcas o que el número de signos positivos es igual al número
de signos negativos es equivalente a probar si p = 0.50.
Los pasos a seguir en la prueba son:
1. Hipótesis: Ho: p = 0.50
H1: p ^ 0.50 o p < 0.50 o p > 0.50.
2. Escoger el nivel de significación: a
371
3. La estadística de prueba S = número de veces que se repite el signo menos frecuente. S se basa en la
distribución Binomial con probabilidad de éxito ' ya que la probabilidad que se prefiera una u otra marca (o
que un valor sea mayor o menor que otro) es '.
4. Región crítica: buscar el valor crítico en la Tabla 6 para la prueba del signo S. La
hipótesis nula se rechaza si S es menor o igual al valor de la tabla.
5. Determinar S = número de veces que se repite el signo menos frecuente, con la información muestral y bajo el
supuesto que Ho es cierta, mediante el siguiente procedimiento:
a) Si se comparan dos marcas de un bien o servicio: aplicar signo positivo (+) cuando la preferencia es por la
marca de interés y signo negativo (-) en caso contrario.
Si se hace comparaciones entre los valores de los grupos A y B asignar signo positivo (+) cuando el valor de A es
superior al valor de B y signo negativo (-) en caso contrario.
Si son iguales los valores no se aplica signo alguno, se descarta las observaciones y el tamaño efectivo de la
muestra disminuye.
b) Hallar Scalc = número de veces que se repite el signo menos frecuente, es el valor calculado del estadístico de
prueba y sirve para hallar el valor-P y compararlo con el nivel de significación a.
c) Si el tamaño efectivo de muestra es n > 20 el valor-P se obtiene mediante la aproximación Normal de la Binomial
S = X = número de veces que se repite el signo menos frecuente con p = q = 0.5.
Si S = X ^ N(0.5n, 0.25n) entonces Zcalc = (X + 0 5) 0 5n ^ n(0, i)
0.5a/n
6. Decisión: se rechaza H0 con el i00 a% de significación, si Scah eRC.por lo
tanto no son iguales las preferencias por ambos productos o los valores comparados de los grupos A y B no son
iguales.
Otra forma de establecer la regla de decisión, es calculando el valor P, a partir del valor Zcalc, de manera que:
• Para dos colas: P = P[|Z| > |Zcalc|] = 2 P[Z < -|Zcalc|]
• Para cola a la derecha: P = P[Z > Zcalc]
• Para cola a la izquierda: P = P[Z < Zcalc]
372
Si el valor de P < a, se rechaza Hp. En caso contrario, se acepta Hp.
Ejemplo 5
En un estudio para determinar si la marca de frugo B es más preferida por las amas de casa que la marca A, se
hizo degustar aleatoriamente las marcas A y B a 16 amas de casa siendo sus preferencias las siguientes: B, B, B,
B, A, B, B, B, B, B, B, A, B, B, A y B. Con el 5% de significación pruebe si la preferencia de las amas de casa por
la marca de frugo A es inferior a la marca B.
Solución
1. Hipótesis: si la preferencia de las amas de casa por las marcas de frugo A y B es la misma es equivalente a
postular Ho: p = 0.50 frente a la alternativa que la preferencia por la marca A es inferior a la marca B, Hi: p <
0.50
2. Nivel de significación: a = 0.05
3. Estadística de prueba: S = número de veces que se repite el signo menos frecuente.
4. Región crítica: para n = 16 y a = 0.05, en la tabla 6 de valores críticos para la prueba del signo, la región crítica
es: R.C. = {S < 3} ^ R.A. = {S > 3}
5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es cierta, mediante el siguiente
procedimiento:
Signo
Ama de casa Frugo preferido
1 B +
2 B +
3 B +
4 B +
5 A -
6 B +
7 B +
8 B +
9 B +
10 B +
11 B +
12 A -
13 B +
14 B +
15 A -
16 B +
373
Scalc = número de veces que se repite el signo menos frecuente = 3.
6. Decisión: como Scalc = 3 e R.C., con el 5% de significación se rechaza Ho y por lo tanto se acepta que la
preferencia por la marca A es inferior a la marca B.
7.5 TEST DE LA MEDIANA
En el acápite 6.5 y 6.6 se trataron las pruebas estadísticas paramétricas Z o T para la verificación de la igualdad
de medias de dos poblaciones, extrayendo muestras independientes de dichas poblaciones con varianzas
conocidas o desconocidas.
La prueba de la mediana es la contraparte no paramétrica para la verificación de la igualdad de medianas de dos
poblaciones, extrayendo muestras independientes.
La escala de medida de la variable es cuando menos ordinal.
El procedimiento a seguir en la prueba es el siguiente:
1. Hipótesis: Ho: Me1 = Me2
H1: Me1 ^ Me2 o Me1 > Me2 o Me1 < Me2
2. Escoger el nivel de significación: a
2 2 (O — e )2
3. Estadística de prueba: %2 = ----- -- ----- >*[1 1—a)
ei
'=1 -=1
Donde Oij son las frecuencias observadas y eij son las frecuencias esperadas obtenidas con las frecuencias
observadas, suponiendo que Ho es cierta.
4. Región crítica: hallar el valor crítico X\\ i-«] tal que la probabilidad de
.2
[1,1—a]
rechazar H0 cuando se supone cierta sea: P[%“ >%[1,1—a] ] = a
22
La Región crítica de la prueba es: R.C. = {X > }
5. Determinar , con la información muestral y bajo el supuesto que Ho es
cierta, mediante el siguiente procedimiento:
a) Calcular la mediana común Me con toda la información de las dos muestras.
b) Para cada muestra determinar el número de observaciones que son menores o iguales a la mediana común y
las que son mayores a dicha mediana y las frecuencias observadas resultantes se colocan en una tabla de
contingencia 2x2 como la siguiente:
374
Muestra < Me > Me Total
O12
1 O11 O1.
2 O21 O22 O2.
Total O.1 O..2 n
O,. xO.j
c) Hallar las frecuencias esperadas etj =------------------------------ y colocarlas en la tabla:
jn
43 28
25 32
31 48
45 42
44 35
26 48
25 21
23 40
24 30
38 40
25 45
20 28
Solución
1. Hipótesis: Ho: Me2 = Mei y Hi: Me2 > Mei
375
2. Nivel de significación: a = 0.05.
2 2 (O - e„)
2
3. Estadística de prueba: %2 — ZZ " " ------- >*[1 1-a)
'-1 J-1 ey
4. Región crítica: el valor crítico es ^[21,095] = 3.84 y R.C. = {X2 > 3.84}.
5. Determinar %C¡aCc, con la información muestral y bajo el supuesto que Ho es cierta, de la siguiente manera:
a) Con toda la información de las dos muestras se calcula la mediana común y resulta Me = 31.5.
b) Para cada muestra se determina el número de observaciones que son menores o iguales (orden 1) a la mediana
común 31.5 y las que son mayores (orden 2) a dicha mediana:
Unid. Vendidas Sexo Orden
39 1 2
43 1 2
25 1 1
31 1 1
45 1 2
44 1 2
26 1 1
25 1 1
23 1 1
24 1 1
38 1 2
25 1 1
20 1 1
30 2 1
28 2 1
32 2 2
48 2 2
42 2 2
35 2 2
48 2 2
21 2 1
40 2 2
30 2 1
40 2 2
45 2 2
28 2 1
Me = 31.5
376
Las frecuencias observadas resultantes se colocan en una tabla de contingencia 2x2 como la siguiente:
Muestra < Me (Ord. 1) > Me (Ord. 2) Total
1 = hombres 8 5 O1. = 13
2 = Mujeres 5 8 O2. = 13
O
<N
TT
3
Total O.1 = 13 n = 26
c) Hallar las frecuencias esperadas e„ =
O,. xO.
n
y colocarlas en la tabla:
Muestra < Me (Ord. 1) > Me (Ord. 2) Total
1 = hombres 6.5 6.5 O1. = 13
2 = Mujeres 6.5 6.5 O2. = 13
.O
Total O.1 = 13 2 n = 26
2 2 (O -e )2 3
d) Determinar: Zcaic = Z Z -O1------------------------ —
ei
i=1 1=1
_ (8-6.5)2 (5-6.5)2 (5-6.5)2 (8-6.5)2 _ _ 3gg
XcaIc 6.5 6.5 6.5 6.5 .
P-valor = P(x2 > 1 385) = 1 - P(x2 < 1385) = 1 - 0.761 = 0.239.
6. Decisión: como xlaic = 138 e R.A. y P-valor = 0.239 > a = 0.05, no se
rechaza H0 por lo tanto con el 5% de significación se acepta que la mediana del número de unidades vendidas por
las mujeres y los hombres son iguales.
377
En el programa Minitab, definir las variables Unidades vendidas y Sexo con sus datos. Escoger del menú
Estadísticas ^ No paramétricos ^ Prueba de la mediana de Mood. Al abrir la ventana de diálogo, en Respuesta:
seleccionar Unid. vendidas, en Factor: seleccionar Sexo. Finalmente escoger Aceptar, tal como se aprecia en la
ventana de diálogo de la página anterior.
En la ventana de Sesión aprece el resultado siguiente:
Prueba de mediana de Mood: Unid. vendidas en funcion de Sexo
Prueba de la mediana de Mood para Unid. vendidas
Chi-cuadrada = 1.38
GL = 1
P = 0.239
Sexo N<= N> Mediana Q3-Q1
1 8 5 26.0 16.5
2 5 8 35.0 14.5
ICs de 95.0% individuales
(__* ------------------------------------------------------ )
( *----------------------------------------------------------------
25.0 30.0 35.0 40.0
Mediana general = 31.5
Un IC de 95.0% para la mediana(1) _ mediana(2): (-15.8,8.4)
Resultados y conclusiones similares a los obtenidos: %1Cílh = i.38 y P = 0.239. Por
lo tanto con el 5% de significación se acepta que la mediana del número de unidades vendidas por las mujeres y
los hombres son iguales.
378
7.7 PROBLEMAS RESUELTOS
1. En el estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC, el año 2012,
con el 5% de significación probar si existe relación entre el hobby (pasatiempo) del alumno y su sexo (género).
Los resultados observados obtenidos con el SPSS v21, se muestran en la siguiente tabla:
Tabla de contingencia HOBBY * SEXO
Valores Observados
SEXO Total
HOBBY Hombre Mujer
Deportes 18 6 24
Música 12 33 45
Baile 1 9 10
TV / Cine 2 27 29
Otros 5 7 12
Total 38 82 120
Solución
1. H0: El hobby de los estudiantes es independiente del género de este. (NO existe relación entre el hobby y el
género del estudiante).
H1: El hobby de los estudiantes depende del género de este (Existe relación entre el hobby y el genero del
estudiante).
2. Nivel de significación: a = 0.05
5 2 (O - e )2
2 ^ ^ ij ij 2
3. Estadística de prueba: x = XX ---------------------------------------------- >X\
eij
i=1 j=1
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
X!2a,(/-1)(C-1) = X (295, 4 = 9.49. Entonces, R.C. = {X2 > 9.49}
5. Hallar xlaic con la tabla de valores observados y la de valores esperados.
Tabla de contingencia HOBBY * SEXO
Valores Esperados
SEXO Total
Hombre Mujer
HOBBY
Deportes 7.6 16.4 24
Música 14.3 30.8 45
Baile 3.2 6.8 10
TV / Cine 9.2 19.8 29
I % calc 32.293
5 2 (O - e )2
Luego xlc - £ £ — ---------------------------- — = 32.293
e,¡
»1 l-1
2
6. Decisión: como x caCc = 32.293 e R.C., con el 5% de significación se rechaza
H0, por lo tanto el hobby de los estudiantes depende del género de este. (Existe relación entre el hobby y el género
del estudiante).
Estando definidas las variables sexo y hobby, los resultados en el programa SPSS se obtienen así:
Analizar ^ Estadísticos descriptivos ^ Tablas de contingencia. En la
ventana de Tablas de contingencia, ingresar en Filas: la variable hobby y en Columnas: la variable sexo.
En Estadísticos, escoger Chi-cuadrado. Luego Continuar y Aceptar, los
resultados son la Tabla de contingencia de valores observados del enunciado y las Pruebas de chi-cuadrado
siguientes:
380
Pruebas de chi-cuadrado
Valor gl Sig. asintótica
(bilateral)
Hombre Mujer
IMPORTANCIA DE TUS
ESTUDIOS
Poca 0 1 1
Media 4
2 6
Mucha 21 43 64
Muchísima 15 34 49
Total 38 82 120
Solución
1. H0: No existe relación entre la importancia de los estudios y el género del estudiante (son independientes).
Hi: Existe relación entre la importancia de los estudios y el genero del estudiante.
2. Nivel de significación: a = 0.05
381
4 2 (O — e. )2
3. Estadística de prueba: %2 = LL—1 --------------------- 1 --------- »%32
e
>=1 -=1 i
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico X2— a,(/—1)(C—1) = X 0.95,3 = 7.81.
Entonces, R.C. = {X2 > 7.81}
5. Hallar %2calc con la tabla de valores observados y la de valores esperados.
Tabla de contingencia IMPORTANCIA DE TUS ESTUDIOS * SEXO
Valores Esperados
SEXO Total
Hombre Mujer
IMPORTANCIA DE TUS
ESTUDIOS
Poca 0.3 0.7 1
Media 1.9 4.1 6
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico XLÁ/-1)(C-1) = X (2.95,6 = 12.6. Entonces,
R.C. = {X2 > 12.6}
5. Hallar xlak con la tabla de valores observados y la de valores esperados.
Valores Esperados
INGRESOS
TIPO DE
EMPRESA < 20 20 - 40 > 40 Total
Cuenta propia 9.0 10.2 10.8 30
Pequeñas 10.5 11.9 12.6 35
Medianas 40.5 45.9 48.6 135
Grandes 90.0 102.0 108.0 300
Total 150 170 180 500
Los valores esperados se obtienen con los totales observados así:
Cuenta propia: 30x150/500 = 9.0, 30x170/500 = 10.2, 30x180/500 = 10.8 Pequeñas: 35x150/500 = 10.5,
35x170/500 = 11.9, 35x180/500 = 12.6 Medianas: 135x150/500 = 40.5, 135x170/500 = 45.9, 135x180/500 =48.6
Grandes: 300x150/500 = 90, 300x170/500 = 102, 300x180/500 = 108 Para hallar xlak ordenamos los valores
observados y esperados en la tabla:
eü (Oij - eij) / eij
Tipo emp.-ingresos Oij
C. propia - < 20 9 9.0 0.000
Pequeña - < 20 12 10.5 0.214
Mediana - < 20 40 40.5 0.006
Grande - < 20 89 90.0 0.011
C. propia - 20 a 40 11 10.2 0.063
Pequeña - 20 a 40 10 11.9 0.303
Mediana - 20 a 40 45 45.9 0.018
Grande - 20 a 40 104 102.0 0.039
C. propia - > 20 10 10.8 0.059
Pequeña - > 20 13 12.6 0.013
Mediana - > 20 50 48.6 0.040
Grande - > 20 107 108.0 0.009
X calc : 0.776
I
384
4 3 (O - e )2
Luego xL -¿ = 0.776
et
-i j-i
6. Decisión: como xlaic = 0.776 e R.A., con el 5% de significación no se rechaza
H0, por lo tanto el nivel de ingreso de los representantes industriales es independiente del nivel de su empleo (El
nivel de ingreso de los representantes industriales no depende del tipo de empresa donde labora).
4. Los datos de partes defectuosas procedente de tres proveedores [Anderson y Otros (2004)] son los siguientes:
Valores Observados:
CALIDAD DE PROVEEDOR
PARTES
A B C Total
Buena 90 i70 i35 395
Defectos pequeños 3 i8 6 27
Defectos graves 7 7 9 23
Total i00 i95 i50 445
Use a = 0.05 y demuestre si hay independencia entre proveedor y calidad de las partes. ¿Qué dice el resultado
de su análisis al departamento de compras? Solución
1. Ho: No existe relación entre el proveedor y la calidad de las partes ofrecidas (son independientes).
H1: Existe relación entre el proveedor y la calidad de las partes ofrecidas.
2. Nivel de significación: a = 0.05
3 3 (O - e )2
2 ^ ^ ij ij 2
3. Estadística de prueba: x -XX ---------------------------------------------- >X4
ej
i-i j-i
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico
X2-a,(/-i)(c-i) = X (2.95,4 = 9.49. Entonces, R.C. = {X2 > 9.49}
5. Hallar xlaic con la tabla de valores observados y la de valores esperados.
Valores Esperados
PROVEEDOR
CALIDAD DE PARTES A B C Total
Buena 88.8 i73.i i33.i 395
Defectos pequeños 6.i ii.8 9.i 27
Defectos graves 5.2 i0.i 7.8 23
Total i00 i95 i50 445
385
Los valores esperados se obtienen con los totales observados así:
Buena: 395x100/445 = 88.8, 395x195/445 = 173.1, 395x150/445 = 133.1 Def. pequeños.: 27x100/445 = 6.1,
27x195/445 = 11.8, 27x150/445 = 9.1 Def. graves.: 23x100/445 = 5.2, 23x195/445 = 10.1, 23x150/445 = 7.8 Para
hallar xlaic ordenamos los valores observados y esperados en la tabla:
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico %1-«, k-p-, = X (2.95,3 = 7.81. Entonces,
R.C. = {X2 > 7.81}
5. Hallar %2calc con la información observada de los 120 alumnos y bajo el
supuesto que Ho es cierta (la importancia del físico es la misma para los alumnos) es decir, con la misma
frecuencia esperada igual a 120/5 = 24. La Tabla de frecuencias observadas y esperadas es:
Imp. del físico Poca Media Mucha Muchísima
Oi 19 48 46 7
ei 24 24 24 24
9
!
9 - 10 9.5 7
10 - 11 10.5 21
11 - 12 11.5 33
12 - 13 12.5 22
13 - 14 13.5 19
14 - 15 14.5 7
15 - 16 15.5 3
Probar si las notas se distribuyen normalmente. Use a = 0.05.
Solución
1. Hipótesis: Ho: Las notas de los alumnos se distribuyen normalmente
H1: Las notas de los alumnos no se distribuyen normalmente
388
2. Nivel de significación: a = 0.05
9 (O -e.)2 2
3. Estadística de prueba: x = Z —i ------------------ i ---------- > X9-2-1
ei
t!
4. Región crítica: en la Tabla 2 de Chi-cuadrado, hallar el valor crítico x1-a, k-P-1 = A (2.95,6 = 12.6. Entonces,
R.C. = {X2 > 12.6}
5. Hallar Xcalc con la información observada de los 120 alumnos.
Z A^i 1412
La nota promedio de los alumnos es: u = — -------------------------- = ----------- = 11.77
n 120
La varianza de las notas es:
ZAn-«U2 = U6950-120(n.77)2 =
2 = 2S2 ^ o = L679
n-1 120-1
Bajo el supuesto que Ho es cierta, X = notas ~ N(11.77, 2.82), luego:
A -11 77
Z = —Yqjc) -------------- * N (0,1) permite calcular las probabilidades pi para los 9
intervalos considerados así:
P(X < 8) = P(Z < -2.25) = 0(-2.25) = 0.01222
P(8 < X < 9) = P(-2.25 < Z < -1.65) = 0(-1.65) - 0(-2.25) =
= 0.04947 - 0.01222 = 0.03725.
P(9 < X <10) = P(-1.65 < Z < -1.05) = 0(-1.05) - 0(-1.65) =
= 0.14686 - 0.04947 = 0.09739.
P(10 < X < 11) = P(-1.05 < Z < -0.46) = 0(-0.46) - 0(-1.05) =
= 0.32276 - 0.14686 = 0.17590.
P(11 <X < 12) = P(-0.46 < Z < 0.14) = 0(0.14) - 0(-0.46)=
= 0.55567 - 0.32276 = 0.23291.
P(12 < X < 13) = P(0.14 < Z < 0.73) = 0(0.73) - 0(0.14) =
= 0.76730 - 0.55567 = 0.21163.
P(13 < X < 14) = P(0.73 < Z < 1.33) = 0(1.33) - 0(0.73) =
= 0.90824 - 0.76730 = 0.14094.
P(14 < X < 15) = P(1.33 < Z < 1.92) = 0(1.92) - 0(1.33) =
= 0.97257 - 0.90824 = 0.06433.
P(X > 15) = P(Z > 1.92) = 1 - 0(1.92) = 1 - 0.97257 = 0.02743.
389
Las probabilidades pi y las frecuencias esperadas ei = n pi = 120 pi se presentan en la siguiente tabla:
NOTAS Xi ni = Oi pi ei = npi (Oi - ei)2/ei
7-8 7.5 2 0.01222 1.5 0.1942
8-9 8.5 6 0.03725 4.5 0.5237
9 - 10 9.5 7 0.09739 11.7 1.8796
10 - 11 10.5 21 0.17590 21.1 0.0006
11 - 12 11.5 33 0.23291 27.9 0.9127
12 - 13 12.5 22 0.21163 25.4 0.4540
13 - 14 13.5 19 0.14094 16.9 0.2576
14 - 15 14.5 7 0.06433 7.7 0.0671
15 - 16 15.5 3 0.02743 3.3 0.0258
Total 120 1.00000 120.0 4.3152
En la última columna se tiene:
¿L = 4.32
6. Decisión: como xlaic = 4 32 e R.A., con el 5% de significación no se rechaza
H0, por lo tanto, se concluye que las notas de los alumnos se distribuyen normalmente.
8. Una muestra de los gastos de estudio mensual (S/.) de 16 alumnos arroja los siguientes resultados: 120, 210,
100, 150, 120, 200, 200, 180, 250, 300, 250, 140, 300, 200, 160 y 300. Probar si la mediana de los gastos de
estudio es diferente de S/. 220. Use a = 0.05.
Solución
1. Hipótesis: Ho: Me = 220
H1: Me ^ 220
2. Nivel de significación: a = 0.05
3. Estadística de prueba: W = suma de los rangos positivos
4. Región crítica: para n = 16 y a = 0.05, en la tabla 5, de Wilcoxon la región crítica es: R.C. = {W < 29 o W > 107}
^ R.A. = {29 < W < 107}
5. Determinar la W de Wilcoxon con la información muestral y bajo el supuesto que Ho es cierta, tal como se
aprecia en la tabla de la página siguiente.
Wcalc = suma de los rangos positivos = 45.5
390
Diferencia di =
Rangos con signo
Gastos Xi - 220 Rango de
Alumnos
(Xi) |di|
(+) (-)
1 120 -100 14.5 14.5
2 210 -10 1 1
3 100 -120 16 16
4 150 -70 9 9
5 120 -100 14.5 14.5
6 200 -20 3 3
7 200 -20 3 3
8 180 -40 7 7
9 250 30 5.5 5.5
10 300 80 11.5 11.5
11 250 30 5.5 5.5
12 140 -80 11.5 11.5
13 300 80 11.5 11.5
14 200 -20 3 3
15 160 -60 8 8
16 300 80 11.5 11.5
Total 45.5 90.5
6. Decisión: como W caic = 45.5 e R.A., con el 5% de significación no se rechaza Ho y por lo tanto la mediana de
los gastos de estudio es de S/. 220.
9. En el problema 8, use la prueba de los signos para probar si la mediana de los gastos de estudio es diferente
de S/. 220. Use a = 0.05.
Solución
1. Hipótesis: Ho: Me = 220
Hi: Me ^ 220
2. Nivel de significación: a = 0.05
3. Estadística de prueba: S = número de veces que se repite el signo menos frecuente.
4. Región crítica: para n = 16 y a = 0.05, en la tabla 6 de valores críticos para la prueba del signo, la región crítica
es: R.C. = {S < 3} ^ R.A. = {S > 3}
5. Determinar Scalc con la información muestral y bajo el supuesto que Ho es cierta, mediante el siguiente
procedimiento:
391
Signo Diferencia di = Xi -
Alumnos Gastos (Xi) 220
1 120 -
2 210 -
3 100 -
4 150 -
5 120 -
6 200 -
7 200 -
8 180 -
9 250 +
10 300 +
11 250 +
12 140 -
13 300 +
14 200 -
15 160 -
16 300 +
Scaic = número de veces que se repite el signo menos frecuente = 5.
6. Decisión: como Scalc = 5 e R.A., con el 5% de significación no se rechaza Ho y por lo tanto la mediana de los
salarios es de S/. 220.
10. Con la información del peso de los hombres y mujeres en la tabla, determinar si la mediana del peso de los
hombres es mayor que la mediana del peso de las mujeres. Usar el 5% de significación.
Hombres (1) Mujeres (2)
68 54
55 42
70 54
73 51
58 43
59 64
74 56
65 47
66 52
69 65
Solución
1. Hipótesis: Ho: Me1 = Me2 y H1: Me1 > Me2
2. Nivel de significación: a = 0.05.
392
2 2 (O — Q )2
2
3. Estadística de prueba: % =
Xp,
1—a)
i=1 j=1
4. Región crítica: el valor crítico es X|i,0.95] = 3.84 y R.C. = {X2 > 3.84}.
5. Determinar %lah , con la información muestral y bajo el supuesto que Ho es cierta, de la siguiente manera:
a) Con toda la información de las dos muestras se calcula la mediana común y resulta Me = 58.5.
b) Para cada muestra se determina el número de observaciones que son menores o iguales (orden 1) a la mediana
común 58.5 y las que son mayores (orden 2) a dicha mediana:
Peso Sexo Ürden
68 1 2
55 1 1
70 1 2
73 1 2
58 1 1
59 1 2
74 1 2
65 1 2
66 1 2
69 1 2
54 2 1
42 2 1
54 2 1
51 2 1
43 2 1
64 2
56 2 1
47 2 1
52 2 1
65 2 2
Me = 58.5
Las frecuencias observadas resultantes se colocan en una tabla de contingencia 2x2 como la siguiente:
Muestra < Me (Ürd. 1) > Me (Ürd. 2) Total
1 = hombres 2 8 Ü1. = 10
2 = Mujeres 8 2 Ü2. = 10
O
C
T
0
Total O.1 = 10 n = 20
ij
393
O,. xO. j
c) Hallar las frecuencias esperadas e tj = ------------------------ y colocarlas en la tabla:
jn
Poca 12 7 19
Media 14 34 48
Mucha 10 36 46
Muchísima 2 5 7
Total 38 82 120
2. En el estudio realizado con los alumnos de la asignatura de Estadística Básica de la FCE-UNAC, el año 2012,
con el 5% de significación probar si hay una relación de dependencia entre la especialización profesional del
alumno de economía y su sexo (género). Los resultados observados obtenidos con el SPSS v21, se muestran
en la siguiente tabla:
Tabla de contingencia ESPECIALIZACIÓN * SEXO
SEXO Total
Hombre Mujer
ESPECIALIZACIÓN
Teoría Económica 8 10 18
Gestión Empresarial 30 72 102
Total 38
82 120
3. Para determinar si el sexo (género) de las personas adultas es determinante para que estas consuman licor,
se realiza una encuesta a 500 adultos, obteniéndose los siguientes resultados:
P2 49 11 60
P3 15 37 52
Total 97 65 162
5. Se lanzan 2 dado 500 veces, el resultado de observar la suma del número de puntos en los 2 dados es la
siguiente:
Suma (Xi) Frecuencia (Oi)
2 6
3 20
4 45
5 42
6 72
7 98
8 75
9 44
10 48
11 35
12 15
Con el 5% de significación, ¿se ajusta el juego al azar?
6. Los pesos de los 120 alumnos de la asignatura de Estadística Básica de la FCE- UNAC, el año 2012, fueron
las siguientes:
PESO (Kg) ni = Oi
Menos 45 2
45 - 50 18
50 - 55 20
55 -60 25
60 - 65 31
65 - 70 9
70 - 75 7
75 - 80 4
80 a más 4
Con el 5% de significación, probar si los pesos se distribuyen normalmente.
7. Una encuesta de opinión a 300 clientes de un supermercado, sobre la calidad del servicio, arroja los siguientes
resultados:
396
Calidad servicio Excelente Bueno Regular Malo Pésimo
Frecuencias (Oi) 72 67 52 56 53
Con el 5% de significación probar si existe diferencia significativa entre la opinión de los clientes sobre la calidad
del servicio en el supermercado.
8. Una muestra de los ingresos familiares (S/.) de 20 empleados arroja los
siguientes resultados: 1300, 700, 700, 2500, 1500, 1200, 1500, 1500, 1500,
1000, 1400, 1800, 1500, 1000, 1500, 700, 700, 1000, 1840 y 2000. Probar si la mediana de los ingresos es
diferente de S/. 1400 con la prueba de Wilcoxon y de los signos. Use a = 0.05.
9. Los pesos de 15 personas arroja los siguientes resultados: 59, 50, 44, 42, 54, 71,
73, 58, 51, 75, 59, 74, 90, 65 y 43. Probar si la mediana de los pesos es diferente
de 65 kilos con la prueba de Wilcoxon y de los signos. Use a = 0.05.
10. Los precios (S/.) del kilo de carne pagado por 12 amas de casa arroja los siguientes resultados: 12.50, 12.00,
11.80, 13.20, 12.80, 11.50, 13.50, 12.40,
11.00, 14.00, 11.30 y 13.30. Probar si la mediana de los precios es diferente de S/. 12.10 con la prueba de Wilcoxon
y de los signos. Use a = 0.05.
11. Con la información de la talla de los hombres y mujeres en la tabla, determinar si la mediana de la talla de los
hombres es mayor que la mediana de la talla de las mujeres. Usar el 5% de significación.
Hombres (1) Mujeres (2)
171 152
167 150
160 152
165 165
168 158
176 150
174 155
169 158
168 165
176 149
397
REFERENCIAS BIBLIOGRÁFICAS
1. Anderson, D. y Otros (2004). “Estadística para Administración y Economía”. Editorial Thomson. Octava edición.
México.
2. Berenson & Levin (1992). "Estadística para Administración y Economía". Prentice Hall Hispanoamericana S.A.,
México.
3. Bazán, J. y Corbera, J. (1997). “Problemas de probabilidad”. Universidad Nacional del Callao: Trabajo de
investigación para la Facultad de Ciencias Económicas. Callao.
4. Canovas, George (1995). “Probabilidad y Estadística: Aplicaciones y métodos”. Mc Graw Hill, México.
5. Chué, J. y Otros (2007). “Estadística descriptiva y probabilidades”. Lima, Perú. Fondo Editorial Universidad de
Lima.
6. López de la Manzanara (1977). "Problemas de Estadística". Editorial Pirámide
S.A., Madrid.
7. Moya y Saravia (1988). "Probabilidad e Inferencia Estadística". Editorial San Marcos, Lima.
8. Hoog & Craig (1981). "Introduction to Mathematical Statistics". Mc Graw -Hill, México.
9. Kohler, Heinz (1996). “Estadística para Negocios y Economía”. Compañía Editorial Continental S.A., México.
10. Levin R. & Rubin D. (1996). "Estadística para Administradores". Prentice-Hall Hispanoamericana S.A. Sexta
edición, México.
11. Levin R. & Rubin D. (2004). “Estadística para Administración y Economía”. Editorial Pearson Prentice-Hall.
Séptima edición, México.
12. Mason, R. y Lind, D. (1998). “Estadística para Administración y Economía”. Editorial Alfaomega. Octava
edición. México.
13. Martínez, Ciro (2005). “Estadística y Muestreo”. Ecoe Ediciones. Décimo segunda edición. Bogota, Colombia.
14. Meendenhall, William (1990). "Estadística para Administradores". Grupo Editorial Iberoamérica S.A., México.
15. Ministerio de Educación (2000). “Nutrición y Retardo en el Crecimiento”. Resultados del II Censo Nacional de
Talla en Escolares 1999. Lima.
398
16. Ministerio de Salud (2011). Informe del estado nutricional en el Perú. Componente nutricional ENAHO-CENAN
Julio 2009 - Junio 2010, CENAN - INEI. Lima, Perú, 2011.
17. Mood & Graybill (1978). "Introducción a la Teoría Estadística". Editorial Aguilar. Madrid, España.
18. Pérez, César (2002). “Estadística aplicada a través de Excel”. Editorial Pearson- Prentice Hall. Madrid, España.
19. Spiegel, Murray (1991). "Estadística". Colección Schaum. Mc Graw-Hill, México.
20. Toma, J. y Rubio, J. (2008). “Estadística aplicada”. Segunda parte. Universidad del Pacífico: Apuntes de
estudio 69. Lima.
21. Webster, Allen. (2000). “Estadística aplicada a los negocios y la economía”. Editorial McGraw-Hill. Tercera
edición. Bogota, Colombia.
REFERENCIAS WEB
22. Acuña, Edgar (2012). “Pruebas no paramétricas”. Universidad de Puerto Rico.
http://www.google.com.pe/url?sa=t&rct=j&q=&esrc=s&frm=1&source=web&c
d=6&sqi=2&ved=0CEoQFiAF&url=http%3A%2F%2Facademic.uprm.edu%2Fe acuna%2F miniman11sl.
pdf&ei=e7dpUov5F oi28wTn8oCYAQ&usg=AFQjCNE -MH9RW0glMaHg479MiFrk0l FJA
23. Bazán, Juan (2011). “Texto de estadística computacional con R, Excel, Minitab y SPSS” (PDF). Universidad
Nacional del Callao: Trabajo de investigación para la Facultad de Ciencias Económicas. Callao.
http://www.unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes Finales Investigacion/Enero 2011/BAZAN
BACA FCE/Estad%EDstica%20computaci onal.pdf
24. http://es.wikipedia.org/wiki/William Sealy Gosset; revisado en agosto de 2012.
25. http://buscon.rae.es/drae/ Real Academia Española © Todos los derechos reservados. Vigésima segunda
edición (2001).
399
APÉNDICE
400
TABLA 1. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR
F(z) = O (z) = P [Z ? z] = r 1 Q—
—La/2^
z F(z)
-1.79 0.03673
-1.78 0.03754
-1.77 0.03836
-1.76 0.03920
-1.75 0.04006
-1.74 0.04093
-1.73 0.04182
-1.72 0.04272
-1.71 0.04363
-1.70 0.04457
-1.69 0.04551
-1.68 0.04648
-1.67 0.04746
-1.66 0.04846
-1.65 0.04947
-1.64 0.05050
-1.63 0.05155
-1.62 0.05262
-1.61 0.05370
-1.60 0.05480
-1.59 0.05592
-1.58 0.05705
-1.57 0.05821
-1.56 0.05938
-1.55 0.06057
-1.54 0.06178
-1.53 0.06301
-1.52 0.06426
-1.51 0.06552
-1.50 0.06681
-1.49 0.06811
-1.48 0.06944
-1.47 0.07078
-1.46 0.07215
-1.45 0.07353
-1.44 0.07493
-1.43 0.07636
-1.42 0.07780
-1.41 0.07927
-1.40 0.08076
-1.39 0.08226
-1.38 0.08379
-1.37 0.08534
-1.36 0.08692
-1.35 0.08851
-1.34 0.09012
-1.33 0.09176
-1.32 0.09342
-1.31 0.09510
-1.30 0.09680
-1.29 0.09853
-1.28 0.10027
-1.27 0.10204
-1.26 0.10383
-1.25 0.10565
-1.24 0.10749
-1.23 0.10935
-1.22 0.11123
-1.21 0.11314
-1.20 0.11507
z F(z)
-1.19 0.11702
-1.18 0.11900
-1.17 0.12100
-1.16 0.12302
-1.15 0.12507
-1.14 0.12714
-1.13 0.12924
-1.12 0.13136
-1.11 0.13350
-1.10 0.13567
-1.09 0.13786
-1.08 0.14007
-1.07 0.14231
-1.06 0.14457
-1.05 0.14686
-1.04 0.14917
-1.03 0.15151
-1.02 0.15386
-1.01 0.15625
-1.00 0.15866
-0.99 0.16109
-0.98 0.16354
-0.97 0.16602
-0.96 0.16853
-0.95 0.17106
-0.94 0.17361
-0.93 0.17619
-0.92 0.17879
-0.91 0.18141
-0.90 0.18406
-0.89 0.18673
-0.88 0.18943
-0.87 0.19215
-0.86 0.19489
-0.85 0.19766
-0.84 0.20045
-0.83 0.20327
-0.82 0.20611
-0.81 0.20897
-0.80 0.21186
-0.79 0.21476
-0.78 0.21770
-0.77 0.22065
-0.76 0.22363
-0.75 0.22663
-0.74 0.22965
-0.73 0.23270
-0.72 0.23576
-0.71 0.23885
-0.70 0.24196
-0.69 0.24510
-0.68 0.24825
-0.67 0.25143
-0.66 0.25463
-0.65 0.25785
-0.64 0.26109
-0.63 0.26435
-0.62 0.26763
-0.61 0.27093
-0.60 0.27425
z F(z)
-0.59 0.27760
-0.58 0.28096
-0.57 0.28434
-0.56 0.28774
-0.55 0.29116
-0.54 0.29460
-0.53 0.29806
-0.52 0.30153
-0.51 0.30503
-0.50 0.30854
-0.49 0.31207
-0.48 0.31561
-0.47 0.31918
-0.46 0.32276
-0.45 0.32636
-0.44 0.32997
-0.43 0.33360
-0.42 0.33724
-0.41 0.34090
-0.40 0.34458
-0.39 0.34827
-0.38 0.35197
-0.37 0.35569
-0.36 0.35942
-0.35 0.36317
-0.34 0.36693
-0.33 0.37070
-0.32 0.37448
-0.31 0.37828
-0.30 0.38209
-0.29 0.38591
-0.28 0.38974
-0.27 0.39358
-0.26 0.39743
-0.25 0.40129
-0.24 0.40517
-0.23 0.40905
-0.22 0.41294
-0.21 0.41683
-0.20 0.42074
-0.19 0.42465
-0.18 0.42858
-0.17 0.43251
-0.16 0.43644
-0.15 0.44038
-0.14 0.44433
-0.13 0.44828
-0.12 0.45224
-0.11 0.45620
-0.10 0.46017
-0.09 0.46414
-0.08 0.46812
-0.07 0.47210
-0.06 0.47608
-0.05 0.48006
-0.04 0.48405
-0.03 0.48803
-0.02 0.49202
-0.01 0.49601
0.00 0.50000
z F(z)
-3.59 0.00017
-3.58 0.00017
-3.57 0.00018
-3.56 0.00019
-3.55 0.00019
-3.54 0.00020
-3.53 0.00021
-3.52 0.00022
-3.51 0.00022
-3.50 0.00023
-3.49 0.00024
-3.48 0.00025
-3.47 0.00026
-3.46 0.00027
-3.45 0.00028
-3.44 0.00029
-3.43 0.00030
-3.42 0.00031
-3.41 0.00032
-3.40 0.00034
-3.39 0.00035
-3.38 0.00036
-3.37 0.00038
-3.36 0.00039
-3.35 0.00040
-3.34 0.00042
-3.33 0.00043
-3.32 0.00045
-3.31 0.00047
-3.30 0.00048
-3.29 0.00050
-3.28 0.00052
-3.27 0.00054
-3.26 0.00056
-3.25 0.00058
-3.24 0.00060
-3.23 0.00062
-3.22 0.00064
-3.21 0.00066
-3.20 0.00069
-3.19 0.00071
-3.18 0.00074
-3.17 0.00076
-3.16 0.00079
-3.15 0.00082
-3.14 0.00084
-3.13 0.00087
-3.12 0.00090
-3.11 0.00094
-3.10 0.00097
-3.09 0.00100
-3.08 0.00104
-3.07 0.00107
-3.06 0.00111
-3.05 0.00114
-3.04 0.00118
-3.03 0.00122
-3.02 0.00126
-3.01 0.00131
-3.00 0.00135
z F(z)
-2.39 0.00842
-2.38 0.00866
-2.37 0.00889
-2.36 0.00914
-2.35 0.00939
-2.34 0.00964
-2.33 0.00990
-2.32 0.01017
-2.31 0.01044
-2.30 0.01072
-2.29 0.01101
-2.28 0.01130
-2.27 0.01160
-2.26 0.01191
-2.25 0.01222
-2.24 0.01255
-2.23 0.01287
-2.22 0.01321
-2.21 0.01355
-2.20 0.01390
-2.19 0.01426
-2.18 0.01463
-2.17 0.01500
-2.16 0.01539
-2.15 0.01578
-2.14 0.01618
-2.13 0.01659
-2.12 0.01700
-2.11 0.01743
-2.10 0.01786
-2.09 0.01831
-2.08 0.01876
-2.07 0.01923
-2.06 0.01970
-2.05 0.02018
-2.04 0.02068
-2.03 0.02118
-2.02 0.02169
-2.01 0.02222
-2.00 0.02275
-1.99 0.02330
-1.98 0.02385
-1.97 0.02442
-1.96 0.02500
-1.95 0.02559
-1.94 0.02619
-1.93 0.02680
-1.92 0.02743
-1.91 0.02807
-1.90 0.02872
-1.89 0.02938
-1.88 0.03005
-1.87 0.03074
-1.86 0.03144
-1.85 0.03216
-1.84 0.03288
-1.83 0.03362
-1.82 0.03438
-1.81 0.03515
-1.80 0.03593
z F(z)
-2.99 0.00139
-2.98 0.00144
-2.97 0.00149
-2.96 0.00154
-2.95 0.00159
-2.94 0.00164
-2.93 0.00169
-2.92 0.00175
-2.91 0.00181
-2.90 0.00187
-2.89 0.00193
-2.88 0.00199
-2.87 0.00205
-2.86 0.00212
-2.85 0.00219
-2.84 0.00226
-2.83 0.00233
-2.82 0.00240
-2.81 0.00248
-2.80 0.00256
-2.79 0.00264
-2.78 0.00272
-2.77 0.00280
-2.76 0.00289
-2.75 0.00298
-2.74 0.00307
-2.73 0.00317
-2.72 0.00326
-2.71 0.00336
-2.70 0.00347
-2.69 0.00357
-2.68 0.00368
-2.67 0.00379
-2.66 0.00391
-2.65 0.00402
-2.64 0.00415
-2.63 0.00427
-2.62 0.00440
-2.61 0.00453
-2.60 0.00466
-2.59 0.00480
-2.58 0.00494
-2.57 0.00508
-2.56 0.00523
-2.55 0.00539
-2.54 0.00554
-2.53 0.00570
-2.52 0.00587
-2.51 0.00604
-2.50 0.00621
-2.49 0.00639
-2.48 0.00657
-2.47 0.00676
-2.46 0.00695
-2.45 0.00714
-2.44 0.00734
-2.43 0.00755
-2.42 0.00776
-2.41 0.00798
-2.40 0.00820
401
TABLA 1. DISTRIBUCIÓN ACUMULATIVA NORMAL ESTÁNDAR
1/2
F(z) = O (z) = P [Z ? z] = e- dt
continuación
z F(z)
0.01 0.50399
0.02 0.50798
0.03 0.51197
0.04 0.51595
0.05 0.51994
0.06 0.52392
0.07 0.52790
0.08 0.53188
0.09 0.53586
0.10 0.53983
0.11 0.54380
0.12 0.54776
0.13 0.55172
0.14 0.55567
0.15 0.55962
0.16 0.56356
0.17 0.56749
0.18 0.57142
0.19 0.57535
0.20 0.57926
0.21 0.58317
0.22 0.58706
0.23 0.59095
0.24 0.59483
0.25 0.59871
0.26 0.60257
0.27 0.60642
0.28 0.61026
0.29 0.61409
0.30 0.61791
0.31 0.62172
0.32 0.62552
0.33 0.62930
0.34 0.63307
0.35 0.63683
0.36 0.64058
0.37 0.64431
0.38 0.64803
0.39 0.65173
0.40 0.65542
0.41 0.65910
0.42 0.66276
0.43 0.66640
0.44 0.67003
0.45 0.67364
0.46 0.67724
0.47 0.68082
0.48 0.68439
0.49 0.68793
0.50 0.69146
0.51 0.69497
0.52 0.69847
0.53 0.70194
0.54 0.70540
0.55 0.70884
0.56 0.71226
0.57 0.71566
0.58 0.71904
0.59 0.72240
0.60 0.72575
z F(z)
1.81 0.96485
1.82 0.96562
1.83 0.96638
1.84 0.96712
1.85 0.96784
1.86 0.96856
1.87 0.96926
1.88 0.96995
1.89 0.97062
1.90 0.97128
1.91 0.97193
1.92 0.97257
1.93 0.97320
1.94 0.97381
1.95 0.97441
1.96 0.97500
1.97 0.97558
1.98 0.97615
1.99 0.97670
2.00 0.97725
2.01 0.97778
2.02 0.97831
2.03 0.97882
2.04 0.97932
2.05 0.97982
2.06 0.98030
2.07 0.98077
2.08 0.98124
2.09 0.98169
2.10 0.98214
2.11 0.98257
2.12 0.98300
2.13 0.98341
2.14 0.98382
2.15 0.98422
2.16 0.98461
2.17 0.98500
2.18 0.98537
2.19 0.98574
2.20 0.98610
2.21 0.98645
2.22 0.98679
2.23 0.98713
2.24 0.98745
2.25 0.98778
2.26 0.98809
2.27 0.98840
2.28 0.98870
2.29 0.98899
2.30 0.98928
2.31 0.98956
2.32 0.98983
2.33 0.99010
2.34 0.99036
2.35 0.99061
2.36 0.99086
2.37 0.99111
2.38 0.99134
2.39 0.99158
2.40 0.99180
z F(z)
3.01 0.99869
3.02 0.99874
3.03 0.99878
3.04 0.99882
3.05 0.99886
3.06 0.99889
3.07 0.99893
3.08 0.99896
3.09 0.99900
3.10 0.99903
3.11 0.99906
3.12 0.99910
3.13 0.99913
3.14 0.99916
3.15 0.99918
3.16 0.99921
3.17 0.99924
3.18 0.99926
3.19 0.99929
3.20 0.99931
3.21 0.99934
3.22 0.99936
3.23 0.99938
3.24 0.99940
3.25 0.99942
3.26 0.99944
3.27 0.99946
3.28 0.99948
3.29 0.99950
3.30 0.99952
3.31 0.99953
3.32 0.99955
3.33 0.99957
3.34 0.99958
3.35 0.99960
3.36 0.99961
3.37 0.99962
3.38 0.99964
3.39 0.99965
3.40 0.99966
3.41 0.99968
3.42 0.99969
3.43 0.99970
3.44 0.99971
3.45 0.99972
3.46 0.99973
3.47 0.99974
3.48 0.99975
3.49 0.99976
3.50 0.99977
3.51 0.99978
3.52 0.99978
3.53 0.99979
3.54 0.99980
3.55 0.99981
3.56 0.99981
3.57 0.99982
3.58 0.99983
3.59 0.99983
3.60 0.99984
z F(z)
0.61 0.72907
0.62 0.73237
0.63 0.73565
0.64 0.73891
0.65 0.74215
0.66 0.74537
0.67 0.74857
0.68 0.75175
0.69 0.75490
0.70 0.75804
0.71 0.76115
0.72 0.76424
0.73 0.76730
0.74 0.77035
0.75 0.77337
0.76 0.77637
0.77 0.77935
0.78 0.78230
0.79 0.78524
0.80 0.78814
0.81 0.79103
0.82 0.79389
0.83 0.79673
0.84 0.79955
0.85 0.80234
0.86 0.80511
0.87 0.80785
0.88 0.81057
0.89 0.81327
0.90 0.81594
0.91 0.81859
0.92 0.82121
0.93 0.82381
0.94 0.82639
0.95 0.82894
0.96 0.83147
0.97 0.83398
0.98 0.83646
0.99 0.83891
1.00 0.84134
1.01 0.84375
1.02 0.84614
1.03 0.84849
1.04 0.85083
1.05 0.85314
1.06 0.85543
1.07 0.85769
1.08 0.85993
1.09 0.86214
1.10 0.86433
1.11 0.86650
1.12 0.86864
1.13 0.87076
1.14 0.87286
1.15 0.87493
1.16 0.87698
1.17 0.87900
1.18 0.88100
1.19 0.88298
1.20 0.88493
z F(z)
1.21 0.88686
1.22 0.88877
1.23 0.89065
1.24 0.89251
1.25 0.89435
1.26 0.89617
1.27 0.89796
1.28 0.89973
1.29 0.90147
1.30 0.90320
1.31 0.90490
1.32 0.90658
1.33 0.90824
1.34 0.90988
1.35 0.91149
1.36 0.91308
1.37 0.91466
1.38 0.91621
1.39 0.91774
1.40 0.91924
1.41 0.92073
1.42 0.92220
1.43 0.92364
1.44 0.92507
1.45 0.92647
1.46 0.92785
1.47 0.92922
1.48 0.93056
1.49 0.93189
1.50 0.93319
1.51 0.93448
1.52 0.93574
1.53 0.93699
1.54 0.93822
1.55 0.93943
1.56 0.94062
1.57 0.94179
1.58 0.94295
1.59 0.94408
1.60 0.94520
1.61 0.94630
1.62 0.94738
1.63 0.94845
1.64 0.94950
1.65 0.95053
1.66 0.95154
1.67 0.95254
1.68 0.95352
1.69 0.95449
1.70 0.95543
1.71 0.95637
1.72 0.95728
1.73 0.95818
1.74 0.95907
1.75 0.95994
1.76 0.96080
1.77 0.96164
1.78 0.96246
1.79 0.96327
1.80 0.96407
z F(z)
2.41 0.99202
2.42 0.99224
2.43 0.99245
2.44 0.99266
2.45 0.99286
2.46 0.99305
2.47 0.99324
2.48 0.99343
2.49 0.99361
2.50 0.99379
2.51 0.99396
2.52 0.99413
2.53 0.99430
2.54 0.99446
2.55 0.99461
2.56 0.99477
2.57 0.99492
2.58 0.99506
2.59 0.99520
2.60 0.99534
2.61 0.99547
2.62 0.99560
2.63 0.99573
2.64 0.99585
2.65 0.99598
2.66 0.99609
2.67 0.99621
2.68 0.99632
2.69 0.99643
2.70 0.99653
2.71 0.99664
2.72 0.99674
2.73 0.99683
2.74 0.99693
2.75 0.99702
2.76 0.99711
2.77 0.99720
2.78 0.99728
2.79 0.99736
2.80 0.99744
2.81 0.99752
2.82 0.99760
2.83 0.99767
2.84 0.99774
2.85 0.99781
2.86 0.99788
2.87 0.99795
2.88 0.99801
2.89 0.99807
2.90 0.99813
2.91 0.99819
2.92 0.99825
2.93 0.99831
2.94 0.99836
2.95 0.99841
2.96 0.99846
2.97 0.99851
2.98 0.99856
2.99 0.99861
3.00 0.99865
402
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el área en el extremos inferior.
PROBABILIDAD P
G.L.
0.0005 0.001 0.005 0.01 0.025 0.05 0.10 0.20 0.30 0.40
1 3.93E-07 1.57E-06 3.93E-05 1.57E-04 9.82E-04 3.93E-03 0.016 0.064 0.148 0.275
2 0.001 0.002 0.010 0.020 0.051 0.103 0.211 0.446 0.713 1.02
3 0.015 0.024 0.072 0.115 0.216 0.352 0.584 1.01 1.42 1.87
4 0.064 0.091 0.207 0.297 0.484 0.711 1.06 1.65 2.19 2.75
5 0.158 0.210 0.412 0.554 0.831 1.15 1.61 2.34 3.00 3.66
6 0.299 0.381 0.676 0.872 1.24 1.64 2.20 3.07 3.83 4.57
7 0.485 0.598 0.989 1.24 1.69 2.17 2.83 3.82 4.67 5.49
8 0.710 0.857 1.34 1.65 2.18 2.73 3.49 4.59 5.53 6.42
9 0.972 1.15 1.73 2.09 2.70 3.33 4.17 5.38 6.39 7.36
10 1.26 1.48 2.16 2.56 3.25 3.94 4.87 6.18 7.27 8.30
11 1.59 1.83 2.60 3.05 3.82 4.57 5.58 6.99 8.15 9.24
12 1.93 2.21 3.07 3.57 4.40 5.23 6.30 7.81 9.03 10.2
13 2.31 2.62 3.57 4.11 5.01 5.89 7.04 8.63 9.93 11.1
14 2.70 3.04 4.07 4.66 5.63 6.57 7.79 9.47 10.8 12.1
15 3.11 3.48 4.60 5.23 6.26 7.26 8.55 10.3 11.7 13.0
16 3.54 3.94 5.14 5.81 6.91 7.96 9.31 11.2 12.6 14.0
17 3.98 4.42 5.70 6.41 7.56 8.67 10.1 12.0 13.5 14.9
18 4.44 4.90 6.26 7.01 8.23 9.39 10.9 12.9 14.4 15.9
19 4.91 5.41 6.84 7.63 8.91 10.1 11.7 13.7 15.4 16.9
20 5.40 5.92 7.43 8.26 9.59 10.9 12.4 14.6 16.3 17.8
21 5.90 6.45 8.03 8.90 10.3 11.6 13.2 15.4 17.2 18.8
22 6.40 6.98 8.64 9.54 11.0 12.3 14.0 16.3 18.1 19.7
23 6.92 7.53 9.26 10.2 11.7 13.1 14.8 17.2 19.0 20.7
24 7.45 8.08 9.89 10.9 12.4 13.8 15.7 18.1 19.9 21.7
25 7.99 8.65 10.5 11.5 13.1 14.6 16.5 18.9 20.9 22.6
26 8.54 9.22 11.2 12.2 13.8 15.4 17.3 19.8 21.8 23.6
27 9.09 9.80 11.8 12.9 14.6 16.2 18.1 20.7 22.7 24.5
28 9.66 10.4 12.5 13.6 15.3 16.9 18.9 21.6 23.6 25.5
29 10.2 11.0 13.1 14.3 16.0 17.7 19.8 22.5 24.6 26.5
30 10.8 11.6 13.8 15.0 16.8 18.5 20.6 23.4 25.5 27.4
31 11.4 12.2 14.5 15.7 17.5 19.3 21.4 24.3 26.4 28.4
32 12.0 12.8 15.1 16.4 18.3 20.1 22.3 25.1 27.4 29.4
33 12.6 13.4 15.8 17.1 19.0 20.9 23.1 26.0 28.3 30.3
34 13.2 14.1 16.5 17.8 19.8 21.7 24.0 26.9 29.2 31.3
35 13.8 14.7 17.2 18.5 20.6 22.5 24.8 27.8 30.2 32.3
36 14.4 15.3 17.9 19.2 21.3 23.3 25.6 28.7 31.1 33.3
37 15.0 16.0 18.6 20.0 22.1 24.1 26.5 29.6 32.1 34.2
38 15.6 16.6 19.3 20.7 22.9 24.9 27.3 30.5 33.0 35.2
39 16.3 17.3 20.0 21.4 23.7 25.7 28.2 31.4 33.9 36.2
40 16.9 17.9 20.7 22.2 24.4 26.5 29.1 32.3 34.9 37.1
41 17.5 18.6 21.4 22.9 25.2 27.3 29.9 33.3 35.8 38.1
42 18.2 19.2 22.1 23.7 26.0 28.1 30.8 34.2 36.8 39.1
43 18.8 19.9 22.9 24.4 26.8 29.0 31.6 35.1 37.7 40.0
44 19.5 20.6 23.6 25.1 27.6 29.8 32.5 36.0 38.6 41.0
45 20.1 21.3 24.3 25.9 28.4 30.6 33.4 36.9 39.6 42.0
46 20.8 21.9 25.0 26.7 29.2 31.4 34.2 37.8 40.5 43.0
47 21.5 22.6 25.8 27.4 30.0 32.3 35.1 38.7 41.5 43.9
48 22.1 23.3 26.5 28.2 30.8 33.1 35.9 39.6 42.4 44.9
49 22.8 24.0 27.2 28.9 31.6 33.9 36.8 40.5 43.4 45.9
50 23.5 24.7 28.0 29.7 32.4 34.8 37.7 41.4 44.3 46.9
403
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el área en el extremos inferior.
Probabilidad P
G.L.
0.50 0.60 0.70 0.80 0.90 0.95 0.975 0.99 0.995 0.999 0.9995
1 0.455 0.708 1.07 1.64 2.71 3.84 5.02 6.63 7.88 10.8 12.1
2 1.39 1.83 2.41 3.22 4.61 5.99 7.38 9.21 10.6 13.8 15.2
3 2.37 2.95 3.66 4.64 6.25 7.81 9.35 11.3 12.8 16.3 17.7
4 3.36 4.04 4.88 5.99 7.78 9.49 11.1 13.3 14.9 18.5 20.0
5 4.35 5.13 6.06 7.29 9.24 11.1 12.8 15.1 16.7 20.5 22.1
6 5.35 6.21 7.23 8.56 10.6 12.6 14.4 16.8 18.5 22.5 24.1
7 6.35 7.28 8.38 9.80 12.0 14.1 16.0 18.5 20.3 24.3 26.0
8 7.34 8.35 9.52 11.0 13.4 15.5 17.5 20.1 22.0 26.1 27.9
9 8.34 9.41 10.7 12.2 14.7 16.9 19.0 21.7 23.6 27.9 29.7
10 9.34 10.5 11.8 13.4 16.0 18.3 20.5 23.2 25.2 29.6 31.4
11 10.3 11.5 12.9 14.6 17.3 19.7 21.9 24.7 26.8 31.3 33.1
12 11.3 12.6 14.0 15.8 18.5 21.0 23.3 26.2 28.3 32.9 34.8
13 12.3 13.6 15.1 17.0 19.8 22.4 24.7 27.7 29.8 34.5 36.5
14 13.3 14.7 16.2 18.2 21.1 23.7 26.1 29.1 31.3 36.1 38.1
15 14.3 15.7 17.3 19.3 22.3 25.0 27.5 30.6 32.8 37.7 39.7
16 15.3 16.8 18.4 20.5 23.5 26.3 28.8 32.0 34.3 39.3 41.3
17 16.3 17.8 19.5 21.6 24.8 27.6 30.2 33.4 35.7 40.8 42.9
18 17.3 18.9 20.6 22.8 26.0 28.9 31.5 34.8 37.2 42.3 44.4
19 18.3 19.9 21.7 23.9 27.2 30.1 32.9 36.2 38.6 43.8 46.0
20 19.3 21.0 22.8 25.0 28.4 31.4 34.2 37.6 40.0 45.3 47.5
21 20.3 22.0 23.9 26.2 29.6 32.7 35.5 38.9 41.4 46.8 49.0
22 21.3 23.0 24.9 27.3 30.8 33.9 36.8 40.3 42.8 48.3 50.5
23 22.3 24.1 26.0 28.4 32.0 35.2 38.1 41.6 44.2 49.7 52.0
24 23.3 25.1 27.1 29.6 33.2 36.4 39.4 43.0 45.6 51.2 53.5
25 24.3 26.1 28.2 30.7 34.4 37.7 40.6 44.3 46.9 52.6 54.9
26 25.3 27.2 29.2 31.8 35.6 38.9 41.9 45.6 48.3 54.1 56.4
27 26.3 28.2 30.3 32.9 36.7 40.1 43.2 47.0 49.6 55.5 57.9
28 27.3 29.2 31.4 34.0 37.9 41.3 44.5 48.3 51.0 56.9 59.3
29 28.3 30.3 32.5 35.1 39.1 42.6 45.7 49.6 52.3 58.3 60.7
30 29.3 31.3 33.5 36.3 40.3 43.8 47.0 50.9 53.7 59.7 62.2
31 30.3 32.3 34.6 37.4 41.4 45.0 48.2 52.2 55.0 61.1 63.6
32 31.3 33.4 35.7 38.5 42.6 46.2 49.5 53.5 56.3 62.5 65.0
33 32.3 34.4 36.7 39.6 43.7 47.4 50.7 54.8 57.6 63.9 66.4
34 33.3 35.4 37.8 40.7 44.9 48.6 52.0 56.1 59.0 65.2 67.8
35 34.3 36.5 38.9 41.8 46.1 49.8 53.2 57.3 60.3 66.6 69.2
36 35.3 37.5 39.9 42.9 47.2 51.0 54.4 58.6 61.6 68.0 70.6
37 36.3 38.5 41.0 44.0 48.4 52.2 55.7 59.9 62.9 69.3 72.0
38 37.3 39.6 42.0 45.1 49.5 53.4 56.9 61.2 64.2 70.7 73.4
39 38.3 40.6 43.1 46.2 50.7 54.6 58.1 62.4 65.5 72.1 74.7
40 39.3 41.6 44.2 47.3 51.8 55.8 59.3 63.7 66.8 73.4 76.1
41 40.3 42.7 45.2 48.4 52.9 56.9 60.6 65.0 68.1 74.7 77.5
42 41.3 43.7 46.3 49.5 54.1 58.1 61.8 66.2 69.3 76.1 78.8
43 42.3 44.7 47.3 50.5 55.2 59.3 63.0 67.5 70.6 77.4 80.2
44 43.3 45.7 48.4 51.6 56.4 60.5 64.2 68.7 71.9 78.7 81.5
45 44.3 46.8 49.5 52.7 57.5 61.7 65.4 70.0 73.2 80.1 82.9
46 45.3 47.8 50.5 53.8 58.6 62.8 66.6 71.2 74.4 81.4 84.2
47 46.3 48.8 51.6 54.9 59.8 64.0 67.8 72.4 75.7 82.7 85.6
48 47.3 49.8 52.6 56.0 60.9 65.2 69.0 73.7 77.0 84.0 86.9
49 48.3 50.9 53.7 57.1 62.0 66.3 70.2 74.9 78.2 85.4 88.2
50 49.3 51.9 54.7 58.2 63.2 67.5 71.4 76.2 79.5 86.7 89.6
404
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el área en el extremos inferior.
PROBABILIDAD P
G.L.
0.0005 0.001 0.005 0.01 0.025 0.05 0.10 0.20 0.30 0.40
51 24.1 25.4 28.7 30.5 33.2 35.6 38.6 42.4 45.3 47.8
52 24.8 26.1 29.5 31.2 34.0 36.4 39.4 43.3 46.2 48.8
53 25.5 26.8 30.2 32.0 34.8 37.3 40.3 44.2 47.2 49.8
54 26.2 27.5 31.0 32.8 35.6 38.1 41.2 45.1 48.1 50.8
55 26.9 28.2 31.7 33.6 36.4 39.0 42.1 46.0 49.1 51.7
56 27.6 28.9 32.5 34.3 37.2 39.8 42.9 47.0 50.0 52.7
57 28.2 29.6 33.2 35.1 38.0 40.6 43.8 47.9 51.0 53.7
58 28.9 30.3 34.0 35.9 38.8 41.5 44.7 48.8 51.9 54.7
59 29.6 31.0 34.8 36.7 39.7 42.3 45.6 49.7 52.9 55.6
60 30.3 31.7 35.5 37.5 40.5 43.2 46.5 50.6 53.8 56.6
61 31.0 32.5 36.3 38.3 41.3 44.0 47.3 51.6 54.8 57.6
62 31.7 33.2 37.1 39.1 42.1 44.9 48.2 52.5 55.7 58.6
63 32.5 33.9 37.8 39.9 43.0 45.7 49.1 53.4 56.7 59.6
64 33.2 34.6 38.6 40.6 43.8 46.6 50.0 54.3 57.6 60.5
65 33.9 35.4 39.4 41.4 44.6 47.4 50.9 55.3 58.6 61.5
66 34.6 36.1 40.2 42.2 45.4 48.3 51.8 56.2 59.5 62.5
67 35.3 36.8 40.9 43.0 46.3 49.2 52.7 57.1 60.5 63.5
68 36.0 37.6 41.7 43.8 47.1 50.0 53.5 58.0 61.4 64.4
69 36.7 38.3 42.5 44.6 47.9 50.9 54.4 59.0 62.4 65.4
70 37.5 39.0 43.3 45.4 48.8 51.7 55.3 59.9 63.3 66.4
71 38.2 39.8 44.1 46.2 49.6 52.6 56.2 60.8 64.3 67.4
72 38.9 40.5 44.8 47.1 50.4 53.5 57.1 61.8 65.3 68.4
73 39.6 41.3 45.6 47.9 51.3 54.3 58.0 62.7 66.2 69.3
74 40.4 42.0 46.4 48.7 52.1 55.2 58.9 63.6 67.2 70.3
75 41.1 42.8 47.2 49.5 52.9 56.1 59.8 64.5 68.1 71.3
76 41.8 43.5 48.0 50.3 53.8 56.9 60.7 65.5 69.1 72.3
77 42.6 44.3 48.8 51.1 54.6 57.8 61.6 66.4 70.0 73.2
78 43.3 45.0 49.6 51.9 55.5 58.7 62.5 67.3 71.0 74.2
79 44.1 45.8 50.4 52.7 56.3 59.5 63.4 68.3 72.0 75.2
80 44.8 46.5 51.2 53.5 57.2 60.4 64.3 69.2 72.9 76.2
81 45.5 47.3 52.0 54.4 58.0 61.3 65.2 70.1 73.9 77.2
82 46.3 48.0 52.8 55.2 58.8 62.1 66.1 71.1 74.8 78.1
83 47.0 48.8 53.6 56.0 59.7 63.0 67.0 72.0 75.8 79.1
84 47.8 49.6 54.4 56.8 60.5 63.9 67.9 72.9 76.8 80.1
85 48.5 50.3 55.2 57.6 61.4 64.7 68.8 73.9 77.7 81.1
86 49.3 51.1 56.0 58.5 62.2 65.6 69.7 74.8 78.7 82.1
87 50.0 51.9 56.8 59.3 63.1 66.5 70.6 75.7 79.6 83.0
88 50.8 52.6 57.6 60.1 63.9 67.4 71.5 76.7 80.6 84.0
89 51.5 53.4 58.4 60.9 64.8 68.2 72.4 77.6 81.6 85.0
90 52.3 54.2 59.2 61.8 65.6 69.1 73.3 78.6 82.5 86.0
91 53.0 54.9 60.0 62.6 66.5 70.0 74.2 79.5 83.5 87.0
92 53.8 55.7 60.8 63.4 67.4 70.9 75.1 80.4 84.4 88.0
93 54.5 56.5 61.6 64.2 68.2 71.8 76.0 81.4 85.4 88.9
94 55.3 57.2 62.4 65.1 69.1 72.6 76.9 82.3 86.4 89.9
95 56.1 58.0 63.2 65.9 69.9 73.5 77.8 83.2 87.3 90.9
96 56.8 58.8 64.1 66.7 70.8 74.4 78.7 84.2 88.3 91.9
97 57.6 59.6 64.9 67.6 71.6 75.3 79.6 85.1 89.2 92.9
98 58.4 60.4 65.7 68.4 72.5 76.2 80.5 86.1 90.2 93.8
99 59.1 61.1 66.5 69.2 73.4 77.0 81.4 87.0 91.2 94.8
100 59.9 61.9 67.3 70.1 74.2 77.9 82.4 87.9 92.1 95.8
405
TABLA 2.
DISTRIBUCIÓN ACUMULATIVA CHI-CUADRADO
Los valores en la tabla son de Chi-cuadrado, siendo la probabilidad p el área en el extremos inferior.
Probabilidad P
G.L.
0.50 0.60 0.70 0.80 0.90 0.95 0.975 0.99 0.995 0.999 0.9995
51 50.3 52.9 55.8 59.2 64.3 68.7 72.6 77.4 80.7 88.0 90.9
52 51.3 53.9 56.8 60.3 65.4 69.8 73.8 78.6 82.0 89.3 92.2
53 52.3 55.0 57.9 61.4 66.5 71.0 75.0 79.8 83.3 90.6 93.5
54 53.3 56.0 58.9 62.5 67.7 72.2 76.2 81.1 84.5 91.9 94.8
55 54.3 57.0 60.0 63.6 68.8 73.3 77.4 82.3 85.7 93.2 96.2
56 55.3 58.0 61.0 64.7 69.9 74.5 78.6 83.5 87.0 94.5 97.5
57 56.3 59.1 62.1 65.7 71.0 75.6 79.8 84.7 88.2 95.8 98.8
58 57.3 60.1 63.1 66.8 72.2 76.8 80.9 86.0 89.5 97.0 100.1
59 58.3 61.1 64.2 67.9 73.3 77.9 82.1 87.2 90.7 98.3 101.4
60 59.3 62.1 65.2 69.0 74.4 79.1 83.3 88.4 92.0 99.6 102.7
61 60.3 63.2 66.3 70.0 75.5 80.2 84.5 89.6 93.2 100.9 104.0
62 61.3 64.2 67.3 71.1 76.6 81.4 85.7 90.8 94.4 102.2 105.3
63 62.3 65.2 68.4 72.2 77.7 82.5 86.8 92.0 95.6 103.4 106.6
64 63.3 66.2 69.4 73.3 78.9 83.7 88.0 93.2 96.9 104.7 107.9
65 64.3 67.2 70.5 74.4 80.0 84.8 89.2 94.4 98.1 106.0 109.2
66 65.3 68.3 71.5 75.4 81.1 86.0 90.3 95.6 99.3 107.3 110.5
67 66.3 69.3 72.6 76.5 82.2 87.1 91.5 96.8 100.6 108.5 111.7
68 67.3 70.3 73.6 77.6 83.3 88.3 92.7 98.0 101.8 109.8 113.0
69 68.3 71.3 74.6 78.6 84.4 89.4 93.9 99.2 103.0 111.1 114.3
70 69.3 72.4 75.7 79.7 85.5 90.5 95.0 100.4 104.2 112.3 115.6
71 70.3 73.4 76.7 80.8 86.6 91.7 96.2 101.6 105.4 113.6 116.9
72 71.3 74.4 77.8 81.9 87.7 92.8 97.4 102.8 106.6 114.8 118.1
73 72.3 75.4 78.8 82.9 88.8 93.9 98.5 104.0 107.9 116.1 119.4
74 73.3 76.4 79.9 84.0 90.0 95.1 99.7 105.2 109.1 117.3 120.7
75 74.3 77.5 80.9 85.1 91.1 96.2 100.8 106.4 110.3 118.6 121.9
76 75.3 78.5 82.0 86.1 92.2 97.4 102.0 107.6 111.5 119.9 123.2
77 76.3 79.5 83.0 87.2 93.3 98.5 103.2 108.8 112.7 121.1 124.5
78 77.3 80.5 84.0 88.3 94.4 99.6 104.3 110.0 113.9 122.3 125.7
79 78.3 81.5 85.1 89.3 95.5 100.7 105.5 111.1 115.1 123.6 127.0
80 79.3 82.6 86.1 90.4 96.6 101.9 106.6 112.3 116.3 124.8 128.3
81 80.3 83.6 87.2 91.5 97.7 103.0 107.8 113.5 117.5 126.1 129.5
82 81.3 84.6 88.2 92.5 98.8 104.1 108.9 114.7 118.7 127.3 130.8
83 82.3 85.6 89.2 93.6 99.9 105.3 110.1 115.9 119.9 128.6 132.0
84 83.3 86.6 90.3 94.7 101.0 106.4 111.2 117.1 121.1 129.8 133.3
85 84.3 87.7 91.3 95.7 102.1 107.5 112.4 118.2 122.3 131.0 134.5
86 85.3 88.7 92.4 96.8 103.2 108.6 113.5 119.4 123.5 132.3 135.8
87 86.3 89.7 93.4 97.9 104.3 109.8 114.7 120.6 124.7 133.5 137.0
88 87.3 90.7 94.4 98.9 105.4 110.9 115.8 121.8 125.9 134.7 138.3
89 88.3 91.7 95.5 100.0 106.5 112.0 117.0 122.9 127.1 136.0 139.5
90 89.3 92.8 96.5 101.1 107.6 113.1 118.1 124.1 128.3 137.2 140.8
91 90.3 93.8 97.6 102.1 108.7 114.3 119.3 125.3 129.5 138.4 142.0
92 91.3 94.8 98.6 103.2 109.8 115.4 120.4 126.5 130.7 139.7 143.3
93 92.3 95.8 99.6 104.2 110.9 116.5 121.6 127.6 131.9 140.9 144.5
94 93.3 96.8 100.7 105.3 111.9 117.6 122.7 128.8 133.1 142.1 145.8
95 94.3 97.9 101.7 106.4 113.0 118.8 123.9 130.0 134.2 143.3 147.0
96 95.3 98.9 102.8 107.4 114.1 119.9 125.0 131.1 135.4 144.6 148.2
97 96.3 99.9 103.8 108.5 115.2 121.0 126.1 132.3 136.6 145.8 149.5
98 97.3 100.9 104.8 109.5 116.3 122.1 127.3 133.5 137.8 147.0 150.7
99 98.3 101.9 105.9 110.6 117.4 123.2 128.4 134.6 139.0 148.2 151.9
100 99.3 102.9 106.9 111.7 118.5 124.3 129.6 135.8 140.2 149.4 153.2
406
TABLA 3.
DISTRIBUCIÓN ACUMULATIVA T DE STUDENT
Los valores en la tabla son valores t, siendo la probabilidad p el área acumulada en el extremos inferior.
PROBABILIDAD P
0.75 0.80 0.85 0.90 0.95 0.975 0.990 0.995 0.9995
1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.599
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841 12.924
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604 8.610
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707 5.959
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499 5.408
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355 5.041
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781
10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169 4.587
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106 4.437
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055 4.318
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073
16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921 4.015
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898 3.965
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878 3.922
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861 3.883
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.768
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646
31 0.682 0.853 1.054 1.309 1.696 2.040 2.453 2.744 3.633
32 0.682 0.853 1.054 1.309 1.694 2.037 2.449 2.738 3.622
33 0.682 0.853 1.053 1.308 1.692 2.035 2.445 2.733 3.611
34 0.682 0.852 1.052 1.307 1.691 2.032 2.441 2.728 3.601
35 0.682 0.852 1.052 1.306 1.690 2.030 2.438 2.724 3.591
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704 3.551
45 0.680 0.850 1.049 1.301 1.679 2.014 2.412 2.690 3.520
50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 3.496
55 0.679 0.848 1.046 1.297 1.673 2.004 2.396 2.668 3.476
60 0.679 0.848 1.045 1.296 1.671 2.000 2.390 2.660 3.460
70 0.678 0.847 1.044 1.294 1.667 1.994 2.381 2.648 3.435
80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 3.416
90 0.677 0.846 1.042 1.291 1.662 1.987 2.368 2.632 3.402
100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 3.390
200 0.676 0.843 1.039 1.286 1.653 1.972 2.345 2.601 3.340
300 0.675 0.843 1.038 1.284 1.650 1.968 2.339 2.592 3.323
400 0.675 0.843 1.038 1.284 1.649 1.966 2.336 2.588 3.315
500 0.675 0.842 1.038 1.283 1.648 1.965 2.334 2.586 3.310
1000 0.675 0.842 1.037 1.282 1.646 1.962 2.330 2.581 3.300
5000 0.675 0.842 1.037 1.282 40745 1.960 2.327 2.577 3.292
6 - 0 19 3 4
7 - 0 20 3 5
8 0 0 21 4 5
9 0 1 22 4 5
10 0 1 23 4 6
11 0 1 24 5 6
12 1 2 25 5 7
13 1 2
La hipótesis nula se rec
íaza si S es menor o igual al valor de la tabla.
409