CORREGIDO

UNIVERSIDAD NACIONAL DE PIURA
FACULTAD DE AGRONOMIA
ESCUELA DE AGRONOMIA
TEMA: INTERVALOS DE CONFIANZA Y PRUEBA DE
HIPÓTESIS PARA MEDIA Y PROPORCIONES.
CURSO: ESTADÍSTICA GENERAL
DOCENTE: LIC. JUAN PANTA IPANAQUÉ
INTEGRANTES:
- GAMARRA NÚÑEZ KEVIN BILL
- RUESTA LÓPEZ MADAI
-ZURITA CHINGUEL LESLY GIANELA
SEMESTRE:
II- 2019
FECHA:
06-01-2020
PIURA-PERÚ
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 2
ÍNDICE
INTRODUCCIÓN....................................................................................................3 4
CAPITULO I: INTERVALOS DE CONFIANZA....................................................4 5
1.1.. Intervalo de confianza para la media : ...........................................................4 5
1.1.1. Intervalo 2 Intervalo de confianza para la media : Varianza 2 2
supuestamente conocida.....................................................................................…7 8
1.1.2 Intervalo de confianza para la media : Varianza 2 desconocida……..9 9
1.1.3 Determinación del tamaño de muestra necesario para estimar la media.......9 0
1.2. Intervalo de confianza para la diferencia entre dos medias..............................11 2
1.2.1. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y y
y  12 conocidas....................................................................................................11 2
1.2.2. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y y
 12 desconocidas..................................................................................................12 3
1.3. Intervalo de confianza para una proporción.....................................................16 7
1.4. Intervalo de confianza para la diferencia entre dos proporciones....................19 1
CAPITULO II: HIPÓTESIS ESTADÍSTICAS.......................................................22 3
2.1Concepto.............................................................................................................22 4
2.2. Hipótesis nula y alternativa..............................................................................22 4
2.3. Prueba de una hipótesis estadística..................................................................23 5
2.3.1. Tipos de prueba de hipótesis......................................................................23 5
2.4. Errores tipo I y tipo II......................................................................................24 6
2.5. Procedimiento de la prueba de hipótesis.........................................................25 7
2.6. Prueba de hipótesis acerca de una media..........................................................26 8
2.6.1. Prueba de hipótesis acerca de una media, con varianza σ2 conocida.........26 8
2.6.2. Prueba de hipótesis acerca de una media, con varianza σ2 desconocida....34 6
2.7. Prueba de hipótesis acerca de dos medias........................................................38 1
2.7.1. Prueba de hipótesis acerca de dos medias con varianzas σ 12 y σ 22 σ 22
σ 22 supuestamente conocidas........................................................................38 1
2.7.2. Prueba de hipótesis acerca de dos medias con Varianzas  12 y σ 22 σ 22 σ 22
supuestamente desconocidas................................................................................42 6
2.8. Prueba de hipótesis acerca de una proporción..................................................51 5
2.8.1. Prueba bilateral...........................................................................................52 6
2.8.2. Prueba unilateral de cola a la derecha........................................................53 7
2.8.3. Prueba unilateral de cola a la izquierda......................................................53 7
2.9. Prueba de hipótesis sobre dos proporciones.....................................................55 9
CONCLUSIONES...................................................................................................63 5
BIBLIOGRAFIA……………………………………………………….………….64
INTRODUCCIÓN
La estadística inferencial es el proceso de uso de los resultados derivados de las
muestras para obtener conclusiones acerca de las características de una población. La
estadística inferencial nos permite estimar características desconocidas como la
media de la población o la proporción de la población. Existen dos tipos de
estimaciones usadas para estimar los parámetros de la población: la estimación
puntual y la estimación de intervalo. Una estimación puntual es el valor de un solo
estadístico de muestra. Una estimación del intervalo de confianza es un rango de
números, llamado intervalo, construido alrededor de la estimación puntual. El
intervalo de confianza se construye de manera que la probabilidad del parámetro de
la población se localice en algún lugar dentro del intervalo conocido
El objetivo del presente trabajo es dar algunos métodos que se usan para
tomar decisiones sobre poblaciones, a partir de los resultados de una muestra
aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se
debe partir de afirmaciones o conjeturas con respecto a la población en el que
estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura
hecha sobre una población o sobre sus parámetros deberá ser sometida a
comprobación experimental con el propósito de saber si los resultados de una
muestra aleatoria extraída de esa población, contradicen o no tal conjetura.

CAPÍTULO I: INTERVALOS DE CONFIANZA
1.1. Intervalo de confianza para la media poblacional.
1.1.1 Intervalo de confianza para la media: Varianza  2 supuestamente

conocida.
Se utiliza la distribución muestral de la media X para determinar el intervalo de
confianza del parámetro.
Si la población es normal N (μ, σ 2 ) , entonces, la distribución del estadístico X es
normal N (μ, σ 2 /n) para cualquier valor de n (n  2).
Si la población no es normal, pero tiene media  y varianza 2 finitas, entonces,
siempre que el tamaño n de la muestra sea suficientemente grande (n  30), por el
teorema del límite central, la distribución de X es aproximadamente normal
N (μ, σ 2 /n) .
Por tanto, según sea el caso, la distribución de la variable aleatoria:
X 
Z
/ n
es exactamente (o aproximadamente) normal N(0,1).
Por tanto, el intervalo de confianza del (1- ) x 100% para  es dado por:
σ σ
X  Z α/2  μ  X  Z α/2
n n
El valor de Z  / 2 se busca en la tabla normal N (0,1), tal que P( Z  Z  / 2 )   / 2 .

 
En la figura 5.1, tenemos que los valores a  X  Z 1 / 2 y b  X  Z 1 / 2 son
n n
los límites de confianza de, inferior y superior, respectivamente.
- z1-/2 0 z1-/2
a X b X
intervalo de 
Figura 4.1. Intervalo de estimación para .
Observación 1. Cuando la población es finita de tamaño N y el tamaño de la muestra
constituye más del 5% del tamaño de la población, se debe usar el factor de
corrección de población finita para modificar la desviación estándar. Así, el intervalo
de confianza del (1- ) x 100% para  es dado por:
σ Nn σ Nn
X - Z α/2 ·  μ  X  Z α/2 ·
n N 1 n N 1
Ejemplo 4.1. Una muestra aleatoria de 100 hogares de una ciudad indica que el
promedio de los ingresos mensuales es de $ 500. Encuentre un intervalo de confianza

del 95% para la media poblacional de los ingresos de todos los hogares de esa
ciudad. Suponga que  = $100.
Solución.
Sea X el ingreso familiar mensual de esa ciudad cuyo promedio  se quiere estimar a
partir de una muestra aleatoria de tamaño n =100. La estimación puntual de es
X  500 . Para el nivel de confianza 1-=0.95, en la tabla normal estándar se
encuentra: z1 / 2  z 0.975  1.96 .
 100
Entonces X  z 0.975  500 (1.96)   500 10
n 100
Luego, el intervalo de confianza del 95% para  es: [480.4, 519.6]
Esto es, se tiene una confianza del 95% que el promedio del ingreso familiar  de esa
ciudad, está en el intervalo [$480.4, $519.6].
Ejercicio. Un analista de investigación de mercados escoge una muestra aleatoria de
100 clientes de un conjunto de 500 clientes de un gran centro comercial que
declararan ingresos mayores a 1,500 soles. El encuentra que los clientes de la
muestra gastaron en la tienda un promedio de S/. 2500.
Estimar el gasto promedio de la población finita al nivel de confianza del 95% .
Suponga que la desviación estándar de la población es  = S/.300.

1.1.2. Intervalo de confianza para la media: Varianza 2 desconocida.
A) Población no normal
Si la población no es normal pero el tamaño de la muestra es suficientemente grande
(n  30), se utiliza la desviación estándar S de la muestra, como estimación puntual
de la desviación estándar  de la población. Entonces, el intervalo de confianza del
(1- ) x 100% para  es aproximadamente:
S S
X  Z α/2 ·  μ  X  Z α/2 ·
n n
constituye más del 5% del tamaño de la población, el intervalo de confianza del
(1- ) x 100% para la media  de una población con varianza desconocida y muestra
grande es:
S Nn S Nn
X  Z α/2 ·  μ  X  Z α/2 ·
n N 1 n N 1
B) Población normal
Si X y S son la media y la desviación estándar respectivamente de una muestra
aleatoria de tamaño n (n <30) escogida de una población normal con varianza 2
desconocida, entonces, el intervalo de confianza del (1- ) x 100 para  es:
S S
X  t α/2, n 1 ·  μ  X  t α/2, n 1 ·
n n
constituye más del 5% del tamaño de la población, el intervalo de confianza del (1-
)x100% para  de una población normal con varianza desconocida y muestra
pequeña es:
S Nn S Nn
X  t α/2, n 1 ·  μ  X  t α/2, n 1 ·
n N 1 n N 1
Ejemplo 4.2. El peso neto de las latas de café instantáneo de un producto, debe tener
un peso neto de 280 gramos. Un inspector de la oficina de defensa al consumidor
tomo una muestra aleatoria de 5 latas de café obteniendo los siguientes pesos netos
en gramos:
280, 290, 285, 275, 284
a) Indicar si es razonable que el inspector, usando un intervalo de confianza del
95% ordene que se multe al productor.
b) ¿Con que grado de confianza se estima que el contenido promedio de café tenga
los límites de confianza 277.432 y 288.168?
Suponga una distribución normal de los pesos netos.
Solución.
a) Sea X el peso de los contenidos de café por lata, cuyo promedio  se quiere
estimar a partir de una muestra aleatoria de tamaño n = 5. Se supone que la
distribución de X es normal con desviación estándar  no conocida.
Para 1 -  = 0.95 y n -1 = 4 grados de libertad en la tabla t- Student se encuentra
t / 2, n 1 = t 0.025, 4  2.776 .
De la muestra se obtiene X  282.8 y S  5.63
Luego tenemos:
S
X t α/2, n 1 ·  282.8 2.776  5.63/ 5  282.8 6.99
n
Luego, el intervalo de confianza del 95% para  es: [275.81, 289.79]
Como el intervalo cubre al valor de 280 gramos, entonces es posible que el inspector
no multe al productor.
b)
  [277.432, 288.168] con confianza 1- . El límite superior es:
X  t α/2, n 1 ·S/ n  282.8  t α/2, n 1  5.63/ 5  288.168
de donde resulta: t / 2, 4  2.132 ,  / 2  0.05 ,   0.10 y 1    0.90 .
1.1.3. Determinación del tamaño de muestra necesario para estimar la media.
Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera
que si  se estima por X , el error de estimación no sea mayor que un valor dado e.
Entonces, si X estima a , entonces, se tiene una confianza del (1- ) x 100% de
que el error no será mayor que el valor dado e cuando el tamaño de la muestra sea
2
 Z ·σ 
n   α/2 
 e 
Si la población es finita de tamaño N y el muestreo es sin sustitución, error estándar
de  X  ( / n ) ( N  n) /( N  1) y el valor de n se calcula por:
z2 / 2 2 N
n
z2 / 2 2  e 2 ( N  1)
Ejemplo 4.3. Se desea realizar una encuesta en un gran sector de un área
metropolitana para determinar el ingreso familiar promedio de los 30 000 hogares de
ese sector. Se desea que el valor del estimador de la media se encuentre a S/.30.00 de
la media verdadera con un nivel de confiabilidad de 99%. Se va utilizar una
desviación estándar muestral igual a S/.200.00 que se obtuvo en una encuesta
anterior como estimador de la desviación estándar de la población. ¿Qué tamaño
debe tener la muestra que se necesita?
Solución. Tenemos
e = 30,  =200, N = 30000, 1-  = 0.99 y Z 0.995  2.58
Si sustituimos estos valores en la formula para n, se tiene:
z2 / 2 2 N ( 2.58) 2 ·(200) 2 (30000)

n   292.96  293
z2 / 2 2  e 2 ( N  1) (2.58) 2 (200) 2  (30) 2 (29999)
Por tanto, se necesitará una muestra de tamaño n = 293 hogares.

1.2. Intervalo de confianza para la diferencia entre dos medias.
1.2.1. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y

 12 conocidas.
Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de

tamaños n1 y n2 escogidas respectivamente de dos poblaciones con varianzas  12 y  12
conocidas, entonces, el intervalo de confianza del (1- ) x 100% de 1   2 es:
(X 1  X 2 )  Z α/2 σ12 /n 1  σ 22 /n 2  μ 1  μ 2  (X1  X 2 )  Z α/2 σ 12 /n 1  σ 22 /n 2
Ejemplo 4.4. Un agente de compras de una compañía está tratando de decidir si
compra la marca A o la marca B de cierto tipo de focos ahorradores de energía. Para
estimar la diferencia entre las dos marcas se lleva a cabo un experimento con dos
muestras aleatorias independientes de 10 focos de cada marca resultando las medias
de vida útil respectivas de 1,230 horas y 1,190 horas. Estimar la verdadera diferencia
de las dos medias de vida útil, mediante un intervalo de confianza del 95%. ¿Es
acertada la decisión del agente si adquiere cualquiera de las dos marcas?-
Suponga que las dos poblaciones tienen distribución normal con desviaciones
estándares de 120 y 60 horas.
Solución.
La estimación puntual de 1   2 es la diferencia de las medias muestrales:
X 1  X 2 = 1230 - 1190 = 40
 12  22 (120) 2 (60) 2
El error estándar de X 1  X 2 es:  X  X      42.43
1 2
n1 n2 10 10
Para 1 -  = 0.95 se encuentra que Z  / 2  Z 0.025  1.96
Los límites de confianza inferior y superior respectivamente de 1   2 son:
( X 1  X 2 ) Z  / 2  12 / n1   22 / n2  40 1.96( 42.43)  40 83.1628
Luego, el intervalo de confianza aproximado del 95% para 1   2 es:
 43.16  1   2  123.16
Dado que el valor 0  [-43.16, 123.16], se concluye que 1   2 y que no hay
diferencias significativas entre las medias de las vidas útiles de los focos de las
marcas A y B. Por tanto, el agente de compras puede adquirir cualquiera de las dos
marcas.
1.2.2. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y

 12 desconocidas.
A) Poblaciones no normales.
Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes
de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones cuyas
distribuciones son no normales con varianzas  12 y  12 desconocidas, entonces,
siempre que los tamaños de las muestras sean (n1  30 y n2  30), los parámetros 1 y
2 se estiman puntualmente por S1 y S2. El intervalo de confianza del (1- ) x 100%
de 1   2 es entonces:
( X 1  X 2 )  Z  / 2 S12 / n1  S 22 / n2  1   2  ( X 1  X 2 )  Z  / 2 S12 / n1  S 22 / n 2
B) Poblaciones normales.
B1) Varianzas supuestas iguales:  12   22   2
Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaños n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas  12 y  12
desconocidas e iguales, entonces, el intervalo de confianza del (1- ) x 100% de 1   2 es:
(X1  X 2 )  t α/2,n1  n 2  2 ·Sc 1/n 1  1/n 2  μ 1  μ 2  (X1  X 2 )  t α/2,n1  n 2 2 ·Sc 1/n 1  1/n 2
El valor de t / 2 , n1  n2  2 , se encuentra en la tabla t - student con n1 + n2 - 2 grados de
libertad, tal que P (T  t / 2, n1 n2  2 )   / 2 .
2
El estimador de la varianza común, S c , es definida por:
(n1  1) S12  (n2  1) S 22

S c2 
n1  n 2  2
B2) Varianzas supuestas distintas:  12   22
Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaños n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas  12 y  22
desconocidas pero distintas, entonces, el intervalo de confianza del (1- ) x 100% de 1   2 es:
El valor de t1 / 2, g , se encuentra en la tabla t-student con g grados de libertad,
( X 1  X 2 )  t α/2,g · S12 /n 1  S 22 /n 2  μ 1  μ 2  (X 1  X 2 )  t α/2,g · S12 /n 1  S 22 /n 2
siendo,
2
 S12 S 22 
  
g  n1 n2  2
2 2
 S12   S 22 
   
 n1    n2 
n1  1 n2  1
Ejemplo 4.5. Una compañía está tratando de decidir cuál de los dos tipos de
neumáticos A y B va a comprar. Como prueba, compra 8 neumáticos de cada marca y
las pone a trabajar regularmente. El registro de duración de cada tipo de neumático,
proporciona las estadísticas siguientes:
Marca A: X 1  250 km S1 = 40 km
Marca B X 2  280 km S2 = 30 km
Suponga que los tiempos de duración de cada tipo de neumático se distribuyen
normalmente con la misma varianza. Basándose en la construcción de un intervalo de
confianza del 95%, ¿Podría Ud. inferir respecto de cuál marca de neumáticos
preferiría comprar la compañía?.-
Solución. Se supone que las poblaciones de los tiempos de duración son normales
con varianzas desconocidas supuestamente iguales.
De los resultados muestrales, tenemos:
n1= 8 X 1  250 km S1 = 40 km
n2 = 8 X 2  280 km S2 = 30 km
(n1  1) S12  ( n2  1) S 22 7·(40) 2  7·(30) 2

Sc    35.3553
n1  n2  2 882
Para 1 -  = 0.95 y 14 grados de libertad, se halla: t 0.025, 14  2.145
Los límites de confianza inferior y superior respectivamente de 1   2 son:
( X 1  X 2 ) t 0.025,14 ·S c 1 / n1  1 / n 2  30 (2.145)(35.3553) 1 / 8  1 / 8  30 37.9186
Luego, el intervalo de confianza aproximado del 95% para 1   2 es:
 67.92  1   2  7.92
Dado que el valor de cero  [-67.92, 7.92], se concluye que 1   2 y que no hay
diferencias significativas entre las medias de los tiempos de duración de las dos
marcas de neumáticos. Por tanto, la compañía puede comprar cualquiera de las dos
marcas de neumáticos.
Ejercicio. Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y
mujeres para realizar determinada tarea. Las experiencias anteriores indican que la
distribución de tiempos tanto para hombres como para mujeres es normal con
varianzas diferentes. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los
siguientes tiempos en minutos:
Hombres: 12, 28, 10, 25, 24, 19, 22, 23, 17
Mujeres: 16, 20, 16, 20, 16, 17, 15, 21

Mediante un intervalo de confianza del 95% para la verdadera diferencia de los
promedios de hombres y mujeres, ¿se puede concluir que los hombres emplean
mayor tiempo que las mujeres para hacer la tarea.
1.3. Intervalo de confianza para una proporción.
Si p̂ es la proporción de éxitos en una muestra aleatoria de tamaño n, entonces, el
intervalo de confianza del (1- ) x 100% para p es:
pˆ (1  pˆ ) pˆ (1  pˆ )
pˆ  Z 1 / 2  p  pˆ  Z 1 / 2
n n
El valor de Z 1 / 2 se halla en la tabla normal N(0,1), de manera que
P ( Z  z1 / 2 )  1   / 2 .
Ejemplo 4.6. Una encuestadora utiliza una muestra aleatoria de 600 electores que
acaban de votar y encontró que 240 votaron a favor del candidato A.
a) Estimar el porcentaje de electores a favor de A en toda la población, utilizando un
intervalo de confianza del 95%.
b) Si con la misma muestra la proporción a favor de B se estima en 38% con una
confianza del 98% que el error no es mayor a 4.62%, ¿Se puede proclamar a A
como ganador?.
Solución.
a) La estimación puntual de la proporción p a favor de A en la población, es la
proporción a su favor en la muestra de n = 600 electores, es decir,
ˆ  240 / 600  0.40

p
Para 1 -  = 0.95 se tiene Z 0.975  1.96

Los límites de confianza inferior y superior de p son respectivamente:
pˆ (1  pˆ ) (0.4)(0.6)
pˆ Z 1 / 2  0.40 (1.96)  0.4 0.0392
n 600
Luego, el intervalo de confianza aproximado del 95% para p es:
0.3608  p  0.4392
Es decir, p 36.08%, 43.92% con confianza del 95%.
b) En este caso el error máximo de estimación de p es:
pˆ (1  pˆ )
e  Z 1 / 2  0.0462
n
Entonces,
El intervalo de confianza del 98% a favor de A es 35.34%, 44.66%
El intervalo de confianza del 98% a favor de B es 33.38%, 42.62%
Dado que la intersección de los intervalos no es vació, no se puede proclamar a A
como ganador. En este caso se dice que hay un empate técnico.
Observación 1. Si se utiliza el valor previo de p̂ de una muestra preliminar o
piloto, el error máximo de estimación de p es:
pˆ (1  pˆ )
e  Z 1 / 2
n
Entonces dado el error máximo e de la estimación de p con confianza de (1- ) x
100%, el tamaño n de la muestra resulta:

( Z 1 / 2 ) 2 pˆ (1  pˆ )
n
e2
Ejemplo 4.7. Antes de una lección presidencial, un determinado partido político está
interesado en estimar la proporción de electores favorables a su candidato. Una
muestra piloto de 100 electores reveló que 60% de los electores eran favorables al
candidato en cuestión.
a) Determine el tamaño de muestra necesario para que el error cometido en la
estimación, sea a lo más 0.01 con probabilidad de 0.90
b) Si, en la muestra final (con tamaño igual al obtenido en (a), se observó que
55% de los electores eran favorables al candidato en cuestión, construya un
intervalo de confianza para la proporción p.
Solución.
a) El estimador puntual de p es ˆ  0.60 .

p
Para 1- = 0.90 se tiene Z 1 / 2  Z  0.95  1.645 . Luego, se tiene una confianza de
90% que el error al estimar p no será mayor que 0.01 si el tamaño de la muestra es,
(1.645) 2 (0.6)(0.4)
n  1623.615  1624 electores
(0.02) 2
b) Respuesta [0.55447, 0.56553]

Observación 2. Si el muestreo es sin reemplazo en una población finita de tamaño
N, entonces el valor del tamaño de la muestra n se calcula por:
( Z 1 / 2 ) 2 pˆ (1  pˆ )·N
n
( Z 1 / 2 ) 2 pˆ (1  pˆ )  e 2 ( N  1)
Si se desconoce p̂ , se puede utilizar el valor de ˆ  0. 5 .

p
Ejemplo 4.8. Una empresa va a hacer un estudio de mercado antes de lanzar un
nuevo producto hacia una población de 30,000 consumidores.
¿Qué tamaño de muestra deberá escoger si quiere tener una confianza del 95% de
que el error de la estimación de la proporción a favor del producto no sea superior al
4%?
Solución.
Para 1- = 0.95 resulta Z 1 / 2  Z  0.975  1.96 .
Utilizando el valor pˆ (1  pˆ )  1 / 4 y N = 30 000 se tiene:
( Z1 / 2 ) 2 pˆ (1  pˆ )·N (1.96) 2 (0.25)·(30000)

n   588.49  589
( Z1 / 2 ) 2 pˆ (1  pˆ )  e 2 ( N  1) (1.96) 2 (0.25)  (0.04) 2 (30000  1)
1.4. Intervalo de confianza para la diferencia entre dos proporciones.
Si p̂1 y p̂ 2 son las proporciones de éxitos en dos muestras aleatorias
independientes de tamaños n1 y n2 respectivamente, entonces, el intervalo de
confianza del (1- ) x 100% de p1  p 2 es

pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 ) pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 )
( pˆ 1  pˆ 2 )  Z 1 / 2   p1  p 2  ( pˆ 1  pˆ 2 )  Z1 / 2 
n1 n2 n1 n2
El valor de Z 1 / 2 se halla en la tabla normal N(0,1), de manera que
P ( Z  z1 / 2 )  1   / 2 .
Ejemplo 4.9. Un fabricante afirma que su nuevo producto de consumo popular
prefieren más los hombres que las mujeres. Para comprobar tal afirmación, se toma
una muestra aleatoria de 250 hombres y otra de 200 mujeres, y se encuentra que 175
hombres y 120 mujeres prefieren el nuevo producto. Utilizando un intervalo de
confianza del 95% para la verdadera diferencia de proporciones de preferencias entre
los hombres y mujeres, ¿se puede concluir que el fabricante del nuevo producto tiene
la razón?
Solución.
175 120
De los datos del problema se obtiene: pˆ 1   0.7 pˆ 2   0.6
250 200
La estimación puntual del parámetro p1  p 2 , es la diferencia de proporciones
muestrales: pˆ 1  pˆ 2  0.1
El error estándar de la diferencia de proporciones, pˆ 1  pˆ 2 es:
pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 ) (0.7)(0.3) (0.6)(0.4)
ˆ pˆ1  pˆ 2      0.045
n1 n2 250 200
Para 1- = 0.95, se tiene Z 1 / 2  Z  0.975  1.96 .

Luego,
pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 )
( pˆ 1  pˆ 2 ) Z 1 / 2   0.1 (1.96)(0.045)  0.1 0.0882
n1 n2
En consecuencia, el intervalo de confianza del 95% para p1  p 2 es
0.0118  p1  p 2  0.1882
Dado que el intervalo no contiene al valor cero, debemos concluir que las
proporciones de preferencias en la población son diferentes, esto es, p1  p 2 y dado
que el intervalo contiene valores positivos, hay razones para concluir que p1  p 2 , es
decir que su nuevo producto de consumo popular prefieren más los hombres que las
mujeres.
CAPITULO II: HIPÓTESIS ESTADÍSTICAS.
2.1. Concepto
Se denomina hipótesis estadística a cualquier afirmación o conjetura que se hace
acerca de la distribución de una o más poblaciones. La afirmación puede referirse
bien a la forma o tipo de distribución de probabilidad de la población o bien referirse
al valor o valores de uno o más parámetros de la distribución conocida su forma. En
las aplicaciones, se supone conocida la forma de la distribución de la población. En
este caso, las hipótesis estadísticas consisten en suponer que los parámetros, que
definen a la población, toman determinados valores numéricos.
Son hipótesis estadísticas, por ejemplo:
1. El ingreso promedio familiar mensual en la ciudad de Piura es no menos de 1300
nuevos soles.
2. La proporción de plantas industriales de cierta región que cumplen con los
estándares de contaminación ambiental es de 0.6.
3. La varianza de la longitud de cierto tipo de objetos es 0.25 cm2.
4. Son iguales las cuentas de gastos de representación de los ejecutivos de dos
departamentos de la empresa, cuyos gastos se distribuyen normalmente con
varianza común σ2.
2.2. Hipótesis nula y alternativa.
Se denomina hipótesis nula y se representa por H0, a la hipótesis que es aceptada
provisionalmente como verdadera y cuya validez será sometida a comprobación

experimental. Los resultados experimentales nos permitirán seguir aceptándola como
verdadera o si, por el contrario, debemos rechazarla como tal.
Se denomina hipótesis alternativa y se representa por H1 o por Ha, a la hipótesis que
se acepta en caso de que la hipótesis nula H 0 sea rechazada. La hipótesis alternativa
H1 , es pues una suposición contraria a la hipótesis nula.
Si se asume que θ0 es un valor del parámetro desconocido θ de una población cuya
distribución se supone conocida, entonces son hipótesis nulas y alternativas
respectivamente las siguientes afirmaciones:
1) H0 : θ = θ0 , y H1 : θ ≠ θ0
2) H0 : θ ≤ θ0 , y H1 : θ > θ0
3) H0 : θ ≥ θ0 , y H1 : θ < θ0
2.3. Prueba de una hipótesis estadística.
Para tomar decisiones estadísticas, se requieren de las dos hipótesis: la hipótesis nula
y la hipótesis alternativa referida a un parámetro θ.
La prueba de una hipótesis estadística es un proceso que nos conduce a tomar la
decisión de aceptar o rechazar la hipótesis nula H 0, en contraposición de la hipótesis
alternativa H1 y en base a los resultados de una muestra aleatoria seleccionada de la
población en estudio.
La aceptación de una hipótesis significa que los datos de la muestra no proporcionan
evidencia suficiente para refutarla. El rechazo significa que los datos de la muestra lo
refutan.
2.3.1. Tipos de prueba de hipótesis.

El tipo de prueba depende básicamente de la hipótesis alternativa H1. Se denomina
prueba de una cola a toda hipótesis donde la alternativa H1 es unilateral. Si la
alternativa H1 es bilateral, la prueba se denomina prueba de dos colas.
H0 : θ = θ0 contra H1 : θ ≠ θ0 se denomina prueba bilateral o de dos colas.
H0 : θ ≤ θ0 , y H1 : θ > θ0 se denomina prueba unilateral de cola a la derecha.
H0 : θ ≥ θ0 , y H1 : θ < θ0 se denomina prueba unilateral de cola a la izquierda.
2.4. Errores tipo I y tipo II.
Al tomar la decisión de aceptar o rechazar la hipótesis nula H0 : θ = θ0 en base a los
resultados obtenidos de una muestra aleatoria seleccionada de la población en
estudio; hay cuatro posibles situaciones que determinan si la decisión tomada es
correcta o incorrecta, como se muestra en la tabla 5.1.
Definición 1. Se denomina error tipo I o error de primera especie, al error que se
comete al rechazar una hipótesis nula H0 cuando está realmente es verdadera.
La probabilidad de cometer un error tipo I se denota por α. Entonces,
α = P[error tipo I] = P[rechazar H0 cuando H0 es verdadera]
Definición 2. Se denomina error tipo II o error de segunda especie, al error que se
comete al aceptar una hipótesis nula H0 cuando en realidad es falsa.
La probabilidad de cometer un error tipo II se denota por β. Entonces,

β = P[error tipo II] = P[rechazar H0 cuando H0 es falsa]
Tabla 5.1
Decisión H0 verdadera H0 falsa

Rechazar H0 Error tipo I Decisión correcta.
Probabilidad: α Probabilidad: 1 - β
Aceptar H0 Decisión correcta. Error tipo II
Probabilidad: 1 - α Probabilidad: β
Definición 3. Se denomina nivel de significancia de una prueba de hipótesis a la
probabilidad de cometer un error tipo I. El nivel de significancia se fija previamente
por lo general en α = 0.05 o α = 0.01.
Definición 4. La potencia de una prueba es la probabilidad de tomar la decisión
acertada, de rechazar H0 cuando ésta es falsa o de aceptar H1 cuando ésta es
verdadera. La potencia de una prueba es calculada por 1 – β.
2.5. Procedimiento de la prueba de hipótesis.
El procedimiento general de la prueba de una hipótesis de parámetro θ se resume en
los siguientes pasos:
1) formular la hipótesis nula H0 : θ = θ0 y la hipótesis alternativa adecuada,
H1 : θ ≠ θ0 ó H1 : θ > θ 0 ó H1 : θ < θ0
2) Especificar el tamaño α del nivel de significancia.
3) Seleccionar la estadística apropiada a usar en la prueba.

4) Establecer la regla de decisión, determinando la región critica de la prueba.
5) Calcular el valor del estadístico de la prueba a partir de los datos de la
muestra.
6) Tomar la decisión de rechazar la hipótesis H0 si el valor del estadístico de la
prueba está en la región critica. En caso contrario, no rechazar H0.
2.6. Prueba de hipótesis acerca de una media.
2.6.1. Prueba de hipótesis acerca de una media, con varianza σ2 conocida.
Sea X la media de una muestra aleatoria de tamaño n seleccionada de una
población con media μ y varianza σ2 supuestamente conocida.
 Si la población es normal N(μ, σ2 ), entonces, la distribución de la estadística X
es exactamente normal N(μ, σ2 / n ) para cualquier valor de n (n ≥ 2).
 Si la población no es normal, pero el tamaño de la muestra n es suficientemente
grande (n ≥ 30 ), ent
 Entonces, la distribución de X es aproximadamente normal N(μ, σ2 / n ).
X  μ0
Como consecuencia, la estadística: Z ~ N(0,1)
σ/ n
Si se supone verdadera la hipótesis nula H0 : θ = θ0 , la estadística especificada por la
hipótesis es entonces, ahora:
X  μ0
Z
σ/ n
1. Prueba unilateral de cola a la derecha.

1. Hipótesis: H0 : μ = μ0 contra H1 : μ > μ0
2. Nivel de significancia: α (0 < α < 1)
X  μ0
3. Estadística de prueba: Z
σ/ n
4. Región critica: La región critica en el rango de variación de z es:
R.C   Z   / Z  Z 1 
0 z1-
Aceptar H0 Aceptar H1
Figura 4.2. Región critica cola a la derecha en escala Z.
5. Decisión ó conclusión:
X  μ0
Si el valor de Z  > Z1- α , se rechazara H0 al nivel de significancia α. No
σ/ n
se rechazara en caso contrario.

2) Prueba unilateral de cola a la izquierda.
1. Hipótesis: H0 : μ = μ0 contra H1 : μ < μ0
2. Nivel de significancia: α
X  μ0
3. Estadística de prueba: Z 
σ/ n
4. Región critica: La región critica en el rango de variación de z es:
R.C   Z  - Z 1 
z1- 0
Rechazar H0 Aceptar H1
Figura 4.3. Región critica cola a la izquierda en escala Z.
3) Prueba bilateral o de dos colas.
En este caso las Hipótesis son: H 0 : μ = μ0 contra H 1 : μ ≠ μ0

La región crítica es:
R.C   Z  - Z / 2 ó Z  Z /2 
- z/2 0 z/2
Rechazar H0 Aceptar H0 Rechazar H0
Figura 4.4. Región critica bilateral en escalas Z.
Ejemplo 4.10. Al estudiar si conviene tener o no una sucursal en la ciudad de
Sullana, la gerencia de una gran tienda comercial de Lima, establece el siguiente
criterio para tomar una decisión.: Abrir la sucursal sólo si el ingresos promedio es no
menos de S/ 1,500 y no abrirla en caso contrario.
Si una muestra aleatoria de 100 ingresos familiares de esa ciudad a dado una media
de S/ 1,440.
a) ¿ cual es la decisión a tomar al nivel de significancia del 5%?.-
b) calcular la potencia de la prueba si el ingreso promedio realmente es 1464.
Suponga que la distribución de los ingresos tiene una desviación estándar igual a 240
nuevos soles.
Solución.
Sea X la variable aleatoria que representa los ingresos familiares mensuales de los
pobladores de Sullana.
a)
1. Hipótesis: H0 : μ = 1500 ( ó H0 :μ ≥ 1500 ) (se abre la sucursal)
H1: μ < 1500 ( no se abre la sucursal)
2. Nivel de significancia: α = 0.05
3. Estadística de prueba: como la población de los ingresos no es normal, pero
n = 100 es grande, por el teorema del límite central, la estadística apropiada
es:
X  μ0
Z
σ/ n
cuya distribución es aproximadamente normal N(0,1).
4. Región critica: Si se supone verdadera la hipótesis nula H0 : μ = 1500, para
α = 0.05 y la alternativa unilateral de cola a la izquierda, en la distribución de
Z, se encuentra el valor critico Zα = Z0.05 = -1.645
α = 0.05
z0.05 = -1.645 0
Luego la región critica en la variable de Z es : R.C   Z  - 1.645 
5. Cálculos: De la muestra se tiene X  1440
X  μ0 1440  1500
Z   2.5
σ/ n 240/ 100
6.- Decisión.- Dado que Z = -2.5 ε R.C, debemos rechazar H0 y concluir con
no abrir la sucursal en Sullana.
b) La probabilidad β de aceptar H0 cuando realmente es μ= 1392 (error tipo II) es:
 1460.52  1392 
β  P X  1500  1.645  24  P X  1460.52/μ  1392  P  Z  
 240/ 100 
= P Z  2.86  0.0021
Luego la potencia de prueba es: 1- β = 1 – 0.0021 = 0.9979.
NOTA. Método del valor P de la prueba.
Otra forma de establecer la regla de decisión, es calculando el valor de P, a partir del
valor absoluto de Zk= ( Z k  (X  μ 0 )/(σ/ n ) , que se obtiene de la muestra, de
manera que:
a) P = P(Z > zk) (cola a la izquierda)
b) P = P(Z < zk) (cola a la derecha)
c) P = P(Z < - zk) + P(Z > zk) = 2P(Z > zk ) (para dos colas)
Si el valor de P < α , entonces, se rechazará H 0. No se rechazará H0 , en caso
contrario.
Los programas estadísticos ( Statgraphics, SPSS, Minitac, entre otros) contienen el
método del valor P en las pruebas de hipótesis.
En el ejemplo 1, el valor absoluto de Zk es igual a 2.5, entonces,
P  P(Z  2.5)  P(Z  2.5)  0.5  P(0  Z  2.5)  0.0062
dado que P = 0.0062 < α = 0.05, se debe rechazar H 0 , con un riesgo α = 0.05 y que
este valor de Zk sólo ocurrirá en 62 casos de 10,000 experimentos. Una región critica
de tamaño 0.0062 es muy pequeña y, por tanto, es poco probable que se cometa error
tipo I.
Ejemplo 4.11. Un proceso automático llena latas de conservas de atún. Si el peso
neto medio del contenido es 170 gramos se afirma que el proceso está controlado, en
caso contrario, el proceso no está controlado. En el proceso de enlatado se ha
determinado que los pesos netos del contenido en las latas se distribuyen como una
normal con desviación estándar de 20 gramos. Si una muestra aleatoria de 16 latas
llenas de atún ha dado el peso neto medio de 165 gramos, ¿se podría concluir que el
proceso esta fuera de control al nivel de significancia 5%?.-
Solución.
Sea X la variable aleatoria con la que se representa el peso neto del contenido en las
altas de atún
1. Hipótesis: H 0 : μ = 170 (el proceso está controlado)
H 1 : μ ≠ 170 (el proceso está fuera de control)
2. Nivel de significancia: α = 0.05
3. Estadística de prueba: como la población del contenido neto de atún es normal,
N(170, (20)2), la estadística apropiada es:
X  μ0
Z ~ N(0, 1)
σ/ n
4. Región critica: Para α = 0.05 y la alternativa bilateral, en la distribución de z,
se encuentra el valor critico:
Zα = Z0.975 = 1.96
- 1.96 0 1.96
Luego la región critica en la variable Z es: R.C = { Z< -1.96 ó Z > 1.96 }
5. Cálculos: De la muestra se tiene X  165 , entonces el valor de Z es:

X  μ0 165  170
Z   1
σ/ n 20 / 16
6. Decisión. Dado que el valor Z = -1  R.C, no debemos rechazar H0 y
concluir que el proceso de enlatado esta controlado (bajo control).
2.6.2. Prueba de hipótesis acerca de una media, con varianza σ2 desconocida.
A) Población no normal.
Si la población no tiene distribución normal y si la varianza es desconocida, para
probar hipótesis acerca de la media μ, sólo si, el tamaño de la muestra es grande (n ≥
30), se utiliza la estadística:
X  μ0
Z
S/ n
cuya distribución es aproximadamente N (0,1).
Luego, las regiones criticas de las pruebas de H 0: μ = μ0 contra las alternativas
respectivas H1: μ ≠ μ0 ó H1: μ > μ 0 ó H1: μ < μ0 son las mismas (aproximadamente
de la sección anterior).
B) Población normal.
Si la población tiene distribución normal N (  ,  2 ) , donde μ y σ2 son
desconocidas, para n ≤ 30 la estadística de prueba acerca de la media μ es:
X  μ0
T ~ t ( n 1)
S/ n
1. Hipótesis: H0 : μ = μ0 contra H1 : μ ≠ μ0
2. Nivel de significancia: α ( 0 < α < 1)

X  μ0
3. Estadística de prueba: T 
S/ n
4. Región critica: la región critica en el rango de variación de t es:
R.C  { T   t ( /2,n 1) ó T  t ( /2,n 1) }
α/2 α/2
- t/2 0 t/2
Rechazar H0 Aceptar H0 Rechazar H0
Figura 4.5. Región critica bilateral en escala t.
5. Decisión. Se rechazará H0 con riesgo α, si el valor de t  R.C. No se rechazará H0
en caso contrario.
2) Prueba unilateral de cola a la derecha.
En este caso las hipótesis son H0 : μ = μ0 contra H0 : μ > μ0
La región critica en el rango de variación de T es: R.C = {T > t (1-α, n-1)}
0 t1-
Aceptar H0 Rechazar H0
Figura 4.6. Región critica cola a la derecha en escala t.

En este caso las hipótesis son H0 : μ = μ0 contra H0 : μ < μ0
La región critica en el rango de variación de T es: R.C = {T < - t ( α, n-1)}
- t1-  0
Rechazar H0 Aceptar H0
Figura 4.7. Región critica cola a la izquierda en escala t.
Ejemplo 4.12. Las cajas de cierto tipo de cereal procesados por una fabrica deben
tener un contenido promedio de 160 gramos. Por una queja ante el defensor del
consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó
una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en
gramos:
157, 157, 163, 158, 159, 162, 159, 158, 156, 161
¿Es razonable que el inspector multe al fabricante?.- Utilice un nivel de significancia
del 5% y suponga que los contenidos tienen distribución normal.
Solución.
Sea la variable aleatoria X que representa los pesos de las cajas del cereal. Se supone
que la distribución de X es normal con media μ y varianza σ2 desconocida.
1) Hipótesis: H0: μ = 160
H1: μ < 160
2) Nivel de significancia: α = 0.05
3) Estadística de prueba: población normal, con varianza desconocida y muestra
pequeña n =10 < 30, emplearemos la siguiente estadística de prueba:
X  160
T
S/ n
que se distribuye según una distribución t- Student con 9 grados de libertad.
4) Región critica: Con el nivel de significancia α = 0.05 y para una prueba de
hipótesis unilateral de cola a la izquierda, en la tabla de probabilidades t- Student se
encuentra el valor de t( α, n-1) = t(0.05, 9) = 1.833.
Consecuentemente, la región critica es: R.C = { T <-1.833 }
5) Cálculos: De los datos de la muestra se obtiene:
n = 10 , X  159 , S = 2.309,
X  160 159  160

T   1.37
S/ n 2.309 / 10
6) Decisión: dado que el valor T = -1.37  R.C. debemos aceptar H0 y concluir que
el inspector no multará al fabricante.
Nota. Utilizando el programa Statgraphics, se encuentra la probabilidad
P = P(T <-1.833) = 0.1012 > 0.05, por lo que debemos aceptar H0.
2.7. Prueba de hipótesis acerca de dos medias.
2.7.1. Prueba de hipótesis acerca de dos medias con varianzas σ 12 y σ 22

supuestamente conocidas.
Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de tamaños n 1
y n2 seleccionadas respectivamente de dos poblaciones independientes, con medias μ1
y μ2 y varianzas σ 12 y σ 22 respectivas supuestamente conocidas.
- Si las dos poblaciones son normales, entonces las estadísticas:
X 1 ~ N( μ 1 , σ12 /n 1 ) y X 2 ~ N( μ 2 , σ 22 /n 2 )
Luego la estadística X 1 - X 2 ~ N( μ 1 - μ 2 , σ12 /n 1  σ 22 /n 2 ) .
- Si las dos poblaciones no son normales, pero n1 y n2 son suficientemente
grandes (n1 ≥ 30 y n2 ≥ 30), entonces:
X1 - X 2  N( μ 1 - μ 2 , σ12 /n 1  σ 22 /n 2 )
Luego, según sean las dos poblaciones normales o no, la estadística:

X1  X 2  (μ 1  μ 2 )
Z
σ 12 σ 22

n1 n 2
tiene distribución exactamente o aproximadamente norma N (0,1).
Si se supone verdadera la hipótesis nula H0 : μ1= μ2 ó H0 : μ1 - μ2 = 0, la estadística
de prueba es:
X1  X 2
Z ~ N(0, 1)
σ12 σ 22

n1 n 2
El valor obtenido de Z, se utiliza para probar H 0 contra cualquiera de las hipótesis
alternativas H0 : μ1 ≠ μ2 H0 : μ1 > μ2 H0 : μ1 < μ2.
1) Hipótesis: H0 : μ1 = μ2 contra H1 : μ1 > μ2
2) Nivel de significancia: α
X1  X 2
Z
3) Estadística de prueba: σ12 σ 22

n1 n 2
4) Región crítica: En el rango de variación de Z es: R.C = { Z > Zα }
Z
0 Z
Figura 4.8. Región critica cola a la derecha en escalas Z
5) Decisión: Se rechazará H0, si el valor de Z  R.C. No se rechazará H 0 en caso
contrario.
Las Hipótesis son: H0 : μ1 = μ2 contra H1 : μ1 < μ2
La región crítica en los valores de Z es: R.C = {Z < - Z1-α }
En este caso las Hipótesis son: H0 : μ1 = μ2 contra H1 : μ1 ≠ μ2
La región crítica en el rango de variación de Z es:
R.C = {Z < - Z1-α/2 ó Z > Z1-α/2 }
Nota. Cuando las hipótesis son de la forma:
1) H0 : μ1 - μ2 = do contra H1 : μ1 - μ2 ≠ do
2) H0 : μ1 - μ2 = do contra H1 : μ1 - μ2 > do
3) H0 : μ1 - μ2 = do contra H1 : μ1 - μ2 < do
(X 1  X 2 )  d 0
Z
Estadística de prueba es, σ12 σ 22

n1 n 2
cuya distribución es exactamente o aproximadamente normal N(0,1), según sean las
dos poblaciones normales o no.
Ejemplo 4.13. Un fabricante quiere comparar dos marcas de maquinas, A y B; para
fabricar un tipo de articulo. Observa dos muestras aleatorias de 60 artículos
procesados po A y B respectivamente y encuentra que las medias de proceso
respectivas son 1230 y 1190 segundos. Suponga que σ 1 = 120 segundos y σ2 = 90
segundos.
a) al nivel de significancia del 5%, ¿se puede inferir que la maquina B es más
rápida que la máquina A?-
b) al nivel de significancia del 5%, ¿se puede inferir que la media de B es menor
que la media de A en menos de 7 segundos?-
Solución.
Sean X1 y X2 los tiempos de proceso con las maquinas A y B respectivamente y μ 1 y
μ2 sus medias respectivas.
Se desconocen las distribuciones de probabilidad de X 1 y X2, pero las muestras son
grandes.
a)
1) Hipótesis : H0 : μ1 = μ2 contra H1 : μ1 > μ2

3) Estadística de prueba : Si se supone verdadera H0 : μ1 = μ2 y para muestras
grandes n1 = 60 y n2 = 60, la estadística apropiada es:
X1  X 2
Z  N(0, 1)
σ12 σ 22

n1 n 2
4) Región critica: En el rango de variación de Z es: R.C = { Z > 1.645 }
5) Cálculos. De los datos se tiene:
n1 = n2 = 60 , X1  1230 , X 2  1190 ;  1  120 y σ 2  90
Luego:
1230 - 1190 40
Z   2.0655
(120) 2 (90) 2 19.365

60 60
6) Decisión. Como el valor de Z = 2.0655  R.C, debemos rechazar H0 y
concluir que la maquina B utiliza menor tiempo en el proceso de fabricación
para dicho tipo de articulo.
b) En este caso, se debe probar H0 : μ1 - μ2 = 7 contra H1 : μ1 - μ2 > 7
Si H0 es verdadera, la estadística de prueba es
(X 1  X 2 )  7
Z ~ N(0, 1)
σ12 σ 22

n1 n 2
La región critica de la prueba unilateral de cola a la derecha, al nivel de significancia
α=0.05 es la misma como del caso a), es decir:
R.C = { Z > 1.645 }
El valor del estadístico es
(X 1  X 2 )  7 (1230 - 1190) - 7
Z   1.7
σ 2
σ 2 19.365

1 2
n1 n 2
Como el valor de Z = 1.7  R.C. , debemos rechazar H0 y concluir que la Máquina
B utiliza un tiempo promedio menos de 7 segundos debajo del promedio de A.
2.7.2. Prueba de hipótesis acerca de dos medias con Varianzas  12 y σ 22

supuestamente desconocidas.
A) Poblaciones no normales
Si las dos muestras aleatorias n1 y n2 independientes seleccionan respectivamente de
dos poblaciones cuyas distribuciones son no normales con varianzas  12 y σ 22
supuestas desconocidas, entonces, siempre que los tamaños de las muestras sean
grandes: n1 ≥ 30 y n2 ≥ 30, las varianzas  1 y σ 2 se estiman por S1 y S 2 . En este

2 2 2 2
caso, para probar la hipótesis H0 : μ1 – μ2 = 0 se utiliza la estadística:

(X 1  X 2 )  (μ 1  μ 2 )
Z  N(0,1)
S12 S 22

n1 n 2
B) Poblaciones normales
Sean X 1 y X 2 las medias y S12 y S 22 las varianzas de dos muestras aleatorias
independientes de tamaños n1 y n2 respectivamente, seleccionadas de dos poblaciones
N(μ 1 , σ12 ) y N(μ 2 , σ 22 ) donde μ1 , μ2 ,  12 y σ 22 son desconocidas.
B1) Varianza desconocidas supuestamente iguales ( σ12  σ 22  σ 2 ).
1) Prueba unilateral de cola a la derecha
1) Hipótesis: H0: μ1 = μ2 (ó μ1 - μ2 = 0)
H1: μ1 > μ2 (ó μ1 - μ2 > 0)
2) Nivel de significancía: α
3) Estadística de prueba: Si la prueba nula H 0 es verdadera y si las poblaciones son
normales con varianzas desconocidas supuestas iguales, entonces la estadística de
prueba es:
(X1  X 2 ) (X1  X 2 )
T 
Sc2 S c2 1 1
 Sc 
n1 n 2 n1 n 2
que tiene distribución t- Student con n1 + n2 – 2 grados de libertad.
2
Donde S c el estimador insesgado de la varianza común σ2 es:
(n 1  1)S12  (n 2  1)S22
S c2 
n1  n 2  2
que tiene distribución t- Student con n1 + n2 –2 grados de libertad.
4. Región crítica: en el rango de variación de T es:

R.C  T  t ( α, n1  n 2  2) 
0 t
Figura 4.9. Región critica cola a la derecha en T.
Las hipótesis son H0 : μ1 = μ2 contra H1 : μ1 < μ2

La región crítica en este caso será: R.C  T   t (1α, n1  n 2  2) 
Rechazar H0 si el valor de T  R.C. No rechazar H0 en caso contrario.
Las hipótesis son H0 : μ1 = μ2 contra H1 : μ1 ≠ μ2

La región crítica en este caso será:

R.C  T   t ( α/2, n1  n 2  2) ó T  t ( α/2, n1  n 2  2) 
Rechazar H0 si el valor de T  R.C.
B2) Varianza desconocidas supuestamente distintas ( σ12  σ 22 ) .
Si las varianzas de las dos poblaciones normales independientes son desconocidas
supuestamente diferentes, entonces la estadística.
(X1  X 2 )  (μ 1  μ 2 )
T ~ t
S12 S 22 (g)

n1 n 2
siendo el grado de libertad g dado por:
2
 S12 S 22 
  
n n
g   12 2   2
 S12   S 22 
   
 n1    n 2 
n1  1 n 2  1
si g no es entero, se aproxima al entero mayor más cercano.
Si la hipótesis nula H0 : μ1 = μ2 se supone verdadera, entonces
(X1  X 2 )
T ~ t
S12 S 22 (g)

n1 n 2
El valor del estadístico T se utiliza para probar H 0 contra cualquiera de las hipótesis
alternativas H1 : μ1 ≠ μ2 ó H1 : μ1 > μ2 ó H1 : μ1 < μ2 , las regiones criticas y las
reglas de decisión son similares a los del caso B1.

Ejemplo 4.14. A un administrador en desarrollo de recursos humanos se le pide que
determine si los salarios por hora de los obreros semiespecializados son los mismos
en dos ciudades distintas. El resultado de está investigación se presenta en la
siguiente tabla.
Ciudad Salarios medios por Desviación estándar tamaño de la
hora de la muestra de la muestra muestra
A $ 8.95 $ 0.40 200
B 9.10 0.60 175
Suponga que la empresa desea probar la hipótesis en el nivel 0.05 de que no hay
diferencia entre los salarios por hora de los trabajadores semiespecializados de las
dos ciudades.
Solución.
Sean X1 y X2 las variables aleatorias que representan los salarios por hora de los
obreros semiespecializados de las ciudades A y B respectivamente.
1) Hipótesis: H0 : μ1 = μ2 contra H1 : μ1 ≠ μ2
2) Nivel de significancia: α =0.05
3) Estadística de prueba:
Si se supone H0 verdadera y dado que los tamaños de las muestras son grandes,
entonces la estadística de prueba a utilizar es:
X1  X 2
Z  N(0,1)
S12 S 22

n1 n 2
4) Región critica: Para α = 0.05 y una prueba de hipótesis bilateral, en la
distribución N(0,1) se encuentra Z0.95 = 1.96. la región critica en la variación de
Z es:
R.C = { Z < -1.96 ó Z > 1.96}
5) Cálculos: de los datos se tiene:
n1 = 200, X 1  $8.95 , S1 = $ 0.40 n2 = 175, X 2  $9.10 , S2 = $ 0.60
entonces,
X1  X 2 8.95 - 9.10 - 0.15

Z    -2.809
S12 S 22 (0.40) 2 (0.60) 2 0.0534
 
n1 n 2 200 175
6) Decisión: Como Z = -2.809  R.C, debemos rechazar la hipótesis H 0 y
llegamos a la conclusión de que las medias de los salarios de obreros
semiespecializados de las dos ciudades son diferentes.
Nota. Con el método del P-valor para la prueba de dos muestras se obtiene:
2P(T>2.809) = 2(0.00248) = 0.00496. dado que p = 0.00496 < 0.05 se debe rechazar
H0 en una prueba bilateral.

Ejemplo 4.15. Una empresa grande de corretaje de acciones desea determinar qué
tanto éxito han tenido sus nuevos ejecutivos de cuenta en la consecución de clientes.
Después de haber terminado su entrenamiento, los nuevos ejecutivos pasan varias
semanas haciendo llamadas a posibles clientes, tratando de conseguir prospectos para
abrir cuentas con la empresa. Los datos siguientes dan el número de cuentas nuevas
que fueron abiertas durante las primeras dos semanas por diez ejecutivas y ocho
ejecutivos de cuenta escogidos aleatoriamente. A un nivel α =0.05 ¿parece que las
mujeres son más efectivas que los hombres para conseguir nuevas cuentas?.-
Se supone que el número de cuentas nuevas se distribuyen como una normal, con
varianzas desconocidas pero iguales.
Número de cuentas nuevas
Ejecutivas de cuenta 12 11 14 13 13 14 13 12 14 12
Ejecutivos de cuenta 13 10 11 12 13 12 10 12
Solución.
Sean X1 y X2 las variables aleatorias que representan los números de cuentas nuevas
de las ejecutivas y ejecutivos respectivamente.
Se sabe que X 1 ~ N( μ 1 , σ 12 ) y X 2 ~ N( μ 2 , σ 22 ) , con σ12  σ 22 :
1) Hipótesis: H0 : μ1 = μ2 contra H1 : μ1 > μ2
2) Nivel de significancia: α =0.05

3) Estadística de prueba: Si se supone H0 verdadera y dado que los varianzas
poblacionales son iguales, la estadística de prueba es:
X1  X 2
T
S c2 Sc2

n1 n 2
que se distribuye según una t- Student con n1 + n2 –2 =16 grados de libertad.
4) Región critica: Para α = 0.05 y una prueba de hipótesis unilateral a la derecha, en
la distribución t(16) se encuentra t(0.05, 16) = 1.746. La región critica en la variación de
T es:
R.C = { T > 1.746}
5) Cálculos: de los datos se tiene:
n1 = 10, X 1  12.8 , S12  1.06667 n2 = 8, X 2  11 .625 , S 22  1.41071
(n 1  1) S12  (n 2  1) S 22 9·(1.0667)  7·(1.41071)

Sc    1.10327
n1  n 2  2 16
entonces,
X1  X 2 12.8 - 11.625 1.175

T    2.24525
Sc2 S c2 (1.10327) 2 (1.10327) 2 0.523327
 
n1 n 2 10 8
6) Decisión: Como T = 2.24525  R.C, debemos rechazar la hipótesis H0 al nivel
del 5% y concluir que las mujeres son más efectivas para conseguir nuevas
cuentas.
Nota. Con el Software Statgraphics plus para la comparación de dos muestras se
obtiene: P(T>2.24525) = 0.0196. Dado que p = 0.0196 < 0.05 se debe rechazar H0 en
una prueba unilateral.
Ejemplo 4.16. El encargado de compras de una compañía tiene que escoger entre
dos marcas de maquinas A y B, para procesar cierto producto. Por cuestiones de
precio el encargado desearía comprar la marca A a no ser que haya evidencia de que
la máquina B es más veloz. Se le permitió operar los dos tipos de maquinas durante
un periodo de prueba, escogiendo al azar luego, los tiempos en segundos de 10
objetos procesados por cada máquina:
Máquina A: 55 56 57 56 58 53 54 59 60 57
Máquina B: 50 51 42 50 40 60 53 44 48 58
Utilizando un nivel de significancia del 5% y suponiendo poblaciones de tiempos
normales con varianzas desconocidas pero diferentes, ¿Qué tipo de maquina debería
comprar la empresa?.-
Respuesta. El valor de T es T = 3.1983, se rechaza H0. Concluimos que se debe
adquirir la maquina B.
2.8. Prueba de hipótesis acerca de una proporción.
Sean X1, X2, ..., Xn una muestra escogida de una población Bernoulli B(1, p), donde
p es la proporción de éxitos en la población.
Sea
X 1  X 2  ...  X n X
p̂  
n n
la proporción de éxitos en la muestra, siendo X el número de éxitos en la muestra.
La estadística X tiene distribución exactamente binomial B(n, p).
Si n es suficientemente grande1, la estadística
X  np pˆ  p
Z    N (0, 1)
np(1  p ) p (1  p ) / n
si se supone verdadera la hipótesis nula H0 : p = p0 , entonces, la distribución
muestral de X es exactamente binomial B(n, p0), y la de la variable aleatoria
X  np 0 pˆ  p 0
Z   N (0, 1)
np0 (1  p 0 ) p 0 (1  p 0 ) / n
Dado el nivel de significancia α, la prueba de la hipótesis nula H 0 : p = p0 , contra
cualquiera de las alternativas H1 : p ≠ p0 ó H1 : p > p0 ó H1 : p < p0 se basa tanto en
la estadística X como en la estadística Z.

1
2.8.1. Prueba bilateral.
Muestra grande
La prueba es, H0 : p = p0 contra H1 : p ≠ p0
Luego, la región critica en los valores de Z es el intervalo:
R.C  { Z   Z1α/2 ó Z  Z1 α/2 }
X  np 0 pˆ  p 0
Se rechaza H0 si el valor de Z
np0 (1  p 0 )

p 0 (1  p0 ) / n
 R.C. No se
rechazará en caso contrario.
2.8.2. Prueba unilateral de cola a la derecha.
Muestra grande.
Las hipótesis son : Ho : p = po contra H1 : p > po
En este caso, la región critica en los valores de Z es el intervalo:
R.C = {Z >Z1-α }
Se rechaza H0 si el valor de Z  R.C.
2.8.3. Prueba unilateral de cola a la izquierda.
Muestra grande.
Las hipótesis son: Ho: p = po contra H1 : p < po
La región crítica en los valores de Z es:
R.C = { Z < - Z1-α }
Luego se rechaza H0 si el valor de Z  R.C.
Ejemplo 4.17. Un fabricante afirma que el 30% de todos los consumidores prefieren
su producto. Con el fin de evaluar está afirmación se tomo una m.a de 400
consumidores y se encontró que 100 de ellos prefieren dicho producto.
¿es ésta, suficiente evidencia para inferir que el porcentaje de preferencia del
producto no es 30% ?.- Utilice el nivel de significancia del 1%.
Solución.
Sea p la proporción poblacional de preferencia del producto.
1) Hipótesis: H0: p = 0.30 contra H1 : p ≠ 0.30
2) Nivel de significancia: α = 0.01.
3) Estadística de prueba: Si Ho es verdadera y n es grande, la estadística
pˆ  p 0 pˆ  0.3
Z   N (0, 1)
p 0 (1  p 0 ) (0.3)(0.7)
n n
4) Región critica: Para α =0.01 y una prueba bilateral, en la distribución de Z se
encuentra el valor critico Z0.995 = 2.575.
Luego, R.C = { Z < -2.575 ó Z > 2.575 }
5) Cálculos:
x 100
N= 400 , x = 100 , pˆ    0.25
n 400
pˆ  p 0 0.25  0.3
Z   2.18
Luego se tiene: p 0 (1  p 0 ) (0.3)(0.7)
n 400
6) Decisión: Como Z =-2.18  R.C, no debemos rechazar H0, y concluimos que el
fabricante tiene la razón.
2.9. Prueba de hipótesis sobre dos proporciones.
Sean X1 y X2 el número de éxitos en dos muestras aleatorias independientes de
tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones de Bernoulli
B(1, p1) y B(1, p2), donde los parámetros p1 y p2 son las proporciones de éxitos
poblacionales.
Sean las proporciones de éxitos muestrales respectivamente:
X1 X2
p̂1  y p̂ 2 
n1 n2
Para n1 y n2 suficientemente grandes (n1 ≥ 30 y n2 ≥ 30 ), la variable

pˆ 1  pˆ 2  ( p1  p 2 )
Z  N (0,1).
p1 (1  p1 ) p 2 (1  p 2 )

n1 n2
Si H0 : p1 = p2 se supone verdadera, la estadística es:
pˆ 1  pˆ 2
Z  N (0,1).
p c (1  p c ) p c (1  p c )

n1 n2
donde pc es el valor común de los parámetros p1 y p2 cuya estimación insesgada es:
x 1  x 2 n 1p̂1  n 2 p̂ 2
p̂  
n1  n 2 n1  n 2
1) Hipótesis: H 0 : p1 = p2 contra H 1: p1 > p2.
2) Nivel de significancia: α
3) Estadística de prueba:
pˆ 1  pˆ 2
Z .
pˆ (1  pˆ ) pˆ (1  pˆ )

n1 n2
4) Región critica: R.C   Z  Z  

5) Decisión: Se rechaza H0 si el valor de Z  R.C. No se rechaza H0 en caso
contrario.
2) Prueba unilateral de cola a la 3) Prueba bilateral o de dos colas.
izquierda.
Hipótesis: H0: p1 = p2 contra Hipótesis: H0: p1 = p2 contra
H 1: p1 < p2. H 1: p1 ≠ p2.
La Región crítica es R.C   Z   Z   La Región crítica es :
Se rechaza H0 si el valor de Z  R.C. R.C   Z   Z α/2 ó Z  Z α/2 
Ejemplo 4.18. Un patrocinador de un programa especial de TV afirma que el programa
representa un atractivo mayor para los televidentes hombres que las mujeres, pero, el
personal de producción del programa piensa que es igual el porcentaje de televidentes
hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300
hombres y otra de 400 mujeres revelo que 120 hombres y 120 mujeres estaban viendo el
programa especial de TV. ¿Puede considerarse significativa la diferencia al nivel del
5%?.-
Solución.
Sean p1 y p2 , respectivamente, las proporciones de hombres y mujeres que ven el
programa especial de televisión.

1) Hipótesis: H0: p1 = p2 contra H 1: p1 > p2.
3) Estadística de prueba: Si H0: p1 = p2 es verdadera y las muestras son grandes, la
estadística es:
pˆ 1  pˆ 2
Z  N (0,1)
pˆ (1  pˆ ) pˆ (1  pˆ )

n1 n2
4) Región critica: Para α = 0.05 y una prueba unilateral de cola a la derecha, la región
critica es:
R.C   Z  1.645 
5) Cálculos: los datos de la muestra dan:
Hombres: n1 = 300, X1 = 120 , Mujeres: n2 = 400, X2 = 120,
120 120
pˆ 1   0.4 pˆ 2   0.3
300 400
x 1  x 2 120  120
p̂    0.34
n 1  n 2 300  400
pˆ 1  pˆ 2 0.4  0.3
Z   2.764
pˆ (1  pˆ ) pˆ (1  pˆ ) (0.34)(0.66) (0.34)(0.66)
 
n1 n2 300 400
6) Decisión. Como el valor de Z = 2.764  R.C., debemos rechazar H0 y concluir que
los datos presentan evidencia de que el programa representa un mayor atractivo para
los hombres.
CONCLUSIONES
 Antes de realizar un estudio de inferencia estadística sobre una variable, lo
primero es decidir el número de elementos, n, a elegir en la muestra
aleatoria. Para ello consideremos que el estudio se basa en una variable de
distribución normal, y nos interesa obtener para un nivel de significación α
dado, una precisión (error).
 Se denomina hipótesis estadística a cualquier afirmación o conjetura que se
hace acerca de la distribución de una o más poblaciones. La afirmación
puede referirse bien a la forma o tipo de distribución de probabilidad de la
población o bien referirse al valor o valores de uno o más parámetros de la
distribución conocida su forma.

BIBLIOGRAFIA
 Snedecor, G.W. and Cochran, W.G. 1980. Statistical methods. Seventh Ed. Iowa, The Iowa State
University Press. 507p.
 Steel, R.G.D. y Torrie, J.H. 1980. Principles and procedures of Statistics.McGraw-Hill. 629p

CORREGIDO

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

CORREGIDO

Caricato da

Copyright:

Formati disponibili

UNIVERSIDAD NACIONAL DE PIURA

TEMA: INTERVALOS DE CONFIANZA Y PRUEBA DE

HIPÓTESIS PARA MEDIA Y PROPORCIONES.

CURSO: ESTADÍSTICA GENERAL

DOCENTE: LIC. JUAN PANTA IPANAQUÉ

- GAMARRA NÚÑEZ KEVIN BILL

- RUESTA LÓPEZ MADAI

-ZURITA CHINGUEL LESLY GIANELA

La estadística inferencial es el proceso de uso de los resultados derivados de las

muestras para obtener conclusiones acerca de las características de una población. La

estadística inferencial nos permite estimar características desconocidas como la

media de la población o la proporción de la población. Existen dos tipos de

estimaciones usadas para estimar los parámetros de la población: la estimación

puntual y la estimación de intervalo. Una estimación puntual es el valor de un solo

estadístico de muestra. Una estimación del intervalo de confianza es un rango de

números, llamado intervalo, construido alrededor de la estimación puntual. El

intervalo de confianza se construye de manera que la probabilidad del parámetro de

la población se localice en algún lugar dentro del intervalo conocido

tomar decisiones sobre poblaciones, a partir de los resultados de una muestra

aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se

debe partir de afirmaciones o conjeturas con respecto a la población en el que

comprobación experimental con el propósito de saber si los resultados de una

muestra aleatoria extraída de esa población, contradicen o no tal conjetura.

CAPÍTULO I: INTERVALOS DE CONFIANZA

1.1. Intervalo de confianza para la media poblacional.

1.1.1 Intervalo de confianza para la media: Varianza  2 supuestamente

confianza del parámetro.

Si la población es normal N (μ, σ 2 ) , entonces, la distribución del estadístico X es

normal N (μ, σ 2 /n) para cualquier valor de n (n  2).

Si la población no es normal, pero tiene media  y varianza 2 finitas, entonces,

siempre que el tamaño n de la muestra sea suficientemente grande (n  30), por el

teorema del límite central, la distribución de X es aproximadamente normal

Por tanto, según sea el caso, la distribución de la variable aleatoria:

es exactamente (o aproximadamente) normal N(0,1).

El valor de Z  / 2 se busca en la tabla normal N (0,1), tal que P( Z  Z  / 2 )   / 2 .

los límites de confianza de, inferior y superior, respectivamente.

Figura 4.1. Intervalo de estimación para .

Observación 1. Cuando la población es finita de tamaño N y el tamaño de la muestra

constituye más del 5% del tamaño de la población, se debe usar el factor de

corrección de población finita para modificar la desviación estándar. Así, el intervalo

de confianza del (1- ) x 100% para  es dado por:

promedio de los ingresos mensuales es de $ 500. Encuentre un intervalo de confianza

ciudad. Suponga que  = $100.

partir de una muestra aleatoria de tamaño n =100. La estimación puntual de es

X  500 . Para el nivel de confianza 1-=0.95, en la tabla normal estándar se

encuentra: z1 / 2  z 0.975  1.96 .

Luego, el intervalo de confianza del 95% para  es: [480.4, 519.6]

ciudad, está en el intervalo [$480.4, $519.6].

Ejercicio. Un analista de investigación de mercados escoge una muestra aleatoria de

100 clientes de un conjunto de 500 clientes de un gran centro comercial que

declararan ingresos mayores a 1,500 soles. El encuentra que los clientes de la

muestra gastaron en la tienda un promedio de S/. 2500.

Estimar el gasto promedio de la población finita al nivel de confianza del 95% .

Suponga que la desviación estándar de la población es  = S/.300.

1.1.2. Intervalo de confianza para la media: Varianza 2 desconocida.

Si la población no es normal pero el tamaño de la muestra es suficientemente grande

(n  30), se utiliza la desviación estándar S de la muestra, como estimación puntual

de la desviación estándar  de la población. Entonces, el intervalo de confianza del

(1- ) x 100% para  es aproximadamente:

Observación 2. Cuando la población es finita de tamaño N y el tamaño de la muestra

constituye más del 5% del tamaño de la población, el intervalo de confianza del

Si X y S son la media y la desviación estándar respectivamente de una muestra

aleatoria de tamaño n (n <30) escogida de una población normal con varianza 2

desconocida, entonces, el intervalo de confianza del (1- ) x 100 para  es: