Sei sulla pagina 1di 60

UNIVERSIDAD NACIONAL DE PIURA

FACULTAD DE AGRONOMIA
ESCUELA DE AGRONOMIA

TEMA: INTERVALOS DE CONFIANZA Y PRUEBA DE

HIPÓTESIS PARA MEDIA Y PROPORCIONES.

CURSO: ESTADÍSTICA GENERAL

DOCENTE: LIC. JUAN PANTA IPANAQUÉ

INTEGRANTES:

- GAMARRA NÚÑEZ KEVIN BILL

- RUESTA LÓPEZ MADAI

-ZURITA CHINGUEL LESLY GIANELA

SEMESTRE:

II- 2019

FECHA:

06-01-2020

PIURA-PERÚ
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 2

ÍNDICE

INTRODUCCIÓN....................................................................................................3 4
CAPITULO I: INTERVALOS DE CONFIANZA....................................................4 5
1.1.. Intervalo de confianza para la media : ...........................................................4 5
1.1.1. Intervalo 2 Intervalo de confianza para la media : Varianza 2 2
supuestamente conocida.....................................................................................…7 8
1.1.2 Intervalo de confianza para la media : Varianza 2 desconocida……..9 9
1.1.3 Determinación del tamaño de muestra necesario para estimar la media.......9 0
1.2. Intervalo de confianza para la diferencia entre dos medias..............................11 2
1.2.1. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y y
y  12 conocidas....................................................................................................11 2
1.2.2. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y y
 12 desconocidas..................................................................................................12 3
1.3. Intervalo de confianza para una proporción.....................................................16 7
1.4. Intervalo de confianza para la diferencia entre dos proporciones....................19 1
CAPITULO II: HIPÓTESIS ESTADÍSTICAS.......................................................22 3
2.1Concepto.............................................................................................................22 4
2.2. Hipótesis nula y alternativa..............................................................................22 4
2.3. Prueba de una hipótesis estadística..................................................................23 5
2.3.1. Tipos de prueba de hipótesis......................................................................23 5
2.4. Errores tipo I y tipo II......................................................................................24 6
2.5. Procedimiento de la prueba de hipótesis.........................................................25 7
2.6. Prueba de hipótesis acerca de una media..........................................................26 8
2.6.1. Prueba de hipótesis acerca de una media, con varianza σ2 conocida.........26 8
2.6.2. Prueba de hipótesis acerca de una media, con varianza σ2 desconocida....34 6
2.7. Prueba de hipótesis acerca de dos medias........................................................38 1
2.7.1. Prueba de hipótesis acerca de dos medias con varianzas σ 12 y σ 22 σ 22
σ 22 supuestamente conocidas........................................................................38 1
2.7.2. Prueba de hipótesis acerca de dos medias con Varianzas  12 y σ 22 σ 22 σ 22
supuestamente desconocidas................................................................................42 6
2.8. Prueba de hipótesis acerca de una proporción..................................................51 5
2.8.1. Prueba bilateral...........................................................................................52 6
2.8.2. Prueba unilateral de cola a la derecha........................................................53 7
2.8.3. Prueba unilateral de cola a la izquierda......................................................53 7
2.9. Prueba de hipótesis sobre dos proporciones.....................................................55 9
CONCLUSIONES...................................................................................................63 5
BIBLIOGRAFIA……………………………………………………….………….64
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 3

INTRODUCCIÓN

La estadística inferencial es el proceso de uso de los resultados derivados de las

muestras para obtener conclusiones acerca de las características de una población. La

estadística inferencial nos permite estimar características desconocidas como la

media de la población o la proporción de la población. Existen dos tipos de

estimaciones usadas para estimar los parámetros de la población: la estimación

puntual y la estimación de intervalo. Una estimación puntual es el valor de un solo

estadístico de muestra. Una estimación del intervalo de confianza es un rango de

números, llamado intervalo, construido alrededor de la estimación puntual. El

intervalo de confianza se construye de manera que la probabilidad del parámetro de

la población se localice en algún lugar dentro del intervalo conocido

El objetivo del presente trabajo es dar algunos métodos que se usan para

tomar decisiones sobre poblaciones, a partir de los resultados de una muestra

aleatoria escogida de esa población. Para llegar a tomar decisiones estadísticas se

debe partir de afirmaciones o conjeturas con respecto a la población en el que

estamos interesados. Tales suposiciones, pueden ser verdaderas o no. Una conjetura

hecha sobre una población o sobre sus parámetros deberá ser sometida a

comprobación experimental con el propósito de saber si los resultados de una

muestra aleatoria extraída de esa población, contradicen o no tal conjetura.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 4

CAPÍTULO I: INTERVALOS DE CONFIANZA

1.1. Intervalo de confianza para la media poblacional.

1.1.1 Intervalo de confianza para la media: Varianza  2 supuestamente


conocida.
Se utiliza la distribución muestral de la media X para determinar el intervalo de

confianza del parámetro.

Si la población es normal N (μ, σ 2 ) , entonces, la distribución del estadístico X es

normal N (μ, σ 2 /n) para cualquier valor de n (n  2).

Si la población no es normal, pero tiene media  y varianza 2 finitas, entonces,

siempre que el tamaño n de la muestra sea suficientemente grande (n  30), por el

teorema del límite central, la distribución de X es aproximadamente normal

N (μ, σ 2 /n) .

Por tanto, según sea el caso, la distribución de la variable aleatoria:

X 
Z
/ n

es exactamente (o aproximadamente) normal N(0,1).

Por tanto, el intervalo de confianza del (1- ) x 100% para  es dado por:

σ σ
X  Z α/2  μ  X  Z α/2
n n

El valor de Z  / 2 se busca en la tabla normal N (0,1), tal que P( Z  Z  / 2 )   / 2 .


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 5

 
En la figura 5.1, tenemos que los valores a  X  Z 1 / 2 y b  X  Z 1 / 2 son
n n

los límites de confianza de, inferior y superior, respectivamente.

- z1-/2 0 z1-/2

a X b X

intervalo de 

Figura 4.1. Intervalo de estimación para .

Observación 1. Cuando la población es finita de tamaño N y el tamaño de la muestra

constituye más del 5% del tamaño de la población, se debe usar el factor de

corrección de población finita para modificar la desviación estándar. Así, el intervalo

de confianza del (1- ) x 100% para  es dado por:

σ Nn σ Nn
X - Z α/2 ·  μ  X  Z α/2 ·
n N 1 n N 1

Ejemplo 4.1. Una muestra aleatoria de 100 hogares de una ciudad indica que el

promedio de los ingresos mensuales es de $ 500. Encuentre un intervalo de confianza


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 6

del 95% para la media poblacional de los ingresos de todos los hogares de esa

ciudad. Suponga que  = $100.

Solución.

Sea X el ingreso familiar mensual de esa ciudad cuyo promedio  se quiere estimar a

partir de una muestra aleatoria de tamaño n =100. La estimación puntual de es

X  500 . Para el nivel de confianza 1-=0.95, en la tabla normal estándar se

encuentra: z1 / 2  z 0.975  1.96 .

 100
Entonces X  z 0.975  500 (1.96)   500 10
n 100

Luego, el intervalo de confianza del 95% para  es: [480.4, 519.6]

Esto es, se tiene una confianza del 95% que el promedio del ingreso familiar  de esa

ciudad, está en el intervalo [$480.4, $519.6].

Ejercicio. Un analista de investigación de mercados escoge una muestra aleatoria de

100 clientes de un conjunto de 500 clientes de un gran centro comercial que

declararan ingresos mayores a 1,500 soles. El encuentra que los clientes de la

muestra gastaron en la tienda un promedio de S/. 2500.

Estimar el gasto promedio de la población finita al nivel de confianza del 95% .

Suponga que la desviación estándar de la población es  = S/.300.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 7

1.1.2. Intervalo de confianza para la media: Varianza 2 desconocida.

A) Población no normal

Si la población no es normal pero el tamaño de la muestra es suficientemente grande

(n  30), se utiliza la desviación estándar S de la muestra, como estimación puntual

de la desviación estándar  de la población. Entonces, el intervalo de confianza del

(1- ) x 100% para  es aproximadamente:

S S
X  Z α/2 ·  μ  X  Z α/2 ·
n n

Observación 2. Cuando la población es finita de tamaño N y el tamaño de la muestra

constituye más del 5% del tamaño de la población, el intervalo de confianza del

(1- ) x 100% para la media  de una población con varianza desconocida y muestra

grande es:

S Nn S Nn
X  Z α/2 ·  μ  X  Z α/2 ·
n N 1 n N 1

B) Población normal

Si X y S son la media y la desviación estándar respectivamente de una muestra

aleatoria de tamaño n (n <30) escogida de una población normal con varianza 2

desconocida, entonces, el intervalo de confianza del (1- ) x 100 para  es:

S S
X  t α/2, n 1 ·  μ  X  t α/2, n 1 ·
n n
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 8

Observación 3. Cuando la población es finita de tamaño N y el tamaño de la muestra

constituye más del 5% del tamaño de la población, el intervalo de confianza del (1-

)x100% para  de una población normal con varianza desconocida y muestra

pequeña es:

S Nn S Nn
X  t α/2, n 1 ·  μ  X  t α/2, n 1 ·
n N 1 n N 1

Ejemplo 4.2. El peso neto de las latas de café instantáneo de un producto, debe tener

un peso neto de 280 gramos. Un inspector de la oficina de defensa al consumidor

tomo una muestra aleatoria de 5 latas de café obteniendo los siguientes pesos netos

en gramos:

280, 290, 285, 275, 284

a) Indicar si es razonable que el inspector, usando un intervalo de confianza del

95% ordene que se multe al productor.

b) ¿Con que grado de confianza se estima que el contenido promedio de café tenga

los límites de confianza 277.432 y 288.168?

Suponga una distribución normal de los pesos netos.

Solución.

a) Sea X el peso de los contenidos de café por lata, cuyo promedio  se quiere

estimar a partir de una muestra aleatoria de tamaño n = 5. Se supone que la

distribución de X es normal con desviación estándar  no conocida.

Para 1 -  = 0.95 y n -1 = 4 grados de libertad en la tabla t- Student se encuentra

t / 2, n 1 = t 0.025, 4  2.776 .
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 9

De la muestra se obtiene X  282.8 y S  5.63

Luego tenemos:

S
X t α/2, n 1 ·  282.8 2.776  5.63/ 5  282.8 6.99
n

Luego, el intervalo de confianza del 95% para  es: [275.81, 289.79]

Como el intervalo cubre al valor de 280 gramos, entonces es posible que el inspector

no multe al productor.

b)

  [277.432, 288.168] con confianza 1- . El límite superior es:

X  t α/2, n 1 ·S/ n  282.8  t α/2, n 1  5.63/ 5  288.168

de donde resulta: t / 2, 4  2.132 ,  / 2  0.05 ,   0.10 y 1    0.90 .

1.1.3. Determinación del tamaño de muestra necesario para estimar la media.

Se puede determinar que tan grande debe ser el tamaño de la muestra, n, de manera

que si  se estima por X , el error de estimación no sea mayor que un valor dado e.

Entonces, si X estima a , entonces, se tiene una confianza del (1- ) x 100% de

que el error no será mayor que el valor dado e cuando el tamaño de la muestra sea

2
 Z ·σ 
n   α/2 
 e 
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 10

Si la población es finita de tamaño N y el muestreo es sin sustitución, error estándar

de  X  ( / n ) ( N  n) /( N  1) y el valor de n se calcula por:

z2 / 2 2 N
n
z2 / 2 2  e 2 ( N  1)

Ejemplo 4.3. Se desea realizar una encuesta en un gran sector de un área

metropolitana para determinar el ingreso familiar promedio de los 30 000 hogares de

ese sector. Se desea que el valor del estimador de la media se encuentre a S/.30.00 de

la media verdadera con un nivel de confiabilidad de 99%. Se va utilizar una

desviación estándar muestral igual a S/.200.00 que se obtuvo en una encuesta

anterior como estimador de la desviación estándar de la población. ¿Qué tamaño

debe tener la muestra que se necesita?

Solución. Tenemos

e = 30,  =200, N = 30000, 1-  = 0.99 y Z 0.995  2.58

Si sustituimos estos valores en la formula para n, se tiene:

z2 / 2 2 N ( 2.58) 2 ·(200) 2 (30000)


n   292.96  293
z2 / 2 2  e 2 ( N  1) (2.58) 2 (200) 2  (30) 2 (29999)

Por tanto, se necesitará una muestra de tamaño n = 293 hogares.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 11

1.2. Intervalo de confianza para la diferencia entre dos medias.

1.2.1. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y


 12 conocidas.

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de


tamaños n1 y n2 escogidas respectivamente de dos poblaciones con varianzas  12 y  12
conocidas, entonces, el intervalo de confianza del (1- ) x 100% de 1   2 es:

(X 1  X 2 )  Z α/2 σ12 /n 1  σ 22 /n 2  μ 1  μ 2  (X1  X 2 )  Z α/2 σ 12 /n 1  σ 22 /n 2

Ejemplo 4.4. Un agente de compras de una compañía está tratando de decidir si

compra la marca A o la marca B de cierto tipo de focos ahorradores de energía. Para

estimar la diferencia entre las dos marcas se lleva a cabo un experimento con dos

muestras aleatorias independientes de 10 focos de cada marca resultando las medias

de vida útil respectivas de 1,230 horas y 1,190 horas. Estimar la verdadera diferencia

de las dos medias de vida útil, mediante un intervalo de confianza del 95%. ¿Es

acertada la decisión del agente si adquiere cualquiera de las dos marcas?-

Suponga que las dos poblaciones tienen distribución normal con desviaciones

estándares de 120 y 60 horas.

Solución.

La estimación puntual de 1   2 es la diferencia de las medias muestrales:

X 1  X 2 = 1230 - 1190 = 40

 12  22 (120) 2 (60) 2
El error estándar de X 1  X 2 es:  X  X      42.43
1 2
n1 n2 10 10
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 12

Para 1 -  = 0.95 se encuentra que Z  / 2  Z 0.025  1.96

Los límites de confianza inferior y superior respectivamente de 1   2 son:

( X 1  X 2 ) Z  / 2  12 / n1   22 / n2  40 1.96( 42.43)  40 83.1628

Luego, el intervalo de confianza aproximado del 95% para 1   2 es:

 43.16  1   2  123.16

Dado que el valor 0  [-43.16, 123.16], se concluye que 1   2 y que no hay

diferencias significativas entre las medias de las vidas útiles de los focos de las

marcas A y B. Por tanto, el agente de compras puede adquirir cualquiera de las dos

marcas.

1.2.2. Intervalo de confianza para la diferencia entre dos medias: Varianza  12 y


 12 desconocidas.

A) Poblaciones no normales.

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes

de tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones cuyas

distribuciones son no normales con varianzas  12 y  12 desconocidas, entonces,

siempre que los tamaños de las muestras sean (n1  30 y n2  30), los parámetros 1 y

2 se estiman puntualmente por S1 y S2. El intervalo de confianza del (1- ) x 100%

de 1   2 es entonces:
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 13

( X 1  X 2 )  Z  / 2 S12 / n1  S 22 / n2  1   2  ( X 1  X 2 )  Z  / 2 S12 / n1  S 22 / n 2

B) Poblaciones normales.

B1) Varianzas supuestas iguales:  12   22   2

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaños n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas  12 y  12
desconocidas e iguales, entonces, el intervalo de confianza del (1- ) x 100% de 1   2 es:

(X1  X 2 )  t α/2,n1  n 2  2 ·Sc 1/n 1  1/n 2  μ 1  μ 2  (X1  X 2 )  t α/2,n1  n 2 2 ·Sc 1/n 1  1/n 2

El valor de t / 2 , n1  n2  2 , se encuentra en la tabla t - student con n1 + n2 - 2 grados de

libertad, tal que P (T  t / 2, n1 n2  2 )   / 2 .

2
El estimador de la varianza común, S c , es definida por:

(n1  1) S12  (n2  1) S 22


S c2 
n1  n 2  2

B2) Varianzas supuestas distintas:  12   22

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaños n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas  12 y  22
desconocidas pero distintas, entonces, el intervalo de confianza del (1- ) x 100% de 1   2 es:
El valor de t1 / 2, g , se encuentra en la tabla t-student con g grados de libertad,
( X 1  X 2 )  t α/2,g · S12 /n 1  S 22 /n 2  μ 1  μ 2  (X 1  X 2 )  t α/2,g · S12 /n 1  S 22 /n 2
siendo,
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 14

2
 S12 S 22 
  
g  n1 n2  2
2 2
 S12   S 22 
   
 n1    n2 
n1  1 n2  1

Ejemplo 4.5. Una compañía está tratando de decidir cuál de los dos tipos de

neumáticos A y B va a comprar. Como prueba, compra 8 neumáticos de cada marca y

las pone a trabajar regularmente. El registro de duración de cada tipo de neumático,

proporciona las estadísticas siguientes:

Marca A: X 1  250 km S1 = 40 km

Marca B X 2  280 km S2 = 30 km

Suponga que los tiempos de duración de cada tipo de neumático se distribuyen

normalmente con la misma varianza. Basándose en la construcción de un intervalo de

confianza del 95%, ¿Podría Ud. inferir respecto de cuál marca de neumáticos

preferiría comprar la compañía?.-

Solución. Se supone que las poblaciones de los tiempos de duración son normales

con varianzas desconocidas supuestamente iguales.

De los resultados muestrales, tenemos:

n1= 8 X 1  250 km S1 = 40 km

n2 = 8 X 2  280 km S2 = 30 km
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 15

(n1  1) S12  ( n2  1) S 22 7·(40) 2  7·(30) 2


Sc    35.3553
n1  n2  2 882

Para 1 -  = 0.95 y 14 grados de libertad, se halla: t 0.025, 14  2.145

Los límites de confianza inferior y superior respectivamente de 1   2 son:

( X 1  X 2 ) t 0.025,14 ·S c 1 / n1  1 / n 2  30 (2.145)(35.3553) 1 / 8  1 / 8  30 37.9186

Luego, el intervalo de confianza aproximado del 95% para 1   2 es:

 67.92  1   2  7.92

Dado que el valor de cero  [-67.92, 7.92], se concluye que 1   2 y que no hay

diferencias significativas entre las medias de los tiempos de duración de las dos

marcas de neumáticos. Por tanto, la compañía puede comprar cualquiera de las dos

marcas de neumáticos.

Ejercicio. Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y

mujeres para realizar determinada tarea. Las experiencias anteriores indican que la

distribución de tiempos tanto para hombres como para mujeres es normal con

varianzas diferentes. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los

siguientes tiempos en minutos:

Hombres: 12, 28, 10, 25, 24, 19, 22, 23, 17

Mujeres: 16, 20, 16, 20, 16, 17, 15, 21


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 16

Mediante un intervalo de confianza del 95% para la verdadera diferencia de los

promedios de hombres y mujeres, ¿se puede concluir que los hombres emplean

mayor tiempo que las mujeres para hacer la tarea.

1.3. Intervalo de confianza para una proporción.

Si p̂ es la proporción de éxitos en una muestra aleatoria de tamaño n, entonces, el

intervalo de confianza del (1- ) x 100% para p es:

pˆ (1  pˆ ) pˆ (1  pˆ )
pˆ  Z 1 / 2  p  pˆ  Z 1 / 2
n n

El valor de Z 1 / 2 se halla en la tabla normal N(0,1), de manera que

P ( Z  z1 / 2 )  1   / 2 .

Ejemplo 4.6. Una encuestadora utiliza una muestra aleatoria de 600 electores que

acaban de votar y encontró que 240 votaron a favor del candidato A.

a) Estimar el porcentaje de electores a favor de A en toda la población, utilizando un

intervalo de confianza del 95%.

b) Si con la misma muestra la proporción a favor de B se estima en 38% con una

confianza del 98% que el error no es mayor a 4.62%, ¿Se puede proclamar a A

como ganador?.

Solución.

a) La estimación puntual de la proporción p a favor de A en la población, es la

proporción a su favor en la muestra de n = 600 electores, es decir,

ˆ  240 / 600  0.40


p

Para 1 -  = 0.95 se tiene Z 0.975  1.96


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 17

Los límites de confianza inferior y superior de p son respectivamente:

pˆ (1  pˆ ) (0.4)(0.6)
pˆ Z 1 / 2  0.40 (1.96)  0.4 0.0392
n 600

Luego, el intervalo de confianza aproximado del 95% para p es:

0.3608  p  0.4392

Es decir, p 36.08%, 43.92% con confianza del 95%.

b) En este caso el error máximo de estimación de p es:

pˆ (1  pˆ )
e  Z 1 / 2  0.0462
n

Entonces,

El intervalo de confianza del 98% a favor de A es 35.34%, 44.66%

El intervalo de confianza del 98% a favor de B es 33.38%, 42.62%

Dado que la intersección de los intervalos no es vació, no se puede proclamar a A

como ganador. En este caso se dice que hay un empate técnico.

Observación 1. Si se utiliza el valor previo de p̂ de una muestra preliminar o

piloto, el error máximo de estimación de p es:

pˆ (1  pˆ )
e  Z 1 / 2
n

Entonces dado el error máximo e de la estimación de p con confianza de (1- ) x

100%, el tamaño n de la muestra resulta:


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 18

( Z 1 / 2 ) 2 pˆ (1  pˆ )
n
e2

Ejemplo 4.7. Antes de una lección presidencial, un determinado partido político está

interesado en estimar la proporción de electores favorables a su candidato. Una

muestra piloto de 100 electores reveló que 60% de los electores eran favorables al

candidato en cuestión.

a) Determine el tamaño de muestra necesario para que el error cometido en la

estimación, sea a lo más 0.01 con probabilidad de 0.90

b) Si, en la muestra final (con tamaño igual al obtenido en (a), se observó que

55% de los electores eran favorables al candidato en cuestión, construya un

intervalo de confianza para la proporción p.

Solución.

a) El estimador puntual de p es ˆ  0.60 .


p

Para 1- = 0.90 se tiene Z 1 / 2  Z  0.95  1.645 . Luego, se tiene una confianza de

90% que el error al estimar p no será mayor que 0.01 si el tamaño de la muestra es,

(1.645) 2 (0.6)(0.4)
n  1623.615  1624 electores
(0.02) 2

b) Respuesta [0.55447, 0.56553]


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 19

Observación 2. Si el muestreo es sin reemplazo en una población finita de tamaño

N, entonces el valor del tamaño de la muestra n se calcula por:

( Z 1 / 2 ) 2 pˆ (1  pˆ )·N
n
( Z 1 / 2 ) 2 pˆ (1  pˆ )  e 2 ( N  1)

Si se desconoce p̂ , se puede utilizar el valor de ˆ  0. 5 .


p

Ejemplo 4.8. Una empresa va a hacer un estudio de mercado antes de lanzar un

nuevo producto hacia una población de 30,000 consumidores.

¿Qué tamaño de muestra deberá escoger si quiere tener una confianza del 95% de

que el error de la estimación de la proporción a favor del producto no sea superior al

4%?

Solución.

Para 1- = 0.95 resulta Z 1 / 2  Z  0.975  1.96 .

Utilizando el valor pˆ (1  pˆ )  1 / 4 y N = 30 000 se tiene:

( Z1 / 2 ) 2 pˆ (1  pˆ )·N (1.96) 2 (0.25)·(30000)


n   588.49  589
( Z1 / 2 ) 2 pˆ (1  pˆ )  e 2 ( N  1) (1.96) 2 (0.25)  (0.04) 2 (30000  1)

1.4. Intervalo de confianza para la diferencia entre dos proporciones.

Si p̂1 y p̂ 2 son las proporciones de éxitos en dos muestras aleatorias

independientes de tamaños n1 y n2 respectivamente, entonces, el intervalo de

confianza del (1- ) x 100% de p1  p 2 es


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 20

pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 ) pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 )
( pˆ 1  pˆ 2 )  Z 1 / 2   p1  p 2  ( pˆ 1  pˆ 2 )  Z1 / 2 
n1 n2 n1 n2

El valor de Z 1 / 2 se halla en la tabla normal N(0,1), de manera que

P ( Z  z1 / 2 )  1   / 2 .

Ejemplo 4.9. Un fabricante afirma que su nuevo producto de consumo popular

prefieren más los hombres que las mujeres. Para comprobar tal afirmación, se toma

una muestra aleatoria de 250 hombres y otra de 200 mujeres, y se encuentra que 175

hombres y 120 mujeres prefieren el nuevo producto. Utilizando un intervalo de

confianza del 95% para la verdadera diferencia de proporciones de preferencias entre

los hombres y mujeres, ¿se puede concluir que el fabricante del nuevo producto tiene

la razón?

Solución.

175 120
De los datos del problema se obtiene: pˆ 1   0.7 pˆ 2   0.6
250 200

La estimación puntual del parámetro p1  p 2 , es la diferencia de proporciones

muestrales: pˆ 1  pˆ 2  0.1

El error estándar de la diferencia de proporciones, pˆ 1  pˆ 2 es:

pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 ) (0.7)(0.3) (0.6)(0.4)
ˆ pˆ1  pˆ 2      0.045
n1 n2 250 200

Para 1- = 0.95, se tiene Z 1 / 2  Z  0.975  1.96 .


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 21

Luego,

pˆ 1 (1  pˆ 1 ) pˆ 2 (1  pˆ 2 )
( pˆ 1  pˆ 2 ) Z 1 / 2   0.1 (1.96)(0.045)  0.1 0.0882
n1 n2

En consecuencia, el intervalo de confianza del 95% para p1  p 2 es

0.0118  p1  p 2  0.1882

Dado que el intervalo no contiene al valor cero, debemos concluir que las

proporciones de preferencias en la población son diferentes, esto es, p1  p 2 y dado

que el intervalo contiene valores positivos, hay razones para concluir que p1  p 2 , es

decir que su nuevo producto de consumo popular prefieren más los hombres que las

mujeres.
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 22

CAPITULO II: HIPÓTESIS ESTADÍSTICAS.

2.1. Concepto

Se denomina hipótesis estadística a cualquier afirmación o conjetura que se hace

acerca de la distribución de una o más poblaciones. La afirmación puede referirse

bien a la forma o tipo de distribución de probabilidad de la población o bien referirse

al valor o valores de uno o más parámetros de la distribución conocida su forma. En

las aplicaciones, se supone conocida la forma de la distribución de la población. En

este caso, las hipótesis estadísticas consisten en suponer que los parámetros, que

definen a la población, toman determinados valores numéricos.

Son hipótesis estadísticas, por ejemplo:

1. El ingreso promedio familiar mensual en la ciudad de Piura es no menos de 1300

nuevos soles.

2. La proporción de plantas industriales de cierta región que cumplen con los

estándares de contaminación ambiental es de 0.6.

3. La varianza de la longitud de cierto tipo de objetos es 0.25 cm2.

4. Son iguales las cuentas de gastos de representación de los ejecutivos de dos

departamentos de la empresa, cuyos gastos se distribuyen normalmente con

varianza común σ2.

2.2. Hipótesis nula y alternativa.

Se denomina hipótesis nula y se representa por H0, a la hipótesis que es aceptada

provisionalmente como verdadera y cuya validez será sometida a comprobación


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 23

experimental. Los resultados experimentales nos permitirán seguir aceptándola como

verdadera o si, por el contrario, debemos rechazarla como tal.

Se denomina hipótesis alternativa y se representa por H1 o por Ha, a la hipótesis que

se acepta en caso de que la hipótesis nula H 0 sea rechazada. La hipótesis alternativa

H1 , es pues una suposición contraria a la hipótesis nula.

Si se asume que θ0 es un valor del parámetro desconocido θ de una población cuya

distribución se supone conocida, entonces son hipótesis nulas y alternativas

respectivamente las siguientes afirmaciones:

1) H0 : θ = θ0 , y H1 : θ ≠ θ0

2) H0 : θ ≤ θ0 , y H1 : θ > θ0

3) H0 : θ ≥ θ0 , y H1 : θ < θ0

2.3. Prueba de una hipótesis estadística.

Para tomar decisiones estadísticas, se requieren de las dos hipótesis: la hipótesis nula

y la hipótesis alternativa referida a un parámetro θ.

La prueba de una hipótesis estadística es un proceso que nos conduce a tomar la

decisión de aceptar o rechazar la hipótesis nula H 0, en contraposición de la hipótesis

alternativa H1 y en base a los resultados de una muestra aleatoria seleccionada de la

población en estudio.

La aceptación de una hipótesis significa que los datos de la muestra no proporcionan

evidencia suficiente para refutarla. El rechazo significa que los datos de la muestra lo

refutan.

2.3.1. Tipos de prueba de hipótesis.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 24

El tipo de prueba depende básicamente de la hipótesis alternativa H1. Se denomina

prueba de una cola a toda hipótesis donde la alternativa H1 es unilateral. Si la

alternativa H1 es bilateral, la prueba se denomina prueba de dos colas.

H0 : θ = θ0 contra H1 : θ ≠ θ0 se denomina prueba bilateral o de dos colas.

H0 : θ ≤ θ0 , y H1 : θ > θ0 se denomina prueba unilateral de cola a la derecha.

H0 : θ ≥ θ0 , y H1 : θ < θ0 se denomina prueba unilateral de cola a la izquierda.

2.4. Errores tipo I y tipo II.

Al tomar la decisión de aceptar o rechazar la hipótesis nula H0 : θ = θ0 en base a los

resultados obtenidos de una muestra aleatoria seleccionada de la población en

estudio; hay cuatro posibles situaciones que determinan si la decisión tomada es

correcta o incorrecta, como se muestra en la tabla 5.1.

Definición 1. Se denomina error tipo I o error de primera especie, al error que se

comete al rechazar una hipótesis nula H0 cuando está realmente es verdadera.

La probabilidad de cometer un error tipo I se denota por α. Entonces,

α = P[error tipo I] = P[rechazar H0 cuando H0 es verdadera]

Definición 2. Se denomina error tipo II o error de segunda especie, al error que se

comete al aceptar una hipótesis nula H0 cuando en realidad es falsa.

La probabilidad de cometer un error tipo II se denota por β. Entonces,


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 25

β = P[error tipo II] = P[rechazar H0 cuando H0 es falsa]

Tabla 5.1

Decisión H0 verdadera H0 falsa


Rechazar H0 Error tipo I Decisión correcta.

Probabilidad: α Probabilidad: 1 - β
Aceptar H0 Decisión correcta. Error tipo II

Probabilidad: 1 - α Probabilidad: β

Definición 3. Se denomina nivel de significancia de una prueba de hipótesis a la

probabilidad de cometer un error tipo I. El nivel de significancia se fija previamente

por lo general en α = 0.05 o α = 0.01.

Definición 4. La potencia de una prueba es la probabilidad de tomar la decisión

acertada, de rechazar H0 cuando ésta es falsa o de aceptar H1 cuando ésta es

verdadera. La potencia de una prueba es calculada por 1 – β.

2.5. Procedimiento de la prueba de hipótesis.

El procedimiento general de la prueba de una hipótesis de parámetro θ se resume en

los siguientes pasos:

1) formular la hipótesis nula H0 : θ = θ0 y la hipótesis alternativa adecuada,

H1 : θ ≠ θ0 ó H1 : θ > θ 0 ó H1 : θ < θ0

2) Especificar el tamaño α del nivel de significancia.

3) Seleccionar la estadística apropiada a usar en la prueba.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 26

4) Establecer la regla de decisión, determinando la región critica de la prueba.

5) Calcular el valor del estadístico de la prueba a partir de los datos de la

muestra.

6) Tomar la decisión de rechazar la hipótesis H0 si el valor del estadístico de la

prueba está en la región critica. En caso contrario, no rechazar H0.

2.6. Prueba de hipótesis acerca de una media.

2.6.1. Prueba de hipótesis acerca de una media, con varianza σ2 conocida.

Sea X la media de una muestra aleatoria de tamaño n seleccionada de una

población con media μ y varianza σ2 supuestamente conocida.

 Si la población es normal N(μ, σ2 ), entonces, la distribución de la estadística X

es exactamente normal N(μ, σ2 / n ) para cualquier valor de n (n ≥ 2).

 Si la población no es normal, pero el tamaño de la muestra n es suficientemente

grande (n ≥ 30 ), ent

 Entonces, la distribución de X es aproximadamente normal N(μ, σ2 / n ).

X  μ0
Como consecuencia, la estadística: Z ~ N(0,1)
σ/ n

Si se supone verdadera la hipótesis nula H0 : θ = θ0 , la estadística especificada por la

hipótesis es entonces, ahora:

X  μ0
Z
σ/ n

1. Prueba unilateral de cola a la derecha.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 27

1. Hipótesis: H0 : μ = μ0 contra H1 : μ > μ0

2. Nivel de significancia: α (0 < α < 1)

X  μ0
3. Estadística de prueba: Z
σ/ n

4. Región critica: La región critica en el rango de variación de z es:

R.C   Z   / Z  Z 1 

0 z1-

Aceptar H0 Aceptar H1

Figura 4.2. Región critica cola a la derecha en escala Z.

5. Decisión ó conclusión:

X  μ0
Si el valor de Z  > Z1- α , se rechazara H0 al nivel de significancia α. No
σ/ n

se rechazara en caso contrario.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 28

2) Prueba unilateral de cola a la izquierda.

1. Hipótesis: H0 : μ = μ0 contra H1 : μ < μ0

2. Nivel de significancia: α

X  μ0
3. Estadística de prueba: Z 
σ/ n

4. Región critica: La región critica en el rango de variación de z es:

R.C   Z  - Z 1 

z1- 0

Rechazar H0 Aceptar H1

Figura 4.3. Región critica cola a la izquierda en escala Z.

3) Prueba bilateral o de dos colas.

En este caso las Hipótesis son: H 0 : μ = μ0 contra H 1 : μ ≠ μ0


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 29

La región crítica es:

R.C   Z  - Z / 2 ó Z  Z /2 

- z/2 0 z/2

Rechazar H0 Aceptar H0 Rechazar H0

Figura 4.4. Región critica bilateral en escalas Z.

Ejemplo 4.10. Al estudiar si conviene tener o no una sucursal en la ciudad de

Sullana, la gerencia de una gran tienda comercial de Lima, establece el siguiente

criterio para tomar una decisión.: Abrir la sucursal sólo si el ingresos promedio es no

menos de S/ 1,500 y no abrirla en caso contrario.

Si una muestra aleatoria de 100 ingresos familiares de esa ciudad a dado una media

de S/ 1,440.

a) ¿ cual es la decisión a tomar al nivel de significancia del 5%?.-

b) calcular la potencia de la prueba si el ingreso promedio realmente es 1464.

Suponga que la distribución de los ingresos tiene una desviación estándar igual a 240

nuevos soles.
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 30

Solución.

Sea X la variable aleatoria que representa los ingresos familiares mensuales de los

pobladores de Sullana.

a)

1. Hipótesis: H0 : μ = 1500 ( ó H0 :μ ≥ 1500 ) (se abre la sucursal)

H1: μ < 1500 ( no se abre la sucursal)

2. Nivel de significancia: α = 0.05

3. Estadística de prueba: como la población de los ingresos no es normal, pero

n = 100 es grande, por el teorema del límite central, la estadística apropiada

es:

X  μ0
Z
σ/ n

cuya distribución es aproximadamente normal N(0,1).

4. Región critica: Si se supone verdadera la hipótesis nula H0 : μ = 1500, para

α = 0.05 y la alternativa unilateral de cola a la izquierda, en la distribución de

Z, se encuentra el valor critico Zα = Z0.05 = -1.645

α = 0.05

z0.05 = -1.645 0
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 31

Luego la región critica en la variable de Z es : R.C   Z  - 1.645 

5. Cálculos: De la muestra se tiene X  1440

X  μ0 1440  1500
Z   2.5
σ/ n 240/ 100

6.- Decisión.- Dado que Z = -2.5 ε R.C, debemos rechazar H0 y concluir con

no abrir la sucursal en Sullana.

b) La probabilidad β de aceptar H0 cuando realmente es μ= 1392 (error tipo II) es:

 1460.52  1392 
β  P X  1500  1.645  24  P X  1460.52/μ  1392  P  Z  
 240/ 100 

= P Z  2.86  0.0021

Luego la potencia de prueba es: 1- β = 1 – 0.0021 = 0.9979.

NOTA. Método del valor P de la prueba.

Otra forma de establecer la regla de decisión, es calculando el valor de P, a partir del

valor absoluto de Zk= ( Z k  (X  μ 0 )/(σ/ n ) , que se obtiene de la muestra, de

manera que:

a) P = P(Z > zk) (cola a la izquierda)

b) P = P(Z < zk) (cola a la derecha)

c) P = P(Z < - zk) + P(Z > zk) = 2P(Z > zk ) (para dos colas)
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 32

Si el valor de P < α , entonces, se rechazará H 0. No se rechazará H0 , en caso

contrario.

Los programas estadísticos ( Statgraphics, SPSS, Minitac, entre otros) contienen el

método del valor P en las pruebas de hipótesis.

En el ejemplo 1, el valor absoluto de Zk es igual a 2.5, entonces,

P  P(Z  2.5)  P(Z  2.5)  0.5  P(0  Z  2.5)  0.0062

dado que P = 0.0062 < α = 0.05, se debe rechazar H 0 , con un riesgo α = 0.05 y que

este valor de Zk sólo ocurrirá en 62 casos de 10,000 experimentos. Una región critica

de tamaño 0.0062 es muy pequeña y, por tanto, es poco probable que se cometa error

tipo I.

Ejemplo 4.11. Un proceso automático llena latas de conservas de atún. Si el peso

neto medio del contenido es 170 gramos se afirma que el proceso está controlado, en

caso contrario, el proceso no está controlado. En el proceso de enlatado se ha

determinado que los pesos netos del contenido en las latas se distribuyen como una

normal con desviación estándar de 20 gramos. Si una muestra aleatoria de 16 latas

llenas de atún ha dado el peso neto medio de 165 gramos, ¿se podría concluir que el

proceso esta fuera de control al nivel de significancia 5%?.-

Solución.

Sea X la variable aleatoria con la que se representa el peso neto del contenido en las

altas de atún
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 33

1. Hipótesis: H 0 : μ = 170 (el proceso está controlado)

H 1 : μ ≠ 170 (el proceso está fuera de control)

2. Nivel de significancia: α = 0.05

3. Estadística de prueba: como la población del contenido neto de atún es normal,

N(170, (20)2), la estadística apropiada es:

X  μ0
Z ~ N(0, 1)
σ/ n

4. Región critica: Para α = 0.05 y la alternativa bilateral, en la distribución de z,

se encuentra el valor critico:

Zα = Z0.975 = 1.96

- 1.96 0 1.96

Luego la región critica en la variable Z es: R.C = { Z< -1.96 ó Z > 1.96 }

5. Cálculos: De la muestra se tiene X  165 , entonces el valor de Z es:


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 34

X  μ0 165  170
Z   1
σ/ n 20 / 16

6. Decisión. Dado que el valor Z = -1  R.C, no debemos rechazar H0 y

concluir que el proceso de enlatado esta controlado (bajo control).

2.6.2. Prueba de hipótesis acerca de una media, con varianza σ2 desconocida.

A) Población no normal.

Si la población no tiene distribución normal y si la varianza es desconocida, para

probar hipótesis acerca de la media μ, sólo si, el tamaño de la muestra es grande (n ≥

30), se utiliza la estadística:

X  μ0
Z
S/ n

cuya distribución es aproximadamente N (0,1).

Luego, las regiones criticas de las pruebas de H 0: μ = μ0 contra las alternativas

respectivas H1: μ ≠ μ0 ó H1: μ > μ 0 ó H1: μ < μ0 son las mismas (aproximadamente

de la sección anterior).

B) Población normal.

Si la población tiene distribución normal N (  ,  2 ) , donde μ y σ2 son

desconocidas, para n ≤ 30 la estadística de prueba acerca de la media μ es:

X  μ0
T ~ t ( n 1)
S/ n

1) Prueba bilateral o de dos colas.

1. Hipótesis: H0 : μ = μ0 contra H1 : μ ≠ μ0

2. Nivel de significancia: α ( 0 < α < 1)


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 35

X  μ0
3. Estadística de prueba: T 
S/ n

4. Región critica: la región critica en el rango de variación de t es:

R.C  { T   t ( /2,n 1) ó T  t ( /2,n 1) }

α/2 α/2

- t/2 0 t/2

Rechazar H0 Aceptar H0 Rechazar H0

Figura 4.5. Región critica bilateral en escala t.

5. Decisión. Se rechazará H0 con riesgo α, si el valor de t  R.C. No se rechazará H0

en caso contrario.

2) Prueba unilateral de cola a la derecha.

En este caso las hipótesis son H0 : μ = μ0 contra H0 : μ > μ0

La región critica en el rango de variación de T es: R.C = {T > t (1-α, n-1)}

0 t1-

Aceptar H0 Rechazar H0

Figura 4.6. Región critica cola a la derecha en escala t.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 36

3) Prueba unilateral de cola a la izquierda.

En este caso las hipótesis son H0 : μ = μ0 contra H0 : μ < μ0

La región critica en el rango de variación de T es: R.C = {T < - t ( α, n-1)}

- t1-  0

Rechazar H0 Aceptar H0

Figura 4.7. Región critica cola a la izquierda en escala t.

Ejemplo 4.12. Las cajas de cierto tipo de cereal procesados por una fabrica deben

tener un contenido promedio de 160 gramos. Por una queja ante el defensor del

consumidor de que tales cajas de cereal tienen menos contenido, un inspector tomó

una muestra aleatoria de 10 cajas encontrando los siguientes pesos de cereal en

gramos:

157, 157, 163, 158, 159, 162, 159, 158, 156, 161

¿Es razonable que el inspector multe al fabricante?.- Utilice un nivel de significancia

del 5% y suponga que los contenidos tienen distribución normal.

Solución.
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 37

Sea la variable aleatoria X que representa los pesos de las cajas del cereal. Se supone

que la distribución de X es normal con media μ y varianza σ2 desconocida.

1) Hipótesis: H0: μ = 160

H1: μ < 160

2) Nivel de significancia: α = 0.05

3) Estadística de prueba: población normal, con varianza desconocida y muestra

pequeña n =10 < 30, emplearemos la siguiente estadística de prueba:

X  160
T
S/ n

que se distribuye según una distribución t- Student con 9 grados de libertad.

4) Región critica: Con el nivel de significancia α = 0.05 y para una prueba de

hipótesis unilateral de cola a la izquierda, en la tabla de probabilidades t- Student se

encuentra el valor de t( α, n-1) = t(0.05, 9) = 1.833.

Consecuentemente, la región critica es: R.C = { T <-1.833 }

5) Cálculos: De los datos de la muestra se obtiene:

n = 10 , X  159 , S = 2.309,

X  160 159  160


T   1.37
S/ n 2.309 / 10
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 38

6) Decisión: dado que el valor T = -1.37  R.C. debemos aceptar H0 y concluir que

el inspector no multará al fabricante.

Nota. Utilizando el programa Statgraphics, se encuentra la probabilidad

P = P(T <-1.833) = 0.1012 > 0.05, por lo que debemos aceptar H0.

2.7. Prueba de hipótesis acerca de dos medias.

2.7.1. Prueba de hipótesis acerca de dos medias con varianzas σ 12 y σ 22


supuestamente conocidas.

Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de tamaños n 1

y n2 seleccionadas respectivamente de dos poblaciones independientes, con medias μ1

y μ2 y varianzas σ 12 y σ 22 respectivas supuestamente conocidas.

- Si las dos poblaciones son normales, entonces las estadísticas:

X 1 ~ N( μ 1 , σ12 /n 1 ) y X 2 ~ N( μ 2 , σ 22 /n 2 )

Luego la estadística X 1 - X 2 ~ N( μ 1 - μ 2 , σ12 /n 1  σ 22 /n 2 ) .

- Si las dos poblaciones no son normales, pero n1 y n2 son suficientemente

grandes (n1 ≥ 30 y n2 ≥ 30), entonces:

X1 - X 2  N( μ 1 - μ 2 , σ12 /n 1  σ 22 /n 2 )

Luego, según sean las dos poblaciones normales o no, la estadística:


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 39

X1  X 2  (μ 1  μ 2 )
Z
σ 12 σ 22

n1 n 2

tiene distribución exactamente o aproximadamente norma N (0,1).

Si se supone verdadera la hipótesis nula H0 : μ1= μ2 ó H0 : μ1 - μ2 = 0, la estadística

de prueba es:

X1  X 2
Z ~ N(0, 1)
σ12 σ 22

n1 n 2

El valor obtenido de Z, se utiliza para probar H 0 contra cualquiera de las hipótesis

alternativas H0 : μ1 ≠ μ2 H0 : μ1 > μ2 H0 : μ1 < μ2.

1) Prueba unilateral de cola a la derecha.

1) Hipótesis: H0 : μ1 = μ2 contra H1 : μ1 > μ2

2) Nivel de significancia: α

X1  X 2
Z
3) Estadística de prueba: σ12 σ 22

n1 n 2

4) Región crítica: En el rango de variación de Z es: R.C = { Z > Zα }

Z
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 40

0 Z

Aceptar H0 Rechazar H0

Figura 4.8. Región critica cola a la derecha en escalas Z

5) Decisión: Se rechazará H0, si el valor de Z  R.C. No se rechazará H 0 en caso

contrario.

2) Prueba unilateral de cola a la izquierda.

Las Hipótesis son: H0 : μ1 = μ2 contra H1 : μ1 < μ2

La región crítica en los valores de Z es: R.C = {Z < - Z1-α }

3) Prueba bilateral o de dos colas.

En este caso las Hipótesis son: H0 : μ1 = μ2 contra H1 : μ1 ≠ μ2

La región crítica en el rango de variación de Z es:

R.C = {Z < - Z1-α/2 ó Z > Z1-α/2 }

Nota. Cuando las hipótesis son de la forma:

1) H0 : μ1 - μ2 = do contra H1 : μ1 - μ2 ≠ do

2) H0 : μ1 - μ2 = do contra H1 : μ1 - μ2 > do

3) H0 : μ1 - μ2 = do contra H1 : μ1 - μ2 < do
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 41

(X 1  X 2 )  d 0
Z
Estadística de prueba es, σ12 σ 22

n1 n 2

cuya distribución es exactamente o aproximadamente normal N(0,1), según sean las

dos poblaciones normales o no.

Ejemplo 4.13. Un fabricante quiere comparar dos marcas de maquinas, A y B; para

fabricar un tipo de articulo. Observa dos muestras aleatorias de 60 artículos

procesados po A y B respectivamente y encuentra que las medias de proceso

respectivas son 1230 y 1190 segundos. Suponga que σ 1 = 120 segundos y σ2 = 90

segundos.

a) al nivel de significancia del 5%, ¿se puede inferir que la maquina B es más

rápida que la máquina A?-

b) al nivel de significancia del 5%, ¿se puede inferir que la media de B es menor

que la media de A en menos de 7 segundos?-

Solución.

Sean X1 y X2 los tiempos de proceso con las maquinas A y B respectivamente y μ 1 y

μ2 sus medias respectivas.

Se desconocen las distribuciones de probabilidad de X 1 y X2, pero las muestras son

grandes.

a)

1) Hipótesis : H0 : μ1 = μ2 contra H1 : μ1 > μ2

2) Nivel de significancia: α = 0.05


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 42

3) Estadística de prueba : Si se supone verdadera H0 : μ1 = μ2 y para muestras

grandes n1 = 60 y n2 = 60, la estadística apropiada es:

X1  X 2
Z  N(0, 1)
σ12 σ 22

n1 n 2

4) Región critica: En el rango de variación de Z es: R.C = { Z > 1.645 }

5) Cálculos. De los datos se tiene:

n1 = n2 = 60 , X1  1230 , X 2  1190 ;  1  120 y σ 2  90

Luego:

1230 - 1190 40
Z   2.0655
(120) 2 (90) 2 19.365

60 60

6) Decisión. Como el valor de Z = 2.0655  R.C, debemos rechazar H0 y

concluir que la maquina B utiliza menor tiempo en el proceso de fabricación

para dicho tipo de articulo.

b) En este caso, se debe probar H0 : μ1 - μ2 = 7 contra H1 : μ1 - μ2 > 7

Si H0 es verdadera, la estadística de prueba es

(X 1  X 2 )  7
Z ~ N(0, 1)
σ12 σ 22

n1 n 2
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 43

La región critica de la prueba unilateral de cola a la derecha, al nivel de significancia

α=0.05 es la misma como del caso a), es decir:

R.C = { Z > 1.645 }

El valor del estadístico es

(X 1  X 2 )  7 (1230 - 1190) - 7
Z   1.7
σ 2
σ 2 19.365

1 2

n1 n 2

Como el valor de Z = 1.7  R.C. , debemos rechazar H0 y concluir que la Máquina

B utiliza un tiempo promedio menos de 7 segundos debajo del promedio de A.

2.7.2. Prueba de hipótesis acerca de dos medias con Varianzas  12 y σ 22


supuestamente desconocidas.

A) Poblaciones no normales

Si las dos muestras aleatorias n1 y n2 independientes seleccionan respectivamente de

dos poblaciones cuyas distribuciones son no normales con varianzas  12 y σ 22

supuestas desconocidas, entonces, siempre que los tamaños de las muestras sean

grandes: n1 ≥ 30 y n2 ≥ 30, las varianzas  1 y σ 2 se estiman por S1 y S 2 . En este


2 2 2 2

caso, para probar la hipótesis H0 : μ1 – μ2 = 0 se utiliza la estadística:


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 44

(X 1  X 2 )  (μ 1  μ 2 )
Z  N(0,1)
S12 S 22

n1 n 2

B) Poblaciones normales

Sean X 1 y X 2 las medias y S12 y S 22 las varianzas de dos muestras aleatorias

independientes de tamaños n1 y n2 respectivamente, seleccionadas de dos poblaciones

N(μ 1 , σ12 ) y N(μ 2 , σ 22 ) donde μ1 , μ2 ,  12 y σ 22 son desconocidas.

B1) Varianza desconocidas supuestamente iguales ( σ12  σ 22  σ 2 ).

1) Prueba unilateral de cola a la derecha

1) Hipótesis: H0: μ1 = μ2 (ó μ1 - μ2 = 0)

H1: μ1 > μ2 (ó μ1 - μ2 > 0)

2) Nivel de significancía: α

3) Estadística de prueba: Si la prueba nula H 0 es verdadera y si las poblaciones son

normales con varianzas desconocidas supuestas iguales, entonces la estadística de

prueba es:

(X1  X 2 ) (X1  X 2 )
T 
Sc2 S c2 1 1
 Sc 
n1 n 2 n1 n 2

que tiene distribución t- Student con n1 + n2 – 2 grados de libertad.

2
Donde S c el estimador insesgado de la varianza común σ2 es:
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 45

(n 1  1)S12  (n 2  1)S22
S c2 
n1  n 2  2

que tiene distribución t- Student con n1 + n2 –2 grados de libertad.

4. Región crítica: en el rango de variación de T es:


R.C  T  t ( α, n1  n 2  2) 

0 t

Aceptar H0 Rechazar H0

Figura 4.9. Región critica cola a la derecha en T.

2) Prueba unilateral de cola a la izquierda.

Las hipótesis son H0 : μ1 = μ2 contra H1 : μ1 < μ2


La región crítica en este caso será: R.C  T   t (1α, n1  n 2  2) 
Rechazar H0 si el valor de T  R.C. No rechazar H0 en caso contrario.

3) Prueba bilateral o de dos colas.

Las hipótesis son H0 : μ1 = μ2 contra H1 : μ1 ≠ μ2


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 46

La región crítica en este caso será:


R.C  T   t ( α/2, n1  n 2  2) ó T  t ( α/2, n1  n 2  2) 
Rechazar H0 si el valor de T  R.C.

B2) Varianza desconocidas supuestamente distintas ( σ12  σ 22 ) .

Si las varianzas de las dos poblaciones normales independientes son desconocidas

supuestamente diferentes, entonces la estadística.

(X1  X 2 )  (μ 1  μ 2 )
T ~ t
S12 S 22 (g)

n1 n 2

siendo el grado de libertad g dado por:

2
 S12 S 22 
  
n n
g   12 2   2
 S12   S 22 
   
 n1    n 2 
n1  1 n 2  1

si g no es entero, se aproxima al entero mayor más cercano.

Si la hipótesis nula H0 : μ1 = μ2 se supone verdadera, entonces

(X1  X 2 )
T ~ t
S12 S 22 (g)

n1 n 2

El valor del estadístico T se utiliza para probar H 0 contra cualquiera de las hipótesis

alternativas H1 : μ1 ≠ μ2 ó H1 : μ1 > μ2 ó H1 : μ1 < μ2 , las regiones criticas y las

reglas de decisión son similares a los del caso B1.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 47

Ejemplo 4.14. A un administrador en desarrollo de recursos humanos se le pide que

determine si los salarios por hora de los obreros semiespecializados son los mismos

en dos ciudades distintas. El resultado de está investigación se presenta en la

siguiente tabla.

Ciudad Salarios medios por Desviación estándar tamaño de la

hora de la muestra de la muestra muestra

A $ 8.95 $ 0.40 200

B 9.10 0.60 175

Suponga que la empresa desea probar la hipótesis en el nivel 0.05 de que no hay

diferencia entre los salarios por hora de los trabajadores semiespecializados de las

dos ciudades.

Solución.

Sean X1 y X2 las variables aleatorias que representan los salarios por hora de los

obreros semiespecializados de las ciudades A y B respectivamente.

1) Hipótesis: H0 : μ1 = μ2 contra H1 : μ1 ≠ μ2

2) Nivel de significancia: α =0.05

3) Estadística de prueba:
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 48

Si se supone H0 verdadera y dado que los tamaños de las muestras son grandes,

entonces la estadística de prueba a utilizar es:

X1  X 2
Z  N(0,1)
S12 S 22

n1 n 2

4) Región critica: Para α = 0.05 y una prueba de hipótesis bilateral, en la

distribución N(0,1) se encuentra Z0.95 = 1.96. la región critica en la variación de

Z es:

R.C = { Z < -1.96 ó Z > 1.96}

5) Cálculos: de los datos se tiene:

n1 = 200, X 1  $8.95 , S1 = $ 0.40 n2 = 175, X 2  $9.10 , S2 = $ 0.60

entonces,

X1  X 2 8.95 - 9.10 - 0.15


Z    -2.809
S12 S 22 (0.40) 2 (0.60) 2 0.0534
 
n1 n 2 200 175

6) Decisión: Como Z = -2.809  R.C, debemos rechazar la hipótesis H 0 y

llegamos a la conclusión de que las medias de los salarios de obreros

semiespecializados de las dos ciudades son diferentes.

Nota. Con el método del P-valor para la prueba de dos muestras se obtiene:

2P(T>2.809) = 2(0.00248) = 0.00496. dado que p = 0.00496 < 0.05 se debe rechazar

H0 en una prueba bilateral.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 49

Ejemplo 4.15. Una empresa grande de corretaje de acciones desea determinar qué

tanto éxito han tenido sus nuevos ejecutivos de cuenta en la consecución de clientes.

Después de haber terminado su entrenamiento, los nuevos ejecutivos pasan varias

semanas haciendo llamadas a posibles clientes, tratando de conseguir prospectos para

abrir cuentas con la empresa. Los datos siguientes dan el número de cuentas nuevas

que fueron abiertas durante las primeras dos semanas por diez ejecutivas y ocho

ejecutivos de cuenta escogidos aleatoriamente. A un nivel α =0.05 ¿parece que las

mujeres son más efectivas que los hombres para conseguir nuevas cuentas?.-

Se supone que el número de cuentas nuevas se distribuyen como una normal, con

varianzas desconocidas pero iguales.

Número de cuentas nuevas

Ejecutivas de cuenta 12 11 14 13 13 14 13 12 14 12

Ejecutivos de cuenta 13 10 11 12 13 12 10 12

Solución.

Sean X1 y X2 las variables aleatorias que representan los números de cuentas nuevas

de las ejecutivas y ejecutivos respectivamente.

Se sabe que X 1 ~ N( μ 1 , σ 12 ) y X 2 ~ N( μ 2 , σ 22 ) , con σ12  σ 22 :

1) Hipótesis: H0 : μ1 = μ2 contra H1 : μ1 > μ2

2) Nivel de significancia: α =0.05


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 50

3) Estadística de prueba: Si se supone H0 verdadera y dado que los varianzas

poblacionales son iguales, la estadística de prueba es:

X1  X 2
T
S c2 Sc2

n1 n 2

que se distribuye según una t- Student con n1 + n2 –2 =16 grados de libertad.

4) Región critica: Para α = 0.05 y una prueba de hipótesis unilateral a la derecha, en

la distribución t(16) se encuentra t(0.05, 16) = 1.746. La región critica en la variación de

T es:

R.C = { T > 1.746}

5) Cálculos: de los datos se tiene:

n1 = 10, X 1  12.8 , S12  1.06667 n2 = 8, X 2  11 .625 , S 22  1.41071

(n 1  1) S12  (n 2  1) S 22 9·(1.0667)  7·(1.41071)


Sc    1.10327
n1  n 2  2 16

entonces,

X1  X 2 12.8 - 11.625 1.175


T    2.24525
Sc2 S c2 (1.10327) 2 (1.10327) 2 0.523327
 
n1 n 2 10 8
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 51

6) Decisión: Como T = 2.24525  R.C, debemos rechazar la hipótesis H0 al nivel

del 5% y concluir que las mujeres son más efectivas para conseguir nuevas

cuentas.

Nota. Con el Software Statgraphics plus para la comparación de dos muestras se

obtiene: P(T>2.24525) = 0.0196. Dado que p = 0.0196 < 0.05 se debe rechazar H0 en

una prueba unilateral.

Ejemplo 4.16. El encargado de compras de una compañía tiene que escoger entre

dos marcas de maquinas A y B, para procesar cierto producto. Por cuestiones de

precio el encargado desearía comprar la marca A a no ser que haya evidencia de que

la máquina B es más veloz. Se le permitió operar los dos tipos de maquinas durante

un periodo de prueba, escogiendo al azar luego, los tiempos en segundos de 10

objetos procesados por cada máquina:

Máquina A: 55 56 57 56 58 53 54 59 60 57

Máquina B: 50 51 42 50 40 60 53 44 48 58

Utilizando un nivel de significancia del 5% y suponiendo poblaciones de tiempos

normales con varianzas desconocidas pero diferentes, ¿Qué tipo de maquina debería

comprar la empresa?.-

Respuesta. El valor de T es T = 3.1983, se rechaza H0. Concluimos que se debe

adquirir la maquina B.
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 52

2.8. Prueba de hipótesis acerca de una proporción.

Sean X1, X2, ..., Xn una muestra escogida de una población Bernoulli B(1, p), donde

p es la proporción de éxitos en la población.

Sea

X 1  X 2  ...  X n X
p̂  
n n

la proporción de éxitos en la muestra, siendo X el número de éxitos en la muestra.

La estadística X tiene distribución exactamente binomial B(n, p).

Si n es suficientemente grande1, la estadística

X  np pˆ  p
Z    N (0, 1)
np(1  p ) p (1  p ) / n

si se supone verdadera la hipótesis nula H0 : p = p0 , entonces, la distribución

muestral de X es exactamente binomial B(n, p0), y la de la variable aleatoria

X  np 0 pˆ  p 0
Z   N (0, 1)
np0 (1  p 0 ) p 0 (1  p 0 ) / n

Dado el nivel de significancia α, la prueba de la hipótesis nula H 0 : p = p0 , contra

cualquiera de las alternativas H1 : p ≠ p0 ó H1 : p > p0 ó H1 : p < p0 se basa tanto en

la estadística X como en la estadística Z.


1
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 53

2.8.1. Prueba bilateral.

Muestra grande

La prueba es, H0 : p = p0 contra H1 : p ≠ p0

Luego, la región critica en los valores de Z es el intervalo:

R.C  { Z   Z1α/2 ó Z  Z1 α/2 }

X  np 0 pˆ  p 0
Se rechaza H0 si el valor de Z
np0 (1  p 0 )

p 0 (1  p0 ) / n
 R.C. No se

rechazará en caso contrario.

2.8.2. Prueba unilateral de cola a la derecha.

Muestra grande.

Las hipótesis son : Ho : p = po contra H1 : p > po

En este caso, la región critica en los valores de Z es el intervalo:

R.C = {Z >Z1-α }

Se rechaza H0 si el valor de Z  R.C.

2.8.3. Prueba unilateral de cola a la izquierda.

Muestra grande.
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 54

Las hipótesis son: Ho: p = po contra H1 : p < po

La región crítica en los valores de Z es:

R.C = { Z < - Z1-α }

Luego se rechaza H0 si el valor de Z  R.C.

Ejemplo 4.17. Un fabricante afirma que el 30% de todos los consumidores prefieren

su producto. Con el fin de evaluar está afirmación se tomo una m.a de 400

consumidores y se encontró que 100 de ellos prefieren dicho producto.

¿es ésta, suficiente evidencia para inferir que el porcentaje de preferencia del

producto no es 30% ?.- Utilice el nivel de significancia del 1%.

Solución.

Sea p la proporción poblacional de preferencia del producto.

1) Hipótesis: H0: p = 0.30 contra H1 : p ≠ 0.30

2) Nivel de significancia: α = 0.01.

3) Estadística de prueba: Si Ho es verdadera y n es grande, la estadística

pˆ  p 0 pˆ  0.3
Z   N (0, 1)
p 0 (1  p 0 ) (0.3)(0.7)
n n
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 55

4) Región critica: Para α =0.01 y una prueba bilateral, en la distribución de Z se

encuentra el valor critico Z0.995 = 2.575.

Luego, R.C = { Z < -2.575 ó Z > 2.575 }

5) Cálculos:

x 100
N= 400 , x = 100 , pˆ    0.25
n 400

pˆ  p 0 0.25  0.3
Z   2.18
Luego se tiene: p 0 (1  p 0 ) (0.3)(0.7)
n 400

6) Decisión: Como Z =-2.18  R.C, no debemos rechazar H0, y concluimos que el

fabricante tiene la razón.

2.9. Prueba de hipótesis sobre dos proporciones.

Sean X1 y X2 el número de éxitos en dos muestras aleatorias independientes de

tamaños n1 y n2 seleccionadas respectivamente de dos poblaciones de Bernoulli

B(1, p1) y B(1, p2), donde los parámetros p1 y p2 son las proporciones de éxitos

poblacionales.

Sean las proporciones de éxitos muestrales respectivamente:

X1 X2
p̂1  y p̂ 2 
n1 n2

Para n1 y n2 suficientemente grandes (n1 ≥ 30 y n2 ≥ 30 ), la variable


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 56

pˆ 1  pˆ 2  ( p1  p 2 )
Z  N (0,1).
p1 (1  p1 ) p 2 (1  p 2 )

n1 n2

Si H0 : p1 = p2 se supone verdadera, la estadística es:

pˆ 1  pˆ 2
Z  N (0,1).
p c (1  p c ) p c (1  p c )

n1 n2

donde pc es el valor común de los parámetros p1 y p2 cuya estimación insesgada es:

x 1  x 2 n 1p̂1  n 2 p̂ 2
p̂  
n1  n 2 n1  n 2

1) Prueba unilateral de cola a la derecha.

1) Hipótesis: H 0 : p1 = p2 contra H 1: p1 > p2.

2) Nivel de significancia: α

3) Estadística de prueba:

pˆ 1  pˆ 2
Z .
pˆ (1  pˆ ) pˆ (1  pˆ )

n1 n2

4) Región critica: R.C   Z  Z  


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 57

5) Decisión: Se rechaza H0 si el valor de Z  R.C. No se rechaza H0 en caso

contrario.

2) Prueba unilateral de cola a la 3) Prueba bilateral o de dos colas.

izquierda.

Hipótesis: H0: p1 = p2 contra Hipótesis: H0: p1 = p2 contra

H 1: p1 < p2. H 1: p1 ≠ p2.

La Región crítica es R.C   Z   Z   La Región crítica es :

Se rechaza H0 si el valor de Z  R.C. R.C   Z   Z α/2 ó Z  Z α/2 

Ejemplo 4.18. Un patrocinador de un programa especial de TV afirma que el programa

representa un atractivo mayor para los televidentes hombres que las mujeres, pero, el

personal de producción del programa piensa que es igual el porcentaje de televidentes

hombres y mujeres que ven el programa especial. Si una muestra aleatoria de 300

hombres y otra de 400 mujeres revelo que 120 hombres y 120 mujeres estaban viendo el

programa especial de TV. ¿Puede considerarse significativa la diferencia al nivel del

5%?.-

Solución.

Sean p1 y p2 , respectivamente, las proporciones de hombres y mujeres que ven el

programa especial de televisión.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 58

1) Hipótesis: H0: p1 = p2 contra H 1: p1 > p2.

2) Nivel de significancia: α = 0.05

3) Estadística de prueba: Si H0: p1 = p2 es verdadera y las muestras son grandes, la

estadística es:

pˆ 1  pˆ 2
Z  N (0,1)
pˆ (1  pˆ ) pˆ (1  pˆ )

n1 n2

4) Región critica: Para α = 0.05 y una prueba unilateral de cola a la derecha, la región

critica es:

R.C   Z  1.645 

5) Cálculos: los datos de la muestra dan:

Hombres: n1 = 300, X1 = 120 , Mujeres: n2 = 400, X2 = 120,

120 120
pˆ 1   0.4 pˆ 2   0.3
300 400

x 1  x 2 120  120
p̂    0.34
n 1  n 2 300  400

pˆ 1  pˆ 2 0.4  0.3
Z   2.764
pˆ (1  pˆ ) pˆ (1  pˆ ) (0.34)(0.66) (0.34)(0.66)
 
n1 n2 300 400
Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 59

6) Decisión. Como el valor de Z = 2.764  R.C., debemos rechazar H0 y concluir que

los datos presentan evidencia de que el programa representa un mayor atractivo para

los hombres.

CONCLUSIONES

 Antes de realizar un estudio de inferencia estadística sobre una variable, lo

primero es decidir el número de elementos, n, a elegir en la muestra

aleatoria. Para ello consideremos que el estudio se basa en una variable de

distribución normal, y nos interesa obtener para un nivel de significación α

dado, una precisión (error).

 Se denomina hipótesis estadística a cualquier afirmación o conjetura que se

hace acerca de la distribución de una o más poblaciones. La afirmación

puede referirse bien a la forma o tipo de distribución de probabilidad de la

población o bien referirse al valor o valores de uno o más parámetros de la

distribución conocida su forma.


Capítulo 1-2. Intervalos de confianza y prueba de hipótesis medias y proporciones. 60

BIBLIOGRAFIA

 Snedecor, G.W. and Cochran, W.G. 1980. Statistical methods. Seventh Ed. Iowa, The Iowa State

University Press. 507p.

 Steel, R.G.D. y Torrie, J.H. 1980. Principles and procedures of Statistics.McGraw-Hill. 629p

Potrebbero piacerti anche