Sei sulla pagina 1di 31

PRUEBA DE HIPÓTESIS

Media y Proporción

“LO QUE ESCUCHO LO OLVIDO. LO QUE VEO LO RECUERDO. PERO LO QUE HAGO, LO ENTIENDO.”
Plan de clases: 3ra semana

• Motivación.
• Competencias
Inicio
• Saberes previos.
• Definiciones básicas
• Prueba de hipótesis para la media:
• Cuando la varianza es conocida
Construcción • Cuando la varianza es desconocida
• Prueba de hipótesis para la proporción
• Prueba de hipótesis para verificar normalidad (vía minitab)

Cierre
• Retroalimentación.
• Autoevaluación
Los dueños de los centros comerciales
creen que un comprador típico pasa en
promedio 75 minutos, con una
desviación estándar de 15 minutos en
el centro comercial. Se introdujeron
restaurantes de especialidades para
mantener a los compradores en el
centro comercial por mayor tiempo.
Una muestra aleatoria de 45
compradores reveló que el tiempo
medio aumentó a 80 minutos. ¿Se
puede afirmar que el tiempo medio
empleado es mayor a 75 minutos?.
COMPETENCIAS
Identifica los elementos
básicos de una PH

Formula e interpreta
Resuelve problemas, apropiadamente Comprende los errores
usa software e pruebas de hipótesis tipo I y II y sabe como
interpreta resultados para un parámetro calcularlos
del software
con la finalidad de
toma de decisiones.

Realiza la PH para la
media, proporción y
varianza y verifica
suposición de
normalidad de los
datos
Conocimientos previos

Uso de la tabla distribución Normal.

Uso de la tabla t de Student.

Cálculo de estimadores como la media muestral,


varianza muestral o desviación estándar muestral.
Estadística inferencial

La estadística inferencial es el proceso de usar


información de una muestra para describir el estado de
una población. Sin embargo, es frecuente que usemos la
información de una muestra para probar un reclamo o
conjetura sobre algún parámetro de la población. El
reclamo o conjetura se conoce como hipótesis. El
proceso que corrobora si la información de una muestra
sostiene o refuta el reclamo se llama prueba de
hipótesis.
¿Qué es una Hipótesis estadística?
Es una proposición o supuesto sobre los parámetros de una o
más poblaciones. Principalmente sobre la media (µ), varianza
(2 ), proporción (), etc.
¿Qué es una Prueba de hipótesis?
Es un procedimiento basado en:
• Evidencia de la muestra
• La teoría de la probabilidad
Se emplea para determinar si la hipótesis nula es
• Un enunciado razonable y no debe rechazarse
• No es razonable y debe ser rechazado
Tipos de Hipótesis

Hipótesis Nula (H0) Hipótesis Alterna (H1)

 Una afirmación acerca del  Una afirmación que es


valor de un parámetro de la aceptada si la muestra provee
población. la evidencia de que la
hipótesis nula es falsa.
 Lleva los signos igual,
mayor igual y menor igual.  Lleva los signos diferente ,
Mayor o menor ( ≠, > ó <).
Ejemplos de cómo plantear las hipótesis
Traducir al
Establecer Plantear
PROBLEMA lenguaje
el opuesto Hipótesis
estadístico
1. ¿El sueldo promedio de un
H0: µ ≥ 3,500
ingeniero de sistemas es por los µ ≥ 3,500 µ < 3,500
H1: µ < 3,500
menos 3,500 soles mensuales?
2. El tiempo de vida promedio de
una determinada pieza usada en
H0: µ = 20000
el ensamblaje de una marca de µ ≠ 20000 µ = 20000
H1: µ ≠ 20000
computadoras es diferente a
20000 horas.
3. Más del 20% de las amas de
H0: π ≤ 0.20
casa utiliza aceite de maíz. π > 0.20 π ≤ 0.20
H1: π > 0.20
Tipos de Errores
• Rechazar una Hipótesis Nula cuando es cierta.
• La probabilidad de cometer un Error del Tipo I es igual al
Error
nivel de significancia α.
tipo I
• La probabilidad de no cometer el Error del Tipo I es igual a
1- α (nivel de confianza).

• Aceptar (no rechazar) una Hipótesis Nula cuando es falsa.


• La probabilidad de cometer un Error del Tipo II es igual a 
Error (Falso negativo).
tipo II
• La probabilidad de No cometer un Error del Tipo II es igual a
1-  (Potencia).
Resumen de las situaciones posibles cuando se toma una decisión en
prueba de hipótesis:
Decisión Ho es verdadera Ho es falsa
Acepta Ho No hay error Error tipo II
Rechaza Ho Error tipo I No hay error
Procedimiento para una prueba de hipótesis
Definir la hipótesis nula y alterna, traducida a lenguaje
Plantear las hipótesis:
estadístico:
Fijar nivel de
Los valores más usados son: 0.01, 0.05, 0.10.
significancia (α):
Identificar el estadístico
Seleccionar el estadístico de prueba (Z, T, X2, F, etc.)
de prueba:
Determinar la regla de Establecer la regla de decisión bajo las cuales se rechaza o
decisión: no H0.
Sacar conclusiones en base a la evidencia muestral y
Conclusión:
tomar la decisión correspondiente

“LO QUE ESCUCHO LO OLVIDO. LO QUE VEO LO RECUERDO. PERO LO QUE HAGO, LO ENTIENDO.”
Prueba de Hipótesis para la media poblacional (µ)
UNILATERAL A LA UNILATERAL A LA
PASOS BILATERAL
IZQUIERDA DERECHA
H 0 :   0 H 0 :   0 H 0 :   0
1. Hipótesis
H1 :    0 H1 :    0 H1 :    0
2. Nivel de
significación
 puede ser 0.01, 0.05, 0.10, etc
Si s es conocido Si s es desconocido
3. Estadístico x x
de Prueba Zc   N (0,1) Tc   t( n1)
/ n S/ n

4. Decisión y
conclusión

Rechazar H0 si Zc < Za Rechazar H0 si |Zc| > Z1-a/2 Rechazar H0 si Zc > Z1-a


Rechazar H0 si Tc < T(n-1,a) Rechazar H0 si |Tc| > T(n-1,1-a/2) Rechazar H0 si Tc > T(n-1,1-a)
Ejemplo 1

Una máquina está calibrada para embolsar cereales a un peso promedio de


500 gramos. Cada cierto tiempo, el jefe de control de calidad realiza una
inspección para determinar si se debe mandar a calibrar la máquina. Para
tomar una decisión seleccionó una muestra aleatoria de 36 bolsas y encontró
un promedio de 496.5 gramos. Si el peso se distribuye normalmente con
una desviación estándar de nueve gramos, ¿a qué conclusión llegará el jefe
de control de calidad? Use un 5% de significancia.
Se identifica:
Datos:
Elemento: Una bolsa de cereal.
Población: Todas las bolsas de cereal. Promedio poblacional: µ = 500 gramos
Variable: X = Peso (en gramos) de las bolsas Muestra aleatoria: n = 36 bolsas
de cereal. Promedio muestral: X  496.5 gramos
Tipo de variable: Cuantitativa continua. Desviación estándar poblacional: σ = 9 gramos
Parámetro a estimar: µ (Peso promedio de
la bolsa de cereal)
1.- Hipótesis nula: Hipótesis alterna

H 0 :   500 H1 :   500
La máquina esta calibrada (las bolsas de cereal La máquina no esta calibrada (las bolsas de cereal
pesan en promedio 500 gr.) no pesan en promedio 500 gr.)

2.-  = 0.05 La variable de estudio es peso (X), y se distribuye como


una normal. Por dato del problema, se sabe que (=9) .

3.- Estadístico de prueba 5.- Decisión


x   496.5  500 Dibujo de la hipotesisi alterna
Zc    2.33
/ n 9 / 36

4.- Valor crítico


Z0 = Z1-/2 = Z0.975 = 1.96 Como Zc= -2.33< ZT=1.96, se rechaza H0.

Conclusión: Con un nivel de significación del 5%, existe evidencia estadística para
concluir que el peso promedio de las bolsas de cereal no pesan 500 gramos. Se justifica
enviar a calibrar la máquina.
Ejemplo 2
En estudios previos se ha determinado que el nivel de colesterol
promedio de pacientes con problemas cardíacos es 220. Un cardiólogo
piensa que en realidad el nivel es más alto y para probar su afirmación
usa la muestra
217 223 225 245 238 216 217 226 202 218
233 235 242 219 221 234 199 236 248 224
Con un 5% de significancia, ¿existe suficiente evidencia estadística para
apoyar la afirmación del cardiólogo?
Se identifica:
Elemento: Un paciente con problemas cardíacos. Datos:
Población: Todos los pacientes con problemas cardíacos.
Promedio poblacional: µ = 220
Variable: X = Nivel de colesterol.
Muestra aleatoria: n = 20 pacientes
Tipo de variable: Cuantitativa continua. ത
Promedio muestral: Estimar por 𝑋.
Parámetro a estimar: µ (Nivel de colesterol promedio)
Desviación estándar poblacional:
Desconocida → Estimar por S.
Por dato del problema, se sabe que  es desconocido, por tanto a partir
de los datos de la muestra debemos calcular la media y desviación
estándar muestral.

Solución:
20

 i  n x
2 2
20 x
x i S i 1
n 1
 13.0944
x i 1
 225.90
n
20

 i     
20

x
2 2 2 2 2
 217  223    248  224 x 217 223  248 224
i
i 1 i 1
20 20

x
i 1
i  4518  i  1 023874
x 2

i 1
1.- Hipótesis nula: Hipótesis alterna

H 0 :   220 H1 :   220
El cardiólogo no tiene la razón El cardiólogo tiene la razón

2.-  = 0.05 La variable de estudio es colesterol (X), y se


supone que distribuye como una normal. Además
 desconocido.
3.- Estadístico de prueba
5.- Decisión
x 225.90  220
Tc    2.02
S / n 13.0944 / 20

4.- Valor crítico


tt  1.729
tt  t n 1;1  t19;0.95  1.729
Como Tc= 2.02 < TT=1.729, se rechaza H0.

Conclusión: Con un nivel de significación del 5%, existe evidencia estadística para concluir que
el colesterol promedio de los pacientes con problemas cardíacos es mayor a 220 (es decir, el
cardiólogo tiene la razón).
Prueba de Hipótesis para la proporción poblacional
UNILATERAL A LA UNILATERAL A LA
PASOS BILATERAL
IZQUIERDA DERECHA
H0 :    0 H0 :    0 H0 :    0
1. Hipótesis
H1 :    0 H1 :    0 H1 :    0
2. Nivel de
significación
 puede ser 0.01, 0.05, 0.10, etc

P 0
Zc  x
3. Estadístico
 0 (1   0 ) P
de Prueba n
n

4. Decisión

Rechazar H0 si Zc < Za Rechazar H0 si |Zc| > Z1-a/2 Rechazar H0 si Zc > Z1-a


Ejemplo 3:

Se debe decidir si los lotes que llegan a una fábrica deben ser aceptados o
devueltos al proveedor. Los artículos de este lote vienen con una garantía de
10% de artículos defectuosos. Si hay evidencia que es más de 10% se
rechazará el lote. Para tomar una decisión se elige una muestra aleatoria de
625 artículos y se encuentran que 550 no son defectuosos. ¿Cuál será la
decisión? Use α = 0.01

Se identifica:
Datos:
Elemento: Un artículo.
Proporción poblacional: π = 0.10
Población: Lote de artículos. No defectuoso
Muestra aleatoria: n = 625 artículos
Variable: X = Estado de artículo Defectuosos
Proporción muestral: Estimar por P
Tipo de variable: Cualitativa nominal. x 550
→P= = = 0.88
Parámetro a estimar: π (Proporción de artículos n 625
defectuosos)
1.- Hipótesis nula: Hipótesis alterna

Ho:  ≤ 0.10 H1:  > 0.10


No se rechaza el lote. Se rechaza el lote
2.-  = 0.01
5.- Decisión
3.- Estadístico de prueba
P  0.12  0.10
Zc    1.667
 (1    0.10(1  0.10)
n 625

4.- Valor crítico Como Zc= 1.667 < ZT =2.33, no se


rechaza H0.
Z0 = Z1- = Z0.99 = 2.33

Conclusión: Con un nivel de significación del 1%, no existe suficiente


evidencia estadística para concluir que más del 10% de los artículos
son defectuosos. No hay razón para rechazar el lote.
¿Cómo calcular el p-valor?
UNILATERAL A LA
BILATERAL UNILATERAL A LA DERECHA
IZQUIERDA
p  valor  2(1  F ( Z c ) )
p  valor  F ( Z c ) p  valor  1  F (Z c )
Z c siempre 

¿Cómo interpretar?
Si p-valor < α, rechazar Ho, es decir, la prueba es significativa
Si p-valor > α, no rechazar Ho, es decir, la prueba no es significativa

¿Qué significa?

El “p-value” llamado el nivel de significación observado, es el mínimo


valor de  al cual se rechazaría la hipótesis nula. Un “p-value” cercano a
0 indica que es muy poco probable que H0 ocurra por lo que estaremos
inclinados a rechazarla.
PRUEBA DE NORMALIDAD: ANDERSON DARLING
(con Reporte Minitab)
Se utiliza esta prueba para verificar si los datos provienen o no de
una población con distribución normal.

Hipótesis Nula Hipótesis Alterna


La variable se distribuye como La variable no se distribuye
una distribución normal como una distribución normal

Nivel de significación:  puede ser 0.01, 0.05, 0.10, etc

Decisión: Si p-valor > α se acepta Ho


Si p-valor < α se rechaza Ho
Ejemplo 4:
Verificar si los siguientes datos se distribuyen como una normal.
1.- Planteamiento de hipótesis
Ho: La variable aleatoria se
comporta como una distribución
normal
H1: La variable aleatoria No se
comporta como una distribución
normal.
2.- Nivel de significación: α =0.05
3.- Decisión
Como p-valor = 0.177 > 0.05, se
acepta H0. Es decir, al nivel de
significación de 5% los datos se
distribuyen como una normal
Ejemplo 5:
La empresa NATUREX S.A invertirá en la elaboración de un yogurt de
aguaymanto si al menos hay un 23.5% de consumidores que adquieran el
producto. El jefe del área de marketing realizó un estudio de mercado, en
donde se observó que de sus 400 entrevistados, 90 adquirirán el producto. A
un nivel de significación del 5%, ¿se puede afirmar que la empresa invertirá
en su nuevo producto?

a) Plantee la hipótesis nula y alterna (en forma simbólica y literal).


b) Calcule el estadístico de prueba.
c) Halle el valor crítico.
d) Realice la decisión y conclusión.
e) Calcule el p-valor y tome la decisión estadística con un α = 0.05.
Se identifica:

Elemento: Un consumidor de yogurt.


Población: Todos los consumidores de yogurt.
Variable: X = Adquisición del producto (Si, No)
Tipo de variable: Cualitativa nominal.
Parámetro a estimar: π (Proporción de consumidores que adquieran el yogurt de
aguaymanto)

Datos:
Proporción poblacional: π = 0.235
Muestra aleatoria: n = 400 consumidores
Proporción muestral: Estimar por P
x 90
→P= = = 0.225
n 400
Η 0 : π  0.235 (La empresa invertirá en la elaboración del yogurt)
a) Hipótesis:
Η1 : π  0.235 (La empresa no invertirá en la elaboración del yogur)

Nivel de significancia:  = 0.01


0.225  0.235
Zc   0.47
b) Estadístico de prueba: 0.235  (1  0.235)
400

c) Valor crítico: Z T  Z α  Z 0.05  1.64 o - 1.65


d) Decisión: Como Z c  0.47  Z 0.05  1.64; no se rechaza H 0 .

Conclusión: Con un nivel de significación de 0.05, no se puede rechazar que la proporción de


consumidores es al menos 0.20. Por lo tanto, la empresa si invertirá en su nuevo producto.
e) Cálculo del p_valor:
p  valor  F(Zc )  F(3.54)  0.319
Como p  valor  0.319  α  0.05; no se rechaza H 0
Ejemplo 6: (Cálculo de la potencia)

El gerente de producción de la compañía de cerveza


Inca revisa su línea de producción. El llenado
automático debe dar un contenido medio de 320 cm3.
Para el control de llenado promedio se seleccionó una
muestra aleatoria de 36 unidades del producto y se
encontró un contenido promedio mayor de 317 cm3 con
una desviación estándar de 12 cm3.

a) Calcule β (Probabilidad de cometer error tipo 2)


cuando la verdadera media es de 312 cm3
b) Calcule la potencia: 1 - β (Probabilidad de no cometer
error tipo 2)
Datos: µ = 320 x  317
n = 36 unidades s  12
0  312 (verdadera media)

a) Cálculo de β:   P( x  317 / 0  312) Estandarizando:


x  0 317  312 x  0
  P(  ) z 
s n 12 36 s n

  P( z  2.5) Buscando en la tabla Z


  1  P( z  2.5) 1  0.99379  0.00621
Se aplicó la propiedad:
P(Z > z) = 1 – P(Z ≤ z): Complemento (Estadística 1)
b) Cálculo de la potencia: 1 – β
1    1  0.00621  0.99379
Pregunta de auto examen

En una encuesta de Gallup se preguntó a 1087


familias seleccionadas aleatoriamente “¿en los fines
de semana salen fuera de la ciudad?”. El 62% de
las personas afirmaron salir de la ciudad. Al nivel
de significación de 5% se puede afirmar de que la
mayoría de las familias salen de la ciudad en los
fines de semana?.
Preguntas de autoevaluación

Para probar una hipótesis para una proporción, se debe verificar que
tanto nπ como n(1- π) debe cumplir___________.

Si se utiliza una prueba de hipótesis unilateral izquierda para la media


cuando la varianza es desconocida, entonces el valor crítico para un
nivel de significación de 5% es _____________.

Al complemento de la potencia se le llama______________.

Al complemento del error tipo I se le denomina _______________.

Una hipótesis estadística es una ___________acerca de uno o varios


parámetros de la población.
Bibliografía:

1.- Anderson, S. (2010) Estadística para Administración y


Economía. Cengage Learning 8va. Edición. México.

2.- Mendehall, W. (2008) Introducción a la Probabilidad y


Estadística. Thomson 12° Edición. México.

3.- Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia


Estadística. Ed. Pontificia Universidad Javeriana 1ra. Edición.
Colombia.

Potrebbero piacerti anche