Sei sulla pagina 1di 32

PRUEBA DE HIPOTESIS

Validando los supuestos de la población

Equipo de
Estadística
UNA VISITA A LA
EMPRESA
CEREALES ÁNGEL

Imagine que usted es el gerente de operaciones de la


Empresa Cereales Ángel y responsable de vigilar la cantidad
empacada en cada caja de cereal. Selecciona y pesa una
muestra aleatoria de 25 cajas, con el fin de calcular la media
muestral e investigar que tanto se acercan los pesos de
llenado a la especificación de 365 gramos establecida por la
empresa. Esta vez debe tomar una decisión y concluir si el
peso medio de llenado de todo el proceso es igual a 365
gramos (o no), con el objetivo de saber si el proceso de
llenado requiere ajustes. ¿Cómo puede tomar esta decisión
de una manera razonada?
CONTENIDO
Prueba de Hipótesis
para la media,
proporción, diferencia
de medias y
diferencia de
proporciones.
DEFINICIONES
I. HIPOTESIS :
•. Es una respuesta a priori a un problema. Es una conjetura sobre
el valor concreto que tiene en realidad.

II. HIPOTESIS ESTADÍSTICA


• Es una afirmación que se hace a cerca de la distribución de
una o más poblaciones.
• Es un enunciado acerca del valor de un parámetro poblacional.

III. PRUEBA DE HIPOTESIS:


• La prueba de una hipótesis, es una regla que cuando los
valores experimentales son observados nos conducen a una
decisión; no rechazar (aceptar) o rechazar la hipótesis.
• Entonces debemos concentrar la atención en dos hipótesis
estadísticas, llamadas: Hipótesis nula e Hipótesis alternativa
IDENTIFICACIÓN DE LA HIPÓTESIS

a) HIPOTESIS NULA (H0):


H0 : = , ≤ , ≥
• Es la hipótesis que se quiere
probar.
• Generalmente es especificada en
una forma exacta
b) HIPOTESIS ALTERNATIVA (H1):
• Es una suposición contraria a la H1 : ≠ , > , <
que se quiere probar.
• Se acepta en caso que la primera
sea rechazada (es decir cuando se
rechaza la Hipótesis Nula).
• Es formulada generalmente con
menos precisión.
ELEMENTOS DE LA PRUEBA HIPÓTESIS
ESTADÍSTICO DE PRUEBA: Es un valor, determinado a partir de la
información muestral, que se utiliza para aceptar o rechazar la hipótesis
nula.

VALOR CRÍTICO: Es aquel valor que se obtiene en función del grado


de confianza seleccionado.

REGLA DE DECISIÓN: Se establece en base a la comparación entre


los valores crítico y de prueba.

REGIÓN DE RECHAZO (RR): Contiene los resultados de la estadística


de prueba para rechazar Ho.

REGIÓN DE ACEPTACIÓN (RA): Contiene los resultados de la


estadística de prueba para aceptar Ho.
ETAPAS BÁSICAS DE UNA PRUEBA DE
HIPÓTESIS

• Plantear la hipótesis nula y alternativa.


• Especificar el nivel de significancia (o confianza)que se
va a utilizar.
• Elegir el estadístico de prueba que debe ser
especificado en términos de un estimador del parámetro
a probar.
• Establecer el valor o valores críticos para rechazar o
aceptar Ho.
• Determinar las reglas de decisión de la prueba.
• Tomar la decisión de aceptar o rechazar Ho
TIPOS DE PRUEBA, REGIÓN CRÍTICA Y NIVEL
DE SIGNIFICACIÓN
A) PRUEBA BILATERAL O DE
AMBAS COLAS
Ho: T = To
H1: T ≠ To
B) PRUEBA UNILATERAL DE COLA
DERECHA
Ho: T ≤ To
H1: T > To
C) PRUEBA UNILATERAL DE COLA
IZQUIERDA
Ho: T ≥ To
H1: T < To
DECISIONES SOBRE LA HIPÓTESIS NULA, CON LAS
PROBABILIDADES ASOCIADAS A CADA DECISIÓN.

HIPÓTESIS NULA HIPÓTESIS NULA


DECISIONES
VERDADERA FALSA

Decisión correcta Error Tipo II


ACEPTAR
Probabilidad = 1-  Probabilidad= 

Error Tipo I
Decisión correcta
Probabilidad= 
RECHAZAR Probabilidad= 1- 
(Nivel de
(Potencia)
significación)
PRUEBA DE HIPÓTESIS PARA LA
MEDIA Y PROPORCIÓN
POBLACIONAL
P. HIPÓTESIS PARA LA MEDIA O PROMEDIO

CASO 1: Estadístico de prueba :


muestra grande (n≥30) X  o
Zo   N (0,1)
/ n

CASO 2: Estadístico de prueba :


muestra pequeña (n<30) X  o
To   T (n  1) g.l
s/ n
EJEMPLO 1

La producción diaria para una planta química local ha promediado 880


toneladas en los últimos años. A la gerente de control de calidad le
gustaría saber si este promedio ha cambiado en meses recientes. Ella
selecciona al azar 50 días de entre la base de datos y calcula el
promedio y desviación estándar de las n = 50 producciones resultando
871 toneladas en promedio y 21 toneladas de desviación. Pruebe la
hipótesis apropiada usando  = 0.05.
Solución:
H0 : = 880 contra H1 : ≠ 880
Estadístico de prueba usamos Caso 1

871  880
Zo   3.03
21 / 50 Z0 = -3.03 -1.96 1.96

Conclusión: como Z0 cae en la región de rechazo, la gerente puede


rechazar la hipótesis nula de que  = 880 y concluir que ha cambiado.
EJEMPLO 2
•La longitud media de una barra de equilibrio es de 43 milímetros. El
supervisor de producciones sospecha que la maquina que produce las
barras se ha desajustado, y le pide al departamento de ingeniería que
investigue esto. El departamento de ingeniería toma una muestra de 12
barras y mide cada una. Los resultados de las mediciones son:
42 39 42 45 43 40 39 41
40
¿Es razonable42 43 que42
concluir la longitud de las barras ha variado? Use 
= 0.02 como nivel de significancia.
Solución:
Datos: ; t(n-1,1-/2)= t(11,0.99) = 2.718
H0 : = 43 contra H1 : ≠ 43
Estadístico de prueba usamos Caso 2
41.5  43
To   2.92
1.78 / 12 T0 = -2.92 -2.718 2.718

Conclusión: como T0 cae en la RR, Se acepta H1 y se concluye que la


media no es 43 milímetros. La maquina deberá ser ajustada.
CASO: UNA VISITA A LA EMPRESA
CEREALES ÁNGEL
•Considerando que la media y desviación estándar de las 25 cajas de
cereal fueron de 368 y 10 gramos respectivamente. Usaremos una
significancia del 0.04 para tomar la decisión mas apropiada.
Solución:
Datos: ; t(n-1,1-)= t(24,0.98) = 2.172
H0 : = 365 contra H1 : ≠ 365
Estadístico de prueba usamos Caso 2
368  365
To   1.50
10 / 25
-2.172 2.172
T0 = 1.50

Conclusión: como T0 cae en la RA, No hay evidencia suficiente para


indicar que el peso medio del proceso es diferente a los 365 gramos,
por lo cual se concluye que el proceso esta no necesita ajustes.
P. HIPÓTESIS PARA LA PROPORCIÓN

CASO 3: Estadístico de prueba :


Para muestras grandes y pequeñas

p  po
Zo   N (0,1)
po (1  po )
n
EJEMPLO 3
A cualquier edad, alrededor de 20% de los peruanos adultos participan en
actividades de acondicionamiento físico al menos dos veces a la semana. No
obstante, estas actividades cambian a medida que las personas envejecen y,
ocasionalmente, los participantes se convierten en no participantes. En una
encuesta local de n = 100 adultos de más de 40 años, un total de 15 personas
indicaron que participaron en estas actividades al menos dos veces a la semana.
¿Estos datos indican que el porcentaje de participación para adultos de más de
40 años de edad es considerablemente menor a la cifra de 20%? Use  = 0.05
para sacar las conclusiones apropiadas.
Solución:
Datos: p = 15/100 = 0.15 ;  = 0.05 ; Z(Z(0.05
H0 : p = 0.20 contra H1 : p
Estadístico de prueba usamos Caso 3
0.15  0.20
Zo   1.25 -1.645
0.20(0.80) Z0 = -1.25
100
Conclusión: No hay suficiente evidencia para concluir que el porcentaje de
adultos de más de 40 años que participan en actividades de acondicionamiento
físico dos veces a la semana es menor a 20%.
PRUEBA DE HIPÓTESIS PARA LA
DIFERENCIA DE DOS MEDIAS CON
MUESTRAS INDEPENDIENTES, DATOS
PAREADOS Y DIFERENCIA DE DOS
PROPORCIONES.
TIPOS DE PRUEBA, REGIÓN CRÍTICA Y NIVEL
DE SIGNIFICACIÓN DOS POBLACIONES
A) PRUEBA BILATERAL O DE
AMBAS COLAS
Ho: T1 = T2 ó T1 - T2 = 0
H1: T1 ≠ T2 ó T1 - T2 ≠ 0
B) PRUEBA UNILATERAL DE COLA
DERECHA
Ho: T1 ≤ T2 ó T1 - T2 ≤ 0
H1: T1 > T2 ó T1 - T2 > 0
C) PRUEBA UNILATERAL DE COLA
IZQUIERDA
Ho: T1 ≥ T2 ó T1 - T2 ≥ 0
H1: T1 < T2 ó T1 - T2 < 0
P. HIPÓTESIS PARA LA DIFERENCIAS DE
MEDIAS MUESTRAS INDEPENDIENTES

CASO 4: Estadístico de prueba :


Muestras grandes (n1 y n2 ≥30) y
( x1  x 2 ) (1   2 )
Zo 
varianzas conocidas  S12 S 22 
  
Distribución Normal Estándar Z  n1 n2 

CASO 5: Estadístico de prueba :


Muestras pequeñas (n1y n2<30) y ( x1  x 2 ) (1   2 )
To 
varianzas desconocidas  1 1
SC   
Distribución T-Student con (n1+n2−2)  n1 n2 
grados de libertad.

Desviación ( n1  1) S12  ( n2  1) S 22
SC 
Mancomunada n1  n2  2
EJEMPLO 4
La empresa A se dedica a la fabricación de
monturas de gafas. Su producción diaria X, en
cientos, sigue una distribución normal. En la
empresa B, la competencia, el número de gafas
producidas Y, también se distribuye normalmente.
Se extraen muestras respectivas de tamaños de 16
y 26 y los resultados obtenidos son los siguientes:
Empresa A Media=90 Varianza=12
Empresa B Media=98 Varianza= 17

¿Ofrecen estos datos evidencia suficiente para


indicar que las medias poblacionales son
diferentes? Sea α =0.05.
•Solución:

Datos: ; con  = 0.05; usamos el Estadístico Caso 5


H0 :  =   contra H1 :  ≠  
( x1  x 2 ) (1   2 ) (90  98)
To    6.47
 1 1  1 1 
SC    3.889   
 n1 n2   16 26 

(16  1)12  ( 26  1)17


SC   3.889
16  26  2

Distribución T= t(n1-n2-2,1-/2)=
-2.021 2.021
t(16+26-2; 0.975) = t(40; 0.975) =2.021 T0 = -6.47

Conclusión: como T0 cae en la RR, Se rechaza H0 y se concluye que la


si existe suficiente evidencia para probar que la producción diaria de la
empresa de gafas A es diferente que la de B, con una confianza del
95%.
EJEMPLO 5

Un editor está interesado en conocer los efectos


sobre unos costosos diseños tricolor para las
cubiertas de los libros de texto. El editor planea
publicar 500 libros de texto de economía y elige
aleatoriamente 40 de ellos para colocarles las
cubiertas caras y otros 40 llevan la cubierta
sencilla. Para aquellos con cubiertas caras, el
promedio de ventas durante el primer año fue de
9.254 con una desviación de 2.107. para los
libros con cubiertas sencillas el promedio de
ventas fue de 8.167 con una desviación de
1.681. asumiendo que las dos poblaciones
tienen distribución normal. Contrastar la
hipótesis de que la media de libros con diseños
de cubierta cara es mayor.
•Solución:

Datos: ; con  = 0.05; usamos el Estadístico Caso 4


H0 :  ≤   contra H1 :  >  

( x1  x 2 ) (1  2 ) (9.254  8.167)


Zo    2.55
 S 2
S 
2
 2.107 1.681
2 2

1
 
2
  
 n1 n2   40 40 

Distribución Z con  = 0.05


Z(0.95) = 1.645
1.645 Z0 = 2.55

Conclusión: como T0 cae en la RR, Se rechaza H0 y se concluye que la


media de las ventas anuales de libros con diseños de cubierta cara es
mayor que la media de las ventas de los libros con diseño simple, con
una confianza del 95%
P. HIPÓTESIS PARA LA DIFERENCIAS DE
MEDIAS DEPENDIENTES O DATOS PAREADOS
 Supongamos que disponemos de una muestra aleatoria de n
pares de observaciones de distribuciones. Denotamos por a la
media muestral y a Sd la desviación estándar observadas para
las n diferencias (Xi – Yi).
a) Prueba bilateral o de ambas colas
Ho: d = 0
H1: d ≠ 0
b) Prueba unilateral de cola derecha
Ho: d ≤ 0
H1: d > 0
c) Prueba unilateral de cola izquierda
Ho: d ≥ 0
H1: d < 0
P. HIPÓTESIS PARA LA DIFERENCIAS DE
MEDIAS DEPENDIENTES O DATOS PAREADOS

CASO 6: Estadístico de prueba T de Student:

_
d
t  t n 1 g. l
sd / n
EJEMPLO 6
Se asume que se tienen
puntajes de la prueba de 10
empleados antes y después
de habérseles impartido
capacitación laboral
adicional, pruébese con un
nivel de significancia de
0.10,
¿existe evidencia para
decir que la media de la
diferencia en los puntaje
antes y después de la
capacitación es diferente?
Los puntajes aparecen en
la tabla:

Solución: Hallando el promedio y desviación estándar
de las di
Hipótesis
Ho: d = 0
_
H1: d ≠ 0 d
t
Estadístico de Prueba sd / n
 0.5
To   2.14
0.736 / 10
Distribución T, con α =0.10
-1.833
t(n-1,1-/2)= t(9,0.95) = 1.833 T0 = -2.14 1.833

Conclusión: como T0 = -2.14 cae en la RR, Se rechaza H0 y se


concluye que si hay diferencia en los puntajes antes y después del
entrenamiento, con una confianza del 90%
P. HIPÓTESIS PARA LA DIFERENCIA DE DOS
PROPORCIONES

CASO 7: Estadístico de prueba :

Zo 
( p1  p2 )  ( P1  P2 ) o  N (0,1)
 1 1
P(1  P )  
 n1 n2 

Donde:
n1 p1  n2 p2
P
n1  n2
EJEMPLO 7
En un estudio diseñado para comparar un nuevo
tratamiento para la migraña con el tratamiento estándar, 78
de 100 individuos que recibieron el tratamiento estándar
respondieron favorablemente y 90 de 100 del nuevo
tratamiento respondieron satisfactoriamente.
¿Ofrecen estos datos evidencia suficiente para indicar que
el nuevo tratamiento es más efectivo? Sea α =0.05 y
determine el valor de P.
•Solución:

Datos: ; con  = 0.05; usamos el Estadístico Caso 7


H0 : P≥ P contra H1 : P< P
P1: proporción de respuesta favorable al tratamiento estándar = 78/100 = 0.78
P2 : proporción de respuesta favorable al tratamiento nuevo = 90/100 = 0.90
Estadístico:

Zo 
( p1  p2 ) ( P1  P2 )o  0.78  0.90

 0.12
 2.32
 1 1  1 1  0 . 0518
P(1  P )   0.84(1  0.84)  
 1 n2 
n  100 100 

78  90
P  0.84
100  100

Z0 = -2.32 -1.645

Conclusión: como Z0 cae en la RR, Se rechaza H0 y se concluye que el


tratamiento nuevo es mas efectivo es el estándar.

Potrebbero piacerti anche