Sei sulla pagina 1di 9

PRUEBA DE HIPÓTESIS Por Oscar Díaz

En los capítulos anteriores se estudió la teoría básica del muestreo. En


esta unidad se verá su aplicación en la prueba de Hipótesis Estadísticas.

2019
Unidad VII: Prueba de Hipótesis.
Por Oscar Díaz

Terminología. estimado 𝑠 2 . La metodología de la prueba o contraste de


hipótesis es una potente herramienta que permitirá al
onsidere una máquina para el llenado de latas de

C bebidas gaseosas que ha sido programada para que


sirva 12 onzas de líquido por lata. Podemos consi-
derar que la población está
ingeniero tomar una decisión con respeto a esta duda de
manera científica.

Hipótesis: Una hipótesis estadística es un enunciado


formada por todas las la- acerca de los valores de los parámetros de una distribución
tas llenadas con esta má- de probabilidad. Por ejemplo, la duda del ingeniero con
quina. Como consecuen- respecto al funcionamiento de la máquina de llenado pude
cia de la variabilidad sa- expresarse de manera formal como:
bemos que cada lata se
𝐻0 : 𝜇 = 12
llena con una cantidad li-
geramente diferentes a 𝐻𝑎 : 𝜇 ≠ 12
12 onzas, pero que en pro-
Al enunciado 𝐻0 : 𝜇 = 12 se le llama la hipótesis nula, y a
medio, la máquina dispensa el líquido a razón de 12 onzas
𝐻𝑎 : 𝜇 ≠ 12 se la llama la hipótesis alterna.
por lata.
Hipótesis Nula: es un enunciado que especifica un va-
Como una medida de control de calidad, si la media del
lor particular para el parámetro que se estudia.
proceso se desvía significativamente de 12 onzas entonces
el proceso de llenado se detiene para ajustar apropiada- La hipótesis nula, 𝐻0 , usualmente representa el procedi-
mente la máquina. Un ingeniero de control de calidad sos- miento de operación estándar (bajo control) de un sistema
pecha que la máquina no está operando adecuadamente. o alguna especificación conocida o norma. Inicialmente,
En otras palabras, el ingeniero sospecha que la media po- este enunciado es asumido como cierto. Por ejemplo, el va-
blacional, a la que representaremos como 𝜇0 = 12, y que lor de 𝜇 = 12 onzas en el proceso de llenado es una hipó-
representa la cantidad media verdadera llenada por lata tesis nula que especifica un valor específico para 𝜇 y repre-
por la máquina, ha tomado algún valor distinto del estándar senta lo que debería suceder cuando la máquina está ope-
de 12 onzas. Si el ingeniero desea probar la validez de esta rando acorde a las especificaciones.
afirmación tendrá que usar algún proceso de inferencia
Hipótesis Alterna: es una declaración sobre el cambio de
estadística para determinar si la media de llenado se ha
la hipótesis nula que el investigador está interesado en
desviado significativamente del valor requerido de 12
comprobar.
onzas por lata.
La hipótesis alterna, 𝐻𝑎 , especifica aquellos valores del
Suponga que una muestra aleatoria de tamaño 𝑛 es
parámetro que representan un cambio importante en el
tomada de esta población que tiene ahora una media
procedimiento de operación estándar (operación fuera de
desconocida 𝜇 (desconocida en el sentido de que existe
control) o de las especificaciones requeridas. En general la
incertidumbre en su valor: ¿sigue teniendo el valor de 12 o
hipótesis alterna es una declaración contradictoria a la
ha tomado algún otro valor?). Como aprendimos en la
hipótesis nula. Si la evidencia muestral sugiere que la
unidad sobre estimación puntual, resulta razonable que
hipótesis nula es falsa, entoces ésta será sustituida por la
nuestra decisión sobre la media de la población se base en
hipótesis alterna. En nuestro ejemplo 𝐻𝑎 especifica los
la media muestral 𝑋̅, y la información adicional sobre la
valores del contenido promedio de líquido servido por la
precisión que proporciona la varianza poblacional 𝜎 2 o su

1
máquina que son mayores que 12 onzas o bien menores • Rechazar 𝐻0
que 12 onzas indicando una operación fuera de control. • No rechazar 𝐻0
Ejemplo 1: Cuando un proceso de manufactura opera En el ejemplo 1, si la hipótesis nula es correcta –es decir
adecuadamente, la longitud promedio de cierta parte que si el sistema opera adecuadamente– esperamos que la me-
se fabrica es de 6.175 pulgadas. Una pequeña cantidad de dia muestral esté muy cercana a 6.175 pulgadas. Pero aque-
variación es tolerada en la longitud, pero aquellas desvia- llas medias muestrales muy grandes o muy pequeñas com-
ciones muy grandes con respecto a la longitud promedio, paradas con 6.175 proporcionan una razón para creer que
en ambas direcciones, no son aceptables. Plantee la hipó- la hipótesis alterna es la correcta.
tesis nula y alterna adecuadas.
En general, si el estadístico de prueba cae en la región de
Solución: Como cada pieza que se produce debe tener una rechazo, la conclusión de la prueba es rechazar 𝐻0 . Si el es-
longitud de 6.175 in podemos hipotetizar que tadístico cae en la región de no rechazo, la conclusión es no
rechazar 𝐻0 . El no rechazo de 𝐻0 significa que no existe su-
𝐻0 : 𝜇 = 6.175
ficiente evidencia como para rechazarla y que por lo tanto
𝐻𝑎 : 𝜇 ≠ 6.175 podría ser verdadera.
¿Cómo decidimos qué hipótesis es la correcta? El proce- Tipos de Pruebas: Podemos realizar los siguientes ti-
dimiento se basa en tomar una muestra aleatoria de la po- pos de pruebas:
blación para determinar si los datos con congruentes con
𝐻0 o con 𝐻𝑎 .
Prueba de dos colas:

Estadístico de Prueba: estadístico calculado con los


datos de la muestra y a partir del cual se basa la decisión de 𝐻0 : 𝜇 = 𝜇0
rechazar o no rechazar 𝐻0 .
𝐻𝑎 : 𝜇 ≠ 𝜇0
Región de Rechazo: (o región crítica) es el conjunto
de valores del estadístico de prueba que conducen al
Prueba de cola superior:
rechazo de la hipótesis nula. El complemento de la región
de rechazo –el conjunto de valores del estadístico de
prueba que no llevan al rechazo de la hipótesis nula– se co-
noce como región de no rechazo. 𝐻0 : 𝜇 = 𝜇0

Valor Crítico: es la frontera entre la región de rechazo 𝐻𝑎 : 𝜇 > 𝜇0


y no rechazo.
Prueba de cola inferior:
Región de Rechazo

Región de Rechazo

𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 < 𝜇0
Región de no
Rechazo
Debido a que el valor verdadero del parámetro es desco-
nocido y la decisión de rechazar o no rechazar 𝐻0 se toma
basados en el valor del estadístico de prueba, podemos co-
Valor Crítico Valor Crítico meter dos tipos de errores:

Error tipo I: Rechazar la hipótesis nula, cando de hecho


Conclusión de una prueba: al realizar una prueba de es verdadera.
hipótesis son posibles dos conclusiones:

2
Error tipo II: No rechazar la hipótesis nula, cuando de Error tipo I: Concluir que el proceso no está operando
hecho es falsa. adecuadamente, cuando de hecho sí lo hace (en otras pala-
bras, concluir que el proceso produce piezas fuera de las
En la siguiente tabla se muestran los diferentes escena-
especificaciones, es decir o muy largas o muy cortas,
rios que pueden presentarse
cuando en realidad produce piezas dentro de los límites to-
Decisión lerados).
Rechazar 𝑯𝟎 No rechazar 𝑯𝟎
Error tipo II: Concluir que el proceso está operando ade-
𝑯𝟎 es verdadera Error tipo I Decisión correcta
cuadamente, cuando de hecho no lo hace (es decir, concluir
𝑯𝟎 es falsa Decisión correcta Error tipo II
que el proceso produce partes con la longitud adecuada,
Denotaremos la probabilidad del error tipo I por 𝛼 y la cuando en realidad las produce o muy largas o muy cortas)
probabilidad del error tipo II por 𝛽. La probabilidad del
Potencia de una prueba: es la probabilidad de
error tipo I también se conoce como el nivel de significancia
rechazar 𝐻0 cuando es falsa.
o el tamaño de la región de rechazo, y se usa para informar
al usuario de la información acerca de cuál es la máxima 𝑃𝑜𝑡𝑒𝑛𝑐𝑖𝑎 = 1 − 𝛽 = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)
probabilidad de cometer un error tipo I o qué tan rara –en
Según lo anterior, la potencia es la probabilidad de re-
términos probabilísticos– debe ser una muestra de tal ma-
chazar correctamente 𝐻0 y podríamos decir que mide la
nera que nos lleve al rechazo de 𝐻0 . El nivel de significancia
«aptitud» de la prueba para comportarse como se requiere.
es una probabilidad que usualmente toma los valores de
En este sentido, la potencia es una medida muy descriptiva
0.05, 0.01 o 0.001. En condiciones perfectas, una prueba
y concisa de la sensibilidad –es decir de la habilidad de la
debe tener probabilidades razonablemente pequeñas de
prueba para detectar diferencias– de una prueba estadís-
los errores tipo I y II.
tica.
𝛼 = 𝑃(𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)
Procedimientos de Prueba para la Me-
𝛽 = 𝑃(𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼) = 𝑃(𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎) dia Poblacional.
En la figura siguiente se ilustran gráficamente los errores tipo I y
El procedimiento general en la prueba de hipótesis con-
tipo II
siste en especificar un valor del error tipo I, y después de-
signar un procedimiento de prueba para que se obtenga un
valor pequeño del error tipo II. Por lo general el error tipo
II es una función del tamaño de muestra y se controla indi-
rectamente. Entre mayor sea el tamaño de muestra utili-
zado en la prueba, menor será 𝛽.
𝛽 𝛼
En las siguientes secciones se revisan los procedimientos
En el control de calidad, a 𝛼 se le conoce como el riesgo para probar hipótesis cuando se ha tomado una sola mues-
del productor, porque denota la probabilidad de que un tra de la población de interés.
lote de buena calidad sea rechazado, o la probabilidad de
Caso I: Una población normal con 𝝈 conocida.
que un proceso que produce valores aceptables de una ca-
racterística particular de calidad sea rechazado por tener Supuesto: población aproximadamente normal y 𝜎 cono-
un desempeño insatisfactorio. Por otra parte, a 𝛽 se le co- 𝜎2
cida. Muestra grande o pequeña. En este caso 𝑋̅~𝑁 (𝜇, 𝑛
).
noce como el riesgo del consumidor, porque denota la pro-
babilidad de aceptar un lote de calidad pobre, o de permitir
Hipótesis nula: 𝐻0 : 𝜇 = 𝜇0
que continúe en operación un proceso que está operando 𝑥̅ −𝜇
Estadístico de prueba: 𝑧 = 𝜎⁄ 𝑛0
de manera insatisfactoria con respecto a alguna caracterís- √
tica de la calidad (Montgomery, 2009). Hipótesis Alterna Región de Rechazo
𝐻𝑎 : 𝜇 > 𝜇0 𝑧 ≥ 𝑧𝛼
Ejemplo 2: Los errores tipo I y II pueden ser descritos de 𝐻𝑎 : 𝜇 < 𝜇0 𝑧 ≤ −𝑧𝛼
la siguiente manera para el ejemplo 1 𝐻𝑎 : 𝜇 ≠ 𝜇0 𝑧 ≤ −𝑧𝛼⁄2 𝑜 𝑧 ≥ 𝑧𝛼⁄2
3
Ejemplo 3: El voltaje de salida de cierto circuito eléctrico gerente? Realice la prueba a un nivel de significancia del
se especifica para que sea 130 V con una desviación están- 5%.
dar de 2.1 V. Una muestra aleatoria de 40 lecturas del vol-
Solución:
taje de salida del circuito, tomadas de manera indepen-
diente, dieron como resultado un voltaje promedio de
128.6 V. Pruebe la hipótesis de que el voltaje de salida es Parámetro de Interés

de 130 V contra la alternativa de que es menor que 130 V. Nivel de significancia (𝛼)

Use un nivel de significancia del 5%. 𝐻0 : 𝐻𝑎 :


Datos: Resultado:
Solución: Estadístico de Prueba

𝜇 = 𝑣𝑜𝑙𝑡𝑎𝑗𝑒 𝑑𝑒 𝑠𝑎𝑙𝑖𝑑𝑎 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑜


Parámetro de Interés
Región de Rechazo:
Nivel de significancia (𝛼)
𝐻0 : 𝜇 = 130 𝐻𝑎 : 𝜇 < 130 0.05

Estadístico de Prueba Datos: Resultado:


𝑥̅ − 𝜇0 𝑥̅ = 128.6
𝑧= 𝑧 = −4.22
𝜎⁄√𝑛 𝜇0 = 130
𝜎 = 2.1 y 𝑛 = 40
Región de Rechazo:

𝑧𝛼 = 𝑧0.05 = 1.645

𝑧 ≤ −1.645
Conclusión:
𝑧 ≤ −1.645
Rechazar 𝐻0 .
Conclusión:
Hay evidencia que el voltaje de salida podría ser menor Caso III: Una población normal con 𝝈 desconocida
que 130 V a un nivel de significancia del 5%.
y muestra pequeña.

Caso II: muestra grande 𝝈 desconocida. Hipótesis nula: 𝐻0 : 𝜇 = 𝜇0


𝑥̅ −𝜇
Supuesto: tamaño de muestra suficientemente grande Estadístico de prueba: 𝑡 = ⁄ 0
𝑠 √𝑛
𝜎2
para garantizar que 𝑥̅ ~ 𝑁 (𝜇, ) Hipótesis Alterna Región de Rechazo
𝑛
𝐻𝑎 : 𝜇 > 𝜇0 𝑡 ≥ 𝑡𝛼
Hipótesis nula: 𝐻0 : 𝜇 = 𝜇0 𝐻𝑎 : 𝜇 < 𝜇0 𝑡 ≤ −𝑡𝛼
𝑥̅ −𝜇 𝐻𝑎 : 𝜇 ≠ 𝜇0 𝑡 ≤ −𝑡𝛼⁄2 𝑜 𝑡 ≥ 𝑡𝛼⁄2
Estadístico de prueba: 𝑧 = 𝑠⁄ 𝑛0

Hipótesis Alterna Región de Rechazo Ejemplo 4: Un fabricante de pinturas afirma que pueden
𝐻𝑎 : 𝜇 > 𝜇0 𝑧 ≥ 𝑧𝛼 pintarse un área de 400 ft 2 con su producto. Para probar
𝐻𝑎 : 𝜇 < 𝜇0 𝑧 ≤ −𝑧𝛼 esta afirmación, se selecciona una muestra aleatoria de 10
𝐻𝑎 : 𝜇 ≠ 𝜇0 𝑧 ≤ −𝑧𝛼⁄2 𝑜 𝑧 ≥ 𝑧𝛼⁄2 galones y se pintan 10 áreas idénticas usando el mismo
equipo. Los resultados fueron los siguientes (en ft 2 )
Ejercicio: El gerente de una empresa asegura que el nú- 310 311 412 368 447
mero promedio de llamadas recibidas en atención al cliente 376 303 410 365 350
no es mayor que 15 por semana. Para corroborar su afirma- ¿Los datos representan evidencia suficiente para contrade-
ción se verificaron las llamadas de 36 semanas que fueron cir la afirmación del fabricante? Haga la prueba a un nivel
seleccionadas de manera aleatoria. Resultó que 𝑥̅ = 17 y de significancia del 5%.
𝑠 2 = 9. ¿La evidencia muestral contradice la afirmación del
Solución: Como no se conoce el valor de 𝜎 lo aproxima-
remos por medio de la desviación estándar muestral, pero
4
antes necesitamos verificar si los datos provienen de una La prueba que se describe a continuación se basa en el
distribución normal. El siguiente diagrama sugiere que po- supuesto que la distribución binomial puede aproximarse
demos suponer normalidad en la población (si bien pre- por una distribución normal. En general esto se cumple si
senta un sesgo a la derecha no presenta valores atípicos) 𝑛𝑝0 ≥ 10 y 𝑛(1 − 𝑝0 ) ≥ 10

Hipótesis nula: 𝐻0 : 𝑝 = 𝑝0
𝑝̂−𝑝0
Estadístico de prueba: 𝑧 =
𝑝 (1−𝑝0 )
√ 0
𝑛
Hipótesis Alterna Región de Rechazo
𝐻𝑎 : 𝑝 > 𝑝0 𝑧 ≥ 𝑧𝛼
𝐻𝑎 : 𝑝 < 𝑝0 𝑧 ≤ −𝑧𝛼
𝐻𝑎 : 𝑝 ≠ 𝑝0 𝑧 ≤ −𝑧𝛼⁄2 𝑜 𝑧 ≥ 𝑧𝛼⁄2
Ejemplo 5: Una empresa de servicios de internet estima
que el 40% de sus clientes posee el servicio de facturación
por cargo automático. En una muestra aleatoria de 100
clientes se encontró que 37% poseen el servicio. A un nivel
de significancia del 1% ¿Existe evidencia para refutar la afir-
mación de la empresa?
Parámetro de Interés μ= verdadera superficie cubierta Solución:
Nivel de significancia (𝛼)
𝐻0 : 𝜇 = 400 𝐻𝑎 : 𝜇 ≠ 400 0.05
P = verdadera proporción de clientes con
Parámetro de Interés cargo automático
Estadístico de Prueba Datos: Resultado:
𝑥̅ = 365.2
𝑥̅ − 𝜇0 𝑠 = 48.417 𝑡 = −2.273 Nivel de significancia (𝛼)
𝑡= 𝐻0 : 𝑝 = 0.4 𝐻𝑎 : 𝑝 ≠ 0.4 0.01
𝑠⁄√𝑛 𝑛 = 10
Estadístico de Prueba Datos: Resultado:
Región de Rechazo: 𝑝̂−𝑝0 𝑝̂ = 0.37
𝛼 𝑧= 𝑝0 = 0.40 𝑧 = −0.61
𝛼 = 0.05 ⇒ = 0.025 𝑝 (1−𝑝0 )
2 √ 0
𝑛 𝑛 = 100
𝑡0.025,9 = 2.262
Región de Rechazo:
𝛼
𝛼 = 0.01 ⇒ = 0.005
2
𝑡 ≤ −2.262 𝑡 ≥ 2.262
Rechazar 𝐻0 . 𝑧0.005 = 2.575
La evidencia sugiere que la superficie cubierta prome-
Conclusión: dio difiere de 400 ft 2 a un nivel de significancia del 5% 𝑧 ≤ −2.575 𝑜 𝑧 ≥ 2.575

𝑧 ≤ −2.575 𝑧 ≥ 2.575
Procedimientos de Prueba para la Pro- No rechazar 𝐻0 .
porción Poblacional. Conclusión: No hay evidencia para refutar la afirmación de la em-
presa a un nivel de 0.01.

En muchos problemas de ingeniería existe interés en una


Procedimientos de Prueba para la Va-
variable aleatoria que sigue una distribución binomial. Por
rianza.
ejemplo, en un proceso de producción los artículos produ-
cidos se pueden clasificar como defectuosos o no defectuo- Revisamos ahora la prueba de hipótesis sobre la varianza
sos y su ocurrencia se puede modelar por medio de la dis- de una población aproximadamente normal. Esta prueba
tribución binomial. Por consiguiente, muchos problemas de resulta de mucha utilidad en los procedimientos de mejo-
toma de decisiones en ingeniería incluyen pruebas de hipó- ramiento de calidad cuando se trata de establecer si los ni-
tesis acerca de 𝑝. veles de dispersión de los procesos se encuentran dentro
de las especificaciones requeridas.

5
Hipótesis nula: 𝐻0 : 𝜎 2 = 𝜎02 Procedimientos de Prueba para la Dife-
(𝑛−1)𝑠2 rencia de Medias.
Estadístico de prueba: χ20 = 𝜎02
Caso I: Poblaciones Normales con Varianzas Cono-
Hipótesis Alterna Región de Rechazo cidas.
𝐻𝑎 : 𝜎 2 > 𝜎02 χ20 ≥ 𝜒𝛼,𝑛−1
2
Hipótesis nula: 𝐻0 : 𝜇1 − 𝜇2 = ∆0
𝐻𝑎 : 𝜎 2 < 𝜎02 χ20 ≤ 𝜒1−𝛼,𝑛−1
2
𝑥̅ −𝑥̅ −∆
Estadístico de prueba: 𝑧 = 1 2 0
𝐻𝑎 : 𝜎 2 ≠ 𝜎02 χ20 ≥ 𝜒𝛼2⁄2,𝑛−1 o 𝜎 2
𝜎 2
√ 1+ 2
2
χ20 ≤ 𝜒1−𝛼 ⁄2,𝑛−1
𝑛1 𝑛2

Hipótesis Alterna Región de Rechazo


𝐻𝑎 : 𝜇1 − 𝜇2 > ∆0 𝑧 ≥ 𝑧𝛼
Ejemplo 6: El administrador de un infocentro cree que la 𝐻𝑎 : 𝜇1 − 𝜇2 < ∆0 𝑧 ≤ −𝑧𝛼
desviación estándar del número de personas que hacen uso 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ ∆0 𝑧 ≤ −𝑧𝛼⁄2 𝑜 𝑧 ≥ 𝑧𝛼⁄2
de las computadoras en un día es superior a 8. Una muestra Ejemplo 7: Un ingeniero químico está interesado en re-
aleatoria de 15 días resultó en ducir el tiempo de secado de cierto tipo de pintura. Se prue-
25 30 5 15 18 ban dos formulaciones. La primera es la formulación tradi-
42 16 9 10 12 cional que durante muchos años han usado y cuyo tiempo
12 38 8 14 27 de secado tiene una desviación estándar de 8 minutos. A
esta formulación se le agregará un nuevo ingrediente que
A un nivel del 10% ¿los datos parecen apoyar la afirmación
se supone reducirá el tiempo de secado sin afectar la varia-
del administrador? Asuma que la variable está normal-
bilidad de los mismos. Se pintan 10 especímenes con cada
mente distribuida.
una de las formulaciones en orden aleatorio resultando en
Solución: tiempos promedios de secado de 𝑥̅1 = 121 minutos y 𝑥̅2 =
σ= verdadera desviación estándar del nú-
112 minutos. ¿Qué conclusión puede obtener el ingeniero
Parámetro de Interés mero de personas que usan el infocentro. a cerca de la efectividad del nuevo ingrediente? Use un ni-
vel de significancia de 0.05. Suponga normalidad.
Nivel de significancia (𝛼)
2 2 0.10 Solución:
𝐻0 : 𝜎 = 64 𝐻𝑎 : 𝜎 > 64
Estadístico de Prueba Datos: Resultado: 𝜇1 − 𝜇2 : verdadera diferencia en los tiem-
Parámetro de Interés
𝑠 2 = 125.4952 pos de secado.
(𝑛 − 1)𝑠 2 𝑛 = 15 χ20 = 27.452 Nivel de significancia (𝛼)
χ20 = 𝐻0 : 𝜇1 − 𝜇2 = 0 o 0.05
𝜎02 𝜎02 = 64 𝐻𝑎 : 𝜇1 > 𝜇2
𝐻0 : 𝜇1 = 𝜇2
Estadístico de Prueba Datos: Resultado:
Región de Rechazo:
𝑥̅1 − 𝑥̅2 − ∆0 𝑥̅1 = 121 𝑧 = 2.52
𝑧=
𝛼 = 0.10 𝑥̅2 = 112
𝜎2 𝜎2 𝜎12 = 𝜎22 = 64
√ 1+ 2
χ20.10,14 = 21.064 𝑛1 𝑛2 𝑛1 = 𝑛2 = 10
∆0 = 0
χ2 ≥ 21.064 Región de Rechazo:

χ2 ≥ 21.064 𝛼 = 0.05
𝑧0.05 = 1.645

Rechazar 𝐻0 .
Hay evidencia que indica que la desviación estándar po-
𝑧 ≥ 1.645
Conclusión: dría ser mayor que 8 a un nivel de significancia de 0.10. Rechazar 𝐻0
El ingeniero puede concluir, a un nivel de 0.05, que aña-
Conclusión: dir el nuevo ingrediente reduce significativamente el
tiempo de secado.

6
Caso II: Poblaciones Normales con Varianzas Des- Caso III: Poblaciones Normales con Varianzas Des-
conocidas pero Iguales. conocidas y Diferentes.

Hipótesis nula: 𝐻0 : 𝜇1 − 𝜇2 = ∆0 Hipótesis nula: 𝐻0 : 𝜇1 − 𝜇2 = ∆0


𝑥̅ −𝑥̅ −∆ 𝑥̅ −𝑥̅ −∆
Estadístico de prueba: 𝑡 = 1 12 10 Estadístico de prueba: 𝑡 = 1 2 0
𝑆𝑝 √ + 𝑠 2𝑠 2
𝑛1 𝑛2 √ 1+ 2
𝑛1 𝑛2

Hipótesis Alterna Región de Rechazo


𝐻𝑎 : 𝜇1 − 𝜇2 > ∆0 𝑡 ≥ 𝑡𝛼,𝑣 Hipótesis Alterna Región de Rechazo
𝐻𝑎 : 𝜇1 − 𝜇2 < ∆0 𝑡 ≤ −𝑡𝛼,𝑣 𝐻𝑎 : 𝜇1 − 𝜇2 > ∆0 𝑡 ≥ 𝑡𝛼,𝑣
𝐻𝑎 : 𝜇1 − 𝜇2 ≠ ∆0 𝑡 ≤ −𝑡𝛼⁄2,𝑣 𝑜 𝑡 ≥ 𝑡𝛼⁄2,𝑣 𝐻𝑎 : 𝜇1 − 𝜇2 < ∆0 𝑡 ≤ −𝑡𝛼,𝑣
(𝑛1 −1)𝑠12 +(𝑛2 −1)𝑠22 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ ∆0 𝑡 ≤ −𝑡𝛼⁄2,𝑣 𝑜 𝑡 ≥ 𝑡𝛼⁄2,𝑣
Donde 𝑠𝑝2 = y 𝑣 = 𝑛1 + 𝑛2 − 2 𝑆2 𝑆2
2
𝑛1 +𝑛2 −2
(𝑛1 +𝑛2 )
1 2
Ejemplo 8: El diseñador de una nueva máquina de cha- Con 𝜈 = 2 2 /𝑛 )2
grados de libertad.
(𝑆2 /𝑛1 ) (𝑆
1 + 2 2
pado asegura que su nuevo diseño es más rápido que la má- 𝑛1 −1 𝑛2 −1

quina que actualmente se usa. Se probaron nueve muestras Ejemplo 9: Se analizan los contenidos de cajas de cereal
aleatorias de manera independiente de cada máquina re- llenados por dos líneas de producción diferentes con el ob-
sultando en la siguiente información: jetivo de determinar si existe diferencia entre ellos. Los re-
Máquina actual Nuevo diseño sultados son los siguientes:
𝑛 9 9 Observación Línea 1 Línea 2
𝑥̅ 35.22 31.56 1 5.83 3.38
𝑠2 24.44 20.03 2 5.66 2.81
3 4.75 7.00
A un nivel del 5%, ¿Puede apoyarse la afirmación del dise- 4 3.00 1.50
ñador? Suponga poblaciones normales con varianzas igua- 5 3.37 5.88
les. 6 3.63 5.25
7 4.00 4.08
Solución:
8 4.63 7.63
9 4.25 4.50
Parámetro de Interés
𝜇1 − 𝜇2 : verdadera diferencia en los tiem- 10 4.13 4.88
pos de chapado.
Nivel de significancia (𝛼) ¿Qué se puede concluir a cerca de los contenidos prome-
𝐻0 : 𝜇1 − 𝜇2 = 0 o 0.05
𝐻𝑎 : 𝜇1 > 𝜇2 dio de ambas líneas de producción? Use 𝛼 = 0.05
𝐻0 : 𝜇1 = 𝜇2
Estadístico de Prueba Datos: Resultado: Solución: Como ambas muestras son pequeñas, necesi-
𝑥̅1 − 𝑥̅2 − ∆0 𝑥̅1 = 35.22 𝑡 = 1.65
𝑡= tamos determinar si las varianzas son iguales o diferentes.
𝑥̅2 = 31.56
1 1 𝑆𝑝 = 4.72 En la siguiente figura se muestran los diagramas de caja
𝑆𝑝 √𝑛 + 𝑛
1 2 𝑛1 = 𝑛2 = 9 para ambas muestras, que nos ayudarán a tomar tal deci-
∆0 = 0 sión.
Región de Rechazo:

𝛼 = 0.05
𝑡0.05,16 = 1.746

𝑡 ≥ 1.746
No Rechazar 𝐻0
No se puede apoyar la afirmación del diseñador a un ni-
Conclusión: vel de significancia de 0.05

7
De los diagramas podemos concluir que no podemos cia contra 𝐻0 . Entre más pequeño sea, más fuerte es la evi-
asumir igualdad de varianzas. Entonces dencia contra 𝐻0 proporcionada por la muestra. Si el valor-
P es menor o igual que 𝛼 decimos que los datos son esta-
𝜇1 − 𝜇2 : verdadera diferencia en los conte-
Parámetro de Interés nidos de las líneas de producción. dísticamente significativos al nivel 𝛼.
Cálculo del valor-P
Nivel de significancia (𝛼)
𝐻0 : 𝜇1 − 𝜇2 = 0 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ 0 0.05 1 − Φ(𝑧𝑐𝑎𝑙 ) 𝑝𝑟𝑢𝑒𝑏𝑎 𝑑𝑒 𝑐𝑜𝑙𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
Estadístico de Prueba Datos: Resultado:
𝑉𝑎𝑙𝑜𝑟𝑃 = { Φ(𝑧𝑐𝑎𝑙 ) 𝑝𝑟𝑢𝑒𝑏𝑎 𝑑𝑒 𝑐𝑜𝑙𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑥̅1 − 𝑥̅2 − ∆0 𝑥̅1 =4.325 2[1 − Φ(|𝑧𝑐𝑎𝑙 |)] 𝑝𝑟𝑢𝑒𝑏𝑎 𝑑𝑒 𝑑𝑜𝑠 𝑐𝑜𝑙𝑎𝑠
𝑡= 𝑥̅2 =4.691 𝑡 = −0.555
Criterio de decisión:
𝑠2 𝑠2 𝑠12 =0.847
√ 1 + 2
𝑛1 𝑛2 𝑠22 =3.509 𝑆𝑖 𝑉𝑎𝑙𝑜𝑟𝑃 > 𝛼 ⇒ 𝑁𝑜 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑎𝑙 𝑛𝑖𝑣𝑒𝑙 𝛼
𝑛1 = 𝑛2 = 8
𝑆𝑖 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 𝛼 ⇒ 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑎𝑙 𝑛𝑖𝑣𝑒𝑙 𝛼
∆0 = 0
Región de Rechazo: Ejemplo 10: El rendimiento diario de una planta química
𝛼 = 0.05 ⇒
𝛼
= 0.025
ha sido de 880 toneladas en los últimos años. El encargado
2
de control de calidad desea saber si este valor ha cambiado
𝜐 = 13.105 ≈ 13 en los últimos meses, para lo cual selecciona de manera
𝑡0.025,13 = 2.160 aleatoria 50 días de la base de datos de la planta obte-
niendo 𝑥̅ = 871 toneladas y 𝑠 = 21 toneladas. Pruebe las
𝑡 ≤ −2.160 𝑜 𝑡 ≥ 2.160
𝑡 ≤ −2.160 𝑡 ≥ 2.160 hipótesis adecuadas usando 𝛼 = 0.05 y el enfoque del va-
lor P
No rechazar 𝐻0 .
Conclusión: No existe una fuerte evidencia, a un nivel de Solución:
0.05, que indique que los contenidos deposita-
dos por las líneas difieran.
𝜇: verdadero rendimiento diario de la
Nota: en los ejemplos 7 y 8 se ha indicado una doble hipótesis Parámetro de Interés planta producción.
nula y alterna con efectos ilustrativos. En realidad, usted debería
Nivel de significancia (𝛼)
optar por escribir sólo una de ellas, la que le resulte más com- 0.05
prensible, como en el ejemplo 9.
𝐻0 : 𝜇 = 880 𝐻𝑎 : 𝜇 ≠ 880
Estadístico de Prueba Resultado: Valor-P:
Uso del Valor-P 𝑥̅ −𝜇0 𝑧0 = −3.03 𝑉𝑎𝑙𝑜𝑟𝑃 = 2[1 − Φ(|𝑧0 |)]
𝑧0 = 𝑠⁄√𝑛 𝑉𝑎𝑙𝑜𝑟𝑃 = 𝟎. 𝟎𝟎𝟐𝟒
Los métodos estudiados en las secciones anteriores re-
portan el resultado de una prueba de hipótesis estadística Conclusión:
Como 𝑽𝒂𝒍𝒐𝒓𝑷 < 𝜶
diciendo si la hipótesis nula fue rechazada o no a un nivel 𝟎. 𝟎𝟎𝟐𝟒 < 𝟎. 𝟎𝟓
Rechazamos 𝑯𝟎
de significancia 𝛼 especificado tomando en cuenta las con- Hay evidencia para pensar
secuencias de cometer un error tipo I. Este enfoque tiene que el rendimiento ha
cambiado.
la limitante de no ofrecer al usuario de la información nin-
guna idea de si el valor calculado del estadístico de prueba Interpretación del Valor-P en Artículos
apenas rebasó la región de rechazo o si se adentró bastante Científicos.
en ella. Otra limitante del enfoque es que impone un nivel
Existe una tendencia muy común con respecto al uso del
de significancia predefinido a los usuarios de la información
valor-P. Algunos investigadores sólo reportan el valor-P y
tales como 0.001, 0.005, 0.01, 0.05 ó 0.10.
dejan a libertad del lector de rechazar o no la hipótesis nula
Otra forma de cuantificar la evidencia en contra de 𝐻0 a un nivel 𝛼. En este caso puede ser de ayuda la siguiente
que contiene una muestra aleatoria es por medio del uso escala (Bluman, pág. 421)
del valor-P o nivel observado de significancia (OLS) de una • Si 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 0.01 Rechace 𝐻0 . La diferencia es altamente significativa.
prueba estadística. El valor-P es el menor valor de 𝛼 para el • Si 0.01 < 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 0.05 Rechace 𝐻0 . La diferencia es significativa.
cual 𝐻0 puede ser rechazada y mide la fuerza de la eviden- • Si 0.05 < 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 0.10 considere las consecuencias del error tipo I antes
de rechazar 𝐻0 .
• Si 𝑉𝑎𝑙𝑜𝑟𝑃 > 0.10 No rechace 𝐻0 . La diferencia no es significativa.

Potrebbero piacerti anche