Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2019
Unidad VII: Prueba de Hipótesis.
Por Oscar Díaz
1
máquina que son mayores que 12 onzas o bien menores • Rechazar 𝐻0
que 12 onzas indicando una operación fuera de control. • No rechazar 𝐻0
Ejemplo 1: Cuando un proceso de manufactura opera En el ejemplo 1, si la hipótesis nula es correcta –es decir
adecuadamente, la longitud promedio de cierta parte que si el sistema opera adecuadamente– esperamos que la me-
se fabrica es de 6.175 pulgadas. Una pequeña cantidad de dia muestral esté muy cercana a 6.175 pulgadas. Pero aque-
variación es tolerada en la longitud, pero aquellas desvia- llas medias muestrales muy grandes o muy pequeñas com-
ciones muy grandes con respecto a la longitud promedio, paradas con 6.175 proporcionan una razón para creer que
en ambas direcciones, no son aceptables. Plantee la hipó- la hipótesis alterna es la correcta.
tesis nula y alterna adecuadas.
En general, si el estadístico de prueba cae en la región de
Solución: Como cada pieza que se produce debe tener una rechazo, la conclusión de la prueba es rechazar 𝐻0 . Si el es-
longitud de 6.175 in podemos hipotetizar que tadístico cae en la región de no rechazo, la conclusión es no
rechazar 𝐻0 . El no rechazo de 𝐻0 significa que no existe su-
𝐻0 : 𝜇 = 6.175
ficiente evidencia como para rechazarla y que por lo tanto
𝐻𝑎 : 𝜇 ≠ 6.175 podría ser verdadera.
¿Cómo decidimos qué hipótesis es la correcta? El proce- Tipos de Pruebas: Podemos realizar los siguientes ti-
dimiento se basa en tomar una muestra aleatoria de la po- pos de pruebas:
blación para determinar si los datos con congruentes con
𝐻0 o con 𝐻𝑎 .
Prueba de dos colas:
Región de Rechazo
𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 < 𝜇0
Región de no
Rechazo
Debido a que el valor verdadero del parámetro es desco-
nocido y la decisión de rechazar o no rechazar 𝐻0 se toma
basados en el valor del estadístico de prueba, podemos co-
Valor Crítico Valor Crítico meter dos tipos de errores:
2
Error tipo II: No rechazar la hipótesis nula, cuando de Error tipo I: Concluir que el proceso no está operando
hecho es falsa. adecuadamente, cuando de hecho sí lo hace (en otras pala-
bras, concluir que el proceso produce piezas fuera de las
En la siguiente tabla se muestran los diferentes escena-
especificaciones, es decir o muy largas o muy cortas,
rios que pueden presentarse
cuando en realidad produce piezas dentro de los límites to-
Decisión lerados).
Rechazar 𝑯𝟎 No rechazar 𝑯𝟎
Error tipo II: Concluir que el proceso está operando ade-
𝑯𝟎 es verdadera Error tipo I Decisión correcta
cuadamente, cuando de hecho no lo hace (es decir, concluir
𝑯𝟎 es falsa Decisión correcta Error tipo II
que el proceso produce partes con la longitud adecuada,
Denotaremos la probabilidad del error tipo I por 𝛼 y la cuando en realidad las produce o muy largas o muy cortas)
probabilidad del error tipo II por 𝛽. La probabilidad del
Potencia de una prueba: es la probabilidad de
error tipo I también se conoce como el nivel de significancia
rechazar 𝐻0 cuando es falsa.
o el tamaño de la región de rechazo, y se usa para informar
al usuario de la información acerca de cuál es la máxima 𝑃𝑜𝑡𝑒𝑛𝑐𝑖𝑎 = 1 − 𝛽 = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎)
probabilidad de cometer un error tipo I o qué tan rara –en
Según lo anterior, la potencia es la probabilidad de re-
términos probabilísticos– debe ser una muestra de tal ma-
chazar correctamente 𝐻0 y podríamos decir que mide la
nera que nos lleve al rechazo de 𝐻0 . El nivel de significancia
«aptitud» de la prueba para comportarse como se requiere.
es una probabilidad que usualmente toma los valores de
En este sentido, la potencia es una medida muy descriptiva
0.05, 0.01 o 0.001. En condiciones perfectas, una prueba
y concisa de la sensibilidad –es decir de la habilidad de la
debe tener probabilidades razonablemente pequeñas de
prueba para detectar diferencias– de una prueba estadís-
los errores tipo I y II.
tica.
𝛼 = 𝑃(𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)
Procedimientos de Prueba para la Me-
𝛽 = 𝑃(𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼) = 𝑃(𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 \𝐻0 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎) dia Poblacional.
En la figura siguiente se ilustran gráficamente los errores tipo I y
El procedimiento general en la prueba de hipótesis con-
tipo II
siste en especificar un valor del error tipo I, y después de-
signar un procedimiento de prueba para que se obtenga un
valor pequeño del error tipo II. Por lo general el error tipo
II es una función del tamaño de muestra y se controla indi-
rectamente. Entre mayor sea el tamaño de muestra utili-
zado en la prueba, menor será 𝛽.
𝛽 𝛼
En las siguientes secciones se revisan los procedimientos
En el control de calidad, a 𝛼 se le conoce como el riesgo para probar hipótesis cuando se ha tomado una sola mues-
del productor, porque denota la probabilidad de que un tra de la población de interés.
lote de buena calidad sea rechazado, o la probabilidad de
Caso I: Una población normal con 𝝈 conocida.
que un proceso que produce valores aceptables de una ca-
racterística particular de calidad sea rechazado por tener Supuesto: población aproximadamente normal y 𝜎 cono-
un desempeño insatisfactorio. Por otra parte, a 𝛽 se le co- 𝜎2
cida. Muestra grande o pequeña. En este caso 𝑋̅~𝑁 (𝜇, 𝑛
).
noce como el riesgo del consumidor, porque denota la pro-
babilidad de aceptar un lote de calidad pobre, o de permitir
Hipótesis nula: 𝐻0 : 𝜇 = 𝜇0
que continúe en operación un proceso que está operando 𝑥̅ −𝜇
Estadístico de prueba: 𝑧 = 𝜎⁄ 𝑛0
de manera insatisfactoria con respecto a alguna caracterís- √
tica de la calidad (Montgomery, 2009). Hipótesis Alterna Región de Rechazo
𝐻𝑎 : 𝜇 > 𝜇0 𝑧 ≥ 𝑧𝛼
Ejemplo 2: Los errores tipo I y II pueden ser descritos de 𝐻𝑎 : 𝜇 < 𝜇0 𝑧 ≤ −𝑧𝛼
la siguiente manera para el ejemplo 1 𝐻𝑎 : 𝜇 ≠ 𝜇0 𝑧 ≤ −𝑧𝛼⁄2 𝑜 𝑧 ≥ 𝑧𝛼⁄2
3
Ejemplo 3: El voltaje de salida de cierto circuito eléctrico gerente? Realice la prueba a un nivel de significancia del
se especifica para que sea 130 V con una desviación están- 5%.
dar de 2.1 V. Una muestra aleatoria de 40 lecturas del vol-
Solución:
taje de salida del circuito, tomadas de manera indepen-
diente, dieron como resultado un voltaje promedio de
128.6 V. Pruebe la hipótesis de que el voltaje de salida es Parámetro de Interés
de 130 V contra la alternativa de que es menor que 130 V. Nivel de significancia (𝛼)
𝑧𝛼 = 𝑧0.05 = 1.645
𝑧 ≤ −1.645
Conclusión:
𝑧 ≤ −1.645
Rechazar 𝐻0 .
Conclusión:
Hay evidencia que el voltaje de salida podría ser menor Caso III: Una población normal con 𝝈 desconocida
que 130 V a un nivel de significancia del 5%.
y muestra pequeña.
Hipótesis nula: 𝐻0 : 𝑝 = 𝑝0
𝑝̂−𝑝0
Estadístico de prueba: 𝑧 =
𝑝 (1−𝑝0 )
√ 0
𝑛
Hipótesis Alterna Región de Rechazo
𝐻𝑎 : 𝑝 > 𝑝0 𝑧 ≥ 𝑧𝛼
𝐻𝑎 : 𝑝 < 𝑝0 𝑧 ≤ −𝑧𝛼
𝐻𝑎 : 𝑝 ≠ 𝑝0 𝑧 ≤ −𝑧𝛼⁄2 𝑜 𝑧 ≥ 𝑧𝛼⁄2
Ejemplo 5: Una empresa de servicios de internet estima
que el 40% de sus clientes posee el servicio de facturación
por cargo automático. En una muestra aleatoria de 100
clientes se encontró que 37% poseen el servicio. A un nivel
de significancia del 1% ¿Existe evidencia para refutar la afir-
mación de la empresa?
Parámetro de Interés μ= verdadera superficie cubierta Solución:
Nivel de significancia (𝛼)
𝐻0 : 𝜇 = 400 𝐻𝑎 : 𝜇 ≠ 400 0.05
P = verdadera proporción de clientes con
Parámetro de Interés cargo automático
Estadístico de Prueba Datos: Resultado:
𝑥̅ = 365.2
𝑥̅ − 𝜇0 𝑠 = 48.417 𝑡 = −2.273 Nivel de significancia (𝛼)
𝑡= 𝐻0 : 𝑝 = 0.4 𝐻𝑎 : 𝑝 ≠ 0.4 0.01
𝑠⁄√𝑛 𝑛 = 10
Estadístico de Prueba Datos: Resultado:
Región de Rechazo: 𝑝̂−𝑝0 𝑝̂ = 0.37
𝛼 𝑧= 𝑝0 = 0.40 𝑧 = −0.61
𝛼 = 0.05 ⇒ = 0.025 𝑝 (1−𝑝0 )
2 √ 0
𝑛 𝑛 = 100
𝑡0.025,9 = 2.262
Región de Rechazo:
𝛼
𝛼 = 0.01 ⇒ = 0.005
2
𝑡 ≤ −2.262 𝑡 ≥ 2.262
Rechazar 𝐻0 . 𝑧0.005 = 2.575
La evidencia sugiere que la superficie cubierta prome-
Conclusión: dio difiere de 400 ft 2 a un nivel de significancia del 5% 𝑧 ≤ −2.575 𝑜 𝑧 ≥ 2.575
𝑧 ≤ −2.575 𝑧 ≥ 2.575
Procedimientos de Prueba para la Pro- No rechazar 𝐻0 .
porción Poblacional. Conclusión: No hay evidencia para refutar la afirmación de la em-
presa a un nivel de 0.01.
5
Hipótesis nula: 𝐻0 : 𝜎 2 = 𝜎02 Procedimientos de Prueba para la Dife-
(𝑛−1)𝑠2 rencia de Medias.
Estadístico de prueba: χ20 = 𝜎02
Caso I: Poblaciones Normales con Varianzas Cono-
Hipótesis Alterna Región de Rechazo cidas.
𝐻𝑎 : 𝜎 2 > 𝜎02 χ20 ≥ 𝜒𝛼,𝑛−1
2
Hipótesis nula: 𝐻0 : 𝜇1 − 𝜇2 = ∆0
𝐻𝑎 : 𝜎 2 < 𝜎02 χ20 ≤ 𝜒1−𝛼,𝑛−1
2
𝑥̅ −𝑥̅ −∆
Estadístico de prueba: 𝑧 = 1 2 0
𝐻𝑎 : 𝜎 2 ≠ 𝜎02 χ20 ≥ 𝜒𝛼2⁄2,𝑛−1 o 𝜎 2
𝜎 2
√ 1+ 2
2
χ20 ≤ 𝜒1−𝛼 ⁄2,𝑛−1
𝑛1 𝑛2
χ2 ≥ 21.064 𝛼 = 0.05
𝑧0.05 = 1.645
Rechazar 𝐻0 .
Hay evidencia que indica que la desviación estándar po-
𝑧 ≥ 1.645
Conclusión: dría ser mayor que 8 a un nivel de significancia de 0.10. Rechazar 𝐻0
El ingeniero puede concluir, a un nivel de 0.05, que aña-
Conclusión: dir el nuevo ingrediente reduce significativamente el
tiempo de secado.
6
Caso II: Poblaciones Normales con Varianzas Des- Caso III: Poblaciones Normales con Varianzas Des-
conocidas pero Iguales. conocidas y Diferentes.
quina que actualmente se usa. Se probaron nueve muestras Ejemplo 9: Se analizan los contenidos de cajas de cereal
aleatorias de manera independiente de cada máquina re- llenados por dos líneas de producción diferentes con el ob-
sultando en la siguiente información: jetivo de determinar si existe diferencia entre ellos. Los re-
Máquina actual Nuevo diseño sultados son los siguientes:
𝑛 9 9 Observación Línea 1 Línea 2
𝑥̅ 35.22 31.56 1 5.83 3.38
𝑠2 24.44 20.03 2 5.66 2.81
3 4.75 7.00
A un nivel del 5%, ¿Puede apoyarse la afirmación del dise- 4 3.00 1.50
ñador? Suponga poblaciones normales con varianzas igua- 5 3.37 5.88
les. 6 3.63 5.25
7 4.00 4.08
Solución:
8 4.63 7.63
9 4.25 4.50
Parámetro de Interés
𝜇1 − 𝜇2 : verdadera diferencia en los tiem- 10 4.13 4.88
pos de chapado.
Nivel de significancia (𝛼) ¿Qué se puede concluir a cerca de los contenidos prome-
𝐻0 : 𝜇1 − 𝜇2 = 0 o 0.05
𝐻𝑎 : 𝜇1 > 𝜇2 dio de ambas líneas de producción? Use 𝛼 = 0.05
𝐻0 : 𝜇1 = 𝜇2
Estadístico de Prueba Datos: Resultado: Solución: Como ambas muestras son pequeñas, necesi-
𝑥̅1 − 𝑥̅2 − ∆0 𝑥̅1 = 35.22 𝑡 = 1.65
𝑡= tamos determinar si las varianzas son iguales o diferentes.
𝑥̅2 = 31.56
1 1 𝑆𝑝 = 4.72 En la siguiente figura se muestran los diagramas de caja
𝑆𝑝 √𝑛 + 𝑛
1 2 𝑛1 = 𝑛2 = 9 para ambas muestras, que nos ayudarán a tomar tal deci-
∆0 = 0 sión.
Región de Rechazo:
𝛼 = 0.05
𝑡0.05,16 = 1.746
𝑡 ≥ 1.746
No Rechazar 𝐻0
No se puede apoyar la afirmación del diseñador a un ni-
Conclusión: vel de significancia de 0.05
7
De los diagramas podemos concluir que no podemos cia contra 𝐻0 . Entre más pequeño sea, más fuerte es la evi-
asumir igualdad de varianzas. Entonces dencia contra 𝐻0 proporcionada por la muestra. Si el valor-
P es menor o igual que 𝛼 decimos que los datos son esta-
𝜇1 − 𝜇2 : verdadera diferencia en los conte-
Parámetro de Interés nidos de las líneas de producción. dísticamente significativos al nivel 𝛼.
Cálculo del valor-P
Nivel de significancia (𝛼)
𝐻0 : 𝜇1 − 𝜇2 = 0 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ 0 0.05 1 − Φ(𝑧𝑐𝑎𝑙 ) 𝑝𝑟𝑢𝑒𝑏𝑎 𝑑𝑒 𝑐𝑜𝑙𝑎 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟
Estadístico de Prueba Datos: Resultado:
𝑉𝑎𝑙𝑜𝑟𝑃 = { Φ(𝑧𝑐𝑎𝑙 ) 𝑝𝑟𝑢𝑒𝑏𝑎 𝑑𝑒 𝑐𝑜𝑙𝑎 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟
𝑥̅1 − 𝑥̅2 − ∆0 𝑥̅1 =4.325 2[1 − Φ(|𝑧𝑐𝑎𝑙 |)] 𝑝𝑟𝑢𝑒𝑏𝑎 𝑑𝑒 𝑑𝑜𝑠 𝑐𝑜𝑙𝑎𝑠
𝑡= 𝑥̅2 =4.691 𝑡 = −0.555
Criterio de decisión:
𝑠2 𝑠2 𝑠12 =0.847
√ 1 + 2
𝑛1 𝑛2 𝑠22 =3.509 𝑆𝑖 𝑉𝑎𝑙𝑜𝑟𝑃 > 𝛼 ⇒ 𝑁𝑜 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑎𝑙 𝑛𝑖𝑣𝑒𝑙 𝛼
𝑛1 = 𝑛2 = 8
𝑆𝑖 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 𝛼 ⇒ 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑎𝑙 𝑛𝑖𝑣𝑒𝑙 𝛼
∆0 = 0
Región de Rechazo: Ejemplo 10: El rendimiento diario de una planta química
𝛼 = 0.05 ⇒
𝛼
= 0.025
ha sido de 880 toneladas en los últimos años. El encargado
2
de control de calidad desea saber si este valor ha cambiado
𝜐 = 13.105 ≈ 13 en los últimos meses, para lo cual selecciona de manera
𝑡0.025,13 = 2.160 aleatoria 50 días de la base de datos de la planta obte-
niendo 𝑥̅ = 871 toneladas y 𝑠 = 21 toneladas. Pruebe las
𝑡 ≤ −2.160 𝑜 𝑡 ≥ 2.160
𝑡 ≤ −2.160 𝑡 ≥ 2.160 hipótesis adecuadas usando 𝛼 = 0.05 y el enfoque del va-
lor P
No rechazar 𝐻0 .
Conclusión: No existe una fuerte evidencia, a un nivel de Solución:
0.05, que indique que los contenidos deposita-
dos por las líneas difieran.
𝜇: verdadero rendimiento diario de la
Nota: en los ejemplos 7 y 8 se ha indicado una doble hipótesis Parámetro de Interés planta producción.
nula y alterna con efectos ilustrativos. En realidad, usted debería
Nivel de significancia (𝛼)
optar por escribir sólo una de ellas, la que le resulte más com- 0.05
prensible, como en el ejemplo 9.
𝐻0 : 𝜇 = 880 𝐻𝑎 : 𝜇 ≠ 880
Estadístico de Prueba Resultado: Valor-P:
Uso del Valor-P 𝑥̅ −𝜇0 𝑧0 = −3.03 𝑉𝑎𝑙𝑜𝑟𝑃 = 2[1 − Φ(|𝑧0 |)]
𝑧0 = 𝑠⁄√𝑛 𝑉𝑎𝑙𝑜𝑟𝑃 = 𝟎. 𝟎𝟎𝟐𝟒
Los métodos estudiados en las secciones anteriores re-
portan el resultado de una prueba de hipótesis estadística Conclusión:
Como 𝑽𝒂𝒍𝒐𝒓𝑷 < 𝜶
diciendo si la hipótesis nula fue rechazada o no a un nivel 𝟎. 𝟎𝟎𝟐𝟒 < 𝟎. 𝟎𝟓
Rechazamos 𝑯𝟎
de significancia 𝛼 especificado tomando en cuenta las con- Hay evidencia para pensar
secuencias de cometer un error tipo I. Este enfoque tiene que el rendimiento ha
cambiado.
la limitante de no ofrecer al usuario de la información nin-
guna idea de si el valor calculado del estadístico de prueba Interpretación del Valor-P en Artículos
apenas rebasó la región de rechazo o si se adentró bastante Científicos.
en ella. Otra limitante del enfoque es que impone un nivel
Existe una tendencia muy común con respecto al uso del
de significancia predefinido a los usuarios de la información
valor-P. Algunos investigadores sólo reportan el valor-P y
tales como 0.001, 0.005, 0.01, 0.05 ó 0.10.
dejan a libertad del lector de rechazar o no la hipótesis nula
Otra forma de cuantificar la evidencia en contra de 𝐻0 a un nivel 𝛼. En este caso puede ser de ayuda la siguiente
que contiene una muestra aleatoria es por medio del uso escala (Bluman, pág. 421)
del valor-P o nivel observado de significancia (OLS) de una • Si 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 0.01 Rechace 𝐻0 . La diferencia es altamente significativa.
prueba estadística. El valor-P es el menor valor de 𝛼 para el • Si 0.01 < 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 0.05 Rechace 𝐻0 . La diferencia es significativa.
cual 𝐻0 puede ser rechazada y mide la fuerza de la eviden- • Si 0.05 < 𝑉𝑎𝑙𝑜𝑟𝑃 ≤ 0.10 considere las consecuencias del error tipo I antes
de rechazar 𝐻0 .
• Si 𝑉𝑎𝑙𝑜𝑟𝑃 > 0.10 No rechace 𝐻0 . La diferencia no es significativa.