Pruebas de HIpótesis

137
Pruebas de hipótesis Estadı́sticas

Una hipótesis Estadı́stica es una afirmación que se hace con respecto a
una o algunas caracterı́sticas desconocidas de una población de interés
o acerca de la misma población.
Una afirmación hecha acerca de una población o de una de sus carac-
terı́sticas de interés, tiene sentido solo si es evaluada con base en la
información obtenida a partir de una muestra aleatoria de dicha pobla-
ción.
Como dicha afirmación puede ser o no cierta, dos hipótesis (antagónicas)

pueden ser planteadas :
H0 : La hipótesis es cierta Ha : La hipótesis es falsa .
H0 se rechaza, solo si la evidencia muestral apoya fuertemente esa de-
cisión. En otro caso diremos que la evidencia muestral no es suficiente
para rechazar H0 y se asume como cierta. El proceso por medio del cual
escogemos una de las dos hipótesis es llamado Prueba de hHipótesis.
Ejemplo
Un tratamiento para dejar de fumar a mostrado ser efectivo en el 60 %
de los casos. Un investigador propone un nuevo método que se supone
mejorará dicho porcentaje. Para verificar esta afirmación se aplicó di-
cho tratamiento a 20 voluntarios con hábito de fumar. ¿Como usar la
información recolectada para decidir si el nuevo tratamiento es mejor?
Queremos determinar si la proporción de personas que deja de fumar a
causa del nuevo tratamiento es más del 60 %. ¿Cuantas de las 20 perso-
nas mı́nimo deben dejar de fumar para aceptar que el nuevo tratamiento
es mejor?
Solución
Sea X: # personas que dejan de fumar a causa del nuevo tratamiento.
X ∼ bin(20 , p). Las hipótesis a probar son:
H0 : p ≤ 0.6 vs Ha : p > 0.6 .
Suponga que un valor k, es tal que si X > k, se tiene suficiente evidencia
para rechazar H0 . (es decir, para concluir que p > 0.6).
138
El conjunto {x | x > k} es tal que siempre que el valor de la v.a. X

esté en éste conjunto, se debe rechazar H0 . ¿Cómo hallar un valor
adecuado para k?
Observe que
X k k
X>k ⇔ > ⇔ p̂ > = p0 .
n n 20
Ası́ X > k ⇔ p̂ > p0 . La desición recae sobre p̂.
Las v.a. X o p̂ son llamadas Estadı́sticos de Prueba y al conjunto

{x | x > k} ó {p̂ | p̂ > p0 } se le llama Región Crı́tica o Región de Re-
chazo. El proceso aquı́ mencionado constituye una prueba de hipótesis
(por notación P.H).
Ası́, toda prueba de hipótesis consta de:

a) Hipótesis Nula: H0 .
b) Hipótesis alterna: Ha .
c) Estadı́stico de Prueba.
d) Región de Rechazo.
En general, sea θ un parámetro de interés desconocido y sea θ0 un valor
particular de θ. Tres hipótesis alternas pueden ser planteadas:
⎧
⎨ θ < θ0
H0 : θ = θ0 vs Ha : θ > θ0
⎩
θ = θ0
Si θ̂ es un estimador puntual para θ, los valores de θ̂ pueden ser usados

para tomar una desición sobre H0 . Las respectivas regiones crı́ticas
asociadas a Ha son:

θ̂ | θ̂ < k θ̂ | θ̂ > k θ̂ | θ̂ < k1 ∨ θ̂ > k2 .
Problema: Hallar valores adecuados para k, k1 , k2 .

139
En este proceso se pueden cometer dos tipos de errores:
Error Tipo I: Rechazar H0 , dado que es cierta.

Error Tipo II: Aceptar H0 , dado que es falsa.
Sea α = P (Error Tipo I) y β = P (Error Tipo II).
α es llamado nivel de significancia de la prueba ó tamaño de la re-

gión crı́tica. Si se fija α, es posible hallar valores adecuados para k, k1 ,
k2 .
Pruebas de Hipótesis para Medias:

Muestras no normales
Sea X 1 , . . . , X n una m.a. de una población con media μ y varian-
za σ 2 . Sea μ 0 un valor de interés para μ. Tres hipótesis pueden ser
establecidas.
⎧
⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0 .
⎩
μ = μ0
Estadı́stico de Prueba: X̄.
R. Crı́tica. Para α dado, tenemos α = P (Error Tipo I). Ahora
α = P (Rechazar H 0 | H 0 es cierta) = P (Rechazar H 0 | μ = μ 0 ) .
Suponga que deseamos probar:
H0 : μ = μ0 vs Ha : μ > μ 0 .
Entonces:

X̄ − μ0 k − μ0
α = P (X̄ > k | μ = μ0 ) = P > .
√σ √σ
n n
140
Si n es grande y σ 2 es conocida, el TLC garantiza que
X̄ − μ0
∼ n(0, 1) .
√σ
n
Luego
k − μ0
α≈P Z > .
√σ
n
k−μ0
De esta última ecuación, se obtiene que zα = √σ
. Al despejar k se
n
obtiene k = μ0 + zα √σn . Finalmente, la región crı́tica está dada por:

σ
R.C = X̄ | X̄ > μ0 + zα √ ⇔ R.C = {ZC | ZC > zα } ,
n
X̄−μ0
donde, ZC = √σ
.
n
Realizando un procedimiento similar, se obtienen las regiones de rechazo

para las todas las posibles hipótesis alternativas:

X̄ − μ 0
X̄ | X̄ > k ⇔ X̄ | X̄ > μ 0 + Zα ⇔ X̄ | √ > Zα .
σ/ n
El procedimiento de Prueba de Hipótesis puede ser reescrito, usando

como estadı́stico de prueba a ZC en vez de X̄. En resumen obtenemos:
⎧
⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0
⎩
μ = μ0
Estadı́stico de Prueba:
X̄ − μ 0
ZC = .
√σ
n
Región Crı́tica: ⎧
⎨ ZC | ZC < −Zα
ZC | ZC > Zα .
⎩
ZC | |ZC | > Zα/2
141
Si σ 2 es desconocida, se usa S 2 .
Ejemplo
Se estudia el rendimiento de un proceso quı́mico. Con base en la obser-
vación de 50 dias. Se obtuvo un rendimiento promedio del 90.48 % con
una desviación estándar de 1.1514 %. ¿Se puede afirmar que el rendi-
miento real del proceso es superior al 90 %? Use un α = 0.01.
Solución
Sea X 1 , . . . , X 50 una m.a. que representa los rendimientos de 50 dias.
Suponga que E[Xi ] = μ y V [Xi ] = σ 2 ambas desconocidas. Se
obtuvo X̄ = 90.48 y S = 1.1514
Las hipótesis a probar son:
H0 : μ = 90 vs Ha : μ > 90
E. Prueba:
X̄ − 90
ZC = ∼ n(0 , 1) α = 0.01 .
√S
50
R. Critica =
{ZC | ZC > Z0.01 } .
Como α = 0.01, se tiene que Z0.01 = 2.33. Ası́, R. Critica = {ZC | ZC > 2.33 } .
90.48 − 90
ZC = 1.1514 = 2.95 .
√
50
Como ZC > 2.33, se rechaza H0 y se concluye que según la información

suministrada, el rendimiento medio real es superior al 90 %.
Pruebas de Hipótesis para Media en pobla-

ciones normales
Si X 1 , . . . , X n es una m.a. de una n(μ , σ 2 ), con μ y σ 2 desconocidas,
X̄−μ
√ ∼ t(n − 1).
sabemos que S/ n
142
Ası́, si μ0 es un valor particular de μ, tenemos:

⎧
⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0
⎩
μ = μ0
E.P:
X̄ − μ
TC = .
√S
n
Región Crı́tica:
⎧
⎨ TC | TC < −tα (n − 1)
TC | TC > tα (n − 1) ; α dado .
⎩
TC | |TC | > tα/2 (n − 1)
Ejemplo
En el ejemplo anterior suponga que el rendimiento del proceso es una
v.a. normal n(μ, σ 2 ) con μ y σ 2 desconocidas. Al observar el rendimiento
diario en los siguientes 20 dias, se obtuvo un rendimiento promedio de
90.52 % y una desviación estándar de 1.2212 %. ¿Se puede afirmar que
el rendimiento medio real del proceso es superior al 90 %?
Solución
Sea X 1 , . . . , X 20 una m.a. que representa los rendimientos del proceso
en 20 dias. Asuma que Xi ∼ n(μ, σ 2 ).
Se quiere probar:
H0 : μ = 90 vs H1 : μ > 90
X̄ − 90
E.Prueba: TC = ∼ t(19)
√S
20
R. Critica: {TC | TC > tα (19)} t0.01 (19) = 2.539
R. Critica: {Tc | Tc > 2.539} .

143
90.52 − 90
TC = 1.2212 = 1.90 .
√
20
Como TC < 2.539. No se puede rechazar H0 . No hay suficiente evi-

dencia para afirmar que el rendimiento medio del proceso sea superior
a 90 %. Asumimos que puede ser inferior o igual al 90 %.
Si α = 0.05 ⇒ t0.05 (19) = 1.729 y asi TC > tα y se puede re-

chazar H0 . Por esta razón el valor de α debe ser previamente fijado.
Ejemplo
El tiempo de secado de un cierto tipo de pintura es una variable aleatoria
Normal con media μ = 75 y desviación estándar σ = 9 (en minutos).
Un grupo de investigadores proponen incorporar un aditivo a la pintura
que permitirá reducir el tiempo de secado al que actualmente se tiene.
Se cree que los tiempos de secado para esta pintura con el aditivo se
seguirán comportando de manera normal con una desviación estándar
σ = 9. Para verificar la afirmación de los investigadores, se consideran
25 pruebas donde se aplica la pintura con el aditivo y se registran los
tiempos de secado. Se decide que si el tiempo promedio obtenido en
la muestra es inferior a 71.8 min, se concluye que el tiempo medio de
secado con el aditivo es inferior al estándar (75 min).
a) Bajo estas condiciones ¿Cuál es la probabilidad de error Tipo I?
b) Calcule la probabilidad de que se concluya que el aditivo no reduce
el tiempo medio de secado, cuando el tiempo medio de secado es
realmente de 72 min.
Solución
Sea X1 , X2 , . . . , X25 una muestra aleatoria que representa los tiempos
de secado de la pintura usando el aditivo. Se asume que Xi ∼ N (μ, 92 ),
i = 1, 2, . . . , n. Las hipótesis a contrastar son:
H0 : μ = 75 vs Ha : μ < 75 .
Se decide que el tiempo medio de secado (μ) será inferior al actual (75
min) si : X̄ <71.8. Luego la región crı́tica o de rechazo es de la forma:
R = { X̄ | X̄ < 71.8 } .
144
a) Se pide calcular la probabilidad del error Tipo I, es decir, α:
α = P (Rechazar H0 | H0 cierta) = P (X̄ < 71.8 | μ = 75)

X̄ − μ0 71.8 − 75
= P σ < 9 = P (Z < −1.78)
√ √
n 25
= 1 − P (Z < 1.78) = 0.03753798 .
b) Concluir que no se reduce el tiempo medio de secado, es aceptar
la hipótesis nula sabiendo que en realiadad el tiempo medio de se-
cado con el aditivo es de 72 min. Se pide entonces calcular una
probabilidad de Error Tipo II:
β = P (Aceptar H0 | H0 Falsa) = P (X̄ ≥ 71.8 | μ = 72)

X̄ − μ0 71.8 − 72
= P σ ≥ 9 = P (Z ≥ −0.11)
√ √
n 25
= P (Z < 0.11) = 0.5437953 .
Pruebas de Hipótesis para Diferencia de

medias en poblaciones no normales
Sea X 1 , . . . , X n una m.a. de una población con media μ1 y varianza
σ12 ; sea Y 1 , . . . , Y m otra m.a. de otra población con media μ2 y va-
rianza σ22 ambas muestras independientes entre si. Se desea probar una
hipótesis acerca de la diferencia μ1 − μ2 .
Las hipótesis a probar son de la forma:

⎧
⎨ μ1 − μ2 < δ 0
H 0 : μ1 − μ2 = δ0 vs H a : μ1 − μ2 > δ 0 ; α dado .
⎩
μ1 − μ2 = δ0
δ0 es un valor conocido, estableido en la hipótesis nula. Si n y m son
grandes, el estadı́stico de prueba para estas hipótesis es de la forma:
X̄ − Ȳ − δ 0 aprox
ZC = 2 ∼ n(0, 1) .
S1 S2
n
+ m2
145
Si se conocen las varianzas, se reemplazan en la expresión anterior. La

región de rechazo es de la forma:
⎧
⎨ ZC | ZC < −Zα
R.R ZC | ZC > Zα .
⎩
ZC | |ZC | > Zα/2
Ejemplo
Dos proveedores fabrican un engrane plástico utilizado en una impreso-
ra láser. El interés está en la resistencia al impacto del engrane, el cuál
se mide en pie − lb. Una muestra aleatoria de 50 engranes suministrados
por el proveedor A, arrojan una resistencia promedio de 295pie − lb con
una desviación de 15pie − lb. Del proveedor B se toma una m.a. de 45
engranes. Esta muestra arroja una resistencia promedio de 306pie − lb y
una desviación estándar de 16pie−lb. ¿Puede afirmarse que los engranes
del proveedor A tienen una resistencia media inferior a los engranes del
proveedor B?. Use α = 0.01
Solución
Sea X1 , . . . , X50 una m.a que representa las resistencias de los en-
granes del proveedor A. Asuma que E[Xi ] = μ1 y V ar[Xi ] = σ12 ;
i = 1, 2, . . . , 50.
Sea Y1 , . . . , Y45 otra m.a. que representa las resistencias de los en-
granes del proveedor B. Asuma que E[Yj ] = μ2 y V ar[Yj ] = σ22 ;
j = 1, 2, . . . , 45., ambas muestras independientes entre si.
De la información muestral se tiene que:
X̄ = 295 , S1 = 15 , Ȳ = 306 , S2 = 16 , n = 50 , m = 45 .
H0 : μ1 − μ2 = 0 vs Ha : μ1 − μ2 < 0 .
El estadı́stico de prueba es:
X̄ − Ȳ − δ0 aprox
ZC = 2 ∼ n(0, 1) .
S1 S2
50
+ 452
Para α = 0.01 la región de rechazo es
R.C. : {ZC | ZC < −z0.01 } = {ZC | ZC < −2.33} .
146
ZC = −3.45. Como ZC = −3.45 < −2.33 se rechaza H0 y se concluye

que la resistencia media del engrane A es inferior a la del engrane B.
Pruebas de Hipótesis para el cociente de

Varianzas en poblaciones normales
Para determinar cuando las varianzas de dos poblaciones normales pue-
den asumirse iguales o diferentes (aunque sean desconocidas), se requiere
el uso de otra distribución de probabilidad especial. Esta se conoce co-
mo Distribución F.
Una variable aleatoria X, se dice que tiene una distribución f con

parámetros ν1 y ν2 , si su p.d.f es de la forma:
ν1 − ν1 +ν 2
Γ ν1 +ν 2
ν 2 ν 1 − ν 2
f (x) = ν1 ν2
1 1
2
x2 1
1+ x ,
Γ 2 Γ 2 ν2 ν2
Los parámetros ν1 y ν2 son comúnmente llamados grados de libertad.

Por notación se escribe: X ∼ f (ν1 , ν2 ). El parámetro ν1 se identifica
con los grados de libertad del numerador y ν2 con los del denominador.
Bajo el supuesto de muestras aleatorias independientes y que provienen

de poblaciones normales, se puede demostrar que,
S12 /σ12
F = 2 2 ∼ f (n − 1, m − 1) ,
S2 /σ2
donde S12 y S22 son las varianzas muestrales de las muestras aleatorias
respectivamente.
Para determinar si las Varianzas poblacionales de ambas muestras pue-
den asumirse iguales o diferentes, se puede calcular un Intervalode Con-
σ2
fianza al 100(1 − α) % para σ12 . Este intervalo es de la forma:
2

S12 1 S12
, f (m − 1, n − 1) ,
S22 fα/2 (n − 1, m − 1) S22 α/2
147
donde fα/2 (n − 1, m − 1) es el cuantil superior a nivel α2 para una f con

n − 1, m − 1 grados de libertad y fα/2 (m − 1, n − 1) es el cuantil superior
a nivel α2 para una f con m − 1, n − 1.
Si dicho intervalo contiene al 1, se asume que las varianzas son iguales,

aunque desconocidas. Si el intervalo no contiene el 1, se asume que las
varianzas son diferentes.
El cálculo de probabilidades o de cuantiles para una f es a través de
tablas que se calculan de manera numérica. En la siguiente imagen se
muestra una parte de una tabla para la f .
Fig. 26: Tabla para la f (ν1 , ν2 )
Otra forma es a través de un juego de hipótesis acerca del cociente entre

σ12 y σ22 . Bajo los mismos supuestos, se desea probar una hipótesis acerca
de la relación entre las varianzas de ambas distribuciones. En particular,
si δ0 es un valor conocido, las hipótesis a contrastar son de la forma:
⎧ 2
⎨ σ1 < δ0 σ22
H 0 : σ12 = δ0 σ22 vs H a : σ 2 > δ0 σ22 .
⎩ 12
σ1 = δ0 σ22
El estadı́stico de Prueba es:
1 S12
FC = ∼ f (n − 1, m − 1) .
δ0 S22
148
La región de rechazo es de la forma:

⎧
⎪
⎪ FC | FC < fα (m−1,
1
⎪
⎪
n−1)
⎪
⎨
FC | FC > fα (n − 1, m − 1) ; α dado .
⎪
⎪
⎪
⎪
⎪
⎩ FC | FC < 1
fα/2 (m−1, n−1)
∨ FC > fα/2 (n − 1, m − 1)
Observe que si se desea probar que σ12 = σ22 , basta hacer δ0 = 1.
Ejemplo
El artı́culo ((Effects of fast-food consumption on energy intake and diet
quality among children in a National household study)) (Pediatrics,
2004), reporta el resumen de datos relacionados con la ingesta de calorı́as
tanto para una muestra de adolescentes que dijeron no suelen consumir
comida rápida y otra muestra de adolescentes que digeron consumirla.
Se cree que esta costumbre incrementa el consumo medio de calorı́as
en el segundo grupo en comparación con el primero. Se desea estable-
cer si la variabilidad en las mediciones de calorı́as en ambos grupos es
diferente. Use un α = 0.05. De la experiencia se sabe que el contenido
de calorı́as en ambas poblaciones es una variable aleatoria Normal. La
infomación obtenida en el estudio se muestra a continuación.
Comen comida rápida Tamaño Promedio Desv. Esta

NO 13 2258 1519
SI 12 2637 1138
Solución
Sea X1 , . . . , X13 una m.a. que representa las mediciones de calorı́as en
el grupo de adolescentes que no consumen comidas rápidas, se asume que
Xi ∼ n(μ1 , σ12 ). Sea Y1 , . . . , Y12 otra m.a. que representa las mediciones
de calorı́as en el grupo de adolescentes que consumen comidas rápidas,
se asume que Yj ∼ n(μ2 , σ22 ) ambas muestras independientes entre si.
Se desea probar las hipótesis:
H0 : σ12 = σ22 vs Ha : σ12 = σ22 .
Estadı́stico de prueba:
S12
FC = ∼ f (12, 11) .
S22
149
La región de rechazo, para un α = 0.05 es de la forma:
1
{ FC | FC < ∨ FC > f0.025 (12, 11) } .
f0.025 (11, 12)
En este caso f0.025 (11, 12) = 3.321 y f0.025 (12, 11) = 3.430. Con esto, la
región de rechazo es de la forma:
{ FC | FC < 0.3011 ∨ FC > 3.43 } .
S12 15192
Ahora, FC = 2 = = 1.782 . Como FC < 3.43, no se puede re-
S2 11382
chazar H0 y se concluye que la evidencia muestral no es suficiente para
observar una diferencia en las varianzas de los consumos de calorias para
ambos grupos de adolescentes, se asume entonces que ambas varianzas
son similares.
Pruebas de Hipótesis para Diferencias de

Medias en Poblaciones Normales
Para efectos de manejar una notación estándar, suponga que se tienen
dos poblaciones normales independientes y se extraen dos muestras alea-
torias.
Sea X 1 , . . . , X n una m.a. de una población n(μ1 , σ12 ) y sea Y 1 , . . . , Y m

otra m.a. de otra población n(μ2 , σ22 ) ambas m.a. E.I. Se desea probar
hipótesis acerca de la diferencia μ1 − μ2 .
Las hipótesis a probar son de la forma:

⎧
⎨ μ1 − μ2 < δ 0
H 0 : μ1 − μ2 = δ0 vs H a : μ1 − μ2 > δ 0 ; δ0 dado .
⎩
μ1 − μ2 = δ0
El estadı́stico de Prueba dependerá de como son σ12 y σ22 .

150
Si se conocen las varianzas, se procede igual que en el caso de tener

muestras grandes y el estadı́stico de prueba será
X̄ − Ȳ − δ 0
ZC = 2 ∼ n(0, 1) .
σ1 σ2
n
+ m2
El caso interesante se tiene cuando no se conocen las varianzas. La re-

lación entre las varianzas de dos poblaciones normales, para efectos de
comparar sus medias, es crucial para determinar el tipo de estadı́stico
de prueba a usar.
Después de identificar la relación entre las varianzas poblacionales se

distinguen dos casos:
Caso I: σ12 = σ22 . El estadı́stico de prueba será:
X̄ − Ȳ − δ0 (n − 1)S12 + (m − 1)S22
TC = ∼ t (n + m − 2) ; Sp2 = .
sp n1 + m1 n+m−2
R. Crı́tica: ⎧
⎨ TC | TC < −tα (n + m − 2)
TC | TC > tα (n + m − 2) ;
⎩
TC | |TC | > tα/2 (n + m − 2)
Caso II: σ12 = σ22 . En este caso el estadı́stico de prueba tiene una
distribución aproximada.
2 2
S1 S22
X̄ − Ȳ − δ0 aprox n
+ m
TC = 2 2
∼ t (v) ; v = 2 2 2 2 − 2 .
S1 S2 S 1 S2
n
+ m
n m
n+1
+ m+1
La región crı́tica tiene forma similar al caso anterior pero cambiando los
151
grados de libertad por ν.

⎧
⎨ TC | TC < −tα (ν)
TC | TC > tα (ν) ; α dado .
⎩
TC | |TC | > tα/2 (ν)
Ejemplo
Dos proveedores fabrican un engrane plástico utilizado en una impre-
sora láser. El interés está en la resistencia al impacto del engrane, el
cuál se mide en pie − lb. Una m.a. de 10 engranes suministrados por el
proveedor A, arrojan una resistencia promedio de 290pie − lb con una
desviación de 12pie − lb. Del proveedor B se toma una m.a. de 15 engra-
nes. Esta muestra arroja una resistencia promedio de 308.5pie−lb y una
desviación estándar de 15pie − lb. Se sabe que las resistencia al impac-
to se comportan de manera normal para este tipo de engrane. ¿Puede
afirmarse que los engranes del proveedor A tienen una resistencia media
inferior a los engranes del proveedor B?. Use α = 0.05
Solución
Sea X 1 , . . . , X 10 una m.a que representa las resistencias de los engra-
nes del proveedor A. Asuma que Xi ∼ n(μ 1 , σ12 ).
Sea Y 1 , . . . , Y 15 otra m.a. que representa las resistencias de los engra-
nes del proveedor B. Asuma que Yj ∼ n(μ 2 , σ22 ) ambas m.a. E.I.
De las muestras se tienen los siguientes resultados:
X̄ = 290, S1 = 12, n = 10 Ȳ = 308.5, S2 = 15, m = 15 .
Verifiquemos como son σ12 y σ22 .
σ12
Un I.C. al 95 % para σ22
es:

S12 1 S12
, f (14, 9) ,
S22 f0.025 (9, 14) S22 0.025
donde f0.025 (9, 14) = 3.21 y f0.025 (14, 9) = 3.80 .

1
⇔ 0.64 ∗ , 0.64 ∗ (3.8) ⇔ (0.1994 , 2.432) .
3.21
152
Como 1 ∈ al I.C. podemos afirmar que σ12 = σ22 .

H0 : μ 1 − μ 2 = 0 vs H1 : μ 1 − μ 2 < 0 .
E. Prueba
X̄ − Ȳ − 0
TC = ∼ t (23) .
S p 10 + 15
1 1
9 S12 + 14 S22
Sp2 = = 193.304 , Sp = 13.90 .
23
290 − 308.5
TC = = −3.26 .
1 1
13.90 10 + 15
Si α = 0.05 t0.05 (23) = 1.714.
Se rechaza H0 y se concluye que los engranes del proveedor B tienen

una resistencia media superior a la de los engranes del proveedor A.
Ejemplo
Se investigan los puntos de fusión de dos aleaciones utilizadas en la fa-
bricación de cierto tipo de soldadura. Para ello se funden 10 muestras
de cada material, y se miden en ambas los respectivos de fusión. Para
la aleación 1 se obtiene un punto de fusión promedio de 421◦ F con una
desvición estándar de 2◦ F. Para la aleación 2 los resultados fueron
426◦ F y 4.2◦ F respectivamente. Por experiencia se sabe que los puntos
de fusión para ambas aleaciones es una variable aleatoria normal. ¿Se
puede afirmar que no hay diferencia significativa en los puntos de fusión
de ambas aleaciones?. Use α = 0.05.
Solución
Sea X 1 , . . . , X 10 una m.a. que representa los puntos de fusión de las
10 muestras de la aleación tipo 1.
Asuma Xi ∼ n(μ 1 , σ12 ) , i = 1, 2, . . . , 10. Sea Y 1 , . . . , Y 10 otra m.a.
que representa los puntos de fusión de las 10 muestras de la aleación
153
tipo 2. Asuma Yi ∼ n(μ 2 , σ22 )

i = 1, 2, . . . , 10. De los resultados muestrales obtenemos:
X̄ = 421 , S 1 = 2.0 , n = 10 , Ȳ = 426 , S 2 = 4.2 , m = 10 .

σ12
Se determinará la relación entre σ12 y σ22 . Un I.C. al 95 % para σ22
es de
la forma:

S12 1 S12
, f (9, 9) ,
S22 f0.025 (9, 9) S22 0.025
σ12
con f0.025 (9, 9) = 4.03. Un I.C. al 95 % para σ22
es:

1
0.227 ∗ , 0.227(4.03) ⇔ (0.056 , 0.915) .
4.03
Como 1 ∈
/ al I.C. afirmamos que σ12 = σ22 .
Otra forma consiste en probar las hipótesis:
H 0 : σ12 = σ22 vs H a : σ12 = σ22 .

Estadı́stico de prueba:
S12
FC = ∼ f (9, 9) .
S22
Región de rechazo

1
R.C. : FC | FC < ∨ FC > f0.025 (9, 9) .
f0.025 (9, 9)
⇔ R.C. : { FC < 0.2481 ∨ FC > 4.03 } .

22
FC = = 0.2268 .
4.22
Como FC ∈ R.C. se reachaza H0 y se concluye que las varianzas po-
blacionales son diferentes. Retomado la pregunta original acerca de los
puntos de fusión medios, las hipótesis a probar son:
H0 : μ 1 − μ 2 = 0 vs H1 : μ 1 − μ 2 = 0 .
154
X̄ − Ȳ − 0 aprox
E.P. TC = 2 ∼ t (v) , con v = 13.745 ∼
= 14 .
S1 S22
10
+ 10
R.Crı́tica:
{TC | TC > tα/2 (14)} = {TC | |TC | > t0.025 (14) } = { TC | |TC | > 2.145 }
421 − 426
TC = = −3.3989 ≈ −3.40 .
4 4.2 2
10
+ 10
Como |TC | = 3.40 > 2.145, se rechaza H0 : y se concluye que según la
información suministrada por ambas muestras, hay evidencia suficiente
para afirmar que los puntos medios de fusión son diferentes.
Pruebas de hipótesis para proporciones

Suponga que X es una v.a tal que X ∼ bin(n , p), con p desconocida.
Sea p0 un valor de interés para p.
Tres hipótesis pueden ser planteadas acerca de p.
⎧
⎨ p < p0
H0 : p = p0 vs H a : p > P0 .
⎩
p = p0
Por el T.L.C. sabemos que si n es grande.
p̂ − p aprox
∼ n(0, 1) .
p (1−p)
n
aprox
Si H0 es cierta p̂−p0 ∼ n(0, 1) . Ası́, el estadı́stico de prueba
p0 (1−p0 )
n
a ser usado es
p̂ − p0
ZC = .
p0 (1−p0 )
n
Para α dado, la Región crı́tica es de la forma:

⎧
⎨ ZC | ZC < −zα
R.C. : ZC | ZC > z α .
⎩
ZC | |ZC | > zα/2
155
Ejemplo
En cierta región, tres candidatos aspiran a cierto cargo público. Para
elegir uno de los tres se realiza una votación entre todas las personas
mayores de edad. Para tener idea si existe preferencia por alguno de
los tres, se realiza una encuesta a 1000 personas y se observó 365 a favor
de A, 330 a favor de B y 305 a favor de C. ¿Existe mayor preferencia
por el candidato A?
Solución
X: # votantes en la encuesta a favor de A.
Xi ∼ bin (1000, p). Se desea probar las hipótesis:
1 1
H0 : p = vs H1 : p > .
3 3
p̂ − 1/3 aprox
ZC = 1 2 ∼ n(0, 1) .
3
(3)
1000
Si α = 0.05 se tiene que Z0.05 = 1.645 y ası́, la región crı́tica es de la

forma:
R.C = {ZC | ZC > Z0.05 } = {ZC | ZC > 1.645} .
En este caso
0.365 − 1/3
ZC = 1 2 = 2.12 .
( )
3 3
1000
Como ZC > 1.645 se rechaza H0 y se concluye que según los datos ob-
servados existe mayor preferencia por A.
Si α = 0.025 ⇒ Z0.02 = 1.96 y ZC > 1.96. La conclusión

es la misma.
156
Si α = 0.01 ⇒ Z0.01 = 2.33 y ZC < 2.33 , no se puede re-

chazar H0 .
Esto indica que la conclusión varı́a dependiendo del valor de α escogido.
Fig. 27: Rechazo Prueba de Hipótesis

El área sombreada es P (Z > 2.12) = 1 − P (Z ≤ 2.12) = 0.017.
Observe que si α < 0.017 no se puede rechazar H0 pero si α > 0.017,

si se rechaza H0 .
¿Que pasa si n es pequeño? La aproximación normal ya no es adecua-

da y es necesario entonces usar directamente la distribución binomial.
⎧
⎨ p < p0
H0 : p = p0 vs Ha : p > p0 .
⎩
p = p0
E.Prueba X ∼ bin (n, p) .

⎧ ⎫
⎨ X |X < k ⎬
R.C = X |X > k .
⎩ ⎭
X | X > k1 v X > k 2
Para α fijo es posible determinar los valores de k, k1 y k2
Suponga que queremos probar H0 : p = p0 vs Ha : p > p0 . E. Prue-

ba: X . R.C. = {X | X > k} . Para α fijo, es muy común que no sea
157
posible encontrar un k tal que la probabilidad de Error Tipo I sea exac-

tamente igual a α.
En este caso se halla el menor valor de k tal que
P (Error T ipo I) ≤ α ⇔ P (X > k | p = p0 ) ≤ α .
Ejemplo
Un tratamiento para dejar de fumar a mostrado ser efectivo en el 60 %
de los casos. Se propone un nuevo tratamiento que se cree mejorará
dicho porcentaje. Para verificar esto se tiene una muestra de 20 volun-
tarios que se someten a este tratamiento y 17 de ellos deja de fumar. ¿Es
el nuevo tratamiento mejor?. Use α = 0.05. Luego α = 0.01. ¿Cambia
la conclusión?
Solución
Sea X: # de pacientes tratados que dejan de fumar.
X ∼ bin (20, p). Las hipótesis a probar son:
H0 : p = 0.6 vs Ha : p > 0.6 .

E. Prueba X. Bajo H0 X ∼ bin (20, 0.6). R.C.: {X | X > k }.
Si α = 0.05, se trata de hallar el menor valor de k tal que: P (X >
k | p = 0.6) ≤ 0.05. Ahora, se tiene que:
Si k = 19 ⇒ P (X > k|p = 0.6) = 3.6562 x 10 −5
Si k = 18 ⇒ P (X > k|p = 0.6) = 5.2405 x 10 −4
Si k = 17 ⇒ P (X > k|p = 0.6) = 0.003611
Si k = 16 ⇒ P (X > k|p = 0.6) = 0.01596
Si k = 15 ⇒ P (X > k|p = 0.6) = 0.05095
El menor valor de k es 16. Ası́ R.C. = {X | X > 16} . Como x =

17 ⇒ se rechaza H0 y se concluye que el nuevo tratamiento es mejor.
158
Si α = 0.01 se tiene que P (X > k | p = 0.6) ≤ 0.01 solo si k = 17 .

No se puede rechazar H0 y concluirı́amos que la evidencia no es sufi-
ciente para decir que el nuevo tratamiento es ”mejor” .
Finalmente se tiene que P (X > 17 | p = 0.6) = 0.03611 .
Valor p de una Prueba de Hipótesis

Ejemplo
Se requiere que la tensión a la ruptura de una hilo utilizado en tapi-
cerı́a sea de por lo menos 100psi para considerarse aceptable. Para
establecer este requisisto, se toma una m.a. de 50 hilos y se miden sus
tensiones a la ruptura. Los resultados obtenidos fueron: x̄ = 99 psi y
S = 3.40 psi. ¿Es este tipo de hilo aceptable?
Solución
Sea X 1 , . . . , X 50 una m.a. que representa las tensiones a la ruptura de
este tipo de hilo. Suponga que E [Xi ] = μ y V ar [Xi ] = σ 2 , i =
1, 2, . . . 50. Tenemos que x̄ = 99 psi y S = 3.4 psi. Las hipótesis a
probar son:
H0 : μ − 100 vs Ha : μ < 100 .

E.P
X̄ − 100
ZC = ∼ N (0, 1) .
√S
50
Para α dado la región crı́tica o de rechazo está dad por:
{ZC | ZC < −Zα } .
Zc = −2.08
Si α = 0.05 ⇒ Zα = 1.645
Si α = 0.025 ⇒ Zα = 1.96
Si α = 0.02 ⇒ Zα = 2.05
Si α = 0.01 ⇒ Zα = 2.33
Observe que para α = 0.02 se rechaza H0 , pero para α = 0.01, No se
puede rechazar.
159
Fig. 28: Valor P
P (Z < −2.08) = 0.0188.

Observe que el área a izquierda de −Z0.02 es mayor que 0.0188 y el área
a izquierda de −Z0.01 es menor que 0.0188. Por esto en el primer caso se
rechaza H0 y en el segundo caso no se puede rechazar. El valor observa-
do para ZC es menor que −Z0.02 y mayor que −Z0.01 . Ası́, para rechazar
H0 , debemos escoger un α, tal que ZC < −Zα .
El mı́nimo valor de α es precisamente 0.0188, que es

P (Z < ZC | μ = 100) = P (Z < −2.08) .
Esta probabilidad se conoce como Valor P , usualmente denotado Vp .

Esta probabilidad representa el mı́nimo nivel de significancia a partir
del cual los datos observados indican que se debe rechazar H0 . También
se entiende como la ”Mı́nima probabilidad de equivocarse al rechazar
H0 ”. Otra interpretación más usual se refiere a que el Valor p es la pro-
babilidad de equivocarse al rechazar H0 obtenida experimentalmente o
con base en la muestra.
Un Valor p pequeño, permite rechazar H0 con seguridad. Un Valor p

grande, no aporta suficiente evidencia para rechazar H0 .
Ası́, para el ejemplo anterior Vp = 0.0188.
160
Observe que: Si α < Vp , no se puede rechazar H0 . Si α >> Vp , se recha-

za H0 con seguridad. Como el valor elegido para α puede indicar que se
rechace o acepte H0 , la decisión recae en el valor p.
Ejemplo En los datos anteriores se sabe que las tensiones a la rup-

tura se distribuyen normales n(μ, σ 2 ). De una muestra aleatoria de 20
hilos se obtiene una tensión a la ruptura promedio de 100.95 con una
desviación estándar de 2.21psi. ¿Se puede afirmar que la tensión a la
ruptura es superior a 100psi?
Solución
Sea X1 , · · · , X20 una m.a. de una n(μ, σ 2 ) que representa las tensiones
a la ruptura de los 20 hilos. De la muestra obtenemos x̄ = 100.95 y
S = 2.21. Las hipótesis a probar son:
H0 : μ = 100 vs Ha : μ > 100 .
El estadı́stico de prueba es:
100.95 − 100
TC = 2.21 = 1.922 .
√
20
Si α = 0.05 ⇒ t 0.05 (19) = 1.729

Si α = 0.025 ⇒ t 0.025 (19) = 2.093
En el primer caso rechazamos. En el segundo no podemos rechazar H0 .
Ahora
Vp = P (t(19) > 1.922) = 0.034866 .
Si se considera que 0.035 es un error pequeño, se puede rechazar H0 y

concluir que, según los datos registrados, la tensión de ruptura media
de este tipo de hilo es superior a 100psi.
161
Fig. 29: Valor P
El cálculo del Valor p está ligado al tipo de hipótesis alterna. En el

primer ejemplo se calculó un área a izquierda (Ha : μ < 100). En el
segundo ejemplo un área a derecha (Ha : μ > 100).
Para el caso de pruebas de hipótesis para la media de una población, se
pueden considerar dos casos para el cálculo del Valor p, dependiendo de
la distribución de la muestra.
Resumen: ⎧
⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0
⎩
μ = μ0
Caso I: Muestras que provienen de poblaciones normales con varianza

σ 2 conocida.
⎧
X − μ0 ⎨ P (Z < ZC )
E.P ZC = , Vp : P (Z > ZC ) .
√σ ⎩
n P (|Z| > |Zc |)
Caso II: Muestras que provienen de poblaciones normales con varianza

σ 2 desconocida.
⎧
X − μ0 ⎨ P ( t(n − 1) < TC )
E.P TC = , Vp : P ( t(n − 1) > TC ) .
√§ ⎩
n P ( |t(n − 1)| > |TC |)
162
Caso III: Muestras que provienen de poblaciones no-normales.

⎧
X − μ0 ⎨ P (Z < ZC )
E.P ZC = , V p : P (Z > ZC ) .
√S ⎩
n P (|Z| > |Zc |)
Para una porporción.
⎧
⎨ p < p0
H0 : p = p 0 vs Ha : p > p0
⎩
p = p0
Caso IV: Tamaño de muestra grande.

⎧
p̂ − p0 ⎨ P (Z < ZC )
E.P ZC = , Vp : P (Z > ZC ) .
p0 (1−p0 )
√ ⎩
n P (|Z| > |Zc |)
Para el caso de diferencia de medias, se usan los casos I, II y III para

efectos del cálculo de los valores p, teniendo especial cuidado en los su-
puestos distribucionales y los grados de libertad (según el caso).
Ejemplo
Se lleva a cabo un estudio para determinar la efectividad de una va-
cuna contra la gripe. La empresa que produce la vacuna asegura que
esta es no efectiva en menos del 0.8 % de los casos en los que se aplica.
Se administra la vacuna a una muestra aleatoria de 3000 sujetos y 13
contraen gripe. ¿Es cierta la afirmación del fabricante? Use el Valor p
para concluir.
Solución
Sea X: Número de vacunados que contraen gripe. Se sabe que X ∼
b(3000, p) , donde p es desconocido. La hipótesis del fabricante establece
que p < 0.008. Luego, las hipótesis a contrastar son:
H0 : p = 0.008 vs Ha : p < 0.008 .
Como n es grande, el estadı́stico de prueba es:
p̂ − 0.008
ZC = .
0.008 (1−0.008)
3000
163
Como p̂ = 3000
13
= 0.0043, se tiene que ZC = −2.25. Luego, el Valor p de
esta prueba se obtiene como:
Vp = P (Z < ZC ) = P (Z < −2.25)
Vp = P (Z > 2.25) = 1 − P (Z < 2.25) = 0.01224 .

Como este valor es pequeño, se puede rechazar H0 con seguridad y con-
cluir que, según la información suministrada, la proporción de personas
vacunadas que contraen gripe, es inferior al 0.8 % .
164
Pruebas de Bondad de Ajuste

Una prueba de Bondad de Ajuste es un procedimiento especial para
determinar si un conjunto de datos proviene de cierta distribución co-
nocida.
Cuando los datos son discretos, la prueba más usada es la prueba Ji-
Cuadrada, debido a que el estadı́stico de prueba usado es una nueva
variable aleatoria llamada χ2 . Otras pruebas usadas pero en datos con-
tinuos son: Kolmogorov-Smirnov, Shapiro-Wilks, Cramer Von Mises,
Anderson-Darling, entre otras.
Definición Una variable aleatoria X se dice que tiene una distribución

χ2 con ν grados de libertad, si su p.d.f. es de la forma:
1 ν x
f (x) = ν ν x 2 −1 e− 2 ; x>0 , ν>0.
Γ 2
2 2
Por notación se escribe: X ∼ χ2 (ν) . El parámetro ν es conocido como

grados de libertad. Un nombre similar al usado en los parámetros de la
distribución f . Es fácil mostrar que:
E[X] = ν ; V ar[X] = 2 ν .
Los cuantiles para esta distribución se obtienen al resolver la ecuación:

P X > χ2α (ν) = α .
Un gráfico de dicha distribución y el respectivo cuantil α superior se
muestra en la figura 30.
Fig. 30: Distribución χ2 (ν)

165
Suponga que se tiene una experimento multinomial, es decir una serie de

ensayos (n ensayos) idénticos e independientes y k posibles categorı́as ó
clases. Sea p i la probabilidad de clasificar en la categorı́a i y sea Ni el
número de ensayos que caen en la categorı́a i de los n ensayos. Se tiene
que N1 + · · · + Nk = n. Cada Ni será una v.a. binomial con parámetros
n y pi ; i = 1, 2 · · · , k. El número esperado de ensayos en la categorı́a
i es E [Ni ] = n pi ; i = 1, 2 · · · , k
Se desea establecer si los datos observados provienen de cierta distri-

bución especial con c.d.f. F 0 (x). Las hipótesis a probar son:
H0 : F (x) = F0 (x) vs
Ha : F0 (x) no es la c.d.f. asociada a la muestra.
Si F0 está claramente especificada, es posible conocer valores particula-
res para los pi ; i = 1, 2, . . . , k y asi obtener E [Ni ]. En otro caso, los pi
deberán ser estimados y en vez de tener E [Ni ], se estima con n p̂i .
En resumen tenemos:
clase 1 2 k total
Frec observada n1 n2 ... nk n
Probabilidad p1 p2 ... pk 1
Frec esperada n p1 n p2 n pk n
Si n pi ≥ 5 ; i = 1, 2 . . . , k , la v.a.

k
(Ni − n pi ) 2
X= ∼ χ 2 (k − 1) .
i=1
n pi
Observe que

k
(Ni − n pi ) 2 (f.obs − f.esp) 2
X= = ∼ χ2 (k − 1) .
i=1
n pi todas las celdas
f.esp
Suponga que se desea establecer valores particulares para los p i , es decir

queremos probar:
H0 : p i = pi 0 ; i = 1, 2 . . . , k vs Ha : ∃ j tal que pj = pj 0
166
E.P:

k
(ni − n pi ) 2
XC = ∼ χ 2 (k − 1) .
i=1
n pi
R.C.:
{XC |XC > χ2α (k − 1) } ; para α dado .
Finalmente

Vp = P χ2α (k − 1) > XC .
El cálculo con la tabla Chi-Cuadrado es similar al cálculo con la tabla

t.
TABLA PARA LA JI-CUADRADO. Áreas a derecha

v 0,1 0,06 0,05 0,025 0,02 0,01 0,005
1 2,706 3,537 3,841 5,024 5,412 6,635 7,879
2 4,605 5,627 5,991 7,378 7,824 9,210 10,597
3 6,251 7,407 7,815 9,348 9,837 11,345 12,838
4 7,779 9,044 9,488 11,143 11,668 13,277 14,860
5 9,236 10,596 11,070 12,833 13,388 15,086 16,750
6 10,645 12,090 12,592 14,449 15,033 16,812 18,548
7 12,017 13,540 14,067 16,013 16,622 18,475 20,278
8 13,362 14,956 15,507 17,535 18,168 20,090 21,955
9 14,684 16,346 16,919 19,023 19,679 21,666 23,589
10 15,987 17,713 18,307 20,483 21,161 23,209 25,188
11 17,275 19,061 19,675 21,920 22,618 24,725 26,757
12 18,549 20,393 21,026 23,337 24,054 26,217 28,300
13 19,812 21,711 22,362 24,736 25,472 27,688 29,819
14 21,064 23,017 23,685 26,119 26,873 29,141 31,319
15 22,307 24,311 24,996 27,488 28,259 30,578 32,801
Ejemplo
Para determinar si un dado está cargado o no, éste es lanzado 600 veces
y se anota cuantas veces aparece cada cara. Los resultados observados
fueron:
167
Cara 1 2 3 4 5 6
Fre.obs 85 94 108 112 98 103
Frec.esp 100 100 100 100 100 100
Las hipótesis a plantear son:
1 1
H 0 : pi = , i = 1, 2, · · · , 6 vs Ha : ∃ j tal que pj = .
6 6
En este caso la distribución acumulada F 0 (x), está asociada a una dis-
tribución uniforme discreta.

6
(n i − 100) 2
XC = ∼ χ 2 (5) .
i=1
100
En este caso se tiene que Xc = 4.82. De esta manera se obtiene:

Vp = P χ2 (5) > 4.82 > 0.1 .
Usando R se tiene que el valor p es ((1-pchisq(4.82,5) = 0.4382404 )). Por
lo tanto, no se puede rechazar H0 ; en otras palabras, no hay suficiente
evidencia para afirmar que el dado está cargado. Asumimos que no lo
está.
Ejemplo
El generador de números aleatorios de una calculadora arrojó 100 núme-
ros aleatorios (dı́gitos). Los resultados obtenidos son:
Dı́gito 0 1 2 3 4 5 6 7 8 9
Frec 11 11 9 8 8 11 9 11 13 9
F.espe. 10 10 10 10 10 10 10 10 10 10
Las hipótesis a plantear son:
1 1
H 0 : pi = , i = 1, 2, . . . , 10 vs Ha : ∃j tal que pj = .
10 10
1
F.esperada = 100 10 = 10:
E.Prueba:
10
(n i − 10) 2
Xc = ∼ χ 2 (9) .
i=0
10
168
En este caso Xc = 2.4. Ası́, el valor p de esta prueba es:

V p = P (χ 2 (9) > 2.4) >> 0.1 .
En R se usa el comando: ((1-pchisq(2.4,9) = 0.983453 )). Como no se pue-
de rechazar H0 , se asume que los números se generan aleatoriamente.
El siguiente ejemplo muestra porqué no es adecuado usar esta prueba

para datos continuos.
Ejemplo
Una prueba que consta de 100 preguntas es presentada por 50 estudian-
tes. Se tiene la creencia de que el puntaje obtenido es una v.a. normal.
Los resultados obtenidos son:
30 40 42 52 55 60 60 62 64 65 66 66 67 67 68 68 68
70 70 70 71 72 72 73 74 74 75 76 76 78 78 78 79 80
80 82 83 84 84 85 86 88 90 90 92 93 93 94 95 97
Para aplicar la prueba Chi-Cuadrado es necesario forzar un esquema

multinomial. Se construirá una tabla de frecuencias.
k ≈ 1 + 3.33 log(50) ≈ 7 min = 30 , max = 97 ,
67
N.rango = 70 , Amplitud = = 9.571 ≈ 10 .
7
Los intervalos resultantes son:
(−∞ , 40), [40 , 50) , [50 , 60) , [60 , 70) , [70 , 80) , [80 , 90) , [90 , ∞) .
Fig. 31: Histograma para puntajes

169
H0 : Los puntajes se distribuyen n (μ, σ 2 ).

Ha : Los puntajes no se distribuyen n (μ, σ 2 ).
Como μ y σ 2 son desconocidas, usamos estimadores puntuales para μ
y σ 2 ; estos serı́an X̄ y S 2 .
Bajo H0 asuma que X: puntaje obtenido en la prueba, es una v.a ,

donde X ∼ n (X̄, S 2 ). x̄ = 73.64, S = 14.257, n = 50. Para calcular
las probabilidades de clase, se procede ası́:
p1 = P (X < 40|X ∼ n (73.64, 203.256))

40 − 73.64
=P Z< = P (Z < −2.36) = 0.00914
14.257
p2 = P (40 ≤ X < 50) = P (−2.36 < Z < −1.6650)

= 0.03932
Y ası́ análogamente para los demás intervalos. La tabla resultante será:
Clase Fre.obs Probabilidad Frec.Esperada

< 40 1 0.00914 0.457
40 ≤ X < 50 2 0.03932 1.966
50 ≤ X < 60 2 0.12007 6.0035
60 ≤ X < 70 12 0.22890 11.445
70 ≤ X < 80 16 0.27622 13.811
80 ≤ X < 90 9 0.20128 10.064
X ≥ 90 8 0.12507 6.2535
Como n p1 y n p2 son pequeños, menores que 5, se organiza una nueva

tabla agrupando las frecuencias menores que 5 (los dos primeros inter-
valos), con la frecuencia del tercer intervalo:
170
Clase Fre.obs Probabilidad Frec.Esperada

< 60 5 0.16853 8.4265
60 ≤ X < 70 12 0.22890 11.445
70 ≤ X < 80 16 0.27622 13.811
80 ≤ X < 90 9 0.20128 10.064
X ≥ 90 8 0.12507 6.2535
E. Prueba:

5
(n i − n pi ) 2
XC = ∼ χ 2 (5 − 2 − 1) .
i=1
n pi
La razón de que los grados de libertad se reduzcan a 2 y no a 4, es

debido a que se pierde un grado de libertad por cada parámetro que
es estimado a partir de H0 (en este caso se estimaron dos parámetros
previamente: la media y la varianza).

XC = 2.367 , Vp = P χ2 (2) > 2.367 > 0.1 .
En R se tiene: ((1-pchisq(2.367,2) = 0.3062051)). Por lo tanto no se puede

rechazar H0 y se asume que los puntajes se distribuyen normalmente.
A pesar de que la prueba aparentemente indica normalidad en los datos,
esta prueba no es concluyente, sobre todo cuando acepta H0 .
Este ejemplo es particularmente importante, porque uno de los supues-

tos fuertes en la mayorı́a de las aplicaciones estadı́sticas, es aquel donde
se debe especificar si la muestra (o muestras) aleatoria proviene de unha
distribución normal.
Entre las propuestas metodologı́cas se encuentran reportadas en la li-

teratura muchas mas pruebas sobre Normalidad. Algunas de las más
conocidas son: Kolmogorov-Smirnov, Shapiro-Wilks, Cramer Von Mis-
ses, Jarque Bera, de Asimetrı́a y Kurtosis de Mardia, etc.
Usando R, se puede aplicar la prueba de Shapiro-Wilk, para determinar

si estos puntajes se distribuyen de manera normal. En R comander se
muestra el procedimiento en la figura 32
171
Fig. 32: Prueba Shapiro-Wilks
Usando código en R:
shapiro.test(puntajes)
Shapiro-Wilk normality test
data: puntajes
W = 0.9521, p-value = 0.04163
El valor p obtenido permite rechazar H0 y se concluye entonces que los

puntajes obtenidos NO se disstribuyen normalmente. En la figura 32
se muestra la densidad ajustada a los puntajes. Observe que su forma
dista mucho de ser simétrica. El código en R:
((plot(density(puntajes), xlab=”Puntaje”, main=”Densidad para Pun-

tajes”, ylab=))).
172
Fig. 33: Densidad para puntajes
Ejemplo
De la producción diaria de una empresa se seleccionan de manera aleato-
ria 4 artı́culos y se examinan uno a uno para verificar si son defectuosos
o no. A pesar de desconocer la proporción diaria de defectuosos en la
empresa, se tiene la idea de que el número de artı́culos defectuosos de los
4 seleccionados es Binomial. Para verificarlo, se repite este experimento
durante 100 dı́as y cada vez se registra el número de defectuosos entre
los 4 seleccionados. Los resultados se muestran en la siguiente tabla.
No éxitos 0 1 2 3 4
Frec Obs 11 17 42 21 9
Verifique si en efecto el número de defectuosos tiene una distribución

Binomial, con n = 4.
Solución
Sea X1 , X2 , · · · , X100 una muestra aleatoria que representa el número
de defectuosos para los 100 dı́as observados. Según el enunciado se desea
probar las hipótesis:
H0 : Xi ∼ b(4 , p) vs Ha : Xi no se distribuye b(4 , p) .

173
Como p es desconocido, bajo H0 cierta es posible estimar a p usando el

método de máxima verosimilitud.
100
100
100

100
4 4 Xi 4−Xi
Xi
L(p) = p (1 − p) 4−Xi
= p i=1 (1 − p) i=1 .
i=1
X i i=1
X i

100
100
(p) = K + Xi ln(p) + 4 ∗ 100 − Xi .
i=1 i=1
Al derivar esta última ecuación e igualar a cero se obtiene que:
1
100
p̂ = Xi .
4 ∗ 100 i=1
Para los datos de la tabla anterior se tiene que

100
Xi
i=1
p̂ = = 12 .
4 ∗ 100
La hipótesis nula se convierte en:
4
1 4 1
H0 : Xi ∼ b(4 , ) ⇔ H0 : pi = , i = 0, 1, 2, 3, 4 .
2 i 2
Bajo H0 , las probabilidades pi son:
1 1 1 1 1
p̂0 = , p̂1 = 4 , p̂2 = 6 , p̂3 = 4 , p̂4 = .
16 16 16 16 16
La tabla resumen con las respectivas frecuencias esperadas es:
No éxitos 0 1 2 3 4
Frec Obs 11 17 42 21 9
Frec Esp 6.25 25 37.5 25 6.25
Estadı́stico de prueba. En este caso la estimación del parámetro p hace
que se pierda un grado de libertad más.

4
(Ni − n pi )2
XC = ∼ χ2 (3) .
i=0
n pi
174
Para los datos observados se tiene que: XC = 8.567 . El valor p de la

prueba se calcula como: V p = P (χ2 (3) > 8.567) . Observando la tabla
para la Ji-cuadrado, se tiene que
0.025 < V p < 0.05 . Con esta información se rechaza H0 y se con-
cluye que según la información registrada, el número de éxitos NO se
distribuye Binomial con p = 12 .
Estadı́stica de Kolmogorov - Smirnov

Suponga que X1 , . . . , Xn es una m.a. de una distribución desconocida
con c.d.f. F (x) y que los datos se ordenan de menor a mayor. Considere
las hipótesis:
H0 : F (x) = F0 (x) vs H1 : F (x) = F0 (x) .
Para evaluar esta hipótesis, se recurre a la Distribución empı́rica de la

muestra, la cual es usualmente denotada Sn (x) y se define como:
⎧
⎨ 0 , x < x(1)
k
Sn (x) = , x(k) ≤ x < x(k+1) .
⎩ n
1 , x ≥ x(n)
Ya que bajo H0 , F0 (x) se encuentra completamente especificada, es po-

sible evaluar F0 (x) para cualquier otro valor de x y compararlo con
Sn (x). Si H0 es cierta, se espera que la diferencia entre Sn (x) y F0 (x)
sea pequeña. La estadı́stica de Kolmogorov-Smirnov se define como:
Dn = máx |Sn (x) − F0 (x)| .

x
La distribución de Dn no depende de la distribución especificada en H0

y solo debe ser evaluada en función del tamaño de la muestra.
Para α dado se rechaza H0 si Dn > √cn . Esta prueba puede ser usada
para verificar si un conjunto de datos (discretos o continuos) provienen
de una distribución especı́fica.
Los valores de c se encuentran tabulados y la respectiva tabla se muestra
en la figura 30.
175
Fig. 34: Valores crı́ticos para la prueba K-S
Ejemplo
A partir de una muestra de 215 estudiantes, se recopiló información
acerca de 5 variables de interés: Estrato, Horas (dedicadas semanalmente
a estudiar), Edad (en años), Trab(Trabaja 1:Si; 2: No) y Prom (obtenido
en el semestre anterior). Se muestra una parte de los datos:
> ind[1:10,]
Estrato Horas edad trab prom
1 1 28 20 1 3.8
2 1 24 21 1 3.7
3 1 18 19 1 3.9
4 1 20 20 2 3.7
5 1 23 25 2 3.7
6 1 26 18 2 3.6
7 2 12 35 1 3.0
8 2 30 26 1 3.2
9 2 4 32 1 2.9
10 2 9 26 1 3.4
Un histograma para la variable Prom se muestra en la figura 35.

176
Fig. 35: Histograma para Promedio
Se quiere determinar si los promedios se comportan de manera Normal.

Se plantean las siguientes hipótesis:
H0 : Los promedios se distribuyen n (μ, σ 2 )

Ha : Los promedios no se distribuyen n (μ, σ 2 )
El estadı́stico de prueba es Dn . debido a que los parámetros en el caso de
una Normal, deben ser estimados por máxima verosimilitud, Lilliefors
propone una modificación a el test K-S. El comando en R para realizar
esta prueba es:
> lillie.test(ind[,5])
Lilliefors (Kolmogorov-Smirnov) normality test
data: ind[, 5]
D = 0.0892, p-value = 0.0002713
Este valor P permite rechazar H0 y concluir que los promedios NO se
distribuyen normalmente.

Pruebas de HIpótesis

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Pruebas de HIpótesis

Caricato da

Copyright:

Formati disponibili

137

Pruebas de hipótesis Estadı́sticas

Como dicha aﬁrmación puede ser o no cierta, dos hipótesis (antagónicas)

El conjunto {x | x > k} es tal que siempre que el valor de la v.a. X

Las v.a. X o p̂ son llamadas Estadı́sticos de Prueba y al conjunto

Ası́, toda prueba de hipótesis consta de:

Si θ̂ es un estimador puntual para θ, los valores de θ̂ pueden ser usados

Problema: Hallar valores adecuados para k, k1 , k2 .

En este proceso se pueden cometer dos tipos de errores:

Error Tipo I: Rechazar H0 , dado que es cierta.

Sea α = P (Error Tipo I) y β = P (Error Tipo II).

α es llamado nivel de signiﬁcancia de la prueba ó tamaño de la re-

Pruebas de Hipótesis para Medias:

Estadı́stico de Prueba: X̄.

R. Crı́tica. Para α dado, tenemos α = P (Error Tipo I). Ahora

α = P (Rechazar H 0 | H 0 es cierta) = P (Rechazar H 0 | μ = μ 0 ) .

Suponga que deseamos probar:

Si n es grande y σ 2 es conocida, el TLC garantiza que

Realizando un procedimiento similar, se obtienen las regiones de rechazo

El procedimiento de Prueba de Hipótesis puede ser reescrito, usando

Como ZC > 2.33, se rechaza H0 y se concluye que según la información

Pruebas de Hipótesis para Media en pobla-

Ası́, si μ0 es un valor particular de μ, tenemos:

R. Critica: {TC | TC > tα (19)} t0.01 (19) = 2.539

R. Critica: {Tc | Tc > 2.539} .

Como TC < 2.539. No se puede rechazar H0 . No hay suﬁciente evi-

Si α = 0.05 ⇒ t0.05 (19) = 1.729 y asi TC > tα y se puede re-

a) Se pide calcular la probabilidad del error Tipo I, es decir, α:

α = P (Rechazar H0 | H0 cierta) = P (X̄ < 71.8 | μ = 75)

Pruebas de Hipótesis para Diferencia de

Las hipótesis a probar son de la forma:

Si se conocen las varianzas, se reemplazan en la expresión anterior. La

ZC = −3.45. Como ZC = −3.45 < −2.33 se rechaza H0 y se concluye

Pruebas de Hipótesis para el cociente de

Una variable aleatoria X, se dice que tiene una distribución f con

Los parámetros ν1 y ν2 son comúnmente llamados grados de libertad.

Bajo el supuesto de muestras aleatorias independientes y que provienen

donde fα/2 (n − 1, m − 1) es el cuantil superior a nivel α2 para una f con

Si dicho intervalo contiene al 1, se asume que las varianzas son iguales,

Fig. 26: Tabla para la f (ν1 , ν2 )

Otra forma es a través de un juego de hipótesis acerca del cociente entre

El estadı́stico de Prueba es:

La región de rechazo es de la forma:

Observe que si se desea probar que σ12 = σ22 , basta hacer δ0 = 1.

Comen comida rápida Tamaño Promedio Desv. Esta

La región de rechazo, para un α = 0.05 es de la forma:

{ FC | FC < 0.3011 ∨ FC > 3.43 } .

Pruebas de Hipótesis para Diferencias de

Sea X 1 , . . . , X n una m.a. de una población n(μ1 , σ12 ) y sea Y 1 , . . . , Y m

Las hipótesis a probar son de la forma:

El estadı́stico de Prueba dependerá de como son σ12 y σ22 .

Si se conocen las varianzas, se procede igual que en el caso de tener

El caso interesante se tiene cuando no se conocen las varianzas. La re-

Después de identiﬁcar la relación entre las varianzas poblacionales se

Caso I: σ12 = σ22 . El estadı́stico de prueba será:

grados de libertad por ν.

X̄ = 290, S1 = 12, n = 10 Ȳ = 308.5, S2 = 15, m = 15 .

Veriﬁquemos como son σ12 y σ22 .

donde f0.025 (9, 14) = 3.21 y f0.025 (14, 9) = 3.80 .

Como 1 ∈ al I.C. podemos aﬁrmar que σ12 = σ22 .

Si α = 0.05 t0.05 (23) = 1.714.

Se rechaza H0 y se concluye que los engranes del proveedor B tienen

tipo 2. Asuma Yi ∼ n(μ 2 , σ22 )

X̄ = 421 , S 1 = 2.0 , n = 10 , Ȳ = 426 , S 2 = 4.2 , m = 10 .

H 0 : σ12 = σ22 vs H a : σ12 = σ22 .