Sei sulla pagina 1di 40

137

Pruebas de hipótesis Estadı́sticas


Una hipótesis Estadı́stica es una afirmación que se hace con respecto a
una o algunas caracterı́sticas desconocidas de una población de interés
o acerca de la misma población.
Una afirmación hecha acerca de una población o de una de sus carac-
terı́sticas de interés, tiene sentido solo si es evaluada con base en la
información obtenida a partir de una muestra aleatoria de dicha pobla-
ción.

Como dicha afirmación puede ser o no cierta, dos hipótesis (antagónicas)


pueden ser planteadas :
H0 : La hipótesis es cierta Ha : La hipótesis es falsa .
H0 se rechaza, solo si la evidencia muestral apoya fuertemente esa de-
cisión. En otro caso diremos que la evidencia muestral no es suficiente
para rechazar H0 y se asume como cierta. El proceso por medio del cual
escogemos una de las dos hipótesis es llamado Prueba de hHipótesis.

Ejemplo
Un tratamiento para dejar de fumar a mostrado ser efectivo en el 60 %
de los casos. Un investigador propone un nuevo método que se supone
mejorará dicho porcentaje. Para verificar esta afirmación se aplicó di-
cho tratamiento a 20 voluntarios con hábito de fumar. ¿Como usar la
información recolectada para decidir si el nuevo tratamiento es mejor?
Queremos determinar si la proporción de personas que deja de fumar a
causa del nuevo tratamiento es más del 60 %. ¿Cuantas de las 20 perso-
nas mı́nimo deben dejar de fumar para aceptar que el nuevo tratamiento
es mejor?

Solución
Sea X: # personas que dejan de fumar a causa del nuevo tratamiento.
X ∼ bin(20 , p). Las hipótesis a probar son:
H0 : p ≤ 0.6 vs Ha : p > 0.6 .
Suponga que un valor k, es tal que si X > k, se tiene suficiente evidencia
para rechazar H0 . (es decir, para concluir que p > 0.6).
138

El conjunto {x | x > k} es tal que siempre que el valor de la v.a. X


esté en éste conjunto, se debe rechazar H0 . ¿Cómo hallar un valor
adecuado para k?

Observe que

X k k
X>k ⇔ > ⇔ p̂ > = p0 .
n n 20
Ası́ X > k ⇔ p̂ > p0 . La desición recae sobre p̂.

Las v.a. X o p̂ son llamadas Estadı́sticos de Prueba y al conjunto


{x | x > k} ó {p̂ | p̂ > p0 } se le llama Región Crı́tica o Región de Re-
chazo. El proceso aquı́ mencionado constituye una prueba de hipótesis
(por notación P.H).

Ası́, toda prueba de hipótesis consta de:


a) Hipótesis Nula: H0 .
b) Hipótesis alterna: Ha .
c) Estadı́stico de Prueba.
d) Región de Rechazo.
En general, sea θ un parámetro de interés desconocido y sea θ0 un valor
particular de θ. Tres hipótesis alternas pueden ser planteadas:

⎨ θ < θ0
H0 : θ = θ0 vs Ha : θ > θ0

θ = θ0

Si θ̂ es un estimador puntual para θ, los valores de θ̂ pueden ser usados


para tomar una desición sobre H0 . Las respectivas regiones crı́ticas
asociadas a Ha son:
     
θ̂ | θ̂ < k θ̂ | θ̂ > k θ̂ | θ̂ < k1 ∨ θ̂ > k2 .

Problema: Hallar valores adecuados para k, k1 , k2 .


139

En este proceso se pueden cometer dos tipos de errores:

Error Tipo I: Rechazar H0 , dado que es cierta.


Error Tipo II: Aceptar H0 , dado que es falsa.

Sea α = P (Error Tipo I) y β = P (Error Tipo II).

α es llamado nivel de significancia de la prueba ó tamaño de la re-


gión crı́tica. Si se fija α, es posible hallar valores adecuados para k, k1 ,
k2 .

Pruebas de Hipótesis para Medias:


Muestras no normales
Sea X 1 , . . . , X n una m.a. de una población con media μ y varian-
za σ 2 . Sea μ 0 un valor de interés para μ. Tres hipótesis pueden ser
establecidas.

⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0 .

μ = μ0

Estadı́stico de Prueba: X̄.

R. Crı́tica. Para α dado, tenemos α = P (Error Tipo I). Ahora

α = P (Rechazar H 0 | H 0 es cierta) = P (Rechazar H 0 | μ = μ 0 ) .

Suponga que deseamos probar:

H0 : μ = μ0 vs Ha : μ > μ 0 .

Entonces:
 
X̄ − μ0 k − μ0
α = P (X̄ > k | μ = μ0 ) = P > .
√σ √σ
n n
140

Si n es grande y σ 2 es conocida, el TLC garantiza que

X̄ − μ0
∼ n(0, 1) .
√σ
n

Luego  
k − μ0
α≈P Z > .
√σ
n

k−μ0
De esta última ecuación, se obtiene que zα = √σ
. Al despejar k se
n
obtiene k = μ0 + zα √σn . Finalmente, la región crı́tica está dada por:

σ
R.C = X̄ | X̄ > μ0 + zα √ ⇔ R.C = {ZC | ZC > zα } ,
n
X̄−μ0
donde, ZC = √σ
.
n

Realizando un procedimiento similar, se obtienen las regiones de rechazo


para las todas las posibles hipótesis alternativas:

X̄ − μ 0
X̄ | X̄ > k ⇔ X̄ | X̄ > μ 0 + Zα ⇔ X̄ | √ > Zα .
σ/ n

El procedimiento de Prueba de Hipótesis puede ser reescrito, usando


como estadı́stico de prueba a ZC en vez de X̄. En resumen obtenemos:

⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0

μ = μ0

Estadı́stico de Prueba:
X̄ − μ 0
ZC = .
√σ
n

Región Crı́tica: ⎧
⎨ ZC | ZC < −Zα
ZC | ZC > Zα .

ZC | |ZC | > Zα/2
141

Si σ 2 es desconocida, se usa S 2 .

Ejemplo
Se estudia el rendimiento de un proceso quı́mico. Con base en la obser-
vación de 50 dias. Se obtuvo un rendimiento promedio del 90.48 % con
una desviación estándar de 1.1514 %. ¿Se puede afirmar que el rendi-
miento real del proceso es superior al 90 %? Use un α = 0.01.

Solución
Sea X 1 , . . . , X 50 una m.a. que representa los rendimientos de 50 dias.
Suponga que E[Xi ] = μ y V [Xi ] = σ 2 ambas desconocidas. Se
obtuvo X̄ = 90.48 y S = 1.1514
Las hipótesis a probar son:
H0 : μ = 90 vs Ha : μ > 90

E. Prueba:
X̄ − 90
ZC = ∼ n(0 , 1) α = 0.01 .
√S
50

R. Critica =
{ZC | ZC > Z0.01 } .

Como α = 0.01, se tiene que Z0.01 = 2.33. Ası́, R. Critica = {ZC | ZC > 2.33 } .

90.48 − 90
ZC = 1.1514 = 2.95 .

50

Como ZC > 2.33, se rechaza H0 y se concluye que según la información


suministrada, el rendimiento medio real es superior al 90 %.

Pruebas de Hipótesis para Media en pobla-


ciones normales
Si X 1 , . . . , X n es una m.a. de una n(μ , σ 2 ), con μ y σ 2 desconocidas,
X̄−μ
√ ∼ t(n − 1).
sabemos que S/ n
142

Ası́, si μ0 es un valor particular de μ, tenemos:



⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0

μ = μ0

E.P:
X̄ − μ
TC = .
√S
n

Región Crı́tica:

⎨ TC | TC < −tα (n − 1)
TC | TC > tα (n − 1) ; α dado .

TC | |TC | > tα/2 (n − 1)

Ejemplo
En el ejemplo anterior suponga que el rendimiento del proceso es una
v.a. normal n(μ, σ 2 ) con μ y σ 2 desconocidas. Al observar el rendimiento
diario en los siguientes 20 dias, se obtuvo un rendimiento promedio de
90.52 % y una desviación estándar de 1.2212 %. ¿Se puede afirmar que
el rendimiento medio real del proceso es superior al 90 %?

Solución
Sea X 1 , . . . , X 20 una m.a. que representa los rendimientos del proceso
en 20 dias. Asuma que Xi ∼ n(μ, σ 2 ).

Se quiere probar:

H0 : μ = 90 vs H1 : μ > 90

X̄ − 90
E.Prueba: TC = ∼ t(19)
√S
20

R. Critica: {TC | TC > tα (19)} t0.01 (19) = 2.539

R. Critica: {Tc | Tc > 2.539} .


143

90.52 − 90
TC = 1.2212 = 1.90 .

20

Como TC < 2.539. No se puede rechazar H0 . No hay suficiente evi-


dencia para afirmar que el rendimiento medio del proceso sea superior
a 90 %. Asumimos que puede ser inferior o igual al 90 %.

Si α = 0.05 ⇒ t0.05 (19) = 1.729 y asi TC > tα y se puede re-


chazar H0 . Por esta razón el valor de α debe ser previamente fijado.

Ejemplo
El tiempo de secado de un cierto tipo de pintura es una variable aleatoria
Normal con media μ = 75 y desviación estándar σ = 9 (en minutos).
Un grupo de investigadores proponen incorporar un aditivo a la pintura
que permitirá reducir el tiempo de secado al que actualmente se tiene.
Se cree que los tiempos de secado para esta pintura con el aditivo se
seguirán comportando de manera normal con una desviación estándar
σ = 9. Para verificar la afirmación de los investigadores, se consideran
25 pruebas donde se aplica la pintura con el aditivo y se registran los
tiempos de secado. Se decide que si el tiempo promedio obtenido en
la muestra es inferior a 71.8 min, se concluye que el tiempo medio de
secado con el aditivo es inferior al estándar (75 min).
a) Bajo estas condiciones ¿Cuál es la probabilidad de error Tipo I?
b) Calcule la probabilidad de que se concluya que el aditivo no reduce
el tiempo medio de secado, cuando el tiempo medio de secado es
realmente de 72 min.
Solución
Sea X1 , X2 , . . . , X25 una muestra aleatoria que representa los tiempos
de secado de la pintura usando el aditivo. Se asume que Xi ∼ N (μ, 92 ),
i = 1, 2, . . . , n. Las hipótesis a contrastar son:

H0 : μ = 75 vs Ha : μ < 75 .

Se decide que el tiempo medio de secado (μ) será inferior al actual (75
min) si : X̄ <71.8. Luego la región crı́tica o de rechazo es de la forma:

R = { X̄ | X̄ < 71.8 } .
144

a) Se pide calcular la probabilidad del error Tipo I, es decir, α:

α = P (Rechazar H0 | H0 cierta) = P (X̄ < 71.8 | μ = 75)


 
X̄ − μ0 71.8 − 75
= P σ < 9 = P (Z < −1.78)
√ √
n 25
= 1 − P (Z < 1.78) = 0.03753798 .
b) Concluir que no se reduce el tiempo medio de secado, es aceptar
la hipótesis nula sabiendo que en realiadad el tiempo medio de se-
cado con el aditivo es de 72 min. Se pide entonces calcular una
probabilidad de Error Tipo II:
β = P (Aceptar H0 | H0 Falsa) = P (X̄ ≥ 71.8 | μ = 72)
 
X̄ − μ0 71.8 − 72
= P σ ≥ 9 = P (Z ≥ −0.11)
√ √
n 25
= P (Z < 0.11) = 0.5437953 .

Pruebas de Hipótesis para Diferencia de


medias en poblaciones no normales
Sea X 1 , . . . , X n una m.a. de una población con media μ1 y varianza
σ12 ; sea Y 1 , . . . , Y m otra m.a. de otra población con media μ2 y va-
rianza σ22 ambas muestras independientes entre si. Se desea probar una
hipótesis acerca de la diferencia μ1 − μ2 .

Las hipótesis a probar son de la forma:



⎨ μ1 − μ2 < δ 0
H 0 : μ1 − μ2 = δ0 vs H a : μ1 − μ2 > δ 0 ; α dado .

μ1 − μ2 = δ0
δ0 es un valor conocido, estableido en la hipótesis nula. Si n y m son
grandes, el estadı́stico de prueba para estas hipótesis es de la forma:
X̄ − Ȳ − δ 0 aprox
ZC = 2 ∼ n(0, 1) .
S1 S2
n
+ m2
145

Si se conocen las varianzas, se reemplazan en la expresión anterior. La


región de rechazo es de la forma:

⎨ ZC | ZC < −Zα
R.R ZC | ZC > Zα .

ZC | |ZC | > Zα/2

Ejemplo
Dos proveedores fabrican un engrane plástico utilizado en una impreso-
ra láser. El interés está en la resistencia al impacto del engrane, el cuál
se mide en pie − lb. Una muestra aleatoria de 50 engranes suministrados
por el proveedor A, arrojan una resistencia promedio de 295pie − lb con
una desviación de 15pie − lb. Del proveedor B se toma una m.a. de 45
engranes. Esta muestra arroja una resistencia promedio de 306pie − lb y
una desviación estándar de 16pie−lb. ¿Puede afirmarse que los engranes
del proveedor A tienen una resistencia media inferior a los engranes del
proveedor B?. Use α = 0.01
Solución
Sea X1 , . . . , X50 una m.a que representa las resistencias de los en-
granes del proveedor A. Asuma que E[Xi ] = μ1 y V ar[Xi ] = σ12 ;
i = 1, 2, . . . , 50.

Sea Y1 , . . . , Y45 otra m.a. que representa las resistencias de los en-
granes del proveedor B. Asuma que E[Yj ] = μ2 y V ar[Yj ] = σ22 ;
j = 1, 2, . . . , 45., ambas muestras independientes entre si.
De la información muestral se tiene que:
X̄ = 295 , S1 = 15 , Ȳ = 306 , S2 = 16 , n = 50 , m = 45 .
Las hipótesis a probar son:
H0 : μ1 − μ2 = 0 vs Ha : μ1 − μ2 < 0 .
El estadı́stico de prueba es:
X̄ − Ȳ − δ0 aprox
ZC = 2 ∼ n(0, 1) .
S1 S2
50
+ 452
Para α = 0.01 la región de rechazo es
R.C. : {ZC | ZC < −z0.01 } = {ZC | ZC < −2.33} .
146

ZC = −3.45. Como ZC = −3.45 < −2.33 se rechaza H0 y se concluye


que la resistencia media del engrane A es inferior a la del engrane B.

Pruebas de Hipótesis para el cociente de


Varianzas en poblaciones normales
Para determinar cuando las varianzas de dos poblaciones normales pue-
den asumirse iguales o diferentes (aunque sean desconocidas), se requiere
el uso de otra distribución de probabilidad especial. Esta se conoce co-
mo Distribución F.

Una variable aleatoria X, se dice que tiene una distribución f con


parámetros ν1 y ν2 , si su p.d.f es de la forma:
    ν1  − ν1 +ν 2
Γ ν1 +ν 2
ν 2 ν 1 − ν 2
f (x) =  ν1   ν2 
1 1
2
x2 1
1+ x ,
Γ 2 Γ 2 ν2 ν2

Los parámetros ν1 y ν2 son comúnmente llamados grados de libertad.


Por notación se escribe: X ∼ f (ν1 , ν2 ). El parámetro ν1 se identifica
con los grados de libertad del numerador y ν2 con los del denominador.

Bajo el supuesto de muestras aleatorias independientes y que provienen


de poblaciones normales, se puede demostrar que,
S12 /σ12
F = 2 2 ∼ f (n − 1, m − 1) ,
S2 /σ2
donde S12 y S22 son las varianzas muestrales de las muestras aleatorias
respectivamente.
Para determinar si las Varianzas poblacionales de ambas muestras pue-
den asumirse iguales o diferentes, se puede calcular un Intervalode Con-
σ2
fianza al 100(1 − α) % para σ12 . Este intervalo es de la forma:
2
 
S12 1 S12
, f (m − 1, n − 1) ,
S22 fα/2 (n − 1, m − 1) S22 α/2
147

donde fα/2 (n − 1, m − 1) es el cuantil superior a nivel α2 para una f con


n − 1, m − 1 grados de libertad y fα/2 (m − 1, n − 1) es el cuantil superior
a nivel α2 para una f con m − 1, n − 1.

Si dicho intervalo contiene al 1, se asume que las varianzas son iguales,


aunque desconocidas. Si el intervalo no contiene el 1, se asume que las
varianzas son diferentes.
El cálculo de probabilidades o de cuantiles para una f es a través de
tablas que se calculan de manera numérica. En la siguiente imagen se
muestra una parte de una tabla para la f .

Fig. 26: Tabla para la f (ν1 , ν2 )

Otra forma es a través de un juego de hipótesis acerca del cociente entre


σ12 y σ22 . Bajo los mismos supuestos, se desea probar una hipótesis acerca
de la relación entre las varianzas de ambas distribuciones. En particular,
si δ0 es un valor conocido, las hipótesis a contrastar son de la forma:
⎧ 2
⎨ σ1 < δ0 σ22
H 0 : σ12 = δ0 σ22 vs H a : σ 2 > δ0 σ22 .
⎩ 12
σ1 = δ0 σ22

El estadı́stico de Prueba es:

1 S12
FC = ∼ f (n − 1, m − 1) .
δ0 S22
148

La región de rechazo es de la forma:




⎪ FC | FC < fα (m−1,
1


n−1)


FC | FC > fα (n − 1, m − 1) ; α dado .





⎩ FC | FC < 1
fα/2 (m−1, n−1)
∨ FC > fα/2 (n − 1, m − 1)

Observe que si se desea probar que σ12 = σ22 , basta hacer δ0 = 1.

Ejemplo
El artı́culo ((Effects of fast-food consumption on energy intake and diet
quality among children in a National household study)) (Pediatrics,
2004), reporta el resumen de datos relacionados con la ingesta de calorı́as
tanto para una muestra de adolescentes que dijeron no suelen consumir
comida rápida y otra muestra de adolescentes que digeron consumirla.
Se cree que esta costumbre incrementa el consumo medio de calorı́as
en el segundo grupo en comparación con el primero. Se desea estable-
cer si la variabilidad en las mediciones de calorı́as en ambos grupos es
diferente. Use un α = 0.05. De la experiencia se sabe que el contenido
de calorı́as en ambas poblaciones es una variable aleatoria Normal. La
infomación obtenida en el estudio se muestra a continuación.

Comen comida rápida Tamaño Promedio Desv. Esta


NO 13 2258 1519
SI 12 2637 1138
Solución
Sea X1 , . . . , X13 una m.a. que representa las mediciones de calorı́as en
el grupo de adolescentes que no consumen comidas rápidas, se asume que
Xi ∼ n(μ1 , σ12 ). Sea Y1 , . . . , Y12 otra m.a. que representa las mediciones
de calorı́as en el grupo de adolescentes que consumen comidas rápidas,
se asume que Yj ∼ n(μ2 , σ22 ) ambas muestras independientes entre si.
Se desea probar las hipótesis:
H0 : σ12 = σ22 vs Ha : σ12 = σ22 .
Estadı́stico de prueba:
S12
FC = ∼ f (12, 11) .
S22
149

La región de rechazo, para un α = 0.05 es de la forma:

1
{ FC | FC < ∨ FC > f0.025 (12, 11) } .
f0.025 (11, 12)

En este caso f0.025 (11, 12) = 3.321 y f0.025 (12, 11) = 3.430. Con esto, la
región de rechazo es de la forma:

{ FC | FC < 0.3011 ∨ FC > 3.43 } .

S12 15192
Ahora, FC = 2 = = 1.782 . Como FC < 3.43, no se puede re-
S2 11382
chazar H0 y se concluye que la evidencia muestral no es suficiente para
observar una diferencia en las varianzas de los consumos de calorias para
ambos grupos de adolescentes, se asume entonces que ambas varianzas
son similares.

Pruebas de Hipótesis para Diferencias de


Medias en Poblaciones Normales
Para efectos de manejar una notación estándar, suponga que se tienen
dos poblaciones normales independientes y se extraen dos muestras alea-
torias.

Sea X 1 , . . . , X n una m.a. de una población n(μ1 , σ12 ) y sea Y 1 , . . . , Y m


otra m.a. de otra población n(μ2 , σ22 ) ambas m.a. E.I. Se desea probar
hipótesis acerca de la diferencia μ1 − μ2 .

Las hipótesis a probar son de la forma:



⎨ μ1 − μ2 < δ 0
H 0 : μ1 − μ2 = δ0 vs H a : μ1 − μ2 > δ 0 ; δ0 dado .

μ1 − μ2 = δ0

El estadı́stico de Prueba dependerá de como son σ12 y σ22 .


150

Si se conocen las varianzas, se procede igual que en el caso de tener


muestras grandes y el estadı́stico de prueba será

X̄ − Ȳ − δ 0
ZC = 2 ∼ n(0, 1) .
σ1 σ2
n
+ m2

El caso interesante se tiene cuando no se conocen las varianzas. La re-


lación entre las varianzas de dos poblaciones normales, para efectos de
comparar sus medias, es crucial para determinar el tipo de estadı́stico
de prueba a usar.

Después de identificar la relación entre las varianzas poblacionales se


distinguen dos casos:

Caso I: σ12 = σ22 . El estadı́stico de prueba será:

X̄ − Ȳ − δ0 (n − 1)S12 + (m − 1)S22
TC = ∼ t (n + m − 2) ; Sp2 = .
sp n1 + m1 n+m−2

R. Crı́tica: ⎧
⎨ TC | TC < −tα (n + m − 2)
TC | TC > tα (n + m − 2) ;

TC | |TC | > tα/2 (n + m − 2)

Caso II: σ12 = σ22 . En este caso el estadı́stico de prueba tiene una
distribución aproximada.
Estadı́stico de Prueba:
 2 2
S1 S22
X̄ − Ȳ − δ0 aprox n
+ m
TC = 2 2
∼ t (v) ; v =  2  2  2 2 − 2 .
S1 S2 S 1 S2

n
+ m
n m

n+1
+ m+1

La región crı́tica tiene forma similar al caso anterior pero cambiando los
151

grados de libertad por ν.



⎨ TC | TC < −tα (ν)
TC | TC > tα (ν) ; α dado .

TC | |TC | > tα/2 (ν)

Ejemplo
Dos proveedores fabrican un engrane plástico utilizado en una impre-
sora láser. El interés está en la resistencia al impacto del engrane, el
cuál se mide en pie − lb. Una m.a. de 10 engranes suministrados por el
proveedor A, arrojan una resistencia promedio de 290pie − lb con una
desviación de 12pie − lb. Del proveedor B se toma una m.a. de 15 engra-
nes. Esta muestra arroja una resistencia promedio de 308.5pie−lb y una
desviación estándar de 15pie − lb. Se sabe que las resistencia al impac-
to se comportan de manera normal para este tipo de engrane. ¿Puede
afirmarse que los engranes del proveedor A tienen una resistencia media
inferior a los engranes del proveedor B?. Use α = 0.05

Solución
Sea X 1 , . . . , X 10 una m.a que representa las resistencias de los engra-
nes del proveedor A. Asuma que Xi ∼ n(μ 1 , σ12 ).
Sea Y 1 , . . . , Y 15 otra m.a. que representa las resistencias de los engra-
nes del proveedor B. Asuma que Yj ∼ n(μ 2 , σ22 ) ambas m.a. E.I.
De las muestras se tienen los siguientes resultados:

X̄ = 290, S1 = 12, n = 10 Ȳ = 308.5, S2 = 15, m = 15 .

Verifiquemos como son σ12 y σ22 .

σ12
Un I.C. al 95 % para σ22
es:
 
S12 1 S12
, f (14, 9) ,
S22 f0.025 (9, 14) S22 0.025

donde f0.025 (9, 14) = 3.21 y f0.025 (14, 9) = 3.80 .


 
1
⇔ 0.64 ∗ , 0.64 ∗ (3.8) ⇔ (0.1994 , 2.432) .
3.21
152

Como 1 ∈ al I.C. podemos afirmar que σ12 = σ22 .


Las hipótesis a probar son:

H0 : μ 1 − μ 2 = 0 vs H1 : μ 1 − μ 2 < 0 .

E. Prueba
X̄ − Ȳ − 0
TC = ∼ t (23) .
S p 10 + 15
1 1

9 S12 + 14 S22
Sp2 = = 193.304 , Sp = 13.90 .
23
290 − 308.5
TC = = −3.26 .
1 1
13.90 10 + 15

Si α = 0.05 t0.05 (23) = 1.714.

Se rechaza H0 y se concluye que los engranes del proveedor B tienen


una resistencia media superior a la de los engranes del proveedor A.

Ejemplo
Se investigan los puntos de fusión de dos aleaciones utilizadas en la fa-
bricación de cierto tipo de soldadura. Para ello se funden 10 muestras
de cada material, y se miden en ambas los respectivos de fusión. Para
la aleación 1 se obtiene un punto de fusión promedio de 421◦ F con una
desvición estándar de 2◦ F. Para la aleación 2 los resultados fueron
426◦ F y 4.2◦ F respectivamente. Por experiencia se sabe que los puntos
de fusión para ambas aleaciones es una variable aleatoria normal. ¿Se
puede afirmar que no hay diferencia significativa en los puntos de fusión
de ambas aleaciones?. Use α = 0.05.

Solución
Sea X 1 , . . . , X 10 una m.a. que representa los puntos de fusión de las
10 muestras de la aleación tipo 1.
Asuma Xi ∼ n(μ 1 , σ12 ) , i = 1, 2, . . . , 10. Sea Y 1 , . . . , Y 10 otra m.a.
que representa los puntos de fusión de las 10 muestras de la aleación
153

tipo 2. Asuma Yi ∼ n(μ 2 , σ22 )


i = 1, 2, . . . , 10. De los resultados muestrales obtenemos:

X̄ = 421 , S 1 = 2.0 , n = 10 , Ȳ = 426 , S 2 = 4.2 , m = 10 .


σ12
Se determinará la relación entre σ12 y σ22 . Un I.C. al 95 % para σ22
es de
la forma:
 
S12 1 S12
, f (9, 9) ,
S22 f0.025 (9, 9) S22 0.025
σ12
con f0.025 (9, 9) = 4.03. Un I.C. al 95 % para σ22
es:
 
1
0.227 ∗ , 0.227(4.03) ⇔ (0.056 , 0.915) .
4.03
Como 1 ∈
/ al I.C. afirmamos que σ12 = σ22 .

Otra forma consiste en probar las hipótesis:

H 0 : σ12 = σ22 vs H a : σ12 = σ22 .


Estadı́stico de prueba:
S12
FC = ∼ f (9, 9) .
S22
Región de rechazo

1
R.C. : FC | FC < ∨ FC > f0.025 (9, 9) .
f0.025 (9, 9)

⇔ R.C. : { FC < 0.2481 ∨ FC > 4.03 } .


22
FC = = 0.2268 .
4.22
Como FC ∈ R.C. se reachaza H0 y se concluye que las varianzas po-
blacionales son diferentes. Retomado la pregunta original acerca de los
puntos de fusión medios, las hipótesis a probar son:

H0 : μ 1 − μ 2 = 0 vs H1 : μ 1 − μ 2 = 0 .
154

X̄ − Ȳ − 0 aprox
E.P. TC = 2 ∼ t (v) , con v = 13.745 ∼
= 14 .
S1 S22
10
+ 10
R.Crı́tica:
{TC | TC > tα/2 (14)} = {TC | |TC | > t0.025 (14) } = { TC | |TC | > 2.145 }
421 − 426
TC = = −3.3989 ≈ −3.40 .
4 4.2 2
10
+ 10
Como |TC | = 3.40 > 2.145, se rechaza H0 : y se concluye que según la
información suministrada por ambas muestras, hay evidencia suficiente
para afirmar que los puntos medios de fusión son diferentes.

Pruebas de hipótesis para proporciones


Suponga que X es una v.a tal que X ∼ bin(n , p), con p desconocida.
Sea p0 un valor de interés para p.
Tres hipótesis pueden ser planteadas acerca de p.

⎨ p < p0
H0 : p = p0 vs H a : p > P0 .

p = p0
Por el T.L.C. sabemos que si n es grande.
p̂ − p aprox
∼ n(0, 1) .
p (1−p)
n

aprox
Si H0 es cierta  p̂−p0 ∼ n(0, 1) . Ası́, el estadı́stico de prueba
p0 (1−p0 )
n
a ser usado es
p̂ − p0
ZC = .
p0 (1−p0 )
n

Para α dado, la Región crı́tica es de la forma:



⎨ ZC | ZC < −zα
R.C. : ZC | ZC > z α .

ZC | |ZC | > zα/2
155

Ejemplo
En cierta región, tres candidatos aspiran a cierto cargo público. Para
elegir uno de los tres se realiza una votación entre todas las personas
mayores de edad. Para tener idea si existe preferencia por alguno de
los tres, se realiza una encuesta a 1000 personas y se observó 365 a favor
de A, 330 a favor de B y 305 a favor de C. ¿Existe mayor preferencia
por el candidato A?

Solución
X: # votantes en la encuesta a favor de A.

Xi ∼ bin (1000, p). Se desea probar las hipótesis:

1 1
H0 : p = vs H1 : p > .
3 3

Estadı́stico de Prueba:

p̂ − 1/3 aprox
ZC = 1 2 ∼ n(0, 1) .
3
(3)
1000

Si α = 0.05 se tiene que Z0.05 = 1.645 y ası́, la región crı́tica es de la


forma:

R.C = {ZC | ZC > Z0.05 } = {ZC | ZC > 1.645} .

En este caso
0.365 − 1/3
ZC = 1 2 = 2.12 .
( )
3 3
1000

Como ZC > 1.645 se rechaza H0 y se concluye que según los datos ob-
servados existe mayor preferencia por A.

Si α = 0.025 ⇒ Z0.02 = 1.96 y ZC > 1.96. La conclusión


es la misma.
156

Si α = 0.01 ⇒ Z0.01 = 2.33 y ZC < 2.33 , no se puede re-


chazar H0 .

Esto indica que la conclusión varı́a dependiendo del valor de α escogido.

Fig. 27: Rechazo Prueba de Hipótesis


El área sombreada es P (Z > 2.12) = 1 − P (Z ≤ 2.12) = 0.017.

Observe que si α < 0.017 no se puede rechazar H0 pero si α > 0.017,


si se rechaza H0 .

¿Que pasa si n es pequeño? La aproximación normal ya no es adecua-


da y es necesario entonces usar directamente la distribución binomial.

⎨ p < p0
H0 : p = p0 vs Ha : p > p0 .

p = p0

E.Prueba X ∼ bin (n, p) .


⎧ ⎫
⎨ X |X < k ⎬
R.C = X |X > k .
⎩ ⎭
X | X > k1 v X > k 2
Para α fijo es posible determinar los valores de k, k1 y k2

Suponga que queremos probar H0 : p = p0 vs Ha : p > p0 . E. Prue-


ba: X . R.C. = {X | X > k} . Para α fijo, es muy común que no sea
157

posible encontrar un k tal que la probabilidad de Error Tipo I sea exac-


tamente igual a α.

En este caso se halla el menor valor de k tal que

P (Error T ipo I) ≤ α ⇔ P (X > k | p = p0 ) ≤ α .

Ejemplo
Un tratamiento para dejar de fumar a mostrado ser efectivo en el 60 %
de los casos. Se propone un nuevo tratamiento que se cree mejorará
dicho porcentaje. Para verificar esto se tiene una muestra de 20 volun-
tarios que se someten a este tratamiento y 17 de ellos deja de fumar. ¿Es
el nuevo tratamiento mejor?. Use α = 0.05. Luego α = 0.01. ¿Cambia
la conclusión?

Solución
Sea X: # de pacientes tratados que dejan de fumar.
X ∼ bin (20, p). Las hipótesis a probar son:

H0 : p = 0.6 vs Ha : p > 0.6 .


E. Prueba X. Bajo H0 X ∼ bin (20, 0.6). R.C.: {X | X > k }.
Si α = 0.05, se trata de hallar el menor valor de k tal que: P (X >
k | p = 0.6) ≤ 0.05. Ahora, se tiene que:

Si k = 19 ⇒ P (X > k|p = 0.6) = 3.6562 x 10 −5

Si k = 18 ⇒ P (X > k|p = 0.6) = 5.2405 x 10 −4

Si k = 17 ⇒ P (X > k|p = 0.6) = 0.003611

Si k = 16 ⇒ P (X > k|p = 0.6) = 0.01596

Si k = 15 ⇒ P (X > k|p = 0.6) = 0.05095

El menor valor de k es 16. Ası́ R.C. = {X | X > 16} . Como x =


17 ⇒ se rechaza H0 y se concluye que el nuevo tratamiento es mejor.
158

Si α = 0.01 se tiene que P (X > k | p = 0.6) ≤ 0.01 solo si k = 17 .


No se puede rechazar H0 y concluirı́amos que la evidencia no es sufi-
ciente para decir que el nuevo tratamiento es ”mejor” .

Finalmente se tiene que P (X > 17 | p = 0.6) = 0.03611 .

Valor p de una Prueba de Hipótesis


Ejemplo
Se requiere que la tensión a la ruptura de una hilo utilizado en tapi-
cerı́a sea de por lo menos 100psi para considerarse aceptable. Para
establecer este requisisto, se toma una m.a. de 50 hilos y se miden sus
tensiones a la ruptura. Los resultados obtenidos fueron: x̄ = 99 psi y
S = 3.40 psi. ¿Es este tipo de hilo aceptable?
Solución
Sea X 1 , . . . , X 50 una m.a. que representa las tensiones a la ruptura de
este tipo de hilo. Suponga que E [Xi ] = μ y V ar [Xi ] = σ 2 , i =
1, 2, . . . 50. Tenemos que x̄ = 99 psi y S = 3.4 psi. Las hipótesis a
probar son:

H0 : μ − 100 vs Ha : μ < 100 .


E.P
X̄ − 100
ZC = ∼ N (0, 1) .
√S
50
Para α dado la región crı́tica o de rechazo está dad por:
{ZC | ZC < −Zα } .
Zc = −2.08
Si α = 0.05 ⇒ Zα = 1.645
Si α = 0.025 ⇒ Zα = 1.96
Si α = 0.02 ⇒ Zα = 2.05
Si α = 0.01 ⇒ Zα = 2.33
Observe que para α = 0.02 se rechaza H0 , pero para α = 0.01, No se
puede rechazar.
159

Fig. 28: Valor P

P (Z < −2.08) = 0.0188.


Observe que el área a izquierda de −Z0.02 es mayor que 0.0188 y el área
a izquierda de −Z0.01 es menor que 0.0188. Por esto en el primer caso se
rechaza H0 y en el segundo caso no se puede rechazar. El valor observa-
do para ZC es menor que −Z0.02 y mayor que −Z0.01 . Ası́, para rechazar
H0 , debemos escoger un α, tal que ZC < −Zα .

El mı́nimo valor de α es precisamente 0.0188, que es


P (Z < ZC | μ = 100) = P (Z < −2.08) .

Esta probabilidad se conoce como Valor P , usualmente denotado Vp .


Esta probabilidad representa el mı́nimo nivel de significancia a partir
del cual los datos observados indican que se debe rechazar H0 . También
se entiende como la ”Mı́nima probabilidad de equivocarse al rechazar
H0 ”. Otra interpretación más usual se refiere a que el Valor p es la pro-
babilidad de equivocarse al rechazar H0 obtenida experimentalmente o
con base en la muestra.

Un Valor p pequeño, permite rechazar H0 con seguridad. Un Valor p


grande, no aporta suficiente evidencia para rechazar H0 .
Ası́, para el ejemplo anterior Vp = 0.0188.
160

Observe que: Si α < Vp , no se puede rechazar H0 . Si α >> Vp , se recha-


za H0 con seguridad. Como el valor elegido para α puede indicar que se
rechace o acepte H0 , la decisión recae en el valor p.

Ejemplo En los datos anteriores se sabe que las tensiones a la rup-


tura se distribuyen normales n(μ, σ 2 ). De una muestra aleatoria de 20
hilos se obtiene una tensión a la ruptura promedio de 100.95 con una
desviación estándar de 2.21psi. ¿Se puede afirmar que la tensión a la
ruptura es superior a 100psi?
Solución
Sea X1 , · · · , X20 una m.a. de una n(μ, σ 2 ) que representa las tensiones
a la ruptura de los 20 hilos. De la muestra obtenemos x̄ = 100.95 y
S = 2.21. Las hipótesis a probar son:

H0 : μ = 100 vs Ha : μ > 100 .

El estadı́stico de prueba es:

100.95 − 100
TC = 2.21 = 1.922 .

20

Si α = 0.05 ⇒ t 0.05 (19) = 1.729


Si α = 0.025 ⇒ t 0.025 (19) = 2.093
En el primer caso rechazamos. En el segundo no podemos rechazar H0 .
Ahora

Vp = P (t(19) > 1.922) = 0.034866 .

Si se considera que 0.035 es un error pequeño, se puede rechazar H0 y


concluir que, según los datos registrados, la tensión de ruptura media
de este tipo de hilo es superior a 100psi.
161

Fig. 29: Valor P

El cálculo del Valor p está ligado al tipo de hipótesis alterna. En el


primer ejemplo se calculó un área a izquierda (Ha : μ < 100). En el
segundo ejemplo un área a derecha (Ha : μ > 100).
Para el caso de pruebas de hipótesis para la media de una población, se
pueden considerar dos casos para el cálculo del Valor p, dependiendo de
la distribución de la muestra.

Resumen: ⎧
⎨ μ < μ0
H 0 : μ = μ0 vs Ha : μ > μ0

μ = μ0

Caso I: Muestras que provienen de poblaciones normales con varianza


σ 2 conocida.

X − μ0 ⎨ P (Z < ZC )
E.P ZC = , Vp : P (Z > ZC ) .
√σ ⎩
n P (|Z| > |Zc |)

Caso II: Muestras que provienen de poblaciones normales con varianza


σ 2 desconocida.

X − μ0 ⎨ P ( t(n − 1) < TC )
E.P TC = , Vp : P ( t(n − 1) > TC ) .
√§ ⎩
n P ( |t(n − 1)| > |TC |)
162

Caso III: Muestras que provienen de poblaciones no-normales.



X − μ0 ⎨ P (Z < ZC )
E.P ZC = , V p : P (Z > ZC ) .
√S ⎩
n P (|Z| > |Zc |)
Para una porporción.

⎨ p < p0
H0 : p = p 0 vs Ha : p > p0

p = p0

Caso IV: Tamaño de muestra grande.



p̂ − p0 ⎨ P (Z < ZC )
E.P ZC = , Vp : P (Z > ZC ) .
p0 (1−p0 )
√ ⎩
n P (|Z| > |Zc |)

Para el caso de diferencia de medias, se usan los casos I, II y III para


efectos del cálculo de los valores p, teniendo especial cuidado en los su-
puestos distribucionales y los grados de libertad (según el caso).

Ejemplo
Se lleva a cabo un estudio para determinar la efectividad de una va-
cuna contra la gripe. La empresa que produce la vacuna asegura que
esta es no efectiva en menos del 0.8 % de los casos en los que se aplica.
Se administra la vacuna a una muestra aleatoria de 3000 sujetos y 13
contraen gripe. ¿Es cierta la afirmación del fabricante? Use el Valor p
para concluir.
Solución
Sea X: Número de vacunados que contraen gripe. Se sabe que X ∼
b(3000, p) , donde p es desconocido. La hipótesis del fabricante establece
que p < 0.008. Luego, las hipótesis a contrastar son:
H0 : p = 0.008 vs Ha : p < 0.008 .
Como n es grande, el estadı́stico de prueba es:
p̂ − 0.008
ZC = .
0.008 (1−0.008)
3000
163

Como p̂ = 3000
13
= 0.0043, se tiene que ZC = −2.25. Luego, el Valor p de
esta prueba se obtiene como:

Vp = P (Z < ZC ) = P (Z < −2.25)

Vp = P (Z > 2.25) = 1 − P (Z < 2.25) = 0.01224 .


Como este valor es pequeño, se puede rechazar H0 con seguridad y con-
cluir que, según la información suministrada, la proporción de personas
vacunadas que contraen gripe, es inferior al 0.8 % .
164

Pruebas de Bondad de Ajuste


Una prueba de Bondad de Ajuste es un procedimiento especial para
determinar si un conjunto de datos proviene de cierta distribución co-
nocida.
Cuando los datos son discretos, la prueba más usada es la prueba Ji-
Cuadrada, debido a que el estadı́stico de prueba usado es una nueva
variable aleatoria llamada χ2 . Otras pruebas usadas pero en datos con-
tinuos son: Kolmogorov-Smirnov, Shapiro-Wilks, Cramer Von Mises,
Anderson-Darling, entre otras.

Definición Una variable aleatoria X se dice que tiene una distribución


χ2 con ν grados de libertad, si su p.d.f. es de la forma:
1 ν x
f (x) = ν  ν x 2 −1 e− 2 ; x>0 , ν>0.
Γ 2
2 2

Por notación se escribe: X ∼ χ2 (ν) . El parámetro ν es conocido como


grados de libertad. Un nombre similar al usado en los parámetros de la
distribución f . Es fácil mostrar que:
E[X] = ν ; V ar[X] = 2 ν .
Los cuantiles para esta distribución se obtienen al resolver la ecuación:
 
P X > χ2α (ν) = α .
Un gráfico de dicha distribución y el respectivo cuantil α superior se
muestra en la figura 30.

Fig. 30: Distribución χ2 (ν)


165

Suponga que se tiene una experimento multinomial, es decir una serie de


ensayos (n ensayos) idénticos e independientes y k posibles categorı́as ó
clases. Sea p i la probabilidad de clasificar en la categorı́a i y sea Ni el
número de ensayos que caen en la categorı́a i de los n ensayos. Se tiene
que N1 + · · · + Nk = n. Cada Ni será una v.a. binomial con parámetros
n y pi ; i = 1, 2 · · · , k. El número esperado de ensayos en la categorı́a
i es E [Ni ] = n pi ; i = 1, 2 · · · , k

Se desea establecer si los datos observados provienen de cierta distri-


bución especial con c.d.f. F 0 (x). Las hipótesis a probar son:

H0 : F (x) = F0 (x) vs
Ha : F0 (x) no es la c.d.f. asociada a la muestra.
Si F0 está claramente especificada, es posible conocer valores particula-
res para los pi ; i = 1, 2, . . . , k y asi obtener E [Ni ]. En otro caso, los pi
deberán ser estimados y en vez de tener E [Ni ], se estima con n p̂i .
En resumen tenemos:

clase 1 2 k total
Frec observada n1 n2 ... nk n
Probabilidad p1 p2 ... pk 1
Frec esperada n p1 n p2 n pk n
Si n pi ≥ 5 ; i = 1, 2 . . . , k , la v.a.


k
(Ni − n pi ) 2
X= ∼ χ 2 (k − 1) .
i=1
n pi

Observe que


k
(Ni − n pi ) 2  (f.obs − f.esp) 2
X= = ∼ χ2 (k − 1) .
i=1
n pi todas las celdas
f.esp

Suponga que se desea establecer valores particulares para los p i , es decir


queremos probar:

H0 : p i = pi 0 ; i = 1, 2 . . . , k vs Ha : ∃ j tal que pj = pj 0
166

E.P:

k
(ni − n pi ) 2
XC = ∼ χ 2 (k − 1) .
i=1
n pi

R.C.:
{XC |XC > χ2α (k − 1) } ; para α dado .

Finalmente
 
Vp = P χ2α (k − 1) > XC .

El cálculo con la tabla Chi-Cuadrado es similar al cálculo con la tabla


t.

TABLA PARA LA JI-CUADRADO. Áreas a derecha


v 0,1 0,06 0,05 0,025 0,02 0,01 0,005
1 2,706 3,537 3,841 5,024 5,412 6,635 7,879
2 4,605 5,627 5,991 7,378 7,824 9,210 10,597
3 6,251 7,407 7,815 9,348 9,837 11,345 12,838
4 7,779 9,044 9,488 11,143 11,668 13,277 14,860
5 9,236 10,596 11,070 12,833 13,388 15,086 16,750
6 10,645 12,090 12,592 14,449 15,033 16,812 18,548
7 12,017 13,540 14,067 16,013 16,622 18,475 20,278
8 13,362 14,956 15,507 17,535 18,168 20,090 21,955
9 14,684 16,346 16,919 19,023 19,679 21,666 23,589
10 15,987 17,713 18,307 20,483 21,161 23,209 25,188
11 17,275 19,061 19,675 21,920 22,618 24,725 26,757
12 18,549 20,393 21,026 23,337 24,054 26,217 28,300
13 19,812 21,711 22,362 24,736 25,472 27,688 29,819
14 21,064 23,017 23,685 26,119 26,873 29,141 31,319
15 22,307 24,311 24,996 27,488 28,259 30,578 32,801

Ejemplo
Para determinar si un dado está cargado o no, éste es lanzado 600 veces
y se anota cuantas veces aparece cada cara. Los resultados observados
fueron:
167

Cara 1 2 3 4 5 6
Fre.obs 85 94 108 112 98 103
Frec.esp 100 100 100 100 100 100
Las hipótesis a plantear son:
1 1
H 0 : pi = , i = 1, 2, · · · , 6 vs Ha : ∃ j tal que pj = .
6 6
En este caso la distribución acumulada F 0 (x), está asociada a una dis-
tribución uniforme discreta.
Estadı́stico de Prueba:


6
(n i − 100) 2
XC = ∼ χ 2 (5) .
i=1
100

En este caso se tiene que Xc = 4.82. De esta manera se obtiene:


 
Vp = P χ2 (5) > 4.82 > 0.1 .
Usando R se tiene que el valor p es ((1-pchisq(4.82,5) = 0.4382404 )). Por
lo tanto, no se puede rechazar H0 ; en otras palabras, no hay suficiente
evidencia para afirmar que el dado está cargado. Asumimos que no lo
está.
Ejemplo
El generador de números aleatorios de una calculadora arrojó 100 núme-
ros aleatorios (dı́gitos). Los resultados obtenidos son:

Dı́gito 0 1 2 3 4 5 6 7 8 9
Frec 11 11 9 8 8 11 9 11 13 9
F.espe. 10 10 10 10 10 10 10 10 10 10
Las hipótesis a plantear son:
1 1
H 0 : pi = , i = 1, 2, . . . , 10 vs Ha : ∃j tal que pj = .
10 10
1
F.esperada = 100 10 = 10:
E.Prueba:
10
(n i − 10) 2
Xc = ∼ χ 2 (9) .
i=0
10
168

En este caso Xc = 2.4. Ası́, el valor p de esta prueba es:


V p = P (χ 2 (9) > 2.4) >> 0.1 .
En R se usa el comando: ((1-pchisq(2.4,9) = 0.983453 )). Como no se pue-
de rechazar H0 , se asume que los números se generan aleatoriamente.

El siguiente ejemplo muestra porqué no es adecuado usar esta prueba


para datos continuos.
Ejemplo
Una prueba que consta de 100 preguntas es presentada por 50 estudian-
tes. Se tiene la creencia de que el puntaje obtenido es una v.a. normal.
Los resultados obtenidos son:

30 40 42 52 55 60 60 62 64 65 66 66 67 67 68 68 68
70 70 70 71 72 72 73 74 74 75 76 76 78 78 78 79 80
80 82 83 84 84 85 86 88 90 90 92 93 93 94 95 97

Para aplicar la prueba Chi-Cuadrado es necesario forzar un esquema


multinomial. Se construirá una tabla de frecuencias.

k ≈ 1 + 3.33 log(50) ≈ 7 min = 30 , max = 97 ,

67
N.rango = 70 , Amplitud = = 9.571 ≈ 10 .
7
Los intervalos resultantes son:

(−∞ , 40), [40 , 50) , [50 , 60) , [60 , 70) , [70 , 80) , [80 , 90) , [90 , ∞) .

Fig. 31: Histograma para puntajes


169

Las hipótesis a probar son:

H0 : Los puntajes se distribuyen n (μ, σ 2 ).


Ha : Los puntajes no se distribuyen n (μ, σ 2 ).
Como μ y σ 2 son desconocidas, usamos estimadores puntuales para μ
y σ 2 ; estos serı́an X̄ y S 2 .

Bajo H0 asuma que X: puntaje obtenido en la prueba, es una v.a ,


donde X ∼ n (X̄, S 2 ). x̄ = 73.64, S = 14.257, n = 50. Para calcular
las probabilidades de clase, se procede ası́:

p1 = P (X < 40|X ∼ n (73.64, 203.256))


 
40 − 73.64
=P Z< = P (Z < −2.36) = 0.00914
14.257

p2 = P (40 ≤ X < 50) = P (−2.36 < Z < −1.6650)


= 0.03932

Y ası́ análogamente para los demás intervalos. La tabla resultante será:

Clase Fre.obs Probabilidad Frec.Esperada


< 40 1 0.00914 0.457
40 ≤ X < 50 2 0.03932 1.966
50 ≤ X < 60 2 0.12007 6.0035
60 ≤ X < 70 12 0.22890 11.445
70 ≤ X < 80 16 0.27622 13.811
80 ≤ X < 90 9 0.20128 10.064
X ≥ 90 8 0.12507 6.2535

Como n p1 y n p2 son pequeños, menores que 5, se organiza una nueva


tabla agrupando las frecuencias menores que 5 (los dos primeros inter-
valos), con la frecuencia del tercer intervalo:
170

Clase Fre.obs Probabilidad Frec.Esperada


< 60 5 0.16853 8.4265
60 ≤ X < 70 12 0.22890 11.445
70 ≤ X < 80 16 0.27622 13.811
80 ≤ X < 90 9 0.20128 10.064
X ≥ 90 8 0.12507 6.2535

E. Prueba:

5
(n i − n pi ) 2
XC = ∼ χ 2 (5 − 2 − 1) .
i=1
n pi

La razón de que los grados de libertad se reduzcan a 2 y no a 4, es


debido a que se pierde un grado de libertad por cada parámetro que
es estimado a partir de H0 (en este caso se estimaron dos parámetros
previamente: la media y la varianza).
 
XC = 2.367 , Vp = P χ2 (2) > 2.367 > 0.1 .

En R se tiene: ((1-pchisq(2.367,2) = 0.3062051)). Por lo tanto no se puede


rechazar H0 y se asume que los puntajes se distribuyen normalmente.
A pesar de que la prueba aparentemente indica normalidad en los datos,
esta prueba no es concluyente, sobre todo cuando acepta H0 .

Este ejemplo es particularmente importante, porque uno de los supues-


tos fuertes en la mayorı́a de las aplicaciones estadı́sticas, es aquel donde
se debe especificar si la muestra (o muestras) aleatoria proviene de unha
distribución normal.

Entre las propuestas metodologı́cas se encuentran reportadas en la li-


teratura muchas mas pruebas sobre Normalidad. Algunas de las más
conocidas son: Kolmogorov-Smirnov, Shapiro-Wilks, Cramer Von Mis-
ses, Jarque Bera, de Asimetrı́a y Kurtosis de Mardia, etc.

Usando R, se puede aplicar la prueba de Shapiro-Wilk, para determinar


si estos puntajes se distribuyen de manera normal. En R comander se
muestra el procedimiento en la figura 32
171

Fig. 32: Prueba Shapiro-Wilks

Usando código en R:

shapiro.test(puntajes)

Shapiro-Wilk normality test

data: puntajes
W = 0.9521, p-value = 0.04163

El valor p obtenido permite rechazar H0 y se concluye entonces que los


puntajes obtenidos NO se disstribuyen normalmente. En la figura 32
se muestra la densidad ajustada a los puntajes. Observe que su forma
dista mucho de ser simétrica. El código en R:

((plot(density(puntajes), xlab=”Puntaje”, main=”Densidad para Pun-


tajes”, ylab=))).
172

Fig. 33: Densidad para puntajes

Ejemplo
De la producción diaria de una empresa se seleccionan de manera aleato-
ria 4 artı́culos y se examinan uno a uno para verificar si son defectuosos
o no. A pesar de desconocer la proporción diaria de defectuosos en la
empresa, se tiene la idea de que el número de artı́culos defectuosos de los
4 seleccionados es Binomial. Para verificarlo, se repite este experimento
durante 100 dı́as y cada vez se registra el número de defectuosos entre
los 4 seleccionados. Los resultados se muestran en la siguiente tabla.

No éxitos 0 1 2 3 4
Frec Obs 11 17 42 21 9

Verifique si en efecto el número de defectuosos tiene una distribución


Binomial, con n = 4.

Solución
Sea X1 , X2 , · · · , X100 una muestra aleatoria que representa el número
de defectuosos para los 100 dı́as observados. Según el enunciado se desea
probar las hipótesis:

H0 : Xi ∼ b(4 , p) vs Ha : Xi no se distribuye b(4 , p) .


173

Como p es desconocido, bajo H0 cierta es posible estimar a p usando el


método de máxima verosimilitud.
100 
  100 
  100
 
100
4 4 Xi 4−Xi
Xi
L(p) = p (1 − p) 4−Xi
= p i=1 (1 − p) i=1 .
i=1
X i i=1
X i

 

100 
100
(p) = K + Xi ln(p) + 4 ∗ 100 − Xi .
i=1 i=1

Al derivar esta última ecuación e igualar a cero se obtiene que:

1 
100
p̂ = Xi .
4 ∗ 100 i=1

Para los datos de la tabla anterior se tiene que



100
Xi
i=1
p̂ = = 12 .
4 ∗ 100
La hipótesis nula se convierte en:
   4
1 4 1
H0 : Xi ∼ b(4 , ) ⇔ H0 : pi = , i = 0, 1, 2, 3, 4 .
2 i 2
Bajo H0 , las probabilidades pi son:
1 1 1 1 1
p̂0 = , p̂1 = 4 , p̂2 = 6 , p̂3 = 4 , p̂4 = .
16 16 16 16 16
La tabla resumen con las respectivas frecuencias esperadas es:

No éxitos 0 1 2 3 4
Frec Obs 11 17 42 21 9
Frec Esp 6.25 25 37.5 25 6.25
Estadı́stico de prueba. En este caso la estimación del parámetro p hace
que se pierda un grado de libertad más.


4
(Ni − n pi )2
XC = ∼ χ2 (3) .
i=0
n pi
174

Para los datos observados se tiene que: XC = 8.567 . El valor p de la


prueba se calcula como: V p = P (χ2 (3) > 8.567) . Observando la tabla
para la Ji-cuadrado, se tiene que
0.025 < V p < 0.05 . Con esta información se rechaza H0 y se con-
cluye que según la información registrada, el número de éxitos NO se
distribuye Binomial con p = 12 .

Estadı́stica de Kolmogorov - Smirnov


Suponga que X1 , . . . , Xn es una m.a. de una distribución desconocida
con c.d.f. F (x) y que los datos se ordenan de menor a mayor. Considere
las hipótesis:

H0 : F (x) = F0 (x) vs H1 : F (x) = F0 (x) .

Para evaluar esta hipótesis, se recurre a la Distribución empı́rica de la


muestra, la cual es usualmente denotada Sn (x) y se define como:

⎨ 0 , x < x(1)
k
Sn (x) = , x(k) ≤ x < x(k+1) .
⎩ n
1 , x ≥ x(n)

Ya que bajo H0 , F0 (x) se encuentra completamente especificada, es po-


sible evaluar F0 (x) para cualquier otro valor de x y compararlo con
Sn (x). Si H0 es cierta, se espera que la diferencia entre Sn (x) y F0 (x)
sea pequeña. La estadı́stica de Kolmogorov-Smirnov se define como:

Dn = máx |Sn (x) − F0 (x)| .


x

La distribución de Dn no depende de la distribución especificada en H0


y solo debe ser evaluada en función del tamaño de la muestra.

Para α dado se rechaza H0 si Dn > √cn . Esta prueba puede ser usada
para verificar si un conjunto de datos (discretos o continuos) provienen
de una distribución especı́fica.
Los valores de c se encuentran tabulados y la respectiva tabla se muestra
en la figura 30.
175

Fig. 34: Valores crı́ticos para la prueba K-S

Ejemplo
A partir de una muestra de 215 estudiantes, se recopiló información
acerca de 5 variables de interés: Estrato, Horas (dedicadas semanalmente
a estudiar), Edad (en años), Trab(Trabaja 1:Si; 2: No) y Prom (obtenido
en el semestre anterior). Se muestra una parte de los datos:
> ind[1:10,]
Estrato Horas edad trab prom
1 1 28 20 1 3.8
2 1 24 21 1 3.7
3 1 18 19 1 3.9
4 1 20 20 2 3.7
5 1 23 25 2 3.7
6 1 26 18 2 3.6
7 2 12 35 1 3.0
8 2 30 26 1 3.2
9 2 4 32 1 2.9
10 2 9 26 1 3.4

Un histograma para la variable Prom se muestra en la figura 35.


176

Fig. 35: Histograma para Promedio

Se quiere determinar si los promedios se comportan de manera Normal.


Se plantean las siguientes hipótesis:

H0 : Los promedios se distribuyen n (μ, σ 2 )


Ha : Los promedios no se distribuyen n (μ, σ 2 )
El estadı́stico de prueba es Dn . debido a que los parámetros en el caso de
una Normal, deben ser estimados por máxima verosimilitud, Lilliefors
propone una modificación a el test K-S. El comando en R para realizar
esta prueba es:
> lillie.test(ind[,5])

Lilliefors (Kolmogorov-Smirnov) normality test

data: ind[, 5]
D = 0.0892, p-value = 0.0002713
Este valor P permite rechazar H0 y concluir que los promedios NO se
distribuyen normalmente.

Potrebbero piacerti anche