Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Test de hipotesis
Test de hip
otesis. Un test de hipotesis es un procedimiento que nos permite
aceptar o rechazar la hipotesis nula basandose en los valores muestrales observados
Basandose en una funcion de las observaciones T (X1 , . . . , Xn ) (estadstico de
contraste), un test de hipotesis determina una region de rechazo R
Regla de decisi
on. Observada la variable se tendra un valor concreto del estadstico de contraste, T (x1 , . . . , xn )
Se aceptara la hipotesis nula H0 si T (x1 , . . . , xn )
/ R, los datos no presentan
evidencia en contra de la hipotesis nula
Se rechazara la hipotesis nula H0 si T (x1 , . . . , xn ) R, los datos apoyan la
hipotesis alternativa H1
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
Tipos de errores
Cuando se toma la decision de aceptar o rechazar la hipotesis nula se pueden
cometer dos tipos de error:
Error tipo I: Se rechaza H0 cuando esta es cierta
Error tipo II: Se acepta H0 cuando esta es falsa
H0 cierta
H0 falsa
Rechazar H0
Error de tipo I
Decision correcta
Aceptar H0
Decision correcta
Error de tipo II
Conceptos fundamentales
Un test tiene nivel de significaci
on , 0 1, si
P [ Rechazar H0 ] = P [T (X1 , . . . , Xn ) R] , 0
Un test tiene tama
no , 0 1, si
= sup P [ Rechazar H0 ] = sup P [T (X1 , . . . , Xn ) R]
0
Se define la funci
on potencia como la funcion
: [0, 1]
donde
() = P [ Rechazar H0 ] = P [T (X1 , . . . , Xn ) R]
Dados y , tests con nivel de significacion para contrastar H0 : 0
frente a H1 : 1 , es uniformemente m
as potente que si se
cumple
() (), 1
Se dice que el test es uniformemente m
as potente (UMP) a nivel
de significaci
on si tiene nivel de significacion y para cualquier otro
test con nivel de significacion , es uniformemente mas potente que
, es decir,
() (), 1
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
H0 : 0
H1 : 1
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
Ejemplo. La longitud media de los tornillos fabricados por una empresa debe
ser de 30mm. Periodicamente se seleccionan al azar 36 tornillos y se mide su
longitud. Se considera que el proceso esta fuera de control cuando la longitud
media muestral x < 29.8 o bien x >30.2mm. Se supone que la longitud de los
tornillos se comporta como una distribucion normal con desviacion tpica 0.6mm.
1. Enunciar las hipotesis nula y alternativa propias de esta situacion.
2. Obtener la probabilidad de cometer un error de tipo I.
3. Calcular la funcion potencia para los valores de las longitudes medias 29.6,
29.8, 30, 30.2 y 30.4.
4. Como una prueba alternativa, se considera que el proceso esta fuera de
control cuando x < 29.75 o bien x >30.25mm. Si el tamano maximo aceptado para un error de tipo I es 0.05. Cual de las dos pruebas es la mejor
suponiendo que en la hipotesis alternativa la longitud media es 30.5mm?
Soluci
on
(
1. Contraste de hipotesis:
H0 : = 30
H1 : 6= 30
29.8 30
30.2 30
=P Z<
+P Z >
0.1
0.1
= P [Z < 2] + P [Z > 2] = 2 0.02275 = 0.0455
Cuando la hipotesis nula es cierta, se obtiene que X N (30, 0.1)
3. Calculo de la funcion potencia:
(29.6) = P=29.6 [Rechazar H0 ] = P=29.6 [X < 29.8 o X > 30.2]
30.2 29.6
29.8 29.6
+P Z >
=P Z<
0.1
0.1
= P [Z < 2] + P [Z > 6] = 0.97725 + 0 = 0.97725
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
29.8 29.8
30.2 29.8
=P Z<
+P Z >
0.1
0.1
= P [Z < 0] + P [Z > 4] w 0.5
(30.0) = 0.0455
(30.2) = (29.8) = 0.5
(30.4) = (29.6) = 0.97725
(30.5) = P=30.5 [Rechazar H0 ] = P=30.5 [X < 29.8 o X > 30.2]
30.2 30.5
29.8 30.5
=P Z<
+P Z >
0.1
0.1
= P [Z < 7] + P [Z > 3] = P [Z < 3] = 0.9987
4. Region de rechazo de la prueba alternativa: x > 30.25 o x <29.75
29.75 30
30.25 30
=P Z<
+P Z >
0.1
0.1
= P [Z < 2.5] + P [Z > 2.5] = 2 0.0062 = 0.0124 < 0.05
(30.5) = P=30.5 [Rechazar H0 ] = P=30.5 [X < 29.75 o X > 30.25]
29.75 30
30.25 30
=P Z<
+P Z >
0.1
0.1
= P [Z < 7.5] + P [Z > 2.5] = P [Z < 2.5] = 0.9938
Al nivel de significacion de 0.05, el primer test es mas potente que este
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
Test de la raz
on de verosimilitudes
Formulaci
on del test de la raz
on de verosimilitudes
Se denomina raz
on de verosimilitudes para contrastar
H0 : 0
H1 : 1
al cociente
sup f (x)
(x) =
sup f (x)
Un test de raz
on de verosimilitudes para contrastar dichas hipotesis es aquel
que rechaza H0 si (x) < c, donde c es una constante
La constante c (0, 1) se determina imponiendo la condicion de que el test tenga
tamano , es decir,
sup P [ Rechazar H0 ] = sup P [(x) < c] =
Comportamiento asint
otico del test de la raz
on de verosimilitudes
Bajo ciertas condiciones de regularidad sobre f (x), Rk , abierto de Rk ,
la variable aleatoria
2 log (X)
se distribuye asintoticamente bajo la hipotesis nula como una variable aleatoria
2 con k r grados de libertad, donde k = dim() y r = dim(0 )
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
(x) =
nnx
pnx
0 (1 p0 )
=
sup fp (x)
sup pnx (1 p)nnx
p=p0
p(0,1)
p(0,1)
p nx
nnx
pnx
0
0 (1 p0 )
= nx
=
nnx
x
x (1 x)
1 p0
1x
nnx
|
x 0 |
> z1/2
/ n
|
x 0 |
> tn1,1/2
s/ n
H0 : 0
H1 : < 0
x 0
< z
/ n
x 0
< tn1,
s/ n
H0 : 0
H1 : > 0
x 0
> z1
/ n
x 0
> tn1,1
s/ n
H0 : =
H1 : 2 6=
02
02
i=1
n
X
i=1
H0 : 2 02
H1 : 2 < 02
H0 : 2 02
H1 : 2 > 02
< 2n,/2
02
o
(xi )2
> 2n,1/2
2
0
n
X
(xi )2
i=1
02
n
X
(xi )2
i=1
02
<
2n,
> 2n,1
Region de rechazo
( desconocida)
(n 1)s2
< 2n1,/2
2
0
o
2
(n 1)s
> 2n1,1/2
2
0
(n 1)s2
< 2n1,
2
0
(n 1)s2
> 2n1,1
2
0
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
D = 1 2
2
D
= 12 + 22 21 2 , generalmente desconocida
Region de rechazo
H0 : D = 0
H1 : D 6= 0
|d 0 |
> tn1,1/2
sD / n
H 0 : D 0
H 1 : D < 0
d 0
< tn1,
sD / n
H 0 : D 0
H 1 : D > 0
d 0
> tn1,1
sD / n
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
d0
0.2125
=
= 3.48
sD / n 0.17268/ 8
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
10
(12 ,
Region de rechazo
desconocidas, 12 = 22 )
22
|
x y 0 |
r
> tn1 +n2 2,1/2
1
1
sp
+
n1 n2
H0 : 1 2 = 0
H1 : 1 2 6= 0
|
x y 0 |
s
> z1/2
2
2
1 2
+
n1 n2
H 0 : 1 2 0
H 1 : 1 2 < 0
x y 0
s
< z
2
2
1 2
+
n1 n2
x y 0
r
< tn1 +n2 2,
1
1
+
sp
n1 n2
H 0 : 1 2 0
H 1 : 1 2 > 0
x y 0
s
> z1
2
2
1 2
+
n1 n2
x y 0
r
> tn1 +n2 2,1
1
1
sp
+
n1 n2
Se denota Sp =
Si 12 y 22 desconocidas y no pueden suponerse iguales (problema de BehrensFisher), como estadstico de contraste se utiliza
Y 0
X
s
S12 S22
+
n1 n2
cuya distribucion aproximada, bajo la hipotesis 1 2 = 0 , es una t[f ] , donde
[f ] es la parte entera de
(s21 /n1 + s22 /n2 )2
f= 2
2
(s1 /n1 )2 /(n1 + 1) + (s22 /n2 )2 /(n2 + 1)
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
11
(xi 1 )2 /n1
i=1
n2
X
(yi 2 )2 /n2
H0 : 12 = 22
H1 : 12 6= 22
i=1
n1
X
(xi 1 )2 /n1
i=1
n2
X
Region de rechazo
(1 y 2 desconocidas)
s21
< Fn1 1,n2 1,/2
s22
o
2
s1
> Fn1 1,n2 1,1/2
s22
(yi 2 ) /n2
i=1
n1
X
H0 : 12 22
H1 : 12 < 22
(xi 1 )2 /n1
i=1
n2
X
s21
< Fn1 1,n2 1,
s22
s21
> Fn1 1,n2 1,1
s22
(yi 2 )2 /n2
i=1
H0 : 12 22
H1 : 12 > 22
n1
X
(xi 1 )2 /n1
i=1
n2
X
(yi 2 )2 /n2
i=1
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
12
Region de rechazo
( 2 desconocida)
H0 : = 0
H1 : 6= 0
|
x 0 |
> z1/2
/ n
|
x 0 |
> z1/2
s/ n
H 0 : 0
H1 : < 0
x 0
< z
/ n
x 0
< z
s/ n
H 0 : 0
H1 : > 0
x 0
> z1
/ n
x 0
> z1
s/ n
Region de rechazo
(12 , 22 desconocidas)
H 0 : 1 2 = 0
H1 : 1 2 6= 0
|
x y 0 |
s
> z1/2
2
2
1 2
+
n1 n2
H0 : 1 2 0
H1 : 1 2 < 0
x y 0
s
< z
2
2
1 2
+
n1 n2
x y 0
s
< z
2
2
s1
s
+ 2
n1 n2
H0 : 1 2 0
H1 : 1 2 > 0
x y 0
s
> z1
2
2
1 2
+
n1 n2
x y 0
s
> z1
2
2
s
s1
+ 2
n1 n2
|
x y 0 |
s
> z1/2
2
2
s1
s
+ 2
n1 n2
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
13
|
p p0 |
p0 (1 p0 )/n
H0 : p p0
H1 : p < p0
> z1/2
p p0
p0 (1 p0 )/n
H0 : p p0
H1 : p > p0
p p0
p0 (1 p0 )/n
< z
> z1
|
p1 p2 0 |
p1 (1 p1 )/n1 + p2 (1 p2 )/n2
> z1/2
p1 p2 0
p1 (1 p1 )/n1 + p2 (1 p2 )/n2
p1 p2 0
p1 (1 p1 )/n1 + p2 (1 p2 )/n2
< z
> z1
n1 P1 + n2 P2
.
n1 + n2
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
14
Ejemplo. Un fabricante de semiconductores produce controladores que se emplean en aplicaciones de motores automovilsticos. El cliente requiere que la fraccion de controladores defectuosos en uno de los pasos de manufactura crticos no
sea mayor que 0.05 y que el fabricante demuestre esta caracterstica del proceso
de fabricacion con este nivel de calidad. El fabricante de semiconductores toma
una muestra aleatoria de 200 dispositivos y encuentra que cuatro de ellos son
defectuosos. El fabricante puede demostrar al cliente la calidad del proceso?
Soluci
on.
Sea p la fraccion de controladores defectuosos
Planteamos el contraste de hipotesis:
H0 : p 0.05
H1 : p < 0.05
Para realizar este contraste se utiliza una aproximacion de la distribucion binomial
a la distribucion normal, valida cuando el tamano muestral es grande y p es
proximo a cero o a uno
Calculamos el estadstico de contraste:
p p0
zexp = p
p0 (1 p0 )/n
4/200 0.05
=p
0.05(1 0.05)/200
= 1.95
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
15
C
alculo del p-valor para contrastes planteados sobre la media de una
distribuci
on normal con conocida
H : = 1200
Contraste: H0 : 6= 1200
1
/ n
= 2.32
H : = 20
Contraste: H0 : 6= 20
1
/ n
= 1.88
H : = 4.25
Contraste: H0 : > 4.25
1
/ n
= 1.48
H : = 10
Contraste: H0 : > 10
1
/ n
= 1.59
H : = 10
Contraste: H0 : < 10
1
/ n
= 0.23
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
16
Zi2 2n
i=1
Distribuci
on t de Student. Sean Y y Z vv.aa. independientes tales que
2
Y n y Z N (0, 1) y consideremos la v.a.
Z
T =p
Y /n
La v.a. T tiene una distribucion denominada t de Student con n grados de
libertad y se denota por
T tn
Distribuci
on F de Snedecor. Sean X e Y vv.aa. independientes tales que
X 2m e Y 2n y consideremos la v.a.
F =
X/m
Y /m
1
Fn,m
F
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
17
Estadsticos muestrales m
as usuales
Sea X1 , X2 , . . . , Xn una m.a.s. de una v.a. X, se define la media muestral X,
la varianza muestral
2 y la cuasivarianza muestral S 2 como
n
1X
X=
Xi
n i=1
1X
=
(Xi X)2
n i=1
1 X
S =
(Xi X)2
n 1 i=1
Distribuciones muestrales
Distribuciones muestrales asociadas a una poblaci
on normal
Sea X1 , X2 , . . . , Xn una m.a.s. de una v.a. X N (, 2 ), entonces
X
N (0, 1)
/ n
(n 1)S 2
2n1
2
X
tn1
S/ n
(X Y ) (1 2 )
s
N (0, 1)
2
2
1 2
+
n1 n2
Sp2
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
18
(distribucion aproximada)
X
N (0, 1)
S/ n
p(1 p)/n
N (0, 1)
1X
donde P =
Xi es el estadstico proporcion muestral.
n i=1
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
19
(P1 P2 ) (p1 p2 )
p1 (1 p1 )/n1 + p2 (1 p2 )/n2
N (0, 1)
Ampliaci
on de Estadstica. Ingeniera Industrial. Curso Academico 2007-08.
20