Sei sulla pagina 1di 73

Prof. Grabiela Montes Q.

En la mayor parte de las pruebas vistas


anteriormente (Estadstica Aplicada I) se
hacan suposiciones acerca de que la
poblacin de donde se extraa la muestra era
Normal, con varianza conocida, o que la
muestra era de tamao grande. Pero sucede
que no siempre las poblaciones son
normales.

Veremos ahora algunas tcnicas que
permiten realizar las mismas pruebas pero
sin la necesidad de las restricciones que
imponan las pruebas anteriores.
Las pruebas no paramtricas tambin se
utilizan para averiguar la forma de las
distribuciones de donde se extraen las
muestras.
No exigen hacer suposiciones sobre que la
distribucin de la poblacin debe ser Normal
o tener una distribucin especfica.
En general son ms fciles de llevar a cabo y
entender.
Ignoran cierta cantidad de informacin.
A menudo no son tan eficientes o exactas
como las pruebas paramtricas.

Veremos las siguientes pruebas no
paramtricas:
Prueba de Wilcoxon para una muestra.
Prueba U de Mann-Whitney.
Prueba H de Kruskal-Wallis.
Prueba de Friedman.

Prueba no paramtrica para contrastar la
mediana de una poblacin.
Slo se puede aplicar si la distribucin es
simtrica y continua.
Supuestos:
Los datos consisten de una m.a. X
1
,, X
n

extrada de una poblacin.
Se plantean las hiptesis:
Caso 1: (Bilateral)
H
0
: M=M
0

H
1
: MM
0

Caso 2: (cola a la izquierda)
H
0
: M=M
0

H
1
: M<M
0

Caso 3: (cola a la derecha)
H
0
: M=M
0

H
1
: M>M
0


Procedimiento para calcular el estadstico de
prueba:
1. Se calculan las diferencias respecto a la
mediana planteada en la hiptesis nula:
D
i
= X
i
M
0
2. Se asignan rangos a las diferencias
absolutas de menor a mayor (sin tener en
cuenta el signo; si hay empates se asignan
los rangos medios)
3. Se calculan:



Criterio de decisin para un nivel de significacin
:
Para muestras grandes (n15): Aproximacin a la
normal:











En Z
c
reemplazar W por W
+
(cola a la derecha) o W
-

(cola a la izquierda).
( )
( )( )
24
1 2 1
4
1
+ +
=
+
=
n n n
n n
W
W
o

W
W
c
W
Z
o

=
Regla de decisin:
Caso 1 (bilateral):
Se rechaza H
0
, si lZ
c
l

> Z
1-/2.

Caso 2 (cola a la izquierda)
Se rechaza H
0
si Z
c
< Z
.

Caso 3 (cola a la derecha):
Se rechaza H
0
si Z
c
> Z
1-.

Al usar MINITAB se puede usar el criterio de
decisin: Se rechaza H
0
si P-value < .

Ejemplo
Los siguientes datos representan el nmero de horas
que funcionan unos controladores antes de requerir
carga:


Probar al nivel de significancia de 0.05 que este
controlador particular opera con una mediana de 1.8
horas antes de requerir carga.

1) Hiptesis H
0
: M = 1.8
H
1
: M 1.8

1.5 2.2 0.9 1.3 2.0 1.6 1.8 1.5 2.0 1.2 1.7 1.5 2.1 2.3 1.7
2) Nivel de significancia: = 0.05
3) Estadstico de Prueba:

Datos Di lDil Rangos signos
1.5 -0.3 0.3 7.5 -
2.2 0.4 0.4 10 +
0.9 -0.9 0.9 14 -
1.3 -0.5 0.5 11.5 -
2 0.2 0.2 4 +
1.8 0 0 Se ignora
1.6 -0.2 0.2 4 -
1.5 -0.3 0.3 7.5 -
2 0.2 0.2 4 +
1.2 -0.6 0.6 13 -
1.7 -0.1 0.1 1.5 -
1.5
-0.3 0.3 7.5
-
2.1
0.3 0.3 7.5
+
2.3
0.5 0.5 11.5
+
1.7
-0.1 0.1 1.5
-
Suma de rangos:
W
+
= 10+4+4+7.5+11.5 =37
W
-
= 7.5+14+11.5+4+7.5+13+1.5+7.5+1.5=68
Entonces
W = min (W
+
, W
-
)
= min (37, 68)
= 37

( )
( )( )
93 . 15
24
29 * 15 * 14
24
1 2 1
5 . 52
4
15 * 14
4
1
= =
+ +
=
= =
+
=
n n n
n n
W
W
o

973 . 0
93 . 15
5 . 52 37
=

=
W
W
c
W
Z
o

4) Regla de decisin:
Se rechaza H
0
si si lZ
c
l

> Z
1-/2.
lZ
c
l = 0.973
Z
1-/2
=Z
0.975
=1.95996

5) Conclusin: No rechazamos H
0
, por lo tanto se
puede concluir que este controlador particular
opera con una mediana de 1.8 horas antes de
requerir carga.

31/03 17:03:47


Prueba de clasificacin con signos de Wilcoxon: Horas

Prueba de la mediana = 1.800 vs. la mediana no = 1.800

Nmero
de Estadstica Mediana
N prueba de Wilcoxon P estimada
Horas 15 14 37.0 0.346 1.700

Supuestos:
Los datos consisten de una m.a. X
1
,, X
n1

extrada de una poblacin 1 y de otra m.a.
Y
1
,, Y
n2
, extrada de una poblacin 2.
Las dos variables son independientes.

Las variables de inters son continuas.
La escala de medida es al menos ordinal.
Las dos distribuciones poblacionales de
diferir lo hacen slo en su parmetro de
posicin (mediana).
Se quiere probar si las medianas de ambas
poblaciones son iguales o no.
Procedimiento de prueba:
1. Planteamiento de las hiptesis:
H
0
: M
1
= M
2

H
1
: M
1
M
2
2. Fijamos el nivel de significancia: .
3. Para calcular U hacemos:


( )
1
1 1
2 1
2
1
R
n n
n n U
+
+ =


Donde:
n
1
: nmero de elementos de la muestra 1.
n
2
: nmero de elementos de la muestra 2.
R
1
: suma de los rangos de la muestra 1.

4. Si n
1
y n
2
son mayores o iguales que 10, se
puede usar la aproximacin normal
siguiente:

( )
12
1 n n n n
y
2
n n

: donde

U
Z
2 1 2 1
U
2 1
U
U
U
c
+ +
= =

=
5. Criterios de decisin:
Con Valor Crtico:
Rechazar H
0
si :



Con P-Valor:
Rechazar H
0
si P-Valor <
/2 1 c
Z Z

>
La siguiente informacin corresponde a los
puntajes que obtuvieron en una prueba
estudiantes de dos especialidades de una
universidad.


Pruebe que las puntuaciones medias en
ambas especialidades es la misma. Use
=0.10

Esp.1 100 110 80 75 130 95 105 125 140 85
Esp.2 92 112 83 136 65 75 89 160 90 114
1. H
0
: M
1
= M
2

H
1
: M
1
M
2

2. =0.10
3. Calcular U:



Dato 65 75 75 80 83 85 89 90 92 95
Grupo 2 1 2 1 2 1 2 2 2 1
Rango 1 2.5 2.5 4 5 6 7 8 9 10
Dato 100 105 110 112 114 125 130 136 140 160
Grupo 1 1 1 2 2 1 1 2 1 2
Rango 11 12 13 14 15 16 17 18 19 20
R
1
= 110.5
n
1
= 10
n
2
= 10


( )
44.5 U
R
2
1 n n
n n U
1
1 1
2 1
=
+ =

+
+ =
5 . 110
2
11 * 10
10 * 10
( ) ( )( )
4158 . 0
2288 . 13
50 5 . 44
Z
13.2288
12
1 10 10 10 * 10
12
1 n n n n

50
2
10 * 10
2
n n

c
U
2 1 2 1
U
2 1
U
=

=
=
+ +
=
+ +
=
= = =
Decisin:
Z
1-/2
= Z
0.95
= 1.645


Se acepta H
0,
por lo tanto las puntuaciones
medianas de ambas especialidades si son
iguales.

4158 . 0 Z
c
=
Usando el SPSS ingresar los datos como se muestra a continuacin:
Luego seguimos los siguientes pasos:
Se ingresa la variable de inters, en nuestro caso Puntajes, luego la variable
de agrupacin, Especialidad, y definimos los grupos con los cdigos
correspondientes a cada uno. Como el tipo de prueba por defecto ya es la
prueba U entonces le damos OK.
El SPSS presenta la siguiente salida:

NPar Tests
Mann-Whitney Test
N Mean Rank Sum of Ranks
1 10 11.05 110.50
2 10 9.95 99.50
Total 20
Ranks
Especialidad
Puntajes

Puntajes
Mann-Whitney
U
44.500
Wilcoxon W 99.500
Z -.416
Asymp. Sig. (2-
tailed)
.677
Exact Sig.
[2*(1-tailed
Sig.)]
.684
Test Statisticsb
Esta prueba es una prueba de suma de
rangos. Sirve para probar si las medianas de k
poblaciones independientes son iguales.
Reemplaza a la prueba ANOVA de igualdad de
medias.
En la prueba H los datos se ordenan de
menor a mayor como si constituyeran una
sola muestra. Despus, si R
i
es la suma de
los rangos asignados a los valores de la i-
sima muestra y n = n
1
+n
2
++n
k
, la
prueba se basa en el estadstico:
( )
( ) 1 n 3
n
R
1 n n
12
H
k
1 i
i
2
i
+
(

+
=

=
Si la hiptesis nula de igualdad de medianas
es verdadera y cada muestra tiene cuanto
menos 5 observaciones, la distribucin
muestral de H puede ser aproximada por una
distribucin chi-cuadrado con k-1 grados de
libertad.
Procedimiento:
1. H
0
: M
1
= M
2
== M
k

H
1
: Al menos una M
i
diferente
2. Fijar el nivel de significancia: .
3. Calcular el valor del estadstico H.
4. Hallar el valor crtico: _
2
(k-1,1-)
5. Criterios de decisin:
Rechazar H
0
si H > _
2
(k-1,1-)


Rechazar H
0
si P-Valor <
Un grupo de empleados en capacitacin de
una compaa, se asignan al azar a tres
grupos, en cada grupo se ensea un
procedimiento de inspeccin a travs de
mtodos diferentes y al final del periodo de
inspeccin se les aplica una prueba de
calidad de desempeo.
Las que siguen son sus calificaciones:
Mtodo 1: 94 87 91 74 86 97
Mtodo 2: 85 82 79 84 61 72 80
Mtodo 3: 89 67 72 76 69
Utilizaremos la prueba H para determinar con
un nivel de significancia de 0.05 si los tres
mtodos son igualmente efectivos.
Solucin:
Ordenando las 18 calificaciones de menor a
mayor y dando rangos tenemos:

Dato: 61 67 69 72 72 74 76 79 80 82 84 85 86 87 89 91 94 97
Grupo: 2 3 3 2 3 1 3 2 2 2 2 2 1 1 3 1 1 1
Rango: 1 2 3 4.5 4.5 6 7 8 9 10 11 12 13 14 15 16 17 18

R
1
=6+13+14+16+17+18=84
R
2
= 1+4.5+8+9+10+11+12=55.5
R
3
= 2+3+4.5+7+15=31.5
Luego sustituyendo los valores de R
i
junto
con n
1
=6, n
2
=7 y n
3
=5 en la frmula de
H, se obtiene:




Como k=3, _
2
(k-1,1-)
=5.991, entonces se
rechaza H
0
, es decir concluimos que los
tres mtodos no son igualmente efectivos.

6.67
19 * 3
5
31.5
7
55.5
6
84
19 * 18
12
H
2 2 2
=

|
|
.
|

\
|
+ + =
Usando el SPSS ingresamos los datos como se muestra a continuacin:
Luego seguimos la siguiente secuencia:
Ingresamos la variable de inters y la variable de agrupacin, tambin
definimos los rangos, colocando los valores mnimo y mximo. Finalmente
le damos OK.
Kruskal-Wallis Test

N Mean Rank
1 6 14.00
2 7 7.93
3 5 6.30
Total 18
Ranks
Mtodo
Calificacin

Calificacin
Chi-square 6.673
df 2
Asymp. Sig. .036
Test Statisticsa,b
El SPSS muestra la siguiente salida:
Esta prueba se aplica cuando los datos estn al menos en
escala ordinal y se tienen k muestras relacionadas, o
cuando se tiene un diseo de un factor con bloques y no
se cumplen los supuestos del modelo.
Se desea evaluar las hiptesis:
H
0
: Las k muestras provienen de la misma poblacin

H
0
: M
1
= M
2
= = M
k
H
1
: Al menos una mediana diferente.
Los datos se presentan en una tabla de doble entrada con b
filas y k columnas, las filas representan los sujetos o conjuntos
de sujetos relacionados y las columnas las distintas
condiciones:

Bloques
Tratamientos
1 2 3 k
1
2
.
.
.
b
Y
11

Y
21

.
.
.
Y
b1

Y
12

Y
22

.
.
.
Y
b2

Y
13

Y
23

.
.
.
Y
b3







Y
1k

Y
2k

.
.
.
Y
bk

Procedimiento de prueba:
Se ordenan los datos de cada bloque y se asignan los rangos
respectivos. (Los rangos varan de 1 a k).
Se calcula el estadstico de Prueba:





Donde R
.j
es la suma de los rangos del j-simo tratamiento. C es
el factor de correccin, que se calcula de la siguiente manera:



Donde t
i
es el nmero de puntuaciones empatadas en el i-simo
grupo de empates.

C
1) (k b 3 R
1) (k k b
12
Fr
k
1 j
2
.j
+
|
|
.
|

\
|
+
=

=
( )
( ) k k b
t t
1 C
3
i
i
3
i

=

Regla de Decisin:
Se rechaza H
0
al nivel de significacin , si Fr
Al utilizar el MINITAB para el procesamiento de los datos,
podemos utilizar el siguiente criterio de decisin:
Se rechaza H
0
si P-value < .

Ejemplo:
Dados los siguientes datos correspondientes a puntuaciones de
tres grupos igualados (relacionados) bajo cuatro condiciones,
probar si las medianas poblacionales de estas puntuaciones son
iguales. Use un nivel de significacin del 8%:
( )
2
1 , 1 o
_
k
I II III IV
A 9 4 1 7
B 6 5 2 8
C 9 1 2 6
Grupo
Condiciones
H
0
: M
1
= M
2
= M
3
= M
4
H
1
: Al menos una M
i
diferente
2) Nivel de significancia: =0.08
3) Estadstico de prueba:
Se dan rangos dentro de cada bloque (Grupo):

I II III IV
A 4 2 1 3
B 3 2 1 4
C 4 1 2 3
R
.j
11 5 4 10
Grupo
Condiciones
1) Se plantean las hiptesis:
k = 4 b = 3 = 0.08
Como no hay empates dentro de cada bloque, entonces C = 0.





4) Criterio de decisin: Se rechaza H
0
si


5) Conclusin: Se rechaza H
0
. Por lo tanto las medianas
poblacionales no son iguales.

( )
2
1 , 1 o
_

>
k
Fr
( )
7.4 F
3(3)(5) 10 4 5 11
3(4)(5)
12
F
r
2 2 2 2
r
=
+ + + =
( )
6.75869 = =

2
) 92 . 0 , 3 (
2
1 , 1
_ _
o k
Con SPSS ingresamos los datos en columnas
diferentes como se muestra a continuacin:
Ingresamos las variables. Por defecto est
marcado Friedman en tipo de prueba. Dar OK.
Obteniendo los siguientes resultados:
En muchas de las tcnicas estadsticas de
estimacin y de pruebas de hiptesis es
necesario comprobar que los datos o los
trminos de error de los modelos estadsticos
tienen distribucin Normal.
Hiptesis:
H
0
: Los datos provienen de la poblacin F
X

H
1
: Los datos no provienen.
Estadstico de prueba:


donde S
n
(x) es la proporcin de datos
menores o iguales a x. Y F
X
(x) es la
probabilidad acumulada hasta x, bajo H
0
.
X n
F S D =sup
Se puede estandarizar D haciendo:



Criterios de decisin:
Se rechaza H
0
si IZ
c
I > Z
1-/2

Se rechaza H
0
si P-value <
n D Z
c
=
Los siguientes datos corresponden al tiempo de atencin,
en minutos, de 20 clientes en la ventanilla de un banco




Pruebe a un nivel de significacin de 0.05 si el tiempo de
atencin se ajusta a una distribucin Normal.


3.6 4.5 2.3 5.5 5.8 5.6 4.8 4.5 4.6 4.8
3.8 4.2 4.3 5.7 3.7 5.5 4.3 4.9 4.2 4.8
X Frec. Acum. Sn Fx lSni-Fxil lSni-1-Fxil
2.3 1 1 0.05 0.004 0.046
3.6 1 2 0.1 0.127 0.027 0.077
3.7 1 3 0.15 0.153 0.003 0.053
3.8 1 4 0.2 0.182 0.018 0.032
4.2 2 6 0.3 0.332 0.032 0.132
4.3 2 8 0.4 0.375 0.025 0.075
4.5 2 10 0.5 0.467 0.033 0.067
4.6 1 11 0.55 0.514 0.036 0.014
4.8 3 14 0.7 0.607 0.093 0.057
4.9 1 15 0.75 0.651 0.099 0.049
5.5 2 17 0.85 0.863 0.013 0.113
5.6 1 18 0.9 0.887 0.013 0.037
5.7 1 19 0.95 0.908 0.042 0.008
5.8 1 20 1 0.926 0.074 0.024
Procedimiento de prueba:
Hiptesis:
H
0
: El tiempo de atencin en ventanilla del banco se ajusta a una
distribucin Normal
H
1
: El tiempo de atencin en ventanilla del banco no se ajusta a una
distribucin Normal
Nivel de significancia:
o = 0.05
Estadstico de prueba:
Del SPSS se obtiene
D = 0.132 (Most Extreme Differences Absolute)
Zc = 0.589 (Kolmogorov-Smirnov Z)
P-value = 0.879 (Asymp. Sig. (2-tailed))
Conclusin:
A un o = 0.05, no se puede la hiptesis nula, por lo tanto se puede
afirmar que el tiempo de atencin en ventanilla se ajusta a una
distribucin Normal
Con SPSS ingresar los datos en una columna:
Seguimos la siguiente ruta:
Ingresamos la variable de inters, seleccionamos la distribucin que
se quiere probar, en nuestro caso la Normal, y le damos OK.
NPar Tests

Tiempo
20
Mean 4.570
Std. Deviation .8498
Absolute .132
Positive .099
Negative -.132
.589
.879
Most Extreme
Differences
Kolmogorov-Smirnov Z
Asymp. Sig. (2-tailed)
One-Sample Kolmogorov-Smirnov Test

N
Normal
Parametersa,b
La prueba de rachas permite verificar la
hiptesis nula de que la muestra es
aleatoria, es decir, si las sucesivas
observaciones son independientes. Este
contraste se basa en el nmero de rachas
que presenta una muestra. Una racha se
define como una secuencia de valores
muestrales con una caracterstica comn
precedida y seguida por valores que no
presentan esa caracterstica.

As, se considera una racha la secuencia
de k valores consecutivos superiores o
iguales a la media muestral (o a la
mediana o a la moda, o a cualquier otro
valor de corte) siempre que estn
precedidos y seguidos por valores
inferiores a la media muestral (o a la
mediana o a la moda, o a cualquier otro
valor de corte).
PROCEDIMIENTO:
1) Hiptesis:
H0: Los datos de la muestra son aleatorios
H1: Los datos de la muestra no son aleatorios
2) Nivel de significacin:
3) Estadstico de Prueba:
Si la muestra es suficientemente grande y la
hiptesis de aleatoriedad es cierta, la distribucin
muestral del nmero de rachas, R, puede
aproximarse mediante una distribucin normal de
parmetros:



Una vez calculado el valor de R (nmero de rachas),
pasamos a estandarizar la variable como se muestra
a continuacin:





4) Criterio de decisin: Se rechaza




donde n1 es el nmero de elementos de una clase,
n2 es el nmero de elementos de la otra clase y n
es el nmero total de observaciones.
/2 - 1
Z Z si
o
>
0
H
Se ha tomado una muestra de 29 estudiantes matriculados en el
Curso de Estadstica Aplicada II y se ha registrado si son hombres
(cdigo 1) o mujeres (cdigo 0). El objetivo es comprobar si la muestra
es aleatoria.
H
o
m
b
r
e
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
M
u
j
e
r
M
u
j
e
r
M
u
j
e
r
M
u
j
e
r
H
o
m
b
r
e
M
u
j
e
r
H
o
m
b
r
e
M
u
j
e
r
1 1 0 1 0 1 1 0 1 1 0 1 0 1 0 1 0 1 1 0 1 0 0 0 0 1 0 1 0
Mujeres n
1
= 14
Hombres n
2
= 15
Total n = 29
Nmero de Rachas R = 22
1 2
1 2 1 2
2
2n n
E(R) 1 15,483
n
R E(R) =6,517> 0,5
2n n (2n n n)
DE(R) 2,641
n (n 1)
R 0,5 E(R)
Z =2,279
DE(R)
= + =
-
-
= =
-
- -
=
1. Hiptesis:
H
0
: Los datos de la muestra son aleatorios
H
1
: Los datos de la muestra no son aleatorios
2. Nivel de significacin: o = 0.05
3. Estadstico de Prueba: Z = 2.279
4. Regla de decisin: Se rechaza H0 si
Valor Crtico Z
0.975
= 1.95996
P-value = Asymp. Sig. (2 tailed) = 0.023
5. Conclusin: H
0
se rechaza Los datos de la
muestra no son aleatorios
/2 - 1
Z Z si
o
>
0
H

Potrebbero piacerti anche