Sei sulla pagina 1di 4

estadística ii

prueba Kruskal - Wallis

Se consideran k muestras aleatorias mutuamente independientes provenientes de


poblaciones cuyas distribuciones no necesariamente son normales. El interés radica en
probar la hipótesis nula que las k muestras aleatorias provienen de poblaciones con
distribuciones idénticas

H0: f1(X) ≅ f2(X) ≅ f3(X) ≅ … fk(X)

donde f1(X) , f2(X) , f3(X) , … , fk(X) son las correspondientes funciones de


densidad de probabilidad. La hipótesis alternativa puede ser general y
establecer sólo que las k distribuciones no son idénticas; sin embargo, esta
prueba es sensible a las diferencias en tendencia central por lo cual resulta muy
útil cuando se sospecha que las distribuciones de interés difieren sólo en ese
aspecto.

La prueba de Kruskal – Wallis se considera, en general, una extensión de la


prueba de Mann - Whitney

prof.: thais león


estadística ii

procedimiento a seguir:

o se combinan las observaciones de las k muestras aleatorias para formar un solo


conjunto de n observaciones, las cuales se arreglan en orden creciente de magnitud
asignando rango a cada una

o se determina la suma de los rangos Ri para cada muestra

 12 k R2 
o se determina el estadístico de prueba H =  ∑ i  − 3 (n +1) , el cual se encuentra
n (n +1) i =1 ni 
aproximado en forma adecuada por una distribución χ con k − 1 grados de libertad,
2

excepto cuando k = 3 y ninguno de los tamaños de muestras es mayor a cinco

o se rechaza la hipótesis nula para valores grandes del estadístico de prueba

prof.: thais león


estadística ii
Se tomaron muestras aleatorias independientes de casas recientemente vendidas en cuatro
zonas residenciales de una gran ciudad. El problema consiste en determinar si existen
diferencias en las zonas con respecto al valor de la propiedad y al precio de venta. Los
datos reportados corresponden a los cocientes entre los precios de venta y el valor
catastral de la propiedad.

zona I zona II zona III zona VI


1.19 (15) 1.08 (4,5) 0.98 (2) 1.12 (7,5)
1.23
1.05 (3) 1.19 (15) 1.14 (10)
(17,5)
1.14 (10) 1.26 (20) 1.08 (4,5) 1.31 (22)
1.25 (19) 1.10 (6) 0.93 (1) 1.12 (7,5)
1.18 1.23
1.29 (21) 1.19 (15)
(12,5) (17,5)
1.18
1.14 (10)
(12,5)
R1 = 68 R2 = 70,5 R3 = 52,5 R4 = 62

a. utilice un método no paramétrico apropiado para determinar si existen diferencias


según la zona

H0: f1(X) ≅ f2(X) ≅ f3(X) ≅ f4(X) (los valores de las propiedades son idénticos cualquiera
que sea la zona)
Ha: fi(X) ≠ fj(X) para algún par i, j

prof.: thais león


estadística ii

H = 1,70395 ; χ2
= 7,815

Reporte: con un nivel de significación del 5 % la evidencia sugiere que


no existen diferencias entre los valores de las propiedades según la
zona considerada

b. utilice un método paramétrico apropiado para determinar si existen diferencias según


la zona

utlice en ambos casos α = 0.05

prof.: thais león

Potrebbero piacerti anche