Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Junio, 2019.
Pruebas de Hipótesis No Paramétricas o de Distribución Libre
Introducción
La mayoría de las pruebas de hipótesis tradicionales conocidas, como la de comparación
de medias o varianzas requieren que las muestras aleatorias a ser utilizadas en los
procedimientos de prueba de hipótesis provengan de poblaciones normales, de tal manera que
los resultados y conclusiones que se obtengan sean confiables. Por otra parte, en las pruebas no
paramétricas no se necesita hacer suposiciones acerca de la distribución de la población y por
ello en ocasiones se denominan pruebas libres de distribución.
En ocasiones requerimos llevar a cabo un procedimiento de prueba de hipótesis
relacionadas con la media poblacional μ, una diferencia de medias poblacionales o pruebas
relacionadas con las varianzas de la población donde el supuesto de normalidad no se cumple.
En estos casos las pruebas no paramétricas o de distribución libre representan una alternativa a
las pruebas tradicionales.
Por ejemplo supongamos que deseamos probar la hipótesis de que el tiempo promedio
para obtener un título profesional en una universidad reconocida no es de 5 años como se cree
sino que este tiempo es superior a los 5 años. Para ello deseamos contrastar las hipótesis
Ho: μ=5 años vs Ha: μ>5 años
Si se deseara aplicar la prueba tradicional para contrastar estas hipótesis tendríamos que
probar que la muestra aleatoria de los tiempos para obtener el título profesional, obtenida de la
población de graduandos de la universidad proviene de una población normal o bien apelar al
teorema del límite central en caso que el tamaño de la muestra sea grande (n>30) así como a
otros supuestos como si la varianza de la población es o no conocida.
En general, los contrastes de pruebas de hipótesis tradicionales exigen el cumplimiento
de supuestos relacionados tanto con la distribución de los datos como de algunos parámetros
para que los resultados de las mismas sean considerados válidos. Parte fundamental de estos
requerimientos es que las poblaciones de donde provienen los datos que conforman las
muestras aleatorias utilizadas en los contrastes sean poblaciones normales, así como supuestos
relativos a las varianzas poblacionales, de allí que a estas se les conozcan como pruebas de
hipótesis paramétricas. En contraparte, los métodos de contraste de distribución libre o no
paramétricos a menudo no requieren suponer conocimiento alguno de las distribuciones de
probabilidad de las poblaciones de donde se obtienen las muestras, excepto tal vez que estas
distribuciones sean continuas.
Cuando se utilizan pruebas no paramétricas para realizar un contraste de hipótesis hay
situaciones donde los datos disponibles son medidos en una escala ordinal y en estos casos se
asignan rangos a los datos a fin de aplicar las pruebas no paramétricas, como veremos más
adelante. En cambio las pruebas paramétricas requieren que los datos analizados sean producto
de una medición por lo menos en una escala de intervalo.
Una gran ventaja de las pruebas no paramétricas es que son una excelente alternativa de
las paramétricas en los casos donde no es posible justificar las suposiciones de normalidad o en
casos donde la escala de medición de la variable es ordinal y no de razón. Por otro lado, para
grandes desviaciones del supuesto de la normalidad de los datos el método no paramétrico es
mucho más eficiente que el procedimiento paramétrico. Claramente es preferible utilizar las
pruebas paramétricas sobre las no paramétricas en los casos donde sea posible verificar las
condiciones de normalidad ya que los contrastes paramétricos son más eficientes.
En resumen, las pruebas no paramétricas junto a las pruebas paramétricas constituyen
todo un conjunto de herramientas estadísticas para adaptar a una gran variedad de situaciones
experimentales.
según sea el caso, pero no se cumple que la población de donde proviene la muestra es normal,
esta prueba es una alternativa para contrastar las hipótesis.
Metodología
De la teoría estadística se sabe que cuando una población posee una distribución de
probabilidad simétrica como la que se presenta en la figura 1 se cumple que la media μ y la
mediana ~μ son iguales.
En este sentido, al no poder verificarse los supuestos requeridos por la prueba
paramétrica tradicional, se opta por la prueba del signo la cual en lugar de la media μ emplea a
la mediana ~
μ como parámetro de tendencia central.
Dado que la distribución es simétrica, llevar a cabo la prueba sobre la mediana ~
μ es
equivalente a realizarla sobre la media μ ya que en este caso la media y la mediana poblacional
son iguales.
La mediana ~
μ estadísticamente se define como el valor para el cual la mitad de los valores de la
población son menores o iguales a él y la otra mitad son mayores o iguales a él. En términos de
probabilidad ~
μ se define como el valor para el cual se cumple:
P( X > ~
μ)=P(X < ~
μ)=0.5.
La manera correcta de plantear las hipótesis cuando decidimos utilizar la prueba del signo
es
Ha: ~μ ≠~μ0
Ho: ~
μ=~
μ0 versus
{ ~ ~
Ha : μ < μ0 ,
Ha : ~
μ >~μ0
De esta manera, la prueba del signo en esencia consiste en determinar cuántos de los
valores de la muestra aleatoria se encuentran arriba y abajo del valor ~
μ . En este sentido, para
0
de la prueba.
Por ejemplo, supóngase que en una muestra de tamaño n=11 se obtuvieron los siguientes
valores 1.5, 2.2, 0.9, 1.3, 2.0, 1.6, 1.8, 1.5, 2.0, 1.2, 1.7 y que el valor ~
μ =1.8, entonces se
0
obtendría el resultado
Donde el valor cero se corresponde con el valor 1.8 en los datos que al ser igual a μ0=1.8
no se le asigna signo y por lo tanto no se tomaría en cuenta para llevar a cabo el contraste de las
hipótesis de la prueba del signo. En este caso para la prueba se dispone de tres signos más ( “+”)
debajo de ~
μ 0 como se muestra en las figuras 2. de allí que se espere que la proporción de signos
positivos y negativos estadísticamente sean iguales.
en la Figura N° 3.
Claramente entonces una cantidad mayor de alguno de los signos reflejaría que la
hipótesis nula es falsa y en consecuencia se rechazaría que el verdadero valor de la mediana es
~
μ . En la figura N° 4 se presenta el caso donde la cantidad de signos positivos es
0
estadísticamente significativamente menor que los positivos, indicando que el verdadero valor
de la mediana no es ~
μ sino un valor menor a este
0
es cierta.
Basamento estadístico.
En la prueba del signo se toman en cuenta son los signos positivos y el estadístico de
prueba que se utiliza para contrastar las hipótesis sigue una distribución binomial con parámetro
p=1 /2 cuando la hipótesis nula Ho: ~ μ=~ μ es verdadera, indicando en este caso, que las
0
Casos Particulares.
Caso 1. El valor verdadero de la mediana posiblemente es menor a ~
μ0
Si se sospecha que el valor verdadero de la mediana es menor a ~
μ 0 las hipótesis a probar
son:
Ho: ~
μ=~
μ0 vs Ha: ~
μ< ~
μ0
Si la cantidad de signos positivos y negativos es similar, es de esperarse que no se rechace
la hipótesis nula. Por el contrario, la presencia de pocos signos positivos (en otras palabras hay
estadísticamente mas signos negativos que positivos), es un indicativo de que la hipótesis nula
no es cierta y en la medida que la cantidad de signos positivos disminuyan y aumenten los signos
negativos es más probable que se rechace la hipótesis nula a favor de la alternativa Ha: ~
μ< ~
μ.0
b. Ho: ~
μ=~
μ0 vs Ha: ~
μ> ~
μ 0.
c. Ho: ~
μ=~
μ 0 vs Ha: ~
μ ≠ ~μ0.
2. Elija un nivel de significancia α fijo.
3. Calcule el valor P con base en el valor x = número de signos positivos.
a. P=Pr ( X ≤ x cuando p=1/2 )
1
(
b. P=Pr X ≥ x cuando p=
2 )
n 1
(
c. Si x < ; P=2 Pr X ≤ x cuando p=
2 2 )
n 1
S i x > ; P=2 Pr ( X ≥ x cuando p= )
2 2
4. Rechace Ho a favor de Ha si P ≤ α
5. Conclusiones.
Los pasos a seguir son similares al caso 1 solo que la expresión para calcular el valor P es
diferente.
Pasos para llevar a cabo el contraste de hipótesis Ho: ~
μ=~
μ0 vs Ha: ~
μ> ~
μ 0.
1. Establezca las hipótesis nula Ho y alternativa Ha.
2. Elija un nivel de significancia α fijo.
3. Calcule el valor P con base en el valor x = número de signos positivos obtenidos a partir
de la muestra de tamaño n.
4. Rechace Ho a favor de Ha si P ≤ α.
5. Conclusiones.
1 1
(
P=2 P r X ≥ x cuando p=
2) [ (
=2 1−P r X ≤ x−1 cuando p=
2 )]
x−1 n
1 1
(
P=2 P X ≥ x cuando p=
2)=2 1−∑ n
i=0
[
i 2 ( )( ) ]
y una vez encontrado el valor P, se rechaza Ho: ~
μ=~
μ0 a favor de Ha: ~
μ ≠ ~μ0 si el valor P obtenido
es menor o igual al nivel de significancia α seleccionado.
Ejemplo de Aplicación.
Ejemplo1. Prueba de hipótesis sobre una mediana. Equivalente No Paramétrico de la prueba
de la media μ de una población normal.
Los siguientes datos representan el número de horas de entrenamiento de vuelo que reciben 18
estudiantes para piloto de cierto instructor antes de su primer vuelo solos:
9 12 18 14 12 14
12 10 16 11 9 11
13 11 13 15 13 14
Realice una prueba del signo al nivel de significancia de 0.02 para probar la afirmación del
instructor de que la mediana del tiempo que se requiere antes de que sus estudiantes vuelen
solos es 12 horas de vuelo de entrenamiento.
Solución.
Lo primero a hacer es plantear las hipótesis a contrastar.
Ho: ~
μ=12 vs Ha: ~ μ ≠ 12
1) Establecer el nivel de significancia α =0.02 para este caso.
2) Determinar el número de signos + y – y obtener el valor de P.
1 1 1 1 1 1 1 1 1 1 1
9 2 8 4 12 4 2 0 16 1 9 1 13 1 3 5 13 14
- 0 + + 0 + 0 - + - - - + - + + + +
En este caso hay 9 signos “+”, 6 signos “-“y 3 ceros (sin signo). Por lo tanto el tamaño de la
muestra pasa de 18 datos inicialmente a n=15
8 15
1
(
P=2 P X ≥ 9 cuando p=
2) [
=2 1−∑ 15
i=0 i
1
2( )( ) ]=0.6072
3) Dado que α =0.02 y P=0.672 se cumple que P>α y por lo tanto no se rechaza Ho: ~
μ=12.
4) Conclusiones: Los datos no arrojan evidencia que contradiga la afirmación del instructor de
vuelo.
Auto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Radiales 4.2 4.7 6.6 7 6. 4.5 5.7 6 7.4 4.9 6.1 5. 5.7 6.9 6.8 4.9
7 2
Cinturó 4.1 4.9 6.2 6.9 6. 4.4 5.7 5.8 6.9 4.9 6 4. 5.3 6.5 7.1 4.8
n 8 9
Solución.
Planteamiento de las Hipótesis.
H 0 :~
μ R −~
μC =0 vs H a : ~μR −~
μC >0
Nivel de Significancia. α =5 %.
Determinar el número de signos + y – y obtener el valor de P.
Auto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Radiales 4.2 4. 6.6 7 6. 4.5 5. 6 7.4 4. 6.1 5. 5.7 6.9 6. 4.9
7 7 7 9 2 8
Cinturó 4.1 4. 6.2 6.9 6. 4.4 5. 5.8 6.9 4. 6 4. 5.3 6.5 7. 4.8
n 9 8 7 9 9 1
Signo 1 -1 1 1 -1 1 0 1 1 0 1 1 1 1 -1 1
Signo + - + + - + + + + + + + - +
Hay 11 signos “+”, 3 signos “-“ y 2 ceros (sin signo). Por lo tanto el tamaño de la
muestra pasa de 16 datos inicialmente a n=14 datos.
10 14
1 1
P=P r X ≥11cuando p= =2 1−∑ 14
( 2 i=0
)
i 2 [ ( )( ) ]=0.0287
Regla de Decisión. Rechazar Ho si P<α =0.05
Prueba del Signo en Investigación de Mercados para estudiar la preferencia de los clientes.
La aplicación de la prueba en este caso consiste en determinar la preferencia hacia una
de dos marcas de un cierto producto utilizando una muestra de n opiniones de potenciales
clientes. En este sentido el objetivo es determinar si existen diferencias en las preferencias de los
clientes por algún producto como leche, refrescos, salsas, cafés, etcétera.
Para llevar a cabo la prueba del signo en este caso lo que se hace en preguntar a un
grupo de n clientes cual de los dos artículos prefieren. La variable que se mide entonces es del
tipo nominal y a través de la aplicación de esta prueba se determina si existen o no diferencias
entre las preferencias hacia los dos artículos que se comparan.
Ejemplo 3. Una empresa desea lanzar al mercado una nueva marca de mayonesa y por ello
decide llevar a cabo una prueba para comparar la preferencia de su producto con la mayonesa
de mayor popularidad que se encuentra en el mercado. Para ello se selecciona a 12 personas a
las que se les da a probar ambos productos de manera aleatoria. Los datos se muestran a
continuación:
Individuo 1 2 3 4 5 6 7 8 9 10 1 12
1
Preferenci N E N E N N E N N N E N
a
donde N significa que se a la persona le gusta más el producto nuevo y E que le gusto la
mayonesa existente en el mercado.
Solución. En este caso la asignación del signo positivo es arbitraria, pudiendo asignarse el
signo”+” a la preferencia por la mayonesa nueva o a la mayonesa existente en el mercado. Para
efecto de este ejemplo se le asignara el signo “+” a la nueva mayonesa. De esta manera los
datos disponibles para aplicar la prueba del signo son:
Individuo 1 2 3 4 5 6 7 8 9 10 11 12
Preferenci + - + - + + - + + + - +
a
SPSS 1 -1 1 -1 1 1 -1 1 1 1 -1 1
Ref SPSS 0 0 0 0 0 0 0 0 0 0 0 0
Planteamiento de las Hipótesis.
H o : No existe diferencias en la preferencia de los clientes por los dos articulos
H a :Si existe diferencia en la preferencia de los clientes por uno de los articulos
Nivel de Significancia. α =5 %.
Determinar el número de signos + y – y obtener el valor de P. Es este caso se obtuvieron x=8
signos '+' y 4 signos '-' para un total de n=12 elementos (individuos). Dado que x >n/2 se
calcula el valor de P a partir de la expresión:
7 12
1 1
P=2 P X ≥ 8 cuando p= =2 1−∑ 12
( 2 i=0
)i 2 [ ( )( ) ]=2 [ 1−0.8062]=0.3877
Conclusiones. Consérvese la hipótesis nula. No existen diferencias en la preferencia de los
clientes por los dos artículos.
Para realizar esta prueba con el SPSS se procede de acuerdo a lo que muestra las imágenes a
continuación, teniendo en cuenta el orden a la hora de seleccionar las variables.
Obsérvese que la variable Preferencia está compuesta por 1 y -1 y la variable RefPref está
compuesta de puros ceros. Esta codificación permite que la diferencia 1-0 de positiva y la
diferencia -1-0 un resultado negativo, coincidiendo estos resultados con los símbolos más y
menos.
Evaluado Puntaje a Grupo Puntaje a Grupo Evaluado Puntaje a Grupo Puntaje a Grupo
r Pequeño Grande r Pequeño Grande
1 2 3 21 4 1
2 1 2 22 4 4
3 4 2 23 4 3
4 4 3 24 3 3
5 3 4 25 3 2
6 3 2 26 2 2
7 4 2 27 3 1
8 2 1 28 4 1
9 4 3 29 3 1
10 1 1 30 4 3
11 3 2 31 3 2
12 3 3 32 1 2
13 4 4 33 4 4
14 4 4 34 3 4
15 4 3 35 2 3
16 1 2 36 2 3
17 1 3 37 2 1
18 2 2 38 1 1
19 2 3 39 3 4
20 4 3 40 3 2
Solución. En este caso los signos positivos y negativos se obtienen a partir de las diferencias
Puntaje a Grupos Pequeños - Puntaje a Grupos Grandes
U = estadístico de la prueba
en la medida que
12
n1 y n2 son mayores y entonces la estadística
U−μU
zc=
σU
tiende a la distribución normal estándar.
Reglas de decisión. Dado que la estadística de prueba z c es normal la región crítica depende de
la forma de la hipótesis alternativa:
Caso 1. Si H a : ~μ1< ~
μ 2, se rechaza H 0 a favor de H a si el valor de P=Pr ( Z < z c ) <α .
Caso 2. Si H a : ~μ1> ~
μ 2, se rechaza H 0 a favor de H a si el valor de P=Pr ( Z > z c ) <α .
Caso 3. Si H a : ~μ1 ≠ ~
μ2, se rechaza H 0 a favor de H a cuando para z c < 0 el valor de
En todos los casos cuando el valor de P es menor al valor de alfa se rechaza la hipótesis nula.
Ejemplo 6. Comparación de dos poblaciones.
Un profesor tiene dos grupos de psicología: uno en la mañana, con 9 alumnos, y otro en la tarde
con 12 alumnos. En el examen final, que es el mismo para ambos grupos, las calificaciones
obtenidas son las que se muestran en la tabla a continuación. ¿Puede concluirse a un nivel de
significancia de 0.05 que el grupo de la mañana posee un rendimiento menor al del grupo de la
tarde? Resolver el problema, primero a mano, dando todos los y luego utilizando el SPSS.
Grupo Mañana 7 87 7 7 82 6 9 75 7
3 9 5 6 5 0
Grupo Tarde 8 81 8 8 90 8 8 92 8 9 53 84
6 4 8 5 4 3 1
Solución.
Planteamiento de las hipótesis
Las hipótesis a probar son
Ho: ~
μ M =~
μ T vs Ha: ~
μ M <~
μT
Ho : Calificaciones del grupo de la mañana son iguales a las calificaciones del grupo de la Tarde
vs
Ha: Calificaciones del grupo de la mañana son menores a las calificaciones del grupo de la Tarde
Establecer el nivel de significancia. α =0.05 .
Aproximación Normalón.
Dado que ambos tamaños de muestra son mayores a 8 se puede utilizar la aproximación normal.
Para ello calculamos la media y desviación estándar del estadístico U
Media
n1 n2 9∗12
μU = = =54
2 2
Desviación estándar
n 1 n2 ( n1 +n2 +1 )
σU =
√ 12 √ =
9∗12 ( 9+ 12+1 )
12
= √198=14.07
Regla de Decisión.
Dado que el valor de P=Pr ( Z ≤−1.8477 ) =0.0323,
se cumple que P<α y en consecuencia se rechaza la
hipótesis nula H : ~
μ =~
0μ a favor de la alternativa
M T
H a : ~μM < ~
μT .
Conclusión. Efectivamente el rendimiento de los
alumnos del grupo de la mañana es menor en
promedio al de los alumnos del grupo de la tarde.
Ha: ~
μT > ~
μ M que indica que la mediana del grupo de la tarde es mayor al de la mañana
y ambas maneras significan lo mismo.
Regla para la codificación: Asignar el código 1 al grupo de datos que se encuentra a la izquierda
de la desigualdad.
En el caso de Ha: ~
μ M <~
μT el código 1 se debe asignar a los datos del grupo de la mañana y para
Ha: ~
μ >~
T μ se debe asignar el 1 a los datos del grupo de la tarde.
M
y por ello el código 1 se asignó a las observaciones del grupo de la mañana ya que ~
μ M se
encuentra a la izquierda de la desigualdad.
Dado que por defecto el valor de P que genera el SPSS es para la hipótesis alterna de dos colas
Ha: ~
μ ≠~
1 μ para obtener el valor de P para la hipótesis unilateral simplemente se divide entre
2
dos el valor de P que produce el SPSS. En este caso el valor de P esta dado por
P=0.064/2=0.032 el cual coincide con nuestro valor calculado anteriormente.
Importante. El uso de la prueba de suma de rangos de Mann - Whitney no se restringe a
poblaciones no normales. Se puede utilizar en vez de la prueba t de dos muestras cuando las
poblaciones son normales, aunque la potencia será menor. La prueba de suma de rangos
siempre es superior a la prueba t para poblaciones definitivamente no normales.
Prueba de Kruskall-Wallis
Se le conoce también como la prueba H de Kruskal-Wallis.
Es la generalización de la prueba de Mann - Whitney para más de dos muestras.
Es la alternativa no paramétrica a la prueba F del análisis de la varianza para probar la
igualdad de k ≥ 2 medias poblacionales.
No requiere que todas las k muestras provengan de poblaciones normales con varianzas
iguales.
Notación.
k = número total de grupos = número total de muestras .
n1 = número de elementos en la muestra 1.
n2 = número de elementos en la muestra 2.
…
n k = número de elementos en la muestra k.
n = número total de datos disponible. n=n1 +n2 +n 3+ …+nk .
R1 = suma de los rangos de todos los elementos en la muestra 1.
R3 = suma de los rangos de todos los elementos en la muestra 2.
…
Rk = suma de los rangos de todos los elementos en la muestra k.
Planteamiento de las Hipótesis. Las hipótesis a contrastar con esta prueba son
H 0 :μ 1=μ2=μ3 vs H a :al menosuna de las μi es diferente
mismas del análisis de la varianza para determinar si dos o más muestras provienen de
poblaciones normales idénticas.
El estadístico de prueba es
k 2
12 Rj
H= ∑ −3 ( n+1 )
n ( n+1 ) j=1 n j
cuya distribución se aproxima a una distribución ji-cuadrada con k −1 grados de libertad cuando
los tamaños de todas las muestras son mayores o iguales a 5.
Regla de decisión. Dado que H posee distribución ji-cuadrada con k −1 grados de libertad, la
regla de decisión es rechazar la hipótesis nula de que todas las medias son iguales a favor de la
alternativa si
H > χ 2k −1 ;α
Obtenidas las sumas de los rangos se procede a obtener el valor del estadístico H Kruskall-Wallis
con n=30, n1 =n2=n 3=10, R1=145 , R2=161 , R3=159 .
12
3
R2j
H= ∑ −3 ( n+1 )
n ( n+1 ) j=1 n j
12 1452 1612 1592
H=
30∗31 10( +
10
+
10
−3∗31 )
H=0.19613
Regla de Decisión.
Dado que el estadístico H tiene distribución aproximadamente ji-cuadrada, se rechaza la
2
hipótesis nula si H > χ 22 ;α =0.05=5.991, o bien si P=Pr ( χ 2 >0.19613 ) <α
1≤ i ≤n { {
x
}}
d n=max max |F ( x(i) )−S n ( x (i ) )|;|F ( x (i ) )−Sn ( x (i−1) )|
Tiempo para 3.35 3.69 3.76 3.81 3.85 3.86 3.99 4.03 4.04 4.16
se atendido 4.17 4.22 4.23 4.23 4.31 4.42 4.46 4.6 4.66 5.12
Solución.
Planteamiento de las hipótesis.
H 0 : Los datos de la muestra se ajustan a la distribución normal
vs
H a : Los datos de la muestra no se ajustan a la distribución normal
Nivel de significancia. α =0.05
Obtención de estadístico de prueba.
Tiempo Fi F(x) Fr(i) Fr(i-1) di di-1
0.0216
3.35 1 3 0.05 0.00 0.0284 -0.0216 Max dn= 0.1177
0.1230 -
3.69 2 2 0.10 0.05 0.0230 -0.0730 Min dn= -0.0730
0.1628 -
3.76 3 7 0.15 0.10 0.0129 -0.0629 d20 = 0.1177
3.81 4 0.1959 0.20 0.15 0.0040 -0.0460
7
0.2251
3.85 5 9 0.25 0.20 0.0248 -0.0252
0.2328
3.86 6 6 0.30 0.25 0.0671 0.0171
0.3445
3.99 7 1 0.35 0.30 0.0055 -0.0445
0.3825
4.03 8 2 0.40 0.35 0.0175 -0.0325
0.3922
4.04 9 2 0.45 0.40 0.0578 0.0078
0.5121 -
4.16 10 2 0.50 0.45 0.0121 -0.0621
0.5222
4.17 11 2 0.55 0.50 0.0278 -0.0222
0.5723
4.22 12 5 0.60 0.55 0.0276 -0.0224
0.5822
4.23 13 7 0.65 0.60 0.0677 0.0177
0.5822
4.23 14 7 0.70 0.65 0.1177 0.0677
0.6592
4.31 15 1 0.75 0.70 0.0908 0.0408
0.7545
4.42 16 7 0.80 0.75 0.0454 -0.0046
0.7853
4.46 17 1 0.85 0.80 0.0647 0.0147
0.8738
4.6 18 6 0.90 0.85 0.0261 -0.0239
0.9026
4.66 19 5 0.95 0.90 0.0473 -0.0027
0.9930
5.12 20 9 1.00 0.95 0.0069 -0.0431
Media
= 4.148
Desv = 0.395
Regla de decisión Dado que el valor de la tabla 0.294 es mayor que el valor calculado de
d 20=0.118 , entonces no se rechaza la hipótesis nula.
Si se utiliza el valor de P que da el SPSS se tiene que dado P=0.2> 0.05 se concluye que no se
rechaza la hipótesis nula.
Conclusión. Dado que el valor de P es 0.2 > 0.05 se concluye que los tiempos para ser atendidos
en la cafetería siguen una distribución normal con media μ=4.148y desviación estándar
σ =0.395.
Salida en SPSS
Obsérvese que el Max dn = 0.118 y Min dn = -0.073 coinciden con los valores arrojados por el
SPSS.
Tipo de crimen
Municipi Asalt Robo de casas Hurto Homicidio Total
o o
A 162 118 451 18 749
B 258 193 458 10 919
C 280 175 390 19 864
Total 700 486 1299 47 2532
La prueba ji cuadrada de independencia tiene como objetivo probar si existe alguna relación de
dependencia entre dos variables categóricas. Para el caso de la tabla anterior la prueba busca
determinar si el tipo de crimen que se comete y el municipio donde ocurre el delito guardan o
no alguna relación. Para este ejemplo las hipótesis a contrastar serian:
H 0 : El tipo de delito que se comete es independiente del municipio donde ocurre eldelit o
H a : E ltipo de delito que se comete y el municipio donde ocurre el delit o son dependientes
Los pasos a seguir para llevar a cabo el contraste ji cuadrado de independencia son muy
sencillos.
1. Plantear las hipótesis a contrastar. Para el ejemplo serian
H 0 : El tipo de delito que se comete es independiente del municipio donde ocurre eldelit o
H a : E ltipo de delito que se comete y el municipio donde ocurre el delit o son dependientes
A continuación la tabla con las frecuencias observadas, esperadas y el aporta a la suma ji-
cuadado
Tipo de crimen
Municipi
o Asalto Robo de casas Hurto Homicidio Total
11
A 162 207.07 9.81 8 143.77 4.62 451 384.26 11.59 18 13.90 1.21 749
19
B 258 254.07 0.06 3 176.40 1.56 458 471.48 0.39 10 17.06 2.92 919
17 238.8
C 280 238.86 7.08 5 165.84 0.51 390 443.26 6.40 19 6 0.55 864
48 6.68 129 269.8 4.67
Total 700 700 16.955 6 486.00 7 9 1299 18.376 47 2 5 2532
Una vez realizados los cálculos se procede a obtener el valor del estadístico de prueba ji-
cuadrado
r 2
2 ( Oij −Eij )
χ =∑ ∑ c
c =16.955+6.687+18.376+ 4.675=46.693
i=1 j=¿¿ Eij
4. Regla de decisión. El estadístico de prueba χ 2c posaee distribución ji-cuadrado con
v=( r−1 ) ( c−1 ) grados de libertad
r 2
2 ( Oij −Eij ) 2
χ =∑ ∑ c
c χv
i=1 j=¿¿ Eij
En consecuencia, para un nivel de significancia α se rechaza la hipótesis nula de
independencia de las variables categóricas si χ 2c > χ 2v; α; es decir, si el valor calculado χ 2c cae en
la región critica como se muestra en la figura.
Para el ejemplo, los grados de libertad son v=( r−1 ) ( c−1 ) =( 3−1 ) ( 4−1 )=6 grados de libertad.
En consecuencia como χ 2v; α = χ 26 ;0.05=12.592 y χ 2c =46.693 se sigue que χ 2c > χ 2v; α (46.693>12.592),
en consecuencia se rechaza la hipótesis nula de independencia; esto es, la ocurrencia de estos
tipos de delitos depende del Municipio.
Casos
Crimen Total
Pruebas de chi-cuadrado
Nota: Obsérvese que los resultados obtenidos con el SPSS coincides con los obtenidos
anteriormente