Sei sulla pagina 1di 11

ESTADÍSTICA NO PARAMÉTRICA

Objetivo general:
Conocer métodos de pruebas de hipótesis aplicables a distribuciones de datos con niveles de medición nominal,
ordinal, continua no normal o simplemente libres de distribución.

Sumario:
1. Prueba de Bondad de Ajuste
2. Prueba de Normalidad
3. Tablas de Contingencia
4. Prueba del signo
5. Prueba de rangos con signo de Wilcoxon
6. Prueba de suma de rangos de Wilcoxon
7. Prueba de Kruskal-Wallis
8. Coeficiente de correlación de rangos de spearman

Desarrollo
1. Prueba de Bondad de Ajuste para cualquier nivel de datos (Pearson)

El objetivo de esta prueba es determinar cuan bien se ajusta un conjunto observado de datos a un conjunto
esperado de datos, sea cual fuere éste, bajo la distribución  2

Las características de esta distribución son:

 Nunca es negativo
 Familia de distribuciones ji cuadradas de acuerdo al número de grados de libertad
 Es una distribución con sesgo positivo

Mediante un ejemplo podremos explicar de mejor manera su aplicación:

Una empresa planea iniciar una serie de tarjetas con fotografías de ex jugadores de béisbol, para ello, exhibe
tarjetas de 6 ex jugadores, vendiéndose el primer día 120 tarjetas. ¿Puede concluirse que las ventas de tarjetas son
iguales para los 6 ex jugadores (frecuencias esperadas) o debe concluirse que las ventas no son iguales? Las
frecuencias observadas y esperadas para las 120 tarjetas vendidas pueden verse en la siguiente tabla:

donde: Frecuencias observadas: tarjetas vendidas por cada jugador.


Frecuencias esperadas: 20 tarjetas por jugador, reflejando la hipótesis de que las ventas son iguales para
cada uno.

El Procedimiento de prueba comienza con las hipótesis:

Ho: No existe diferencia entre frecuencias observadas y frecuencias esperadas (ventas iguales)
H1: Existe una diferencia entre los dos conjuntos de frecuencias

El Estadístico de Prueba calculado sigue la distribución ji cuadrada, que se denota  2 , y esta determinado por la
siguiente formula:

 ( f  f )2 
 2   o e 
 fo 

donde: fo es una frecuencia observada en una categoría específica


fe es una frecuencia esperada de una categoría determinada

Los cálculos pueden resumirse en el siguiente cuadro:

El valor critico que separa la zona de no rechazo de la zona de rechazo de la hipótesis nula esta determinado por 5
grados de libertad, que resulta de restar el número de categorías menos 1 (k-1), con un 5% de significancia en la
Tabla  2 , que da lugar a un valor crítico de 11.07, como se observa en el siguiente gráfico:

De esta manera se tiene un  2 calculado 34.4 mayor que el  2 crítico 11.07, con lo cual se debe rechazar la
hipótesis nula debido a que existen grandes diferencias entre las frecuencias observadas y esperadas de ventas
iguales.

2. Prueba de normalidad

Se puede emplear esta misma prueba de bondad de ajuste para determinar si un conjunto de frecuencias
observadas corresponde a uno de frecuencias de distribución normal. (frecuencias esperadas) En otros términos,
¿coinciden los valores observados en una distribución de frecuencias con los valores esperados con base en una
distribución normal?

Para ilustrar la aplicación de esta prueba, veamos un ejemplo:

Se recopiló información acerca de los sueldos anuales de profesores de tiempo completo en 160 colegios
universitarios, dando lugar a un pago laboral medio de 54.03 (miles de dólares), y una desviación estándar de
13.76 (miles de dólares), que se puede resumir en la siguiente tabla donde se pueden ver las frecuencias
observadas, frecuencias esperadas bajo distribución normal y los cálculos de la  2 :

La frecuencia esperada bajo distribución normal se construye mediante los siguientes pasos:

En cada clase, se obtienen valores Z correspondientes para los límites inferior X i y superior Xs de cada clase con
la formula habitual:

x 
z

donde: x son los límites inferior y superior de cada clase


 es la media
 es la desviación estándar

Una vez encontrados los valores Z inferior y Z superior de cada clase, se puede encontrar las probabilidades entre
el valor medio y cada uno de estos Z en la Tabla de Distribución Normal. Luego la diferencia entre estas
probabilidades, representa la probabilidad esperada de cada clase, que al multiplicarse por el total de
observaciones, en este caso 160 colegios, da lugar al valor esperado o frecuencia esperada de colegios en
distribución normal.

Una vez obtenida la frecuencia esperada, se procede a aplicar la Prueba de Bondad de Ajuste, bajo las siguientes
hipótesis:

Ho: La población sigue una distribución normal (frecuencia observada es igual a la esperada)
H1: La población no sigue una distribución normal (frecuencia observada no es igual a la esperada)

El valor crítico estada dado por (k – 2 –1), donde k representa el número de categorías o clases, 2 por el cálculo
de los parámetros poblacionales (media y desviación estándar), y 1 por la muestra, que con un 5% de
significancia determina una valor de 9.48. El  2 calculado tiene un valor de 2.59, con lo cual no se puede
rechazar la hipótesis nula de normalidad de los datos.

3. Tablas de contingencia

Las Pruebas de Bondad de Ajuste también se pueden aplicar para el caso de 2 variables de análisis, tal cual puede
ilustrar el siguiente ejemplo:

¿Un hombre liberado de una prisión federal se ajusta mejor a la vida civil si regresa a su ciudad natal o si va a
vivir a otra parte? Las dos características son el ajuste a la vida civil y el lugar de residencia. En otras palabras,
¿existe relación entre el ajuste a la vida civil y el lugar de residencia después de la liberación?

Para ello, se entrevistaron a 200 ex convictos al azar. Se clasifica el ajuste de cada individuo a la vida civil como
excelente, bueno, regular o insatisfactorio, en los sitios de residencia de ciudad de origen y otra ciudad, con la
siguientes hipótesis:
Ho: No existe relación entre el ajuste a la vida civil y el lugar donde radique el individuo después de ser liberado
(frecuencia observada igual a la frecuencia esperada)
H1: Existe relación entre el ajuste a la vida civil y el lugar donde resida la persona después de salir de prisión.

Los datos y cálculos se pueden ver en la siguiente tabla de contingencia:

La frecuencia esperada para cualquier celda queda determinada por:

(total por renglón)(total por columna)


fe 
gran total

El valor calculado que es la suma total de las diferencias entre la frecuencia observada y esperada en cada celda,
alcanza un valor de 5.279.

En una prueba de 2 características, los grados de libertad quedan determinados por:

gl = (numero de filas –1)(numero de columnas –1)

Con 2 filas y 4 columnas, se tiene 3 grados de libertad que con un 1% de significancia, se obtiene un valor critico
de 11.345 en la tabla ji cuadrada, que al ser mayor que el valor calculado de 5.279, se debe aceptar la hipótesis
nula de que no existe relación entre el ajuste a la vida civil y el lugar donde radique el individuo después de ser
liberado. (frecuencia observada igual a la frecuencia esperada)

4. Prueba del signo

La prueba de signo se basa en el signo algebraico de una diferencia entre dos observaciones relacionadas, sin
tomar en cuenta la magnitud de la diferencia, sólo el sentido (o dirección) de la misma para establecer la igualdad
o diferencia entre estas observaciones relacionadas. Una aplicación de esta prueba son los experimentos de
"antes/después", como por ejemplo la evaluación de un nuevo programa de afinación de motores de automóvil.
Antes de la operación se registra el número de millas recorridas por galón de gasolina consumida, y se registran
de nuevo después de la afinación. En teoría, si tal acción no fue eficaz, es decir, no se manifiesta en el
funcionamiento del automóvil, entonces en forma aproximada la mitad de los automóviles probados mostraría un
aumento en el millaje por galón, y la otra mitad, una disminución. El signo "+" se asignaría al aumento, y el signo
"-" a la disminución. Otro ejemplo puede ser un experimento referente a la preferencia hacia un producto
comercial. En un grupo de tomadores de café se dio a cada uno sucesivamente dos tazas de café (descafeinado y
regular) sin marca alguna, y se les preguntó luego su preferencia. La elección por el descafeinado puede
codificarse como "+", y la preferencia por el regular como "-". En cierto sentido los datos son de nivel ordinal,
porque el bebedor de café puede dar a su producto preferido el rango superior, y otorgar a la otra clase un rango
de inferior. Como en el caso anterior, si los consumidores no tienen preferencia alguna, se puede esperar que la
mitad de la muestra de los tomadores de café prefieran el producto descafeinado, y la otra mitad, el regular

Para ilustrar la aplicación de esta prueba, nos valemos de la evaluación (antes y después) de un programa de
capacitación. El signo "+" indica mejoría, y el signo "-" señala empeoramiento, conforme a la siguiente tabla:

El procedimiento usual comienza con el planteamiento de las hipótesis:

Ho: no hay cambio ( 0.5) no hay cambio en la capacidad por el programa de capacitación
H1: se incrementa la capacidad de gerentes (>0.5) se incrementa la capacidad

Debido a que la prueba del signo cumple los requisitos de una distribución binomial, se sigue esta entidad
estadística de prueba:

 dos resultados posibles (éxito y fracaso), en este caso el éxito sería mejoramiento de la capacidad
 para cada ensayo, se tiene una probabilidad de éxito constante 50%
 el número total de ensayos es fijo
 cada ensayo es independiente

El Valor estadístico de prueba es el número de signos positivos (éxitos), eliminando de la prueba aquellas
diferencias de no cambio. En este caso la muestra se reduce a 14. Luego se calculan las probabilidades de cada
uno de los posibles números de éxitos (0 a 14) con la formula binomial habitual:

n!
P( x)   x (1   ) n  x
x!( n  x )!

donde: n es el número de ensayos


x es el número de éxitos
 es la probabilidad de éxito en cada ensayo

Luego se suman hacia arriba la probabilidad acumulada debido a que es una prueba de una cola a la derecha
debido a la hipótesis alternativa de una sola dirección (>), por tanto la zona de rechazo esta en la cola de valor
superior. Si el signo de desigualdad apuntara a la extremidad de la izquierda (<), la región de rechazo estaría en la
cola inferior. Si este fuera el caso, se sumarían las probabilidades hacia abajo para lograr las probabilidades
acumuladas. Estos cálculos pueden observarse en la siguiente tabla:
Luego el 10% de significancia por ejemplo, determina el nivel de éxitos de la suma de probabilidades
acumuladas, buscando la cifra mas cercana al 10%, pero sin excederla. Contando el número de éxitos
correspondiente, que en este caso es 10. La regla de decisión es si el número de éxitos o signos positivos es igual
a 10 o más, se rechaza la hipótesis nula y se acepta la hipótesis alternativa.

5. Prueba de rangos con signo de Wilcoxon

La prueba t de pares dependientes suponía una distribución normal, en caso de no asumirse como verdadero este
supuesto, tenemos la prueba de rangos con signo de Wilcoxon para hacer una contraste de 2 poblaciones
dependientes. Además que se afronta un problema con la consideración de normalidad cuando el nivel de
medición en las muestras es ordinal, y no de intervalo o de razón. Por ejemplo, su póngase que hay 10 pacientes
para cirugía en una clínica, y el supervisor de enfermería pide que los evalúen según una escala del 1 al 10, con
base en la dificultad de cuidado al enfermo. La distribución de las diferencias probablemente no se aproximará a
la normal, y por lo tanto, la prueba t de pares no sería apropiada.

Un ejemplo detalla de mejor manera la aplicación de esta prueba:

Un restaurante familiar desarrolló un nuevo aderezo. Antes de reemplazar el sabor actual, desea realizar ciertas
pruebas para estar seguro de que a los comensales les gustará más el nuevo sabor. En una muestra aleatoria de 15
personas.. A cada miembro de la muestra se les pide que califiquen en una escala del 1 al 20 el viejo y nuevo
aderezo. Un valor cercano a 20 indica que al participante le gustó el sabor, mientras que una calificación próxima
a O indica que ése no le agradó. Los resultados y cálculos se indican en la tabla siguiente. ¿Es razonable concluir
que la gente prefiere el nuevo sabor al 5% de significancia?
El procedimiento comienza con el planteamiento de la hipótesis:

Ho: no hay diferencia en las evaluaciones de los dos sabores


H1: Las evaluaciones del nuevo sabor son mayores

Esta es una prueba de una cola, porque solo se cambiaría el aderezo si los participantes consideran que el nuevo
sabor es mejor. Luego se calcula la diferencia entre las calificaciones para cada participante, luego se toma en
cuenta únicamente las diferencias positivas y negativas reduciéndose la muestra. Si se elige restar la calificación
del sabor actual de la calificación para el nuevo, un resultado positivo es la "cantidad" en la que el participante
favorece el nuevo sabor. Las calificaciones con diferencia negativa indica que el participante favorece el aderezo
actual.

Luego se determina las diferencias absolutas y se ordenan de menor a mayor asignándoles un rango. Cuando se
tiene similar diferencia, se promedian los rangos involucrados y se les asigna el promedio. Posteriormente a cada
rango asignado se le da el mismo signo de la diferencia original, se suman todos los valores de las columnas
Rango con signo positivo y negativo, y la menor de las dos sumas de rangos se utiliza como valor estadístico de
la prueba.

Los valores críticos están dados por la tabla T de Wilcoxon. Al ser una prueba de una cola y un nivel de
significancia del 5%, y un tamaño de muestra de 14, se obtiene un valor critico de 25. La regla de decisión es
rechazar la hipótesis nula si la menor de la suma de rangos vale 25 o menos, en este caso se debe aceptar la
hipótesis nula.

6. Prueba de suma de rangos de Wilcoxon

Esta es una prueba para determinar si dos muestras independientes provienen o no de la misma población bajo el
supuesto que no están distribuidas de forma normal ni que las dos varianzas son iguales, se basa en el promedio
de rangos, a los datos se les jerarquiza como si las observaciones fueran parte de una sola muestra. Si la hipótesis
nula es verdadera, entonces los rangos estarán casi normalmente distribuidos entre las dos muestras y el promedio
de los rangos para los dos conjuntos muestrales será casi el mismo.

Esto es, los rangos bajo, mediano y alto deben quedar divididos igualmente entre las dos muestras. Si la hipótesis
alternativa es verdadera uno de los conjuntos muestrales tendrá la mayoría de los rangos más bajos y, por tanto,
un rango total menor. La otra muestra tendrá mayor número de los rangos más altos y, por lo tanto, un total más
elevado. Si cada muestra contiene al menos 8 observaciones, la distribución normal estándar será empleada como
el valor estadístico de prueba. La formula es:

n1 (n1  n2  1)
W
z 2
n1n2 (n1  n2  1)
12
donde:
 n1 es el número de observaciones de la primera población.
 n2 es el número de observaciones de la segunda población.
 W es la suma de rangos de la primera población.

El siguiente ejemplo puede ilustrar esta prueba:

Una compañía aérea notó recientemente un aumento en el número de pasajeros que no hacen uso de su
reservación ni la cancelan, en vuelos que salen de Atlanta. Está particularmente interesado en determinar si hay
más ausencias en vuelos provenientes de dicha ciudad que en vuelos que parten de Chicago.. Al nivel de
significancia de 0.05, ¿se puede concluir que hay más pasajeros ausentes en vuelos que salen de Atlanta?

Para ello toma una muestra de 9 vuelos de Atlanta y ocho de Chicago que junto a los cálculos correspondientes se
presenta en la siguiente tabla:

Si el número de ausencias es el mismo para Atlanta que para Chicago, es de esperar que las medias de los dos
rangos sean casi iguales. Si tal número no es el mismo, se cuenta con que las dos sumas de rangos sean muy
diferentes.

El funcionario cree que hay más ausencias en los vuelos de Atlanta. Por tanto es adecuado utilizar una prueba de
una cola, con la región de rechazo localizada en la extremidad de valores superiores bajo las siguientes hipótesis:

Ho: La distribución de ausencias es la misma para Atlanta y Chicago.


H1: La distribución de ausencias es mayor para Atlanta que para Chicago.

El valor estadístico de prueba sigue la distribución normal estándar. Al nivel de significancia del 5%, se obtiene
un valor crítico z de 1.65. La hipótesis nula se rechaza si la magnitud calculada de z es mayor que 1.65. Para ello
en primer lugar se clasifican las observaciones de ambas muestras como si fueran un solo grupo. Luego el menor
numero de ausencias se le asigna el rango 1 y así sucesivamente, de allí se suma el rango en cada muestra y se
procede a calcular el valor de z, que en este ejemplo tiene un valor de 1.49, con lo que es menor que 1.65, y por
lo tanto permite no rechazar la hipótesis nula.

7. Prueba de Kruskal-Wallis

El procedimiento de análisis de variancia (ANOVA) sirve para determinar si son iguales varias medias
poblacionales, cuando se supone que los datos son a niveles de intervalo o de razón, cuando las poblaciones
estaban normalmente distribuidas y que eran iguales las desviaciones estándares de dichas poblaciones. ¿Qué
pasaría si los datos fueran de escala ordinal y/o las poblaciones no fueran normales? Kruskal y Wallis elaboraron
una prueba no paramétrica para ello que sólo necesita datos a nivel ordinal por rangos. Tal prueba no exige
suposiciones respecto a la forma de las poblaciones, salvo que las muestras sean independientes. La prueba se
conoce como análisis de variancia en un sentido por rangos.

Para calcular la magnitud estadística de prueba de Kruskal-Wallis, (1) se combinan todos los valores de las
muestras, (2) se ordenan tales valores combinados, de menor a mayor, y (3) los valores ordenados se reemplazan
por rangos, comenzando con 1 para el valor más pequeño. Un ejemplo puede aclarar el procedimiento.

Se llevará a cabo un seminario de administración para un gran número de ejecutivos de manufactura, finanzas y
comercio. Antes de programar las sesiones respectivas, el director del seminario se interesó en determinar si los
tres grupos tenían conocimientos semejantes acerca de los principios de administración o gerenciales. Se planea
tomar muestras de los ejecutivos de manufactura, finanzas y comercio, y aplicar una prueba a cada uno. Si no
existe diferencia en las calificaciones para las tres distribuciones, el director del seminario impartirá sólo una
sesión. Sin embargo, si se encuentra diferencia en las puntuaciones, se impartirán sesiones diferentes.

El primer paso, consiste en establecer las hipótesis nula y alternativa:

Ho: Son iguales las distribuciones de las puntuaciones sobre principios de administración para las poblaciones de
ejecutivos en manufactura, finanzas y comercio.
H1: No todas las distribuciones son iguales.

El valor estadístico de la prueba esta dado por la siguiente formula:

12  ( R1 ) (  R2 ) 2 (  Rk ) 2 
2

H    .....    3(n  1)
n(n  1)  n1 n2 nk 

con k-1 grados de libertad, donde k es el numero de poblaciones, ( R) son las sumas de los rangos de las
muestras y n el tamaño de las muestras.

La distribución de H es muy cercana a la ji cuadrada con k-1 grados de libertad si cada tamaño de muestra es
igual a 5 por lo menos, que en este caso con 5% de significancia y 2 grados de libertad da lugar a un valor critico
de 5.991. Se aceptaría la hipótesis nula si el valor H calculado es menor o igual a 5.991.

Los datos y cálculos para el ejercicio se pueden ver en la siguiente tabla:

Considerando las puntuaciones como una sola población, se ordena el rango de menor a mayor, y procediendo a
utilizar la formula del H calculado, se obtiene un valor de 5.736 que al ser menor que 5.991, permite aceptar la
hipótesis nula.

9. Coeficiente de correlación de rangos de Spearman

Este coeficiente mide la asociación entre dos variables ordinales jerarquizadas, por ejemplo, a dos integrantes del
consejo universitario se les pide que clasifiquen 10 propuestas de investigación para el cuerpo docente. Se desea
estudiar la asociación entre las puntuaciones de dichos miembros del personal. Esto es, ¿tales personas clasifican
como más valiosa y menos valiosa a las mismas propuestas? El coeficiente de correlación de rangos de
Spearman, proporciona una medida de tal asociación. El coeficiente de correlación de rangos se calcula usando la
siguiente fórmula:

6 d 2
rs  1 
n( n 2  1)

donde: d es la diferencia entre los rangos de cada par y n el numero de observaciones en pares.

El coeficiente de correlación de rangos puede adoptar cualquier valor desde -1.00 hasta 1.00. Un valor de -1.00
indica una correlación negativa perfecta, y uno de 1.00, una correlación positiva perfecta entre los rangos. Una
correlación de rangos igual a 0 indica que no hay asociación fuerte entre los mismos. Las correlaciones de rangos
de -0.84 y 0.84 señalarían una fuerte asociación, pero la primera manifiesta una relación inversa entre los rangos,
y la segunda, una relación directa.

Un ejemplo puede ilustrar la aplicación de esta prueba:

Los ejecutivos de empresa otorgan una puntuación compuesta a cada egresado de la universidad que ingresa a
una compañía de fabricación de plásticos. Tal puntuación es una expresión del potencial futuro del egresado. Las
calificaciones representan, por supuesto, el nivel ordinal de medición. El recién egresado entra a un programa de
capacitación en planta, y se le otorga otra puntuación compuesta basada en pruebas, opiniones de líderes de
grupo, dirigentes de entrenamiento, etc. Las puntuaciones de los ejecutivos y de la capacitación en planta se
muestran en la siguiente tabla junto a los cálculos correspondientes:

Para determinar la relación existente entre las dos calificaciones, esto es cuál es el coeficiente de correlación de
rangos, se clasifica las variables de menor a mayor, asignándoles un rango en cada tipo de calificación, y luego se
procede a aplicar la formula correspondiente obteniéndose en este caso un valor de 0.726 que indica una fuerte
asociación positiva entre las dos calificaciones.

7. Prueba de significancia del coeficiente de correlación de rangos

Surge la pregunta de sí la correlación en la población es en realidad igual a cero, puesto que se trata únicamente
de una muestra, por lo que se prueba la significancia del resultado del coeficiente se aplica mediante la siguiente
formula para una muestra mayor a 10:
n2
t  rs
1  rs2

La distribución de muestreo del coeficiente de correlación sigue la distribución t con n-2 grados de libertad

Las hipótesis de la prueba son Ho: la correlación es igual a cero y H1: la correlación es mayor que cero.

La regla de decisión es rechazar la hipótesis nula si el valor calculado t es mayor que el t crítico al 5% de
significancia, prueba de una cola y n-2 grados de libertad. En el ejemplo, un t calculado de 3.338 es mayor que el
t critico de 1.812 por lo que se debe rechazar la hipótesis nula.

Potrebbero piacerti anche