Sei sulla pagina 1di 19

Unidad 4 Pruebas de bondad de ajuste y pruebas no

paramétricas
4.1 Bondad de ajuste
Las pruebas de bondad de ajuste tratan de verificar si el conjunto de datos se
puede ajustar o afirmar que proviene de una determinada distribución. Las
pruebas básicas que pueden aplicarse son: la ji-cuadrada y la prueba de Smirnov-
Kolmogorov. Ambas pruebas caen en la categoría de lo que en estadística se
denominan pruebas de “Bondad de Ajuste” y miden, como el nombre lo indica, el
grado de ajuste que existe entre la distribución obtenida a partir de la muestra y la
distribución teórica que se supone debe seguir esa muestra. Ambas pruebas están
basadas en la hipótesis nula de que no hay diferencias significativas entre la
distribución muestral y la teórica, H0 es la distribución que se supone sigue la
muestra aleatoria. La hipótesis alternativa siempre se enuncia como que los datos
no siguen la distribución supuesta. Hablamos de bondad de ajuste cuando
tratamos de comparar una distribución de frecuencia observada con los valores
correspondientes de una distribución esperada o teórica. Algunos estudios
producen resultados sobre los que no podemos afirmar que se contribuyen
normalmente, es decir con forma acampanada concentradas sobre la media.

Formula:

4.1.1 Análisis de Ji-cuadrada


El procedimiento de la prueba requiere una muestra aleatoria de tamaño n
proveniente de la población cuya distribución de probabilidad es desconocida.
Estas n observaciones se pueden distribuir en k intervalos de clases y pueden ser
representadas en histogramas. La prueba se puede utilizar tanto para
distribuciones discretas como para distribuciones continuas La prueba se puede
sintetizar en los siguientes pasos. 1. Se colocan los n datos históricos (muéstrales)
en una tabla de frecuencia de la siguiente manera: a. Se busca en cuantos
intervalos de clases se puede distribuir los datos en estudio lo cual se puede hacer
m = n o alternativamente es muy común utilizar las encontrar el número de
intervalos se aplica la regla de sturges: m =1+3,3 log n donde n es el número de
datos b. Luego encontramos el rango el cual es la diferencia entre el mayor valor y
el menor valor.

1. se obtienen las frecuencias observadas en cada intervalos se calcula la media,


la varianza y las desviación estándar.

2. Se propone una distribución de probabilidad una distribución de probabilidad de


acuerdo con la tabla de frecuencia o con la curva que muestre un histograma o
polígono de frecuencia.

3. Con la distribución propuesta, se calcula la frecuencia esperada para cada uno


de los intervalos (FEi) de la siguiente manera: Si la variable es continua se halla
mediante la integración de la distribución propuesta y luego se multiplica por el
número total de datos. Si la variable es continua se utiliza de modelo matemático
de la distribución propuesta y se evalúan todas las categorías y luego se multiplica
por el número total de datos.

4. Se calcula el estadístico de prueba

Nota: El estadístico de prueba tiene distribución Chi cuadrado con, m-k-1 grados
de libertad, siempre que las frecuencias esperadas sean 5 o más para todas las
categorías 5. Si el estimador C es menor o igual al valor correspondiente X 2 con
m-k-1 grados de libertad (K= números de parámetros estimados de la distribución
propuesta estimada por los estadísticos muéstrales) y a un nivel de confiabilidad
de 1-α, entonces no se puede rechazar la hipótesis de que los datos siguen la
distribución que se propuso.
PRUEBA CHI CUADRADO PARA UNA DISTRIBUCIÓN DE PROBABILIDAD
BINOMIAL

En un estudio diseñado para determinar la tolerancia de los pacientes a un nuevo


analgésico, 100 médicos seleccionaron cada uno una muestra de 25 pacientes
para participar en el estudio. Cada paciente después de haber tomado el nuevo
analgésico durante un periodo especificado, fue interrogado para saber si prefería
éste o el que había tomado regularmente con anterioridad. El interés consiste en
determinar si los datos son compatible con la hipótesis de que extrajeron de un
una población que sigue una distribución Binomial.

Ejemplo:
4.1.2 Prueba de Independencia
El objetivo es verificar si existe una dependencia entre las variables cualitativas
que definen filas y columnas, es decir, si para todo i = 1, ..., k y j = 1, .., m se
verifica que la probabilidad del resultado correspondiente a la combinación Ai ∩ Bj
es el producto de las probabilidades marginales correspondientes. P(Ai) es la
probabilidad del resultado i para la variable fila y P(Bj) la del resultado j para la
variable columna.

Cuando cada individuo de la población a estudio se puede clasificar según dos


criterios A y B, admitiendo el primero a posibilidades diferentes y b el segundo, la
representación de las frecuencias observadas en forma de una matriz a x b recibe
el nombre de Tabla de contingencia. Los datos se disponen de la forma.

La hipótesis nula a contrastar admite que ambos caracteres, A y B, se presentan


de forma independiente en los individuos de la población de la cual se extrae la
muestra; siendo la alternativa la dependencia estocástica entre ambos caracteres.
La realización de esta prueba requiere el cálculo del estadístico.

Ejemplo:

4.1.3 Pruebas de la bondad del ajuste


Prueba de Bondad de Ajuste, consiste en determinar si los datos de cierta muestra
corresponden a cierta distribución poblacional. En este caso es necesario que los
valores de la variable en la muestra y sobre la cual queremos realizar la inferencia
esté dividida en clases de ocurrencia, o equivalentemente, sea cual sea la variable
de estudio, deberemos categorizar los datos asignado sus valores a diferentes
clases o grupos. Metodología útil para validar las hipótesis sobre la distribución
teórica en la población que se realiza en la estadística paramétrica, i.e., contrastes
de hipótesis, intervalos de confianza, regresión lineal, etc
La prueba Ji cuadrada hace uso de la distribución del mismo nombre para probar
la bondad del ajuste al comparar el estadístico de prueba Xo2 con el valor en
tablas de la mencionada distribución Ji cuadrada con v grados de libertad y un
nivel de significancia alfa

Ejemplo:

La siguiente muestra de tamaño 50 ha sido obtenida de una población que registra


la vida útil (en unidades de tiempo) de baterías alcalinas tipo AAA. Pruébese la
hipótesis nula de que la variable aleatoria vida útil de las baterías sigue una
distribución exponencial negativa. Considérese un nivel de significancia alfa de
5%.
4.1.4 Tablas de contingencia
En estadística las tablas de contingencia se emplean para registrar y analizar la
asociación entre dos o más variables, habitualmente de naturaleza cualitativa
(nominales u ordinales).

Suponga que se dispone de dos variables, la primera el género (hombre o mujer) y


la segunda recoge si el individuo es zurdo o diestro. Se ha observado esta pareja
de variables en una muestra aleatoria de 100 individuos. Se puede emplear una
tabla de contingencia para expresar la relación entre estas dos variables:
Las cifras en la columna de la derecha y en la fila inferior reciben el nombre de
frecuencias marginales y la cifra situada en la esquina inferior derecha es el gran
total.

La tabla nos permite ver de un vistazo que la proporción de hombres diestros es


aproximadamente igual a la proporción de mujeres diestras. Sin embargo, ambas
proporciones no son idénticas y la significación estadística de la diferencia entre
ellas puede ser evaluada con la prueba χ² de Pearson, supuesto que las cifras de
la tabla son una muestra aleatoria de una población. Si la proporción de individuos
en cada columna varía entre las diversas filas y viceversa, se dice que existe
asociación entre las dos variables. Si no existe asociación se dice que ambas
variables son independientes.

El grado de asociación entre dos variables se puede evaluar empleando distintos


coeficientes: el más simple es el coeficiente phi que se define por

Donde χ2 se deriva del test de Pearson, y N es el total de observaciones -el gran


total-. Φ puede oscilar entre 0 (que indica que no existe asociación entre las
variables) e infinito. A diferencia de otras medidas de asociación, el coeficiente Φ
de Cramer no está acotado.

Ejemplo:

Se sortea un viaje a Roma entre los 120 mejores clientes de una agencia de
automóviles. De ellos, 65 son mujeres, 80 están casados y 45 son mujeres
casadas. Se pide:

1.¿Cuál será la probabilidad de que le toque el viaje a un hombre soltero?

2.Si del afortunado se sabe que es casado, ¿cuál será la probabilidad de que sea
una mujer?
4.2 Pruebas no paramétricas
Las pruebas no paramétricas o de distribución libre no están sometidas a ciertos
requisitos que son comunes a las pruebas paramétricas. Fundamentalmente
dichos requisitos se refieren a la distribución que presenta la variable en la
población. Por otra parte son especialmente útiles ante tamaños muestrales
reducidos o, en los casos en que la variable que nos interese este medida en una
escalaordinal. 

Para acceder a dichas pruebas debemos seleccionar el procedimiento pruebas no


paramétricas en el menú Analizar. Tras ello, se nos presentan distintas opciones
que pueden ser clasificadas en función de si la prueba en cuestión está destinada
a una, dos o más muestras. Las primeras suelen tener como objetivo la evaluación
del grado de ajuste de nuestros datos a una distribución determinada de los
mismos mientras que las restantes suelen utilizarse en la comparación de alguna
característica de dos o más muestras con lo cual serían el equivalente no
paramétrico del procedimiento comparar medias.

LAS PRUEBAS PARAMÉTRICAS

1. Se conoce el modelo de distribución de la población objeto de estudio y se desconoce un


número finito de parámetros de dicha distribución que hay que estimar con los datos de la
muestra.
2. 2. Requieren conocer la distribución de la muestra para poder r realizar inferencias sobre
la población.

LAS PRUEBAS NO PARAMÉTRICAS

1. Son métodos de distribución libre. No requieren conocer la distribución de la muestra.

2. Se utilizan estadísticos cuya distribución se determina con independencia de cuál sea la


distribución de la población.

4.2.1 Escala de medición


Nominal o clasificatoria: Se da cuando las observaciones consisten en
clasificaciones de objetos en categorías o clases mutuamente excluyentes. Se
dice que la medición es elemental.

Un ejemplo de datos en esta escala son las observaciones de una variable


aleatoria Bernoulli donde las observaciones son del tipo éxito o fracaso, presente o
ausente, mayor del 20% o menor del 20%, etc. La única relación que puede
establecerse es la de igualdad y por lo tanto de desigualdad. Dos observaciones
son iguales si están en la misma clase y diferentes si no lo están. El único
estadístico válido para este tipo de datos es la frecuencia en cada clase.

Una escala nominal es una escala de medición en la cual los números sirven
como “etiquetas” solamente para identificar o clasificar un objeto. Una escala de
medición nominal normalmente trata sólo con variables no numéricas (no
cuantitativas).

Estos son algunos ejemplos de escalas de medición nominal que te ayudarán a


comprender un poco mejor qué es esta escala de medición y para qué sirve.

Ejemplos:

¿Cómo describirías tu comportamiento?

E – extrovertido

I – introvertido

A – ambas

¿Cuál es tu género?

H – hombre

M – mujer

Podrías seleccionar una opción que describa tu color de pelo:

Negro

Café

Rojo

Amarillo

Otro
4.2.2 Métodos paramétricos contra no paramétricos
Escala Nominal: La escala de medida nominal, puede considerarse la escala de
nivel más bajo, y consiste en la asignación, puramente arbitraria de números o
símbolos a cada una de las diferentes categorías en las cuales podemos dividir el
carácter que observamos, sin que puedan establecerse relaciones entre dichas
categorías, a no ser el de que cada elemento pueda pertenecer a una y solo una
de estas categorías. Se trata de agrupar objetos en clases, de modo que todos los
que pertenezcan a la misma sean equivalentes respecto del atributo o propiedad
en estudio, después de lo cual se asignan nombres a tales clases, y el hecho de
que a veces, en lugar de denominaciones, se le atribuyan números, puede ser una
de las razones por las cuales se le conoce como "medidas nomina es".

Ejemplo

Podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San


Carlos de acuerdos a la carrera que cursan.

Carrera Numero asignado a la categoría


Educación 1
Administración 2
Se ha de tener presente que los números asignados a cada categoría sirven única
y exclusivamente para identificar la categoría y no poseen propiedades
cuantitativas.

Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo


o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces
puede recurrirse a la propiedad de "orden" de los números asignándolo a los
objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la
de B, puede inferirse que A posee un mayor grado de atributo que B.

La asignación de números a las distintas categorías no puede ser completamente


arbitraria, debe hacerse atendiendo al orden existente entre éstas.

Los caracteres que posee una escala de medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus categorías, el cálculo de las medidas
estadísticas de posición, como por ejemplo la mediana.

Escala de intervalos iguales: Está caracterizada por una unidad de medida


común y constante que asigna un número igual al número de unidades
equivalentes a la de la magnitud que posea el elemento observado. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningún momento ausencia de la magnitud que estamos midiendo. Esta
escala, además de poseer las características de la escala ordinal, encontramos
que la asignación de los números a los elementos es tan precisa que podemos
determinar la magnitud delos intervalos (distancia) entre todos los elementos de la
escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera
escala verdaderamente cuantitativa y a los caracteres que posean esta escala de
medida pueden calculársele todas las medidas estadísticas a excepción del
coeficiente de variación.

Escala de coeficientes o Razones: El nivel de medida más elevado es el de


cocientes o razones, y se diferencia de las escalas de intervalos iguales
únicamente por poseer un punto cero propio como origen; es decir que el valor
cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se
observa una carencia total de propiedad, se dispone de una unidad de medida
para el efecto. A iguales diferencias entre los números asignados corresponden
iguales diferencias en el grado de atributo presente en el objeto de estudio.
Además, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos
decir que A. Tiene dos, tres o cuatro veces la magnitud de la propiedad presente
en B.

4.2.3 Prueba de kolmogorov – smirnov


En estadística, la prueba de Kolmogórov-Smirnov (también prueba K-S) es una
prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos
distribuciones de probabilidad entre sí.

Mediante la prueba se compara la distribución acumulada de las frecuencias


teóricas (ft) con la distribución acumulada de las frecuencias observadas (fobs), se
encuentra el punto de divergencia máxima y se determina qué probabilidad existe
de que una diferencia de esa magnitud se deba al azar.

Pasos:

1. Calcular las frecuencias esperadas de la distribución teórica específica por


considerar para determinado número de clases, en un arreglo de rangos de menor
a mayor.

2. Arreglar estos valores teóricos en frecuencias acumuladas.

3. Arreglar acumulativamente las frecuencias observadas.

4. Aplicar la ecuación D = ft - f obs, donde D es la máxima discrepancia de ambas.


5. Comparar el valor estadístico D de Kolmogorov-Smirnov en la tabla de valores
críticos de D.

6. Decidir si se acepta o rechaza la hipótesis.


Ecuación:

En esta ecuación se aprecia que el procedimiento es muy simple y quizá lo que


parezca más complicado corresponde al cálculo de la frecuencia esperada de
cada tipo de distribución teórica. Por lo tanto, en la marcha de los ejercicios se
presentará cada uno de ellos y la manera de aplicar la prueba estadística.

Ejemplo: En una investigación, consistente en medir la talla de 100 niños de 5


años de edad, se desea saber si las observaciones provienen de una población
normal.
4.2.4 Prueba de Anderson- Darling

La prueba de Anderson-Darling es una prueba no paramétrica sobre si los datos


de una muestra provienen de una distribución específica. La fórmula para el
estadístico A determina si los datos vienen de una distribución con función
acumulativa F. La prueba de Anderson-Darling es una prueba estadística que
permite determinar si una muestra de datos se extrae de una distribución de
probabilidad. En su forma básica, la prueba asume que no existen parámetros a
estimar en la distribución que se está probando, en cuyo caso la prueba y su
conjunto de valores críticos siguen una distribución libre.

El estadístico de Anderson-Darling mide qué tan bien siguen los datos una
distribución específica. Para un conjunto de datos y una distribución específicos,
mientras mejor se ajuste la distribución a los datos, menor será este estadístico.
Por ejemplo, puede utilizar el estadístico de Anderson- Darling para determinar si
los datos cumplen el supuesto de normalidad para una prueba t.

Las hipótesis para la prueba de Anderson-Darling son:

H0: Los datos siguen una distribución especificada

H1: Los datos no siguen una distribución especificada

Utilice el valor p correspondiente (si está disponible) para probar si los datos
provienen de la distribución elegida. Si el valor p es menor que un nivel de
significancia elegido (por lo general 0.05 ó 0.10), entonces rechace la hipótesis
nula de que los datos provienen de esa distribución. Minitab no siempre muestra
un valor p para la prueba de Anderson-Darling, porque éste no existe
matemáticamente para ciertos casos.

También puede utilizar el estadístico de Anderson-Darling para comparar el ajuste


de varias distribuciones con el fin de determinar cuál es la mejor. Sin embargo,
para concluir que una distribución es la mejor, el estadístico de Anderson-Darling
debe ser sustancialmente menor que los demás. Cuando los estadísticos están
cercanos entre sí, se deben usar criterios adicionales, como gráficas de
probabilidad, para elegir entre ellos.
Ejemplo de comparación de distribuciones

Estas gráficas de probabilidad son para los mismos datos. Tanto la distribución
normal como la distribución de Weibull de 3 parámetros ofrecen un ajuste
adecuado a los datos.

Minitab calcula el estadístico de Anderson-Darling usando la distancia al cuadrado


ponderada entre la línea de ajustada de la gráfica de probabilidad (con base en la
distribución elegida y usando el método de estimación de máxima verosimilitud o
las estimaciones de mínimos cuadrados) y la función escalonada no paramétrica.
El cálculo se pondera más fuertemente en las colas de la distribución.

4.2.5 Prueba de Ryan-Joiner

Esta prueba evalúa la normalidad calculando la correlación entre los datos y las
puntuaciones normales de los datos. Si el coeficiente de correlación se encuentra
cerca de 1, es probable que la población sea normal. El estadístico de Ryan-Joiner
evalúa la fuerza de esta correlación; si se encuentra por debajo del valor crítico
apropiado, usted rechazará la hipótesis nula de normalidad en la población. Esta
prueba es similar a la prueba de normalidad de Shapiro-Wilk.

Ejemplo:

En el método de Anderson Darling o Ryan Joiner, si el valor de probabilidad Pde la


prueba es mayor a 0.05, se considera que los datos son normales. Seguir los
siguientes pasos:Generar 100 datos aleatorios en Minitab
4.2.6 Prueba de Shapiro-Wilk

En estadística, la prueba de Shapiro–Wilk se usa para contrastar la normalidad de


un conjunto de datos. Se plantea como hipótesis nula que una muestra x1, ..., xn
proviene de una población normalmente distribuida. Fue publicado en 1965 por
Samuel Shapiro y Martin Wilk. Se considera uno de los test más potentes para el
contraste de normalidad, sobre todo para muestras pequeñas (n<30).

Con los datos correspondientes a la variable Trans de la encuesta y con referencia


a los encuestados que viven en Barcelona, se quiere comprobar si su distribución
en cuanto al tipo de transporte utilizado se adapta a los resultados de un estudio
realizado por el Ayuntamiento de Barcelona, que son los siguientes: el 40% de los
desplazamientos al trabajo se realizan en metro; el 30% en autobús; el 20% en
transporte privado y 10% otros medios. La distribución de frecuencias de la
variable Trans es:

En este caso para realizar el contraste Chi-cuadrado es necesario definir las


cuatro categorías contempladas en la hipótesis nula. Para ello, se crea una nueva
variable, Trans2, a partir de Trans con las siguientes categorías: Metro, Bus,
Privado (que resultará de agregar Coche y Moto) y Otros (que agrupará Tren y
Otros).Una vez creada la nueva variable, con la secuencia Analizar > Pruebas no
paramétricas > Chi-cuadrado se llega al cuadro de diálogo en donde se selecciona
la variable Trans2 y se introduce en Valores esperados las frecuencias relativas de
cada categoría según la hipótesis nula correctamente ordenadas: 0,4 para la
categoría 1; 0,3 para la 2; 0,2 para la 3 y 0,10 para la 4. Al aceptar se obtienen los
siguientes resultados:
Como todas las categorías presentan frecuencia esperada mayor que 5 se puede
aplicar el contraste Chi-cuadrado sin modificar el número de categorías. El valor
del estadístico Chi-cuadrado permite rechazar la hipótesis nula para niveles de
significación superiores al 2,7%. Así pues, al 5% de significación se llega a la
conclusión de que la distribución del tipo de transporte que utilizan los alumnos no
se adapta a la publicada por el ayuntamiento.

Referencias:
 BECERRA C. (2015) Pruebas de bondad de ajuste,
https://es.slideshare.net/carlosbehe/pruebas-de-bondad-de-ajuste
 LOPEZ M. (2012) Unidad 5 estadistica 2,
https://es.slideshare.net/MariaLopezHernandez/unidad-5-estadistica-2
 ESCANDON A. (2016) Pruebas de bondad de ajuste y pruebas no
paramétricas, https://es.slideshare.net/jato90/pruebas-de-bondad-de-ajuste-
y-pruebas-no-parametricas

Potrebbero piacerti anche