Sei sulla pagina 1di 10

Prueba de bondad de ajuste

Prueba de bondad de ajuste

Bedoya Serrato Jhon Eduar, Rojas Bautista Luis Fernando, Seplveda Taborda
Juan David, Osorio Garca Carolain y Restrepo Pineda Lina Vanessa

Corporacin Universitaria Remington (Pereira,Colombia)

Resumen: La prueba de bondad de ajuste sirve


para medir o para estudiar que tan bien se ajusta la
distribucin de frecuencia de una muestra con la
distribucin de inters, si existe mucha diferencia
entre estas dos distribuciones la conclusin es que
la muestra de frecuencia no proviene de la
segunda distribucin de inters; caso contrario si
se parecen los perfiles la conclusin es que la
muestra si proviene de esta distribucin.
Palabras claves: distribucin, frecuencia, muestra
Summary: The goodness of fit test is used to
measure or to study how well the frequency
distribution of a sample with the distribution of
interest is adjusted, if there is much difference
between these two distributions the conclusion is
that the sample frequency does not come from the
second distribution; otherwise if the profiles
resemble the conclusion is that the sample if it
comes from this distribution.
Keywords: distribution, frequency, samples

Prueba de bondad de ajuste

Introduccin
Cuando se realizan investigaciones,
con frecuencia es importante obtener
informacin a travs de una muestra sobre la
forma como se distribuyen los datos de una

En otras palabras La bondad de ajuste es un


conjunto de datos donde se comparan las
Frecuencias Observadas con las frecuencias
esperadas tericamente;

poblacin.

Ho, la muestra proviene de la


distribucin de xx poblacin.

Algunos estudios producen resultados sobre


los que no podemos afirmar que se
distribuyen normalmente, es decir con forma
acampanada concentrados sobre la media.

Frecuencias Observada, Fo = F(x).

Frecuencias Esperadas; fe= f(x). Ha,


la muestra NO proviene de la
distribucin de xx poblacin

En estos casos debemos emplear tcnicas no


paramtricas que se utilizan ampliamente en
las aplicaciones de las ciencias sociales,

Pruebas chi-cuadrada
Como ya se ha visto varias veces, los

cuando no se puede asumir a priori que los

resultados obtenidos de muestras no siempre

datos de una muestra se ajusten a una

concuerdan exactamente con los resultados

normal.

tericos esperados, segn las reglas de


probabilidad. Por ejemplo, aunque
consideraciones tericas conduzcan a

Bondad de ajuste
Estas pruebas permiten verificar que
la poblacin de la cual proviene una muestra
tiene una distribucin especificada o

esperar 50 caras y 50 cruces cuando se lanza


100 veces una moneda bien hecha, es raro
que se obtengan exactamente estos
resultados.

supuesta. En la construccin del modelo de

Supngase que en una determinada muestra

simulacin es importante decidir si un

se observan una serie de posibles sucesos:

conjunto de datos se ajusta apropiadamente a


una distribucin especfica de probabilidad.

E1, E2, E3, . . . , EK, que ocurren con


frecuencias o1, o2, o3, . . ., oK, llamadas
frecuencias observadas y que, segn las

Prueba de bondad de ajuste

reglas de probabilidad, se espera que ocurran

solamente son posibles dos sucesos E1 y E2

con frecuencias e1, e2, e3, . . . ,eK llamadas

como, por ejemplo, caras o cruces,

frecuencias tericas o esperadas.

defectuoso, etc., el problema queda resuelto

A menudo se desea saber si las frecuencias


observadas difieren significativamente de las
frecuencias esperadas. Para el caso en que

Definicin de X2
Una medida de la discrepancia existente

satisfactoriamente con los mtodos de las


unidades anteriores. En esta unidad se
considera el problema general.

El nmero de grados de libertad

est

dado por:

entre las frecuencias observadas y esperadas


es suministrada por el estadstico X2, dado
por:

=k1m
en donde:
K = nmero de clasificaciones en el
problema.
m = nmero de parmetros estimados a

Donde si el total de frecuencias es N,

partir de los datos mustrales para obtener


los valores esperados.

Si X2 = 0, las frecuencias observadas y

Ensayo de Hiptesis

esperadas concuerdan exactamente, mientras


que si X2>0, no coinciden exactamente. A

En la prctica, las frecuencias esperadas se

valores mayores de X2, mayores son las

calculan de acuerdo con la hiptesis Ho. Si

discrepancias entre las frecuencias

bajo esta hiptesis el valor calculado de X2

observadas y esperadas.

dado es mayor que algn valor crtico, se


deduce que las frecuencias observadas

Si las frecuencias esperadas son al menos


iguales a 5, la aproximacin mejora para
valores superiores.

difieren significativamente de las esperadas


y se rechaza Ho al nivel de significacin
correspondiente. En caso contrario, no se

Prueba de bondad de ajuste

rechazar. Este procedimiento se llama


ensayo o prueba de chi-cuadrado de la

Solucin:

hiptesis.
Debe advertirse que en aquellas
circunstancias en que X2 est muy prxima
a cero debe mirarse con cierto recelo, puesto
que es raro que las frecuencias observadas
concuerden demasiado bien con las
esperadas. Para examinar tales situaciones,
se puede determinar si el valor calculado de
X2 es menor que las X2 crticas o de tabla
(ensayo unilateral izquierdo), en cuyos casos
se decide que la concordancia es bastante
buena.
Ejemplos:

Ensayo de Hiptesis:

Ho; Las frecuencias observadas y esperadas


son significativamente iguales

(dado bien hecho)

H1; Las frecuencias observadas y esperadas


son diferentes (dado cargado).

Primero se procede a calcular los valores


esperados. Como es bien sabido por todos la
probabilidad de que caiga cualquier nmero
en un dado no cargado es de 1/6. Como la

La siguiente tabla muestra las frecuencias

suma de los valores observados es de 120, se

observadas al lanzar un dado 120 veces.

multiplica este valor por 1/6 dando un

Ensayar la hiptesis de que el dado est bien

resultado de 20 para cada clasificacin.

hecho al nivel de significacin del 0.05.


Cara

Tabla#2: Tabla de frecuencia observada y


Tabla#1: tabla de frecuencia observada

frecuencia esperada.

Grados de libertad = k-1-m = 6-1-0 = 5

Prueba de bondad de ajuste

No se tuvo que calcular ningn parmetro

Regla de decisin:

para obtener las frecuencias esperadas.


Si X2R 11.1 no se rechaza Ho.
Si X2R >11.1 se rechaza Ho.
Distribucin Chi Cuadrado
Clculos:

Justificacin y decisin:

Como 5 es menor a 11.1 no se rechaza Ho y


se concluye con una significacin de 0.05
que el dado est bien hecho.

Tabla#3: Tabla chi cuadrado


Ventajas
-

Son accesibles a ser usadas con


muestras pequeas

No se necesita suposiciones
restrictivas de las pruebas
paramtricas.

Se usan con datos cualitativos


siendo fcil de comprender.

Desventajas
Grafica#1: Distribucin Chicuadrado

Prueba de bondad de ajuste

Muchas de las veces no son muy

en esta seccin la presentamos para un caso

eficientes como las pruebas

distinto al de la distribucin continua.

paramtricas.
-

Cuando usar esta prueba

Es posible que pierdan la


informacin o la ignoren muchas de

- La prueba de Kolmogorov puede usarse

las veces.

con muestras muy pequeas, en donde no se

Llevan a una mayor probabilidad de

pueden aplicar otras pruebas paramtricas.

no rechazar una hiptesis nula falsa.

- Podemos usar la prueba de Kolmogorov


para verificar la suposicin de normalidad

Caractersticas
1.

subyacente en todo anlisis de inferencia.

El valor de chi cuadrado nunca es

- Si bien constituye una prueba de

negativo ya que el valor entre las dos

implementacin sencilla, tenga en cuenta

frecuencias es eleva al cuadrado


2.

que carga con las desventajas de los mtodos

Existe una familia de distribuciones

no paramtricos en general, en el sentido de

de Chi cuadrado para cada grado de

producir resultados menos precisos que los

libertad, el valor no depender del

procedimientos convencionales.

tamao de la muestra sino del

3.

nmero de categoras.

- Cuando trabaje con muestras pequeas,

Tiene sesgo positivo; conforme

recuerde usar la frecuencia cumulada

aumenta el nmero de grados de

experimental.

libertad, la distribucin comienza a


aproximarse a la de tipo normal.
Ventajas:
Prueba de Kolmogorov Smirnov
Otra prueba para la bondad de ajuste

puesto que no requiere que los datos se

se apoya en la distribucin de Kolmogorov


Smirnov la que al ser desarrollada para
variables continuas la hace ms poderosa por
ejemplo, en el caso de los nmeros
aleatorios, que la Ji cuadrada. Por esta razn,

Es una prueba poderosa y fcil de utilizar,

agrupen de determinada manera.


-

Es particularmente til para juzgar qu tan


cerca est la distribucin de frecuencias
observada de la distribucin de frecuencias

Prueba de bondad de ajuste

esperada, porque la distribucin de

Para todo valor de probabilidad igual o

probabilidad Dn depende del tamao de

menor que 0.05, se acepta Ha y se rechaza

muestra n, pero es independiente de la

Ho.

distribucin de frecuencia esperada (Dn es

Zona de rechazo.

una estadstica de distribucin libre o

Para todo valor de probabilidad mayor que

desviacin absoluta mxima entre las

0.05, se acepta Ho y se rechaza Ha.

frecuencias observadas y tericas).


Tabla de 100 nios. Los valores X + s son
Ejemplo:

99.2 2.85.

En una investigacin, consistente en medir la


talla de 100 nios de 5 aos de edad, se
desea saber si las observaciones provienen
de una poblacin normal.

Eleccin de la prueba estadstica.


El modelo experimental tiene una muestra y
es factible un arreglo en el carcter ordinal o

Tabla#4: Tabla de 100 nios.

en los rangos de las series de clases. Vase:


Estadstica/Flujogramas/Flujograma 1
Aplicacin de la prueba estadstica.
Primero se elaboran los clculos de los
Planteamiento de la hiptesis.

valores tericos esperados para la


distribucin normal.

Hiptesis alterna (Ha). Los valores

Inicialmente se determina el valor Z de los

observados de las frecuencias para cada

lmites de cada clase en la serie, por

clase son diferentes de las frecuencias

ejemplo: en la primera clase se determinan el

tericas de una distribucin normal.

lmite inferior y el superior (90 y 93), y en

Hiptesis nula (Ho). Las diferencias entre

las subsecuentes slo los lmites superiores

los valores observados y los tericos de la

(97, 101, 105 y 109). Para cada valor de Z,

distribucin normal se deben al azar.

se localiza el rea bajo la curva norma

Nivel de significacin.

tipificada. (Vase: tabla de reas bajo la

Prueba de bondad de ajuste

curva normal tipificada de 0 a 2).

Clculos de los valores tericos.

Los clculos de valores Z, son de la forma


siguiente:

Tabla#5: Clculos de los valores teoricos

Las frecuencias acumuladas tericas y las


Y as sucesivamente.

observadas se arreglan

Para cada valor Z, se localiza el rea de la


curva tipificada de la tabla de nmeros

En los rangos correspondientes, como se

aleatorios. A partir de estos valores, se

muestra en la siguiente tabla, y

obtiene la diferencia entre los lmites de

posteriormente se aplica la frmula de

clases entre el superior y el inferior, por

Kolmogorov-Smirnov.

ejemplo: 0.4997 - 0.4793 = 0.020, 0.4793 0.2357 = 0.2436, 0.2357 - (-0.2794) =


0.5151, -0.2794 - (-0.4854) = 0.206 y -

Clculo estadstico D de KolmogorovSmirnov.

0.4854 - (-0.4994) = 0.014.


Estos resultados de diferencias se
multiplican por el tamao de la muestra (100
nios), luego se obtienen las frecuencias
tericas y despus se arreglan en frecuencias
acumuladas.
Tabla#6: Calculo estadstico.

Prueba de bondad de ajuste

D = ft - fobs = - 0.036
La diferencia mxima D es igual a -0.049,

calcularlo tiene una probabilidad menor que

valor que se compara con los valores crticos

0.05, o sea, es inversamente proporcional al

de D en la prueba maestral de Kolmogorov-

crtico determinado o localizado en la tabla.

Smirnov y se obtiene la probabilidad de la


existencia de esa magnitud de acuerdo con la

Decisin.

prueba de Kolmogorov-Smirnov. El valor N

En virtud de lo anterior, el estadstico de

es 100 y el mayor nmero de N en la tabla es

Kolmogorov-Smirnov obtenido es menor

35, por lo cual se aplica la frmula al pie de

que el crtico y su probabilidad mayor que

la tabla:

0.05, por lo tanto, se acepta Ho y se rechaza

Para la probabilidad de

Ha.
Interpretacin.
Las frecuencias observadas y las tericas

Lo anterior quiere decir que para todo valor

calculadas no difieren significativamente.

menor que el crtico para una probabilidad

Por lo tanto, las observaciones tienen una

de 0.05, la probabilidad correspondiente es

distribucin normal.

mayor que 0.05, y todo valor mayor que D al

Prueba de bondad de ajuste

REFERENCIAS BIBLIOGRFICAS
http://www.sites.upiicsa.ipn.mx/polilibros/portal/Polilibros/P_terminados/SimSist/doc/SIMULA
CI-N-128.htm
http://simulacion2011.blogspot.com.co/2011/02/pruebas-de-bondad-de-ajuste.html
http://www.monografias.com/trabajos30/inferencia-estadistica/inferencia-estadistica.shtml
http://simulacion-de-procesos.blogspot.com.co/2011/02/desventajas-de-la-experimentacion.html
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap04.html
http://www.raydesign.com.mx/psicoparaest/index.php?option=com_content&view=article&id=247:pruebakolmogorov&catid=53:pruebasnopara&Itemid=62
http://es.slideshare.net/mib/prueba-de-la-bondad-del-ajuste