Sei sulla pagina 1di 14

HIDRAULICA

INTRODUCCION

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

En la determinación de valores extremos (caudales máximos o mínimos, niveles


máximos o mínimos, etc.) necesarios para el análisis y solución de muchos
problemas relacionados con la ingeniería hidráulica, resulta común emplear las
distribuciones probabilísticas más usuales para el estudio de problemas
hidrológicos. Así, a partir de un registro histórico de valores extremos, se infiere
aquellos valores máximos o mínimos asociados a un cierto período de retorno de
diseño.
Es relativamente común apreciar estudios en los cuales, a partir de una data
histórica de valores extremos, se haya hecho uso de distribuciones tales como:
Gumbel, Normal o Log Pearson tipo III, para estimar los valores extremos asociados
a un periodo de retorno seleccionado. En menor medida se observará el empleo
de distribuciones tales como: log normal de 2 parámetros, log normal de 3
parámetros o la distribución gamma de 2 ó de 3 parámetros.
En este sentido cabería preguntarse: ¿qué ha llevado al especialista a seleccionar
una determinada distribución probabilística para el análisis efectuado? ¿se ha
verificado que la distribución escogida sea la que efectivamente mejor se ajusta o
representa a la serie histórica de datos? ¿cuál de las distribuciones disponibles
debió haberse empleado en verdad en la estimación requerida de valores
extremos? Estas preguntas nos conducen a la necesidad de revisar los temas
relacionados con las pruebas de bondad de ajuste.

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

DEFINICIONES
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos
disponibles se ajustan a una determinada distribución. Se entiende por bondad
de ajuste a la asimilación de los datos observados de una variable a una
función matemática previamente establecida y reconocida. A través de ésta es
posible entonces predecir el comportamiento de la variable en estudio (Pizarro,
1986).
Entre las pruebas de bondad de ajuste más conocidas, cabe mencionar las
siguientes:

Prueba de Chi Cuadrado

Prueba de Kolmogorov Smirnov

Prueba de Anderson Darling

PRUEBA DE CHI CUADRADO


La prueba de Chi Cuadrado se basa en la comparación entre la frecuencia
observada en un intervalo de clase y la frecuencia esperada en dicho intervalo,
calculada de acuerdo con la distribución teórica considerada. Es decir, se trata
de determinar si las frecuencias observadas en la muestra están lo
suficientemente cerca de las frecuencias esperadas bajo la hipótesis nula
formulada.
Para aplicar esta prueba se debe agrupar las observaciones de la muestra en
intervalos de clase, preferiblemente del mismo tamaño.

Valor del estadístico Chi-cuadrado calculado


2
El estadístico de prueba, X C queda definido por la expresión:

donde:
 O :frecuencia observada en el intervalo i, de acuerdo a la muestra
i
considerada

 E : frecuencia esperada en el intervalo i, de acuerdo a la distribución


i

seleccionada
 k: número de intervalos de clase en que se han agrupado las
observaciones

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

Valor tabular de Chi-cuadrado


2
El valor tabular del estadístico Chi-cuadrado, X t, determina a partir del
cuadro siguiente, en función de los grados de libertad y del nivel de t ,
significación elegido, esto es, la probabilidad de exceder el valor extremo.

PRUEBA DE CHI CUADRADO

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

Los grados de libertad se determinan con la expresión:


g.l. = k – 1 – p grados de libertad, donde k es el número de intervalos de clase
y p es el número de parámetros que definen completamente a la distribución
seleccionada.
El nivel de significación, α, usualmente es 5% o 1%

Criterio de Decisión
El criterio de decisión se fundamenta en la comparación del valor calculado de
Chi-cuadrado con el valor tabular encontrado, esto es:

Si el estadístico Chi-cuadrado calculado es menor o igual que el valor tabular,


t
2 2
es decir: X C ≤ X t entonces, se acepta la hipótesis nula, que establece

que los valores observados se ajustan a la distribución considerada, al nivel de

significación seleccionado (usualmente α= 5% o 1%) siendo necesario probar

con otra distribución teórica.

Comentarios
Algunas consideraciones que hay que tener en cuenta con respecto a la
aplicación de esta prueba son las siguientes:

 El análisis debe efectuarse con datos agrupados en intervalos de clase.

 El número de intervalos de clase debe ser por lo menos 5. Se


recomienda también que, para facilidad de los cálculos, el número de
intervalos de clase no sea mayor a 20.

 El número de observaciones esperado (frecuencia observada) en cada


intervalo de clase debe ser por lo menos 5. Si esta condición no se
cumple, es necesario agrupar en uno los resultados de varios intervalos
de clase.
 Al efectuar los cálculos de las frecuencias esperadas, debe
considerarse los intervalos extremos como casos especiales. Así:
 En el primer intervalo, que incluye aquellos valores observados
entre x y x , la probabilidad a considerar debe ser la
0 1
correspondiente a que la variable aleatoria sea menor o igual que
x (no solo comprendida entre x y x )
1 0 1
 En el último intervalo, que incluye aquellos valores observados
entre x y x , la probabilidad a considerar debe ser la
k-1 k
correspondiente a que la variable aleatoria sea mayor que x
k-1

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

(no solo comprendida entre x y x ).


k-1 k

APLICACIÓN DE LA PRUEBA DE CHI CUADRADO


Operativamente, para aplicar en un caso práctico la prueba de chi-cuadrado
debe seguirse el siguiente procedimiento:

 Determinar el Número de Intervalos de Clase


El número de intervalos de clase se calcula con la fórmula propuesta por
Yevjevich:
NC = 1 + 1.33 ln(N)

donde:
NC - número de intervalos de clase
N - número de datos

 Calcular la Amplitud de cada Intervalo


La amplitud de cada intervalo se determina con la ecuación:

El límite inferior del primer intervalo de clase se determina con la relación:

Límite inferior = Xmin - X/2

 Calcular los Intervalos de Clase, Marcas de Clase, Frecuencias

Absolutas y Relativa Observadas y Frecuencia Acumulada


La frecuencia absoluta observada corresponde al número de valores
comprendido en el intervalo de clase. La suma de todas las frecuencias
absolutas debe ser igual al total de datos, N.
La frecuencia relativa se obtiene de dividir la frecuencia absoluta entre el
número de datos, N
La frecuencia acumulada resulta de acumular los valores correspondientes a
la frecuencia relativa. La frecuencia acumulada en el último intervalo de clase
debe dar 1.

 Calcular la Media y Desviación Estándar para los Datos Agrupados


La media y la desviación estándar de los datos agrupados se determina
mediante las siguientes relaciones:

donde:
 f – frecuencia absoluta
i

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

 x – marca de clase
i
 k – número de intervalos de clase
 N – número total de datos

 Adoptar alguna distribución probabilística y determinar la frecuencia


esperada para cada intervalo de clase

 Calcular los estadísticos Chi Cuadrado y aplicar el criterio de


decisión
2
 El estadístico de prueba, X C se calcula con la expresión:

2
 El estadístico tabular X t se determina en la tabla de Chi Cuadrado
en función de los grados de libertad y del nivel de significancia
seleccionado

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

2 2
 Finalmente, si X C ≤ X t se acepta la hipótesis nula que afirma
que la serie de datos se ajusta a la distribución seleccionada
2 2
Si X C > Xt se rechaza la hipótesis nula y se afirma que la serie
de datos no se ajusta a la distribución seleccionada.

CASO PRACTICO DE CHI CUADRADO

CASO PRACTICO DE CHI CUADRADO


HIDRAULICA

CASO PRACTICO DE CHI CUADRADO

CASO PRACTICO DE CHI CUADRADO

PRUEBA DE AJUSTE DE BONDAD


HIDRAULICA

PRUEBA DE KOLMOGOROV SMIRNOV


Este procedimiento es un test no paramétrico que permite establecer si dos
muestras se ajustan al mismo modelo probabilístico (Varas y Bois, 1998).
Es un test válido para distribuciones continuas y sirve tanto para muestras
grandes como para muestras pequeñas (Pizarro et al, 1986).
Así mismo, Pizarro (1988), hace referencia a que, como parte de la aplicación
de este test, es necesario determinar la frecuencia observada acumulada y la
frecuencia teórica acumulada; una vez determinadas ambas frecuencias, se
obtiene el máximo de las diferencias entre ambas.
El estadístico Kolmogorov-Smirnov, D, considera la desviación de la función de
distribución de probabilidades de la muestra P(x) de la función de
probabilidades teórica, escogida Po(x) tal que:

Dn = max |P(x) – Po(x) |

La prueba requiere que el valor Dn calculado con la expresión anterior sea


menor que el valor tabulado Dα para un nivel de significancia (o nivel de
probabilidad) requerido. El valor crítico Dα de la prueba se obtiene de la tabla
mostrada, en función del nivel de significancia α y el tamaño de la muestra n.

Tabla de
valores de D
en función del
nivel de
significancia y
del tamaño de
la muestra

PRUEBA DE AJUSTE DE BONDAD


HIDRAULICA

El procedimiento a seguir en la aplicación práctica de la prueba de


Kolmogorov-Smirnov es el siguiente:

 Determinar la frecuencia observada acumulada y la Frecuencia téorica

acumulada, Po(x) y P(x).

 En cada caso, calcular: Dn = max |P(x) – Po(x) |

Así, Dn es la máxima diferencia entre la función de distribución

acumulada de la muestra y la función de distribución acumulada teórica

escogida

 Fijar un nivel de probabilidad o de significancia α . Los valores de

0.05 y 0.01 son los más usuales.

 Determinar el valor crítico Dα en la tabla correspondiente.

 Aplica el criterio de decisión:


 Si el valor calculado Dn es menor que el Dα, se acepta la
hipótesis nula (Ho) que establece que la serie de datos se ajusta a
la distribución teórica escogida.
 Si el valor calculado Dn es mayor que el Dα, se rechaza la
hipótesis nula (Ho) y se acepta la hipótesis alternativa (Ha) que
establece que la serie de datos no se ajusta a la distribución teórica
escogida.

EJEMPLO PRUEBA DE
KOLMOGOROV
SMIRNOV

PRUEBA DE AJUSTE DE BONDAD


HIDRAULICA

SMIRNOV
KOLMOGOROV
EJEMPLO PRUEBA DE
PRUEBA DE ANDERSON - DARLING
Esta prueba no paramétrica es una modificación del test de Kolmogorov-
Smirnov, donde se les da más peso a las colas de la distribución que la prueba
de K-S.
2
Fórmula: A = − N− S
El estadístico para la prueba de Anderson-Darling es:

donde:
PRUEBAS DE BONDAD DE AJUSTE
HIDRAULICA

 n - es el número de datos
 F(x) - es la función e distribución de probabilidad teórica
 Fn(x) - es la función de distribución empírica
Para definir la regla de rechazo para esta prueba es necesario obtener el
estadístico ajustado para luego compararlo con los valores críticos de la tabla
de Anderson- Darling.
La tabla siguiente muestra los valores críticos para distintas distribuciones con
parámetros conocidos.

Una vez obtenido el estadístico ajustado, la regla de rechazo se realiza de


manera análoga a la prueba de Kolmogorov-Smirnov.
2
Si A es mayor o igual que a , se acepta la hipótesis nula; siendo a el valor
n o o
2
asociado al estadístico de prueba A
n

PRUEBAS DE BONDAD DE AJUSTE


HIDRAULICA

CONCLUSIONES

¿En que casos es recomendable cada estadístico?


 Chi-Cuadrado: es recomendable para distribuciones discretas o
continuas cuando existe gran cantidad de datos. Se recomienda trabajar con
datos agrupados.
 Kolmogorov-Smirnov (K-S): es recommendable para distribuciones
continuas y muestras de cualquier tamaño. No requiere hacer uso de datos
agrupados.
 Anderson-Darling: es recomendable para distribuciones con colas
pronunciadas. No requiere hacer uso de datos agrupados.

PRUEBAS DE BONDAD DE AJUSTE

Potrebbero piacerti anche