Sei sulla pagina 1di 70

Captulo 5 REVISIN DE CONCEPTOS DE ESTADSTICA Y PROBABILIDAD

73

La planeacin y el diseo de proyectos relacionados con el agua necesitan informacin de diferentes eventos hidrolgicos que no son gobernados por leyes fsicas y qumicas conocidas, sino por las leyes de azar. Por ejemplo, el caudal de un ro vara da a da y ao tras ao, y no puede predecirse exactamente cual ser su valor en un perodo de tiempo cualquiera. En el caso del diseo de un puente, el estudio hidrolgico determinara la creciente asociada con una probabilidad crtica(se busca determinar el caso crtico), la cual se supone representa el riesgo para el puente. Esto solo puede determinarse a travs del anlisis probabilstico y estadstico basado en los registros hidrolgicos del pasado. Es dable afirmar que la hidrologa, en algunos casos, trata con variables aleatorias cuyo comportamiento no puede predecirse con certidumbre. El comportamiento de una variable aleatoria est descrito por una ley de probabilidades, la cual asigna medidas de probabilidad a posibles valores o rangos de ocurrencia de la variable aleatoria. Las variables aleatorias pueden ser discretas o continuas. Se dice que una variable aleatoria es discreta si ella slo puede tomar valores especficos. Por ejemplo, si N denota el nmero de das lluviosos en el mes de diciembre, entonces N es una variable aleatoria discreta. En este caso, la ley de probabilidades asocia medidas de probabilidad a cada posible ocurrencia de la variable aleatoria.
U U

Una variable aleatoria es continua si puede tomar todos los valores en un rango de ocurrencia. Por ejemplo, si Q es una variable aleatoria que denota el valor de los caudales promedios diarios del ro Magdalena, entonces Q
U U

74

puede asumir cualquier valor y es entonces una variable aleatoria continua En este caso la ley de probabilidades asigna medidas de probabilidad a rangos de ocurrencia de la variable aleatoria. En el anlisis probabilstico y estadstico en hidrologa, se asume que la informacin histrica disponible de una variable hidrolgica representa una muestra tomada de una poblacin cuyas caractersticas se desconocen. En el anlisis probabilstico se analizan posibles leyes de probabilidad que pueden describir el comportamiento de las variables de la poblacin. En el anlisis estadstico, se hacen inferencias sobre la variable (la poblacin), usando la muestra. Por ejemplo, cuando se calcula una media con observaciones disponibles, se est infiriendo que la media calculada es la media de la poblacin, lo cual no necesariamente es verdad, pues esto depender de la calidad de la informacin, del nmero de observaciones y otros aspectos. El hecho es que muchos fenmenos hidrolgicos son errticos, complejos y de naturaleza aleatoria, y solo pueden ser interpretados en un sentido probabilstico. Uno de los problemas ms importantes en hidrologa es la interpretacin de registros de eventos pasados para inferir la ley de probabilidades de la variable hidrolgica (poblacin) de inters, procedimiento que en hidrologa se conoce con el nombre de anlisis de frecuencia. Por ejemplo supngase que se tienen registros del caudal del ro Magdalena durante un perodo de 50 aos. Son factibles dos tipos de anlisis: descriptivo y de inferencia. El primero se realiza sin ninguna referencia a su poblacin, de la cual se tiene una muestra de 50 aos. Consiste, bsicamente, en calcular propiedades estadsticas, como media, varianza y otras. En el segundo, la muestra se analiza para inferir las propiedades de su poblacin, lo cual ayudar a derivar las caractersticas probabilsticas del caudal. El primero es una aplicacin de los mtodos estadsticos que

75

requieren poca decisin y poco riesgo. El segundo involucra riesgos y requiere una total comprensin de los mtodos empleados y el peligro involucrado en la prediccin y estimacin de las variables. Los objetivos bsicos de la estadstica en la hidrologa son entre otros: 1) 2) 3) 4) 5) Interpretacin de las observaciones Anlisis de la calidad de la informacin Inferencia sobre el comportamiento de la variable Extraccin del mximo de informacin de los registros Presentacin de la informacin en grficas, tablas, ecuaciones, que bsicamente ayudan a la toma de decisiones en el planeamiento de los recursos hdricos.

En resumen, el objetivo principal de la estadstica en hidrologa es obtener informacin de los fenmenos hidrolgicos pasados y hacer inferencias acerca de su comportamiento en el futuro.

5.1 CONCEPTOS BSICOS 5.1.1 Concepto de probabilidad. La probabilidad de ocurrencia de un evento dado es igual a la relacin entre el nmero de sucesos favorables m y el nmero de sucesos totales, n:
P( X = x ) = m n

(5.1)

La teora de la probabilidad se basa en los siguientes axiomas:

76

1)

La probabilidad de ocurrencia de un evento, Pi, siempre tiene un valor entre 0 y 1, as:


B B

0 Pi 1 . La probabilidad de un evento cierto es 1:

(5.2)

P
i =1
B B B B

=1

(5.3)

2) Si X1 y X2 son eventos independientes y mutuamente excluyentes, entonces:

P ( X 1 X 2 ) = P( X 1 ) + P( X 2 )

(5.4)

Dos eventos son independientes si la probabilidad de ocurrencia de uno no se ve afectada por la ocurrencia del otro,. y se dice que son mutuamente excluyentes cuando la ocurrencia de uno imposibilita la ocurrencia del otro. Los axiomas anteriores permiten la definicin de conceptos importantes. Por ejemplo, si dos eventos X1 y X2 no son mutuamente excluyentes, la probablidad de que ocurra X1 u ocurra X2 est dada as:
B B B B B B B B

P ( X1 X 2 ) = P ( X1 ) + P ( X 2 ) P ( X1 X 2 )

(5.5)

La P( X 1 X 2 ) es llamada unin de probabilidades y se lee la probabilidad de X1 o X2.


B B B

77

La probabilidad de que dos eventos independientes ocurran de manera simultnea es el producto de las probabilidades individuales as:

P ( X1 X 2 ) = P ( X1 ) P ( X 2 )

(5.6)

La P( X 1 X 2 ) es llamada la probabilidad de interseccin y se lee la probabilidad de X1 y X2.


B B B B

La probabilidad de que ocurra un evento X1 dado que ha ocurrido X2 se llama probabilidad condicional y se denota as:
B B B B

P(

X1

X2

) = P(

X1 X 2 ) P( X 2 )

(5.7)

Ejemplo 5.1 Supngase que el ro Cauca alcanza cada invierno un nivel de creciente con una frecuencia relativa de 0.2. En el Cauca hay un puente cuya probabilidad de falla en los estribos es 0,3 y la experiencia muestra que cuando hay creciente, las probabilidades de esta falla suben a 0,5. Las probabilidades son: P(creciente) = P(C) = 0,2 P(no creciente) = P(C) = 0,8 P(falla) = P(F) = 0,3 P(no falla) = P(F) = 0,7 P (falla dada creciente) = P(F/C)= 0,5 Se desea conocer la probabilidad de falla del puente. Solucin: El puente falla (queda inutilizado) cuando falla en los estribos o cuando hay creciente; esto se puede denotar as:

78

P( C F ) = P( C ) + P( F ) P( C F )

Aplicando la ecuacin 5.7 de probabilidad condicional: P ( C F ) = P( C ) P ( F ) C Reemplazando valores, se obtiene:


P ( C F ) = 0. 2 . 0 . 5 = 0. 1 Al reemplazar este valor en la expresin de unin de probabilidades, se concluye finalmente que P(CF)=0.4

5.1.2

Perodo de retorno:
B B

Se define el perodo de retorno, Tr, de un evento de cierta magnitud como el tiempo promedio que transcurre entre la ocurrencia de ese evento y la prxima ocurrencia de ese evento con la misma magnitud. Se define tambin como el tiempo que transcurre para que un evento sea excedido o igualado, al menos una vez en promedio. Si P es la probabilidad de excedencia, se puede demostrar matemticamente que: 1 (5.8) Tr = P Por ejemplo, si un caudal de 8098 m3/s es excedido en promedio una vez cada 10000 aos, entonces su perodo de retorno, Tr, es de 10000 aos.
P P B B

5.1.3

Concepto de riesgo.

En el diseo de obras hidrulicas expuestas a grandes avenidas, es necesario considerar el riesgo asociado con el valor seleccionado para el diseo. Por lo comn, el ingeniero disea una obra para resistir una avenida de cierta magnitud. Se define el riesgo R de un diseo como la probabilidad de que la avenida para la cual se disea la obra sea excedida. Se entiende que sta es

79

una situacin de riesgo, pues la obra se disea para soportar cierta avenida mxima , y crecientes mayores le podran hacer dao o incluso destruirla. El riego R puede entonces escribirse como: 1 n R = 1 - (1 - ) (5.9) Tr La confiabilidad se define como el complemento del riesgo (Confiabilidad = 1-R). Se quiere que la obra tenga un riesgo pequeo de daarse o, lo que es lo mismo, una alta confiabilidad. Ejemplo 5.2 Qu perodo de retorno debe escoger un ingeniero en el diseo de un box-culvert, si se acepta solo el 10% de riesgo de avenida en una vida til, n, de 25 aos? Solucin: Aplicando la ecuacin 5.9 se tiene: R = 0.1 = 1 - (1 1 Tr )
25
T

Reemplazando los valores de Tr y n se obtiene:


B B

TR = 238 aos
B B

Ejemplo 5.3 Una presa por gravedad puede fallar por deslizamiento (A), por crecientes (B), o por ambas. Asumir que : 1) La probabilidad de falla por deslizamiento es dos veces la probabilidad de falla por creciente: P(A)=2 P(B)

80

2) La probabilidad de falla por deslizamiento, dado que ha habido creciente, es 0.8 3) La probabilidad de falla de la presa es de 1*10-3
P

Determinar la probabilidad de que ocurra un deslizamiento, P(A). Solucin: La presa queda inutilizada cuando se presenta una falla por deslizamiento o cuando hay una creciente, lo que puede expresarse como:
P( A B ) = 0.001 = P( A ) + P( B ) P( A B )

(1)

Se tiene adems que: P(A) = 2 P(B) Reemplazando la (2) en la (1):


0.001 = 3P( B ) P( A B )

(2)

(3)

Se sabe que: P( A B ) = 0.8 = P( AB ) P( B ) (4)

Resolviendo simultneamente la (3) y la (4), se obtiene: P(A) = 9.1 * 10-4


P

81

Ejemplo 5.4 De 1000 circuitos de tubera de acueducto en una ciudad, se reportan 15 contaminados con materias fecales; 5 tienen excesivas concentraciones de plomo (Pb) y entre stos dos de ellos contaminados tambin por materias fecales. Se pregunta:
B B

a) b)

c)
d)

Cul es la probabilidad de que un sistema seleccionado al azar resulte con contaminacin fecal? Suponiendo que un sistema se encuentre contaminado con materias fecales, cul es la probabilidad de que tambin est contaminado con plomo? Cul es la probabilidad de que un sistema seleccionado al azar est contaminado? Suponiendo que la probabilidad de contaminacin hallada en el numeral anterior no es satisfactoria, y que se desea que no exceda de 0.01, cul es el valor permisible para la probabilidad de contaminacin por materias fecales, asumiendo que el valor de la probabilidad condicional hallada en el numeral b an se puede aplicar?

Solucin: Llamemos P(F) a la probabilidad de contaminacin por materia fecal, P(Pb) a la probabilidad de contaminacin por plomo y P(C) a la probabilidad de contaminacin por plomo o por materia fecal. Se tiene entonces:
B B

a) P(F) = 17/1000 b) La probabilidad condicional P(Pb/F) puede expresarse como:


B B

P( Pb / F ) =

P(Pb F) P(F)

82

y P(Pb) = 5/1000. Reemplazando, se obtiene que: P(PBI/F) = 2/17


B B

c)Se pregunta en este numeral el valor de P(C); este valor establece la probabilidad de que un circuito est contaminado con plomo o con materias fecales. Como hay 15 circuitos contaminados con materias fecales y 5 contaminados con plomo, se tiene entonces que: P(C) = 20/1000= 0.002 d) La probabilidad de contaminacin C se puede expresar como: P( C) = P( F Pb ) P( F ) + P( B ) P( F Pb ) y se conoce el valor de la probabilidad condicional:
P( Pb / F ) = 2 / 17 = P( Pb F ) P( F )

(1)

(2)

Resolviendo la (1) y la (2) simultneamente se halla que: P(F) = 0.00567

5.2 DISTRIBUCIONES DE FUNCIONES DE PROBABILIDADES EN HIDROLOGIA

Tal como se haba mencionado anteriormente, el comportamiento de las variables aleatorias discretas o continuas se describe con la ley de probabilidades asociada, que asigna medidas de probabilidad a ocurrencias o a rangos de ocurrencia de la variable. Estas leyes de probabilidad reciben el nombre de funciones de distribuciones de probabilidad. Como notacin, se representa por una letra mayscula la variable aleatoria, y por una letra minscula, un valor especfico, una relacin o una muestra de la variable.
U U U U U U

P(X = a) indica la probabilidad de que la variable aleatoria X tenga un valor de a; similarmente, P(a<X<b) indica la probabilidad que la variable

83

aleatoria X est en el intervalo [a, b] .Si se conoce la probabilidad P(a<X<b) para todos los posibles valores de a y b, se dice que se conoce la distribucin de probabilidades de la variable X. Si se tiene una muestra cuyas observaciones se asumen extradas de una misma poblacin (idnticamente distribuidas), ellas pueden presentarse como un histograma de frecuencias. Todo el rango disponible de la variable aleatoria se divide en intervalos discretos; se cuenta el nmero de observaciones que cae en cada intervalo, y el resultado se dibuja en un diagrama de barras como el mostrado en la Figura 3.1, que representa la precipitacin promedio anual en una estacin.
U U U U U U

FIGURA 5.1 Histograma de frecuencias. Supngase que se tiene una variable continua y el ancho x del intervalo que se usa para el histograma se escoge tan pequeo como sea posible; supngase igualmente que se tiene el suficiente nmero de observaciones en cada intervalo, para que el histograma de frecuencia muestre variaciones suaves en todo el rango de valores. Si el nmero de observaciones ni en el intervalo i que cubre el rango [xi-x, xi] se divide por el nmero total de observaciones, N, el resultado se denomina funcin de frecuencia relativa fs (x):
B B B B B B U U U U U U U U B B

84

f s ( xi ) =
B B

ni n
B B

(5.10)

la cual es un estimado de P( xi -x<X<xi), la probabilidad de que la variable aleatoria X caiga en el intervalo [xi -x, xi]. El subndice s indica que la funcin es calculada de los datos muestrales.
B B B B

La suma de los valores de las frecuencias relativas en un punto es la funcin de frecuencia acumulada, Fs(x),dada como:
U U U U U U U U U

F S ( x i ) = f S ( x j)
j =1

(5.11)

Este es un estimado de P(X xi), la probabilidad acumulada de xi, o funcin acumulada de probabilidades.
B B B B

Las funciones de frecuencia relativa y frecuencia acumulada se definen para una muestra. Las funciones correspondientes a la poblacin se obtienen en el lmite cuando n: y x 0. En el lmite, la funcin de frecuencia relativa dividida por el intervalo x, se convierte en la funcin de densidad de probabilidades fX(x)
U U U U U U U U U U U U B B

(x) f X (x) = lim f S n x x 0


U U U U U

(5.12)
U

La funcin de frecuencia acumulada se convierte en la funcin acumulada de distribucin de probabilidades FX(x)


U U U U U U U U B B

FX (x) = lim FS (x)


n x 0

(5.13)

85

cuya derivada es la funcin de densidad de probabilidad:


dFX (x) dx

f X (x) =

(5.14)

Para un valor dado de la variable aleatoria X, Fx(x) es la probabilidad acumulada P(X x), y puede expresarse como la integral de la funcin de densidad para el rango X x.
B B

P(X x) = FX (x) =

(u)du

(5.15)

en donde u es una variable de integracin. Si se tiene la funcin de distribucin acumulada para una variable X y se tiene un valor xA de esa variable, (ver Figura 5.2) se cumple que:
B B

FX (xA ) = P (X x A )

(5.16)

Una forma bastante usada en hidrologa para escribir el valor de una variable hidrolgica asociada a cierto perodo de retorno es la de utilizar lo que se conoce como factor de frecuencia, K. En este caso, el valor de la variable se puede escribir como:
X A = + K

(5.17)

86

Donde representa la media y es la desviacin tpica de la variable hidrolgica. XT es el valor de la variable aleatoria asociada a un perodo de retorno T. Como se sabe:
B B

FX (X T ) = P (X XT )

= 1 - P (X > XT )

P(XXT ) representa la probabilidad de excedencia, la cual est relacionada con el perodo de retorno como:
B B

P( X X T ) =

1 T

(5.18)

1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 1 2 3 4 5 x 6 7 8 9 10

FX(x)

FIGURA 5.2 Distribucin acumulada

De donde:
FX ( X T ) = 1 1 T

87

O:
FX ( + K ) = 1 1 T

Y se obtiene finalmente:
K= 1 1 1 FX 1 T

FX-1 ( ) representa el inverso de la distribucin acumulada de probabilidades. Por ejemplo, para obtener FX-1 (1 - 1/T), se entra al grfico 5.2 con el valor de 1-1/T al eje de probabilidades, y se lee en el otro eje el valor del inverso de la distribucin acumulada de probabilidades. Lo que significa que el factor de frecuencia es funcin de la distribucin de probabilidades y del perodo de retorno que se escoja.
B PB P B PB P

La funcin de densidad de probabilidades tiene las siguientes caractersticas cuando la variable aleatoria es continua: 1)

(x)dx = 1

(5.19)

2)

P(a X b) = f X (x)dx
a

(5.20)

3)

f X (x)dx = 0
b

(5.21)

Cuando la variable aleatoria es discreta las anteriores propiedades se pueden denotar as:

88

1)

f (x ) = 1
i i

(5.22)

2)
P( a X b ) =
xi b xi a

f (x )
i

(5.23)

3)

P( X x j ) = f ( x i )
i =1

i= j

(5.24)

Lo que implica que las probabilidades se definen solo como reas bajo la funcin de densidad de probabilidades, FDP, entre lmites finitos. Ejemplo 5.5 Hallar la funcin de distribucin acumulada para una variable aleatoria que se define como el nmero de veces que se lanza una moneda, hasta que aparece cara. Solucin: La probabilidad de que caiga cara en cualquier ensayo es y es independiente de la probabilidad de que caiga sello. Si A es el evento de que caiga sello en el primer ensayo y B (es el evento) de que caiga sello en el segundo ensayo, la probabilidad que suceda A y B es:

89

P(AB) = P(A) + P(B) = (1/2)2


P P

Si hay x-1 ensayos, la probabilidad de que caiga sello en el ensayo (x-1) es (1/2)x-1 y la probabilidad de cara en el x-avo ensayo es:
P P

(1/2)x-1 = (1/2)x
P P P P

se tiene entonces que: x 1 2 3 P(X=x) 1/8 Fx(x)


B B

7/8

en donde x es el nmero de ensayos, P(X=x) es la probabilidad de ocurrencia de sello en todos los ensayos y FX(x) es la funcin de probabilidades acumulada.
B B

5.3 MOMENTOS DE LAS DISTRIBUCIONES

Las propiedades matemticas de las distribuciones estadsticas pueden ser definidas en trminos de los momentos de la distribucin. Los momentos representan parmetros que tienen significado fsico o geomtrico. Se reconocer fcilmente la analoga entre los momentos estadsticos y los momentos de rea estudiados en mecnica de slidos. El r-avo momento con relacin al origen se define como:

r =

f X (x)dx

(5.25)

90

o en el caso discreto:

r = xr f X ( xi ) i
i =1

(5.26)

El subndice se usa para momentos respecto al origen. El primer momento con respecto al origen representa la media de la distribucin. Los momentos pueden definirse con respecto a otro punto distinto al origen. Por ejemplo, el r-avo momento con respecto a la media se puede escribir como:
r = (x - ) f X (x)dx
r

(5.27) (5.28)

r = f X ( x i )( x ) r
i =1

- n

La primera de estas ecuaciones para el caso de una variable aleatoria continua y la segunda si la variable es discreta. Rara vez se necesita calcular ms de tres momentos. Estos son usados para estimar los parmetros y describir las caractersticas de la distribucin.

5.4

CARACTERISTICAS ESTADISTICAS BASICAS

Uno de los usos de la estadstica es extraer la informacin esencial de una muestra de datos, para determinar las caractersticas y el comportamiento de la poblacin. Hay algunas caractersticas bsicas, como la media, la varianza y otras que se pueden calcular o estimar utilizando la muestra de datos disponibles, para tratar de entender el comportamiento general de la poblacin.

91

En general, las caractersticas estadsticas bsicas se calculan como el valor esperado E de alguna funcin de una variable aleatoria. El valor esperado de una funcin g(X) de una variable aleatoria X se define como:
U U U U U U U U

E[g( X )] =

g( u )f

( u )du

(5.29)

En donde fX (u) representa la funcin de distribucin de probabilidades (FDP) de la variable X


B B

Las principales caractersticas son: La media : representa el valor esperado de la variable misma. Para una variable aleatoria X, la media E(X) es el primer momento con respecto al origen; es una medida de la tendencia central de la distribucin:

E(X) = =

xf

(x)dx

(5.30)

El estimador de la media a partir de una muestra se puede escribir como:

1 N x = xi N i =1
P P

(5.31)

La varianza 2: mide la variabilidad de los datos, la dispersin de los mismos alrededor de la media. Es el segundo momento respecto a la media:

92

E[(X - ) ] = 2 = (x - ) f X (x)dx
2 2 -

(5.32)

El estimador de la varianza a partir de una muestra est dado por:

2 x =
-

1 N 2 ( xi x ) N - 1 i =1

(5.33)

La desviacin estndar : es una medida de la variabilidad con las mismas dimensiones que X; es la raz cuadrada de la varianza y su valor estimado se denota por . Mientras mayor sea la desviacin estndar, mayor es la dispersin de los datos. ( ver Figura 5.3).

El coeficiente de variacin CV: est definido por la relacin de la desviacin estndar y la media, y se puede escribir como: CV = cuyo estimado es (5.34)

x ; es una medida adimensional de la x variabilidad. alrededor de la media.


Asimetra: la distribucin de los valores de una distribucin alrededor de la media se mide por la asimetra, la cual est dada por el tercer momento alrededor de la media:
E[(X - ) ] = (x - ) f X (x)dx
3 3 -

(5.35)

93

FIGURA 5.3 Distribucin de probabilidades con diferente desviacin estndar. La asimetra se hace adimensional dividiendo la anterior ecuacin por 3 y se obtiene as, el coeficiente de asimetra :
P P

1
3

E[(x - ) ]

(5.36)

El estimador de est dado por:

x =

N ( xi - x )
i =1

(5.37)
3

(N - 1)(N - 2) x

Como se muestra en la Figura 5..4, para >0, asimetra positiva, los datos se concentran a la derecha y para <0, asimetra negativa, los datos se concentran a la izquierda.

94

<0

>0

fX (x)

FIGURA 5.4. Distribucin de Probabilidades con Diferentes Coeficientes Ejemplo 5.6


En una estacin pluviomtrica se tienen precipitaciones promedias mensuales multianuales de un determinado mes, cuyas frecuencias absolutas se muestran en la tabla siguiente. Encontrar la precipitacin promedia mensual.
Frecuencia Intervalo en mm 100-110 110-112 120-130 130-140 140-150 150-160 160-170 Absoluta 10 16 9 10 20 15 20

Solucin:

95

En total se tiene 100 valores, para cada intervalo se halla el valor medio o marca de clase y se le asigna una frecuencia relativa, la cual es la frecuencia absoluta sobre el nmero total de valores (100). El valor medio de cada intervalo es xi y la frecuencia relativa es fx(xi).
B B B B B B

Se elabora entonces la tabla siguiente.

Intervalo clase (mm) 100-110 110-120 120-130 130-140 140-150 150-160 160-170

Valor medio xi (mm)


B B

F. absoluta

F. relativa fx(xi)
B B B B

xi fx(xi)
B B B B B B

105 115 125 135 145 155 165

10 16 9 10 20 15 20 =100

0.1 0.16 0.09 0.1 0.2 0.15 0.2

10.5 18.4 11.25 13.5 29 23.25 33 =138.90

Aplicando la ecuacin 5.29 la media se puede expresar como:

x = xifx(xi)=138.9 mm.
B B B B B B

5.5

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS DISCRETAS

El uso de estas distribuciones se restringe a aquellos eventos aleatorios en los cuales el resultado puede ser descrito solamente como un xito o como

96

un fracaso, esto es, solo hay dos eventos mutuamente excluyentes para un experimento. Adems, los experimentos sucesivos son independientes y la probabilidad permanece constante de ensayo a ensayo. Un ejemplo en hidrologa sera la probabilidad de que un da sea lluvioso o seco. La distribuciones de este tipo ms usadas en hidrologa son la distribucin binomial y la geomtrica.

5.5.1 Distribucin binomial.


Consideramos como p la probabilidad de que el caudal mximo en un ao en un ro exceda un valor de 1800 m3/s .La probabilidad de no excederlo, q, es 1-p .Supngase que se est considerando un perodo de 3 aos. La probabilidad de excedencia en el ao 3 y no en los aos 1 y 2 es qqp, dado que los eventos son independientes ao a ao. La probabilidad de excedencia en cualquiera de los 3 aos es pqq +qpq + qqp debido a que la excedencia pudo ocurrir en el 1o., 2o o en el 3o. ao. La probabilidad de excedencia en 3 aos est dada como 3q2p. La probabilidad de dos excedencias en 5 aos es ppqqq, pqpqq1....qqqpp. Se puede ver que cada uno de estos trminos es q3p2; el nmero de trminos es igual al nmero de formas de arreglar dos items dentro de 5 items. Esto es (5/2) = 5x4/2 = 10 y la probabilidad de tener dos excedencias en 5 aos es (5/2)q3p2
P P P P P P P P P P P P

Puede generalizarse de tal manera que la probabilidad de x excedencias es n aos est dada por (n/x)pxqn-x , lo que tambin puede expresarse as:
P P P P

P( X = x ) =

n! p x (1 p )n x x! (n x)!

(5.38)

expresin conocida como distribucin binomial. Los parmetros de esta distribucin son:

97

= np 2 = np(1 p ) = (q p ) npq

(5.39)

Ejemplo 5.7
Como se dijo anteriormente, una creciente de Tr aos de perodo de retorno se define como aqulla que tiene una probabilidad de excedencia de 1/Tr en cualquier ao. Asumiendo que las mximas crecientes anuales son independientes, la distribucin binomial permite resolver varios problemas prcticos en hidrologa, as:
B B B B

a) Cul es la probabilidad de que una creciente con un perodo de retorno de 50 aos ocurra exactamente en ese perodo? Aplicando la ecuacin 5.38 se tiene:

P( X = 1) =
b)

50 1 ( ) 1 (1 1 / 50) 49 = 0.37 3 50

Cul es la probabilidad de que en 50 aos se presenten 3 crecientes que igualen o excedan la de Tr =50 aos?
B B

Con la misma ecuacin anterior se tiene:


P( X = 3) = 50 (1 / 50) 3 (1 1 / 50)47 = 0.06 3

c)

Cul es la probabilidad de que una o ms crecientes excedan el caudal con 50 aos de perodo de retorno en ese mismo tiempo?

La clave para contestar esta pregunta est en las palabras una o ms. Como los eventos son independientes y mutuamente excluyentes, se puede escribir:

98

P[una o ms crecientes en 50 aos] = 1 - P[no crecientes en 50 aos] o lo que es lo mismo: P[una o ms crecientes en 50 aos]= 1
50 (1 / 50) 0 (1 1 / 50) 50 = 0.64 0

5.5.2 Distribucin Geomtrica.


Cuando se construye una obra con un caudal de diseo determinado, es de inters para los diseadores conocer cuntos aos pasarn antes que este caudal de diseo sea igualado o excedido. Si p es la probabilidad de excedencia del caudal de diseo (1/Tr) , la probabilidad de falla en el n-avo ao,P, es:
B B

P = (1 p )n 1 p

(5.40)

Esta es la llamada distribucin geomtrica. La media y la varianza de la distribucin geomtrica son:


1 P (1 P ) 2 = P2

(5.41)

Ejemplo 5.9
El mximo nivel de la creciente anual de un ro se denota por H (metros): Asumiendo que la funcin de densidad de probabilidad se describe como se muestra en la grfica, determinar: a) La altura de inundacin para un perodo de 20 aos.

99

b) Cul es la probabilidad de que durante los prximos 20 aos la altura hallada en el numeral anterior sea excedida al menos una vez?. c) Cul es la probabilidad de que durante los prximos 5 aos este valor sea excedido exactamente una vez?

F(H)

H(m)

Solucin:
a) El rea bajo la funcin de densidad es 1, que equivale a P(5[H[7) =1. Para un caudal con un Tr de 20 aos se cumple que:
B B

P( H H Tr=20 ) = 1 / 20 = 0.05
lo que significa que 0.05 es un rea bajo la funcin de densidad y:
P( H H Tr=20 ) = 1 0.05 = 0.95

y se plantea la siguiente relacin:

100

0.05 =

(7 H Tr=20 )(0.95) 2

Despejando el valor de H, se obtiene finalmente:


H Tr=20 = 6.9 m

b) Se puede escribir la siguiente ecuacin: P(HTr=20 sea excedida al menos una vez) =1 - P(HTr=20 no sea excedida)
B B B B

Aplicando la ecuacin 5.38 (binomial ) se puede escribir entonces: sea excedida P(HTr=20 20 1 (0.05) 0 (0.95) 20 = 0.642 0
B B B B

al

menos

una

vez)

O sea que P(HTr=20 sea excedida al menos una vez) = 0.642 b) Aplicando tambin la ecuacin 5.38, se tiene:
5 P( H Tr = 20 = 1) = (0.05)1 (0.95) 0.4 = 0.024 1

Ejemplo 5.9
Tres diques de control de inundaciones se construyen en una planicie por la cual corren dos ros, tal como se muestra en la figura. Los diques se disean as: El dique I tiene un caudal de diseo con un perodo de retorno de 20 aos. El dique II tiene un caudal de diseo con un perodo de retorno de 10 aos El dique III tiene un caudal de diseo con un perodo de retorno de 25 aos. Asumir que las crecientes en los ros A y B son estadsticamente independientes y que las fallas de los diques I y III tambin lo son.

101

a) Cul es la probabilidad de inundacin en un ao cualquiera producida solamente por el ro A. b) Cul es la probabilidad de inundacin de la planicie en un ao? c) Cul es la probabilidad de que no haya inundacin en los prximos 4 aos?

Solucin:
a)El ro A puede producir inundacin en la planicie si falla el dique I o si falla el dique II, lo que se puede expresar como:
P(I II ) = P(I ) + P(II ) P(I II ) P(I II ) = 0.05 + 0.1 0.1 0.05 = 0.145

b) La probabilidad de inundacin se da por el ro A o por el ro B, lo que puede expresarse como: P( A B ) = P( A ) + P( B ) P( A B ) P(A)=0.145, hallado en el numeral anterior y P(B) =1/25=0.04, lo que implica que:

102

P( A B ) = 0.145 + 0.04 0.145 0.04 = 0.179

c) La probabilidad de inundacin, P, en cualquier ao, es 0.179, como se explic en el numeral anterior, y la probabilidad ,q, de no inundacin ser entonces: q =1 -P =1 - 0.179 =0.821 y la probabilidad de no inundacin en 4 aos ser entonces:

P(no inundacin en 4 aos) =(0.821)4 =0.454


P P

Ejemplo 5.10
Un proyecto se disea con un caudal que tiene un perodo de retorno de 10 aos. Cul es la probabilidad de que este caudal se presente por primera vez al quinto ao de acabado el proyecto?

Solucin:
Este es un ejemplo donde puede aplicarse la distribucin geomtrica, as: La probabilidad de excedencia, p, para este caso es :

p =1/Tr=1/10=0.1
Entonces:

P(probabilidad de inundacin 5 ao)=(0.1)(1-0.1) =0.06561

5.6. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS

103

La mayora de las variables hidrolgicas son variables aleatorias continuas. Enseguida se describen brevemente las distribuciones de probabilidades ms usadas en anlisis de frecuencia de estas variables.

5.6.1 La distribucin Normal


La distribucin Normal es una distribucin simtrica en forma de campana, conocida tambin como Campana de Gauss. Es fundamental en el dominio de la estadstica y la probabilidad. Una razn es que el teorema del lmite central establece que para varias condiciones muy generales, la distribucin de la suma de un gran nmero de variables aleatorias puede aproximarse a la Normal, sin importar a qu distribucin pertenezcan ellas mismas. Muchos procesos fsicos pueden conceptualizarse como la suma de procesos individuales. Por otra parte, muchos procesos de inferencia estadstica se basan en suposiciones de que la variable aleatoria se distribuye normalmente. Es por ello que la Normal encuentre tantas aplicaciones en hidrologa: en pruebas de hiptesis, intervalos de confianza, etc. Una variable aleatoria X se distribuye de acuerdo con una distribucin de probabilidades Normal si su FDP est dada como:

f X (x) =

1 x 2

( x x )2 2 2 x

(5.42)

Los parmetros de la distribucin son dos: la media,x, y la desviacin estndar x. La asimetra de la distribucin es cero. Esta distribucin tiene una forma de campana simtrica, como se muestra en la Figura 5.5, por lo tanto la media, la moda y la mediana son iguales.
B B B B

Si se hace la siguiente transformacin:

104

= (x x ) / x
se obtiene como FDP y como funcin acumulada de la variable :

f u (u) =

1 - u2 e 2 2

1 Fu (u) = 2

-w 2

(5.43) d

FIGURA 5.5 Distribucin normal.


La variable u es llamada variable estandarizada, tiene media cero y desviacin estndar uno. Debido a que la variable normal estandarizada tiene todos sus parmetros conocidos, existen tablas para encontrar la funcin acumulada de esa variable. La tabla 5.1 es una de ellas. Aunque la simetra de la distribucin la hace inaplicable para valores extremos, la distribucin Normal describe el comportamiento probabilstico de los valores medios bastante bien. La distribucin normal se usa para:

105

Aproximar la distribucin de probabilidades de errores aleatorios . Comparar distribuciones: las propiedades de una muestra de variables no normales pueden compararse con las de variables normales. Muchos estadsticos pueden ser normalmente distribuidos, como, por ejemplo, la media de la mayora de las variables hidrolgicas.

106

5.6.1.1 Estimacin de parmetros


Solo se presentar en estas notas la estimacin de parmetros por el mtodo de los momentos, que fue desarrollado en 1902 por Karl Pearson. El consider que un buen estimativo de los parmetros de una distribucin de probabilidades es aqul para el cual los momentos de la funcin de densidad de probabilidades son iguales a los momentos correspondientes de la muestra. Los estimadores de los parmetros de la distribucin normal por el mtodo de los momentos son:
= 1 N xi N i =1

(5.44) (5.45)

N 1 = ( x i )1 / 2 N

5.6.1.2 Factor de frecuencia


Para la distribucin normal, el factor de frecuencia est dado como:
K= x-

(5.46)

que es la misma variable reducida, definida por la ecuacin (5.41). La magnitud de la variable XT para un perodo de retorno dado T puede encontrarse, utilizando el factor de frecuencia, con el siguiente procedimiento: 1 1 1. F u (K ) = 1 K = Fu1 (1 ) T T
B B

107

2.

1 Usando el valor calculado de 1 en la tabla 5.1, se lee el valor T de x en la primera columna, que corresponde a K o F-1 (1- 1/T)
P P P P B B

3.

Se calcula el valor buscado como:

X T = + K
Ejemplo 5.11
Se tiene una estacin con 30 aos de datos de caudales medios anuales con media de 117 m3/s y desviacin estndar de 94 m3/s. Si los datos se ajustan a una distribucin Normal, cul es el caudal correspondiente a un perodo de retorno, Tr, de 100 aos?.
P P P P B B

Solucin:
En este caso se puede escribir: Fu(K) = 1 - 1/Tr = 0.99 K = Fu-1 (0.99) Con el valor de 0.99 en la tabla 5.1, se obtiene: K = 2.326 El valor asociado a Tr=100 se calcula como: Q100 = Q + Q K = 117 + 94 x 2.326 = 335.6 m3/s
B B B B B PB P B B P P

5.6.1.3 Intervalos de confianza


Cuando se desea hallar cualquier estadstico, por ejemplo la media, generalmente se dispone de una muestra de tamao limitado. Se quiere saber qu tan cercano puede estar ese estimado al verdadero valor desconocido de la poblacin. En otras palabras, se quisiera conocer con una cierta certeza (probabilidad) la franja de valores entre los cuales se encontrara el verdadero valor de la poblacin. Si esa franja es grande, habr mucha incertidumbre en el

108

valor estimado de la media, y si es pequea, habr, por el contrario, mucha confianza en ese valor estimado. Con ese fin se utilizan los llamados intervalos de confianza. Supngase, por ejemplo, que se desea estimar la media de la poblacin, . Asmase que 1 y 2 son dos estadsticos (funciones de la muestra aleatoria) tales que: 1 < 2 y P(1< < 2) =;. Entonces [1 , 2] es llamado el intervalo de confianza para la media ., ; es llamado el nivel de confianza (nivel de probabilidad) y 1 y 2 son llamados los lmites de confianza inferior y superior, respectivamente. Esta definicin puede extenderse al intervalo de estimacin de un parmetro cualquiera o a una funcin del parmetro. Se debe tener en cuenta que los intervalos de confianza y los lmites de confianza son realmente variables aleatorias, ya que son funciones del tamao de la muestra y de estimadores a su vez, funcin de muestras aleatorias. Como los tamaos de la muestra varan, los intervalos de confianza cambian de una muestra a otra. Mientras ms estrecho es el intervalo de confianza, mejor es el procedimiento de estimacin.

Para el valor estimado asociado a un perodo de retorno cualquiera, los intervalos de confianza se calculan usando el error estndar, ST, el cual es una medida de la desviacin estndar de la magnitud de un evento calculado a partir de una muestra respecto a la verdadera magnitud del evento. Se presentarn para todas las distribuciones, los intervalos de confianza para los diferentes cuantiles de la poblacin.
B B

Para la distribucin Normal, los lmites de confianza para el verdadero valor de un cuantil asociado con un periodo de retorno T son:

XT u1- ST

(5.47)

109

en donde ; es el nivel de probabilidad, u1- es el cuantil de la distribucin Normal estandarizada para una probabilidad acumulada de 1- y ST es el error estndar.
B B B B

Cada distribucin tiene expresiones para hallar el error estndar, por ejemplo, el de la distribucin Normal es:

ST =

1 x (1 + K 2 / 2)2 N

(5.48)

Ejemplo 5.12
Los caudales medios anuales de un ro con media 1.5 m3/s y desviacin estandar de 0.6 m3/s se distribuyen normalmente. Cul es la probabilidad de que se produzca un caudal medio igual o menor a 1 m3/s, en cualquier ao?.
P P P P P P

Solucin:
Se tiene entonces que:
P( X 1) = P( 1 )

Reemplazando los valores:


P ( 1 1 .5 ) = P( 0.83) 0 .6

En la tabla 5.1, se encuentra P(-0.83). Considerando la simetra de la distribucin normal (ver Figura 5.6 en donde A = B), se tiene:

P( -0.83) = 1 - P( 0.83) = 1 - 0.797 = 0.203

110

FIGURA 5.6 Simetra de la distribucin normal. Ejemplo 5.13


La escorrenta anual de una pequea cuenca se distribuye normalmente con media de 356 mm y desviacin estndar de 76.2 mm. Determinar la probabilidad de que la escorrenta anual sea menor que 280 mm en todos los tres siguientes aos.

Solucin:

P 280) = P(

280 356 ) = P( 0.997) 76.2

y:
P( 0.997 ) = 1 0.8413 = 0.1587

La probabilidad de que sea menor en tres aos consecutivos es:

0,1587 x 0,1587 x 0,1587 = 0,00399 5.6.2 Distribucin Log Normal


Consideremos un clculo hipottico de la escorrenta en una cuenca. La escorrenta es el producto de varios factores aleatorios, como lluvia, rea

111

contribuyente, prdidas, coeficiente de evaporacin, etc. En general, cuando la variable aleatoria X es el producto de un gran nmero de otras variables aleatorias, la distribucin de los logaritmos de X puede aproximarse a la Normal, ya que los logaritmos de X son la suma de los logaritmos de los factores contribuyentes. Si se tiene una variable aleatoria X y ln X = Y se ajusta a una distribucin Normal, se dice que la variable aleatoria X es lognormalmente distribuida. La funcin de densidad de esta distribucin, si se asume que Y=loga(X), donde a es la base del logaritmo, es:
B B

1 y - y 1 f X (x) = exp 2 y x 2 2 y
B B B B

(5.49)

y es el parmetro de escala y y es el parmetro de forma. La forma de la distribucin lognormal se muestra en la Figura 5.7.

FIGURA 5.7 Distribucin lognormal.

112

Se ha demostrado que la distribucin lognormal puede aplicarse en un amplio nmero de eventos hidrolgicos, especialmente a aquellos casos en los cuales la variable tiene un lmite inferior, la distribucin emprica no es simtrica y los factores que causan los eventos son independientes y multiplicativos. Si la variable aleatoria X tiene un lmite inferior xo diferente de cero, y la variable Z = X -xo sigue una distribucin lognormal con dos parmetros, entonces X se ajusta a una distribucin lognormal con tres parmetros. La funcin de densidad de esta distribucin es:
B B B B

1 ln (X - xo ) - y 1 f X (x) = exp 2 (X - xo ) y y 2
B B B B B B

(5.50)

donde los parmetros y, y y xo son llamados los parmetros de escala, forma y localizacin respectivamente. La distribucin lognormal con tres parmetros puede aplicarse a eventos con valores positivos o negativos, siempre que x x0; mientras que la lognormal con dos parmetros solo puede aplicarse a eventos con valores positivos.
B B

5.6.2.1 Estimacin de parmetros


Para la distribucin lognormal de dos parmetros, usando el mtodo de momentos, los parmetros se pueden estimar como:
Y = 1 N log a ( X i ) N i =1
12

(5.51) (5.52)

1 N 2 Y = [log a ( X i ) Y ] N i =1

Para la distribucin lognormal de tres parmetros, xo debe tambin estimarse. Una manera de estimar xo requiere que el coeficiente de asimetra sea
B B B B

113

positivo. En este mtodo, el segundo momento de Z = X - xo no depende de x0, esto es, z = x y z = x - x0, entonces el lmite inferior xo se puede expresar como: Cv x (5.53) x0 = x 1 Cv z Donde:
B B B B B B B B B B B B B B B B

Cv x =

x x

Cv z = z z

(5.54)

Donde:

Cvz =

(1- w )
2/3

1 w = - x + 2 + 4 x 2
B B

1/3 1/2

];

(5.55)
x > 0

en donde x es el coeficiente de asimetra de x. Los parmetros de la distribucin lognormal de dos parmetros tambin pueden estimarse con base en las relaciones entre los parmetros de la variable transformada Y y Y y los parmetros de la variable original X y X, dadas como: 1 2 Y = log a ( X ) Y (5.56) 2
B B B B B B B B

Y = log a 1 + X 2 X
2

1 2

(5.57)

114

En este caso, se estiman X y X con los datos originales, y con las ecuaciones anteriores se estiman Y y Y los parmetros de la distribucin lognormal.
B B B B B B B B

Ejemplo 5.14
Los caudales medios de un ro en una estacin hidromtrica han sido modelados con las siguientes distribuciones: a) Normal con parmetros = 256.7 m3/s y = 191 m3/s b) Lognormal con parmetros y = 5.228 y y = 0.84
P P P P B B B B

Calcular la probabilidad de que el caudal medio est entre 300 y 400 m3/s
P P

Solucin:
a) Si se usa la Normal se tiene:

P(300[Q[400)= FX(400)-FX(300)
B B B B

Si se usa la variable estandarizada , se tiene entonces que:

300 x 400 - x Fu P(300Q400)= F x x = Fu (u400) - Fu (u300) donde:


B B B B B B B B B B

u300 = (300 - 256.7)/191 = 0.2267


B B

con este valor, se va a la tabla 5.1 y se encuentra que Fx (0.2267) = 0.5871 y u400 = (400 - 256.7)/191 = 0.75
B B B B

de la tabla 5.1, se tiene: Fx (0.75) = 0.7734


B B

115

lo que implica que:

P(300Q400)=0.7734 - 0.5871=0.1863
b) Si se usa la distribucin lognormal:

P(300Q400)=FY(ln(400))-FY(ln(300)) ln(400) Y ln(300) Y Fu = Fu Y Y y: ln(300) = 5.704 ln(400) = 5.99


B B B B

se tiene entonces que: F(5.99 ) = (5.99 - 5.228)/0.84 = 0.91 de la tabla 5.1 se tiene que F(0.91) = 0.8186 F(5.704 )= (5.704 - 5.228)/0.84 = 0.564 de la tabla 5.1 se obtiene F(0.564) = 0.7123 se encuentra finalmente:
B B B B B B B B B B

P(300 Q 400) = 0.8186 - 0.7123 = 0.106


Este ejemplo se puede resolver tambin calculando Y y Y a partir de x y x con las ecuaciones 5.56 y 5.57.
B B B B B B B B B

5.6.2.2 Factor de frecuencia


Se utiliza el mismo factor de frecuencia que en la distribucin Normal, excepto que este se aplica a los logaritmos de la variable y la ecuacin, para un cuantil cualquiera XT queda:
B B

ln (X T ) = y + K y

(5.58)

116

1 en donde K = Fu 1 1 T

Si se quiere trabajar con la variable no transformada al campo logartmico se tiene que:


2 1/2 ln (1 + Cv ) expK T (ln(1 + Cv 2 )) - - 1 2 K= Cv

(5.59)

donde:

1 -1 K T = Fu 1 - Tr

(5.60)

1 1 Fu 1 es el inverso de la funcin de distribucin Normal estandarizada T

acumulada y Cv es el coeficiente de variacin


B B

5.6.2.3 Intervalos de confianza


En el campo transformado, los lmites estn dados por los de la distribucin Normal como:

ln(XT ) u1- 2 ST

(5.61)

en donde:

ST =
y

Y N

(5.62)

117

2 = 1 + KT 2

1/2

(5.63)

Ejemplo 5.15
Se tiene un ro con caudales mximos anuales lognormalmente distribuidos, con x =15 m3/s y x =5 m3/s; se da tambin Y =2.6554 y Y =0.3246. Encontrar el caudal para un perodo de retorno de 100 aos. Si se tiene un perodo de retorno de 30 aos de registro, cules son los lmites de confianza para un ; de 10%?.
P P P P

Solucin:
El coeficiente de variacin se calcula como: 5 Cv = x = = 0.33 x 15 Para hallar KT, se procede as:
B B

Fu (K T ) = 1 De la tabla 5.1:

1 TI

= 1-

1 = 0.99 100

K T = F1 (0.99) = 2.33
El valor de K se puede calcular usando la ecuacin (5.59) como:
2 1/2 ln (1 + 0. 33 ) exp 2.33 (ln(1 + 0. 332 )) - - 1 2 K= 0.333

118

K= 3.028 El valor asociado a un perodo de retorno de 100 aos ser:

XT = 15 + 5 x 3.028 = 30.14 m3/s


B B P P

Los lmites de confianza se hallan as en el campo transformado: ln(XT ) u1- 2 ST Se calcula primero con la ecuacin (5.63) y luego ST con la ecuacin (5.60), el resultado es:
B B

2 = 1 + 2.33 = 1.93 2 0.3246 = 0.11 ST = 1.93 * 30

1/2

De la tabla 5.1, se lee: 1-;=0.95=1.64


B B B B

Por lo tanto: ln (30.28) 1.64 * 0.11 = 3.41 0.1875 = [3.2225, 3.5975] = [e3.2225, e3.5975] = [25.091, 36.5]
P P P P

5.6.3 Distribucin Gumbel


Una familia importante de distribuciones usadas en el anlisis de frecuencia hidrolgico es la distribucin general de valores extremos, la cual ha sido ampliamente utilizada para representar el comportamiento de crecientes y sequas. A partir de la distribucin general de valores extremos, se pueden derivar tres tipos de distribuciones: la tipo I, comnmente conocida como Gumbel, la tipo II y la tipo III, llamada tambin Weibull.

119

Ellas difieren entre s por el valor del parmetro de forma. La expresin general de la funcin de densidad de probabilidades para la distribucin extrema tipo I o Gumbel es:

f X (x) =

x - 1 x - exp- exp

(5.64)

En donde y son los parmetros de la distribucin. La distribucin Gumbel tiene la forma mostrada en la figura 5.8.

5.6.3.1 Estimacin de parmetros


Por el mtodo de momentos, los estimadores de los parmetros son:
= 6

(5.65) (5.66)

= - 0.5772

donde y son la media y la desviacin estndar estimadas con la muestra.

5.6.3.2 Factor de frecuencia


El factor de frecuencia para la distribucin Gumbel es:
K=6 {0.577 + ln[lnTr - ln(Tr - 1)]}

(5.67)

donde TI es el perodo de retorno.


B B

5.6.3.3 Intervalos de confianza

120

Los lmites de confianza por el mtodo de momentos para un nivel de probabilidad ; son:
X T u 1- 2 S T

(5.68)

FIGURA 5.8 Distribucin Gumbel ST = N


1/2

(5.69) (5.70)

= [1 + 1.1396K + 1.1 K 2]

K es el factor de frecuencia de la distribucin, dado por la ecuacin 5.67.

5.6.4 Distribucin Gamma


Esta distribucin ha sido una de las ms usadas en hidrologa. Como la mayora de las variables hidrolgicas son sesgadas, la funcin Gamma se utiliza para ajustar la distribucin de frecuencia de variables tales como crecientes mximas anuales, caudales mnimos, volmenes de flujo anuales y estacionales, valores de precipitaciones extremas y volmenes de lluvia de corta duracin. La funcin de distribucin Gamma tiene dos o tres

121

parmetros. La ltima funcin es llamada tambin Distribucin Pearson tipo III. La distribucin Gamma est relacionada con otras distribuciones muy conocidas como las distribuciones Chi-cuadrado y la exponencial negativa, que son casos particulares de la distribucin Gamma. La distribucin Gamma de dos parmetros tiene una funcin de densidad de probabilidades de la forma:
x 1 x - f X (x) = e | | ( )

-1

(5.71)

Donde: 0 x < para ; > 0 -: < x ; para ; < 0

; y son los parmetros de escala y forma, respectivamente, y () es la funcin Gamma completa.


El parmetro siempre es mayor que cero, mientras que ; puede ser positivo o negativo. La funcin Gamma completa est dada por:

() = z-1 e-z dz
0

(5.72)

La distribucin Gamma de tres parmetros tiene la siguiente funcin de densidad de probabilidades:


1 x - xo x - xo f X (x) = exp | | ( )
-1

(5.73)

Donde: xo x < ; para ; > 0


B B

122

-: < x xo para ; < 0


B B

; y son los parmetros de escala y forma, respectivamente, y xo es el parmetro de localizacin. La Figura 5.9 muestra formas de la funcin de densidad de probabilidades Gamma para ; > 0.
B B

5.6.4.1 Estimacin de parmetros


Para la distribucin Gamma de dos parmetros, usando el mtodo de los momentos, se tienen las siguientes expresiones (para sus parmetros).
=

(5.74) (5.75)

2 = 2

FIGURA 5.9 Distribucin Gamma.( Varas, Bois, 1998)


Los estimadores de los parmetros, por el mtodo de momentos, son los siguientes:

123

1 = 2 Cv =

(5.76)

$ $ $ , y C v son la media, desviacin estndar y coeficiente de variacin

calculados con la muestra, respectivamente. Para la distribucin Gamma con tres parmetros o Pearson tipo III, los parmetros, por el mtodo de momentos, pueden estimarse por:

2 =

(5.77)

(5.78)

X0 = $ es el coeficiente de asimetra calculado usando la muestra.


5.6.4.2 Factor de frecuencia
Si se define:

(5.79)

1 K T = Fu 1 - Tr el factor de frecuencia K tiene la siguiente forma:

(5.80)

124

1 2 2 3 K K T + (K t 1) + (K T 6K T ) (K T 1) + K T 6 3 6 6 6 (5.81)

Para la distribucin Pearson tipo III o Gamma de 3 parmetros, existen tablas, como la 5.2, que dan el factor de frecuencia en funcin del coeficiente de asimetra calculado con la muestra.

5.6.4.3 Intervalos de confianza


Si se tiene que:
XT u 1 2 S T ST = N

(5.82)

=(,Tr) y est tabulado para la Gamma de dos parmetros y para la Pearson tipo III. La tabla 5.3 da valores de , para hallar el intervalo de confianza de la distribucin Pearson tipo III.
B B

5.6.5 Distribucin log Pearson Tipo III


Si los logaritmos de la variable aleatoria X se ajustan a una distribucin Pearson Tipo III, se dice que la variable aleatoria X se ajusta a una distribucin Log Pearson Tipo III. Esta distribucin es ampliamente usada en el mundo para el anlisis de frecuencia de caudales mximos. Su funcin de densidad est dada por:

1 ln(x) - y o f x (x) = x ()

-1

ln (x)- y o -

(5.83)

donde ; es el parmetro de escala, es el parmetro de forma y yo el parmetro de localizacin.


B B

125

126

TABLA 5.2. VALORES DE KT PARA LA DISTRIBUCIN PEARSON III (ASIMETRA POSITIVA)


B B

Coeficiente de Asimetra 0.500 0.200

Probabilidad de Excedencia 0.100 0.040 0.020 0.010 0.005

3.0 2.9 2.8 2.7 2.6 2.5 2.4 2.3 2.2 2.1 2.0 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0

-0.396 -0.390 -0.384 -0.376 -0.368 -0.360 -0.351 -0.341 -0.330 -0.319 -0.307 -0.294 -0.282 -0.268 -0.254 -0.240 -0.225 -0.210 -0.195 -0.180 -0.164 -0.148 -0.132 -0.116 -0.099 -0.083 -0.066 -0.050 -0.033 -0.017 0.000

0.420 0.440 0.460 0.479 0.499 0.518 0.537 0.555 0.574 0.592 0.609 0.627 0.643 0.660 0.675 0.690 0.705 0.719 0.732 0.745 0.758 0.769 0.780 0.790 0.800 0.808 0.816 0.824 0.830 0.836 0.842

1.180 1.195 1.210 1.224 1.238 1.250 1.262 1.274 1.284 1.294 1.302 1.310 1.318 1.324 1.329 1.333 1.337 1.339 1.340 1.341 1.340 1.339 1.336 1.333 1.328 1.323 1.317 1.309 1.301 1.292 1.282

2.278 2.277 2.275 2.272 2.267 2.262 2.256 2.248 2.240 2.230 2.219 2.207 2.193 2.179 2.163 2.146 2.128 2.108 2.087 2.066 2.043 2.018 1.993 1.967 1.939 1.910 1.880 1.849 1.818 1.785 1.751

3.152 3.134 3.114 3.093 3.071 3.048 3.023 2.997 2.970 2.942 2.912 2.881 2.848 2.815 2.780 2.743 2.706 2.666 2.626 2.585 2.542 2.498 2.453 2.407 2.359 2.311 2.261 2.211 2.159 2.107 2.054

4.051 4.013 3.973 3.932 3.889 3.845 3.800 3.753 3.705 3.656 3.605 3.553 3.499 3.444 3.388 3.330 3.271 3.211 3.149 3.087 3.022 2.957 2.891 2.824 2.755 2.686 2.615 2.544 2.472 2.400 2.326

4.970 4.909 4.847 4.783 4.718 4.652 4.584 4.515 4.444 4.372 4.298 4.223 4.147 4.069 3.990 3.910 3.828 3.745 3.661 3.575 3.489 3.401 3.312 3.223 3.132 3.041 2.949 2.856 2.763 2.670 2.576

127

FIGURA 5.10 Distribucin Log-Pearson Tipo III. (Salas, 1992). 5.6.5.1 Estimacin de Parmetros
Los estimadores de los parmetros por el mtodo de los momentos son:
2 = y y
2

2 y 0 = y

= y

(5.84)

Donde y , y y son la media, desviacin estndar y coeficiente de asimetra calculados usando los logaritmos de los datos, respectivamente.

5.6.5.2 Factor de frecuencia


Si se cumple que Y= ln X, se tiene que:

128

YT = ln XT = y + K y

(5.85)

En donde Y y y son la media y desviacin estndar de los logaritmos de X, y K se obtiene de la tabla 5.2.
B B B B

TABLA 5.3 VALORES DE PARA LA DISTRIBUCION PEARSON TIPO III


0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 Tr=2 1.0801 1.0808 1.0830 1.0866 1.0913 1.0987 1.1073 1.1179 1.1304 1.1449 1.1614 1.1799 1.2003 1.2223 1.2157 1.2701 1.2952 1.3204 1.3452 1.3690 1.3913
B B

Tr=5 1.1698 1.2006 1.2309 1.2609 1.2905 1.3199 1.3492 1.3785 1.4082 1.4385 1.4699 1.5030 1.5382 1.5764 1.6181 1.6643 1.7157 1.7732 1.8374 1.9091 1.9888
B B

Tr=10 1.3748 1.4367 1.4989 1.5610 1.6227 1.6838 1.7441 1.8032 1.8609 1.9170 1.9714 2.0240 2.0747 2.1237 2.1711 2.2173 2.2627 2.3081 2.3541 2.4018 2.4525
B B

Tr=20 1.6845 1.7810 1.8815 1.9852 2.0915 2.1998 2.3094 2.4198 2.5303 2.6403 2.7492 2.8564 2.9613 3.0631 3.1615 3.2557 3.3455 3.4303 3.5100 3.5844 3.6536
B B

Tr=50 2.1988 2.3425 2.4986 2.6656 2.8423 3.0277 3.2209 3.1208 3.6266 3.8374 4.0522 4.2699 4.4996 4.7100 4.9301 5.1486 5.3644 5.5761 5.7827 5.9829 6.1755
B B

Tr=100 2.6363 2.8168 3.0175 3.2365 3.4724 3.7238 3.9895 4.2684 4.5595 4.8618 5.1741 5.4952 5.8240 6.1592 6.4992 6.8427 7.1881 7.5339 7.8783 8.2196 8.5562
B B

5.6.5.3 Intervalos de confianza


Se utiliza la tabla 5.3 para hallar valores del parmetro y se cumple que:

129

ST =

y N

(5.86)

Los lmite de confianza se pueden expresar como:

ln X T 1 / 2S T

(5.87)

5.7 ANLISIS DE FRECUENCIA

El anlisis de frecuencia puede hacerse de dos maneras: usando los llamados factores de frecuencia o hallando la distribucin emprica de los datos muestrales, por el mtodo de "Plotting position" o posicin de graficacin. Como regla general, el anlisis de frecuencia no debe realizarse para perodos cortos, menores de 10 aos de registros. A continuacin se describe brevemente los dos procedimientos propuestos para realizar el anlisis de frecuencia.

5.7.1 Posicin de graficacin o"Plotting Position"


La posicin de graficacin o plotting posittion" trabaja con la probabilidad de excedencia asignada a cada valor de la muestra. Para determinar sta, se han propuesto numerosos mtodos empricos. Si n es el nmero total de valores y m es el rango de un valor en una lista ordenada de mayor a menor (m = 1 para el valor mximo y m=n para el menor valor), la probabilidad de excedencia se puede obtener por medio de las siguientes expresiones:

California:
P= m n

(5.88)

130

Weibull:
P= m n +1

(5.89)

Hazen:
P= 2m -1 2n

(5.90)

La expresin acumulada de probabilidades ms usada es la de Weibull. Con las anteriores ecuaciones, se halla la que se conoce como distribucin emprica de una muestra. Luego se puede hacer un anlisis para ajustar a la distribucin emprica una de las distribuciones tericas vistas anteriormente. La distribucin acumulada de una variable puede ser representada grficamente en un papel de probabilidad diseado para la distribucin. En este papel, las ordenadas representan el valor de x en una cierta escala y las abscisas representan la probabilidad de P(X >x) o P(X< x), el perodo de retorno o la variable reducida. Las escalas de las ordenadas y las abcisas son diseadas de tal manera que cuando una muestra es de una poblacin con esa distribucin, la grfica debe ajustarse a una lnea recta. El propsito de este papel es "linealizar" las relaciones de probabilidad para que los datos puedan ser fcilmente dibujados y usados en extrapolacin o propsitos de comparacin. Se puede observar en las pginas siguientes los papeles de probabilidad correspondientes a las distribuciones Gumbel y Log-Normal.

5.7.2 Factores de frecuencia


Ven te Chow propuso que toda muestra se puede ajustar a una expresin como la siguiente:

X= +K

(5.91)

til para el anlisis de frecuencia hidrolgico, donde K es el factor de $ $ frecuencia, es la media estimada y es la desviacin estndar estimada. Cada distribucin tiene su factor de frecuencia como se vio anteriormente.

131

132

133

5.8 BONDAD DE PROBABILIDADES

AJUSTE

DE

UNA

DISTRIBUCION

DE

En los numerales anteriores, se ha descrito el uso de varias distribuciones de probabilidad para estimar eventos con perodos de retorno mayores que los de los eventos histricos. Surge entonces el interrogante de cul de estas distribuciones se debe utilizar para una muestra particular. No hay un acuerdo entre los hidrlogos acerca de cul de las distribuciones debe usarse. Las pruebas para comprobar la bondad del ajuste son necesarias, pero no son suficientes para aceptar una distribucin. Tal vez las dos pruebas de bondad de ajuste ms utilizadas en hidrologa son la Chi - Cuadrada y la Smirnov Kolmogorov.Con estas pruebas se escogera con la muestra, la distribucin de probabilidades que representa el comportamiento probabilstico de la poblacin. Una prueba adicional puede hacerse calculando la suma de los cuadrados de las diferencias entre los valores observados y los calculados. Aunque los procedimientos estadsticos no pueden por s solos determinar la mejor distribucin de frecuencia, si pueden suministrar argumentos para escoger la distribucin ms adecuada. Por ejemplo, las distribuciones Pearson tipo III y Log-Pearson tipo III requieren la estimacin del coeficiente de asimetra de datos muestrales. Esto puede ser una razn suficiente para preferir cualquier otra distribucin, ya que este parmetro tiene un comportamiento muy sesgado, por lo cual se necesitara una gran cantidad de registros para tener un estimado ms o menos confiable, y dichos registros no se consiguen fcilmente en nuestro medio. Por otra parte, las distribuciones de dos parmetros tienen un valor fijo o ignoran la asimetra de la poblacin, lo cual tampoco es conveniente. En resumen, no hay un procedimiento nico para escoger la mejor distribucin. Las pruebas estadsticas ayudan; el ajuste grfico tambin puede contribuir; en definitiva, prima el juicio de quien est haciendo el anlisis. 5.8.1 Prueba Smirnov - Kolmogorov

134

El estadstico Smirnov - Kolmogorov, D, considera la mxima desviacin de la funcin de distribucin de probabilidades emprica de la muestra, FE(x), de la funcin de distribucin de probabilidades terica, escogida , Fx (x), tal que:
B B

Dn = Max | FE(x) - Fx (x) |


B B

(5.92)

La prueba requiere que el valor Dn calculado con la expresin anterior sea menor que el valor tabulado Dn para el nivel de probabilidad requerido.
B B

Esta prueba es fcil de realizar y comprende las siguientes etapas: El estadstico Dn es la mxima diferencia entre la funcin de distribucin acumulada emprica de la muestra y la funcin de distribucin acumulada terica escogida.Se fija el nivel de probabilidad. Valores como 0.05 y 0.01 son los ms usuales. El valor crtico Da de la prueba debe ser obtenido de tablas como la tabla 5.4. Este estadstico es funcin de y n. Si el valor calculado Dn es mayor que Da, la hiptesis de que la distribucin terica escogida se ajusta adecuadamente al comportamiento probabilstico de la poblacin debe rechazarse, de otra manera, se acepta esta hiptesis.
B B B B B B B B

5.8.2 Prueba Chi Cuadrado


La prueba Chi-cauadrado se usa tambin para determinar el grado de ajuste de una distribucin de probabilidades terica a una distribucin emprica. Supongase que en una muestra se tengan una serie de posibles eventos E1, E2, ....Ek que ocurren con frecuencias observadas de O1, O2, .....Ok. Si se tiene una distribucin terica de probabilidades se espera que esos eventos ocurran con frecuencias e1, e2,....ek
B B B B B B B B B B B B B B B B B B B

TABLA 5.4 VALORES DE Dn


B

135

N 5 10 15 20 25 30 35 40 45 50 N50

;=0.20 0.45 0.32 0.27 0.23 0.21 0.19 0.18 0.17 0.16 0.15

;=0.10 0.51 0.37 0.30 0.26 0.24 0.22 0.20 0.19 0.18 0.17

;=0.05 0.56 0.41 0.34 0.29 0.27 0.24 0.23 0.21 0.20 0.19

;=0.01 0.67 0.49 0.40 0.36 0.32 0.29 0.27 0.25 0.24 0.23

1.07 N

1.22 N

1.36 N

1.63 N

Se est interesado en conocer como difieren las frecuencias observadas de las frecuencias esperadas (halladas con una distribucin terica de probabilidades). Una medida de la discrepancia entre frecuencias observadas y calculadas est dada por el estadstico 2 as:
P P

k (O e ) 2 2 = i i ei i =1

(5.93)

donde: Oi = ei Si 2 =0, significa que las distribucion terica y emprica ajustan exactamente, mientras que si 20, ellas difieren. La distribucin de la variable 2 se puede asimilar a una distribucin Chi-cuadrado con (k-n-1) grados de libertad, donde k es el nmero de intervalos y n es el nmero de parmetros de la distribucin terica. La funcin 2 est tabulada en muchos textos de estadstica.Supngase que la hiptesis Ho es aceptar que una distribucin emprica se ajusta a una distribucin Normal. Si el valor calculado de 2 por la ecuacin 5.89 es mayor que algn valor crtico de 2 ,con niveles de significancia ;de 0.05 o 0.01 ( el nivel de confianza se define como 1-;, siendo
P P P P P P P P B B P P P P

136

frecuentemente utilizados niveles de confianza del 95%), se puede decir que las frecuencias observadas difieren significativamente de las frecuencias esperadas y entonces la hiptesis Ho se rechaza (para esos niveles de significancia). Si ocurre lo contrario, entonces se acepta. Este procedimiento es llamado la prueba de hiptesis Chi- cuadrado.
B B

Ejemplo 5.16
Se tienen los valores de temperatura mensual de una ciudad, mostrados en la tabla 5.5 . Se supone que estas temperaturas se ajustan a una distribucin Normal. Usando la prueba Smirnov-Kolmogorov, verificar la validez de esta hiptesis.

Solucin:
La media de la muestra es 76.4F y la desviacin estndar es 3.1 F. Se fijan dos hiptesis: una hiptesis Ho estipula que la variable X es normalmente distribuida con los valores de la media y desviacin estndar calculados anteriormente y la otra hiptesis alternativa, Ha, es lo contrario de sta.
B B B B

Se puede fijar un intervalo de 1 F y se hace la tabla 5.6 donde FE(T) es la frecuencia acumulada de la muestra, fT (t) es la frecuencia, FE(t)N es la distribucin de probabilidades acumulada emprica y FT(t) es la distribucin de probabilidades acumulada Normal (se halla utilizando el concepto de variable reducida u y usando la tabla 5.1)
B B B B

El mayor valor Dn es 0.0758. El valor Da obtenido de la tabla 5.5 para un ; del 90% es igual a 0.1963, lo cual significa que la hiptesis Ho puede aceptarse.
B B B B B B

TABLA 5.5 Temperaturas en F8


P P

137

Ao 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959

Junio 77 72 76 74 78 75 75 73 82 79 78 69 74 75 72 72

Julio 77 76 78 74 80 79 73 78 81 80 83 80 77 76 76 75

Agosto 77 76 74 83 76 74 70 78 77 78 80 79 77 74 74 76

TABLA 5.6 Distribuciones de probabilidades emprica y Normal para la temperatura.

138

T 68 69 70 71 72 73 74 75 76 77 78 79 80

fT(t)
B B

FE(t) 0 1 2 2 5 7 14 18 25 31 37 40 44

FE(t)N 0 0.0208 0.0417 0.0417 0.1042 0.1458 0.2917 0.3750 0.5208 0.6458 0.7708 0.83333 0.9167

FT(t)
B B

FE(t)N -FT(t)
B B

0 1 1 0 3 2 7 4 7 6 6 3 4

0.0035 0.0084 0.0197 0.0409 0.0778 0.1357 0.2206 0.3264 0.488 0.5753 0.6950 0.7995 0.8770

0.0045 0.0124 0.022 0.0008 0.0264 0.0101 0.0711 0.0486 0.0328 0.0705 0.0758 0.0338 0.0397

81

45

0.9375

0.9306

0.0069

Ejemplo 5.17

139

Se tienen los caudales mximos instantneos de la estacin RP-3 en el Ro Murr, en el departamento de Antioquia. Se desea encontrar el caudal de un perodo de retorno de 50 aos hallado con las distribuciones Gumbel, Lognormal de dos parmetros y Log Pearson tipo III.

Ao
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991

Q m3/s
P P

3239.0 3431.7 4577.9 3612.0 4151.8 1949.0 2342.9 1345.0 1862.2 1652.8 4220.0 4958.4 2664.9 1392.7

Solucin
Distribucin Gumbel Aplicando la ecuacin de Ven Te Chow se tiene que: Q Tr = 50 = + K y: = 2957.2 m3/s
P P

= 1234 .58 m3/s


P P

140

De la ecuacin 5.67 se halla el factor de frecuencia K=2.5924 Se tiene entonces que: QTr=50=6158 m3/s
B B P P

Aplicando la ecuacin 5.68 y 5.69 para hallar el error estandar, ST se obtiene que:
B B

ST=1111.458 m3/s
B B P P

Para ;=0.05 se obtiene de la tabla 5.1 que T0.95=1.645 y aplicando la ecuacin 5.70 para los intervalos de confianza se obtiene finalmente que:
B B

(4329.37 QTr=50=61587986.07)
B B

Distribucin Log-Normal Con los logaritmos de los valores de caudales mximos instantneos se obtiene que: y = 7.903

y = 0.4504
Aplicando la ecuacin 5.59 para hallar el factor de frecuencia K y utilizando la tabla 5.1 se halla: K=2.055 De la ecuacin 5.58:

ln QTr=50=8.8286 y sacando el antilogaritmo :


B B

QTr=50=6827 m3/s
B B P P

Con las ecuaciones 5.62 y 5.63 se obtiene un error estandar ST=0.2123


B B

141

Para un ;=0.05 se obtiene de la tabla 5.1 T0.95=1.64. Finalmente :


B B

(4814.4QTr=50=68279679.84)
B B

Distribucin Pearson Tipo III Se tiene que: = 2957.2 = 1234.6 = 0.1702 De la tabla 5.2 se obtiene el valor del factor de frecuencia K:

K=2.144
y aplicando la ecuacin de Ven TE Chow:

QTr=50=5604 m3/s
B B P P

Con la ecuacin 5.82 y con la tabla 5.3 se obtiene un error estandar ST=809.05 y los intervalos de confianza para ;=0.05 son entonces:
B B

(4273QTr=50=56046934.9)
B B

142

Potrebbero piacerti anche