Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
73
La planeacin y el diseo de proyectos relacionados con el agua necesitan informacin de diferentes eventos hidrolgicos que no son gobernados por leyes fsicas y qumicas conocidas, sino por las leyes de azar. Por ejemplo, el caudal de un ro vara da a da y ao tras ao, y no puede predecirse exactamente cual ser su valor en un perodo de tiempo cualquiera. En el caso del diseo de un puente, el estudio hidrolgico determinara la creciente asociada con una probabilidad crtica(se busca determinar el caso crtico), la cual se supone representa el riesgo para el puente. Esto solo puede determinarse a travs del anlisis probabilstico y estadstico basado en los registros hidrolgicos del pasado. Es dable afirmar que la hidrologa, en algunos casos, trata con variables aleatorias cuyo comportamiento no puede predecirse con certidumbre. El comportamiento de una variable aleatoria est descrito por una ley de probabilidades, la cual asigna medidas de probabilidad a posibles valores o rangos de ocurrencia de la variable aleatoria. Las variables aleatorias pueden ser discretas o continuas. Se dice que una variable aleatoria es discreta si ella slo puede tomar valores especficos. Por ejemplo, si N denota el nmero de das lluviosos en el mes de diciembre, entonces N es una variable aleatoria discreta. En este caso, la ley de probabilidades asocia medidas de probabilidad a cada posible ocurrencia de la variable aleatoria.
U U
Una variable aleatoria es continua si puede tomar todos los valores en un rango de ocurrencia. Por ejemplo, si Q es una variable aleatoria que denota el valor de los caudales promedios diarios del ro Magdalena, entonces Q
U U
74
puede asumir cualquier valor y es entonces una variable aleatoria continua En este caso la ley de probabilidades asigna medidas de probabilidad a rangos de ocurrencia de la variable aleatoria. En el anlisis probabilstico y estadstico en hidrologa, se asume que la informacin histrica disponible de una variable hidrolgica representa una muestra tomada de una poblacin cuyas caractersticas se desconocen. En el anlisis probabilstico se analizan posibles leyes de probabilidad que pueden describir el comportamiento de las variables de la poblacin. En el anlisis estadstico, se hacen inferencias sobre la variable (la poblacin), usando la muestra. Por ejemplo, cuando se calcula una media con observaciones disponibles, se est infiriendo que la media calculada es la media de la poblacin, lo cual no necesariamente es verdad, pues esto depender de la calidad de la informacin, del nmero de observaciones y otros aspectos. El hecho es que muchos fenmenos hidrolgicos son errticos, complejos y de naturaleza aleatoria, y solo pueden ser interpretados en un sentido probabilstico. Uno de los problemas ms importantes en hidrologa es la interpretacin de registros de eventos pasados para inferir la ley de probabilidades de la variable hidrolgica (poblacin) de inters, procedimiento que en hidrologa se conoce con el nombre de anlisis de frecuencia. Por ejemplo supngase que se tienen registros del caudal del ro Magdalena durante un perodo de 50 aos. Son factibles dos tipos de anlisis: descriptivo y de inferencia. El primero se realiza sin ninguna referencia a su poblacin, de la cual se tiene una muestra de 50 aos. Consiste, bsicamente, en calcular propiedades estadsticas, como media, varianza y otras. En el segundo, la muestra se analiza para inferir las propiedades de su poblacin, lo cual ayudar a derivar las caractersticas probabilsticas del caudal. El primero es una aplicacin de los mtodos estadsticos que
75
requieren poca decisin y poco riesgo. El segundo involucra riesgos y requiere una total comprensin de los mtodos empleados y el peligro involucrado en la prediccin y estimacin de las variables. Los objetivos bsicos de la estadstica en la hidrologa son entre otros: 1) 2) 3) 4) 5) Interpretacin de las observaciones Anlisis de la calidad de la informacin Inferencia sobre el comportamiento de la variable Extraccin del mximo de informacin de los registros Presentacin de la informacin en grficas, tablas, ecuaciones, que bsicamente ayudan a la toma de decisiones en el planeamiento de los recursos hdricos.
En resumen, el objetivo principal de la estadstica en hidrologa es obtener informacin de los fenmenos hidrolgicos pasados y hacer inferencias acerca de su comportamiento en el futuro.
5.1 CONCEPTOS BSICOS 5.1.1 Concepto de probabilidad. La probabilidad de ocurrencia de un evento dado es igual a la relacin entre el nmero de sucesos favorables m y el nmero de sucesos totales, n:
P( X = x ) = m n
(5.1)
76
1)
(5.2)
P
i =1
B B B B
=1
(5.3)
P ( X 1 X 2 ) = P( X 1 ) + P( X 2 )
(5.4)
Dos eventos son independientes si la probabilidad de ocurrencia de uno no se ve afectada por la ocurrencia del otro,. y se dice que son mutuamente excluyentes cuando la ocurrencia de uno imposibilita la ocurrencia del otro. Los axiomas anteriores permiten la definicin de conceptos importantes. Por ejemplo, si dos eventos X1 y X2 no son mutuamente excluyentes, la probablidad de que ocurra X1 u ocurra X2 est dada as:
B B B B B B B B
P ( X1 X 2 ) = P ( X1 ) + P ( X 2 ) P ( X1 X 2 )
(5.5)
77
La probabilidad de que dos eventos independientes ocurran de manera simultnea es el producto de las probabilidades individuales as:
P ( X1 X 2 ) = P ( X1 ) P ( X 2 )
(5.6)
La probabilidad de que ocurra un evento X1 dado que ha ocurrido X2 se llama probabilidad condicional y se denota as:
B B B B
P(
X1
X2
) = P(
X1 X 2 ) P( X 2 )
(5.7)
Ejemplo 5.1 Supngase que el ro Cauca alcanza cada invierno un nivel de creciente con una frecuencia relativa de 0.2. En el Cauca hay un puente cuya probabilidad de falla en los estribos es 0,3 y la experiencia muestra que cuando hay creciente, las probabilidades de esta falla suben a 0,5. Las probabilidades son: P(creciente) = P(C) = 0,2 P(no creciente) = P(C) = 0,8 P(falla) = P(F) = 0,3 P(no falla) = P(F) = 0,7 P (falla dada creciente) = P(F/C)= 0,5 Se desea conocer la probabilidad de falla del puente. Solucin: El puente falla (queda inutilizado) cuando falla en los estribos o cuando hay creciente; esto se puede denotar as:
78
P( C F ) = P( C ) + P( F ) P( C F )
5.1.2
Perodo de retorno:
B B
Se define el perodo de retorno, Tr, de un evento de cierta magnitud como el tiempo promedio que transcurre entre la ocurrencia de ese evento y la prxima ocurrencia de ese evento con la misma magnitud. Se define tambin como el tiempo que transcurre para que un evento sea excedido o igualado, al menos una vez en promedio. Si P es la probabilidad de excedencia, se puede demostrar matemticamente que: 1 (5.8) Tr = P Por ejemplo, si un caudal de 8098 m3/s es excedido en promedio una vez cada 10000 aos, entonces su perodo de retorno, Tr, es de 10000 aos.
P P B B
5.1.3
Concepto de riesgo.
En el diseo de obras hidrulicas expuestas a grandes avenidas, es necesario considerar el riesgo asociado con el valor seleccionado para el diseo. Por lo comn, el ingeniero disea una obra para resistir una avenida de cierta magnitud. Se define el riesgo R de un diseo como la probabilidad de que la avenida para la cual se disea la obra sea excedida. Se entiende que sta es
79
una situacin de riesgo, pues la obra se disea para soportar cierta avenida mxima , y crecientes mayores le podran hacer dao o incluso destruirla. El riego R puede entonces escribirse como: 1 n R = 1 - (1 - ) (5.9) Tr La confiabilidad se define como el complemento del riesgo (Confiabilidad = 1-R). Se quiere que la obra tenga un riesgo pequeo de daarse o, lo que es lo mismo, una alta confiabilidad. Ejemplo 5.2 Qu perodo de retorno debe escoger un ingeniero en el diseo de un box-culvert, si se acepta solo el 10% de riesgo de avenida en una vida til, n, de 25 aos? Solucin: Aplicando la ecuacin 5.9 se tiene: R = 0.1 = 1 - (1 1 Tr )
25
T
TR = 238 aos
B B
Ejemplo 5.3 Una presa por gravedad puede fallar por deslizamiento (A), por crecientes (B), o por ambas. Asumir que : 1) La probabilidad de falla por deslizamiento es dos veces la probabilidad de falla por creciente: P(A)=2 P(B)
80
2) La probabilidad de falla por deslizamiento, dado que ha habido creciente, es 0.8 3) La probabilidad de falla de la presa es de 1*10-3
P
Determinar la probabilidad de que ocurra un deslizamiento, P(A). Solucin: La presa queda inutilizada cuando se presenta una falla por deslizamiento o cuando hay una creciente, lo que puede expresarse como:
P( A B ) = 0.001 = P( A ) + P( B ) P( A B )
(1)
(2)
(3)
81
Ejemplo 5.4 De 1000 circuitos de tubera de acueducto en una ciudad, se reportan 15 contaminados con materias fecales; 5 tienen excesivas concentraciones de plomo (Pb) y entre stos dos de ellos contaminados tambin por materias fecales. Se pregunta:
B B
a) b)
c)
d)
Cul es la probabilidad de que un sistema seleccionado al azar resulte con contaminacin fecal? Suponiendo que un sistema se encuentre contaminado con materias fecales, cul es la probabilidad de que tambin est contaminado con plomo? Cul es la probabilidad de que un sistema seleccionado al azar est contaminado? Suponiendo que la probabilidad de contaminacin hallada en el numeral anterior no es satisfactoria, y que se desea que no exceda de 0.01, cul es el valor permisible para la probabilidad de contaminacin por materias fecales, asumiendo que el valor de la probabilidad condicional hallada en el numeral b an se puede aplicar?
Solucin: Llamemos P(F) a la probabilidad de contaminacin por materia fecal, P(Pb) a la probabilidad de contaminacin por plomo y P(C) a la probabilidad de contaminacin por plomo o por materia fecal. Se tiene entonces:
B B
P( Pb / F ) =
P(Pb F) P(F)
82
c)Se pregunta en este numeral el valor de P(C); este valor establece la probabilidad de que un circuito est contaminado con plomo o con materias fecales. Como hay 15 circuitos contaminados con materias fecales y 5 contaminados con plomo, se tiene entonces que: P(C) = 20/1000= 0.002 d) La probabilidad de contaminacin C se puede expresar como: P( C) = P( F Pb ) P( F ) + P( B ) P( F Pb ) y se conoce el valor de la probabilidad condicional:
P( Pb / F ) = 2 / 17 = P( Pb F ) P( F )
(1)
(2)
Tal como se haba mencionado anteriormente, el comportamiento de las variables aleatorias discretas o continuas se describe con la ley de probabilidades asociada, que asigna medidas de probabilidad a ocurrencias o a rangos de ocurrencia de la variable. Estas leyes de probabilidad reciben el nombre de funciones de distribuciones de probabilidad. Como notacin, se representa por una letra mayscula la variable aleatoria, y por una letra minscula, un valor especfico, una relacin o una muestra de la variable.
U U U U U U
P(X = a) indica la probabilidad de que la variable aleatoria X tenga un valor de a; similarmente, P(a<X<b) indica la probabilidad que la variable
83
aleatoria X est en el intervalo [a, b] .Si se conoce la probabilidad P(a<X<b) para todos los posibles valores de a y b, se dice que se conoce la distribucin de probabilidades de la variable X. Si se tiene una muestra cuyas observaciones se asumen extradas de una misma poblacin (idnticamente distribuidas), ellas pueden presentarse como un histograma de frecuencias. Todo el rango disponible de la variable aleatoria se divide en intervalos discretos; se cuenta el nmero de observaciones que cae en cada intervalo, y el resultado se dibuja en un diagrama de barras como el mostrado en la Figura 3.1, que representa la precipitacin promedio anual en una estacin.
U U U U U U
FIGURA 5.1 Histograma de frecuencias. Supngase que se tiene una variable continua y el ancho x del intervalo que se usa para el histograma se escoge tan pequeo como sea posible; supngase igualmente que se tiene el suficiente nmero de observaciones en cada intervalo, para que el histograma de frecuencia muestre variaciones suaves en todo el rango de valores. Si el nmero de observaciones ni en el intervalo i que cubre el rango [xi-x, xi] se divide por el nmero total de observaciones, N, el resultado se denomina funcin de frecuencia relativa fs (x):
B B B B B B U U U U U U U U B B
84
f s ( xi ) =
B B
ni n
B B
(5.10)
la cual es un estimado de P( xi -x<X<xi), la probabilidad de que la variable aleatoria X caiga en el intervalo [xi -x, xi]. El subndice s indica que la funcin es calculada de los datos muestrales.
B B B B
La suma de los valores de las frecuencias relativas en un punto es la funcin de frecuencia acumulada, Fs(x),dada como:
U U U U U U U U U
F S ( x i ) = f S ( x j)
j =1
(5.11)
Este es un estimado de P(X xi), la probabilidad acumulada de xi, o funcin acumulada de probabilidades.
B B B B
Las funciones de frecuencia relativa y frecuencia acumulada se definen para una muestra. Las funciones correspondientes a la poblacin se obtienen en el lmite cuando n: y x 0. En el lmite, la funcin de frecuencia relativa dividida por el intervalo x, se convierte en la funcin de densidad de probabilidades fX(x)
U U U U U U U U U U U U B B
(5.12)
U
(5.13)
85
f X (x) =
(5.14)
Para un valor dado de la variable aleatoria X, Fx(x) es la probabilidad acumulada P(X x), y puede expresarse como la integral de la funcin de densidad para el rango X x.
B B
P(X x) = FX (x) =
(u)du
(5.15)
en donde u es una variable de integracin. Si se tiene la funcin de distribucin acumulada para una variable X y se tiene un valor xA de esa variable, (ver Figura 5.2) se cumple que:
B B
FX (xA ) = P (X x A )
(5.16)
Una forma bastante usada en hidrologa para escribir el valor de una variable hidrolgica asociada a cierto perodo de retorno es la de utilizar lo que se conoce como factor de frecuencia, K. En este caso, el valor de la variable se puede escribir como:
X A = + K
(5.17)
86
Donde representa la media y es la desviacin tpica de la variable hidrolgica. XT es el valor de la variable aleatoria asociada a un perodo de retorno T. Como se sabe:
B B
FX (X T ) = P (X XT )
= 1 - P (X > XT )
P(XXT ) representa la probabilidad de excedencia, la cual est relacionada con el perodo de retorno como:
B B
P( X X T ) =
1 T
(5.18)
FX(x)
De donde:
FX ( X T ) = 1 1 T
87
O:
FX ( + K ) = 1 1 T
Y se obtiene finalmente:
K= 1 1 1 FX 1 T
FX-1 ( ) representa el inverso de la distribucin acumulada de probabilidades. Por ejemplo, para obtener FX-1 (1 - 1/T), se entra al grfico 5.2 con el valor de 1-1/T al eje de probabilidades, y se lee en el otro eje el valor del inverso de la distribucin acumulada de probabilidades. Lo que significa que el factor de frecuencia es funcin de la distribucin de probabilidades y del perodo de retorno que se escoja.
B PB P B PB P
La funcin de densidad de probabilidades tiene las siguientes caractersticas cuando la variable aleatoria es continua: 1)
(x)dx = 1
(5.19)
2)
P(a X b) = f X (x)dx
a
(5.20)
3)
f X (x)dx = 0
b
(5.21)
Cuando la variable aleatoria es discreta las anteriores propiedades se pueden denotar as:
88
1)
f (x ) = 1
i i
(5.22)
2)
P( a X b ) =
xi b xi a
f (x )
i
(5.23)
3)
P( X x j ) = f ( x i )
i =1
i= j
(5.24)
Lo que implica que las probabilidades se definen solo como reas bajo la funcin de densidad de probabilidades, FDP, entre lmites finitos. Ejemplo 5.5 Hallar la funcin de distribucin acumulada para una variable aleatoria que se define como el nmero de veces que se lanza una moneda, hasta que aparece cara. Solucin: La probabilidad de que caiga cara en cualquier ensayo es y es independiente de la probabilidad de que caiga sello. Si A es el evento de que caiga sello en el primer ensayo y B (es el evento) de que caiga sello en el segundo ensayo, la probabilidad que suceda A y B es:
89
Si hay x-1 ensayos, la probabilidad de que caiga sello en el ensayo (x-1) es (1/2)x-1 y la probabilidad de cara en el x-avo ensayo es:
P P
(1/2)x-1 = (1/2)x
P P P P
7/8
en donde x es el nmero de ensayos, P(X=x) es la probabilidad de ocurrencia de sello en todos los ensayos y FX(x) es la funcin de probabilidades acumulada.
B B
Las propiedades matemticas de las distribuciones estadsticas pueden ser definidas en trminos de los momentos de la distribucin. Los momentos representan parmetros que tienen significado fsico o geomtrico. Se reconocer fcilmente la analoga entre los momentos estadsticos y los momentos de rea estudiados en mecnica de slidos. El r-avo momento con relacin al origen se define como:
r =
f X (x)dx
(5.25)
90
o en el caso discreto:
r = xr f X ( xi ) i
i =1
(5.26)
El subndice se usa para momentos respecto al origen. El primer momento con respecto al origen representa la media de la distribucin. Los momentos pueden definirse con respecto a otro punto distinto al origen. Por ejemplo, el r-avo momento con respecto a la media se puede escribir como:
r = (x - ) f X (x)dx
r
(5.27) (5.28)
r = f X ( x i )( x ) r
i =1
- n
La primera de estas ecuaciones para el caso de una variable aleatoria continua y la segunda si la variable es discreta. Rara vez se necesita calcular ms de tres momentos. Estos son usados para estimar los parmetros y describir las caractersticas de la distribucin.
5.4
Uno de los usos de la estadstica es extraer la informacin esencial de una muestra de datos, para determinar las caractersticas y el comportamiento de la poblacin. Hay algunas caractersticas bsicas, como la media, la varianza y otras que se pueden calcular o estimar utilizando la muestra de datos disponibles, para tratar de entender el comportamiento general de la poblacin.
91
En general, las caractersticas estadsticas bsicas se calculan como el valor esperado E de alguna funcin de una variable aleatoria. El valor esperado de una funcin g(X) de una variable aleatoria X se define como:
U U U U U U U U
E[g( X )] =
g( u )f
( u )du
(5.29)
Las principales caractersticas son: La media : representa el valor esperado de la variable misma. Para una variable aleatoria X, la media E(X) es el primer momento con respecto al origen; es una medida de la tendencia central de la distribucin:
E(X) = =
xf
(x)dx
(5.30)
1 N x = xi N i =1
P P
(5.31)
La varianza 2: mide la variabilidad de los datos, la dispersin de los mismos alrededor de la media. Es el segundo momento respecto a la media:
92
E[(X - ) ] = 2 = (x - ) f X (x)dx
2 2 -
(5.32)
2 x =
-
1 N 2 ( xi x ) N - 1 i =1
(5.33)
La desviacin estndar : es una medida de la variabilidad con las mismas dimensiones que X; es la raz cuadrada de la varianza y su valor estimado se denota por . Mientras mayor sea la desviacin estndar, mayor es la dispersin de los datos. ( ver Figura 5.3).
El coeficiente de variacin CV: est definido por la relacin de la desviacin estndar y la media, y se puede escribir como: CV = cuyo estimado es (5.34)
(5.35)
93
FIGURA 5.3 Distribucin de probabilidades con diferente desviacin estndar. La asimetra se hace adimensional dividiendo la anterior ecuacin por 3 y se obtiene as, el coeficiente de asimetra :
P P
1
3
E[(x - ) ]
(5.36)
x =
N ( xi - x )
i =1
(5.37)
3
(N - 1)(N - 2) x
Como se muestra en la Figura 5..4, para >0, asimetra positiva, los datos se concentran a la derecha y para <0, asimetra negativa, los datos se concentran a la izquierda.
94
<0
>0
fX (x)
Solucin:
95
En total se tiene 100 valores, para cada intervalo se halla el valor medio o marca de clase y se le asigna una frecuencia relativa, la cual es la frecuencia absoluta sobre el nmero total de valores (100). El valor medio de cada intervalo es xi y la frecuencia relativa es fx(xi).
B B B B B B
Intervalo clase (mm) 100-110 110-120 120-130 130-140 140-150 150-160 160-170
F. absoluta
F. relativa fx(xi)
B B B B
xi fx(xi)
B B B B B B
10 16 9 10 20 15 20 =100
x = xifx(xi)=138.9 mm.
B B B B B B
5.5
El uso de estas distribuciones se restringe a aquellos eventos aleatorios en los cuales el resultado puede ser descrito solamente como un xito o como
96
un fracaso, esto es, solo hay dos eventos mutuamente excluyentes para un experimento. Adems, los experimentos sucesivos son independientes y la probabilidad permanece constante de ensayo a ensayo. Un ejemplo en hidrologa sera la probabilidad de que un da sea lluvioso o seco. La distribuciones de este tipo ms usadas en hidrologa son la distribucin binomial y la geomtrica.
Puede generalizarse de tal manera que la probabilidad de x excedencias es n aos est dada por (n/x)pxqn-x , lo que tambin puede expresarse as:
P P P P
P( X = x ) =
n! p x (1 p )n x x! (n x)!
(5.38)
expresin conocida como distribucin binomial. Los parmetros de esta distribucin son:
97
= np 2 = np(1 p ) = (q p ) npq
(5.39)
Ejemplo 5.7
Como se dijo anteriormente, una creciente de Tr aos de perodo de retorno se define como aqulla que tiene una probabilidad de excedencia de 1/Tr en cualquier ao. Asumiendo que las mximas crecientes anuales son independientes, la distribucin binomial permite resolver varios problemas prcticos en hidrologa, as:
B B B B
a) Cul es la probabilidad de que una creciente con un perodo de retorno de 50 aos ocurra exactamente en ese perodo? Aplicando la ecuacin 5.38 se tiene:
P( X = 1) =
b)
50 1 ( ) 1 (1 1 / 50) 49 = 0.37 3 50
Cul es la probabilidad de que en 50 aos se presenten 3 crecientes que igualen o excedan la de Tr =50 aos?
B B
c)
Cul es la probabilidad de que una o ms crecientes excedan el caudal con 50 aos de perodo de retorno en ese mismo tiempo?
La clave para contestar esta pregunta est en las palabras una o ms. Como los eventos son independientes y mutuamente excluyentes, se puede escribir:
98
P[una o ms crecientes en 50 aos] = 1 - P[no crecientes en 50 aos] o lo que es lo mismo: P[una o ms crecientes en 50 aos]= 1
50 (1 / 50) 0 (1 1 / 50) 50 = 0.64 0
P = (1 p )n 1 p
(5.40)
(5.41)
Ejemplo 5.9
El mximo nivel de la creciente anual de un ro se denota por H (metros): Asumiendo que la funcin de densidad de probabilidad se describe como se muestra en la grfica, determinar: a) La altura de inundacin para un perodo de 20 aos.
99
b) Cul es la probabilidad de que durante los prximos 20 aos la altura hallada en el numeral anterior sea excedida al menos una vez?. c) Cul es la probabilidad de que durante los prximos 5 aos este valor sea excedido exactamente una vez?
F(H)
H(m)
Solucin:
a) El rea bajo la funcin de densidad es 1, que equivale a P(5[H[7) =1. Para un caudal con un Tr de 20 aos se cumple que:
B B
P( H H Tr=20 ) = 1 / 20 = 0.05
lo que significa que 0.05 es un rea bajo la funcin de densidad y:
P( H H Tr=20 ) = 1 0.05 = 0.95
100
0.05 =
(7 H Tr=20 )(0.95) 2
b) Se puede escribir la siguiente ecuacin: P(HTr=20 sea excedida al menos una vez) =1 - P(HTr=20 no sea excedida)
B B B B
Aplicando la ecuacin 5.38 (binomial ) se puede escribir entonces: sea excedida P(HTr=20 20 1 (0.05) 0 (0.95) 20 = 0.642 0
B B B B
al
menos
una
vez)
O sea que P(HTr=20 sea excedida al menos una vez) = 0.642 b) Aplicando tambin la ecuacin 5.38, se tiene:
5 P( H Tr = 20 = 1) = (0.05)1 (0.95) 0.4 = 0.024 1
Ejemplo 5.9
Tres diques de control de inundaciones se construyen en una planicie por la cual corren dos ros, tal como se muestra en la figura. Los diques se disean as: El dique I tiene un caudal de diseo con un perodo de retorno de 20 aos. El dique II tiene un caudal de diseo con un perodo de retorno de 10 aos El dique III tiene un caudal de diseo con un perodo de retorno de 25 aos. Asumir que las crecientes en los ros A y B son estadsticamente independientes y que las fallas de los diques I y III tambin lo son.
101
a) Cul es la probabilidad de inundacin en un ao cualquiera producida solamente por el ro A. b) Cul es la probabilidad de inundacin de la planicie en un ao? c) Cul es la probabilidad de que no haya inundacin en los prximos 4 aos?
Solucin:
a)El ro A puede producir inundacin en la planicie si falla el dique I o si falla el dique II, lo que se puede expresar como:
P(I II ) = P(I ) + P(II ) P(I II ) P(I II ) = 0.05 + 0.1 0.1 0.05 = 0.145
b) La probabilidad de inundacin se da por el ro A o por el ro B, lo que puede expresarse como: P( A B ) = P( A ) + P( B ) P( A B ) P(A)=0.145, hallado en el numeral anterior y P(B) =1/25=0.04, lo que implica que:
102
c) La probabilidad de inundacin, P, en cualquier ao, es 0.179, como se explic en el numeral anterior, y la probabilidad ,q, de no inundacin ser entonces: q =1 -P =1 - 0.179 =0.821 y la probabilidad de no inundacin en 4 aos ser entonces:
Ejemplo 5.10
Un proyecto se disea con un caudal que tiene un perodo de retorno de 10 aos. Cul es la probabilidad de que este caudal se presente por primera vez al quinto ao de acabado el proyecto?
Solucin:
Este es un ejemplo donde puede aplicarse la distribucin geomtrica, as: La probabilidad de excedencia, p, para este caso es :
p =1/Tr=1/10=0.1
Entonces:
103
La mayora de las variables hidrolgicas son variables aleatorias continuas. Enseguida se describen brevemente las distribuciones de probabilidades ms usadas en anlisis de frecuencia de estas variables.
f X (x) =
1 x 2
( x x )2 2 2 x
(5.42)
Los parmetros de la distribucin son dos: la media,x, y la desviacin estndar x. La asimetra de la distribucin es cero. Esta distribucin tiene una forma de campana simtrica, como se muestra en la Figura 5.5, por lo tanto la media, la moda y la mediana son iguales.
B B B B
104
= (x x ) / x
se obtiene como FDP y como funcin acumulada de la variable :
f u (u) =
1 - u2 e 2 2
1 Fu (u) = 2
-w 2
(5.43) d
105
Aproximar la distribucin de probabilidades de errores aleatorios . Comparar distribuciones: las propiedades de una muestra de variables no normales pueden compararse con las de variables normales. Muchos estadsticos pueden ser normalmente distribuidos, como, por ejemplo, la media de la mayora de las variables hidrolgicas.
106
(5.44) (5.45)
N 1 = ( x i )1 / 2 N
(5.46)
que es la misma variable reducida, definida por la ecuacin (5.41). La magnitud de la variable XT para un perodo de retorno dado T puede encontrarse, utilizando el factor de frecuencia, con el siguiente procedimiento: 1 1 1. F u (K ) = 1 K = Fu1 (1 ) T T
B B
107
2.
1 Usando el valor calculado de 1 en la tabla 5.1, se lee el valor T de x en la primera columna, que corresponde a K o F-1 (1- 1/T)
P P P P B B
3.
X T = + K
Ejemplo 5.11
Se tiene una estacin con 30 aos de datos de caudales medios anuales con media de 117 m3/s y desviacin estndar de 94 m3/s. Si los datos se ajustan a una distribucin Normal, cul es el caudal correspondiente a un perodo de retorno, Tr, de 100 aos?.
P P P P B B
Solucin:
En este caso se puede escribir: Fu(K) = 1 - 1/Tr = 0.99 K = Fu-1 (0.99) Con el valor de 0.99 en la tabla 5.1, se obtiene: K = 2.326 El valor asociado a Tr=100 se calcula como: Q100 = Q + Q K = 117 + 94 x 2.326 = 335.6 m3/s
B B B B B PB P B B P P
108
valor estimado de la media, y si es pequea, habr, por el contrario, mucha confianza en ese valor estimado. Con ese fin se utilizan los llamados intervalos de confianza. Supngase, por ejemplo, que se desea estimar la media de la poblacin, . Asmase que 1 y 2 son dos estadsticos (funciones de la muestra aleatoria) tales que: 1 < 2 y P(1< < 2) =;. Entonces [1 , 2] es llamado el intervalo de confianza para la media ., ; es llamado el nivel de confianza (nivel de probabilidad) y 1 y 2 son llamados los lmites de confianza inferior y superior, respectivamente. Esta definicin puede extenderse al intervalo de estimacin de un parmetro cualquiera o a una funcin del parmetro. Se debe tener en cuenta que los intervalos de confianza y los lmites de confianza son realmente variables aleatorias, ya que son funciones del tamao de la muestra y de estimadores a su vez, funcin de muestras aleatorias. Como los tamaos de la muestra varan, los intervalos de confianza cambian de una muestra a otra. Mientras ms estrecho es el intervalo de confianza, mejor es el procedimiento de estimacin.
Para el valor estimado asociado a un perodo de retorno cualquiera, los intervalos de confianza se calculan usando el error estndar, ST, el cual es una medida de la desviacin estndar de la magnitud de un evento calculado a partir de una muestra respecto a la verdadera magnitud del evento. Se presentarn para todas las distribuciones, los intervalos de confianza para los diferentes cuantiles de la poblacin.
B B
Para la distribucin Normal, los lmites de confianza para el verdadero valor de un cuantil asociado con un periodo de retorno T son:
XT u1- ST
(5.47)
109
en donde ; es el nivel de probabilidad, u1- es el cuantil de la distribucin Normal estandarizada para una probabilidad acumulada de 1- y ST es el error estndar.
B B B B
Cada distribucin tiene expresiones para hallar el error estndar, por ejemplo, el de la distribucin Normal es:
ST =
1 x (1 + K 2 / 2)2 N
(5.48)
Ejemplo 5.12
Los caudales medios anuales de un ro con media 1.5 m3/s y desviacin estandar de 0.6 m3/s se distribuyen normalmente. Cul es la probabilidad de que se produzca un caudal medio igual o menor a 1 m3/s, en cualquier ao?.
P P P P P P
Solucin:
Se tiene entonces que:
P( X 1) = P( 1 )
En la tabla 5.1, se encuentra P(-0.83). Considerando la simetra de la distribucin normal (ver Figura 5.6 en donde A = B), se tiene:
110
Solucin:
P 280) = P(
y:
P( 0.997 ) = 1 0.8413 = 0.1587
111
contribuyente, prdidas, coeficiente de evaporacin, etc. En general, cuando la variable aleatoria X es el producto de un gran nmero de otras variables aleatorias, la distribucin de los logaritmos de X puede aproximarse a la Normal, ya que los logaritmos de X son la suma de los logaritmos de los factores contribuyentes. Si se tiene una variable aleatoria X y ln X = Y se ajusta a una distribucin Normal, se dice que la variable aleatoria X es lognormalmente distribuida. La funcin de densidad de esta distribucin, si se asume que Y=loga(X), donde a es la base del logaritmo, es:
B B
1 y - y 1 f X (x) = exp 2 y x 2 2 y
B B B B
(5.49)
y es el parmetro de escala y y es el parmetro de forma. La forma de la distribucin lognormal se muestra en la Figura 5.7.
112
Se ha demostrado que la distribucin lognormal puede aplicarse en un amplio nmero de eventos hidrolgicos, especialmente a aquellos casos en los cuales la variable tiene un lmite inferior, la distribucin emprica no es simtrica y los factores que causan los eventos son independientes y multiplicativos. Si la variable aleatoria X tiene un lmite inferior xo diferente de cero, y la variable Z = X -xo sigue una distribucin lognormal con dos parmetros, entonces X se ajusta a una distribucin lognormal con tres parmetros. La funcin de densidad de esta distribucin es:
B B B B
1 ln (X - xo ) - y 1 f X (x) = exp 2 (X - xo ) y y 2
B B B B B B
(5.50)
donde los parmetros y, y y xo son llamados los parmetros de escala, forma y localizacin respectivamente. La distribucin lognormal con tres parmetros puede aplicarse a eventos con valores positivos o negativos, siempre que x x0; mientras que la lognormal con dos parmetros solo puede aplicarse a eventos con valores positivos.
B B
(5.51) (5.52)
1 N 2 Y = [log a ( X i ) Y ] N i =1
Para la distribucin lognormal de tres parmetros, xo debe tambin estimarse. Una manera de estimar xo requiere que el coeficiente de asimetra sea
B B B B
113
positivo. En este mtodo, el segundo momento de Z = X - xo no depende de x0, esto es, z = x y z = x - x0, entonces el lmite inferior xo se puede expresar como: Cv x (5.53) x0 = x 1 Cv z Donde:
B B B B B B B B B B B B B B B B
Cv x =
x x
Cv z = z z
(5.54)
Donde:
Cvz =
(1- w )
2/3
1 w = - x + 2 + 4 x 2
B B
1/3 1/2
];
(5.55)
x > 0
en donde x es el coeficiente de asimetra de x. Los parmetros de la distribucin lognormal de dos parmetros tambin pueden estimarse con base en las relaciones entre los parmetros de la variable transformada Y y Y y los parmetros de la variable original X y X, dadas como: 1 2 Y = log a ( X ) Y (5.56) 2
B B B B B B B B
Y = log a 1 + X 2 X
2
1 2
(5.57)
114
En este caso, se estiman X y X con los datos originales, y con las ecuaciones anteriores se estiman Y y Y los parmetros de la distribucin lognormal.
B B B B B B B B
Ejemplo 5.14
Los caudales medios de un ro en una estacin hidromtrica han sido modelados con las siguientes distribuciones: a) Normal con parmetros = 256.7 m3/s y = 191 m3/s b) Lognormal con parmetros y = 5.228 y y = 0.84
P P P P B B B B
Calcular la probabilidad de que el caudal medio est entre 300 y 400 m3/s
P P
Solucin:
a) Si se usa la Normal se tiene:
P(300[Q[400)= FX(400)-FX(300)
B B B B
con este valor, se va a la tabla 5.1 y se encuentra que Fx (0.2267) = 0.5871 y u400 = (400 - 256.7)/191 = 0.75
B B B B
115
P(300Q400)=0.7734 - 0.5871=0.1863
b) Si se usa la distribucin lognormal:
se tiene entonces que: F(5.99 ) = (5.99 - 5.228)/0.84 = 0.91 de la tabla 5.1 se tiene que F(0.91) = 0.8186 F(5.704 )= (5.704 - 5.228)/0.84 = 0.564 de la tabla 5.1 se obtiene F(0.564) = 0.7123 se encuentra finalmente:
B B B B B B B B B B
ln (X T ) = y + K y
(5.58)
116
1 en donde K = Fu 1 1 T
(5.59)
donde:
1 -1 K T = Fu 1 - Tr
(5.60)
ln(XT ) u1- 2 ST
(5.61)
en donde:
ST =
y
Y N
(5.62)
117
2 = 1 + KT 2
1/2
(5.63)
Ejemplo 5.15
Se tiene un ro con caudales mximos anuales lognormalmente distribuidos, con x =15 m3/s y x =5 m3/s; se da tambin Y =2.6554 y Y =0.3246. Encontrar el caudal para un perodo de retorno de 100 aos. Si se tiene un perodo de retorno de 30 aos de registro, cules son los lmites de confianza para un ; de 10%?.
P P P P
Solucin:
El coeficiente de variacin se calcula como: 5 Cv = x = = 0.33 x 15 Para hallar KT, se procede as:
B B
Fu (K T ) = 1 De la tabla 5.1:
1 TI
= 1-
1 = 0.99 100
K T = F1 (0.99) = 2.33
El valor de K se puede calcular usando la ecuacin (5.59) como:
2 1/2 ln (1 + 0. 33 ) exp 2.33 (ln(1 + 0. 332 )) - - 1 2 K= 0.333
118
Los lmites de confianza se hallan as en el campo transformado: ln(XT ) u1- 2 ST Se calcula primero con la ecuacin (5.63) y luego ST con la ecuacin (5.60), el resultado es:
B B
1/2
Por lo tanto: ln (30.28) 1.64 * 0.11 = 3.41 0.1875 = [3.2225, 3.5975] = [e3.2225, e3.5975] = [25.091, 36.5]
P P P P
119
Ellas difieren entre s por el valor del parmetro de forma. La expresin general de la funcin de densidad de probabilidades para la distribucin extrema tipo I o Gumbel es:
f X (x) =
x - 1 x - exp- exp
(5.64)
En donde y son los parmetros de la distribucin. La distribucin Gumbel tiene la forma mostrada en la figura 5.8.
(5.65) (5.66)
= - 0.5772
(5.67)
120
Los lmites de confianza por el mtodo de momentos para un nivel de probabilidad ; son:
X T u 1- 2 S T
(5.68)
(5.69) (5.70)
= [1 + 1.1396K + 1.1 K 2]
121
parmetros. La ltima funcin es llamada tambin Distribucin Pearson tipo III. La distribucin Gamma est relacionada con otras distribuciones muy conocidas como las distribuciones Chi-cuadrado y la exponencial negativa, que son casos particulares de la distribucin Gamma. La distribucin Gamma de dos parmetros tiene una funcin de densidad de probabilidades de la forma:
x 1 x - f X (x) = e | | ( )
-1
(5.71)
() = z-1 e-z dz
0
(5.72)
(5.73)
122
; y son los parmetros de escala y forma, respectivamente, y xo es el parmetro de localizacin. La Figura 5.9 muestra formas de la funcin de densidad de probabilidades Gamma para ; > 0.
B B
(5.74) (5.75)
2 = 2
123
1 = 2 Cv =
(5.76)
calculados con la muestra, respectivamente. Para la distribucin Gamma con tres parmetros o Pearson tipo III, los parmetros, por el mtodo de momentos, pueden estimarse por:
2 =
(5.77)
(5.78)
(5.79)
(5.80)
124
1 2 2 3 K K T + (K t 1) + (K T 6K T ) (K T 1) + K T 6 3 6 6 6 (5.81)
Para la distribucin Pearson tipo III o Gamma de 3 parmetros, existen tablas, como la 5.2, que dan el factor de frecuencia en funcin del coeficiente de asimetra calculado con la muestra.
(5.82)
=(,Tr) y est tabulado para la Gamma de dos parmetros y para la Pearson tipo III. La tabla 5.3 da valores de , para hallar el intervalo de confianza de la distribucin Pearson tipo III.
B B
1 ln(x) - y o f x (x) = x ()
-1
ln (x)- y o -
(5.83)
125
126
3.0 2.9 2.8 2.7 2.6 2.5 2.4 2.3 2.2 2.1 2.0 1.9 1.8 1.7 1.6 1.5 1.4 1.3 1.2 1.1 1.0 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0.0
-0.396 -0.390 -0.384 -0.376 -0.368 -0.360 -0.351 -0.341 -0.330 -0.319 -0.307 -0.294 -0.282 -0.268 -0.254 -0.240 -0.225 -0.210 -0.195 -0.180 -0.164 -0.148 -0.132 -0.116 -0.099 -0.083 -0.066 -0.050 -0.033 -0.017 0.000
0.420 0.440 0.460 0.479 0.499 0.518 0.537 0.555 0.574 0.592 0.609 0.627 0.643 0.660 0.675 0.690 0.705 0.719 0.732 0.745 0.758 0.769 0.780 0.790 0.800 0.808 0.816 0.824 0.830 0.836 0.842
1.180 1.195 1.210 1.224 1.238 1.250 1.262 1.274 1.284 1.294 1.302 1.310 1.318 1.324 1.329 1.333 1.337 1.339 1.340 1.341 1.340 1.339 1.336 1.333 1.328 1.323 1.317 1.309 1.301 1.292 1.282
2.278 2.277 2.275 2.272 2.267 2.262 2.256 2.248 2.240 2.230 2.219 2.207 2.193 2.179 2.163 2.146 2.128 2.108 2.087 2.066 2.043 2.018 1.993 1.967 1.939 1.910 1.880 1.849 1.818 1.785 1.751
3.152 3.134 3.114 3.093 3.071 3.048 3.023 2.997 2.970 2.942 2.912 2.881 2.848 2.815 2.780 2.743 2.706 2.666 2.626 2.585 2.542 2.498 2.453 2.407 2.359 2.311 2.261 2.211 2.159 2.107 2.054
4.051 4.013 3.973 3.932 3.889 3.845 3.800 3.753 3.705 3.656 3.605 3.553 3.499 3.444 3.388 3.330 3.271 3.211 3.149 3.087 3.022 2.957 2.891 2.824 2.755 2.686 2.615 2.544 2.472 2.400 2.326
4.970 4.909 4.847 4.783 4.718 4.652 4.584 4.515 4.444 4.372 4.298 4.223 4.147 4.069 3.990 3.910 3.828 3.745 3.661 3.575 3.489 3.401 3.312 3.223 3.132 3.041 2.949 2.856 2.763 2.670 2.576
127
FIGURA 5.10 Distribucin Log-Pearson Tipo III. (Salas, 1992). 5.6.5.1 Estimacin de Parmetros
Los estimadores de los parmetros por el mtodo de los momentos son:
2 = y y
2
2 y 0 = y
= y
(5.84)
Donde y , y y son la media, desviacin estndar y coeficiente de asimetra calculados usando los logaritmos de los datos, respectivamente.
128
YT = ln XT = y + K y
(5.85)
En donde Y y y son la media y desviacin estndar de los logaritmos de X, y K se obtiene de la tabla 5.2.
B B B B
Tr=5 1.1698 1.2006 1.2309 1.2609 1.2905 1.3199 1.3492 1.3785 1.4082 1.4385 1.4699 1.5030 1.5382 1.5764 1.6181 1.6643 1.7157 1.7732 1.8374 1.9091 1.9888
B B
Tr=10 1.3748 1.4367 1.4989 1.5610 1.6227 1.6838 1.7441 1.8032 1.8609 1.9170 1.9714 2.0240 2.0747 2.1237 2.1711 2.2173 2.2627 2.3081 2.3541 2.4018 2.4525
B B
Tr=20 1.6845 1.7810 1.8815 1.9852 2.0915 2.1998 2.3094 2.4198 2.5303 2.6403 2.7492 2.8564 2.9613 3.0631 3.1615 3.2557 3.3455 3.4303 3.5100 3.5844 3.6536
B B
Tr=50 2.1988 2.3425 2.4986 2.6656 2.8423 3.0277 3.2209 3.1208 3.6266 3.8374 4.0522 4.2699 4.4996 4.7100 4.9301 5.1486 5.3644 5.5761 5.7827 5.9829 6.1755
B B
Tr=100 2.6363 2.8168 3.0175 3.2365 3.4724 3.7238 3.9895 4.2684 4.5595 4.8618 5.1741 5.4952 5.8240 6.1592 6.4992 6.8427 7.1881 7.5339 7.8783 8.2196 8.5562
B B
129
ST =
y N
(5.86)
ln X T 1 / 2S T
(5.87)
El anlisis de frecuencia puede hacerse de dos maneras: usando los llamados factores de frecuencia o hallando la distribucin emprica de los datos muestrales, por el mtodo de "Plotting position" o posicin de graficacin. Como regla general, el anlisis de frecuencia no debe realizarse para perodos cortos, menores de 10 aos de registros. A continuacin se describe brevemente los dos procedimientos propuestos para realizar el anlisis de frecuencia.
California:
P= m n
(5.88)
130
Weibull:
P= m n +1
(5.89)
Hazen:
P= 2m -1 2n
(5.90)
La expresin acumulada de probabilidades ms usada es la de Weibull. Con las anteriores ecuaciones, se halla la que se conoce como distribucin emprica de una muestra. Luego se puede hacer un anlisis para ajustar a la distribucin emprica una de las distribuciones tericas vistas anteriormente. La distribucin acumulada de una variable puede ser representada grficamente en un papel de probabilidad diseado para la distribucin. En este papel, las ordenadas representan el valor de x en una cierta escala y las abscisas representan la probabilidad de P(X >x) o P(X< x), el perodo de retorno o la variable reducida. Las escalas de las ordenadas y las abcisas son diseadas de tal manera que cuando una muestra es de una poblacin con esa distribucin, la grfica debe ajustarse a una lnea recta. El propsito de este papel es "linealizar" las relaciones de probabilidad para que los datos puedan ser fcilmente dibujados y usados en extrapolacin o propsitos de comparacin. Se puede observar en las pginas siguientes los papeles de probabilidad correspondientes a las distribuciones Gumbel y Log-Normal.
X= +K
(5.91)
til para el anlisis de frecuencia hidrolgico, donde K es el factor de $ $ frecuencia, es la media estimada y es la desviacin estndar estimada. Cada distribucin tiene su factor de frecuencia como se vio anteriormente.
131
132
133
AJUSTE
DE
UNA
DISTRIBUCION
DE
En los numerales anteriores, se ha descrito el uso de varias distribuciones de probabilidad para estimar eventos con perodos de retorno mayores que los de los eventos histricos. Surge entonces el interrogante de cul de estas distribuciones se debe utilizar para una muestra particular. No hay un acuerdo entre los hidrlogos acerca de cul de las distribuciones debe usarse. Las pruebas para comprobar la bondad del ajuste son necesarias, pero no son suficientes para aceptar una distribucin. Tal vez las dos pruebas de bondad de ajuste ms utilizadas en hidrologa son la Chi - Cuadrada y la Smirnov Kolmogorov.Con estas pruebas se escogera con la muestra, la distribucin de probabilidades que representa el comportamiento probabilstico de la poblacin. Una prueba adicional puede hacerse calculando la suma de los cuadrados de las diferencias entre los valores observados y los calculados. Aunque los procedimientos estadsticos no pueden por s solos determinar la mejor distribucin de frecuencia, si pueden suministrar argumentos para escoger la distribucin ms adecuada. Por ejemplo, las distribuciones Pearson tipo III y Log-Pearson tipo III requieren la estimacin del coeficiente de asimetra de datos muestrales. Esto puede ser una razn suficiente para preferir cualquier otra distribucin, ya que este parmetro tiene un comportamiento muy sesgado, por lo cual se necesitara una gran cantidad de registros para tener un estimado ms o menos confiable, y dichos registros no se consiguen fcilmente en nuestro medio. Por otra parte, las distribuciones de dos parmetros tienen un valor fijo o ignoran la asimetra de la poblacin, lo cual tampoco es conveniente. En resumen, no hay un procedimiento nico para escoger la mejor distribucin. Las pruebas estadsticas ayudan; el ajuste grfico tambin puede contribuir; en definitiva, prima el juicio de quien est haciendo el anlisis. 5.8.1 Prueba Smirnov - Kolmogorov
134
El estadstico Smirnov - Kolmogorov, D, considera la mxima desviacin de la funcin de distribucin de probabilidades emprica de la muestra, FE(x), de la funcin de distribucin de probabilidades terica, escogida , Fx (x), tal que:
B B
(5.92)
La prueba requiere que el valor Dn calculado con la expresin anterior sea menor que el valor tabulado Dn para el nivel de probabilidad requerido.
B B
Esta prueba es fcil de realizar y comprende las siguientes etapas: El estadstico Dn es la mxima diferencia entre la funcin de distribucin acumulada emprica de la muestra y la funcin de distribucin acumulada terica escogida.Se fija el nivel de probabilidad. Valores como 0.05 y 0.01 son los ms usuales. El valor crtico Da de la prueba debe ser obtenido de tablas como la tabla 5.4. Este estadstico es funcin de y n. Si el valor calculado Dn es mayor que Da, la hiptesis de que la distribucin terica escogida se ajusta adecuadamente al comportamiento probabilstico de la poblacin debe rechazarse, de otra manera, se acepta esta hiptesis.
B B B B B B B B
135
N 5 10 15 20 25 30 35 40 45 50 N50
;=0.20 0.45 0.32 0.27 0.23 0.21 0.19 0.18 0.17 0.16 0.15
;=0.10 0.51 0.37 0.30 0.26 0.24 0.22 0.20 0.19 0.18 0.17
;=0.05 0.56 0.41 0.34 0.29 0.27 0.24 0.23 0.21 0.20 0.19
;=0.01 0.67 0.49 0.40 0.36 0.32 0.29 0.27 0.25 0.24 0.23
1.07 N
1.22 N
1.36 N
1.63 N
Se est interesado en conocer como difieren las frecuencias observadas de las frecuencias esperadas (halladas con una distribucin terica de probabilidades). Una medida de la discrepancia entre frecuencias observadas y calculadas est dada por el estadstico 2 as:
P P
k (O e ) 2 2 = i i ei i =1
(5.93)
donde: Oi = ei Si 2 =0, significa que las distribucion terica y emprica ajustan exactamente, mientras que si 20, ellas difieren. La distribucin de la variable 2 se puede asimilar a una distribucin Chi-cuadrado con (k-n-1) grados de libertad, donde k es el nmero de intervalos y n es el nmero de parmetros de la distribucin terica. La funcin 2 est tabulada en muchos textos de estadstica.Supngase que la hiptesis Ho es aceptar que una distribucin emprica se ajusta a una distribucin Normal. Si el valor calculado de 2 por la ecuacin 5.89 es mayor que algn valor crtico de 2 ,con niveles de significancia ;de 0.05 o 0.01 ( el nivel de confianza se define como 1-;, siendo
P P P P P P P P B B P P P P
136
frecuentemente utilizados niveles de confianza del 95%), se puede decir que las frecuencias observadas difieren significativamente de las frecuencias esperadas y entonces la hiptesis Ho se rechaza (para esos niveles de significancia). Si ocurre lo contrario, entonces se acepta. Este procedimiento es llamado la prueba de hiptesis Chi- cuadrado.
B B
Ejemplo 5.16
Se tienen los valores de temperatura mensual de una ciudad, mostrados en la tabla 5.5 . Se supone que estas temperaturas se ajustan a una distribucin Normal. Usando la prueba Smirnov-Kolmogorov, verificar la validez de esta hiptesis.
Solucin:
La media de la muestra es 76.4F y la desviacin estndar es 3.1 F. Se fijan dos hiptesis: una hiptesis Ho estipula que la variable X es normalmente distribuida con los valores de la media y desviacin estndar calculados anteriormente y la otra hiptesis alternativa, Ha, es lo contrario de sta.
B B B B
Se puede fijar un intervalo de 1 F y se hace la tabla 5.6 donde FE(T) es la frecuencia acumulada de la muestra, fT (t) es la frecuencia, FE(t)N es la distribucin de probabilidades acumulada emprica y FT(t) es la distribucin de probabilidades acumulada Normal (se halla utilizando el concepto de variable reducida u y usando la tabla 5.1)
B B B B
El mayor valor Dn es 0.0758. El valor Da obtenido de la tabla 5.5 para un ; del 90% es igual a 0.1963, lo cual significa que la hiptesis Ho puede aceptarse.
B B B B B B
137
Ao 1944 1945 1946 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959
Junio 77 72 76 74 78 75 75 73 82 79 78 69 74 75 72 72
Julio 77 76 78 74 80 79 73 78 81 80 83 80 77 76 76 75
Agosto 77 76 74 83 76 74 70 78 77 78 80 79 77 74 74 76
138
T 68 69 70 71 72 73 74 75 76 77 78 79 80
fT(t)
B B
FE(t) 0 1 2 2 5 7 14 18 25 31 37 40 44
FE(t)N 0 0.0208 0.0417 0.0417 0.1042 0.1458 0.2917 0.3750 0.5208 0.6458 0.7708 0.83333 0.9167
FT(t)
B B
FE(t)N -FT(t)
B B
0 1 1 0 3 2 7 4 7 6 6 3 4
0.0035 0.0084 0.0197 0.0409 0.0778 0.1357 0.2206 0.3264 0.488 0.5753 0.6950 0.7995 0.8770
0.0045 0.0124 0.022 0.0008 0.0264 0.0101 0.0711 0.0486 0.0328 0.0705 0.0758 0.0338 0.0397
81
45
0.9375
0.9306
0.0069
Ejemplo 5.17
139
Se tienen los caudales mximos instantneos de la estacin RP-3 en el Ro Murr, en el departamento de Antioquia. Se desea encontrar el caudal de un perodo de retorno de 50 aos hallado con las distribuciones Gumbel, Lognormal de dos parmetros y Log Pearson tipo III.
Ao
1978 1979 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990 1991
Q m3/s
P P
3239.0 3431.7 4577.9 3612.0 4151.8 1949.0 2342.9 1345.0 1862.2 1652.8 4220.0 4958.4 2664.9 1392.7
Solucin
Distribucin Gumbel Aplicando la ecuacin de Ven Te Chow se tiene que: Q Tr = 50 = + K y: = 2957.2 m3/s
P P
140
De la ecuacin 5.67 se halla el factor de frecuencia K=2.5924 Se tiene entonces que: QTr=50=6158 m3/s
B B P P
Aplicando la ecuacin 5.68 y 5.69 para hallar el error estandar, ST se obtiene que:
B B
ST=1111.458 m3/s
B B P P
Para ;=0.05 se obtiene de la tabla 5.1 que T0.95=1.645 y aplicando la ecuacin 5.70 para los intervalos de confianza se obtiene finalmente que:
B B
(4329.37 QTr=50=61587986.07)
B B
Distribucin Log-Normal Con los logaritmos de los valores de caudales mximos instantneos se obtiene que: y = 7.903
y = 0.4504
Aplicando la ecuacin 5.59 para hallar el factor de frecuencia K y utilizando la tabla 5.1 se halla: K=2.055 De la ecuacin 5.58:
QTr=50=6827 m3/s
B B P P
141
(4814.4QTr=50=68279679.84)
B B
Distribucin Pearson Tipo III Se tiene que: = 2957.2 = 1234.6 = 0.1702 De la tabla 5.2 se obtiene el valor del factor de frecuencia K:
K=2.144
y aplicando la ecuacin de Ven TE Chow:
QTr=50=5604 m3/s
B B P P
Con la ecuacin 5.82 y con la tabla 5.3 se obtiene un error estandar ST=809.05 y los intervalos de confianza para ;=0.05 son entonces:
B B
(4273QTr=50=56046934.9)
B B
142