Analisis de Datos Hidrologicos

ANALISIS DE DATOS HIDROLOGICOS
Antecedentes
La hidrología es la ciencia que trata de la presencia y distribución espacial y temporal del agua en la Tierra, tanto por encima
como por debajo de su superficie, y en particular de sus propiedades químicas, biológicas y físicas y de su interacción con el
entorno físico (OMM/UNESCO, 1992). La hidrología ayuda a comprender las distintas fases del ciclo hidrológico, desde el paso
del agua de la atmósfera a la Tierra hasta su regreso a la atmósfera. Constituye, pues, la base de la evaluación y gestión de los
recursos hídricos y de los problemas prácticos ocasionados por las crecidas y sequías, la erosión y el transporte de sedimentos
y la polución del agua. Las crecientes presiones experimentadas por los recursos hídricos disponibles en la búsqueda de un
mayor bienestar económico, así como la preocupación que suscita la polución del agua superficial y subterránea, han puesto de
relieve la importancia fundamental de la hidrología en todas las iniciativas relacionadas con el agua y el medio ambiente 1.
Estaciones climatológicas
En una estación climatológica de una red básica se recopilan los datos siguientes: precipitación, valores de sondeo
nivométrico, y evaporación. Se sobreentiende que las estaciones que miden la evaporación o la nieve, particularmente las
primeras, miden también por lo general valores de temperatura, humedad y viento, ya que estos elementos meteorológicos
afectan a la evaporación y a la fusión de la nieve 2.
Importancia de los datos

La compilación de datos hidrológicos, ya sean éstos mediciones de precipitación, registros de nivel de agua, mediciones de
caudal, datos de observación de aguas subterráneas o de muestreo de la calidad del agua, culmina en una serie de datos de
utilidad para la adopción de decisiones. Las decisiones se pueden adoptar directamente a partir de mediciones de datos en
bruto, estadísticas derivadas de éstos o resultados de distintas etapas de modelización de datos elaborados, pero los datos
obtenidos serán el fundamento de todas las decisiones 3.
Datos hidrometeorológicos
Existen varios tipos de datos usados en la hidrología:
• Datos históricos de eventos naturales registrados cronológicamente en forma discreta ó continua. Son series de tiempo
producto de observaciones y que se pierden si no se registran en el momento de su ocurrencia. A este tipo pertenecen la gran
mayoría de los datos hidrológicos e hidrometeorológicos.
• Levantamiento de datos hidrológicos en áreas, como por ejemplo profundidad y calidad de aguas subterráneas, infiltración o
sedimentación en ríos. Son datos de campo que se toman esporádicamente y no necesariamente, en forma secuencial.
• Medidas en laboratorio, como lo son conductividades hidráulicas o calidad de aguas.
• Registro simultáneo de un evento (lluvia-caudal) en dos localidades geográficas diferentes, durante un determinado período de
tiempo (generalmente 4 ó 5 años) usados para transferir información ó correlacionar datos con propósitos diversos, como lo son
análisis de caudales4.
Calidad, homogeneidad y consistencia de los datos
Los datos hidrológicos deben ser independientes, homogéneos y lo más representativos posible de la población. En la
recolección de datos de lluvias en una cuenca, por ejemplo, las estaciones deberán ser localizadas en sitios estratégicos cuya
cobertura total deberá representar la misma. Las fuentes de los errores en datos hidrológicos observados pueden ser: en el
1
OMM.Nº168, Guía de prácticas hidrológicas Volumen I, Sexta Edición, Ginebra 2, Suiza,
2011. Pag.
2
2011. Pag.
3
2011. Pag.
4
FATTORELLI Sergio, FERNANDEZ Pedro, Diseño Hidrológico, Segunda edición, WASA-GN,
2011. Pag.
1
REYES Esteban.
sensor (error del registro del dato in situ),en la transmisión del dato, en el registro en la estación de recepción, en el
procesamiento y análisis de los datos.
Dentro de los errores, se consideran errores al azar y errores sistemáticos. Los primeros están siempre en los datos,
generalmente se distribuyen alrededor del verdadero valor y la desviación estándar se usa para determinar la magnitud de los
desvíos. Los segundos crean inconsistencias o diferencias en un sólo sentido en relación al valor medio que deben ser
detectadas y corregidas. Existen diversas técnicas, para corregir inconsistencias 5.
Variables aleatorias
Una variable aleatoria X(t) tiene una cierta distribución probabilística. Esa distribución determina la posibilidad de que una
determinada observación X, de la variable, caiga dentro de un rango especificado de X. Sí, por ejemplo la precipitación media
de enero, en un lugar, es de 50 mm, la distribución probabilística podría establecer que pueda estar en el rango entre 40 y 60
milímetros. Su distribución probabilística, permanece invariable a través del tiempo, es decir, son procesos estacionarios, como
por ejemplo el caso de un río en condiciones naturales, donde las características de la cuenca (físicas, climáticas) no cambian a
través del periodo de registros. Si las condiciones cambiaran, (embalses, urbanizaciones, desforestaciones, etc) el proceso
sería no estacionario y por tanto, se deberán introducir los respectivos factores de cambio 6.
Series de Tiempo
Una serie de tiempo se define, en hidrología, como la magnitud de un evento observado en forma discreta a intervalos de
tiempo, dt, promediados en ese intervalo o registrados en forma continua en un tiempo, t, por ejemplo caudales medios, diarios,
promedio de caudales instantáneos a través de un intervalo discreto de 1 día, o caudales instantáneos registrados en forma
continua durante todos los instantes de cada día.
Las series de tiempo en hidrología pueden ser series de duración completa, en la cual figuran todos los registros de la muestra,
o series de duración parcial, donde los datos se seleccionan de tal manera que su magnitud es mayor (o menor) que un valor
base predefinido. Si en una serie, de valores máximos se elige, el valor mayor de cada año se tendrá una serie anual máxima.
Si se seleccionan los mínimos será como una serie anual mínima. Una serie anual máxima puede dejar de considerar valores
máximos que ocurren durante un año menores que el máximo de ese año, pero mayores que los máximos de otros años; en
estos casos una serie de duración parcial (por encima de una base predefinido) da una mejor idea del comportamiento de la
muestra.
En la selección de eventos en una serie de duración parcial, se debe tener cuidado en la selección de eventos independientes 7.
¿Qué es la estadística?
Estadística es la representación y análisis de los datos numéricos, de las medidas de los diferentes elementos y factores
hidrológicos, de tal manera expuestos, que puedan sacarse conclusiones útiles para su aplicación: a la previsión de avenidas o
caudales altos de las corrientes de agua; al regulamiento del agua que pueda caer sobre una cuenca vertiente o a su
aprovechamiento hidráulico; a la obtención de los valores más corrientes de la precipitación; al grado de contaminación a que
pueda llegar al medio ambiente en una determinada época; y, cualquier causa y efecto de los elementos hidrológicos.
Campo de aplicación.
La estadística es factible de aplicación a todos los fenómenos, tanto en su aspecto cualitativo como en le cuantitativo, pero en
todos ellos han de entrar los números o datos que representan. Así, los datos de precipitación de un determinado lugar.
El proceso estadístico.
5
2011. Pag.
6
2011. Pag.
7
2011. Pag.
2
REYES Esteban.
Es el conjunto de operaciones necesarias para llegar a la obtención de leyes o reglas a que obedece un determinado fenómeno.
Como todas las ciencias experimentales la primera etapa es la toma de datos o recopilación de datos.
La recopilación de los datos puede ser directa o indirecta y dentro de la directa puede ser obtenida por el recopilador-
investigador en su propio observatorio o estación de toma de datos con lo que puede hacer un primer análisis de ellos o un
control de calidad de datos, antes de la inserción en cuadros, lo que redunda en beneficio de las investigaciones a realizar y en
la calidad de las hipótesis y resultados.
Sin embargo, por mucho interés que se ponga en la toma de datos, hay errores difícilmente eliminables. Estos pueden
clasificarse en sistemáticos y accidentales. Son sistemáticos errores producidos por una imperfección del aparato de medida;
por una tendencia del observador a dar las décimas pares o impares; por una deficiencia fisiológica del observador; y en
general, por una causa técnica o fisiológica del aparato a observar o del propio observador. Errores accidentales son los
producidos por circunstancias especiales, difíciles de determinar; unas veces con posibilidades de detectarlos y determinarlos
cuando se ha seguido una observación continua o gráfica de un fenómeno, otras veces, por comparación con observaciones
próximas8.
Población, muestra.
Un conjunto suficientemente grande elementos o datos estadísticos constituye una población. La población puede ser finita ó
infinita; todas las precipitaciones anuales ocurridas en un lugar; todos los caudales o descargas anuales en una determinada
estación de aforos.
Una fracción del colectivo o población recibe el nombre de muestra. Es un cierto número de electos o datos tomados de la
población o colectivo; como por ejemplo si de todos los aforos de una estación hidrológica, o de aforos, tomamos una fracción
“o muestra” de ellos.
Variables discretas y variables continuas.

Al considerar los datos que se obtienen de una magnitud tal como el número de días de lluvia, el número de días con
precipitación superior o inferior a una cantidad, nos encontramos con que el valor del dato es un número entero, otras como la
precipitación, pueden tomar cualquier valor o sólo están limitadas inferior o superiormente, la lluvia tiene el valor mínimo cero; el
caudal de un río no puede bajar del valor cero. Las primeras reciben el nombre de variable o magnitud discreta y las segundas
continuas.
 Los conteos datos discretos (cualidad).
 Las medidas producen datos continuos (cantidad).
Cifras significativas en al obtención de un dato estadístico.

En el manejo de datos hidrológicos es bastante corriente que después de ejecutar operaciones nos encontramos con valore
tales como: 15.55; 26.45; 18.33; 67.66; etc. En hidrología con considerar décimas es bastante suficiente, por lo tanto en el
ejemplo anterior, se toma 18.3 y 67.7, por defecto y exceso para 18.33 y 67.66; pero cuando se trata de valores centrales como
15.55 y 26.45, tan licito sería tomar valores por defecto que por exceso; par obviar los errores acumulativos o sustractivos, los
servicios estadísticos establecen reglas seguir; por ejemplo, es norma general tomar el par más próximo al número en
cuestión ; así, para 15.55 se toma 15.6 y para 26.45 se toma 26.4; con ello si en una estadística aparecen muchos números
existen razones admitir, y así no existe el error acumulativo 9.
Ordenación y clasificación de los datos

Los datos de precipitación y aforo están ordenados por meses y años, si el estudio es mensual se lleva al cuadro los diferentes
meses ordenados por años, confeccionando éste se lleva a otros cuadros donde se colocan ordenados en forma creciente,
colocando a derecha o izquierda del dato, el año en que sucedió.
8
Martínez Molina, Ignacio, Estadística Aplicada a la Hidrometeorología, Instituto Nacional de
Meteorología,, Madrid, 1985, página 18.
9
Martínez Molina, Ignacio, Estadística Aplicada a la Hidrometeorología, Instituto Nacional de
Meteorología,, Madrid, 1985, Pág. 20,21.
3
REYES Esteban.
Histogramas
La representación gráfica de los datos es casi siempre bastante más significativa que los datos en los cuadros estadísticos.
Normalmente pueden obtenerse más conclusiones de un gráfico adecuado que da un cuadro de presentación de datos. Estas
presentaciones gráficas reciben el nombre de histogramas. Son como la historia gráfica del variable elemento estudiado.
 Histograma cronológico
 Histograma de valores ordenados
 Histograma de frecuencia no acumulada y acumulada
PARÁMETROS ESTADÍSTICOS
Un parámetro estadístico es el valor esperado de alguna variable aleatoria o de alguna función, es decir, son estimadores de las
muestras para caracterizarlas10.
Medidas de tendencia hacia un valor central de la serie

 Promedio aritmético o media aritmética (μ) es el primer momento alrededor del origen. Aunque da información sobre la
muestra, este parámetro no caracteriza completamente a una variable aleatoria. Si la muestra es pequeña y contiene
valores extremos (altos o bajos) el promedio no será un parámetro real en relación con la población. Se calcula
mediante la expresión:
n
x i
x1  x2  ...  xn
x i 1

n n
Donde:
xi: es valor observado de la variable.
N: es el número de observaciones.
 Promedio geométrico: se calcula con la siguiente expresión:
x n x1  x2  ...  xn
 Mediana (M): es el valor de la variable que deja con igual probabilidad de ocurrencia (0.50) los valores abajo y arriba
de ella, por lo tanto, la mediana resulta atractiva, en el caso de series que se apartan de la normal.
 Moda: es el valor de la variable que ocurre con mayor frecuencia para ilustración del cálculo de estos parámetros).
Los tres parámetros (la media aritmética, la mediana y la moda) son iguales para distribuciones simétricas. Para series
pequeñas, se justifica el uso de la mediana, porque el promedio se afecta en ellas mucho más por los valores extremos y es
además más robusta. En la práctica hidrológica en series que se apartan de la distribución normal es común usar los logaritmos
de la variable.
En hidrología se tienen frecuentemente muestras de distintos tamaños N 1, N2, N3 ... NR y se necesita obtener el promedio
ponderado de todas ellas, así:
n
 N x  i i
xp  i 1
n
N
i 1
i
Medidas de Dispersión
Las medidas de dispersión miden como los valores de una variable se dispersan alrededor del valor central o media aritmética
de la serie, es decir, representan una distribución alrededor de un valor medio.

10
2011. Pag.
4
REYES Esteban.
 Desviación media (σM): Es la media aritmética del valor absoluto de los errores. Se calcula con la siguiente expresión:
n
x i x
M  i 1
N
 Desviación estándar (σ): Es el parámetro de dispersión más usado en hidrología, se llama también desviación
cuadrática. Es la raíz cuadrada de la varianza y tiene las unidades de x.
n 2
x i  x
M  i 1
N 1
 La varianza: es el cuadrado de la desviación estándar (σ2) y es el segundo momento alrededor de la media.

Sus unidades son el cuadrado de las unidades de la variable. En general, es un indicador que indica cuanto
cerca de la media está el valor de la variable. Si teóricamente todos los valores fueran igual a la media, la
varianza sería cero
La ecuación de la varianza se puede también expresar desarrollando el trinomio cuadrado perfecto del
numerador.
n 2
x i  x
2  i 1
N 1
 Covarianza. Cuando se analiza la varianza de dos (X, Y) ó más variables (X, Y, Z). En el caso de dos
variables, la covarianza es la media aritmética del producto de los errores de X, e Y, y se expresa mediante
la siguiente ecuación:
 Coeficiente de variación: es el cociente entre la desviación estándar y el promedio, X . Es adimensional.
 Si una variable x es multiplicada por una constante C, la varianza, σ2, y la desviación estándar, σ, se
multiplican por C2 y por C, respectivamente; consecuentemente, el coeficiente de variación Cv no se
afecta. Si una constante C se suma o resta a cada uno de los valores de una variable (ej. cambio de origen)
la σ y σ2 no cambian, pero el Cv varía, así:
 El coeficiente de asimetría (g): Es el tercer momento alrededor de la media. Describe la distribución de los
datos alrededor de media. Es una medida de la simetría. Una distribución simétrica tiene un coeficiente de
asimetría igual a cero cuando los datos se distribuyen alrededor de la media; negativo cuando la
distribución de los datos tiene mayor sesgo a la izquierda y positivo cuando tiene mayor sesgo a la derecha,
según como se desvíe hacia valores bajos o altos con relación a la media. Es un parámetro muy usado en
estudios regionales, se calcula con la expresión:
Los momentos centrales en general, de orden r se estiman para muestras como:
Donde:
5
REYES Esteban.
N: es el número de observaciones.
x: son los valores observados.
x: es el promedio aritmético de la muestra.
Cuando se trabaja con valores altos de la variable (ejemplo caudal) conviene trabajar con logaritmos.
ANALISIS DE INFORMACION HIDROLOGICO
3.1 PRESENTACION Y ANALISIS DE DATOS.

Según Germán Monsalve Sáenz; Pág. 87:
En una serie de dados estadísticos de una estación hidrológica de medidas, es indispensable resumir esta
multitud de cifras, en elementos sintéticos que caractericen la estación desde el punto de vista considerado.
Se busca definir una serie de "n" observaciones de valores individuales xi con i<n, desde los tres puntos de
vista siguientes.
a. Valor central o dominante de la serie
b. Dispersión o fluctuación de diversas observaciones alrededor del valor central
c. Características de forma.
2.1.1 ESTADÍGRAFOS DE POSICIÓN

Según Rufino Moya; Pág. 151-152
Son aquellos que describen la posición que ocupa la distribución de frecuencia respecto a un valor de la
variable. Se distinguen dos tipos: los estadígrafos de tendencia central y los de localización.
2.1.1.1 LA MEDIA ARITMÉTICA ( x )
Es la medida de tendencia central mas usada, conocida y familiar a todos nosotros. La media
aritmética o simplemente media (o promedio) de una muestra x 1, x2,…, xn de tamaño "n" de
una variable o característica "x", se denota por x , y esta dada por:
n
x  x  ...  x n x i
x 1 2  i 1
n n
2.1.2 ESTADÍGRAFOS O MEDIDAS DE DISPERSIÓN.

Según Rufino Moya; Pág. 267:
Los estadígrafos de dispersión como su nombre indica, miden la dispersión de los datos de la muestra.
Según Máximo Villón Béjar; Pág. 90:

Las medidas de dispersión o variabilidad permiten observar como se reparten o dispersan los datos a uno
y otro lado del centro.
 Si la dispersión es poca; indica gran uniformidad de los datos.
 Si la dispersión es grande; indica poca uniformidad de los datos.
2.1.2.1 RECORRIDO DE LA VARIABLE o RANGO

El recorrido de la variable, es la diferencia entre los dos valores extremos, es decir:
6
REYES Esteban.
R  x max .  x min .

El rango o amplitud es una manera conveniente de escribir la dispersión, sin embargo, no da
medida alguna de la dispersión entre los datos con respecto al valor central
2.1.2.2 VARIANZA.
Esta medida es la más utilizada en el estudio de la dispersión. La varianza mide la dispersión
de los datos con respecto a la media aritmética
Varianza poblacional (σ2)

La varianza de una población finita de "n" elementos x1, x2,…, xn , se n
define como la media aritmética del cuadrado de las desviaciones de
 x  
2
i
los elementos con respecto a su media μ, es decir:
2  i 1
n
Varianza muestral (S2)
n
La varianza de una muestra x1, x2,…, xn , de una variable o
  x  x
2
característica "x" , se define como la media de cuadrado de las i
desviaciones de las observaciones con respecto a la media aritmética S2  i 1
de estos, es decir: n 1
2.1.2.3 DESVIACIÓN TÍPICA O DESVIACIÓN ESTÁNDAR (S):

Según Rufino Moya; Pág.292
Desviación estándar "S" de las observaciones x1, x2,…, xn de una características", se define como la
raíz cuadrada positiva de la varianza tanto poblacional como maestral.
n
 x  
2
i
 Desviación estándar poblacional:
  2  i 1
n
n
x  x
2
i
 Desviación estándar muestral:
S  S2  i 1
n 1
OBSERVACION:
Generalmente en Hidrología se suele trabajar con información muestral debido a que no se tiene
información de toda la población.
2.1 CORRELACION Y REGRESION

2.4.1 CORRELACION.
Según, Máximo Villón Béjar; Pág.224:
La correlación se define como la asociación entre dos o más variables aleatorias
2.4.1.1 COEFICIENTES DE CORRELACIÓN(r):
7
REYES Esteban.
Según, Máximo Villón Béjar; Pág.225-226:

Es el estadístico que nos permite medir el grado de asociación de dos variables linealmente
asociadas. Para el caso de una muestra esta dada por:
r
S xy

 xy  n x y
SxSy nS x S y
Donde:
n n n n
  xi  x  ;   yi  y  ; x y
2 2
;
Sx  i 1
Sy  i 1
x i 1
y i 1
n n n n
Variación de valores de r: -1< r < 1; describen los varios grados de asociación.

Si x e y son independientes: Szy = 0 , Luego r = 0
2.4.1.2 COEFICIENTE DE DETERMINACIÓN (r2):

Según, Máximo Villón Béjar; Pág. 226:
Es la proporción o porcentaje, de la variación total de la variable dependiente y, que es explicada o
depende de la variable independiente x, por lo cual, es un criterio para explicar la importancia de la
variable independiente dentro del modelo.
Además; 0 < r2 < 1; de 0-100%.
2.4.2 REGRESION.
2.4.2.1 REGRESIÓN LINEAL SIMPLE
Según, Máximo Villón Béjar; Pág. 229-231:
En Hidrológica el modelo más simple y común, esta basada en la suposición de que dos variables
se relacionan en forma lineal, como por ejemplo:
- Caudales y precipitaciones de una misma cuenca
- precipitaciones de una estación, con precipitaciones de otra estación.
- Caudal de una estación con caudal de otra estación.
- Precipitación con la altitud de una cuenca
Este hecho, permite correlacionar estas variables para completar datos o extender un registro
Ecuación de regresión: La ecuación general de la regresión lineal es: y  a  bx

Donde:
x = Variable independiente, variable conocida.
y = Variable dependiente, variable que se trata de predecir.
a = Intercepto, punto donde la línea de regresión cruza el eje y, es decir valor de y
cuando x = 0.
b = Pendiente de la línea o coeficiente de regresión, es decir, es la cantidad de cambio de
y asociada a un cambio unitario de x.
Estimación de los parámetros.

Dada la ecuación de regresión lineal y  a  bx ; donde a y b son los parámetros de la ecuación.
El método mas utilizado para la estimación de los parámetros a y b es el de mínimos cuadrados.
Por tanto los parámetros estarán dadas por las formulas:
8
REYES Esteban.
y x x y x2
n x i y i   xi  y i
y b
i i i i i
a
n x   x  n xi2   xi 
2 2 2
i i
En los cálculos resulta más cómodo calcular b con la ecuación anterior para b y luego calcula a
como sigue:
a  y  bx
2.4.2.2 REGRESIÓN NO LINEAL SIMPLE.

Según, Máximo Villón Béjar; Pág.236 -241:
Relaciones no Relaciones Donde Existen varias
lineales lineales relaciones no
lineales, que con
1 w  a  bx w
1 un artificio
y
a  bx y adecuado pueden
reducirse a
1 y  a  bw 1 relaciones
y  ab w
x x lineales, dentro
Linealizando de las cuales se
y  ab x w  a1  b1 x w  ln y pueden
mencionar:
y  ax b w  a1  bz w  ln y
z  ln x
y  ax  bx 2 w  a  bx y
w
x
2.4.2.3 ANALISIS DE REGRESIÓN.

Según, Máximo Villón Béjar; Pág.226 -229:
Es una técnica deterministica, que permite determinar la naturaleza de la relación funcional entre
dos o mas variables, permite predecir los valores de y = f(x) con un cierto grado de aproximación.
Pasos para el análisis de regresión.
1. Seleccionar una función de relación correlativa, simple o múltiple, lineal o no lineal
1 1
y  a  bx , y , y  ab , y  ab x , y  ax b , y  ax  bx 2
a  bx x
2. Estimación de los dos parámetros que miden el grado de asociación correlativa.( r2 , r)
3. Prueba de significación de los parámetros estadísticos que miden la asociación correlativa, para
lo cual se aplica la prueba "t"
3.1 Se plantea la hipótesis

H0: ρ = 0 (ρ es el coeficiente de correlación poblacional y su valor varía entre -1 y 1)
H a: ρ ≠ 0
3.2 Calculo de t calculado (tc)
9
REYES Esteban.
r n2
Se utiliza la ecuación: t c 
1 r2
Donde:
r = Coeficiente de correlación.
n = Numero de pares de valores
3.3 Calculo del t tabular ( tt)
El tt se obtiene de las tablas preparadas para este efecto, con un nivel de significación α o
una probabilidad de (1- α), y con un grado de libertad (ν = n-2), donde n es el numero de
pares de valores
3.4 Criterios de decisión:

 Si t c  t t , se acepta la hipótesis nula, por lo que ρ = 0, y por lo tanto no hay
correlación significativa.
 Si t c  t t , se rechaza la hipótesis nula por lo que ρ ≠ 0, indicándose que es
significativo y por lo tanto existe correlación entre las variables.
4. Estimación de los parámetros de la ecuación o función de regresión. (a, b)
2.2 COMPLETACIÓN Y EXTENCION DE DATOS.

Definiciones.
Según, Máximo Villón Béjar; Pág.283
La extensión de información, es el proceso de transferencia de información desde una estación con
"largo" registro histórico a otra con "corto" registro.
La completación de datos, es el proceso por el cual, se llenan "huecos" que existen en un registro de
datos. La completación es un caso particular de la extensión.
Técnicas.
Según, Máximo Villón Béjar; Pág.284
a. Las técnicas que se utilizan para la completación, en orden de prioridad son:
 Regresión lineal simple, entre estas:
- Correlación cruzada entre dos o mas estaciones
- Autocorrelación.
 Rellano con criterios prácticos.
b. Para la extensión se usan modelos de:
 Regresión lineal simple.
 Regresión lineal múltiple.
Proceso.
El proceso a seguir para la completación y extensión, es como se indica:
1. Obtener la serie de tamaño N1, a completar o extender (y1 , y2 , …, yn)
2. Seleccionar la estación, que guarde una buena relación con la estación con la que se esta trabajando, y
cuya longitud de la serie sea mayor, como por ejemplo: N= N1+N2 (x1, x2, ….xN1, xN1+1, xN1+ 2 …, xN1+N2)
3. Seleccionar un modelo de correlación, en este caso, la ecuación de regresión lineal.
4. Estimación de los parámetros (a, b, r)
10
REYES Esteban.
5. Ecuación de completación o extensión.
 S1( y )
y 
 t 1 y  r  xt  x1 
 S 1( y )
Esta dada por la ecuación: 
 y  y  r S1( y )  x  x    1  r 2 .S 
 t 1 S t 1 1( y ) t
 1( y )
Donde:
- y1 y x1 = Son los estimados de las medias.
- S1( y ) , S1( x ) = Varianza.
- r = Coeficiente de correlación
-  t = Variable aleatoria normal e independiente, con media cero y varianza unitaria.
-  = 0; Se usa en completación ( en este caso el ruido aleatorio no es considerado)
-  = 1; Se usa en extensión.( en este caso el ruido o factor aleatorio si es considerado)
-   f ( N 1 , N 2 ) ; Corrige el sesgo en la varianza del proceso.
N 2  N 1  4  N 1  1

 N 2  1 N1  3 N1  2
6. Criterios de confiabilidad.
Es verificar si estadísticamente esta dentro de lo permitido; para esto se procede de la
siguiente forma:
a. Calculo del estadístico (tc)

r N1  2
Se utiliza la ecuación: t c 
1 r 2
Donde:
tc = Valor del estadístico t calculado.
r = Coeficiente de correlación.
N1 = Numero de pares de valores
b. Calculo de tt
El valor critico de t, se obtiene de las tablas t de Student (tt), con 95% de probabilidad, o con
un nivel de significación del 5%, es decir
 / 2  0.025

G.L  N1  2
c.Comparación de tc con el tt :
 Si t c  t t  r no es significativo, por lo tanto no hay correlación significativa.
 Si t c  t t  r es significativa, por lo que sí existe correlación significativa entre las
variables yt y xt , y se pueden hacer uso de la ecuación para la completación y
extensión.
2.3 ANALISIS DE CONSISTENCIA.

11
REYES Esteban.
El profesional que busca la información de la cuenca en estudio, en las instituciones encargadas de su

recopilación, pero una vez obtenida esta, una de las interrogantes que se debe hacer es: ¿Es confiable la
información disponible?
La respuesta se obtiene realizando un análisis de consistencia de la información disponible, mediante
criterios físicos y métodos estadísticos que permiten identificar , evaluar y eliminar los posibles errores
sistemáticos que han podido ocurrir, sea por causas naturales u ocasionadas por la intervención de la mano del
hombre.
El análisis de consistencia de la información hidrológica, se realiza mediante los siguientes procesos.

- Análisis visual grafico.
- Análisis doble masa.
- Análisis estadístico.
3.4.1 ANÁLISIS VISUAL GRAFICO.

En coordenadas cartesianas se plotea la información hidrológica histórica, ubicándose en las ordenadas, los
valores de la serie y en las abscisas el tiempo (años, meses, días, etc.)
Un grafico de esta naturaleza sirven para analizar la consistencia de la información hidrológica en forma
visual, e indicar el periodo o periodos en los cuales la información es dudosa, lo cual se puede reflejar como
"picos" muy altos o valores muy bajos, saltos y/o tendencias, los mismos que deberán comprobarse, si son
fenómenos naturales que si efectivamente han ocurrido, o si son producto de errores sistemáticos.
Para conocer la causa del fenómeno detectado, se pueden analizar de diversas formas:
1. Cuando se tienen estaciones vecinas, se comparan los gráficos de las series históricas, y se observa
cual periodo varía notoriamente uno con respecto al otro.
2. Cuando se tiene una sola estación, esta se divide en varios periodos y se compara la información de
campo obtenida.
3. Cuando se tienen datos de precipitación y escorrentía, se comparan los diagramas, los cuales deben ser
similares en su comportamiento
3.4.2 ANÁLISIS ESTADÍSTICO.

Según, Máximo Villón Béjar; Pág.266:
Después de obtener los gráficos construidos para el análisis visual, los periodos de posible corrección, y los
periodos de dados que se mantendrán con sus valores originales se proceden al análisis estadístico de saltos,
tanto en la madia, como en al desviación estándar
ANALISIS DE SALTOS.
3.4.3.1 CONSISTENCIA DE LA MEDIA
El análisis estadístico consiste en probar, mediante la prueba t (prueba de hipótesis), si los valores
medios ( x 1 , x 2 ) de las submuestras, son estadísticamente iguales o diferentes con una probabilidad
del 95% o con 5% de nivel de significación, de la siguiente manera.
a. Cálculo de la media y la de la desviación estándar

1
1 n1  1 n1 
2 2
x1   xi ; S1( x )    x i  x 1  
n1 i 1  n1  1 i 1 
1
1 n2  1 n2 
2 2
x2  x j ; S 2( x )    x i  x 2  
n2 j 1  n2  1 j 1 
Donde:
 xi = Valores de la serie del periodo 1
12
REYES Esteban.
 xj = Valores de la serie del periodo 2

 x 1 , x 2 = Media de los periodos 1 y 2 respectivamente.
 S1( x ) , S 2 ( x ) = Desviación estándar de los periodos 1 y 2 respectivamente.
 n =Tamaño de la muestra (n1 +n2)
b. Cálculo del t calculado tc según:
tc 
 x 1  x 2    1   2 
Sd
Donde: 1   2  0 (por hipótesis, la hipótesis es que las medias son iguales)
x  x2 
1 1
y S   n1  1 S1   n 2  1 S 2
Quedando: tc 
1
; Además: S d  S p  1  1 
2  2

2 2
Sd p  
 n1 n2   n1  n 2  2 
Siendo:
S d = Desviación de las diferencias de los promedios.
S p = Desviación estándar ponderada.
c. Cálculo del t tabular tt :

El valor critico de t, se obtiene de las tablas t de Student (tt), con 95% de probabilidad, o con un
nivel de significación del 5%, es decir.
 / 2  0.025

G.L  n1  n2  2
d. Comparación de tc con el tt :
 Si t c  t t (95%)  x 1  x 2 (estadísticamente) En este caso, siendo las medias
x1  x 2 estadísticamente, no se debe realizar proceso de corrección.
 Si t c  t t (95%)  x 1  x 2 (estadísticamente) En este caso, siendo las medias
x1  x 2 estadísticamente, se debe corregir la información.
3.4.3.2 CONSISTENCIA DE LA DESVIACIÓN ESTÁNDAR.

El análisis consiste en probar, mediante la prueba F, si los valores de la desviación estándar de
las submuetras son estadísticamente iguales o diferentes, con un 95% de probabilidad o con un 5% de
nivel de significación, de la siguiente forma:
a. Cálculo de las varianzas de ambos periodos.

2 2
 1  n1  1  n2
S 2
1( x )     xi  x1  ; S 22( x )     xi  x 2 
 n1  1  i 1  n2  1  j 1
b. Cálculo del F calculado tc según:
13
REYES Esteban.
 S12( x)
Fc  2 , si S1( x )  S 2( x)
2 2
 S 2( x )
 2
 S 2( x )
Fc  S 2 , si S1( x )  S 2( x)
2 2
 1( x )
c. Cálculo del F tabular (valor critico de F ó Ft)
G.L.N  n1 1 2 2
Se obtiene de las tablas F para una probabilidad del
95%, o con un nivel de significación del 5%, y grados de
libertad:
  , Si S1(x)  S2(x)
 G.L.D  n2 1
Donde:
G.L.N = Grados de libertad del numerador
G.L.D = Grados de libertad del

denominador.
G.L.N  n2 1 , Si S 2  S 2
d. Comparación del Fc con el Ft :
 Si Fc  Ft (95%)  S1( x )  S 2( x )
G.L.D  n 1 2(x) 1(x)

(estadísticamente).
 Si Fc  Ft (95%)  S1( x )  S 2 ( x )
 1 
(estadísticamente), por lo que se debe corregir.
3.4.4 CORRECCION DE DATOS:

 / xt  x1
En los casos en que los parámetros media y desviación
 X (t )  S S2( x )  x 2 ...( )
estándar de las submuetras de las series de tiempo, resultan
estadísticamente iguales, la información original no se corrige, por ser
consistente con 95% de probabilidad. En caso contrario, se corrigen los  1( x )
valores de las submuestras mediante las siguientes ecuaciones. 
Donde:  X /  xt  x 2 S  x1...( )
X (t/ ) = Valor corregido de saltos.  (t ) S2( x ) 1( x )
xt = Valor a ser corregido.
- La ecuación (  ) se utiliza cuando se debe corregir los valores de la submuestra de tamaño n1
- La ecuación ( ) se utiliza cuando se debe corregir los valores de la submuestra de tamaño n2
2.4 ANALISIS DE TENDENCIA.

Antes de realizar el análisis de tendencias, se realiza el analizas de saltos y con la serie libre de saltos, se
procede a analizar las tendencias en la media y en la desviación estándar.
3.5.1 TENDENCIA A LA MEDIA

La tendencia en la media Tm, puede ser expresada en forma general por la ecuación polinomial:
14
REYES Esteban.
Tm  Am  Bm t  C m t 2  Dm t 3  ....
y en forma particular por la ecuación de regresión lineal simple: Tm  Am  Bm t
Donde:
 t = Tiempo en años, tomado como la variable independiente de la tendencia. (t = 1, 2, 3,…, n)
 Tm = Tendencia en la media, para este caso:
/
 Tm = X (t ) Valor corregido de saltos es decir, datos a usarse para el cálculo de los parámetros.
 Am , Bm , C m , Dm ,... = Coeficiente de los polinomios de regresión, que deben ser estimados con los
datos
El calculo de la tendencia en la media, haciendo uso de la ecuación Tm  Am  Bm t y se realiza mediante

el siguiente proceso.
a. Calculo de los parámetros de la ecuación de regresión lineal simple.

Am  Tm  t.Bm
b. Evaluación de la tendencia Tm
Para averiguar si la tendencia es significativa, se analiza el coeficiente de regresión Bm o también el
coeficiente de correlación R
El análisis de R según el estadístico t, es como sigue:

R n2
1. Calculo de estadístico tc según: t c 
1 R2
Donde:
tc= Valor del estadístico t calculado.
n = Numero toatl de datos.
R = Coeficiente de correlacion.
2. Calculo de tt
El valor critico de t, se obtiene de la tabla de t Student, con 95% de probabilidad o con un
nivel de significación del 5%, es decir:
 / 2  0.025

G.L  n  2
3. Comparación de tc con el tt :
 Si t c  t t (95%)  R no es significativo. En este caso, la tendencia no es
significativa y hay que corregir.
 Si t c  t t (95%)  R Si es significativo. En este caso, la tendencia es significativa

y hay necesidad de corregir la información de tendencia en la media.
c. Correlación de la información.
La tendencia en la media se elimina haciendo uso de la ecuación:
15
REYES Esteban.
Yt  X (/t )  Tm ó

Yt  X (t )  ( Am  Bm t )
/
Donde:
/
 X (t ) =serie corregida de saltos.
 Tm = Tendencia en la media.
 Yt =Serie sin tendencia en la media.
/
Para que el proceso X t preserve la media constante, se devuelve el promedio de las X t luego
las ecuaciones anteriores toman la forma:
Yt  X (/t )  Tm  T m

Yt  X (t )  ( Am  Bm t )  T m
/
Donde: Tm es el promedio de la tendencia en la media o promedio de los valores corregidos de

saltos.
3.5.2 TENDENCIA A LA DESVIACION ESTANDAR:

La tendencia en la desviación estándar Ts, se expresa en forma general por la ecuación polinomial:
TS  AS  B S t  C S t 2  DS t 3  ....
Y en forma particular, por la ecuación de regresión lineal simple: TS  AS  BS t
Donde:
 t = Tiempo en años (t = 1, 2, 3,…, n)
 TS = Tendencia en la desviación estándar
 Tm = Y(t ) Valor corregido d tendencia en la media, es decir, datos a usarse para el calculo de los
parámetros.
 AS , B S , C S , D S ,... = Coeficiente de los polinomios de regresión, que deben ser estimados con los
datos
Para calcular y probar si la tendencia en la desviación estándar es significativa, se sigue el siguiente
proceso.
La información ya sin tendencia en la media Yt, se divide en periodos de datos anuales.
a. Se calcula las desviaciones estándar para cada periodo de toda la información.
1
 1 12 2
S P    Y p  Y p  
2
Y p
11 p 1 
Donde:
 SP = Desviación estándar del año p, es decir e los datos mensuales del año p
 Yp = Serie sin tendencia en la media
 Y p =Promedio de datos mensuales del año p (p = 1, 2, 3, ….., 12)
16
REYES Esteban.
b. Se calculan los parámetros de la ecuación, a partir de las desviaciones estándar anuales y el tiempo
t (en años), utilizando las ecuaciones dadas para la tendencia en la media.
c. Se realiza la evaluación de Ts siguiendo el mismo proceso descrito para Tm
Si en la prueba R resulta significativo, la tendencia en la desviaron estándar es significativa, por lo que

se debe eliminar de la serie aplicando la siguiente ecuación.
X (/t )  Tm
Zt 
TS
Donde: Zt = Serie sin tendencia en la media ni en la desviación estándar. Las demás variables han sido
definidas en párrafos anteriores.
Para que el proceso preserve la media y la desviación estándar constante, la ecuación toma la forma:
X (/t )  Tm
Zt  .T S  T m
TS
Donde: T S , T m son los promedios de la tendencia en la desviación estándar y la media respectivamente.
La serie Zt en una serie homogénea y consistente al 95% de probabilidad.
17

Analisis de Datos Hidrologicos

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Analisis de Datos Hidrologicos

Caricato da

Copyright:

Formati disponibili

ANALISIS DE DATOS HIDROLOGICOS

Importancia de los datos

Variables discretas y variables continuas.

Cifras significativas en al obtención de un dato estadístico.

Ordenación y clasificación de los datos

Medidas de tendencia hacia un valor central de la serie

 Promedio geométrico: se calcula con la siguiente expresión:

FATTORELLI Sergio, FERNANDEZ Pedro, Diseño Hidrológico, Segunda edición, WASA-GN,

 La varianza: es el cuadrado de la desviación estándar (σ2) y es el segundo momento alrededor de la media.

 Coeficiente de variación: es el cociente entre la desviación estándar y el promedio, X . Es adimensional.

Los momentos centrales en general, de orden r se estiman para muestras como:

ANALISIS DE INFORMACION HIDROLOGICO

3.1 PRESENTACION Y ANALISIS DE DATOS.

2.1.1 ESTADÍGRAFOS DE POSICIÓN

2.1.2 ESTADÍGRAFOS O MEDIDAS DE DISPERSIÓN.

Según Máximo Villón Béjar; Pág. 90:

2.1.2.1 RECORRIDO DE LA VARIABLE o RANGO

Según Máximo Villón Béjar; Pág. 90:

Varianza poblacional (σ2)

desviaciones de las observaciones con respecto a la media aritmética S2  i 1

2.1.2.3 DESVIACIÓN TÍPICA O DESVIACIÓN ESTÁNDAR (S):

2.1 CORRELACION Y REGRESION

2.4.1.1 COEFICIENTES DE CORRELACIÓN(r):

Según, Máximo Villón Béjar; Pág.225-226:

Variación de valores de r: -1< r < 1; describen los varios grados de asociación.

2.4.1.2 COEFICIENTE DE DETERMINACIÓN (r2):

Además; 0 < r2 < 1; de 0-100%.

Ecuación de regresión: La ecuación general de la regresión lineal es: y  a  bx

Estimación de los parámetros.

Por tanto los parámetros estarán dadas por las formulas:

2.4.2.2 REGRESIÓN NO LINEAL SIMPLE.

2.4.2.3 ANALISIS DE REGRESIÓN.

2. Estimación de los dos parámetros que miden el grado de asociación correlativa.( r2 , r)

3.1 Se plantea la hipótesis

3.4 Criterios de decisión:

4. Estimación de los parámetros de la ecuación o función de regresión. (a, b)

2.2 COMPLETACIÓN Y EXTENCION DE DATOS.

El proceso a seguir para la completación y extensión, es como se indica:

1. Obtener la serie de tamaño N1, a completar o extender (y1 , y2 , …, yn)

3. Seleccionar un modelo de correlación, en este caso, la ecuación de regresión lineal.

4. Estimación de los parámetros (a, b, r)

5. Ecuación de completación o extensión.

a. Calculo del estadístico (tc)

2.3 ANALISIS DE CONSISTENCIA.

El profesional que busca la información de la cuenca en estudio, en las instituciones encargadas de su

El análisis de consistencia de la información hidrológica, se realiza mediante los siguientes procesos.

3.4.1 ANÁLISIS VISUAL GRAFICO.

3.4.2 ANÁLISIS ESTADÍSTICO.

a. Cálculo de la media y la de la desviación estándar

 xj = Valores de la serie del periodo 2

b. Cálculo del t calculado tc según:

c. Cálculo del t tabular tt :

3.4.3.2 CONSISTENCIA DE LA DESVIACIÓN ESTÁNDAR.

a. Cálculo de las varianzas de ambos periodos.

b. Cálculo del F calculado tc según:

c. Cálculo del F tabular (valor critico de F ó Ft)

G.L.D  n 1 2(x) 1(x)

3.4.4 CORRECCION DE DATOS:

2.4 ANALISIS DE TENDENCIA.

3.5.1 TENDENCIA A LA MEDIA

El calculo de la tendencia en la media, haciendo uso de la ecuación Tm  Am  Bm t y se realiza mediante

a. Calculo de los parámetros de la ecuación de regresión lineal simple.

El análisis de R según el estadístico t, es como sigue:

 Si t c  t t (95%)  R Si es significativo. En este caso, la tendencia es significativa