Sei sulla pagina 1di 28

UNIVERSIDAD NACIONAL SANTIAGO ANTÚNEZ DE MAYOLO

FACULTAD DE CIENCIAS DEL AMBIENTE

Escuela Profesional de Ingeniería Ambiental

INFORME N° 03

“Análisis estadístico y probabilístico de las estaciones Chuquicara, Cedros y Colcas”

Curso: Hidrología

Docente: DÍAZ SALAS, Abelardo

Integrantes:

 HUAYNATE GAMARRA, Darwin


 JARA JULCA, Jhon
 LOLI GERRERO, Erick
 MACEDO CASTILLO, Andre
 MINAYA HILARIO, Jairo Álvaro
 VEGA GARCÍA, Rusbel

Huaraz-Perú
ii

ÍNDICE
iii

INDICE DE FIGURAS

Figura 1. Histograma y polígono de frecuencias .................................................................... 13


Figura 2. Diagrama escalonado .............................................................................................. 14
Figura 3. Distribución normal................................................................................................. 17
Figura 4. Distribución exponencial ......................................................................................... 18
Figura 5. Distribución de Gumbel ........................................................................................... 20

INDICE DE ECUACIONES
Ecuación 1. El rango ............................................................................................................... 10
Ecuación 2. Número de grupos o clases.................................................................................. 11
Ecuación 3. Ancho de clase ..................................................................................................... 11
Ecuación 4. Marca de clase .................................................................................................... 11
Ecuación 5. Frecuencia relativa ............................................................................................. 11
Ecuación 6. Frecuencia absoluta acumulada ......................................................................... 12
Ecuación 7. Frecuencia relativa acumulada ........................................................................... 12
Ecuación 8. Probabilidad ........................................................................................................ 15
Ecuación 9. Función de distribución normal .......................................................................... 16
Ecuación 10. Distribución acumulada normal........................................................................ 17
Ecuación 11. Función de distribución exponencial ............................................................... 18
Ecuación 12. Distribución acumulada exponencial ................................................................ 19
Ecuación 13. Función de la distribución de Gumbel .............................................................. 19
Ecuación 14. Distribución acumulada de Gumbel .................................................................. 20
Ecuación 15. Función de la distribución Lognormal .............................................................. 21
Ecuación 16. Periodo de retorno ............................................................................................ 21
Ecuación 17. Periodo de retorno con la función de distribución acumulada ......................... 21
iv

INTRODUCCIÓN
v
5

I. OBJETIVOS

1.1. Objetivos generales

Realizar el análisis estadístico y probabilístico de las estaciones Chuquicara, Cedros y

Colcas.

1.2. Objetivos específicos

 Realizar la tabla de distribución de frecuencias con los caudales máximos de las

estaciones Chuquicara, Cedros y Colcas.

 Realizar los cálculos de densidad empírica, normal, exponencial, Gumbel y

lognormal, con los datos de los caudales máximos instantáneos de las estaciones

Chuquicara, Cedros y Colcas y encontrar el modelo que se ajuste a la a la función

densidad empírica.

 Determinar la probabilidad y el periodo de retorno para todos los caudales

máximos instantáneos de las estaciones Chuquicara, Cedros y Colcas.

 Determinar los caudales para periodos de 50, 100, 150 y 200 años

respectivamente.

 Determinar el caudal ecológico en base a la Resolución jefatural del ANA


6

1.3. Justificación

En la actualidad la estadística es una ciencia que ha logrado ganar importantes

espacios en muchos ámbitos cotidianos, es indispensable en estudios de poblaciones,

predicciones de riesgos, pero sobre todo proporciona herramientas valiosas en la toma

de decisiones eso sin quitarle al ser humano la última palabra. Mediante la

probabilidad, es posible ajustar de la manera más exacta posible los imponderables

debidos al azar en los más variados campos tanto de la ciencia como de la vida

cotidiana.

Como futuros ingenieros ambientales es de mucha importancia conocer el diseño de

diversas estructuras hidráulicas y determinar un modelo probabilístico el cual se

ajuste a los datos obtenidos de las estaciones en estudio, con el estudio estadístico y

probabilístico lograremos predecir la ocurrencia de acuerdo a una magnitud o

fenómeno que ocurre, con la cual podremos calcular los caudales de diseños para las

diversas estructuras hidraúlicas, sean diseño de represas, diseño de canales, diseño de

embalses, etc.
7

II. MARCO TEÓRICO

2.1 Antecedentes

2.1.1 En el contexto internacional ( has dos antecedentes aquí jhon)

a) (Completraaaa)

b) (Completara)

2.1.2 En el contexto nacional ( has dos antecedentes aquí jhon)

a. Completarararra

b. Completarrrrr
8

2.2 Bases teóricas

2.2.1 Estadística aplicada a la Hidrología

2.2.1.1 Conceptos generales

Estadística

Es una ciencia que utiliza datos numéricos para obtener inferencias basadas

en el cálculo de probabilidades. Una estadística es también un conjunto de

datos obtenidos a través de un estudio estadístico (Significados, 2016).

Son numerosas las definiciones de Estadística, no correspondiendo aquí

presentar su nómina ni elegir una que resulte idónea. Sí en cambio, conviene

distinguir dos ramas que han evolucionado en forma separada:

a. Estadística descriptiva

Se dedica a la descripción, visualización y resumen de datos originados a

partir de los fenómenos de estudio. Los datos pueden ser resumidos

numérica o gráficamente. Su objetivo es organizar y describir las

características sobre un conjunto de datos con el propósito de facilitar su

aplicación, generalmente con el apoyo de gráficas, tablas o medidas

numéricas.

b. Estadística inferencial

Se dedica a la generación de los modelos, inferencias y predicciones

asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad

de las observaciones. Se usa para modelar patrones en los datos y extraer

inferencias acerca de la población bajo estudio. Estas inferencias pueden


9

tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis),

estimaciones de unas características numéricas (estimación), pronósticos

de futuras observaciones, descripciones de asociación (correlación) o

modelamiento de relaciones entre variables (análisis de regresión).

2.2.1.2 Obtención de datos

La obtención de datos en la hidrología se realiza tomando muestras (datos),

dado que no es posible recopilar todos los datos de la población referente a

una variable hidrometeoro lógica. Como se trata de una muestra y se

considera que la recopilación de los datos se efectúa al azar, se dice que el

muestreo es aleatorio y por consiguiente a la muestra se denomina muestra

aleatoria.

2.2.1.2.1 Población

Es el conjunto de todos los posibles elementos que intervienen en un

experimento o en un estudio. La hay de dos tipos:

 Población finita. Es aquella que indica que es posible alcanzarse

o sobrepasarse al contar. Es aquella que posee o incluye un

número limitado de medidas y observaciones (Gestiopolis, 2015).

 Población infinita. Es infinita si se incluye un gran conjunto de

medidas y observaciones que no pueden alcanzarse en el conteo.

Son poblaciones infinitas porque hipotéticamente no existe límite

en cuanto al número de observaciones que cada uno de ellos puede

generar (Gestiopolis, 2015).


10

2.2.1.2.2 Muestra

Es un conjunto de medidas u observaciones tomadas a partir de una

población dada. Es un subconjunto de la población (Gestiopolis, 2015).

2.2.1.3 Clasificación de los datos

Para facilitar la interpretación y la evaluación correspondiente, estos datos

deben ser clasificados o categorizados o distribuidos en clases, es decir los

datos deben ser organizados en clases o grupos. La clasificación se logra

ordenando los datos según su magnitud en forma ascendente o descendente y

luego se agrupan en clases. Al clasificar los datos, se determina el número de

datos en cada clase, dado que cada una de estas clases tienen sus límites

(valores) superior e inferior definidos.

Según Mas (2010) que hay que seguir son los siguientes pasos para obtener

la distribución de frecuencias:

1. Alcance y recorrido (A)

Es el intervalo definido por el menor y mayor de los datos

2. Rango (R)

Viene ser la diferencia entre los extremos del alcance.

𝑅 = 𝑄𝑚á𝑥 − 𝑄𝑚𝑖𝑛

Ecuación 1. El rango
11

3. Intervalos de clase (Ii)

Son grupos que resultan de particionar el alcance o recorrido; el número

de grupos (K) se determina por la regla propuesta por STURGES.

𝑲 = 1 + 3.32 𝐿𝑜𝑔 𝑛

n= Número total de datos

Ecuación 2. Número de grupos o clases

4. Ancho de clase (w)

Viene a ser la diferencia que existe entre los extremos de cada intervalo.

𝑹
𝒘=𝑲

Ecuación 3. Ancho de clase

5. Marca de clase (yi)

Son los puntos medios de los intervalos de clase.

𝐿𝑖 + 𝐿𝑠
𝒚𝒊 =
2

Ecuación 4. Marca de clase

6. Frecuencia absoluta (fi)

Es el número de datos que cae dentro de cada intervalo.

7. Frecuencia relativa (hi)

Es el cociente entre la frecuencia absoluta y el número total de datos.

𝑓𝑖
𝒉𝒊 =
𝑛

Ecuación 5. Frecuencia relativa


12

8. Frecuencia absoluta acumulada (Fi)

Es aquella que resulta de sumar sucesivamente las frecuencias absolutas.

Fi = f1+f2+f3+f4+….….+fn

Ecuación 6. Frecuencia absoluta acumulada

9. Frecuencia relativa acumulada (Hi)

Es aquella que resulta de sumar sucesivamente las frecuencias relativas.

Hi= h1+h2+h3+h4+…….+hn = 1

Ecuación 7. Frecuencia relativa acumulada

2.2.1.4 Presentación de datos

Después de la clasificación de datos, es necesario presentar los resultados en

forma de tablas y en forma de gráficos, con la finalidad de facilitar su

interpretación y su posterior análisis.

a) Presentación tabular o distribuciones de frecuencia

La presentación tabular o las distribuciones de frecuencia o tabla de

distribuciones de frecuencia es una tabla que divide los datos de la muestra

en cierto número de clases, donde se muestra el número de datos en cada

clase, a este número de datos en cada clase se le conoce con el nombre de

frecuencia de clase o simplemente frecuencia.

b) Presentación en forma gráfica

a) Histogramas y polígono de frecuencia


13

Son diagramas de barra o rectángulos cuyas bases representan los

intervalos de clase y las alturas las respectivas absolutas y relativas

(Mas, 2010).

Un polígono de frecuencias, es un gráfico de línea trazado sobre las

marcas de clase. Puede obtenerse uniendo los puntos medios de los

techos de los rectángulos en el histograma.

Figura 1. Histograma y polígono de frecuencias

b) Diagrama escalonado

Son diagramas similares a las histogramas con la diferencia de que las

alturas son las frecuencias absolutas o relativas acumuladas (Mas,

2010).
14

Figura 2. Diagrama escalonado

2.2.1.5 Descripción de datos

La razón fundamental de clasificar los datos en una tabla y graficar las

frecuencias es para describir la naturaleza de la distribución de frecuencias,

La descripción se realiza mediante los estadísticos o los estadígrafos.

a. Estadísticos de posición

Son números que indican la localización del valor medio o valor central

de la distribución de frecuencias, estos estadísticos son denominados

como medidas de localización o medidas de tendencia central; por tanto

las medidas de posición determinan la ubicación del valor central de los

datos de una distribución de frecuencias. Los estadísticos de posición

comúnmente usados son: media, mediana y moda.

b. Medidas muestrales de dispersión

Estos estadísticos (números) indican el grado de dispersión o desfases en

los datos de la muestra, poca dispersión indica una uniformidad en los


15

valores de la muestra, mientras que alta dispersión indica poca

uniformidad en los valores de la muestra. Cuando los valores son muy

cercanos al promedio existe uniformidad y cuando los valores de la

muestra son muy alejados al promedio se dice que no hay uniformidad, es

decir los valores de la muestra son diferentes o dispersos. Los estadísticos

de dispersión son: rango, varianza, desviación estándar y coeficiente de

variación.

2.2.2 Probabilidad aplicada a la Hidrología

2.2.2.1 Conceptos básicos

Probabilidad

La probabilidad de ocurrencia de un evento dado es igual a la relación entre el

número de sucesos favorables “m” y el número de sucesos totales, “n”.

𝑚
P(X = x) =
𝑛

Ecuación 8. Probabilidad

Fenómeno aleatorio

Es aquel fenómeno que bajo las mismas condiciones experimentales se

presentan más de una manera o también se le denomina fenómeno que sucede

al azar.

Espacio muestral

Es el conjunto de todas las ocurrencias o resultados posibles de un

experimento aleatorio. En un experimento aleatorio no es posible predecir


16

con anticipación el resultado, pero si es posible conocer el conjunto de todos

los resultados posibles, llamado especio muestral.

Evento

Es un subconjunto del espacio muestral, evento también se puede definir como

la colección de puntos o subconjuntos en un espacio muestral que tienen

características comunes.

2.2.2.2 Distribuciones de probabilidad para variables continuas

i. Distribución normal

Es una distribución simétrica en forma de campana, también conocida

como Campana de Gauss. Es fundamental en el dominio de la estadística y

la probabilidad (Allen, 2002).

Cuya función es la siguiente:

Ecuación 9. Función de distribución normal

Los parámetros de la distribución son dos:


17

La función densidad de la distribución normal será:

Ecuación 10. Distribución acumulada normal

Para calcular los valores ajustados a la distribución normal (x):

Esta distribución tiene una forma de campana simétrica, como se muestra

en la Ilustración mmmmmmm.

Figura 3. Distribución normal

La distribución normal se usa para:

 Comparar distribuciones: las propiedades de una muestra de variables

no normales pueden compararse con las de variables normales.

 Aproximar la distribución de probabilidades de errores aleatorios.


18

 Muchos estadísticos pueden ser normalmente distribuidos, como, por

ejemplo, la media de la mayoría de las variables hidrológicas.

ii. Distribución exponencial

La función densidad del modelo probabilístico exponencial está dado

por:

Donde:
1
λ=𝑋

Ecuación 11. Función de distribución exponencial

Como ejemplo de esta función se muestra en la figura 4.

Figura 4. Distribución exponencial


En consecuencia, la función de distribución acumulada de probabilidades

será:
19

Ecuación 12. Distribución acumulada exponencial

iii. Distribución de Gumbel

En teoría de probabilidad y estadística la distribución de Gumbel, es

utilizada para modelar la distribución del máximo (o el mínimo), por

lo que se usa para calcular valores extremos.

Esta distribución ha sido utilizada, con buenos resultados, para el

estudio de frecuencias de valores extremos; por ello es aplicable a

valores máximos o mínimos de caudales, precipitaciones,

temperaturas, etc) (Montealegre, 1990).

Cuya función es la siguiente:

Donde:

𝑿−𝜷
w: 𝜶

Donde:

𝜷 = 𝜇 − 0.45𝜎

𝜶 = 0.78𝜎

Ecuación 13. Función de la distribución de Gumbel


20

Como ejemplo de esta función se muestra en la figura 5.

Figura 5. Distribución de Gumbel

Entonces la distribución acumulada de Gumbel será:

−𝑤
F(w) = 𝑒 −𝑒

Ecuación 14. Distribución acumulada de Gumbel

iv. Distribución Lognormal

En probabilidades y estadísticas, la distribución lognormal es una

distribución de probabilidad de una variable aleatoria cuyo logaritmo

está normalmente distribuido. Es decir, si X es una variable aleatoria

con una distribución normal, entonces exp(X) tiene una distribución

lognormal.

Cuya función es la siguiente:


21

Donde:

𝝁: 𝑚𝑒𝑑𝑖𝑎
𝝈: 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟

Ecuación 15. Función de la distribución Lognormal

2.2.2.3 Periodo de retorno

El periodo de retorno es el número de años en que en promedio se presenta

una variable hidrológica extrema (evento extremo) superior o igual a cierto

valor. El periodo de retorno se denomina también tiempo de retorno, intervalo

de ocurrencia. Y se expresa de la siguiente manera:

Ecuación 16. Periodo de retorno

Así mismo se puede relacionar el Periodo de retorno con la función de

distribución acumulada F(x), de la siguiente manera:

Ecuación 17. Periodo de retorno con la función de distribución acumulada


22

2.3 Términos conceptuales

1. Estadística

Ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de ellos,

inferencias basadas en el cálculo de probabilidades.

2. Probabilidad

Cálculo matemático de las posibilidades que existen de que una cosa se cumpla o

suceda al azar.

3. Población

Una población estadística es un conjunto de sujetos o elementos que presentan

características comunes.

4. Muestra

Una muestra es un subconjunto de elementos de la población estadística.

5. Periodo

Se utiliza regularmente para designar el intervalo de tiempo necesario para

completar un ciclo repetitivo, o simplemente el espacio tiempo que dura algo.

6. Distribución

En teoría de la probabilidad y estadística, la distribución de probabilidad de una

variable aleatoria es una función que asigna a cada suceso definido sobre la

variable la probabilidad de que dicho suceso ocurra.


23

7. Frecuencia

En estadística, la frecuencia de un evento es el número de veces en que dicho

evento se repite durante un experimento o muestra estadística.

III. MATERIALES Y MÉTODOLOGÍA

3.1 Materiales

 Datos de los Caudales medios anuales entre los años 1953-1981 de las estaciones

de Chuquicara, Cedros y Colcas.

 Laptop

 Calculadora

 Cuaderno de apuntes

 USB

 Software Microsoft Excel 2016

 Software Microsoft Word 2016

3.2 Metodología

 Lo primero que realizamos fue la clasificación de los datos de las estaciones de

Chuquicara, Cedros y Colcas, en una tabla de frecuencias.

 Luego en la tabla de frecuencias procedimos a realizar los cálculos de la función

densidad empírica, normal, exponencial, Gumbel y lognormal, con los datos de los

caudales máximos instantáneos de las estaciones Chuquicara, Cedros y Colcas y

encontrar el modelo que se ajuste a la función densidad empírica.


24

 Luego procedimos a calcular las probabilidades y el tiempo de retorno de todos

caudades máximos instantáneos de las estaciones Chuquicara, Cedros y Colcas.,

en los datos no agrupados.

 Luego procedimos a calcular los caudales para periodos de 50, 100, 150 y 200

años respectivamente, en las estaciones Chuquicara, Cedros y Colcas.

 Finalmente se procedió con el cálculo del caudal ecológico en base a la Resolución

jefatural del ANA

IV. RESULTADOS Y DISCUSIÓN

V. CONCLUSIONES

VI. RECOMENDACIONES
25

VII. REFERENCIAS BIBLIOGRÁFICAS

Allen, B. (2002). Revisión de conceptos de estadística y probabilidad. Lima.

Gestiopolis. (17 de mayo de 2015). Gestiopolis.com. Obtenido de Gestiopolis.com:

https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/

Mas Fernández, H. (2010). Estadística. Lima: Cuzcano.

Montealegre B., J. (1990). Técnicas estadísticas aplicadas en el manejo de datos

hidrológicos y meteorolóicos. Bogotá: Trillas.

Significados. (10 de junio de 2016). Obtenido de Significados:

https://www.significados.com/estadistica/
26

VIII. ANEXOS
27

ESTADÍSTICA Y PROBABILIDAD

Potrebbero piacerti anche