Estadística y Probabilidad

UNIVERSIDAD NACIONAL SANTIAGO ANTÚNEZ DE MAYOLO
FACULTAD DE CIENCIAS DEL AMBIENTE
Escuela Profesional de Ingeniería Ambiental
INFORME N° 03
“Análisis estadístico y probabilístico de las estaciones Chuquicara, Cedros y Colcas”
Curso: Hidrología
Docente: DÍAZ SALAS, Abelardo
Integrantes:
 HUAYNATE GAMARRA, Darwin

 JARA JULCA, Jhon
 LOLI GERRERO, Erick
 MACEDO CASTILLO, Andre
 MINAYA HILARIO, Jairo Álvaro
 VEGA GARCÍA, Rusbel
Huaraz-Perú
ii
ÍNDICE
iii
INDICE DE FIGURAS
Figura 1. Histograma y polígono de frecuencias .................................................................... 13

Figura 2. Diagrama escalonado .............................................................................................. 14
Figura 3. Distribución normal................................................................................................. 17
Figura 4. Distribución exponencial ......................................................................................... 18
Figura 5. Distribución de Gumbel ........................................................................................... 20
INDICE DE ECUACIONES
Ecuación 1. El rango ............................................................................................................... 10
Ecuación 2. Número de grupos o clases.................................................................................. 11
Ecuación 3. Ancho de clase ..................................................................................................... 11
Ecuación 4. Marca de clase .................................................................................................... 11
Ecuación 5. Frecuencia relativa ............................................................................................. 11
Ecuación 6. Frecuencia absoluta acumulada ......................................................................... 12
Ecuación 7. Frecuencia relativa acumulada ........................................................................... 12
Ecuación 8. Probabilidad ........................................................................................................ 15
Ecuación 9. Función de distribución normal .......................................................................... 16
Ecuación 10. Distribución acumulada normal........................................................................ 17
Ecuación 11. Función de distribución exponencial ............................................................... 18
Ecuación 12. Distribución acumulada exponencial ................................................................ 19
Ecuación 13. Función de la distribución de Gumbel .............................................................. 19
Ecuación 14. Distribución acumulada de Gumbel .................................................................. 20
Ecuación 15. Función de la distribución Lognormal .............................................................. 21
Ecuación 16. Periodo de retorno ............................................................................................ 21
Ecuación 17. Periodo de retorno con la función de distribución acumulada ......................... 21
iv
INTRODUCCIÓN
v
5
I. OBJETIVOS
1.1. Objetivos generales
Realizar el análisis estadístico y probabilístico de las estaciones Chuquicara, Cedros y
Colcas.
1.2. Objetivos específicos
 Realizar la tabla de distribución de frecuencias con los caudales máximos de las
estaciones Chuquicara, Cedros y Colcas.
 Realizar los cálculos de densidad empírica, normal, exponencial, Gumbel y
lognormal, con los datos de los caudales máximos instantáneos de las estaciones
Chuquicara, Cedros y Colcas y encontrar el modelo que se ajuste a la a la función
densidad empírica.
 Determinar la probabilidad y el periodo de retorno para todos los caudales
máximos instantáneos de las estaciones Chuquicara, Cedros y Colcas.
 Determinar los caudales para periodos de 50, 100, 150 y 200 años
respectivamente.
 Determinar el caudal ecológico en base a la Resolución jefatural del ANA

6
1.3. Justificación
En la actualidad la estadística es una ciencia que ha logrado ganar importantes
espacios en muchos ámbitos cotidianos, es indispensable en estudios de poblaciones,
predicciones de riesgos, pero sobre todo proporciona herramientas valiosas en la toma
de decisiones eso sin quitarle al ser humano la última palabra. Mediante la
probabilidad, es posible ajustar de la manera más exacta posible los imponderables
debidos al azar en los más variados campos tanto de la ciencia como de la vida
cotidiana.
Como futuros ingenieros ambientales es de mucha importancia conocer el diseño de
diversas estructuras hidráulicas y determinar un modelo probabilístico el cual se
ajuste a los datos obtenidos de las estaciones en estudio, con el estudio estadístico y
probabilístico lograremos predecir la ocurrencia de acuerdo a una magnitud o
fenómeno que ocurre, con la cual podremos calcular los caudales de diseños para las
diversas estructuras hidraúlicas, sean diseño de represas, diseño de canales, diseño de
embalses, etc.
7
II. MARCO TEÓRICO
2.1 Antecedentes
2.1.1 En el contexto internacional ( has dos antecedentes aquí jhon)
a) (Completraaaa)
b) (Completara)
2.1.2 En el contexto nacional ( has dos antecedentes aquí jhon)
a. Completarararra
b. Completarrrrr
8
2.2 Bases teóricas
2.2.1 Estadística aplicada a la Hidrología
2.2.1.1 Conceptos generales
Estadística
Es una ciencia que utiliza datos numéricos para obtener inferencias basadas
en el cálculo de probabilidades. Una estadística es también un conjunto de
datos obtenidos a través de un estudio estadístico (Significados, 2016).
Son numerosas las definiciones de Estadística, no correspondiendo aquí
presentar su nómina ni elegir una que resulte idónea. Sí en cambio, conviene
distinguir dos ramas que han evolucionado en forma separada:
a. Estadística descriptiva
Se dedica a la descripción, visualización y resumen de datos originados a
partir de los fenómenos de estudio. Los datos pueden ser resumidos
numérica o gráficamente. Su objetivo es organizar y describir las
características sobre un conjunto de datos con el propósito de facilitar su
aplicación, generalmente con el apoyo de gráficas, tablas o medidas
numéricas.
b. Estadística inferencial
Se dedica a la generación de los modelos, inferencias y predicciones
asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad
de las observaciones. Se usa para modelar patrones en los datos y extraer
inferencias acerca de la población bajo estudio. Estas inferencias pueden

9
tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis),
estimaciones de unas características numéricas (estimación), pronósticos
de futuras observaciones, descripciones de asociación (correlación) o
modelamiento de relaciones entre variables (análisis de regresión).
2.2.1.2 Obtención de datos
La obtención de datos en la hidrología se realiza tomando muestras (datos),
dado que no es posible recopilar todos los datos de la población referente a
una variable hidrometeoro lógica. Como se trata de una muestra y se
considera que la recopilación de los datos se efectúa al azar, se dice que el
muestreo es aleatorio y por consiguiente a la muestra se denomina muestra
aleatoria.
2.2.1.2.1 Población
Es el conjunto de todos los posibles elementos que intervienen en un
experimento o en un estudio. La hay de dos tipos:
 Población finita. Es aquella que indica que es posible alcanzarse
o sobrepasarse al contar. Es aquella que posee o incluye un
número limitado de medidas y observaciones (Gestiopolis, 2015).
 Población infinita. Es infinita si se incluye un gran conjunto de
medidas y observaciones que no pueden alcanzarse en el conteo.
Son poblaciones infinitas porque hipotéticamente no existe límite
en cuanto al número de observaciones que cada uno de ellos puede
generar (Gestiopolis, 2015).

10
2.2.1.2.2 Muestra
Es un conjunto de medidas u observaciones tomadas a partir de una
población dada. Es un subconjunto de la población (Gestiopolis, 2015).
2.2.1.3 Clasificación de los datos
Para facilitar la interpretación y la evaluación correspondiente, estos datos
deben ser clasificados o categorizados o distribuidos en clases, es decir los
datos deben ser organizados en clases o grupos. La clasificación se logra
ordenando los datos según su magnitud en forma ascendente o descendente y
luego se agrupan en clases. Al clasificar los datos, se determina el número de
datos en cada clase, dado que cada una de estas clases tienen sus límites
(valores) superior e inferior definidos.
Según Mas (2010) que hay que seguir son los siguientes pasos para obtener
la distribución de frecuencias:
1. Alcance y recorrido (A)
Es el intervalo definido por el menor y mayor de los datos
2. Rango (R)
Viene ser la diferencia entre los extremos del alcance.
𝑅 = 𝑄𝑚á𝑥 − 𝑄𝑚𝑖𝑛
Ecuación 1. El rango
11
3. Intervalos de clase (Ii)
Son grupos que resultan de particionar el alcance o recorrido; el número
de grupos (K) se determina por la regla propuesta por STURGES.
𝑲 = 1 + 3.32 𝐿𝑜𝑔 𝑛
n= Número total de datos
Ecuación 2. Número de grupos o clases
4. Ancho de clase (w)
Viene a ser la diferencia que existe entre los extremos de cada intervalo.
𝑹
𝒘=𝑲
Ecuación 3. Ancho de clase
5. Marca de clase (yi)
Son los puntos medios de los intervalos de clase.
𝐿𝑖 + 𝐿𝑠
𝒚𝒊 =
2
Ecuación 4. Marca de clase
6. Frecuencia absoluta (fi)
Es el número de datos que cae dentro de cada intervalo.
7. Frecuencia relativa (hi)
Es el cociente entre la frecuencia absoluta y el número total de datos.
𝑓𝑖
𝒉𝒊 =
𝑛
Ecuación 5. Frecuencia relativa

12
8. Frecuencia absoluta acumulada (Fi)
Es aquella que resulta de sumar sucesivamente las frecuencias absolutas.
Fi = f1+f2+f3+f4+….….+fn
Ecuación 6. Frecuencia absoluta acumulada
9. Frecuencia relativa acumulada (Hi)
Es aquella que resulta de sumar sucesivamente las frecuencias relativas.
Hi= h1+h2+h3+h4+…….+hn = 1
Ecuación 7. Frecuencia relativa acumulada
2.2.1.4 Presentación de datos
Después de la clasificación de datos, es necesario presentar los resultados en
forma de tablas y en forma de gráficos, con la finalidad de facilitar su
interpretación y su posterior análisis.
a) Presentación tabular o distribuciones de frecuencia
La presentación tabular o las distribuciones de frecuencia o tabla de
distribuciones de frecuencia es una tabla que divide los datos de la muestra
en cierto número de clases, donde se muestra el número de datos en cada
clase, a este número de datos en cada clase se le conoce con el nombre de
frecuencia de clase o simplemente frecuencia.
b) Presentación en forma gráfica
a) Histogramas y polígono de frecuencia

13
Son diagramas de barra o rectángulos cuyas bases representan los
intervalos de clase y las alturas las respectivas absolutas y relativas
(Mas, 2010).
Un polígono de frecuencias, es un gráfico de línea trazado sobre las
marcas de clase. Puede obtenerse uniendo los puntos medios de los
techos de los rectángulos en el histograma.
Figura 1. Histograma y polígono de frecuencias
b) Diagrama escalonado
Son diagramas similares a las histogramas con la diferencia de que las
alturas son las frecuencias absolutas o relativas acumuladas (Mas,
2010).
14
Figura 2. Diagrama escalonado
2.2.1.5 Descripción de datos
La razón fundamental de clasificar los datos en una tabla y graficar las
frecuencias es para describir la naturaleza de la distribución de frecuencias,
La descripción se realiza mediante los estadísticos o los estadígrafos.
a. Estadísticos de posición
Son números que indican la localización del valor medio o valor central
de la distribución de frecuencias, estos estadísticos son denominados
como medidas de localización o medidas de tendencia central; por tanto
las medidas de posición determinan la ubicación del valor central de los
datos de una distribución de frecuencias. Los estadísticos de posición
comúnmente usados son: media, mediana y moda.
b. Medidas muestrales de dispersión
Estos estadísticos (números) indican el grado de dispersión o desfases en
los datos de la muestra, poca dispersión indica una uniformidad en los

15
valores de la muestra, mientras que alta dispersión indica poca
uniformidad en los valores de la muestra. Cuando los valores son muy
cercanos al promedio existe uniformidad y cuando los valores de la
muestra son muy alejados al promedio se dice que no hay uniformidad, es
decir los valores de la muestra son diferentes o dispersos. Los estadísticos
de dispersión son: rango, varianza, desviación estándar y coeficiente de
variación.
2.2.2 Probabilidad aplicada a la Hidrología
2.2.2.1 Conceptos básicos
Probabilidad
La probabilidad de ocurrencia de un evento dado es igual a la relación entre el
número de sucesos favorables “m” y el número de sucesos totales, “n”.
𝑚
P(X = x) =
𝑛
Ecuación 8. Probabilidad
Fenómeno aleatorio
Es aquel fenómeno que bajo las mismas condiciones experimentales se
presentan más de una manera o también se le denomina fenómeno que sucede
al azar.
Espacio muestral
Es el conjunto de todas las ocurrencias o resultados posibles de un
experimento aleatorio. En un experimento aleatorio no es posible predecir

16
con anticipación el resultado, pero si es posible conocer el conjunto de todos
los resultados posibles, llamado especio muestral.
Evento
Es un subconjunto del espacio muestral, evento también se puede definir como
la colección de puntos o subconjuntos en un espacio muestral que tienen
características comunes.
2.2.2.2 Distribuciones de probabilidad para variables continuas
i. Distribución normal
Es una distribución simétrica en forma de campana, también conocida
como Campana de Gauss. Es fundamental en el dominio de la estadística y
la probabilidad (Allen, 2002).
Cuya función es la siguiente:
Ecuación 9. Función de distribución normal
Los parámetros de la distribución son dos:

17
La función densidad de la distribución normal será:
Ecuación 10. Distribución acumulada normal
Para calcular los valores ajustados a la distribución normal (x):
Esta distribución tiene una forma de campana simétrica, como se muestra
en la Ilustración mmmmmmm.
Figura 3. Distribución normal
La distribución normal se usa para:
 Comparar distribuciones: las propiedades de una muestra de variables
no normales pueden compararse con las de variables normales.
 Aproximar la distribución de probabilidades de errores aleatorios.

18
 Muchos estadísticos pueden ser normalmente distribuidos, como, por
ejemplo, la media de la mayoría de las variables hidrológicas.
ii. Distribución exponencial
La función densidad del modelo probabilístico exponencial está dado
por:
Donde:
1
λ=𝑋
Ecuación 11. Función de distribución exponencial
Como ejemplo de esta función se muestra en la figura 4.
Figura 4. Distribución exponencial

En consecuencia, la función de distribución acumulada de probabilidades
será:
19
Ecuación 12. Distribución acumulada exponencial
iii. Distribución de Gumbel
En teoría de probabilidad y estadística la distribución de Gumbel, es
utilizada para modelar la distribución del máximo (o el mínimo), por
lo que se usa para calcular valores extremos.
Esta distribución ha sido utilizada, con buenos resultados, para el
estudio de frecuencias de valores extremos; por ello es aplicable a
valores máximos o mínimos de caudales, precipitaciones,
temperaturas, etc) (Montealegre, 1990).
Donde:
𝑿−𝜷
w: 𝜶
Donde:
𝜷 = 𝜇 − 0.45𝜎
𝜶 = 0.78𝜎
Ecuación 13. Función de la distribución de Gumbel

20
Como ejemplo de esta función se muestra en la figura 5.
Figura 5. Distribución de Gumbel
Entonces la distribución acumulada de Gumbel será:
−𝑤
F(w) = 𝑒 −𝑒
Ecuación 14. Distribución acumulada de Gumbel
iv. Distribución Lognormal
En probabilidades y estadísticas, la distribución lognormal es una
distribución de probabilidad de una variable aleatoria cuyo logaritmo
está normalmente distribuido. Es decir, si X es una variable aleatoria
con una distribución normal, entonces exp(X) tiene una distribución
lognormal.

21
Donde:
𝝁: 𝑚𝑒𝑑𝑖𝑎
𝝈: 𝑑𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟
Ecuación 15. Función de la distribución Lognormal
2.2.2.3 Periodo de retorno
El periodo de retorno es el número de años en que en promedio se presenta
una variable hidrológica extrema (evento extremo) superior o igual a cierto
valor. El periodo de retorno se denomina también tiempo de retorno, intervalo
de ocurrencia. Y se expresa de la siguiente manera:
Ecuación 16. Periodo de retorno
Así mismo se puede relacionar el Periodo de retorno con la función de
distribución acumulada F(x), de la siguiente manera:
Ecuación 17. Periodo de retorno con la función de distribución acumulada

22
2.3 Términos conceptuales
1. Estadística
Ciencia que utiliza conjuntos de datos numéricos para obtener, a partir de ellos,
inferencias basadas en el cálculo de probabilidades.
2. Probabilidad
Cálculo matemático de las posibilidades que existen de que una cosa se cumpla o
suceda al azar.
3. Población
Una población estadística es un conjunto de sujetos o elementos que presentan
características comunes.
4. Muestra
Una muestra es un subconjunto de elementos de la población estadística.
5. Periodo
Se utiliza regularmente para designar el intervalo de tiempo necesario para
completar un ciclo repetitivo, o simplemente el espacio tiempo que dura algo.
6. Distribución
En teoría de la probabilidad y estadística, la distribución de probabilidad de una
variable aleatoria es una función que asigna a cada suceso definido sobre la
variable la probabilidad de que dicho suceso ocurra.

23
7. Frecuencia
En estadística, la frecuencia de un evento es el número de veces en que dicho
evento se repite durante un experimento o muestra estadística.
III. MATERIALES Y MÉTODOLOGÍA
3.1 Materiales
 Datos de los Caudales medios anuales entre los años 1953-1981 de las estaciones
de Chuquicara, Cedros y Colcas.
 Laptop
 Calculadora
 Cuaderno de apuntes
 USB
 Software Microsoft Excel 2016
 Software Microsoft Word 2016
3.2 Metodología
 Lo primero que realizamos fue la clasificación de los datos de las estaciones de
Chuquicara, Cedros y Colcas, en una tabla de frecuencias.
 Luego en la tabla de frecuencias procedimos a realizar los cálculos de la función
densidad empírica, normal, exponencial, Gumbel y lognormal, con los datos de los
caudales máximos instantáneos de las estaciones Chuquicara, Cedros y Colcas y
encontrar el modelo que se ajuste a la función densidad empírica.

24
 Luego procedimos a calcular las probabilidades y el tiempo de retorno de todos
caudades máximos instantáneos de las estaciones Chuquicara, Cedros y Colcas.,
en los datos no agrupados.
 Luego procedimos a calcular los caudales para periodos de 50, 100, 150 y 200
años respectivamente, en las estaciones Chuquicara, Cedros y Colcas.
 Finalmente se procedió con el cálculo del caudal ecológico en base a la Resolución
jefatural del ANA
IV. RESULTADOS Y DISCUSIÓN
V. CONCLUSIONES
VI. RECOMENDACIONES
25
VII. REFERENCIAS BIBLIOGRÁFICAS
Allen, B. (2002). Revisión de conceptos de estadística y probabilidad. Lima.
Gestiopolis. (17 de mayo de 2015). Gestiopolis.com. Obtenido de Gestiopolis.com:
https://www.gestiopolis.com/que-es-estadistica-tipos-y-objetivos/
Mas Fernández, H. (2010). Estadística. Lima: Cuzcano.
Montealegre B., J. (1990). Técnicas estadísticas aplicadas en el manejo de datos
hidrológicos y meteorolóicos. Bogotá: Trillas.
Significados. (10 de junio de 2016). Obtenido de Significados:
https://www.significados.com/estadistica/
26
VIII. ANEXOS
27
ESTADÍSTICA Y PROBABILIDAD

Estadística y Probabilidad

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Estadística y Probabilidad

Caricato da

Copyright:

Formati disponibili

UNIVERSIDAD NACIONAL SANTIAGO ANTÚNEZ DE MAYOLO

FACULTAD DE CIENCIAS DEL AMBIENTE

Escuela Profesional de Ingeniería Ambiental

“Análisis estadístico y probabilístico de las estaciones Chuquicara, Cedros y Colcas”

Docente: DÍAZ SALAS, Abelardo

 HUAYNATE GAMARRA, Darwin

Figura 1. Histograma y polígono de frecuencias .................................................................... 13

1.1. Objetivos generales

Realizar el análisis estadístico y probabilístico de las estaciones Chuquicara, Cedros y

1.2. Objetivos específicos

 Realizar la tabla de distribución de frecuencias con los caudales máximos de las

estaciones Chuquicara, Cedros y Colcas.

 Realizar los cálculos de densidad empírica, normal, exponencial, Gumbel y

Chuquicara, Cedros y Colcas y encontrar el modelo que se ajuste a la a la función

 Determinar la probabilidad y el periodo de retorno para todos los caudales

máximos instantáneos de las estaciones Chuquicara, Cedros y Colcas.

 Determinar el caudal ecológico en base a la Resolución jefatural del ANA

En la actualidad la estadística es una ciencia que ha logrado ganar importantes

espacios en muchos ámbitos cotidianos, es indispensable en estudios de poblaciones,

predicciones de riesgos, pero sobre todo proporciona herramientas valiosas en la toma

de decisiones eso sin quitarle al ser humano la última palabra. Mediante la

probabilidad, es posible ajustar de la manera más exacta posible los imponderables

Como futuros ingenieros ambientales es de mucha importancia conocer el diseño de

diversas estructuras hidráulicas y determinar un modelo probabilístico el cual se

probabilístico lograremos predecir la ocurrencia de acuerdo a una magnitud o

diversas estructuras hidraúlicas, sean diseño de represas, diseño de canales, diseño de

II. MARCO TEÓRICO

2.1.1 En el contexto internacional ( has dos antecedentes aquí jhon)

2.1.2 En el contexto nacional ( has dos antecedentes aquí jhon)

2.2 Bases teóricas

2.2.1 Estadística aplicada a la Hidrología

2.2.1.1 Conceptos generales

en el cálculo de probabilidades. Una estadística es también un conjunto de

datos obtenidos a través de un estudio estadístico (Significados, 2016).

Son numerosas las definiciones de Estadística, no correspondiendo aquí

presentar su nómina ni elegir una que resulte idónea. Sí en cambio, conviene

distinguir dos ramas que han evolucionado en forma separada:

Se dedica a la descripción, visualización y resumen de datos originados a

partir de los fenómenos de estudio. Los datos pueden ser resumidos

numérica o gráficamente. Su objetivo es organizar y describir las

características sobre un conjunto de datos con el propósito de facilitar su

aplicación, generalmente con el apoyo de gráficas, tablas o medidas

Se dedica a la generación de los modelos, inferencias y predicciones

asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad

de las observaciones. Se usa para modelar patrones en los datos y extraer

inferencias acerca de la población bajo estudio. Estas inferencias pueden

tomar la forma de respuestas a preguntas sí/no (prueba de hipótesis),

estimaciones de unas características numéricas (estimación), pronósticos

de futuras observaciones, descripciones de asociación (correlación) o

modelamiento de relaciones entre variables (análisis de regresión).

2.2.1.2 Obtención de datos

La obtención de datos en la hidrología se realiza tomando muestras (datos),

dado que no es posible recopilar todos los datos de la población referente a

una variable hidrometeoro lógica. Como se trata de una muestra y se

considera que la recopilación de los datos se efectúa al azar, se dice que el

muestreo es aleatorio y por consiguiente a la muestra se denomina muestra

Es el conjunto de todos los posibles elementos que intervienen en un

experimento o en un estudio. La hay de dos tipos:

 Población finita. Es aquella que indica que es posible alcanzarse

o sobrepasarse al contar. Es aquella que posee o incluye un

número limitado de medidas y observaciones (Gestiopolis, 2015).

 Población infinita. Es infinita si se incluye un gran conjunto de

medidas y observaciones que no pueden alcanzarse en el conteo.

Son poblaciones infinitas porque hipotéticamente no existe límite