Sei sulla pagina 1di 17

PROBABILIDAD Y ESTADISTICA

UNIVERSIDAD DE CUENCA

PROFESORA: ING. SOLEDAD ESTRELLA


ALUMNA: KATHERINE NIETO

Contenido
1. INTRODUCCIN............................................................................................. 2
2. OBJETIVOS..................................................................................................... 3
3. DESARROLLO................................................................................................ 4
3.1. ESCOGER UNA DISTRIBUCION DE PROBABILIDAD............................4
3.2. DISTRIBUCIN DE FRECHET.................................................................6
3.3. DISTRIBUCIN DE GUMBEL..................................................................7
3.4. PERIODOS DE RETORNO.......................................................................7
3.5. APLICACIONES........................................................................................ 8
4. CONCLUSIONES........................................................................................... 13
5. BIBLIOGRAFA............................................................................................. 14

1.INTRODUCCIN
El presente trabajo se desarrollara como escoger una distribucin para un
correcto anlisis de datos y su interpretacin, ya que en muchos casos el
aplicar
una
distribucin
inadecuada
puede
generar
grandes
complicaciones, por ejemplo en el caso de que se desee obtener la
probabilidad de la contaminacin de un artculo cualquiera, donde del
resultado depender el nmero de artculos que deben ser desechados;
en conclusin si se hace un mal clculo se tendra como consecuencia una
gran prdida econmica. Adems, tambin se estudiaran las
distribuciones de Gumbel y Frechet, conocidas en la estadstica de los
valores extremos, pues estos tienen una gran participacin por ejemplo,
una estructura de edificacin debe disearse para resistir las mximas
cargas, los mximos vientos, los mximos gradientes de temperatura y
los mximos terremotos; una obra de proteccin contra riadas se proyecta
para soportar los mximos caudales; un embalse para abastecimiento de
agua a un ncleo urbano se disea para dar servicio bajo las condiciones
peores de sequa; un dique se proyecta para resistir las olas mayores, etc.
Por esto en la ingeniera es de gran importancia el anlisis de valores
extremos; en el presente informe se buscara hacer un mayor estudio de la
aplicacin de valores extremos en el campo de la Ingeniera Civil.

2.OBJETIVOS

De datos obtenidos, poder hacer el correcto anlisis para escoger


una distribucin de probabilidad adecuada para su estudio.
Desarrollar el concepto de la distribucin de Frechet.
Desarrollar el concepto de la distribucin de Gumbel.
Ofrecer una gua prctica para el estudio estadstico de valores
extremos.
Realizar un anlisis de las funciones y sus aplicaciones.
Dar ejemplos del uso de las funciones en problemas que se
relacionan con la Ingeniera Civil.

3.DESARROLLO
3.1. ESCOGER UNA DISTRIBUCION DE PROBABILIDAD
Un mtodo muy bsico para escoger una distribucin de probabilidad es el
anlisis de la simetra, para lo cual se compara la media con la mediana,
lo que ayudara a escoger una distribucin simtrica como la distribucin
normal o una asimtrica como la distribucin exponencial.
Para una distribucin simtrica, la media y mediana deben tener o
acercarse al mismo valor, ya que comnmente una distribucin asimtrica
la media es mucho mayor a la mediana.
Cuando se tiene N datos, una distribucin simtrica no es apropiada si la
diferencia entre la media y la mediana es mayor que la desviacin
estndar dividido para N .
Este mtodo es sin embargo, para un anlisis muy breve con datos
pequeos.
Por otro lado se tiene un mtodo ms prctico para escoger una
distribucin que realiza un anlisis ms profundo, el cual se presenta a
continuacin:
Los sistemas reales presentan fuentes de aleatoriedad, por lo que es
necesario simular un sistema real a partir de los datos. Algunos ejemplos
de sistemas con fuentes, son:
- Fabricacin: Tiempos de procesamiento
Tiempos de falla
Tiempos de reparacin de maquinas
- Defensa: Tiempos de arribo y carga til de aviones o misiles
Errores de lanzamiento
- Comunicaciones: Tiempos entre llegadas de mensajes
Longitudes de mensajes
- Transporte Tiempo de embarque
Tiempo entre arribos
- Otros
Para escoger una distribucin de probabilidad, se pueden identificar
algunos pasos principales como:
1. Escoger una distribucin.
2. Estimar parmetros
3. Test de bondad de ajuste
1. Escoger una distribucin
Para seleccionar la distribucin de probabilidad correcta, se debe mirar la
variable en cuestin y listar todo lo que se sabe acerca de las condiciones
que rodean a esta variable.
Usted puede ser capaz de obtener informacin valiosa acerca de la
variable incierta a partir de datos histricos. Si los datos histricos no
estn disponibles, utilice su propio criterio, para enumerar todo lo que
sabe acerca de la variable.
4

Por ejemplo, mira a los " pacientes curados " variable que se analizan. La
compaa tiene previsto realizar pruebas a 100 pacientes. Usted sabe que
los pacientes bien sern curados o no curados. Y, usted sabe que el
frmaco ha demostrado una tasa de curacin de alrededor de 0,25 (25 %).
Estos hechos son las condiciones que rodean a la variable.
Entonces describiendo las condiciones de una distribucin y
proporcionando ejemplos del mundo real de cada tipo de distribucin.
Seleccione la distribucin que caracteriza a esta variable.
Una distribucin caracteriza a una variable cuando las condiciones de la
distribucin coinciden con los de la variable.
Para el ejemplo, mire las condiciones de la distribucin binomial, describe
que Para cada ensayo, slo hay dos resultados posibles: el xito o el
fracaso; Los ensayos son independientes. Lo que ocurre en el primer juicio
no afecta a la segunda prueba, y as sucesivamente; adems, La
probabilidad de xito sigue siendo la misma de un ensayo a.
Compruebe ahora la variable "pacientes curados " Hay dos posibles
resultados: el paciente est bien curado o no curado; los ensayos (100)
son independientes entre s. Lo que sucede con el primer paciente no
afecta a la segunda paciente; adems, La probabilidad de curacin de un
paciente 0.25 (25 %) sigue siendo el mismo cada vez que un paciente se
prueba.
Dado que las condiciones de la variable coinciden con las condiciones de
la distribucin binomial, la distribucin binomial sera el tipo de
distribucin correcto para la variable en cuestin.
Una vez seleccionado el tipo de distribucin, determinar los valores de los
parmetros para la distribucin. Cada tipo de distribucin tiene su propio
conjunto de parmetros.
Las caractersticas de algunas de las distribuciones ms utilizadas se
presentan a continuacin.
Las distribuciones continuas ms usadas son:
- Uniforme: Para cantidades que varan "aleatoriamente" entre
valores a y b, y que no se conocen ms datos.
- Exponencial: Tiempos entre llegadas de "clientes" a un sistema, y
que ocurren a una tasa constante. Tiempos de falla de mquinas.
- Gamma, Weibull: Tiempo de servicio, tiempos de reparacin.
- Normal: Errores. Sumas grandes Teorema central del lmite
Las distribuciones discretas ms usadas son:
- Bernoulli.
- Uniforme discreta.
- Geomtrica: nmero de observaciones hasta detectar el primer
error.
- Binomial negativa: nmero de observaciones hasta detectar el nsimo error.
- Poisson: Nmero de eventos en un intervalo de tiempo, si ocurren a
tasa constante.
2. Estimar parmetros
5

Para algunas de las distribuciones es necesario obtener parmetros, que


representen caractersticas especficas que intervienen en la funcin,
como son:
De posicin, que se aplican en la distribucin normal, uniforme; de escala,
que se aplican en la distribucin normal, uniforme, exponencial,
lognormal; y de forma, que se aplican en la distribucin Gamma, Weibull,
lognormal.
3. Test de bondad
La bondad de ajuste describe cun bien se ajusta un conjunto de
observaciones. Las medidas de bondad en general resumen la
discrepancia entre los valores observados y los valores esperados en el
modelo de estudio. Se pueden realizar varios test, por ejemplo el test de
normalidad de los residuos, comprobar si dos muestras se obtienen a
partir de dos distribuciones idnticas (test de Kolmogorov-Smirnov), o si
las frecuencias siguen una distribucin especfica (test chi cuadrado).
Por ejemplo, en el caso del test de chi cuadrado, compara la distribucin
de frecuencias observada (Fo) de una variable con la distribucin de
frecuencias obtenida.
El propsito de la prueba es averiguar si existen diferencias
estadsticamente significativas entre la distribucin observada (Fo) y la
distribucin esperada (Fe).
Se plantean las hiptesis:
Nula: Ho: Fo=Fe
Alterna: Ha: Fo Fe
El procedimiento de la prueba incluye el clculo de la llamada chi
cuadrada, cuya frmula es:
2
(frecuencia observadafrecuenciaesperada)
2=
frecuencia esperada
Donde se compara con una tabla llamada Valores Crticos de Chi
cuadrada, si el valor calculado resulta mayor que el valor critico de dicha
medida, se rechaza; si es menor o igual, ambas distribuciones se ajustan.

3.2. DISTRIBUCIN DE FRECHET


Es un caso especial de la distribucin de valores extremos generalizada.
Su funcin de distribucin, cuando se tienen tres parmetros, viene dada
por

( x
)

F ( x )=
Si x >

, mientras que la funcin de densidad es


x
f ( x )=

( )

( x )

Si x >

Donde

(0,)

es el parmetro de forma,

(0,)

el de escala y

( ,+)

el de localizacin. Cuando se tienen dos parmetros (en el


caso en el que =0 ), la funcin de distribucin pasa a ser

( x )

F ( x )=

Si x > 0

Y la funcin de densidad es
x
f ( x )=

()

( x )

Si x > 0

Por ltimo, cuando la distribucin slo tiene un parmetro ( =1 ),


F ( x )=x

Si x > 0
Y

f ( x )= ( x )

( x )

Si x > 0

El nombre de la distribucin viene del matemtico francs Maurice


Frchet, y su principal uso es en el campo de la hidrologa.

3.3. DISTRIBUCIN DE GUMBEL


Fue descubierta por Emil Julius Gumbel, matemtico judo nacido en
Alemania a finales del siglo XIX. Es un caso particular de la distribucin de
valores extremos generalizada, y tambin es conocida como la
distribucin log-Weibull, o como la distribucin exponencial doble. Segn
Reiss y Thomas (1997), la distribucin de Gumbel tiene la misma
importancia que la distribucin Normal en otras aplicaciones.
La funcin de distribucin de la distribucin de Gumbel es
F ( x )=

( x)

Mientras que la funcin de densidad viene dada por

f ( x )=

( x)

( x)

x ( ,+ ) .

La distribucin de Gumbel corresponde al caso en el que


En ese caso, la funcin de distribucin viene dada por
x

F ( x )=

=0

y =1 .

,
7

Mientras que la funcin de densidad de probabilidad sera


f ( x )=

3.4. PERIODOS DE RETORNO


Cuando la variable aleatoria considerada es una magnitud relacionada con
algn fenmeno natural (caudales, velocidades de viento, etc.), es
conveniente referirse a periodos de retorno en lugar de a probabilidades
de ocurrencia. Si p es la probabilidad de que una variable x supere un
valor dado X en un cierto lapso, el periodo de retorno T representara el
nmero de unidades de tiempo que transcurrirn en promedio entre dos
oportunidades en que la variable supere dicho valor, es decir:
1
p=P(x X)= T
El anlisis estadstico consiste en hallar la funcin que mejor represente el
comportamiento de la variable aleatoria x, para luego asignar a cada
valor X una probabilidad o periodo de recurrencia.
-

DISTRIBUCION FRECHET
Mximos:
1
T=
1F( y)
Mnimos:
1
T=
F( y)
y=

k
ln( F ( y))

DISTRIBUCION GUMBEL
Mximos:
1
T=
1F(x )
Mnimos:
1
T=
F (x)
1
x=u ln (ln(F ( x )))

3.5. APLICACIONES

En el campo de la ingeniera civil existen varias aplicaciones en las cuales


es necesario el clculo de los valores extremos y por ende la aplicacin de
algunas de las distribuciones de probabilidad para la obtencin de valores

estadsticos. El predecir fenmenos meteorolgicos es una principal


aplicacin, como son las velocidades de vientos, el nivel de
precipitaciones y caudales de ros, etc.
EJEMPLO 1. (Tomado de Anlisis Estadstico De Valores Extremos,
MAGGIO)
Evaluacin de cotas hidromtricas extremas, mximas y mnimas, a lo
largo del rio Paran, Republica de Argentina.
Con el objeto de predecir avenidas o estiajes se tomaron como variables
las cotas hidromtricas.
De las series de crecidas y bajantes diarias se tomaron los valores
extremos anuales, de varios lugares, que son:
Rosario San Pedro Las Palmas Zrate - Riachuelo Corrientes
Paran
Anlisis de crecidas:
Se ordenaron los datos en forma decreciente, se determinaron las
probabilidades y s graficaron por Gumbel.

Anlisis de estiajes:
Para las bajantes extremas se sigui el mismo procedimiento, y se decidi
recurrir a la distribucin Gumbel.

EJEMPLO
(Tomado
Anlisis
Frecuencia
Los
Caudales
Mximos
Diarios En
Ros
De

2.
De
De
De

10

Colombia Considerando Las Fases Del Fenmeno ENSO, ALVARES.


POVEDA)
Los denominados fenmenos de El Nio y La Nia dominan la variabilidad
climtica del planeta a escala de tiempo interanual. Ambos fenmenos
son las dos fases opuestas del fenmeno llamado El Nio-Oscilacin del
Sur (ENSO). El Nio es el calentamiento anormal de las aguas del Pacfico
(fase caliente) y durante La Nia ocurre un enfriamiento del mar. En
general, en Colombia durante El Nio se presenta una disminucin
drstica de las lluvias y de los caudales de los ros, as como una
disminucin en la cantidad de agua almacenada en los suelos, y por ende
una disminucin de la actividad vegetal y en la evapotranspiracin, y un
aumento en las temperaturas del aire. Durante La Nia ocurren los efectos
contrarios, es decir que se presentan tormentas muy intensas, crecidas de
ros e inundaciones en las planicies aluviales.
El objetivo es, usando una metodologa de funciones de probabilidad
mixtas, que consideran dos fases del ENSO: El Nio y La Nia, estimar los
caudales mximos de diferente perodo de retorno.
El anlisis se realiza usando dos tipos de separacin de las muestras
estadsticas, as:
- Muestra 1: Caudales durante (1) El Nio y No ENSO y (2) caudales
durante La Nia (2 poblaciones)
- Muestra 2: Caudales durante (1) El Nio, (2) caudales No ENSO y (3)
caudales durante La Nia (3 poblaciones)
La distribucin ser el resultado de la sumatoria de la funcin de
distribucin de probabilidad de cada muestra, afectada por un factor de
ponderacin dado por la relacin entre los datos de cada muestra y los
datos de la serie completa. La representacin de la mezcla de funciones
de distribucin de probabilidades est dada segn,
FT ( X x )=1 F1 ( X x ) + 2 F2 ( X x ) ++ i F i ( X x )
n

i =1
i=1

En donde FT representa la funcin de distribucin de probabilidad de toda


la muestra de caudales extremos, Fi es la funcin de distribucin de
probabilidad de cada muestra resultante de la discretizacin, y pi
representa el factor de ponderacin de cada muestra.
Para efectuar el anlisis se usaron las funciones de probabilidad
Lognormal, y las distribuciones de valor extremo tipo I (Gumbel) y tipo II
(Frechet).
Obteniendo las grficas se probabilidad se obtiene por Gumbel.
m0.28
P ( X x )=
n+0.28
En donde m es la posicin de un valor en una lista ordenada por magnitud
descendente y n es el nmero de datos de la serie de caudales mximos
anuales.
Se inicia con el ajuste de un mismo tipo de funcin de distribucin para
cada discretizacin obteniendo as tres funciones de distribucin de
11

probabilidad (Lognormal, Gumbel y Frechet) para los caudales diarios


mximos observados durante los aos de ocurrencia de La Nia, y para
los caudales diarios mximos observados durante aos de ocurrencia de
El Nio.
El factor de ponderacin , en la ecuacin se estima mediante el
cociente entre el nmero de datos de la discretizacin de las muestras y
el nmero total de datos.
El error estndar de estimacin (eee) de los promedios mustrales
estimados con una muestra de n datos, se estima mediante.

eee=
n
Con datos de registros de varios lugares distribuidos en las regiones
centro y occidental de Colombia.
Se obtuvieron resultados como:
EJEMPLO 3. (Tomado de Determinacin De La Accin Del Viento Sobre

Las Estructuras En Chile, OSSANDN)


Para el clculo de la accin del viento sobre una estructura ubicada en
una determinada localidad se precisa conocer la mxima velocidad a la
que estar sometida durante su vida til. Para ello, se requiere estimar
una velocidad de retorno a partir de registros histricos de velocidades de
viento, medidos en el mismo sector donde se encuentra ubicada la
estructura.
A continuacin describe la metodologa estadstica conocida como Anlisis
de Valores Extremos conducente a la determinacin de una velocidad de
retorno a partir de los registros histricos de velocidades de viento. Esta
metodologa consiste en construir una base de datos formada por los
valores mximos de la velocidad del viento obtenidos de los registros
histricos, para luego ajustarles una funcin distribucin de probabilidad
acumulada y as obtener la velocidad de retorno del viento en una
determinada localidad.

12

De estas tres distribuciones de valores extremos, la distribucin de


Gumbel y la distribucin de Weibull han tenido aceptacin entre los
climatlogos que estudian el problema de los valores extremos. La
distribucin de Frechet en cambio entrega valores muy grandes, irreales
de la situacin de vientos de una determinada localidad.
La funcin de probabilidad acumulada Fgve(x) de la Distribucin
Generalizada de Valores Extremos puede ser escrita por:

{[

Fgve ( x ) =exp 1

k ( xu)
a

]}
1
k

Donde:
x= Valores mximos de una serie
k= Parmetro de forma
a= Parmetro de escala
u= Parmetro de ubicacin
Para el percentil u R con perodo de retorno correspondiente a

TR

, la

probabilidad acumulada es dada por:


1
Fgve ( uR )=1
TR
Combinando estas dos ltimas ecuaciones tenemos la expresin para la
velocidad u R asociada a un perodo de retorno T R .

{[

a
1
u R=u+ 1 ln 1
k
TR
Los
tres
especiales
k=0
Tipo
I,
conocida
Distribucin
k<0
Tipo
II,
conocida
Distribucin
k>0
Tipo
III,
conocida
Distribucin

)] }
k

casos
son:
(Distribucin
tambin
por
de Gumbel)
(Distribucin
tambin
por
de Frechet)
(Distribucin
tambin
por
de Weibull)

Aplicando estas distribuciones a los datos se obtienen resultados como:

13

CABE RESALTAR QUE EN LOS EJEMPLOS EXPUESTOS SOLO SE RESALTA LA


APLICACIN DE LAS DISTRIBUCIONES DE GUMBEL Y FRECHET PARA
PROBLEMAS RELACIONADOS EL CAMPO DE LA INGENIERIA CIVIL, YA QUE
ESTOS NO MUESTRAN LOS DATOS UTILIZADOS, SUS CALCULOS O AJUSTES
EXTRAS REALIZADOS PARA OBTENER SUS RESULTADOS.

14

4.CONCLUSIONES

Para la correcta solucin de un problema, seguir los pasos, para


poder utilizar una distribucin y que el resultado no tenga un
margen de error demasiado grande; estos pasos son, escoger la
distribucin, estimar parmetros; realizar el ajuste de bondad, y
otros secundarios.
Para poder hacer una buena eleccin de distribucin de
probabilidad realizar el anlisis de la variable aleatoria, para
poder compararla con las caractersticas de las distribuciones
conocidas y poder elegir la que ms se acomode a la variable.
La distribucin de Frechet es utilizada para el anlisis de valores
extremos, presenta parmetros de forma y escala; el nombre
viene del matemtico francs Maurice Frchet, y su principal uso
es en el campo de la hidrologa.
La distribucin Gumbel, fue descubierta por el matemtico Emil
Julius Gumbel. Al igual que Frechet, es un caso particular de la
distribucin de valores extremos generalizada.
Las aplicaciones de las distribuciones de Frechet y Gumbel en la
Ingeniera Civil se da en varias formas, por la relacin que estos
mantienen con los valores extremos ya que en este campo de
estudio es necesario el anlisis de este tipo de valores para
asegurar un buen resultado a su trabajo.
Entre las principales aplicaciones de las distribuciones se
encuentra la hidrologa por ejemplo en el nivel de precipitaciones
y caudales de ros, un embalse para abastecimiento de agua a un
ncleo urbano se disea para dar servicio bajo las condiciones
peores de sequa, o un dique se proyecta para resistir las olas
mayores, etc. Adems, para predecir fenmenos meteorolgicos
donde una estructura debe resistir los mximos vientos, los
mximos gradientes de temperatura y los mximos terremotos.

15

5.BIBLIOGRAFA

Maggio Elena, ANALISIS ESTADISTICO DE VALORES EXTREMOS,


NOLDOR S.R.L, Buenos Aires.
Murillo Juan G., TEORIA DEL VALOR EXTREMO, Revista
Ingenieras Universidad de Medelln, Colombia, 2009.
Muoz R., guila V., DETERMINACIN DE LA ACCIN DEL VIENTO
SOBRE LAS ESTRUCTURAS EN CHILE, Santiago de Chile, 2008.
Melo F., Becerra R., MEDIDAS DE RIESGO, CARACTERSTICAS Y
TCNICAS DE MEDICIN, Colombia, 2005.
Ibez Alejandro, ANLISIS ESTADSTICO DE VALORES
EXTREMOS Y APLICACIONES, Universidad de Granada, 2011.
lvarez Milena, ANLISI DE FRECUENCIA DE LOS CAUDALES
MXIMOS DIARIOS EN ROS DE COLOMBIA CONSIDERANDO LAS
FASES DEL FENMENO ENSO, Universidad Nacional Sede
Medelln.
Castillo Enrique, ESTADSTICA DE VALORES EXTREMOS.
DISTRIBUCIONES ASINTTICAS, Universidad de Cantabria,
Espaa.
Reynaga Jess, PRUEBA DE BONDAD DE AJUSTE.
Flesia
Georgina,
SELECCIN
DE
DISTRIBUCIONES
DE
PROBABILIDAD, FaMAF, 2013.
Oracle, DISTRIBUTION FITTING, 2008.
CHOSSING A DISTRIBUTION, Contaminated Sites Statistical
Applications Guidance Document No. 12-6, 2001.
Ricci Vito, FITTING DISTRIBUTIONS WHIT R, 2005.
EkstrM Joakim, ON PEARSON VERFIFICATION AND THE CHISQUARE TEST, UCLA Department of Statistics, 8125
Mathematical Sciences Building, Box 951554, Los Angeles CA,
90095-1554.
Castillo E., NUEVOS MODELOS DE DISTRIBUCIONES DE
EXTREMOS BASADOS EN APROXIMACIONES EN LAS RAMAS,
Trabajos De Estadstica Y De Investigacin Operativa Vol. 34, No.
3, Universidad De Santander, 1983.
Charles Yoe, CHOOSING A PROBABILITY DISTRIBUTION, Institute
For Water Resources, 2010.

16

Potrebbero piacerti anche