Sei sulla pagina 1di 12

SOLUCIÓN TALLER 3

PUNTO 1
➢ Calcular e interpretar CADA UNA de las medidas (de tendencia central y de
dispersión) aprendidas con el tema de Estadística Descriptiva

Se hacía por separado para colectivo, Metrolínea y finalmente la suma de ambas:

Sistema Sistema
TOTAL
Colectivo Metrolínea
Media 31604,66102 8229,342105 36904,91525
Varianza
Desviación 61714955,88 5361711,961 21253632,08
Desviación 7855,886703 2315,537078 4610,166166
Mediana 30418 8633 37980
C. Asimetría 0,132427314 -0,569304905 -0,573530277
C. Curtósis -1,379696371 -1,04546378 -0,584460145
C. Variación 0,248567346 0,281375722 0,124920113

*Para los datos de Metrolínea no se incluía en los cálculos los valores ceros de los anos donde aún no
funcionaba.

➢ Verificación supuesto de Normalidad


❖ Para pasajeros movilizados por transporte colectivo:
Histograma
Q-Q Plot

❖ Para pasajeros movilizados por Metrolínea:


Histograma
Q-Q Plot

❖ Para pasajeros movilizados por Colectivo + Metrolínea:


Histograma
Q-Q Plot

➢ Ajustar a modelo de probabilidad y prueba de bondad de ajuste


Se podía hacer aplicando Kolmogorov-Smirnov

❖ Para pasajeros movilizados por transporte colectivo:


❖ Para pasajeros movilizados por Metrolínea:

❖ Para pasajeros movilizados por Colectivo + Metrolínea:


PUNTO 2
Con base en los datos suministrados por la gráfica de precipitaciones mínimas durante los
últimos 34 años, tomados de la estación hidrológica se procede a analizar su
comportamiento.
➢ DISTRIBUCION DE GUMBEL
Como se va a trabajar con datos mínimos se utiliza la distribución de valores extremos de
GUMBEL que corresponde a mínimos.


F ( x ) = 1 − exp − e  ( x −u ) 
Que corresponde a la FDA.
De la muestra obtenemos los datos de la media aritmética, varianza y desviación estándar.

E x  =  x = 894.853
VARx  = 38124.184
 x = 195.254
Además, como son valores mínimos para un periodo de retorno para el año 50 se tiene:

1 1
A= = = 0.02
Tr 50
Se puede ver que para la FDA necesitamos unos parámetros como son u y α, los cuales
pueden ser obtenidos con las siguientes ecuaciones.

0.577
𝐸[𝑥] = 𝑢 +
𝛼
𝜋∗𝜋
𝑉𝐴𝑅[𝑥] =
6𝛼 2
Con esto hallamos dichos parámetros:

𝜋∗𝜋
𝑉𝐴𝑅[𝑥] = = 38124.184
6𝛼 2
𝜋∗𝜋
𝛼=√ = 0.00657
6 ∗ 38124.184

0.577
𝐸[𝑥] = 𝑢 +
0.00657
0.577
𝑢 = 894.853 −
0.00657
𝑢 = 807.029
Ahora podemos completar la FDA

𝐹 (𝑥) = 1 − 𝑒𝑥𝑝[−𝑒 0.00657(𝑥−807.029) ] = 0.02

−0.02 = −𝑒 0.00657(𝑥−807.029)
−3.902 = 0.00657 (𝑥 − 807.029)
−593.902 = 𝑥 − 807.029
𝑥 = 213.127

Este sería la precipitación mínima para el año 50.

➢ DISTRIBUCION LOG-NORMAL
Tenemos la fdp :

 Lnx −u Lnx  2
− 0.5  
f (x ) =
1   Lnx 
e
x Lnx 2

Donde con ayuda de los datos dados por la muestra se pueden calcular los parámetros u y
σ.

Entonces:
 1 2
 u Lnx + ( Lnx ) 
Ex =  x = e  2 

2 2
(
Var x  =  x =  x e( Lnx ) − 1
2
)
Hallamos la media:

x =
 precipitaciones = 894.853
34
Hallamos la varianza:

 x 2 = 38124 .184

Con estos valores los reemplazamos en las ecuaciones 1 y 2, para así hallar u Lnx y  Lnx :
38124.184 = (894.853) e ( Lnx ) − 1
2
 2

( Lnx ) 2
= 0.04651
 Lnx = 0.21566

894.853 = e (u Lnx +0.5(0.04651))


u Lnx = 6.7734

Entonces:
2
 Lnx − 6.7734 
− 0. 5 
f (x ) =
1  0.21566 

e
x * 0.21566 * 2
2
 Lnx − 6.7734 
x 1 − 0.5  
 0.21566 
e
0.02 =  x * 0.21566 * 2
0

2
x  Lnx − 6.7734 
1.8497 −0.5  0.21566 
0.02 =  e
0
x

➢ DISTRIBUCION LOGPEARSON TIPO III


Para esta distribución el primer paso es tomar los logaritmos en base 10 de la información
de precipitaciones, se calculan la media, la desviación estándar y el coeficiente de asimetría
(Cs) para los logaritmos de los datos:
Una vez calculados los datos de media y desviación estándar, se calcula el Cs:
(logPi-
AÑO PRECIPITACION LOG 2,94)^2

1971 653 2,81491318 0,01532101

1972 1004 3,00173371 0,00397435

1973 881 2,94497591 3,9497E-05

1974 771 2,88705438 0,00266637

1975 1102 3,04218159 0,01071025

1976 1146 3,05918462 0,01451865

1977 881 2,94497591 3,9497E-05

1978 766 2,88422877 0,00296616

1979 1203 3,08026563 0,0200433

1980 464 2,66651798 0,07407829


1981 996 2,99825934 0,00354836

1982 987 2,99431715 0,00309424

1983 825 2,91645395 0,0004945

1984 810 2,90848502 0,00091242

1985 888 2,94841297 9,4512E-05

1986 840 2,92427929 0,0002077

1987 1235 3,09166696 0,02340157

1988 967 2,98542647 0,00218418

1989 668 2,82477646 0,01297658

1990 897 2,95279244 0,00019884

1991 790 2,89762709 0,00168627

1992 866 2,93751789 1,3768E-06

1993 790 2,89762709 0,00168627

1994 918 2,96284268 0,00058329

1995 843 2,92582757 0,00016547

1996 1004 3,00173371 0,00397435

1997 308 2,48855072 0,2026265

1998 1026 3,01114736 0,00524989

1999 882 2,94546859 4,5932E-05

2000 971 2,98721923 0,00235496

2001 827 2,91750551 0,00044884

2002 841 2,924796 0,00019308

2003 1278 3,10653085 0,02817013

2004 1097 3,04020663 0,01030537

SUMA 99,9155026 0,44896201 SUMA

MEDIA 2,93869125 0,01360491 (2860161/33)

0,11664008 (28601/33)^0,5

Cs =
(
n LogPi − LogP )3

(n − 1)(n − 2)(S LogP )


donde LogP = 2.9387

S LogP = 0.11664

Entonces

(
34 LogPi − 2.9387 )
3

Cs =
(33)(32)(0.11664)

34 * (− 0.09869127)
Cs =
(33)(32)(0.11664)
C s = −2.0026

Con este Cs y el periodo de retorno (Tr=50), se calcula el factor de frecuencia Kt , con


ayuda de la tabla de valores de Kt para la distribución de Logpearson Tipo III.
Se obtienen dos valores muy cercanos entonces se procede a interpolar:

− 2.0 → 0.980
− 2.1 → 0.939
0.939 − 0.980
K 50 = 0.980 + * (− 2.0026 + 2 )
− 2.1 + 2.0
K 50 = 0.9789

Luego:

y 50 = LogP + K 50 * S LogP
y 50 = 2.9387 + 0.9789 * 0.11664
y 50 = 3.0529

X 50 = 10 3.0259
X 50 = 1129.54

Ese es la precipitación esperada para el año 50.


PUNTO 3
➢ Debian descargar los datos de la página indicada y eliminar aquellas ciudades que no tuviesen
el valor de tarifa, inicialmente eran 172 ciudades, pero eliminando las de tarifa cero quedan 156
datos. Para hallar el intervalo de confianza lo podían hacer directamente para toda la muestra
o podían dividir la muestra en muestras más pequeñas y calcular el intervalo para cada
submuestra. Lo hice para diferentes niveles de confianza ya que nos les pedí uno específico.

Ahora dividiendo la muestra grande en cuatro submuestras

Potrebbero piacerti anche