Sei sulla pagina 1di 8

Objetivo:

El archivo EXP36 anlogamente al

Comprobar que la suma de las


variables independientes con la misma
distribucin se aproxima a la normal.
Estudiar la robustez de la aproximacin
frente a cambios en la hiptesis del teorema.

X 1 X 36
anterior. Contiene 36 variables
todas exponenciales de media 4 as como

S 4 , S9 , S 25 , Y25 , y S36
ROBUST: contiene las variables:

Metodologa:
Se efectuarn distintas sumas de v.a
independientes con distribucin uniforme y
exponencial. Se comprobara grficamente y
mediante test de hiptesis que se cumple el
teorema central de limite y se verifica que la
hiptesis de independencia es esencial
Archivos a utilizar:
UNI25
El archivo UNI25 contiene 25 variable
aleatoria (U1,,U25) con distribucin uniforme
en el intervalo de (0,1). De cada variable se
dispone de una secuencia de 1000 valores
generados aleatoriamente. El hecho es de
disponer de una muestra, en lugar de toda
una poblacin har que los valores estimados
por el paquete de los parmetros no coincidan
exactamente con los tericos. El archivo
incluye tambin las variables:

S3 U1 U 2 U 3
S 4 U1 U 2 U 3 U 4
9

S9 U i

X1 = U(0,1), X2 = (02.12)

X 3 U (0'4,1'4), X 4 U (0'6,1'6), X 5 U (0'8,1'8), X 6 U (1, 2),


X 7 U (1'2, 2'2), X 8 U (1'4, 2'4), X 9 U (2, 3), X 10 U (3, 4'5), X 11 U (6, 9),

Y8, Y11: Media aritmtica de los 8 y 11


primeras variables, respectivamente.
DEPEN: Contiene 16 variables con
distribucin U(0,1)

X1, X 2 , X 3 , X 4 , X 5
d1 , d 2, d 3 , d 4 , d 5
m1 , m2 , m3
md1 , md2 , md3

U (0,1)
di 1 X i
mi 2 X i l
mdi 2d i l

Y10: Media de las 10 primeras


uniformes
Y12: Media de 12 variables (

X 1 , X 2 , X 3 , X 4 , X 5 d1 , d 2, d3 , d 4 , d5 md1 , md2, md3


)

i ?1

25

S 25 U i
i 1

Y25

S 25
25

1. Distribucin terica.

Teniendo en cuenta la media y la


varianza de una distribucin U(0, 10) son
=0.5 y 1/12=0.0833 y que una
exponencial de media 4 tiene una varianza
16, obtener las siguientes distribuciones
tericas suponiendo que se puede aplicar
el Teorema Central de Lmite.
1.1
X i : U (0,1)
4

Xi ~
i 1
9

Xi ~
i 1
25

X
i 1

X
i 1

X
i 1
25

X
i 1

1.5 Utilizando las mismas variables


uniformes del primer apartado 1.1 Es
posible obtener la distribucin exacta
4

Xi
i=1

? Razonar la respuesta en caso de

afirmativo indicar dicha distribucin.


Respuesta: No, porque solo se puede
realizar una aproximacin debido a la
cantidad de datos.

25

1.2.

X
i 1

~ N

25

Xi: las del archivo ROBUST

X1 + X2 + X4 ~ N( , )
1.3.

Exponenciales de media 4
4

X
i 1

X
i 1
24

X
i 1
36

X
i 1

2. Distribucin aproximada para las


variables del archivo UNI25
2.1 Obtener el histograma de U1
(tomando los valores Min=0 ; Max=1;
intervalo = 10). Visualice el histograma
utilizando Stat Basis Statistic.

25

X
i 1

25

~ N

1.4 Utilizando las mismas variables


que en apartado anterior
obtener la
distribucin exacta: Seleccione la opcin
gamma.

Realice el test de Kolmogorov-Smirnov (KS test), Cual es significance level?

(Utilizar los
sistema).

parmetro estimado por el

Histograma

Test de K-S
Grfica de probabilidad de s3
Normal
99.99

Media
Desv.Est.
N
KS
Valor P

99

Porcentaje

95

1.499
0.5049
1000
0.030
0.036

80
50
20
5
1

0.01

-0.5

0.0

0.5

1.0

1.5
s3

2.0

2.5

3.0

3.5

Se puede aceptar que lo datos


proceden de una U(0,1)? Razonar la
respuesta.
Respuesta: No pues la prueba de normalidad
nos indica que los datos se desfasan en los
extremos y por mucho.

2.2 Realice el test de K-S para contrastar si


S4
sigue una distribucin Uniforme
(Utilizando los parmetros estimados por
el sistema).

Significance level=
Es
respuesta.

S4

Uniforme?

Razonar

la

Respuesta: S, pues la recta pasa por casi


todos los datos.
2.3 Dibujar el histograma y realizar
el test de K-S para las variables S 3 , S4,
S9, S25
,Y25
para contrastar
si se
MEDIANA
distribuyen
Normalmente
como
VARIANZA
consecuencia
del teorema de limite

S3

S4

S9

S25

1.5090
0.2550

2.0038
0.3252

4.4701
0.7369

12.517
2.052

0.5
0.0

VALOR

0.036

0.15

0.15

0.15

Obsrvese que al aumentar el no. de


sumandos la aproximacin a la normal
mejora.

3. Distribucin aproximada para las


variables del archivo EXP36.
3.1 Obtener el histograma de X1
(Tomar el valor Min = 0) y realizar el test
de K-S.
Histograma de x1
200

Frecuencia

150

100

50

12

16
x1

20

24

28

Significance Level =
Sigue S4 una distribucin Gamma?
Con qu parmetros? Razonar la
respuesta.
3.3 Dibujar los histogramas y
realizar el test de K-S para las variables S4,
S9, S25, S36 e Y25 para contrastar si como
consecuencia del Teorema Central del
Lmite se distribuyen Normalmente (utilizar
los parmetros estimados por el sistema).
Para s4

Realizando la prueba K-S obtenemos:

Para s9
Cul es el Significance Level?
Se puede aceptar que los datos proceden
de una Exp(4)? Razonar su respuesta.
3.2 Realizar el test de K-S para
contrastar si S4 sigue una distribucin
Gamma (utilizar los parmetros estimados
por el sistema).

Para s25

Para Y25

Para s36.

S4

MEDIANA
VARIANZA
P-VALOR

14.911
59.095
<0.01

S9
34.073
134.94
<0.01

S25

S36

Y25

39.222
376.49
<0.01

142.35
571.96
0.051

3.9689
0.6024
<0.01

Para qu variables se rechaza la


hiptesis de Normalidad? Para todas
menos para S36 ya que el valor de p es
mayor que 0.05

Obsrvese que en este modelo se


necesita un no. mayor de sumandos para
conseguir un p-valor alto.

4. Necesidad de la hiptesis Idntica


distribucin en el Teorema Central de
Lmite
Se trabaja con el archivo ROBUST.
4.1 Dibujar el histograma y realizar
el test de K-S de la variable Y8 e Y11
(Utilizar los parmetros estimados por el
sistema) para ver si como consecuencia
del TCL su distribucin se aproxima a la de
una Normal.

lnea de normalidad. Y como establece el


nivel de significacin que donde existan
valores mas alejados de la lnea esta ser
menos o ms aceptada.
Hasta qu punto es robusto el teorema
central del lmite frente a la hiptesis de
que todas las variables deben tener el
mismo parmetro?
Respuesta: Los rangos en los cuales son
mas robustos son de:
Y8 (1.413,1428)
Y11(11.32,11.416)
Asi queda demostrado que todo esta
dentreo de los rangos y por lo tanto las
graficas de K-S son aceptadas por que el
nivel de significacin es menos que el 5%.
5. Necesidad de la hiptesis de
Independencia en el Teorema Central
de Lmite
Se trabaja con el archivo DEPEN
5.1 Dibujar el histograma y realizar
el test de K-S de las variables Y 10 e Y12
para ver si como consecuencia de TCL su
distribucin se aproxima a la de una
normal.
El ajuste se realizara con
los
parmetros
tericos
correspondientes
(segn el TCL) a la media aritmtica de
diez v.a uniformes en el intervalo (0,1)
P-valor para Y10:0.5
P-valor para Y12:-0.25

Nivel de significacin de Y8 : 3.6%


Nivel de significacin de Y11 :2.8%

4.2 Observar cmo estn definidas


estas variables y explicar por qu es
menor el nivel de significacin de Y11.
Respuesta: Es menor ya que al observar la
grafica puede verse claramente que
existen ms valores que no entran la la

Deducir el resultado del test hasta


qu punto el mtodo es robusto frente a
cambios en la hiptesis de independencia
de las variables.
Respuesta: Como los valores de las
variables Y10 y Y12 tienen el mismo valor,
su grafica es:

Al intentar hacer la prueba K-S a las


variables nos arroja este Mensaje:

Esto nos indica que no se puede realizar


esta prueba para los valores tomados por
las variables, ya que solo tendran una
acumulacin y no una distribucin.

Potrebbero piacerti anche