Sei sulla pagina 1di 12

ESTADlSTlCA ESPANOLA Vol. 30, Nm. 1 18, 1988, pgs.

203 a 213

Ajuste Bayesiano a una Distribucin mediante la Familia Exponencial Potencial


Por MIGUEL A. GOMEZ VILLEGAS
Departamento de Estadistica. Facultad de Ciencias Matem^ticas. Universidad Complutense. 28040 Madrid.

Se utiliza la familia exponencial potencial para contrastar la hiptesis de que una muestra proviene de una distribucin totalmente especificada frente a que no es as. Para ello se transforma el contraste inicial en otro paramtrico mediante una clase que contiene a la distribucin uniforme, tamando como verosirnilitud dicha familia se calcula la distribucin a posteriori, viendo con qu probabilidad contiene el valor del parmet^o al que corresponde la uniforme. Palabras clave. Ajuste Bayesiano a una Distrbucin. Contraste Bayesiano de Modelos. Familia Exponencial Potencial: Problema de Ajuste Bayesiano. Clasificacin AMS: Primaria 62 F03, 62 H 15. Secundaria 62 F 15, 62G10. 1. INTRODUCCION

EI problema de dada una muestra aleatorio simple contrastar si se distribuye de acuerdo con una distribucin Fo totalmente especificada frente a que no es as, se resuelve, desde el punto de vista cl^sico, recurriendo a los contrastes de la ^ para medir la bondad del ajuste o desde el punto de

E ^r ^r^^^,^ ic ^^ E ^F^^^tic^t .^,

vista no pararntrico mediante ia utilizacin de! estadstico de KotmogorovSmirnov, En el primer caso hay que dividir en intervalos el recorrido de la variable, lo que repercute drsticamente en et resultado del contraste, y en el segundo ta hiptesis de trabajo, la clase de todas las distribuciones continuas, es demasiado amplia. [^esde et punto de vista bayesian se conocen dos afternativas. Bernardo (1 98^) introduce ta familia "atfa" y Girn y C?rtiz (1 985) la familia "beta sirr^trica".
Estos dos mtodos, y ef que nosotros presentamos, tratan bsicamente de conseguir una familia paramtrica suficientemente rica y tratable, F(y/j^) que para algn vator particutar del parmetro contenga a la distribucin uniforme. Corno si la hiptesis nula es correcta F^(x) tendr distribucin uniforme et problema queda reducido a suponer que ia muestra Fo(x,j, ..., Fo(x} sigue la verosimilitud F(y/j3}, combinar dicha verosimilitud con ta informacin a priori, construir la distribucin a posteriori y si el vatar f^=^o, al que corresponde la uniforme, cae dentro de un intervalo de probabilidad alta se acepta et ajuste y caso contrario se rechaza.

Nuestra familia de verosimilitudes es la familia exponencial potencial ya utilizada, ver Diananda ( 1 949}, Box (^ 953) y Turner ( 1 90}, y ms recientemente en el libro de Box y Tiao ( 1973), pag. 1 58, para estudiar la repercusin de la hiptesis de normalidad, pero en contextas del todo diferentes al que aqui nos ocupa.

DESCRIPCEOt^I DEL N10DELo

2.1. La familia de verosmilitudes


Consideremos la familia de densidades f( y/^3} = c^ (^3) exp {-c (^3} ( Y- 2 donde el parmetro ^3 varia en el intervalo (-1, 1} y siendo

'^

r'^(3(1+^)^ 2

r-2tit3

t1+^3) 2 ( 2 (1+jj) } I^(^(1+^)}


r ( ^ { ^ -^^} }

,+u

-^ (2.V^3} ^+^

AJ'^;^T f. f3Ati^E=tilAtiO A l ti^^^ C)I^T fZIHI t lOti ti1[-[)1 ^1ti1 f L^^ f-^titll_I^> E^POtif ^( 1^1l f'O T f ti( 1^11

^^I^

Esta familia se obtiene de ta familia exponencial potencial plxl = Kexp (-2 ^ x ^ ) mediante un cambio de origen y escala junto con una reparametriiacin del parmetro q. EI motivo ha sido lograr que cuando ^ se vaya aproximando a -1 la familia se aproxime a la distribucin uniforme en el intervalo (0,1 }. Esta familia contiene para el valor 0 a la distribucin normal se va afilando cuando el parmetro crece hasta 1, que contiene a la doble exponencial, y se va achatando hasta aproximarse a la uniforme cuando el parmetro decrece hacia -1. Como puede verse por la gama de valores que cubre, el tipo de alternativas que se pueden tratar es el de distribuciones simtricas ms aptastadas que la normal hasta ta uniforme (platocrticas} o ms afiladas que la normal hasta la doble exponencial (teptocrticas}. A continuacin se incluye en la Figura 1 la grfica de f(y ^(3) para los valores de ^3 = 1, 0,50, 0, -0,50, y-0,7 5 de tas distintas funciones de densidad; correspondindose respectivamente, el ms atto con la ms afilada, hasta el ms bajo con la rns aplastada.

.5

1.5

FIGURA 1

^o^

FSTAC^1^TiC^^A ESP,AC^L.A

En un trabajo previo, Gmez Villegas (1 9$6) hemos estudiado ei contraste tomando la funcin de densidad para que todas las distribuciones tuv'reran como soporte el intervalo 10,1 ), lo que Ileva a la utilizacin de ia nueva densidad

9(Y^Q) _

ft YII3 1 F{^ I^^ - F(ol^)

Sin embargo como all pusimos de manifiesto la probabilidad que concentra sobre el intervalo unidad la familia exponencial potencial va desde el 1 a0lo correspondiente a^3=-1 hasta e! 91 %, correspondiente a^3=0,5. Por la que preferimos mantener 1a familia sin truncar, lo que hace los clculos m^is simples. Tomando entonces una muestra aieatorio simple x={x,, ..., x) y para contrastar si proviene de F^{x), una distribucin continua y totalmente concida, calculamas y; =FQ(x;), suponiendo que dichos vaiores tienen como verosimilitud f{y ^ j^), si la hiptesis es correcta deben de ajustarse bien al valor de ^3 correspondientes a ia distribucin uniforme, por lo tanto contrastamos realmente Ha :^3= - 1 frente a la hiptesis alternativa H, :^3 ^-1.

2.2. An^ilisis del modelo.


Obtenemos que {a verosirnilitud de la muestra viene dada por z _ { -C t%3) ^ ^ y - 1_ I ^ + ^ } f { Y ^) = cc^n { j3) eXp , 2 . o aiternativamente f( y I^3) = cc^n (^3) exp {-ne t^3) M( Y I!3) }

siendo
" _1 f^ 2 ( y , ^3) =^^ly' n de las desviaciones de los el momento muestral absoluto de orden 1+^ valores obtenidos al valor 1/2. Dentro del paradigma bayesiano debemos escoger una distribucin a priori sobre /3 para construir la distribucin a posteriori. At no disponer de distribucin natural conjugada propia y ser casi imposible, desde el punto de vista prctico, 1a determinacin de la distribucin a priori no informativa, que por tratarse de un caso regular sera proporcional M

AJUSTE BAYESIANn A UNA D[STRIBUCION MEDIANTE L.A FAMIL(A EXP^NENCIAL POTENCIAL

ZU

a la rai cuadrada de la informacin de Fisher, hemos utilizado como a priori

^t (^ ) _ ^ ^ r. ^. ^ ^ (^^
2 con lo que en definitiva queda la distribucin a posteriori proporcional a la verosimilitud:

n(^ I y 1

flY I ^1 d^
1^^ f( Y ^^) dIB

En todo caso si tomamos otra distribucn q(^3) como a priori su correspondiente a posteriori sera proporcional a q(^) ^(^ ^ y ), con nu la distribucin a posteriori correspondiente a la uniforme, por lo que nuestro clculo sera un buen auxiliar.

A partir de aqu, el procedimiento usual consiste en fijar un valor a pequeo, determinar una regin confidencial S de probabilidad a posteriori 1-a y ver si S contiene al punto ^B=-1. Si adems determinamos S de manera que sea de densidad mxima (ver Berger (1985) 1, esta regin vendra dada por

S={,^/^(^Iy) > k}
donde k sera un valor tal que 1S ^(^ ^ y 1 d^3 = 1-a, es decir, tal que Jn^,e^ ly )> k f(Y ^^) df^ ^

1- r f( Y ^^1 dl3
Pero en lugar de fijar el valor de a y determinar la regin S de densidad mxima correspondiente, podemos trabajar al revs, viendo cual ha de ser la minima regin S que cubra al valor ^3=1 y calculando despus su probabilidad 1-a. Dado que si todos los valores de y; son distintos de cero y de uno es
lim f(y ^ ^3) -- 1. ^ ^ -^ -^ la regin S que buscamos es el conjunto de puntos ^3 tales que nI f3 ^ y) > 1(vase la figura 2) y su probabilidad es

1^ ^,^ ^ Y)> 1 f( Y(^) d^

J ^ f(y 1 !^ ^ d^

?CI^

F.tii ^^E)I^T I( ^ E^F'^Atit)L._.A

...1
3. EJEMPLOS NUMERICOS Ejemp/o 1.^

Con el fin de poner de manifiesto el funcionamiento del mtodo hemos contrastado la hiptesis nula, de que una muestra de tamao 100 proviene de una distribucin t de Student con 4 grados de libertad, cuando la citada rnuestra proviene de una distribucin normal N 4x; 0, 0,75). Los parmetros estn elegidos para permitir una aproximacin aceptable entre las dos distribuciones. En la Tabla 1 aparecen los correspondientes valores de la distribucin normal. Apiicando a estas la funcin de distrib^^cin de la t, deben desviarse de la distribucin uniforme, sus valores pueden verse en la Tabla 2. La distribucin final del par^imetro ^3 puede verse en la figura 3 donde se observa que efectivamente cualquier regin de alta probabilidad a posteriori no cubre al valor -1, en concreto es t^,98 la probabilidad de que un intervafo de altura mxima no cubra al valor -1, el valor de la probabilidad del conjunto S de la Seccin 2.2.

FIGURA 3

A1l'STE-: N-1ti'E:SI,ANO A l'tiA C.^IS"tR1E3l'('1Oti ME^Dl,AtiTE 1_^ t=.Ati11L.I.A F:?^F'OtiE.ti('I-^L. WOTE.ti(. IAl"

?Oy

Tab/a 1. Muestra de tarna 100 de N(x 0, 0,75)


1,2349
-0,4317

-0,8867
0,9072 -1,1598 -0,3840 -0,3264 1,8004 -0,10 51 -0,1277 -0,6480 -0,6500 -0,4552 0,2799
0,7341

-0,4820 -0,6985 0,9329 0,01 18 0,1508 0,6679 0,8285


0,2181

0,3746 0,8525 -0,6990


1,1 181

-0,3623 -0,1500 0,0591 -0,0440 -0,2144 -0,1417 0,4206 0,7963


-0,1704

0,0180 -0,6672 1,5422 1,4620 -0,0203 -1,7855 0,9645 1, 0040 0,1493 0,0870 0, 8152 0,4861 -1,2312 0,8454 -0,0941 -0,6677 0,5052
-1,1 195 -0,4218 0,442 4

-0,5809 -1,6952
0,0144

-0,1059 0,9399
-1,0617

-1,0732 0,3674 0,2887 0,1049 -0,5745 -0,1349


1,4413

0,2071 0,2 3 50 0,57 59 -0,476$ 0,4985

2,1836
-0,5407

0,3407

-0, 7 031 0,9493 0,2879

-1,02 61 0,0187 -0,6700

0,4387 0,1976 0,5082 0,3 502 0,2537 -0,8134 1,2285 0,3280 0,47 52 -0,1731 0,3459 -1,5033 0,8272 0,3002 -0,1401 -0, 5080
1,1373

Tab/a 2. Imagen de la muestra de la tabla 1 mediante la funcin de distribucin de la t con 4 grados de libertad.
0,8578
0,3441 0,212 7

0,3275

0,5067

0,2962

0,2617
0,7 980 0,5044 0,5563 0,7296 0,7 730

o,27os
0,201 1 0,8912 0,4924
0,0744

o,os2s
0,5054
0,1718

0,4604 0,7998
0,17 41

0,7922 0,1 5 53 0,3602 0,3282 0,9269 0,4807 0,4523

0,4190
0,3677
0,4440

0,2761
0,2776 0,3363 0,6033 0,7482 0,6365
0,7790

0,5221 0,483 5 0,4204


0,4471

0,2 61 5 0,8369 0,6248

0,6522 0,7648 0,4365 0,2604 0,8019 0,6061

0,8053 0,8139 0,5557 0,5326 0,7698 0,6738 0,1428 0,7773 0,4648


0,2704

0,6800
0,1628
0,3474

0,6595

0,6340 0,6064 0,5392 0,2982 0,4496 0,8885 0,5770 0,5871 0,7022 0,3292 0,6778 0,9528 0,308 7 0,1814 0,5070 0,2698

0,6582 0,5735 0,6810 0,6281 0,5939 0,2308 0,8567 0,6203 0,6703 0,43 5 5 0,8266

0,1036
0,7727 0,6105 0,4477
0,3191

0,8405

?t0

E:STA[^^ [STICA ESPA!^OLA

Ejemplo: 2
Se trata ahora de aplicar nuestro mtodo a contrastar Ha = X^ N(x; 0,1 ) a partir de una muestra de tamao 100 tomada de la citada N(x; 0,1).

En la TAB LA 3 aparecen ^os correspondienies valores de la distribucin N (x; 0,1) .

Tab/a 3. Muestra de tamar^o 1 OO de Ntx; O, ^)


-1,4309

-o,7ssa
0,3133 2,9 i 15

-0,02 71
0,1991

^ -1,s41 s
0,6736 1,f069 0,4899 -0,1 798 0,7678

-0,8934
0,5849 0,3383 0,6337

1,1029 1,5164
-1,5463 -4,1401

-0,7209
1,5920 0,2634 -1,0845 -0,2307

O,fi905 -0,2000 -0,1889 -0,9375 -0,4309 -2,3806 0,1 i 60 1,1272 -1,492 7 2,1840 0,3849 1,9218

-0,^43 5 3

-o,8sao
0,9788 1,4909 0,4032 1,1047 0,0788

0,4670 0,43 74

-2,0044
-0,6774 -0,8637

2,4oos -o,8ss7
0,4994 ^,4542 0,0960 -0,2908

0,5608 1,2657
-0,652fi

^,28so
1,0869 -0,12 5 5
-0,5624 -0,6182 0,1398 0,2761 0,6647 0,0249 -1,2307

-0,0587

-0,6070 1,1366 -1,0611


0,201 1 -0,4831

0,4002
0,9179 -0,5120 -0,1 7 03

-0,6358 -1,3682
1,3586

1,os17
0,3839 -0,3145 1,3386 0,6481

o,s77s
1,6380
0,4612

-0,2859
-0,2272

0,3732
-0,9320 0,12 82

-0,8903
0,5998 -O, 7 316

-0,1868
-0,09 50

0,9382

Aplicando a estos valores la funcin de distribucin de la N (x; O, 1), hemos obtenido la TAB LA 4.

AJUSTE BAYESIANO A UNA DISTRIBI!CION MEDfANTE LA EAMILIA EXPONENC IAL POTE^JCtAL

2 1^

Tab/a 4. Imagen de la muestra de la Tabla 3 mediante la funcin de distribucin de la N(x; 0, 1).


0,0763 0,2218 4,6232 0,9982 0,1858 0,7208 0,4892 0,5790 0,0504 0,7498
0,8134

0,9459
0,6880

0,4206 0,4249 0,17 42 G1,3331 0,0087

0,3315 0,19 3 7 0,8362 0,9320 0,6568

0,6799 0,6692 0,0225 0,2490

0,193 8
0,9918 0,1930 0,6914

0,6326 0,7370
0,8650 0,9353 0,061 1 0,4442 0,2 718 0,8721 0,1443 0,5798 0,3144

0,4285
0,7788 0,2354 0,9443 0,6040 0,1391 0,4086

0,5463
0,8702 0,0678 0,9855 0,6500 0,9727 0,2624

0,8653 0,5315
0,7127 0,8972 0,2 569 0,9007 0,8615 0,4500

0,6753 0,5383
0,3855 0,4765 0,8558

0,6557
0,8207

0,08 5 7
0,9128

0,2868
0,2681 0,5557 0,6089 4,7470 0,5100 0,109 2

0,6496
0,3764

0,3042
0,4323 0,6457 0,1756 0,551 1

0,751 1
0,9492 0,67 78 0,42 58 0,4621

0,9096
0,7416 0,1866 0,7225

0,3873
0, 4100 0,8259

0,2321

La dstribucin fina/ del parmetro ^ puede verse en la FI G U RA 4 donde se observa que el valor -1 es la moda de esta distribucin y qu, por tanto, cualquier regin creible, por pequea que sea en probabilidad a posteriori, cubre al valor -1.

FIGURA 4

-1

E^.tiT ^^I)IST!( ^^ f SP-^tiC)l.,A

4.

DISCUSION

EI mtodo debe generalizarse para poder contener una familia m^s amplia de distribuciones, una posible solucin es permitir la existencia de u^ nuevo parmetro de centralizacin, en lugar de mantener fijo el valor de ^, y tratarlo como parmetro marginal. Sera deseable abordar el doble problema de la comparacin por un lado con los mtodos clsicos, incluyendo adems la comparacin de los mtodos de Kolmogorov-Smiknorv y de la X2 con el de transformarlos y ajustar a la uniforme y por otro el comparar los dos mtodos bayesianos existentes, dando condiciones que aconsejen la utilizacin ms adecuada de ellos.

AGI~iADECIMIENTO Quiero dar las gracias al Profesor Eusebi Gmez Snchez-Manzano, por sus valiosos comentarios as como por su desinteresada ayuda prestada en el tratamiento numrico.

A.II ^;Tf. H^^^'E:^I,>ti() ,1 l^tiA (^iSTRIH[ ( I()ti !^1E::[)fAtiT^E. t^a F^^111.1 ^ FKP<)tiE ^.< I^^t f'()TE 1( I^l_

?^^

REFERENCIAS
B E R G E R, J. O. (1 9 8 5). Sta tis tical decision theory and Ba yesian analysis. S p ri nger-Verlag. New York.

BERNARDO, J. M. (1982). Contraste de modelos probabilsticos desde una perspectiva bayesiana. Trabajos de Estadstca e Investgacin Operativa. 33, 2, 16-30. Box, G. E. P. (19 53 ). A note on regions for test of ku rtosis. Biometrika. 40, 465. B ox, G . E. P. a n d T^AO, G. C. (19 7 3). Bayesian nference in statistica/ analysis. Addison - Wesley. London. D^ANANDA, P. H. (1949). NOte on some properties of maximun likelihood estimates. Proc. Camb. Phil. Soc. 45, 536-544. G IRON, F. J. y^RTI2, C. R. (1985). Una alternativa bayesiana a los contrastes de la bondad del ajuste. Trabajos de Estadstica e lnvestigacin Operativa., 36, 2, 56-69.
GOMEZ VILLEGAS, M. A. (1986). Aproximacin a una distribucin conocida desde el punto de vista bayesiano. Actas de la XVI Reunin de la S.E.I.O. por aparecer.

TURNER, M. E. (1960). Note on heuristic estimation methods. Biometrics. 299-301.

6AYESlAN FIT TO A DISTRIBUTION THROUGH THE CLASS O F EXPON ENTIAL POTENTIAL POV1/ER DISTRIBUTIONS.

SUMMARY
A test about goodness of fit is considered for the case of simple null hypotheses. By considering the class of exponental power distributions and the uniform distribution embedding into it, a Bayesian testing for uniformity is presented, how alternative to classical model. Key words: Bayesian Fit; Bayesian Hypotheses Testing; Exponential Power Distributions.