Sei sulla pagina 1di 45

Dezembro, 2011

Paula Cristina Fartaria Marques


Licenciatura em Matemtica
Licenciatura em Professores do Ensino Bsico



O Teste de Esfericidade por Blocos de Matrizes
para uma Amostra

Dissertao para obteno do Grau de Mestre em
Matemtica e Aplicaes

Orientador: Filipe J. Marques, Doutor, FCT-UNL
Co-orientador: Carlos A. Coelho, Doutor, FCT-UNL

Jri:
Presidente: Prof. Doutor Joo Tiago Praa Nunes Mexia
Arguente: Prof. Doutor Lus Miguel Lindinho da Cunha Mendes Grilo
Vogal: Prof. Doutor Filipe Jos Gonalves Pereira Marques








Paula Cristina Fartaria Marques
Licenciatura em Matemtica
Licenciatura em Professores do Ensino Bsico




O Teste de Esfericidade por Blocos de Matrizes
para uma Amostra



Dissertao para obteno do Grau de Mestre em
Matemtica e Aplicaes



Orientador: Filipe J. Marques, Doutor, FCT-UNL
Co-orientador: Carlos A. Coelho, Doutor, FCT-UNL








O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA








Copyright, Paula Cristina Fartaria Marques, Faculdade de Cincias e Tecnologia da
Universidade Nova de Lisboa.










A Faculdade de Cincias e Tecnologia e a Universidade Nova de Lisboa tm o direito, perptuo
e sem limites geogrficos, de arquivar e publicar esta dissertao atravs de exemplares
impressos reproduzidos em papel ou de forma digital, ou por qualquer outro meio conhecido ou
que venha a ser inventado, e de a divulgar atravs de repositrios cientficos e de admitir a sua
cpia e distribuio de objectivos educacionais ou de investigao, no comerciais, desde que
seja dado crdito ao autor e editor.
V















AGRADECIMENTOS

Ao meu Orientador Professor Doutor Filipe J. Marques pela ajuda, pacincia e apoio
disponibilizado na realizao deste trabalho.
Ao meu Co-orientador Professor Doutor Carlos A. Coelho pela sua compreenso e ajuda nas
dificuldades sentidas.
Ao meu marido, pelo apoio e motivao nesta longa caminhada.

VII







RESUMO

O objectivo do trabalho consiste em desenvolver distribuies quase-exactas para a estatstica
de razo de verosimilhanas do teste de esfericidade por blocos de matrizes para uma amostra,

*
, extrada de uma populao multivariada Normal. Atravs da decomposio da hiptese nula
do teste em duas hipteses nulas parciais, possvel obter no s a expresso da estatstica de
razo de verosimilhanas, como ainda a expresso do seu h-simo momento nulo e a funo
caracterstica da varivel aleatria W= -log
*
. Na primeira hiptese nula parcial testada a
independncia de vrios grupos de variveis e na segunda a igualdade dos blocos diagonais da
matriz de covarincia. A decomposio da hiptese nula do teste em duas hipteses nulas
parciais, induz uma factorizao na funo caracterstica de W= -log
*
que serve de base para a
construo das distribuies quase-exactas para W e para
*
. Estas aproximaes tm como
distribuio uma distribuio Gama Quase-Inteira Generalizada (GQIG) ou mistura de duas ou
trs distribuies GQIG. Propomos ainda, para W, duas aproximaes assimptticas sob a forma
de misturas de duas ou trs distribuies Gama. Para avaliarmos a qualidade das aproximaes
assimptticas e quase-exactas propostas so realizados estudos numricos, que tm como base
uma medida de proximidade entre distribuies, ela mesma baseada nas respectivas funes
caractersticas. Os resultados obtidos permitem verificar a elevada preciso das distribuies
quase-exactas e as suas boas propriedades assimptticas.

Palavras-chave: Estatstica de razo de verosimilhanas, distribuies quase-exactas, teste de
independncia, teste de igualdade de matrizes de covarincia, Gama Inteira Generalizada, Gama
Quase-Inteira Generalizada.
IX





ABSTRACT

The aim of this study is to develop near-exact distributions for the likelihood ratio test statistic
for the one sample block matrix sphericity test for a sample extracted from a multivariate
normal population. Using the decomposition of the null hypothesis of the test in two partial null
hypotheses, it is possible to obtain the expression of the likelihood ratio test statistic, the
expression of its h-th null moment and the characteristic function of W = - log

*
. With the first
null partial hypothesis we test the independence of k groups of variables and with the second
one we test the equality of the k diagonal blocks of the covariance matrix. The decomposition of
the null hypothesis in two null partial hypotheses, induces a factorization on the characteristic
function W= -log

*
, which enables us to obtain near-exact distributions for W and

*
. These
approximations have Generalized Near-Integer Gamma distributions (GNIG) or mixtures of two
or three distributions GNIG. We also propose two asymptotic approximations in the form of two
or three mixtures of Gamma distributions. To test the quality of asymptotic and near-exact
approximations, we carry out numerical studies, using a measure based on the respective
characteristic functions, where we can check the high precision of near-exact distributions and
its good asymptotic properties.


Keywords: Likelihood ratio statistic, near-exact distributions, test of independence, test of
equal covariance matrices, Generalized Integer Gamma, Generalized Near-Integer Gamma.


XI





NDICE

Resumo ...IX
Abstract ...XI
ndice XIII
Lista de Tabelas..XV
Introduo ..................................................................................................................................... 1
Captulo 1 Conceitos Bsicos ..................................................................................................... 3
1.1 Introduo ........................................................................................................................... 3
1.2 Distribuio Gama.............................................................................................................. 3
1.3 Distribuio Beta ................................................................................................................ 3
1.4 Distribuio Logbeta .......................................................................................................... 4
1.5 Distribuio GIG (Gama Inteira Generalizada) ................................................................. 4
1.6 Distribuio GQIG (Gama Quase-Inteira Generalizada) ................................................... 5
1.7 Distribuio Normal Multivariada ..................................................................................... 6
1.8 Distribuio de Wishart ...................................................................................................... 7
Captulo 2 - O teste de esfericidade por blocos de matrizes para uma amostra ............................ 9
2.1 Introduo ........................................................................................................................... 9
2.2 A decomposio da hiptese nula do teste .......................................................................... 9
2.3 A estatstica de razo de verosimilhanas e a expresso do seu h-simo momento .......... 10
2.4 A funo caracterstica de ... ................................................................... 12
2.5 Factorizao das funes caractersticas de ................ 13
2.5.1 A funo caracterstica de ... ....................................................... 14
2.5.2 A funo caracterstica de .. ............................................................. 15
Captulo 3 - Distribuies Assimptticas e Quase-Exactas para W e ...19
3.1 Introduo .......................................................................................................................... 19
3.2 Aproximao baseada no Mtodo de Box ......................................................................... 19
3.3 Aproximaes baseadas em momentos ............................................................................. 20
XIII
*
log = W
*
b|a
W
*
a
W log
2
e log
1
= =
*
log
a | b 2
W =
*
*
log
a
W
1
=


3.4 Aproximaes Quase - Exactas para W e ....21
Captulo 4 Estudos Numricos ................................................................................................. 25
Concluso .................................................................................................................................... 27
Bibliografia ................................................................................................................................. 29
XIV
*


LISTA DE TABELAS

Tabela 4.1 - Valores da medida A para p*=2 e valores crescentes de p, k e n...25
Tabela 4.2 - Valores da medida A para p*=3 e valores crescentes de p, k e n...26
Tabela 4.3 - Valores da medida A para p=8, p*=4, k=2 e valores crescentes de n26
Tabela 4.4 - Valores da medida A para p=9, p*=3, k=3 e valores crescentes de n....26

XV
I





INTRODUO
As estatsticas de teste mais comuns em estatstica multivariada tm distribuies muito
complexas e quase impossveis de usar na prtica sendo por isso necessrio trabalhar com
aproximaes s suas actuais e complicadas distribuies.
Neste trabalho pretendemos obter aproximaes para a distribuio da estatstica usada no teste
de esfericidade por blocos de matrizes para uma amostra. Chao & Gupta (1991) obtm a
estatstica de razo de verosimilhanas do teste de esfericidade por blocos de matrizes, a
expresso do seu -simo momento e a sua distribuio exacta usando a expanso assimpttica
de Barnes para a funo Gama. o n
~
Carde &Nagar (2001) apresentam a expresso do h-simo
momento nulo da estatstica de teste e obtm para o caso de apenas dois blocos diagonais a
expresso da densidade, usando a transformada inversa de Mellin e a definio de funo de
Meijer. Contudo, estes resultados so ainda difceis de usar em termos prticos devido s
complexas expresses das distribuies. Deste modo, propomos como aproximaes para a
distribuio da estatstica do teste de esfericidade por blocos de matrizes para uma amostra, dois
tipos de aproximaes; as primeiras so aproximaes assimptticas baseadas em misturas de
duas ou trs distribuies Gama e obtidas atravs da tcnica de acertar momentos e as segundas
so aproximaes quase-exactas. As distribuies quase-exactas so obtidas a partir de uma
decomposio da hiptese nula do teste em duas hipteses nulas parciais. Esta decomposio
induz uma factorizao na funo caracterstica do logaritmo da estatstica de teste. As
distribuies quase-exactas so ento obtidas aproximando assimptoticamente uma parte da
funo caracterstica pela funo caracterstica de uma distribuio Gama ou da mistura de duas
ou trs distribuies Gama. A substituio feita de forma que a funo caracterstica resultante
corresponda a uma distribuio conhecida e que possa ser usada na aplicao prtica do teste
atravs de clculo de quantis e -values. As distribuies quase-exactas, desenvolvidas neste
trabalho, tm por base as distribuies Gama Inteira Generalizada (Coelho, 1998) e Gama
Quase-Inteira Generalizada (Coelho, 2004). Para avaliar a qualidade das distribuies propostas
vamos ainda considerar a aproximao apresentada em Chao & Gupta (1991), baseada no
mtodo desenvolvido por Box (1949).
No Captulo 1, fazemos um resumo das diferentes distribuies que sero utilizadas ao longo
deste trabalho, das quais destacamos a distribuio Gama Inteira Generalizada e a Gama Quase-
Inteira Generalizada que so a base das distribuies quase-exactas propostas para a estatstica
de razo de verosimilhanas do teste.
No Captulo 2, mostramos que podemos dividir a hiptese nula do teste, em duas hipteses
nulas parciais, uma para testar a independncia de k grupos de p
*
variveis e outra para testar a
igualdade de k matrizes de covarincia. Com base nesta decomposio derivamos as expresses
1
-------------------- O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
-------


da estatstica de razo de verosimilhanas, o h-simo momento nulo e tambm a funo
caracterstica do logaritmo da estatstica de razo de verosimilhanas. Ser com base nesta
expresso que vamos desenvolver distribuies quase-exactas para estatstica de teste.
No Captulo 3, propomos aproximaes assimptticas baseadas em misturas de 2 ou 3
distribuies Gama e desenvolvemos distribuies quase-exactas com base na factorizao
induzida pela decomposio da hiptese nula e que tero a distribuio de uma Gama Quase-
Inteira Generalizada ou da mistura de duas ou trs distribuies Gama Quase-Inteira
Generalizadas.
Por ltimo, no captulo 4, usamos uma medida baseada nas frmulas de inverso das funes
caractersticas que um upper bound para o mdulo da diferena entre as respectivas
distribuies, que permite avaliar a qualidade das vrias aproximaes.

















2
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


( )
( )
( ) , , 1) x (0 x 1 x
, B
1
x f
1 1
X
< < =

CAPTULO 1 CONCEITOS BSICOS
1.1 INTRODUO
Neste captulo apresentamos as distribuies univariadas e multivariadas usadas nos captulos
que se seguem, assim como algumas das suas propriedades. Nos casos das distribuies mais
comuns esta apresentao feita essencialmente como objectivo de estabelecer a notao
utilizada. Das distribuies apresentadas destacamos as distribuies Gama Inteira Generalizada
(GIG) e Gama Quase-Inteira Generalizada (GQIG) que sero as distribuies base das
aproximaes quase-exactas desenvolvidas neste trabalho.

1.2 DISTRIBUIO GAMA

Dizemos que a v.a X segue uma distribuio Gama, se a funo densidade for dada por,

( )
( )
1
I
=
r x
r
X
x e
r
x f

, ( ) + e , 0 x


em que, 0 > r o parmetro de forma, 0 > o parmetro de taxa e ( ) . I

representa a usual
funo gama. Podemos escrever que ( ) , ~ r X I . A funo caracterstica da varivel aleatria
dada por,
( ) ( )
r r
X
it t

= u , R t e ,
onde ( )
2
1
1 = i .
O h-simo momento da varivel aleatria X com distribuio Gama de parmetros r e
| |
( )
( )
h h
r
h r
X E

I
+ I
= , ( ) r h > .

1.3 DISTRIBUIO BETA
Dizemos que X uma varivel aleatria com distribuio Beta de parmetros 0 > e 0 > ,
que se representa por ( ) , Beta X ~ , se tiver funo densidade de probabilidade dada pela
expresso seguinte,



onde ( ) ) , | o B a funo Beta.
3
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


( )
( )
( )
( )
( )
( )
( )
( ) . h ,
h
h


, B
h, B
X E
h
>
+ +
+ +
=
+
=
A funo caracterstica de uma varivel aleatria com distribuio ( ) , dada pela
seguinte expresso,
( ) ( )
2
1
1 1
) 1 ( e , ; ; - i R t it F t
X
= e + = u | o o
,
em que ( ) z F ; ;
1 1
| o a funo hipergeomtrica de Kummer (Abramowitz e Stegun, 1974),
representada por,
( )
( )
( )
( )
( )
.
!
, ,
0
1 1

=
+ I
+ I
I
I
=
j
j
j
z
j
j
z F
|
o
o
|
| o
O h-simo momento da varivel aleatria X dado por,



1.4 DISTRIBUIO LOGBETA
Se ( ) , eta X B ~ com 0 > e 0 > , ento a varivel aleatria X Y log = tem distribuio
Logbeta com os parmetros 0 > e 0 > (Johnson et al., 1995). Esta pode ser representada
por ( ) , Logbeta Y ~ , sendo a sua funo densidade de probabilidade dada por,

( )
( )
( ) ( ) 0 y , e 1 e
, B
1
y f
1
y y
Y
> =


.
A funo caracterstica da varivel aleatria ( ) , Logbeta Y ~ representada da seguinte
forma,

( ) ( ) ( ) ( )
( )
( )
( )
( )
( ). R t ,
it
it



it
X E
itlogX
e E
itY
e E t
Y

e
+
+
=

= =


1.5 A DISTRIBUIO GIG (GAMA INTEIRA GENERALIZADA)

Sejam,

( ) p 1,...., j
j
,
j
r ~
j
X =
p variveis aleatrias, independentes de taxa 0
j
> , com
j' j
= , quaisquer que sejam
{ } p 1,...., j j,
'
e

, com
'
j j = .
4
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


( ) ( ) ( ) 0 , ; ,...., ; ,...., |
1
1 1
> =

=

y e y P K p r r y f
p
j
y
j p p
GIG j


( ) ( ) ( ) 0 , 1 ; ,...., ; ,...., |
1
*
1 1
> =

=

y e y P K p r r y F
p
j
y
j p p
GIG j


( )
=

= [
=
=
j
r
1 k
1 k
y
k j,
c y
j
P
p
1 j
j
r
j
K e
( ) ( ) . 1 - ,... 1 , ,
1
j
p
j k
k
i
k j k
r i r p j i R = =

=
=


Dizemos que a varivel aleatria

=
=
p
1 j
j
X Y
tem distribuio GIG (Gama Inteira Generalizada) de profundidade p com parmetros de
forma
j
r e parmetros de taxa
j
, p 1,..., j = e representamos por,
( ) p ; ,...., ; r ,..., r GIG ~ Y
p 1 p 1
.
As funes densidade e distribuio de Y (Coelho, 1998) so dadas respectivamente por,



e



onde,



e

( ) ( )
=

=

=
j
r
k
k
i
i k
j
i!
i
y
! k
j,k
c y
*
j
P
1
1
0
1

com

( )
( ) p j
r
c
p
j i
i
r
j i
j
r j
i
j
,...., 1 ,
! 1
1
1
,
=

=
[
=
=

, (1.5.1)
e

(1.5.2)



onde,

(1.5.3)

1.6 A DISTRIBUIO GQIG (GAMA QUASE-INTEIRA GENERALIZADA)

A distribuio GQIG (Gama Quase-Inteira Generalizada) de profundidade 1 + p a distribuio
da varivel,
5
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
( )
( )
( )
( )
,..., 1 ; 1 ,..., 1 , , ,
! 1
! 1
1
,
1
,
p j r k c p j i R
k r
i k r
k
c
j i k r j
k
i j
j
k r j
j j
= =

+
=

=



( )
( )
( )
( ) ( ) ( ) 0 , , , c
1 ; , ,...., ; , ,...., |
1
1
1
1
k j,
1
1 1
>
)
`

+
+ I
I
= +

=
+
=

z z r k r F z
r k
k
e K
p r r r z f
j
j
r
k
j
r k
p
j
z
r
p p
GQIG

( )
( )
( )
( )
( ) ( ) ( ) 0 , , 1 ,
1
-
, 1 ,
1
1 ; , ,...., ; , ,...., |
1
1
1 1
1
1 1 1 1
> + +
+ + I
+
+ I
= +


=
+
=

z z i r r F
i r
z
e K
z r r F
r
z
p r r r z F
r
i
j
i r i
j
p
j
z
r
r r
p p
GQIG
j


2 1
Y Y Z + =

onde
2 1
e Y Y so variveis aleatrias independentes, a varivel aleatria
1
Y com distribuio
GIG de profundidade p , ( ) p r r GIG Y
p p
; ,..., ; ,..., ~
1 1 1


e a varivel aleatria
2
Y com
distribuio Gama com parmetro de forma r no inteiro e parmetro de taxa
j
= ,
p j ,..., 1 = e denotamos por ( ) , ~
2
r Y I .
A funo densidade de Z dada por,




e a funo distribuio por,



onde,
( ) k
c
c
k
j
k j
k j
I =

,
*
,

com
k j
c
,
dados por (1.5.1) at (1.5.3).

1.7 DISTRIBUIO NORMAL MULTIVARIADA
Dizemos que | |
T
p
X X X ,...,
1
= tem distribuio Normal p-Multivariada, facto que denotamos
por, ( ) E , ~
p
N X , onde
T
p
] ,..., [
1
= e )] , [cov(
j i
X X = E com p j i ,..., 1 , = , se a
funo densidade de X for dada por,

( )
( ) ( )
t
E

=
X X
p
T
e X f
1
2
1
2
1
2
.
2
1
) (
.
6
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


1.8 DISTRIBUIO WISHART
Esta distribuio uma generalizao da distribuio Qui-Quadrado. uma distribuio de
probabilidade conjunta de variveis aleatrias representadas sob a forma matricial.
Sejam ( ) , 0 ~
i p
N X , n i ,..., 1 = uma amostra aleatria. Ento a matriz

=
=
n
i
T
i i
X X W
1



tem uma distribuio de Wishart com matriz de parmetro e n graus de liberdade e
denotamos este facto por ( ) n
p
W W , ~ E .
7
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------





CAPTULO 2 - O TESTE DE ESFERICIDADE POR BLOCOS
DE MATRIZES PARA UMA AMOSTRA
2.1 INTRODUO
O teste de esfericidade usual permite testar se a hiptese nula de variveis independentes, com
igual varincia vlida. O teste de esfericidade por blocos de matrizes uma generalizao do
teste de esfericidade usual. Pretendemos, agora, testar se k grupos de variveis aleatrias so
independentes e tm iguais matrizes de covarincia.
Consideremos uma amostra de dimenso N extrada de uma populao Multivariada Normal,
( ) ,
p
N .
Vamos testar a hiptese nula,

( ) A =
(
(
(
(

A
A
A
=
k 0
I
0 0
0 0
0 0
:

H , (A no especificada) (2.1.1)
onde as matrizes A so de ordem * p , com * kp p = .

2.2 A DECOMPOSIO DA HIPTESE NULA DO TESTE
Em Coelho & Marques (2009) a sugerida decomposio de uma hiptese, em hipteses nulas
parciais, revela-se uma boa opo quando se pretende obter distribuies quase-exactas para a
estatstica do teste. A hiptese nula em (2.1.1) pode ser decomposta em duas hipteses nulas
parciais, mais precisamente

oa oa ob o
H o H H
|
= (2.2.1)
onde, para


2 1
2 22 21
1 12 11
(
(
(
(

E E E
E E E
E E E
=
kk k k
k
k

(2.2.2)
temos
) ,... 1 , ( , 0 : para k j i j i H
ij oa
= = = (2.2.3)
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
9


a hiptese nula para testar a independncia dos k grupos de * p variveis e

( ) , ... :
22 11 |
A = = = =
kk oa ob
H (A no especificada) (2.2.4)
a hiptese nula para testar a igualdade das k matrizes de covarincia de ordem * p , assumindo
oa
H como verdadeira.

2.3 A ESTATSTICA DE RAZO DE VEROSIMILHANAS E A EXPRESSO DO SEU h-SIMO
MOMENTO
A estatstica modificada de razo de verosimilhanas para testar a hiptese nula em (2.2.3)
dada por,

[
=
=
k
j
n
jj
n
a
A
A
1
2
2
*
| |
(2.3.1)
onde 1 = N n , ( )( )
=
=
N
i
T
X
i
X X
i
X A
1
e
jj
A a -sima matriz diagonal de ordem * p de
A.
A estatstica modificada de razo de verosimilhanas para testar a hiptese nula em (2.2.4)
dada por,

( )
[
[
=
=
=
k
j
nk
n p
k
j
n
jj
knp
a b
A n
A kn
1
2 2
*
1
2
2
*
*
|
*
(2.3.2)
onde
kk
A A A + + = ... *
11
e tem distribuio Wishart com nk graus de liberdade, o que fcil
de verificar uma vez que
jj
A a -sima matriz da diagonal de A

de ordem * p , as matrizes
kk
A A A ,..., ,
22 11
so independentes sob
o
H

e

( ) k i n W A
p ii
,..., 1 , , ~
*
= A .
Atendendo s propriedades da distribuio de Wishart, referidas em Anderson (2003) temos

( ) n n n W A A A A
* p kk
+ + + A + + + = .... , ~ ... *
22 11

k vezes
ou seja,
( ) nk W A
* p
, ~ * A .
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
10


( ) | | ( ) | | ( ) ( ) | |
h
a
h
a b
h
a a b
h
E E E
* *
|
* *
|
* = =
*

( )
( )

2
1
2
1
2
1
2
1

*
*
*
*
2
*
|
.
|

\
|
I
|
.
|

\
|
+ I
|
.
|

\
|
+ I
|
.
|

\
|
I
=
n
nh n
nkh nk
nk
k
kp
kp
p
p
h knp
( )
=
(
(
(
(
(

|
|
|
|
|
.
|

\
|

(
(
(
(
(

|
|
|
|
|
.
|

\
|
=
[ [
[
= =
=
h
k
j
n
jj
n
h
nk
k
j
np
k
j
n
jj
knp
A
A
E
A n
A kn
E
1
2
2
2
1
2
*
1
2
2
*
*
( )
( ) ( )

1
2
2
2
1
2
1
2
1

1
2
2
2
1
2

1
*
*
*
*
*
*
1
*
*
2
*
[ [
= =
|
.
|

\
|
+ I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
+ I

|
.
|

\
|
+ I
|
.
|

\
|
I

|
.
|

\
|
I
|
.
|

\
|
+ I
=
k
j
p
p
kp
kp
p
p k
j
p
p
h knp
h
n
n
n
nh n
h
nk
nk
n
h
n
k
Segundo Anderson (2003) e tendo em conta a decomposio em (2.2.1), se
*
a
, dada em
(2.3.1), a estatstica de razo de verosimilhanas para testar
oa
H e
*
|a b
, dada em (2.3.2) a
estatstica de razo de verosimilhanas para testar
oa ob
H
|
, ento
*
|
* *
a b a
= a estatstica de
razo de verosimilhanas para testar
o
H . Portanto, a estatstica modificada de razo de
verosimilhanas dada por

( ) ( )
( ) ( )
.
1


*
*

*

*
2
1
2
2
1
1
2
*
2
*
2
2
1
2
2
*
2
2 2
*
2
*
2
1
2 2
*
2
*
2
1
2 2
*
1
2
1
2
2
*
2
1
2 2
*
1
2
2
*
1
2
2
*
|
* *
nk
k
j
jj
n
nk
k
j
jj
knp
knp
n
nk
k
j
jj
nk nk
knp
n
nk
knp
knp n
k
j
nk
n p
knp n
k
j
nk
n p
k
j
n
jj
k
j
n
jj
knp n
k
j
nk
n p
k
j
n
jj
knp
k
j
n
jj
n
a b a
A
k
A
A k k
k A
A k
k A
A n
kn A
A n
kn A
A n A
A kn A
A n
A kn
A
A

[
[ [
[
[
[
[
= =

=
= =
=
=
=
=
= =
= = =
= = =
(2.3.3)

Dada a independncia das estatsticas de razo de verosimilhanas
*
a
e
*
|a b
sob

, a
expresso do h-simo momento nulo da estatstica de teste, , pode ser obtida como produto
das expresses dos h-simos momentos das estatsticas de razo de verosimilhanas,
*
a
e
*
|a b

(para as expresses dos momentos veja-se Muirhead (1982) e Anderson (2003)), ou seja,






(2.3.4)





--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
11
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


( ) | |
( )
( )
( )
( )
. 1 -
1
,
1
2
1
1
2
1
1
2
1
1
2
1
k * E
*
1
*
1
*
2
1
n
p
h
j n
j nh n
j nkh nk
j nk
kp
j
p
j
knh p
h

>
|
.
|

\
|
+ I
|
.
|

\
|
+ + I

|
.
|

\
|
+ + I
|
.
|

\
|
+ I
=
[ [
= =

( ) ( ) ( ) ( )
( )
( )
( )
( )
. ,
1
2
1
1
2
1
1
2
1
1
2
1
k
*
1
*
1
*
2
1
-
*
[ [
= =

e
|
.
|

\
|
+ I
|
.
|

\
|
+ I

|
.
|

\
|
+ I
|
.
|

\
|
+ I
=
= = u
p
j
k p
j
knit p
it
itW
W
R t
j nkit nk
j nk
j n
j nit n
E e E t
onde ( ) .
p
I a funo gama multivariada definida por

( ) ( )
[
=

|
.
|

\
|
I = I
p
j
p p
p
j t t
1
4
) 1 (
1
2
1
t ,
podemos a ttulo de exemplo, indicar que,


( )
( )
( ) ( )
( )
( ) . 1
2
1

1
2
1
2
1
2
1
*
1
4
1 * *
*
1
4
1 * *
*
[
[
=

|
.
|

\
|
+ + I =
=
|
.
|

\
|
+ I =
|
.
|

\
|
+ I
kp
j
kp kp
kp
j
kp kp
kp
j nh n
j nh n nh n
t
t


Portanto,






2.4 A FUNO CARACTERSTICA DE W= - log
*

Vamos usar a expresso do h-simo momento nulo de
*
para obtermos a expresso da funo
caracterstica de
*
log = W da seguinte forma:

(2.4.1)


A decomposio da hiptese nula em (2.2.1) induz uma factorizao na funo caracterstica de
W . Usando a factorizao em (2.3.4) podemos escrever a funo caracterstica em (2.4.1) como
o produto das funes caractersticas de
*
1
log
a
W = e de
*
| 2
log
a b
W = .
Assim,

( ) ( ) ( ) t t t
W W W
2 1
u u = u ,
em que
12
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


( ) ( )
( )
[
[
=
=

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
=
= = u
k
j
p
p
p
p
k
j
itnp
itknp
itW
W
n
itn n
itnk nk
nk
n
kn
e E t
1
*
*
*
*
1
2
*
2
*
2
2 2
2 2
2


2
2
( ) ( )
[
=

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
= = u
k
j
p
p
kp
kp
itW
W
itn
n
n
n
itn
n
e E t
1
*
*
*
*
2 2
1
2
1
2
1
2 2
1
1
1

e

.



Ento, obtemos
( )
( )

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
= u
[
=
k
j
p
p
k p
k p
W
it
n
n
n
itn n
t
1
*
*
*
*
1
2
2
2
1
2
1
2
1


( ) t
W
1
u
( )
( )
( )
[
[
=
=

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I

k
j
p
p
p
k
j
nit p
p
it nkp
n
it
n
it
nk
n
nk
nk
1
*
*
*
1
2
*
*
2
*
2
1
2
1
2
2

(2.4.2)
( ) t
W
2
u


2.5 FACTORIZAO DAS FUNES CARACTERSTICAS DE W
1
E W
2

Com o objectivo final de desenvolver distribuies quase-exactas para a estatstica modificada
de razo de verosimilhanas,
*
, vamos utilizar factorizaes das funes caractersticas de
*
| 2
*
1
log e log
a b a
W W = = . Estas factorizaes mostram que as distribuies exactas de
2 1
e W W

podem ser representadas sob a forma da soma de duas variveis aleatrias
independentes, uma com distribuio GIG e outra com distribuio correspondente soma de
variveis independentes com distribuio Logbeta multiplicadas, eventualmente, por uma
constante.
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
13


*
2
1
2 2 2
2 2
1
2 2
m
n
it
n n
it
n n n

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I

( ) t
2 , 1
u
2.5.1 A FUNO CARACTERSTICA DE W
1
= - log
a
*

Em Coelho (2004), o autor apresenta uma possvel factorizao para a funo caracterstica de
log
*
1 a
W = , na seguinte forma,

( )

2
1
2 2 2
2 2
1
2 2
2 2 2
*
2
1
1
m
p
j
z z
W
n
it
n n
it
n n n
n
it
j p n j p n
t
j j
[

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I

|
.
|

\
|

+

|
.
|

\
| +
= u
podemos reescrever a funo caracterstica anterior da seguinte forma:

( )
*
2
1
2
1
2 2 2
2 2
1
2 2
2
2
1
m
z
p
j
W
n
it
n n
it
n n n
itn j p n
j p n
t
j

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I

|
|
|
|
.
|

\
|
+
+
= u
[

=


( ) ( )
*
2
1
*
2
1
*
2
1
2
1
2 2 2
2 2
1
2 2
2
1
2 2 2
2 2
1
2 2
2
1
2 2 2
2 2
1
2 2
m
z z
p
j
m
z z
p
j
m
z
p
j
n
it
n n
it
n n n
it
n
j p n
n
j p n
n
it
n n
it
n n n
it
n
j p n
n
j p n
n
it
n n
it
n n n
n
itn j p n
n
j p n
j j
j j
j

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I

|
.
|

\
|


|
.
|

\
|
=

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I

|
.
|

\
|

+
|
.
|

\
| +
=

|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
|
I

|
|
|
|
.
|

\
|
+
+
=

=
[
[
[



[
=


|
.
|

\
|

|
.
|

\
|
=
1
2

p-
j
z z
j p j p
it
n
j n
n
j n
(2.5.1.1)
( ) t
1 , 1
u


(2.5.1.2)


14
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------

= +
= +
=
=
=

p j h
j m
j m
j
z
j j-
j
...., 5, , z
4 , * h
3 , * h
2 , 0
2 2
2
1
2
n
( ) t
1 , 2
u
com

=
mpar
par
*
* p , k
* p , 0
m
. (2.5.1.3)
Sendo os parmetros
j
z dados por,

(2.5.1.4)


com
( ) ( ) 1 1,..., > = = j k i p h
i j
, 2 ,... 1 = p j (2.5.1.5)
onde k o nmero de grupos de variveis com um nmero mpar de variveis.
A funo caracterstica ( ) t
1 , 1
u corresponde soma de 2 p variveis aleatrias com
distribuio Gama com parmetros de forma
j
z , inteiros, dados em (2.5.1.4) e taxas
n
j n
com 1 ,..., 2 = p j , isto , uma distribuio GIG (Coelho, 1998) de profundidade
2 p .
A funo caracterstica ( ) t
2 , 1
u corresponde soma de * m variveis aleatrias
independentes com distribuio Logbeta multiplicadas por com parmetros
2
e
2
1
2
n n
.

2.5.2 A FUNO CARACTERSTICA DE W
2
= - log
b|a
*

Em Coelho & Marques (2011) os autores obtm a seguinte factorizao para ( ) t
W
2
u ,


( )
k k
r
p
k
r
W
it
n
k n
n
k n
t
|
.
|

\
|

|
.
|

\
|
= u
[

=
1
1
2

(2.5.2.1)

--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
15


( )
( )
2
1 *
*
2
2

p
q
k
pk p pk p
pk p pk p
it
n
b a b a
it
n
b a b a
|
|
|
|
.
|

\
|
|
.
|

\
|
+ I + I
|
.
|

\
|
+ I + I

[
=
( ) t
2 , 2
u

( ) ( )
( ) ( )
[[
(

= =
+ I + I
+ I + I

2
1 1
*
*
p
j
q
k
jk j jk j
jk j jk j
nit b a b a
nit b a b a





(2.5.2.2)



onde,

= +
= =
=
1
* *
k
1
*
2 1 , r
2 1 e 1 1 ,
- p- k a
- p- k ,...,p- k r
r
k
k
, (2.5.2.3)
com,
( )( )
|
|
.
|

\
|
(

=
q
p
q
p
q p a
2 2
1
2
1 2
*
o o
,


e,

=
+
=
; contrrio caso 1
par 0
2 2
1
2
,
, p
p p
p



{ }
( ) { }

{ }
{ }

+ e
|
|
.
|

\
|
(

+
+ e
+ e
|
|
.
|

\
|
(

+ e
=
2 passo ; 1 ,..., 2 1 ,
2 2
1
2 passo ; 1 2 2 ,... 2 - 2
1 , 2 - p min 2,..., ,
2 2
1 1,..., ,
1
1
1
*
p p k
k p
q
p p k
p k
k p
q
k c
r
k
k
o
o
o o
o
(2.5.2.4)

e onde para o ,..., 1 = k ,


( ) ( ) ( )
(

+
(

+
|
|
.
|

\
|
(

+
(

=
2
2
2 2
2 1 2 1
2

k q q q
q q k
q
c
k


16
0
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


( ) .
2 4 4
2
2
2
2
1
2 2 2
2
2
2
1
|
|
.
|

\
|
+ + +
(

+
|
|
.
|

\
|
(

+
|
|
.
|

\
|
(

=
+
q p
q
p
q
q p
c
o
o o
o
o
o
o

n
k n
e


(2.5.2.5)



A funo caracterstica ( ) t
1 , 2
u corresponde soma de 1 p variveis aleatrias
independentes com distribuio Gama, com parmetros de forma
k
r

, inteiros, dados em
(2.5.2.3) e taxas com 1 ,..., 1 = p k , isto , uma distribuio GIG de profundidade
1 p .
A funo caracterstica ( ) t
2 , 2
u corresponde soma de

2 2 p q q p + variveis
aleatrias independentes com distribuio Logbeta, as primeiras

q p 2 multiplicadas por n
e as segundas 2 p q multiplicadas
2
n
.



















17
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------







CAPTULO 3 DISTRIBUIES ASSIMPTTICAS E
QUASE-EXACTAS PARA W E
*

3.1 INTRODUO
Neste captulo desenvolvemos vrios tipos de aproximaes para a estatstica
*
. Comeamos
por apresentar uma aproximao para W apresentada em Chao & Gupta (1991), baseada no
tradicional mtodo de Box (1949). Em seguida propomos duas aproximaes assimptticas para
W na forma de mistura de duas ou trs distribuies Gama, com o mesmo parmetro de taxa e
que acertam os primeiros quatro ou seis momentos da distribuio exacta.
Finalmente, desenvolvemos distribuies quase-exactas para e

que tm a distribuio de
uma GQIG ou da mistura de duas ou trs distribuies GQIG que acertam os primeiros dois,
quatro ou seis momentos da distribuio exacta.

3.2 APROXIMAO BASEADA NO MTODO DE BOX
Em Chao & Gupta (1991), embora os autores apresentem um teste mais geral que o teste de
esfericidade por blocos de matrizes para uma amostra, na prtica apenas estudam este teste
porque assumem e no testam a igualdade de matrizes de covarincia associadas ao nmero de
populaes multivariadas normais consideradas.
Assim, com as devidas correces, podemos utilizar a aproximao apresentada pelos referidos
autores, que baseada no usual Mtodo de Box, como uma aproximao assimpttica para
* log = W .
A aproximao apresentada sob a forma de uma mistura de Qui-quadrados,


( ) ( ) ( ) ( ) ( ) ( )
3 2 2
4 2
2
* log 2

+
+ s s + s = s n O z P z P z P z P
f f f
_ _ e _ (3.2.1)
onde,

( )( )( ) ( )( ) ( )
( ) ( ) | | , 1 1 1
2

24
1 3
32
2 1
32
2 1 1
3
2
liberdade de graus com
2 2
2 2 2
2
+ + =

+ +

+ +
=
k p k
p
f
f n
k
p p p p pk pk pk
n

e

e,
( ) ( )( ) ( ) ( ) | | 1 1 3 1 1 2 1
12
1
2 2 2
+ + + + + + = k k k p k k p k
nfk
p
, onde k o numero de
grupos e p o nmero total de variveis.
19
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


Atendendo expresso (3.2.1) e a que * log = W , obtemos
( ) ( ) ( ) ( ) z P z P z P z W P
f f f
s s + s ~ s
+
2
2
2
4 2
2
2 _ e _ e _
e podemos considerar,
( ) ( ) ( ) ( ). 1 2
2
4 2
2
2
z P z P z W P
f f
s + s ~ s
+
_ e _ e
Usando o facto de que,

( ) | |
( )
| |
( )
(

= = = u

*
log 2
2 * log


it
it itW
W
e E e E e E t

e sendo
2
f
_ um caso especial da distribuio Gama, pois

|
.
|

\
|
I
2
1
,
2
~ ~
2
f
X X
f
_
ento,
( ) ( )
( )
( )
( ) ( ) ( )
( ) ( ) ( ) .
2
1
2
1
2
1
2
1
1
2
1
2
1
2
1
2
1
1
2 2
1
2
1
2 2
1
2
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
4
2
4
2
2
2
2
(
(
(
(

|
|
|
.
|

\
|
+
(
(
(
(

|
|
|
.
|

\
|
=
=
(
(

|
|
.
|

\
|
|
.
|

\
|
+
(
(

|
|
.
|

\
|
|
.
|

\
|
=
=
(
(

|
|
.
|

\
|

|
.
|

\
|
+
(
(

|
|
.
|

\
|

|
.
|

\
|
~ u
|
.
|

\
|

+ |
.
|

\
|

+ |
.
|

\
|

|
.
|

\
|

+ |
.
|

\
|

+
+

f
f
f
f
f
f
f
f
f
f
f
f
f
f
W
it it
it it
it it
t

e

Desta forma, obtemos uma aproximao para ( ) t
W
u , sob a forma de uma mistura de duas
distribuies Gama,
( ) ( )( ) ( ) ( ) ( )
2
2
2
2
2
2 2
2
1
+
+ = u
f f f f
Box
it it t e e . (3.2.2)

3.3 APROXIMAES BASEADAS EM MOMENTOS
Considerando a aproximao obtida por Box (1949) propomos duas novas aproximaes
assimptticas para W , sob a forma de duas misturas de distribuies Gama que acertam os
quatro ou seis primeiros momentos da distribuio exacta. Nas diferentes misturas,
semelhana do que acontece na aproximao de Box, consideramos igual parmetro de taxa
para as diferentes Gamas na mistura.
Especificando, propomos como aproximaes para ( ) t
W
u a funo caracterstica da mistura de
duas ou trs distribuies Gama, ambas com o mesmo parmetro de taxa,
20
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


( ) t
W
*
2
u
( ) ( )

= u
2
1
2
j
s s
j G M
j j
it p t , (3.3.1)
e

( ) ( )

= u
3
1
3
j
s s
j G M
j j
it p t
(3.3.2)

com . 3 ,..., 1 0 , , ; 1 ; 1
1 2 3 1 2
= > = = j s p p p p p p
j j

As expresses em (3.3.1) e (3.3.2), so obtidas pela resoluo do seguinte sistema de equaes:

( )
( )
( ) ( )
. 2 ,..., 1 , | |
0 0
1
k h
t
t
t
t
s
h s
p i
t
h
W
h
t
h
MkG
h
k
j
h
j
j
j
h
=
c
u c
=
c
u c
=
I
+ I
= =
=


tomando k=2, no caso da mistura de duas distribuies Gama, ou k=3, no caso da mistura de trs
distribuies Gama.

3.4 APROXIMAES QUASE-EXACTAS PARA W E
*

Considerando as factorizaes apresentadas na seco 2.5, onde esto bem patentes as
semelhanas entre as distribuies de
2 1
e W W , podemos reescrever a funo caracterstica de
* log = W , atravs do teorema seguinte:
Teorema 1: A funo caracterstica de * log = W pode ser apresentada da forma,
( ) ( ) ( )
[

u u
|
.
|

\
|

|
.
|

\
|
= u
1
1
2 , 2 2 , 1
p
j
v v
W
t t it
n
j n
n
j n
t
j j
(3.4.1)
( ) t
W
*
1
u
com ( ) ( ) t t
2 , 2 2 , 1
e u u dadas respectivamente em (2.5.1.2) e (2.5.2.2) e onde os
j
v so dados
por,

= +
=
=

1 ,..., 2
1
p j z r
j r
v
j p j
j
j
(3.4.2)
com os
j
z dados em (2.5.1.4) e os
j
r dados em (2.5.2.3).

Com base no teorema 1, desenvolvemos distribuies quase-exactas que tm por base a seguinte
construo,
21
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------



( ) ( ) ( ) t t t
W W
W
2
*
1
*
u u = u
Dist. GIG soma de Logbeta ind.


substituio assimpttica para ( ) t
W
*
2
u


( ) ( ) ( ) .
2
h
1
*
1

=

u ~ u
j
j
W
W
j j
it t t
o o
u

mistura de 2 ou 3 distribuies GQIG (h=4 ou h=6)
(sendo uma nica distribuio GQIG para h=2)

Portanto,
( ) ( ) ( ) ( ) t t t t
W
W W
W
u ~ u u = u
*
2
*
1
~
, (3.4.3)
Distribuio GIG

onde ( ) t
W
*
1
u e ( ) t
W
*
2
u so dadas em (3.4.1) e ( ) t
W
*
2
~
u a funo caracterstica em (3.4.5)
utilizada para aproximar a funo caracterstica ( ) t
W
*
2
u .
Propomos que a funo caracterstica ( ) t
W
*
2
~
u seja a funo caracterstica de uma distribuio
Gama ou da mistura de duas ou trs distribuies Gama, dependente do nmero de momentos
que se pretende acertar. Assim, as funes caractersticas ( ) t
W
*
2
u e ( ) t
W
*
2
~
u tm as primeiras
duas, quatro ou seis derivadas em zero iguais, por outras palavras temos,

( ) ( ) h j t
dt
d
t
dt
d
t
W j
j
t
W j
j
,..., 1 , |
~
|
0 0
*
2
*
2
= u = u
= =
(3.4.4)
para h=2, 4 ou 6 consoante ( ) t
W
*
2
~
u seja a funo caracterstica de uma distribuio Gama ou a
funo caracterstica da mistura de duas distribuies Gama ou a funo caracterstica da
mistura de trs distribuies Gama com os mesmos parmetros de taxa, isto ,

( ) ( )

= u
2
1
*
2
~
h
j
j
W
j j
it t
o o
u (3.4.5)
com pesos ( )

=
= = = >
2
1 j
1 e 6 ou 4 , 2 com
2
h
1,...., 0
h
j j
h j u u .
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
22


Desta forma, podemos escrever a funo caracterstica quase-exacta do logaritmo da estatstica
de razo de verosimilhanas,
*
log = W , na forma (3.4.3) onde ( ) t
W
*
2
~
u a funo
caracterstica de uma distribuio Gama, da mistura de duas distribuies Gama ou da mistura
de trs distribuies Gama, obtendo como distribuies quase-exactas, respectivamente, uma
distribuio GQIG ou a mistura de duas ou trs distribuies GQIG de profundidade p .
No teorema que se segue, so apresentadas as distribuies e as funes densidade de
probabilidade para as distribuies quase exactas de
*
.

Teorema 2: As distribuies quase-exactas para
*
log = W so uma GQIG ou a mistura de
duas ou trs distribuies GQIG de profundidade p para h=2,4 ou 6. As funes densidade de
probabilidade das distribuies quase-exactas para
*
so dadas por (veja-se seces 1.5 e
1.6),

=

|
.
|

\
| +

2
1
1 1
1
; ,
1
,...,
1
; , ,..., | log
h
v
v p
GQIG
v
p
n
p n
n
n
v v f
e
o e u
e as funes distribuio das distribuies quase-exactas para
*
so dadas por

=

|
.
|

\
| +

2
1
1 1
; ,
1
,...,
1
; , ,..., | log 1
h
v
v p
GQIG
v
p
n
p n
n
n
v v F o e u
com os
j
v dados em (3.4.2), e onde, para h=2

2
1 2
2
1
1
2
1 2
1
e
m m
m
m m
m

= o
com
( ) 2 1 , |
0
*
2
, j t
t
i m
t
W j
j
j
j
= u
c
c
=
=


e para h=4 ou 6

os valores dos parmetros o u e ,
v v
so obtidos como soluo numrica
do sistema de equaes em (3.4.4), isto ,
( ) ( ) h j t
dt
d
t
dt
d
t
W j
j
t
W j
j
,...., 1 , |
~
|
0 0
*
2
*
2
= u = u
= =

com

=
=
1
2
1
2
1
h
i
i h
p p .
Na prxima seco podemos constatar que estas distribuies quase-exactas fornecem
excelentes aproximaes para W e para
*
, e so mais fceis de usar em termos prticos o que
facilita o clculo de quantis quase-exactos e p-values.
23
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------





CAPTULO 4 ESTUDOS NUMRICOS
Para avaliarmos a qualidade das aproximaes desenvolvidas no captulo anterior, usamos uma
medida de proximidade entre as funes caractersticas. Esta j utilizada em diversos trabalhos
para avaliar qualidade de distribuies quase-exactas (Grilo & Coelho, 2007; Coelho &
Marques, 2011).
Seja Y uma varivel aleatria contnua com suporte S, em que ( ) y F
Y
a sua funo
distribuio, ( ) y f
Y
a sua funo densidade de probabilidade e ( ) t
Y
u a funo
caracterstica. Seja
n
X uma varivel aleatria, em que ( ) y F
n
X
, ( ) y f
n
X
e ( ) t
n
X
u so,
respectivamente, a funo distribuio, a funo densidade e a funo caracterstica da varivel
aleatria
n
X .
A medida dada por,

( ) ( )
}


u u
= A dt
t
t t
n
X Y
t 2
1
, (4.1)
com

( ) ( )
S y
y F y F
n
X Y
e
A s . max

Nas tabelas seguintes vamos denotar por GQIG, M2GQIG e M3GQIG respectivamente as
distribuies quase-exactas GQIG, mistura de duas distribuies GQIG e mistura de trs
distribuies GQIG. Alm disso, denotemos por M2G e M3G a mistura de duas ou trs
distribuies Gama que acertam quatro ou seis momentos da distribuio exacta e que
correspondem s aproximaes propostas na seco 3.3. Finalmente denotaremos por Box a
aproximao assimpttica obtida em Chao & Gupta (1991).
Nas tabelas 4.1 e 4.2 apresentamos os valores da medida A
,
para o caso em que
*
p est fixo e
p , k e n aumentam.
Tabela 4.1 Valores da medida A

para p*=2 e valores crescentes de p, k e n.
p p
*
k n GQIG M2GQIG M3GQIG M2G M3G BOX
6 2 3 8 4.010
-6
6.010
-9
3.010
-11
4.710
-4
6.410
-5

1.910
-2

8 2 4 10 1.510
-6
3.710
-10
1.810
-12
5.910
-4

9.210
-5

4.710
-2

10 2 5 12 4.410
-7
1.210
-10
7.510
-14
1.710
-4

1.910
-5

4.010
-2

14 2 7 16 1.010
-7
1.510
-11
4.510
-15
7.510
-4

1.410
-4

1.810
-1

18 2 9 20 2.710
-8
1.910
-12
2.910
-16
1.510
-4

1.510
-4

3.110
-1

--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------
25


Tabela 4.2 Valores da medida A

para p*=3 e valores crescentes de p, k e n.
p p
*
k n GQIG M2GQIG M3GQIG M2G M3G BOX
9 3 3 11 4.510
-6
3.610
-9
4.010
-12
6.210
-4
1.010
-4

5.810
-2

12 3 4 14 1.210
-6
4.310
-10
2.910
-13
7.110
-4

1.210
-4

1.210
-1

15 3 5 17 4.310
-7
8.210
-11
3.810
-14
7.610
-4

1.410
-4

2.110
-1

21 3 7 23 8.310
-8
1.710
-12
9.010
-16
8.010
-4

2.510
-4
*

4.110
-1

27 3 9 29 2.510
-8
6.310
-13
5.210
-17
8.110
-4

3.710
-4
*

6.410
-1

* Os parmetros foram calculados com dificuldade na convergncia.
Podemos observar que os valores de A apresentados pela distribuio quase-exacta GQIG so
bem melhores do que os apresentados pelas distribuies assimptticas , misturas de duas ou
trs Gamas. As misturas de duas ou trs distribuies GQIG so as distribuies que apresentam
os valores mais baixos, sendo a distribuio M3GQIG a que apresenta os valores mais baixos de
todas. A aproximao assimpttica denotada por Box a que apresenta os valores mais altos.
Nas tabelas 4.3 e 4.4 apresentamos o caso em que apenas o valor de n aumenta sucessivamente
e os restantes parmetros permanecem inalterados.

Tabela 4.3 - Valores da medida Apara p=8, p*=4, k=2 e valores crescentes de n
p p
*
k n GQIG M2GQIG M3GQIG M2G M3G BOX
8 4 2 10 3.110
-6
2.910
-10
9.110
-13
5.610
-4
8.510
-5

3.310
-2

8 4 2 50 2.110
-7
6.910
-13
1.810
-14
1.810
-7

7.310
-10

3.210
-5

8 4 2 100 5.510
-8
4.310
-14
3.210
-18
1.110
-8

2.710
-11

3.310
-6


Tabela 4.4 - Valores da medida Apara p=8, p*=4, k=2 e valores crescentes de n
p p
*
k n GQIG M2GQIG M3GQIG M2G M3G BOX
9 3 3 10 4.510
-6
3.610
-9
4.010
-12
6.210
-4
1.010
-4

5.810
-2

9 3 3 50 4.610
-7
2.710
-11
1.210
-14
2.610
-7

1.310
-9

9.010
-5

9 3 3 100 1.210
-7
2.010
-12
1.510
-15
1.610
-8

3.410
-11

9.210
-6


Analisando as tabelas 4.3 e 4.4, podemos concluir que os valores de A da distribuio quase-
exacta GQIG s apresenta os melhores valores, comparada com a mistura de duas ou trs
Gamas, para 10 = n . No entanto, os valores da distribuio quase-exacta GQIG conseguem ser
melhores do que os da aproximao assimpttica denotada por Box, mas ficam aqum dos
valores A das misturas de duas ou trs distribuies GQIG. Novamente, a mistura de trs
distribuies GQIG apresenta os valores mais baixos.
Em todas as tabelas verificamos as boas propriedades assimptticas das distribuies quase-
exactas para valores crescentes de p e n.
26
--------------------O TESTE DE ESFERICIDADE POR BLOCOS DE MATRIZES PARA UMA AMOSTRA --------------------


CONCLUSO

Neste trabalho procurmos contribuir para que as dificuldades levantadas na utilizao do teste
de esfericidade por blocos de matrizes para uma amostra, devidas essencialmente estrutura
complexa da distribuio exacta da estatstica de razo de verosimilhanas, fossem de alguma
forma ultrapassadas. Neste sentido propusemos para a distribuio da estatstica de teste duas
aproximaes assimptticas sob a forma de misturas de duas ou trs distribuies Gama e
desenvolvemos, com base numa decomposio da hiptese nula do teste, distribuies quase
exactas que correspondem a uma distribuio Gama Quase-Inteira Generalizada ou a misturas
destas distribuies.
A utilizao de uma decomposio da hiptese nula, do teste de esfericidade por blocos de
matrizes para uma amostra, em duas hipteses nulas parciais, uma para estudar a independncia
dos grupos de variveis e outra para estudar a igualdade das matrizes de covarincia, permitiu
obter de uma forma simples a expresso da estatstica de razo de verosimilhanas, a expresso
do seu -simo momento nulo e ainda a expresso da funo caracterstica do logaritmo da
estatstica de razo de verosimilhanas.
A factorizao induzida na funo caracterstica do logaritmo da estatstica de teste pela
decomposio da hiptese nula considerada, juntamente com os resultados obtidos em Coelho
& Marques (2011) e Coelho (2004) permitiram o desenvolvimento das distribuies quase-
exactas. As distribuies quase-exactas obtidas revelaram-se excelentes aproximaes quando
comparadas com as outras aproximaes propostas e com a aproximao obtida em Chao &
Gupta (1991) e tm distribuies conhecidas, com expresses fceis de implementar e de usar
em termos computacionais, o que as torna uma ptima ferramenta para usar na prtica.
Verificmos, ainda, que as aproximaes quase-exactas revelam boas propriedades
assimptticas no s para valores crescentes do tamanho da amostra, mas tambm para valores
crescentes do nmero de variveis e do nmero de grupos de variveis.

27







BIBLIOGRAFIA

Abramowitz, M. & Stegum, I. A. (1974). Handbook of Mathematical Functions, 9rd ed., Dover,
New York.
Anderson, T. W. (2003). An Introduction to Multivariate Statistical Analysis, 3rd ed., J. Wiley
& Sons, New York.
Box, G. E. P.(1949). A general distribution theory for a class of likelihood criteria. Biometrika,
36, 317-346.
o n
~
Carde , L. & Nagar K. D. (2001). Testing Block Sphericity of a Covariance Matrix.
Divulgaciones Matemticas, 9, 25-34.
Chao, C. C.; Gupta A. K.(1991). Testing of Homogeneity of Diagonal Blocks with Blockwise
Independence. Communication in Statistics Theory and Methods, 20, 1957-1969.
Coelho, C. A. (1998).The Generalized Integer Gamma Distribution A basis for distributions in
Multivariate Statistics. Journal of Multivariate Analysis, 64, 86-102.
Coelho, C. A.(2004). The Generalized Near-Integer Gamma Distribution: a basis for near
exact approximations to the distributions of statistics which are the product of an odd
number of independent Beta random variables. Journal of Multivariate Analysis, 89,
191-218.
Coelho, C. A. & Marques, F. J. (2011). Near-exact distributions for the likelihood ratio test
statistic for testing the equality of several variance-covariance matrices in elliptically
contourned distributions. Computational Statistic(in print).
Coelho, C. A. & Marques, F. J. (2009).The advantage of decomposing elaborate hypotheses on
covariance matrices into conditionally independent hypotheses in building near-exact
distributions for the test statistics. Linear Algebra and Its Applications, 430, 2592-
2606.
Grilo L.M. & Coelho C.A. (2007). Development and Comparative Study of two Near-exact
Approximations to the Distribution of the Product of an Odd Number of Independent
Beta Random Variables. Journal of Statistical Planning and Inference, 137, 1560-1575.
Johnson, N.L. & Kotz, S. and Balakrishnan, N. (1995). Continuous Univariate Distributions. 2rd
ed.J.Wiley& Sons, New York.
Marques, F. J. & Coelho, C. A. (2011). A general near-exact distribution theory for the most
common likelihood ratio test statistics used in Multivariate Statistics. Test,20, 180-203.
Muirhead, Robb J. (1982). Aspects of Multivariate Statistical Theory. 2rd ed. J. Wiley & Sons,
New York.


29

Potrebbero piacerti anche