Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
8 INFERNCIA ESTATSTICA
Alguns conceitos breves sobre aspectos inferenciais em contexto
multivariado.
Problemas tradicionais
Estimao de mdia populacional
Estimao de vector mdio populacional, .
Estatstica Multivariada
2009-10
180 / 218
Amostras aleatrias
Cada extraco aleatria dum elemento duma populao com p
variveis um vector aleatrio:
X = (X1 , X2 , ..., Xp )t ,
onde cada Xi representa uma varivel aleatria.
Chamamos amostra aleatria duma populao multivariada a uma
coleco de n extraces aleatrias independentes dessa populao.
Uma amostra aleatria multivariada representa-se de 2 formas:
Uma coleco de n vectores aleatrios independentes:
(X1 , X2 , ..., Xn ) .
Estatstica Multivariada
2009-10
181 / 218
Vectores aleatrios
Definio 8.1
Seja X = (X1 , X2 , ..., Xp )t um vector aleatrio. Define-se (admitindo que
existem os valores esperados, varincias e covarincias indicados):
1
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
182 / 218
A distribuio Multinormal
Definio 8.2
Seja Y um vector aleatrio n-dimensional. Diz-se que Y tem
distribuio Multinormal, com parmetros dados pelo vector e a
matriz (definida positiva) se a sua funo densidade conjunta fr:
fY (y) =
(2 )n/2
1
p
e 2 (y )
1
)
det(
(y )
y Rn
).
Nesse caso, escreve-se: Y Nn ( ,
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
183 / 218
z
y
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
184 / 218
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
185 / 218
vector
1
n
Xi
i=1
vectores
Estatstica Multivariada
2009-10
186 / 218
Propriedades do estimador X
), (i = 1, ..., n),
Dada uma amostra aleatria Multinormal, Xi Np ( ,
ento:
E [X] =
V [X] =
1
n
(Estimador centrado).
(Semelhante ao univariado).
X Np ( , n1 ) (s neste ponto
1 (X ) p2
Q = (X )t n
precisoMultinormalidade).
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
187 / 218
conhecida, Multinormalidade)
Inferncia sobre (
Teste de Hipteses a = 0
Hipteses: H0 : = 0 vs. H1 : 6= 0
1 (X 0 ) p2 , sob H0 .
Estatstica do teste: Q = (X 0 )t n
Estatstica Multivariada
2009-10
188 / 218
Elipsides em Rp
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
189 / 218
Elipsides em Rp
Recordar que, se C definida positiva, ento:
Pt
C admite decomposio espectral C = P
(elementos diagonais de positivos);
1 Pt .
C1 existe e tem decomposio espectral C1 = P
(x x0 )t C1 (x x0 )
1
k 1
t
t .
.
P (x x0 )
.
0
0
p
Se P = I, fica
i=1
..
.
0
...
...
..
.
...
1
k p1
...
0
1
k 2
(xi x0i )2
k i
0
0
..
.
= k
0
0
..
.
0
1
k p
t
P (x x0 ) = 1
Estatstica Multivariada
2009-10
190 / 218
Regio de confiana em R2
Regiao de confianca para
2.3
2.4
confianca =
0.95
2.1
2.2
0.8
0.9
1.0
1.1
1.2
1.3
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
191 / 218
1
n1
Xt (In P1n )X
1
n1
Estatstica Multivariada
2009-10
192 / 218
Distribuio de Wishart
Vrias distribuies surgem associadas Multinormal. Uma a de
Wishart.
Definio 8.3
Seja App uma matriz aleatria, com funo densidade conjunta:
( 1 tr(A1 ))
det(A)(np1)/2 e 2
, A def. positiva
p
2np/2 p(p1)/4 det()1/2n ( 21 (n+1i))
w (A; , n) =
i=1
0
, caso contrario
Diz-se que A tem distribuio de Wishart com parmetros n e :
A Wp (, n). Se = Ip diz-se que temos uma Wishart padro.
Estatstica Multivariada
2009-10
193 / 218
Teorema 8.2
Seja Xnp uma matriz aleatria cujas linhas so vectores aleatrios
).
com distribuio Xi Np (0,
t
Seja M = X X. Ento
, n) .
M Wp (
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
194 / 218
A Wishart e o estimador de
Teorema 8.3 (Cochran)
Seja Xnp uma matriz aleatria cujas n linhas so elementos duma
). Seja Cnn uma matriz
amostra aleatria, com distribuio Np (0,
simtrica, no-aleatria. Ento, Xt CX tem distribuio de Wishart se e
s se C fr uma matriz idempotente. Nesse caso, tem-se
, r )
Xt CX Wp (
, n 1) .
Wp (
Estatstica Multivariada
2009-10
195 / 218
Estatstica Multivariada
2009-10
196 / 218
Teorema 8.5
Para uma amostra Multinormal, os estimadores X e S so
independentes.
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
197 / 218
Corolrio
Seja Xnp uma matriz aleatria cujas n linhas tm distribuio
) (i = 1, ..., n). Ento
Xi N ( ,
np
n (x )t S1 (x )
{z
}
(n 1)p |
F(p,np)
Estatistica T 2 de Hotelling
(vem de
) e (n 1)S Wp (
, n 1)).
n X Np ( n ,
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
198 / 218
Estatstica do teste: F =
sob H0 .
(np)n
(n1)p
(X 0 )t S 1 (X 0 ) F(p,np),
p(n 1)
.
(n p)n
Estatstica Multivariada
2009-10
199 / 218
O Lambda de Wilks
Uma quantidade que surge com frequncia em tcnicas de Estatstica
Multivariada o lambda de Wilks.
Definio 8.4
Sejam
, m) (m p);
App uma matriz aleatria com distribuio Wp (
, n);
Bpp uma matriz aleatria com distribuio Wp (
A e B independentes.
Ento,
det(A)
det(A + B)
1
det(Ip + A1B)
J. Cadima (DM/ISA)
(p, m, n) .
Estatstica Multivariada
2009-10
200 / 218
1
det(Ip + A1 B)
1
p
(1 + i )
i=1
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
201 / 218
2
pn
.
(p, m, 1)
p
F(p,mp+1) .
p
(p, m, 2)
F(2p,2(mp+1)) .
pn
1/s
com a = m 12 (p n + 1)
J. Cadima (DM/ISA)
s=
Estatstica Multivariada
F(pn,as pn +1) ,
2
p 2 n 4
.
p2 +n2 5
2009-10
202 / 218
Bk p
| {z }
Cnk
| {z }
np
| {z}
erros aleatorios
1 = 2 = 3 = ... = k Rp .
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
203 / 218
Pressupostos
Identifica-se cada vector observado (linhas da matriz X) por
dois ndices: Xij , em que o
primeiro ndice (i) indica o nvel do factor (i = 1, ..., k);
segundo ndice (j) indica o repetio no seio do nvel (j = 1, ..., ni ).
Admite-se que
As linhas da matriz X so observaes independentes.
em cada nvel do factor tem-se distribuio Multinormal:
Xij
i ) ,
Np ( i ,
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
204 / 218
Se H0 verdade
H0 : 1 = 2 = ... = k
Nesse caso, todas as observaes Xij so identicamente distribudas:
Xij
) .
Np ( ,
J. Cadima (DM/ISA)
, n 1) .
Wp (
Estatstica Multivariada
2009-10
205 / 218
Para quaisquer i
),
Seja, ou no, H0 verdade, tem-se Xij N ( i ,
i = 1, ..., k .
Sconj =
(ni 1) Si
i=1
k
(ni 1)
1
nk
(ni 1) Si .
i=1
i=1
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
206 / 218
1 t
X (In PC )X .
{z
}
n|
=W
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
207 / 218
vs.
H1 : i, j tais que i 6= j
det(W )
.
det(T )
Estatstica Multivariada
2009-10
208 / 218
1
det(W )
=
=
det(W + B)
det(In + W 1 B)
1 + i
i=1
Xt (PC P1n ) X
, k 1) .
Wp (
Teorema de Craig
Seja dada uma matriz aleatria Xnp cujas linhas so vectores
). Sejam C1 e C2 matrizes
aleatrios i.i.d. com distribuio Np ( ,
(no aleatrias e de dimenso n n) simtricas. Ento Xt C1 X e Xt C2 X
so independentes se C1 C2 = 0.
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
209 / 218
Teste MANOVA
Pressupostos: n observaes independentes p-variadas, em k nveis
dum factor
), i = 1; ..., k ; j = 1, ..., ni ; i ni = n.
Xij Np ( i ,
Hipteses:
H0 : 1 = 2 = ... = k
vs.
H1 : i, j t.q. i 6= j .
Estatstica do Teste:
==
det(W )
=
det(W + B)
1
p
(1 + i )
(p, n k, k 1) ,
i=1
com
W = Xt (In PC )X;
B = Xt (PC P1n )X;
i (i = 1, ..., p) valores prprios de W 1 B.
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
210 / 218
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
211 / 218
Estatsticas alternativas
Lambda de Wilks: =
1 + i .
i=1
p
Bartlett-Pillai: U =
i=1
i
1+i .
Hotelling-Lawley: V = i .
i=1
J. Cadima (DM/ISA)
Estatstica Multivariada
2009-10
212 / 218