Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
por
Gauss Moutinho Cordeiro
Departamento de Estatstica e Informatica,
Universidade Federal Rural de Pernambuco,
Rua Dom Manoel de Medeiros, s/n,
50.171-900 Recife, PE, Brasil
e
Eufrasio de Andrade Lima Neto
Departamento de Estatstica,
Universidade Federal da Paraba,
Cidade Universit
aria, s/n,
58.051-900 Joao Pessoa, PB, Brasil
Pref
acio
Este texto objetiva apresentar alguns modelos de regressao para analise de
dados univariados. Nao se pretende abrir todos os modelos de regressao, mas
sim abordar os principais modelos usados na pratica de uma forma resumida
e consistente.
Existe uma vasta literatura destinada a estudar de forma isolada os
seguintes modelos: os modelos normal-linear, os modelos para a analise de dados categorizados, os modelos lineares generalizados e os modelos aditivos generalizados. O pre-requisito para a leitura deste texto e um Curso de Inferencia
Estatstica com base em Teoria da Verossimilhanca ao nvel de graduac
ao.
O texto, dividido em 6(seis) captulos, se destina prioritariamente a alunos
de mestrado e doutorado embora possa tambem, ser utilizado por alunos dos
u
ltimos anos de graduacao.
O Captulo 1 descreve o modelo classico de regressao e o Captulo 2 trata
dos modelos lineares generalizados. Tecnicas de diagnostico nesses modelos
sao descritas no Captulo 3. Os principais modelos lineares generalizados e
algumas de suas extensoes sao apresentados no Captulo 4. Outros modelos de regressao importantes como o modelo normal nao-linear, os modelos
heterocedasticos e autocorrelacionados sao tratados no Captulo 5.
Finalmente, no Captulo 6, apresentam-se analises de dados reais atraves
dos sistemas S-PLUS e GLIM.
Agradecemos ao Oscar P. da Silva Neto pelo trabalho de preparac
ao dos
originais.
Conte
udo
1 Modelo Cl
assico de Regress
ao
1.1
Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2
Estimacao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3
Somas de Quadrados . . . . . . . . . . . . . . . . . . . . . . . .
1.4
1.5
Modelo Normal-Linear . . . . . . . . . . . . . . . . . . . . . . .
10
1.6
Analise de Variancia . . . . . . . . . . . . . . . . . . . . . . . .
11
1.7
. . . . . . . . . . . . . . . .
15
1.8
16
1.9
Tecnicas de Diagnostico . . . . . . . . . . . . . . . . . . . . . .
19
1.9.1
Matriz de projec
ao . . . . . . . . . . . . . . . . . . . . .
20
1.9.2
Resduos . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.9.3
Influencia . . . . . . . . . . . . . . . . . . . . . . . . . .
23
1.9.4
Tecnicas graficas . . . . . . . . . . . . . . . . . . . . . .
25
29
1.11 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
35
iii
2.1
Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
2.2
36
2.2.1
Formulacao do modelo . . . . . . . . . . . . . . . . . . .
36
As Componentes de um MLG . . . . . . . . . . . . . . . . . . .
37
2.3.1
Componente aleatoria . . . . . . . . . . . . . . . . . . .
37
2.3.2
40
2.3.3
41
2.3.4
A matriz modelo . . . . . . . . . . . . . . . . . . . . . .
41
2.4
O Algoritmo de Estimac
ao . . . . . . . . . . . . . . . . . . . . .
43
2.5
Adequacao do Modelo . . . . . . . . . . . . . . . . . . . . . . .
47
2.6
Predicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
48
2.7
48
2.7.1
A funcao desvio . . . . . . . . . . . . . . . . . . . . . . .
48
2.7.2
50
2.7.3
A analise do desvio . . . . . . . . . . . . . . . . . . . . .
50
Modelo Binomial . . . . . . . . . . . . . . . . . . . . . . . . . .
52
2.8.1
Momentos e cumulantes . . . . . . . . . . . . . . . . . .
53
2.8.2
53
2.8.3
Funcoes de ligac
ao apropriadas . . . . . . . . . . . . . .
54
2.8.4
A funcao de verossimilhanca
. . . . . . . . . . . . . . .
60
2.8.5
61
2.8.6
A funcao desvio . . . . . . . . . . . . . . . . . . . . . . .
61
Modelo de Poisson . . . . . . . . . . . . . . . . . . . . . . . . .
62
2.9.1
A distribuic
ao de Poisson . . . . . . . . . . . . . . . . .
62
2.9.2
63
2.3
2.8
2.9
iv
2.9.3
A Funcao de ligac
ao . . . . . . . . . . . . . . . . . . . .
63
2.9.4
64
2.9.5
O parametro de dispersao . . . . . . . . . . . . . . . . .
65
2.9.6
A distribuic
ao multinomial e a Poisson . . . . . . . . . .
65
66
67
67
2.11.1 A distribuic
ao gama . . . . . . . . . . . . . . . . . . . .
68
69
2.11.3 O desvio . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
70
71
72
. . . . . . . . . . . . . . . . . . . .
72
72
2.13 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
73
3 An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
77
3.1
3.2
Resduos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
3.1.1
Resduo de Pearson
. . . . . . . . . . . . . . . . . . . .
77
3.1.2
Resduo de Anscombe . . . . . . . . . . . . . . . . . . .
78
3.1.3
Desvio residual . . . . . . . . . . . . . . . . . . . . . . .
79
3.1.4
79
82
3.2.1
83
v
3.2.2
Situacoes assint
oticas . . . . . . . . . . . . . . . . . . .
85
3.2.3
85
Verificacao da Distribuic
ao dos Resduos . . . . . . . . . . . . .
87
3.3.1
Teste de normalidade . . . . . . . . . . . . . . . . . . .
87
3.3.2
Erro de classificac
ao na distribuic
ao dos dados . . . . .
90
3.4
92
3.5
Verificando a Nao-Linearidade em
um Sub-Conjunto de Vari
aveis Explicativas . . . . . . . . . . .
93
3.6
95
3.7
95
3.8
97
3.8.1
Medidas de alavancagem . . . . . . . . . . . . . . . . . .
97
3.8.2
Medidas de influencia . . . . . . . . . . . . . . . . . . .
98
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
3.3
3.9
101
4.1
4.2
4.3
4.2.1
4.2.2
4.3.2
4.3.3
Testes de adequac
ao . . . . . . . . . . . . . . . . . . . . 112
4.3.4
Testes de comparac
ao entre modelos . . . . . . . . . . . 113
vi
4.4
4.5
4.4.2
Parametros na func
ao de vari
ancia . . . . . . . . . . . . 118
4.5.2
Parametros na func
ao de ligac
ao . . . . . . . . . . . . . 119
4.5.3
4.6
. . . . . . . . . . . . . . . . . . . . . . . 122
4.7
4.8
4.9
153
5.1
5.2
5.3
5.3.2
Resultados assint
oticos . . . . . . . . . . . . . . . . . . . 161
vii
5.3.3
5.3.4
5.3.5
Grafico da Vari
avel Adicionada . . . . . . . . . . . . . . 167
5.4
5.5
5.6
Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174
6 An
alise de Dados Reais atrav
es dos Sistemas GLIM e S-Plus177
6.1
6.2
Sistema de Avaliac
ao - Uma Introduc
ao . . . . . . . . . . . . . 178
6.3
6.4
6.5
6.6
6.7
6.8
Uma seq
uencia tpica de diretivas . . . . . . . . . . . . . . . . . 203
6.9
Captulo 1
Modelo Cl
assico de Regress
ao
1.1
Introduc
ao
A analise de dados atraves da regressao linear e uma das tecnicas mais usadas
de estimacao, existindo uma ampla literatura sobre o assunto. Os seguintes
livros contem os principais topicos relacionados com regressao linear: Scheffe
(1959), Searle (1971), Rao (1973), Seber (1977), Arnold (1981), Draper e Smith
(1981), Cook e Weisberg (1982), Montgomery e Peck (1982), Weisberg (1985)
e Wetherill et al. (1986). O principal objetivo deste captulo e apresentar
alguns conceitos basicos de regressao linear que visam a facilitar a compreensao
dos captulos seguintes, onde serao apresentados modelos de regressao mais
amplos.
O modelo classico de regressao teve origem nos trabalhos de astronomia
a tecnica mais adequada
elaborados por Gauss no perodo de 1809 a 1821. E
quando se deseja estudar o comportamento de uma vari
avel dependente y
(variavel resposta) em relac
ao a outras vari
aveis independentes (vari
aveis explicativas) que sao responsaveis pela variabilidade da vari
avel resposta. O
modelo classico de regressao e definido por:
i) respostas yi independentes (ou pelo menos nao correlacionadas) para
i = 1, . . . , n, cada yi tendo uma distribuic
ao especificada de media i =
1
MODELOS PARAMETRICOS
2
E(yi ) e variancia 2 constante;
1.2
Estimac
ao
Modelo Cl
assico de Regress
ao
(1.2)
X
SQE()
=2
xir (yi i ) = 0,
r
(1.3)
i=1
(1.4)
(1.5)
MODELOS PARAMETRICOS
.
No caso da matriz A = X T X ser singular, ou seja, algumas das equac
oes
normais dependem de outras equac
oes de modo que ha menos de p equac
oes
independentes para estimar os p par
ametros 1 , . . . , p , o sistema (1.3) admitira uma infinidade de solucoes. Entretanto, se o mesmo for consistente (se
existem matrizes A tais que = A y e uma soluc
existir ),
ao de (1.3).
As matrizes A dependem somente de X T X e em geral nao sao u
nicas, exT
ceto quando X X for nao-singular. Tais matrizes sao chamadas de inversas
generalizadas.
No metodo de estimacao de Huber (1973), citado anteriormente, a miniP
mizacao de i (i ) em relacao a produz o sistema de p equac
oes nao-lineares
n
X
(1.6)
i=1
(1) ()
em que
= ()/. Se a func
ao () e quadratica, o EMQ (1.4) segue
diretamente de (1.6).
Exemplo 1.1: Regress
ao Linear Simples.
Considere uma u
nica vari
avel explicativa x para representar o comportamento de uma variavel resposta y cuja media e dada pela equac
ao linear
E(y) = = 0 + 1 (x x
). Pode-se estimar o vetor = (0 , 1 )T a partir da
equacao (1.4), obtendo-se o EMQ de como
1
P
P
n
(x
)
y
i
i
i
i
= P
P
P
2
(x
)
(x
)
(x
)y
i
i
i
i
i
i
i
0
1
P
x)yi
Pi (xi
x)2
i (xi
Modelo Cl
assico de Regress
ao
Tax
9.0
9.0
9.0
7.5
8.0
10.0
8.0
8.0
8.0
7.0
8.0
7.5
7.0
7.0
7.0
7.0
7.0
7.0
7.0
8.5
7.0
8.0
9.0
9.0
Ren
3571
4092
3865
4870
4399
5342
5319
5126
4447
4512
4391
5126
4817
4207
4332
4318
4206
3718
4716
4341
4593
4983
4897
4258
Rod
1976
1250
1586
2351
431
1333
11868
2138
8577
8507
5939
14186
6930
6580
8159
10340
8508
4725
5915
6010
7834
602
2449
4686
Lic
52.5
57.2
58.0
52.9
54.4
57.1
45.1
55.3
52.9
55.2
53.0
52.5
57.4
54.5
60.8
58.6
57.2
54.0
72.4
67.7
66.3
60.2
51.1
51.7
Con
460
566
577
631
574
534
571
554
577
628
487
644
640
704
648
968
587
699
632
591
782
510
610
524
Tax
8.5
9.0
8.0
7.5
8.0
9.0
7.0
7.0
8.0
7.5
8.0
6.5
5.0
7.0
8.5
7.0
7.0
7.0
7.0
7.0
6.0
9.0
7.0
7.0
Ren
4574
3721
3448
3846
4188
3601
3640
3333
3063
3357
3528
3802
4045
3897
3635
4345
4449
3656
4300
3745
5215
4476
4296
5002
Rod Lic
2619 55.1
4746 54.4
5399 54.8
9061 57.9
5975 56.3
4650 49.3
6905 51.8
6594 51.3
6524 57.8
4121 54.7
3495 48.7
7834 62.9
17782 56.6
6385 58.6
3274 66.3
3905 67.2
4639 62.6
3985 56.3
3635 60.3
2611 50.8
2302 67.2
3942 57.1
4083 62.3
9794 59.3
MODELOS PARAMETRICOS
1.3
Somas de Quadrados
O valor mnimo da soma de quadrados dos erros e denominado soma de quadrados dos resduos (SQR), pois mede a discrepancia entre o vetor de observac
oes
Assim, SQR
y e o vetor de valores ajustados (ou medias ajustadas)
= X .
e expresso por
= (y X )
T (y X ).
SQR = SQE()
(1.7)
r =y
= y X .
(1.8)
Tem-se r = y Hy = (I H)y, onde I representa a matriz identidade
facil verificar que o vetor de resduos r e o vetor
de ordem n. E
de valores
ajustados sao ortogonais. Com efeito,
rT
= y T (I H)T Hy = 0,
pois H e simetrica e idempotente. Temos, ainda, rT r = (y
)T (y
) =
T
T
T
T
y (I H) (I H)y = y y
e, portanto,
yT y =
T
+ rT r.
(1.9)
Modelo Cl
assico de Regress
ao
1.4
b) Covariancia do EMQ .
A matriz de covariancia do EMQ e obtida de
= E{[ E()][
E()]
T } = E{[ ][ ]T }.
Cov()
= , temos
Usando (1.5) e o fato de que E()
= E{(X T X)1 X T T X(X T X)1 }
Cov()
= (X T X)1 X T E(T )X(X T X)1 .
MODELOS PARAMETRICOS
= E(T ) = 2 I, obtem-se
Finalmente, como Cov()
= 2 (X T X)1 .
Cov()
(1.10)
Assim, a matriz inversa (X T X)1 usada para estimar em (1.4) determina a matriz de covari
ancia de em (1.10), exceto pelo multiplicador
2
. Os elementos da diagonal da equac
ao (1.10) sao as vari
ancias das
estimativas de mnimos quadrados dos parametros em e, portanto,
representam a precisao destas estimativas.
c) Covariancia do vetor
.
A estrutura de covariancia do vetor
das medias ajustadas segue diretamente da equacao (1.10). Temos,
T = 2 X(X T X)1 X T = 2 H.
Cov(
) = XCov()X
Assim, a matriz de projec
ao H representa, exceto pelo escalar 2 , a matriz de covariancia de
. Logo, Cov(
i ,
j ) = 2 hij , onde hij e o elemento
(i, j) da matriz H. As propriedades desta matriz serao detalhadas na
Secao 1.9.1.
d) Estimacao de 2 .
Para determinar as covari
ancias de e
torna-se necessario estimar a
2
variancia dos erros. Para isso usamos o teorema do valor esperado
de uma forma quadratica: Se y e um vetor de media e matriz de
covari
ancia V , ent
ao: E( y T Ay) = tr(AV )+E( T A), igualdade v
alida
para qualquer matriz quadrada A. Logo, de (1.7) e r = (I H)y, obtem-se
SQR = y T (I H)y
e, portanto,
E(SQR) = 2 tr(I H) + T X T (I H)X.
Como (I H)X = 0 e (I H) e uma matriz simetrica e idempotente,
o traco de (I H) iguala ao seu posto n p, implicando E(SQR) =
Modelo Cl
assico de Regress
ao
2 =
T (y X )
(y X )
.
(n p)
(1.11)
e r s
ao ortogonais, ou seja,
MODELOS PARAMETRICOS
10
T r = y T H T (I H)y = y T (H H)y = 0,
pois a matriz de projec
ao H e simetrica e idempotente.
1.5
Modelo Normal-Linear
11
Modelo Cl
assico de Regress
ao
(1.12)
1.6
An
alise de Vari
ancia
(1.13)
O termo do lado esquerdo de (1.13) e a soma dos quadrados das observacoes em relacao ao seu valor medio e representa uma medida da variabilP
idade total dos dados. Esta soma sera denotada por SQT = i (yi y)2 . O
primeiro termo do lado direito de (1.13) e a soma dos quadrados explicada
P
pelo modelo de regressao, sendo denotada por SQE = i (
y)2 , enquanto
P i
o segundo termo e a soma de quadrados residual SQR = i (yi
i )2 , que nao
e explicada pelo modelo de regressao. O modelo sera tanto melhor ajustado
quanto maior for a variacao explicada SQE em relac
ao `a variac
ao total SQT.
A deducao da equacao (1.13) decorre elevando-se ao quadrado os termos da
MODELOS PARAMETRICOS
12
igualdade yi y = (
i y) + (yi
i ) e somando-se sobre as observac
oes.
Tem-se,
X
X
X
X
(
i y)(yi
i ).
(yi
i )2 + 2
(
i y)2 +
(yi y)2 =
i
= y1T Hy y1T y = 0,
pois 1T H = 1T quando a matriz modelo X tem uma coluna de uns correspondente ao intercepto.
P
i y)2 e nao-explicada
As somas de quadrados explicada SQE = i (
P
i )2 pela regressao podem ser escritas em notac
ao matricial
SQR = i (yi
T
como: SQE = X T y n
y 2 e SQR = y T (I H)y. Pode-se medir a adequac
ao
do ajuste do modelo comparando a soma de quadrados residual SQR (que se
espera seja pequena) com a soma de quadrados devida `a regressao SQE. Ou,
alternativamente, comparando SQE com a soma de quadrados total SQT =
y T y n
y 2 . A razao desses dois termos e representada por
R2 =
SQE
T X T y n
y2
=
.
SQT
y T y n
y2
(1.14)
13
Modelo Cl
assico de Regress
ao
Soma de Quadrados
T
Regressao SQE = X yn
y
Residual
Total
SQR = y T (I H)y
T
SQT = y yn
y
GL
Media de Quadrados
Estatstica
p1
M QE = SQE/(p1)
F = M QE/M QR
np M QR = SQR/(np)
n1
(1.15)
MODELOS PARAMETRICOS
14
Coef
374.7
-34.52
-0.06653
-0.002399
13.367
S = 66.38
StDev
185.7
12.97
0.01724
0.003394
1.927
R-Sq = 67.8%
T
2.02
-2.66
-3.86
-0.71
6.94
P
0.050
0.011
0.000
0.483
0.000
R-Sq(adj) = 64.8%
Analysis of Variance
Source
Regression
Error
Total
DF
4
43
47
SS
398906
189461
588366
MS
99726
4406
F
22.63
P
0.000
Modelo Cl
assico de Regress
ao
1.7
15
Selec
ao das Vari
aveis Explicativas
Depois do ajustamento preliminar de um modelo de regressao, temos interesse em selecionar as variaveis explicativas que podem ser eliminadas do modelo, objetivando obter um modelo parcimonioso para explicar os dados em
questao. O teste F da analise de vari
ancia permite apenas inferir que algumas
das variaveis explicativas sao realmente importantes para explicar a variabilidade da variavel resposta. Para selecionarmos as vari
aveis independentes que
sao significativas, precisamos determinar a distribuic
ao das estimativas dos
2
parametros e do modelo normal-linear.
Neste modelo, a estimativa de mnimos quadrados r tem distribuic
ao normal N (r , 2 vrr ), onde vrr e o elemento (r, r) da diagonal da matriz (X T X)1 .
Como e independente de
2 e a distribuic
ao de
2 e (n p)1 2 2np , a estatstica teste Tr definida por
r r
Tr =
,
(1.16)
vrr
padrao, isto e,
vrr . Se este quociente for inferior ao valor crtico tnp () da
distribuicao tnp de Student com n p graus de liberdade, a vari
avel independente xr nao e significativa para explicar a variabilidade da resposta e podera
ser eliminada do modelo; caso contr
ario, xr e estatisticamente significante
para explicar o comportamento da vari
avel resposta. Da Tabela 1.3, verificamos facilmente que a estatstica Tr (= Coef /StDev) so nao e significativa
para a variavel independente Rodov (| Tr |= 0.71 < t43 (5%) = 2.02). Assim,
podemos reajustar o modelo de regressao (1.15) `a vari
avel dependente Cons
excluindo a variavel Rodov, pois a malha rodovi
aria estadual do estado americano nao influi significativamente no consumo de combustvel de seus habitantes. Reajustando o modelo de regressao (1.15) sem a vari
avel explicativa
Rodov obtem-se a equacao da primeira regressao descrita na Tabela 1.4. Nesta
equacao, apenas a estimativa do intercepto (Constant) nao e significativa, pois
sua estatstica Tr satisfaz | Tr |= 1.95 < t44 (5%) = 2.02. Assim, reajustou-se
um novo modelo de regressao sem o termo constante, obtendo-se a segunda
16
MODELOS PARAMETRICOS
regressao descrita nesta tabela. Neste novo modelo sem intercepto, contendo
apenas as variaveis explicativas T axa, Rend e Licen, verifica-se que a vari
avel
T axa pode ser excluda da regressao, pois | Tr |= 1.91 < t45 (5%) = 2.01.
Finalmente, a terceira regressao da Tabela 1.4, mostra que as vari
aveis independentes Rend e Licen sao significativas para explicar a variabilidade do
consumo de combustvel per-capita por ano nos estados americanos.
A equacao ajustada E(Con) = 0.07035Rend + 15.344Lic revela que o
consumo de combustvel per-capita aumenta (como esperado) com o aumento
do percentual da populacao que esta habilitada a dirigir. Por exemplo, um
incremento de 10% no percentual de motoristas habilitados provocaria um
aumento medio de 153.44 galoes no consumo per-capita anual dos habitantes
de qualquer estado americano. Entretanto, nesta equac
ao, a vari
avel Rend
aparece ajustada com sinal negativo, o que pode parecer contradit
orio que
o consumo per-capita decresca com o aumento da renda. Uma possvel explicacao para este fato e que as pessoas com rendas muito altas realmente
consomem menos combustvel, pois procuram usar outros meios de transporte como avioes e trens para percorrer grandes distancias. Observa-se que a
u
ltima regressao contempla o maior valor da estatstica F entre as regressoes
ajustadas, no caso F = 1668.93 e, ent
ao, a media de quadrados explicada pela
regressao e cerca de 1669 vezes maior do que a media de quadrados residual.
1.8
Intervalos e Regi
oes de Confianca
Intervalos de confianca para coeficientes individuais de ou regioes de confianca para subconjuntos e combinac
oes lineares das componentes de podem
ser obtidos, respectivamente, utilizando os elementos da matriz (X T X)1 .
Da estatstica pivotal definida em (1.16), podemos construir um intervalo de
100(1-)% de confianca para o verdadeiro valor r a partir de
r
vrr tnp (/2).
(1.17)
Os sinais menos e mais correspondem aos limites inferior e superior do
17
Modelo Cl
assico de Regress
ao
Coef
305.5
-29.28
-0.06796
13.747
StDev
156.9
10.58
0.01703
1.839
S = 66.00
R-Sq = 67.4%
Analysis of Variance
Source
DF
SS
Regression
3
396705
Error
44
191662
Total
47
588366
T
1.95
-2.77
-3.99
7.47
P
0.058
0.008
0.000
0.000
R-Sq(adj) = 65.2%
MS
132235
4356
F
30.36
P
0.000
Regression Analysis
The regression equation is
Cons = - 15.2 Taxa - 0.0575 Rend + 16.4 Licen
Predictor
Noconstant
Taxa
Rend
Licen
Coef
StDev
-15.172
-0.05751
16.410
7.939
0.01665
1.267
-1.91
-3.45
12.95
0.062
0.001
0.000
S = 68.01
Analysis of Variance
Source
DF
SS
Regression
3
16348097
Error
45
208170
Total
48
16556267
MS
5449366
4626
F
1177.99
P
0.000
Coef
StDev
-0.07035
15.344
0.01567
1.170
-4.49
13.11
0.000
0.000
S = 69.95
Analysis of Variance
Source
DF
SS
Regression
2
16331202
Error
46
225065
MS
8165601
4893
F
1668.93
P
0.000
18
MODELOS PARAMETRICOS
1/2
cT
tnp (/2) 1 + cT (X T X)1 c
. Estes intervalos para as observac
oes
estimadas sao geralmente denominados intervalos de toler
ancia.
Finalmente, podemos obter uma regiao de confianca para todos os
parametros em a partir dos resultados descritos nos itens ii) e iv) da Sec
ao
1.5. Com efeito, a inequacao matricial
T X( )
p
( )X
2 Fp,np (),
(1.19)
19
Modelo Cl
assico de Regress
ao
1.1. Tem-se,
(X T X)1 =
1/n
0
0
P
1
x)2
i (xi
ancia para a
P
1/2 tn2 (/2). Se desejarmos um intervalo de toler
{ i (xi x)2 }
variavel resposta quando a vari
avel explicativa e igual a x+ , obteremos
s
1
(x+ x
)2
0 + 1 (x+ x
)
tnp (/2) 1 + + P
.
)2
n
i (xi x
Da terceira regressao descrita na Tabela 1.4, calculamos agora os limites de confianca para os coeficientes das vari
aveis Rend e Licen. Da
formula (1.17), obtemos os seguintes intervalos, ao nvel de significancia de
5% em que t46 (0.025) = 2.01: para a vari
avel Rend, 0.07035 0.01567 x
2.01 = (0.102, 0.039) e para a vari
avel Licen, 15.344 1.170 x 2.01 =
(12.922, 17.696). Entao, podemos dizer que, com 95% de confianca, os coeficientes verdadeiros de Rend e Licen pertencem aos intervalos (0.102, 0.039)
e (12.922, 17.696), respectivamente.
1.9
T
ecnicas de Diagn
ostico
MODELOS PARAMETRICOS
20
1.9.1
Matriz de projec
ao
21
Modelo Cl
assico de Regress
ao
1.9.2
Resduos
(1 hii )
(1.20)
e que E(ri ) = 0, Var(ri ) = 1 e Cov(ri , rj ) = hij / {(1 hii )(1 hjj )}1/2
para i 6= j.
Para contornar a dependencia entre ri e
2 , podemos estimar 2
eliminando-se a observacao yi do modelo de regressao. Assim, seja (i) o
EMQ de obtido quando eliminamos a observac
ao yi ,
(i) = xTi (i) a media
2 o estimador n
preditiva correspondente, e
(i)
ao-viesado da vari
ancia supondo
que a observacao yi nao esta presente no ajustamento do modelo. Como yi e
MODELOS PARAMETRICOS
22
yi
(i)
n
o1/2 .
T
T
1
(1.21)
(i)
=
(n p)
2 ri2 /(1 hii )
.
(n p 1)
(1.22)
hii ri
1hii .
Assim, obtemos
ti =
y
i
r
pi
= i.
(i)
(i) (1 hii )
23
Modelo Cl
assico de Regress
ao
padronizados, ou seja,
s
ti =
np1
r .
n p ri2 i
(1.24)
1.9.3
Influ
encia
T X T X((i) )
((i) )
.
p
2
(1.25)
MODELOS PARAMETRICOS
24
hii
r2 .
p(1 hii ) i
(1.26)
25
Modelo Cl
assico de Regress
ao
DF F IT Si = ti
hii
p(1 hii )
1/2
.
(1.27)
1.9.4
T
ecnicas gr
aficas
i e
b) um grafico dos resduos padronizados ri versus os valores ajustados
um grafico de probabilidade dos resduos padronizados ordenados versus
os quantis
c
ao normal reduzida. Estes quantis sao definidos
da distribui
i3/8
1
1
por
e a func
ao de distribuic
ao acumulada
n+1/4 , onde (.)
da normal reduzida. No primeiro grafico dos resduos padronizados, os
pontos devem estar aleatoriamente distribudos entre as duas retas y =
2 e y = 2 paralelas ao eixo horizontal, sem exibir uma forma definida.
Se neste grafico os pontos exibirem algum padrao, isto pode ser indicativo
26
MODELOS PARAMETRICOS
de heterocedasticidade da vari
ancia dos erros ou da nao-linearidade dos
efeitos das variaveis explicativas nas medias das observac
oes. No segundo
grafico, se os pontos ficarem praticamente dispostos sobre uma reta,
as observacoes podem ser consideradas como tendo, aproximadamente,
distribuicao normal;
c) graficos de hii , Di e DF F IT Si versus a ordem das observac
oes para
detectar as observacoes influentes.
27
Modelo Cl
assico de Regress
ao
Standardized Residual
4
3
2
1
0
-1
-2
5
10
15
20
25
30
35
40
45
Observation Order
Standardized Residual
4
3
2
1
0
-1
-2
300
400
500
600
700
800
Fitted Value
Standardized Residual
4
3
2
1
0
-1
-2
-2
-1
Normal Score
MODELOS PARAMETRICOS
28
Hii
0.2
0.1
0.0
0
10
20
30
40
50
40
50
40
50
Observ.
COOK
0.3
0.2
0.1
0.0
0
10
20
30
Observ.
1.0
DFFITS
0.5
0.0
-0.5
0
10
20
30
Observ.
29
Modelo Cl
assico de Regress
ao
1.10
Estimac
ao de M
axima Verossimilhanca
i=1
1
1
2
T
2
n log + 2 (y X) (y X) .
l(, ) =
2
MODELOS PARAMETRICOS
30
2 =
T (y X )
(y X )
.
n
(1.29)
r 2
4
i=1
i=1
n
2l
1
1 X
= 4 6
(yi xTi )2 .
( 2 )2
2
i=1
n
2l
1 X
2l
E
= 2
xir xis , E
=0
r s
r 2
i=1
n
2l
= 4.
E
( 2 )2
2
Logo, a matriz de informac
ao para e 2 pode ser escrita como
2 X T X
0
.
I(, 2 ) =
0
n/(2 4 )
Modelo Cl
assico de Regress
ao
31
2 (X T X)1
0
.
I(, 2 )1 =
0
2 4 /n
No caso, o resultado assint
otico e um resultado exato e a matriz I(, 2 )1
iguala `a estrutura de covariancia exata das estimativas de maxima verossim = 2 (X T X)1 , como visto em (1.10), e
ilhanca de e 2 , ou seja, Cov()
Var(
2 ) = 2 4 /n.
Da teoria de verossimilhanca, conclumos ainda que as estimativas e
2
tem distribuicoes assintoticas normais p-variada Np (, 2 (X T X)1 ) e univariada N ( 2 , 2 4 /n), respectivamente. No caso, o primeiro resultado e exato, e
ja tnhamos mostrado na Sec
ao 1.5 ii) que o EMQ (identico ao EMV) tem distribuicao normal p-variada de media e estrutura de covari
ancia 2 (X T X)1 .
A estrutura bloco-diagonal da matriz I(, 2 )1 implica que as EMV e
SQE()
1
1
T T
2
exp
2 ( ) X X( ) .
L(, ) =
2 2
2
(2)n/2 n
sao estatsticas sufiO criterio da fatorizacao implica que e SQE()
2
cientes para os parametros e , e e evidente que estas estatsticas sao sufi-
MODELOS PARAMETRICOS
32
cientes minimais. Embora n e X sejam necessarios para calcular a verossimilhanca, estas quantidades nao sao aleatorias e, portanto, nao sao partes integrantes das estatsticas suficientes.
1.11
Exerccios
(ii) SQE =
T H 3 y,
10
16
20
1295
1304
1300
1428
1456
1603
1535
1094.10
1180.15
1137.30
1714.80
1289.50
1401.50
1640.40
33
Modelo Cl
assico de Regress
ao
8.93
10.80
18.59
22.33
39.35
56.11
61.72
64.62
TEMPO
9.00
14.00
21.00
28.00
42.99
57.00
63.00
70.00
AREA
67.00
TEMPO
79.00
x1
41.2
48.6
42.6
39.0
34.7
44.5
39.1
40.1
45.9
x2
41.2
10.6
10.6
10.4
9.3
10.8
10.7
10.0
12.0
x3
31.9
13.2
28.7
26.5
8.5
24.3
18.6
20.4
15.2
167.1
174.4
162.0
140.8
179.8
163.7
174.5
185.7
160.6
MODELOS PARAMETRICOS
34
0 1 0 0
.
C=
0 0 0 1
Formar a tabela ANOVA e testar as hipoteses H : 1 = 2 = 3 =
0, H 0 : C = 0 e H 00 : 2 = 0 dado C = 0. Utilize = 0.01;
(ii) Para o ajuste do modelo y = 0 + 2 x2 + aos dados, calcular
R2 e
2 e comparar com os valores obtidos impondo-se o modelo
irrestrito corrente;
(iii) Fazer uma analise de diagnostico completo para o ajuste de (ii).
8. Suponha um modelo de regressao y = X + contendo 0 como intercepto e 1 o vetor n 1 de uns correspondente. Mostre que 1T H1 = n,
onde H e a matriz de projec
ao.
9. Suponha que tenhamos um modelo de regressao y = X + , onde os
parametros estao sujeitos a restricoes de igualdade do tipo C = d.
Mostre que a estimativa de mnimos quadrados (EMQ) de e dada por
Captulo 2
Modelos Lineares
Generalizados
2.1
Introduc
ao
MODELOS PARAMETRICOS
36
2.2
2.2.1
37
2.3
As Componentes de um MLG
De uma forma geral, a estrutura de um MLG e formada por tres partes: uma
componente aleat
oria composta de uma vari
avel aleatoria Y com n observac
oes
independentes, um vetor de medias e uma distribuic
ao pertencente `a famlia
exponencial; uma componente sistem
atica composta por vari
aveis explicativas
x1 , . . . , xp tais que produzem um preditor linear ; e uma func
ao monotonica
diferenciavel, conhecida como funca
o de ligac
ao, que relaciona estas duas componentes.
2.3.1
Componente aleat
oria
[y b()]
fY (y; , ) = exp
+ c(y, ) ,
(2.1)
a()
onde a(), b() e c() sao func
oes conhecidas; > 0 e denominado par
ametro de
dispers
ao e e denominado par
ametro can
onico que caracteriza a distribuic
ao
em (2.1). Se e conhecido, a equac
ao (2.1) representa a famlia exponencial
uniparametrica indexada por .
Assim, para a distribuicao normal, temos
1
(y )2
fY (y; , ) =
exp
2 2
2 2
= exp
(y 2 /2) 1
2
2
2
2
y2
2
+ log(2 )
,
2
n 2
o
e c(y, ) = 21 y + log(2) .
MODELOS PARAMETRICOS
38
2l
2
+E
2
= 0.
(2.3)
y b()
+ c(y, ).
a()
Logo,
l
y b0 ()
=
a()
(2.4)
2l
b00 ()
.
=
2
a ()
(2.5)
b0 ()
a()
= 0 de modo que
E(Y )= = b0 ().
(2.6)
b00 () Var(Y )
+
= 0.
a ()
a ()2
Logo,
Var(Y ) = a()b00 ().
(2.7)
39
N (, 2 )
a()
2
b()
c(y, )
y2
2
2
()
V ()
exp()
(1+e )
(1 )
{log(2)}/2
B(m,)
m
P ()
1
m
log(1 + e )
log y!
m
G(, )
log()
log(y) log y
exp()
log my
log ()
N (, )
(2)
1
2
1
2y
{log(2y 3 )}/2
(2) 2
MODELOS PARAMETRICOS
40
2.3.2
A componente sistem
atica e a func
ao de ligac
ao
i = 1, . . . , n
41
2.3.3
= ;
Poisson
= log ;
binomial
= log{/(1 )};
gama
= 1 ;
normal inversa
= 2 .
2.3.4
A matriz modelo
MODELOS PARAMETRICOS
42
1, se ocorre o nvel i
ui =
0, caso contr
ario
como
A = 1 u1 + 2 u2 + . . . + k uk ,
onde i = valor do i-esimo nvel.
Termo de Interacao Misto
Um termo de interacao entre os fatores pode ser includo no modelo. Em
experimentos fatoriais, onde existe apenas uma observac
ao para cada combinacao dos nveis dos fatores, se sao colocadas todas as interac
oes, tem-se o
modelo saturado. No caso de duas vari
aveis contnuas, a interac
ao e obtida
pela inclusao do termo 12 x1 x2 . Se as vari
aveis sao fatores, utiliza-se ()ij .
Alem disso, pode-se ajustar uma componente que represente o efeito simultaneo de um fator e uma vari
avel contnua. Em um modelo com o fator A
e a covariavel X, definidos anteriormente, ajusta-se o termo j X ao inves de
X.
Notacao Utilizada nos MLGs
Wilkinson e Rogers (1973) apresentam uma notac
ao adequada que pode
ser utilizada tambem em programas de computadores. Nesta notac
ao, as
primeiras letras do alfabeto A, B, C, . . . representam os fatores, enquanto que
43
as u
ltimas X, Y, Z, . . . sao utilizadas para as covari
aveis. Esta notac
ao e resumida na Tabela 2.2
2.4
Tipo do Termo
Formula Algebrica
Formula do Modelo
Covariavel
Fator
Misto
i x
A.X
Composto
()ij
A.B
Misto-Composto
ij x
A.B.X
O Algoritmo de Estimac
ao
l()
,
MODELOS PARAMETRICOS
44
l()
U ()
K = E
= E
.
j s
i
U ()(m) h (m+1)
(m) = 0
"
(m+1)
(m)
U ()(m)
#1
U ( (m) ),
i=1
i=1
X
1 X
{yi i b(i )} +
c(yi , ).
a()
n
i
l()
1 X
=
.
yi b0 (i )
a()
i=1
45
Calculando
i
i i i
=
i i
pela regra da cadeia e utilizando as equac
oes (2.6), (2.7) e (2.8), obtemos
i = b0 (i ) e V (i ) = b00 (i ) =
i
.
i
l()
1
1 X
U () =
yi b0 (i )
=
xi .
a()
V (i )g 0 (i )
i=1
1
X T W X,
a()
(2.9)
46
MODELOS PARAMETRICOS
g(i )
.
zi = (yi i )
i
Utilizando estes dois resultados, o algoritmo escore de Fisher para calcular
a estimativa de maxima verossimilhanca (EMV) de e expresso por
(m+1) = (m) + (X T W (m) X)1 X T W (m) z (m) .
Colocando (X T W (m) X)1 em evidencia tem-se, finalmente,
(m+1) = (X T W (m) X)1 X T W (m) y (m) ,
(2.10)
47
2.5
Adequac
ao do Modelo
n
X
i=1
onde = (1 , . . . , n )T e y = (y1 , . . . , yn )T .
Uma medida da bondade do ajuste conhecida como desvio escalonado, que
sera abordada mais adiante, e definida como
D (y; ) = 2l(y; y) 2l(; y).
Note-se que, para os modelos exponenciais, l(y; y) representa a maxima
verossimilhanca de um ajuste exato, no qual os valores ajustados sao iguais aos
valores observados (modelo saturado). Assim, como l(y; y) nao depende dos
parametros de interesse, maximizar a log-verossimilhanca l(; y) e equivalente
a minimizar o desvio escalonado D (y; ) com relac
ao a , sujeito `as restric
oes
MODELOS PARAMETRICOS
48
impostas pelo modelo. Por exemplo, para o modelo normal de regressao com
variancia 2 , temos para uma u
nica observac
ao
1
(y )2
2
fY (y; , ) =
,
exp
2 2
2
de modo que a log-verossimilhanca e dada por
1
(y )2
l(; y) = log(2 2 )
.
2
2 2
Obtem-se, entao, a log-verossimilhanca do modelo saturado fazendo = y.
Logo,
n
l(y; y) = log(2 2 ).
2
Entao, o desvio escalonado para o modelo normal iguala
P
(yi i )2
2.6
Predic
ao
A predicao no contexto dos MLGs deve ser interpretada como uma pergunta
do tipo o que... se... ?, ao contr
ario do contexto de series temporais onde o
importante salientar que as quanvalor predito esta indexado pelo tempo. E
tidades preditas devem estar sempre acompanhadas por medidas de precisao
e que o modelo utilizado esteja correto. Para um estudo mais detalhado sobre
predicoes, analise de variancia e varios tipos de padronizac
oes, vide Lane e
Nelder (1982).
2.7
2.7.1
Medidas de Discrep
ancia ou Bondade de Ajuste
A func
ao desvio
49
log-verossimilhancas maximizadas.
Sabemos que, dado n observac
oes, podemos construir modelos com ate n
parametros. Porem, o modelo mais simples, chamado de modelo nulo, contem
apenas um parametro que representa a media comum a todas as observac
oes
ys. O modelo nulo aloca toda a variac
ao entre os ys para a componente
aleatoria. Por outro lado, o modelo saturado contem n parametros, um para
cada observacao. No modelo saturado toda a variac
ao dos ys e alocada para
a componente sistematica.
Assim, na pratica, o modelo nulo e muito simples enquanto o modelo
saturado e nao-informativo. Porem, o modelo saturado e u
til para medir a
discrepancia de um modelo intermedi
ario (em investigac
ao) com p par
ametros
(p < n).
Seja y = (y1 , . . . , yn )T uma amostra aleatoria com distribuic
ao pertencente
b
e
`a famlia exponencial (2.1). Sejam = (b
) e = (y) as estimativas dos
parametros canonicos para o modelo em investigac
ao e o modelo saturado,
respectivamente. Seja
b
lp =
n
X
l(bi , ; yi ) =
i=1
n
X
{[yi bi b(bi )]/ai () + c(yi , )},
i=1
n
X
l(ei , ; yi ) =
i=1
n
X
{[yi ei b(ei )]/ai () + c(yi , )}
i=1
n
X
i=1
onde
D = D(y; ) = 2
n
X
i=1
MODELOS PARAMETRICOS
50
2.7.2
n
X
(yi
i )2 /V (
i ),
i=1
2.7.3
A an
alise do desvio
A an
alise do desvio e uma generalizac
ao da analise de vari
ancia para os MLGs
visando obter, a partir de uma seq
uencia de modelos encaixados, isto e, cada
51
modelo incluindo mais termos que os anteriores, os efeitos de fatores, covariaveis e suas possveis interac
oes.
Dois modelos Mpr e Mps s
ao encaixados (Mpr Mps ) quando os termos
que formam Mps incluem todos os termos que compoem Mpr mais outros
termos que nao estao em Mpr .
Considere Mp1 Mp2 . . . Mpr uma seq
uencia de modelos encaixados
com respectivas dimensoes p1 < p2 < . . . < pr , matrizes Xp1 , Xp2 , . . . , Xpr ,
desvios Dp1 > Dp2 > . . . > Dpr , todos os modelos com a mesma distribuic
ao
e funcao de ligacao. Vale ressaltar que as desigualdades entre os desvios nao
sao validas para a estatstica de Pearson generalizada. Logo, a comparac
ao de
modelos encaixados e feita, exclusivamente, pela func
ao desvio.
As diferencas entre os desvios Dpi Dpj , pi < pj , devem ser interpretadas
como uma medida de variac
ao dos dados, sendo explicada pelos termos que
estao em Mpj e nao estao em Mpi . Se Dpi Dpj > 2pj pi , consideramos que
os termos que estao em Mpj e nao estao em Mpi sao significativos.
Para entender este procedimento, tem-se um exemplo de planejamento
com dois fatores A e B, com a e b nveis, respectivamente. Ajustam-se, sucessivamente, os modelos: 1 (modelo nulo), A, A + B, A + B + A.B (modelo
saturado). Na Tabela 2.3, apresenta-se a analise do desvio para esta seq
uencia
de modelos juntamente com a interpretac
ao dos termos.
g.l.
Desvio
Diferenca
g.l.
Termo
ab1
D1
a(b1)
DA
D1 DA
a1
A ignorando B
A+B
(a1)(b1)
DA+B
DADA+B
b1
B includo A
A+B +A.B
DA+B
(a1)(b1)
interacao A.B
includos A e B
MODELOS PARAMETRICOS
52
2.8
Modelo Binomial
(2.12)
m
P
i=1
Yi de
53
esta na
2.8.1
Momentos e cumulantes
(2.13)
(2.14)
2.8.2
Converg
encia para normal e Poisson
MODELOS PARAMETRICOS
54
variavel aleatoria padronizada
Sm m
Z=p
m(1 )
2.8.3
Fun
co
es de liga
c
ao apropriadas
p
X
j=1
j xj .
55
p
X
xij j ,
i = 1, . . . , n.
j=1
MODELOS PARAMETRICOS
56
limites.
1.00
0.90
0.70
-2
0.50
0.20
0.10
0.00
-4
-6
-8
-10
exp()
.
1 + exp()
57
2 1 ,
1/
1
1 + 12
< 1 ,
() =
(2.16)
1/
1/
2
1
1
1
+
+
1
2
2
1 ,
1
2
onde = X e o preditor linear que pode assumir qualquer valor real.
MODELOS PARAMETRICOS
58
Em situacoes onde e apropriado tratar sucesso e fracasso de forma assimetrica (Yates (1955) traz alguns exemplos), uma segunda famlia de transformacoes e proposta, sendo definida por
W () =
{(1 ) 1}
.
(2.17)
1/ (e > 1),
1 (1 + e )
(2.18)
() =
1,
caso contr
ario.
No contexto dos MLGs, Aranda-Ordaz (1981) sugere que a func
ao de
ligacao seja definida em termos das transformac
oes inversas (2.16) ou (2.18).
A famlia F e analisada graficamente, supondo os seguintes valores ar importante lembrar que T () = T () e que
bitrarios de : 0, 0,25 e 0,5. E
quando = 0 temos a ligacao logstica como um caso particular. Pela Figura
2.2, podemos observar que quando < 0,1 e > 0,8, T () cresce ou decresce
muito pouco, `a medida que assume valores mais distantes de 0. Entretanto,
para valores de 0,2 0,8, praticamente nao ha diferenca entre as ligac
oes
para os diversos s.
59
1.00
0.90
0.70
-2
0.50
0.20
0.10
0.00
-4
-6
-8
-10
10
1.00
0.90
0.70
0.50
0.20
0.10
0.00
-5
-10
-15
MODELOS PARAMETRICOS
60
assimetrica. Os valores arbitrarios de utilizados foram -0,5, 0,5 e 2,0. Observando a Figura 2.3 fica bastante claro que quando 0,1 nao existe diferenca
entre as ligacoes. Porem, para valores de 0,8, quanto maior o valor de
mais rapidamente log W () cresce. Para maiores detalhes sobre estas famlias
de ligacao, vide Aranda-Ordaz (1981).
2.8.4
A func
ao de verossimilhan
ca
n
X
i
l(; y) =
yi log
+ mi log(1 i ) .
(2.19)
1 i
i=1
O termo
log
mi
yi
p
X
xij j ,
i = 1, . . . , n.
j=1
p
X
xij j ,
i = 1, . . . , n.
j=1
p
p
n X
n
X
X
X
l(; y) =
yi xij j
mi log 1 + exp
xij j .
i=1 j=1
i=1
j=1
61
2.8.5
Estimac
ao dos par
ametros
2.8.6
A func
ao desvio
MODELOS PARAMETRICOS
62
onde
i = (
i ) =
i /mi . No modelo saturado, a EMV de i e obtida por
i = yi /mi .
Assim, a funcao desvio para o modelo binomial e expressa como
D(y;
) = 2l(
; y) 2l(
; y)
X
mi yi
= 2
yi log(yi /
i ) + (mi yi ) log
,
mi
i
i
onde i = mi i .
A variavel aleatoria D(y;
) e distribuda aproximadamente como 2np ,
onde p e o n
umero de parametros ajustados segundo o modelo em investigac
ao.
2.9
Modelo de Poisson
2.9.1
A distribuic
ao de Poisson
y
,
y!
y = 0, 1, 2, . . .
63
2.9.2
Fun
c
ao geratriz de momentos e cumulantes
r 1.
2.9.3
A Func
ao de liga
c
ao
MODELOS PARAMETRICOS
64
2.9.4
Fun
c
ao desvio e principais transforma
c
oes
n
X
(yi log i i ),
(2.20)
i=1
p
n X
X
{yi xij j exp(xij j )}.
i=1 j=1
= 2
n
X
{yi log(yi /
i ) (yi
i )}.
i=1
65
1/2
6
g(y) =
1/2
(2)1/2 +
;
y = 0.
6
Se Y P (), entao g(Y ) tem, aproximadamente, distribuic
ao normal padrao.
Alternativamente, Freeman e Tukey (1950) sugerem a vari
avel transformada
W = Y + Y + 1.
q
Alem disso, Anscombe (1948) propos utilizar 2 Y + 38 como alternativa para
melhorar a normalidade dos dados sob forma de contagens.
2.9.5
O par
ametro de dispers
ao
2.9.6
A distribuic
ao multinomial e a Poisson
MODELOS PARAMETRICOS
66
2.10
Modelo Normal
observacoes
func
ao de
normais independentes
ligac
ao
nas covari
aveis x1 , . . . , xp
(2.21)
2.10.1
67
Cumulantes e estimac
ao
t2 2
2
M (t; , ) = exp t +
2
sendo seus cumulantes r = 0 para r > 2. Outras caractersticas desta distribuicao sao: media, mediana e moda iguais a e coeficientes de assimetria
e curtose iguais a 0 e 3, respectivamente.
No modelo classico de regressao, a EMV de , que coincide com a de
mnimos quadrados, e dada em forma fechada por
= (X T X)1 X T y.
A funcao de verossimilhanca depende apenas dos dados atraves de e da soma
T (y X ).
Sabe-se ainda que
dos quadrados dos resduos SQR = (y X )
N (, 2 (X T X)1 ) e SQR 2 2np . Os testes estatsticos sao realizados
de forma exata atraves das estatsticas 2 , t de Student e F como descritos
no Captulo 1.
2.11
Modelo Gama
MODELOS PARAMETRICOS
68
2.11.1
A distribuic
ao gama
1
y
y
,
y > 0, > 0, > 0,
(2.22)
f (y; , ) =
exp
()
69
2.11.2
A func
ao de vari
ancia
2.11.3
O desvio
i (1 + log yi ),
i
MODELOS PARAMETRICOS
70
2.11.4
A func
ao de ligac
ao
71
2.11.5
Estimac
ao do par
ametro de dispers
ao
(2.23)
+ D)
D(6
,
6 + 2D
(2.24)
= D(y;
onde D
)/n.
Contudo, o principal problema de (2.23) e (2.24) e o fato de estarem
baseadas na funcao desvio, pois D(y;
) e igual a infinito quando alguma componente de y e zero. Alem disso, se a suposic
ao de distribuic
ao gama for falsa,
1/2
=
(yi
i ) /
i /(n p) = X 2 /(n p),
i=1
MODELOS PARAMETRICOS
72
2.12
2.12.1
A func
ao densidade
1/2
(y )2
f (y; , ) =
,
y > 0.
exp
2y 3
22 y
As aplicacoes do modelo N (, ) envolvem estudo do movimento Browniano de partculas, analise de regressao com dados consideravelmente assimetricos, testes de confiabilidade, analise seq
uencial e analogo da analise
de variancia para classificacoes encaixadas. Outras aplicac
oes incluem modelagem de tempos, como: durac
ao de greves, tempo de primeira passagem nos
passeios aleatorios, tempos de sobrevivencia, tempo gasto para injetar uma
substancia no sistema biologico, etc.
2.12.2
Principais caractersticas
1/2
1+92
3
e moda
2 . Alem disso, existe uma relac
ao importante
42
entre os momentos positivos e negativos dada por E(Y r ) =
E(Y r+1 )
.
2r+1
73
2.13
Exerccios
1
parametro desconhecido e ligac
ao = ( 1) , conhecido. Calcular a EMV de para os modelos normal, Poisson, gama, normal inverso e binomial negativo. Fazer o mesmo para o modelo binomial com
MODELOS PARAMETRICOS
74
) p
;
8 m(1 )
7. Sejam as funcoes de probabilidade:
m
B(y) =
y (1 )my ,
y
1
Var(Z)=(4m)
P (y) =
e y
.
y!
1/2
B(y)
m
=
.
P (y)
my
8. Mostre que a distribuic
ao gama tem func
ao geratriz de cumulantes
t
.
K(t) = log 1
,
D(6 + D)
)/n e o desvio medio.
onde D = D(y;
75
R
10. Demonstrar que a ligac
ao = b00 ()2/3 d normaliza a distribuic
ao de
tornando o seu coeficiente de assimetria, aproximadamente, zero.
,
11. Se Y B(m, ), demonstrar que a media e a vari
ancia de log[(Y +
P i m1
m2
Di () = x x
exp(x) para i = 0, 1. Calcular a exx
rx
pressao do r-esimo cumulante desta distribuic
ao.
15. Se Y P () demonstrar: (a) que o coeficiente de assimetria de Y 2/3 e de
ordem 1 enquanto aqueles de Y e Y 1/2 s
ao de ordem 1/2 ; (b) que
a log-verossimilhanca para uma u
nica observac
ao e aproximadamente
quadratica na escala 1/3 ; (c) a formula do r-esimo momento fatorial
E[Y (Y 1) (Y r + 1)] = r ; (d) a formula de recorrencia
entre
os momentos centrais r+1 = r r1 + r /; (e) que 2 Y tem,
aproximadamente, distribuic
ao N (0, 1).
16. Se Y G(, ), demonstrar que: (a) quando > 1 a densidade
e zero na origem e tem uma u
nica moda no ponto /; (b) a
log-verossimilhanca para uma u
nica observac
ao e, aproximadamente,
1/3
quadratica na escala
; (c) a vari
avel transformada 3[(Y /)1/3 1]
MODELOS PARAMETRICOS
76
e, aproximadamente, normal.
= log(y/
log (
)
y ), onde y e y sao as medias aritmetica e geometrica
dos dados, respectivamente, e () e a func
ao digama; (b) uma soluc
ao
aproximada para esta estimativa e dada por = y/2(y y); (c) a
variancia assintotica de iguala [ 0 () 1]1 /n.
21. Demonstrar que para os modelos normal e normal inverso supondo 1 =
= n , isto e, observac
oes independentes e identicamente distribudas,
o desvio S1 tem distribuic
ao 2n1 , supondo o modelo verdadeiro.
22. Demonstrar que para o modelo gama simples, em que todas as medias
y ),
sao iguais, o desvio reduz-se `a estatstica classica S1 = 2n log(y/
onde y e y sao, as medias aritmetica e geometrica dos dados y1 . . . yn ,
respectivamente.
Captulo 3
An
alise de Resduos e
Diagn
ostico em Modelos
Lineares Generalizados
3.1
Resduos
3.1.1
Resduo de Pearson
MODELOS PARAMETRICOS
78
3.1.2
Resduo de Anscombe
A(yi ) A(
i )
p
.
A0 (
i ) V (
i )
3 2/3
2 (yi
2/3
i )
1/6
rAi =
3(yi
1/3
i )
1/3
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
3.1.3
79
Desvio residual
3.1.4
Comparac
ao entre os resduos
MODELOS PARAMETRICOS
80
3 1/2 2/3
rA =
(c 1)
2
e
rD = sign(c 1)
1/2 [2(c log c c + 1)]1/2 .
Na Tabela 3.1 fazemos uma comparac
ao entre os tres resduos citados
acima para diversos valores de c.
3 2/3
2 (c
1)
rD
rP
(c 1)
0.0
-1.5
-1.414
-1.0
0.2
-0.987
-0.956
-0.8
0.4
-0.686
-0.683
-0.6
0.6
-0.433
-0.432
-0.2
1.0
0.0
0.0
0.0
1.5
0.466
0.465
0.5
2.0
0.881
0.879
1.0
2.5
1.263
1.258
1.5
3.0
1.620
1.610
2.0
4.0
2.280
2.256
3.0
5.0
2.886
2.845
4.0
10.0
5.462
5.296
9.0
81
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
Nota-se que a diferenca maxima entre rA e rD ficou em apenas 6%, registrada em c = 0. O resduo de Pearson apresentou uma diferenca consideravel,
para a grande maioria dos valores de c, em relac
ao aos resduos rA e rD . Devese ressaltar, porem, que para modelos mal ajustados e/ou para observac
oes
aberrantes, podem ocorrer diferencas consideraveis entre estes resduos. Os
valores de rA e rD sao, tambem, bastante proximos para os modelos gama e
normal inverso.
Para o modelo binomial, fazemos y = c m , onde m representa o n
umero
de ensaios de Bernoulli, a probabilidade de sucesso e c encontra-se no intervalo unitario devido `as restric
oes (i) log c > 0 e (ii) log(1 c) > 0, provenientes da expressao para o desvio residual. Podemos observar na Figura 3.1
que o desvio residual apresenta-se menor que o resduo de Pearson, independente do valor de . Quando o valor de c se aproxima de 1, a diferenca entre
os resduos diminui. Alem disso, tanto para o desvio residual quanto para o
resduo de Pearson, `a medida que cresce o resduo tambem aumenta (vide
Figura 3.2).
0.80
0.70
0.60
0.40
0.20
0.10
0.0
Desvio Residual
-0.5
-1.0
-1.5
-2.0
-2.5
0.1
0.2
0.5
0.7
MODELOS PARAMETRICOS
82
0.80
0.70
0.40
0.20
0.10
-0.5
0.60
0.0
Resduo
-1.0
-1.5
-2.0
-2.5
-3.0
-3.5
3.2
0.2 (Pearson)
0.7 (Pearson)
An
alise Residual e Medidas de Influ
encia
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
83
3.2.1
i = 1, . . . , n.
i = 1, . . . , n,
tem como u
nica solucao
vi = hi (yi , ),
i = 1, . . . , n.
vi = 1 (F (yi ; )),
i = 1, . . . , n,
(3.1)
MODELOS PARAMETRICOS
84
(3.2)
i=1
(3.3)
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
3.2.2
85
Situaco
es assint
oticas
3.2.3
Correc
ao de vi
es para o desvio residual
(3.5)
MODELOS PARAMETRICOS
86
b(r) ()
.
a()1r
(3.6)
3
3/2
(3.7)
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
Distribuic
ao
Gama (m, )
3 ()/6
1/(3 m)
t de Student (m)
Logstica (, )
Laplace ()
Binomial (m, p)
Poisson (m)
87
(12p)
mp(1p)
1/(6 m)
3.3
3.3.1
Verificac
ao da Distribuic
ao dos Resduos
Teste de normalidade
MODELOS PARAMETRICOS
88
(3.8)
F 1 ((v); ))
l(;
F 1 ((v); ))].
(3.9)
Gigli (1987, Cap.2) apresenta G(v) em termos da expressao (3.9) para diversas
distribuicoes. Temos, por exemplo, quando Y Gama(m, )
r
y
y y
m
G(v) = sinal
2 m log m m log + m .
2
2 2
89
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
1
e y0 = F 1 (u0 ) = ym ,
2
1
1
f 0 (ym ; ) 0
00
00
G (0) =
rD (ym , )
r (ym , )
[f (ym ; )]3 D
2 [f (ym ; )]2
3
[f 0 (ym ; )]2
1
0
+
G000 (0) = rD
(ym , )
2f (ym ; ) ( 2)3 [f (ym ; )]5
)
f 00 (ym ; )
3
f 0 (ym ; ) 00
1
3
r (y , )
3
4
4 D m
2 [f (ym ; )]
2 [f (ym ; )]
1
1
+ 3
r000 (y , )
3 D m
[f
(y
;
)]
m
2
e
1
1
G(v) = G(0) + G0 (0)v + G00 (0)v 2 + G000 (0)v 3 + Op (v 4 ).
2
6
(3.10)
Assim, como foi dito anteriormente, caso o grafico de G(v) versus v seja
MODELOS PARAMETRICOS
90
aproximadamente linear, temos a confirmacao do quao proximo o desvio residual esta do resduo de Cox e Snell.
Gigli (1987, Cap. 2) utiliza o grafico G(v) v para testar a normalidade
em diversas distribuicoes discretas e contnuas, tais como: gama, Weibull,
logstica, Laplace, Poisson, binomial, geometrica, etc.
3.3.2
Erro de classificac
ao na distribuic
ao dos dados
(3.11)
lF
| = 0
(3.12)
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
91
y
lF
| = E 1 +
= E (y).
E
Como E (y) = 1
, pois a esperanca e calculada supondo a distribuic
ao
verdadeira H(; ), entao
=
.
1
(3.13)
MODELOS PARAMETRICOS
92
3.4
Verificando a Inclus
ao de uma Nova Covari
avel
= diag
Vi1
i
i
2 )
,
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
(yi
i )
1/2 .
V
93
3.5
Verificando a N
ao-Linearidade em
um Sub-Conjunto de Vari
aveis Explicativas
(X2 1)/, se 6= 0
()
X2 =
(3.14)
log(X ),
se = 0.
2
Para verificar a nao-linearidade nas vari
aveis contidas em X2 , segundo
Wang (1987), deve-se testar a hipotese H0 : = 1 no MLG com preditor
()
linear = X1 (1 , . . . , q )T + X2 (q+1 , . . . , p )T .
Utilizando uma expansao linear em serie de Taylor de , podemos aprox-
MODELOS PARAMETRICOS
94
()
imar X2
localmente por
()
X2
onde U () =
()
X2
+ ( 1)U (1) ,
(3.15)
onde
z = (z1 , . . . , zn )T = U (1) (q+1 , . . . , p )T
e
= ( 1).
Note que, sob a hipotese nula H0 , a EMV de , em (3.15), e obtida pelo
metodo de Newton-Raphson citado na Sec
ao 2.4. Ent
ao, podemos calcular z a
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
95
3.6
Verificando a Fun
c
ao de Ligac
ao e de Vari
ancia
Em relacao `a func
ao de ligac
ao, um procedimento informal consiste na construcao de um grafico entre a vari
avel dependente ajustada y e . Se o
grafico for aproximadamente linear, a func
ao de ligac
ao estara correta. Devese ressaltar que para dados binarios este grafico e nao-informativo, sendo
necessario o uso de metodos formais.
Dentre os procedimentos formais, o metodo proposto por Hinkley (1985)
e bastante utilizado na pratica. Consiste em adicionar 2 como uma nova
covariavel na matriz modelo. Se isto causar uma reduc
ao significativa no
desvio, a funcao de ligacao nao e adequada. Para verificar se a reduc
ao e
estatisticamente significante, pode-se utilizar o teste proposto na Sec
ao 2.7.3.
Uma estrategia informal para verificar a adequac
ao da func
ao de vari
ancia
seria construir um grafico dos resduos absolutos versus os valores ajustados. Caso os pontos estejam dispersos sem uma tendencia (local ou global)
definida, podemos considerar a func
ao de vari
ancia adequada. Entretanto,
uma tendencia positiva indica que a vari
ancia esta crescendo de acordo com
a media. Com isso, a escolha inicial de V () pode ser substituda por
V () 2 . Entretanto, uma tendencia negativa indica o efeito inverso.
3.7
Correc
ao de Continuidade Residual no Modelo
Logstico
Nos u
ltimos anos, in
umeros trabalhos tem sido publicados abordando o comportamento residual em regressao logstica, dentre os quais podemos destacar:
Cox e Snell (1968), Pregibon (1981), Landwehr, Pregibon e Shoemaker (1984),
Jennings (1986), Copas (1988) e McCullagh e Nelder (1989).
Em particular, Pierce e Schafer (1986) sugerem uma correc
ao de con-
96
MODELOS PARAMETRICOS
tinuidade para os resduos argumentando que R (yi 1/2, pi ) apresenta melhor normalidade que R (yi , pi ), onde {resduos de Pearson, Anscombe,
desvio residual e desvio residual ajustado} (vide Sec
oes 1.6 e 3.1.3). Alem
disso, segundo eles, quando a estimativa pi encontra-se proxima do parametro
pi (desconhecido na pratica), este mesmo comportamento e esperado pelos
resduos calculados a partir de pi .
Entretanto, Duffy (1990) apresenta evidencia contra o uso da correc
ao
de continuidade nos resduos em regressao logstica. Atraves de uma analise
grafica informal, a autora conclui que a correc
ao de continuidade age de forma
a prejudicar a normalidade dos resduos no modelo logstico. Duffy tambem
testa a habilidade dos resduos em detectar observac
oes contaminadas ou outliers. Novamente, o uso da correc
ao de continuidade prejudica a identificac
ao
de tais observacoes a partir dos resduos.
Para uma analise mais detalhada sobre os problemas da correc
ao de continuidade em modelos de regressao logstica, vide Duffy (1990).
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
3.8
3.8.1
97
Medidas de alavancagem
(3.16)
e o valor de W em .
onde W
Espera-se que as observac
oes distantes do espaco formado pelas vari
aveis
explicativas apresentem valores apreciaveis de hii . Como H e matriz de
projecao, 0 hii 1, vide Sec
ao 1.9.1 para uma demostrac
ao similar. Alem
disso, tr(H) = posto(H) = p.
Hoalgin e Welsh (1978) sugerem usar h > 2p/n para indicar os pontos
de alavancagem. Uma ferramenta informal para visualizar tais observac
oes
consiste em usar um index plot (grafico indexado) dos hii versus i com
limite h = 2p/n.
MODELOS PARAMETRICOS
98
3.8.2
Medidas de influ
encia
(3.17)
(3.18)
n p hi
2
|rD
Ti =
|,
(3.19)
(i)
p 1 hi
onde rD(i) e aproximadamente o desvio residual deletado (vide McCullagh e
2
Nelder, 1989, Sec. 12.7.3). Aqui, rD
e definido pela variac
ao no desvio
(i)
An
alise de Resduos e Diagn
ostico em Modelos Lineares Generalizados
99
3.9
Exerccios
2/
(normal inversa).
7. Seja H = W 1/2 X(X T W X)1 X T W 1/2 o analogo da matriz de projec
ao
para um modelo linear generalizado. Demonstre que, aproximadamente,
V 1/2 (
) = HV 1/2 (y ),
onde V = diag{V (1 ), . . . , V (n )} e a matriz diagonal com a func
ao de
variancia.
8. Demonstre as correcoes de vies apresentadas na Tabela 3.2.
100
MODELOS PARAMETRICOS
Captulo 4
MODELOS PARAMETRICOS
102
4.2
O modelo logstico linear e um membro da classe dos MLGs servindo de alternativa para analisar respostas binarias atraves de um conjunto de vari
aveis
explicativas. A relacao entre a probabilidade de sucesso p e o conjunto de
variaveis explicativas e dada atraves da func
ao de ligac
ao logstica (vide Sec
ao
2.8). Tal relacionamento e sigmoidal, uma vez que a relac
ao entre o logit(p)
e a matriz modelo e linear. O modelo logstico linear tambem e conhecido na
literatura como modelo de regressao logstica.
Suponha que temos n observac
oes binomiais sob a forma yi /mi , i =
1, . . . , n, de modo que E(yi ) = mi pi , onde pi e a probabilidade de sucesso correspondente `a i-esima observac
ao. Assim, o modelo logstico linear relaciona
pi com um conjunto de p vari
aveis explicativas x1i , x2i , . . . , xpi , associado a
i-esima observacao, sendo expresso por
pi
logit(pi ) = log
= 0 + 1 x1i + . . . + p xpi .
(4.1)
(1 pi )
103
P
j
(4.2)
e i
.
1 + e i
4.2.1
Ajuste do modelo
pi
= 0 + 1 x1i + . . . + p xpi .
logit(pi ) = log
(1 pi )
A observacao yi com valor esperado mi pi pode ser expressa como yi =
mi pi + i . A componente do resduo e dada por i = yi mi pi tendo valor
esperado zero, contudo sua distribuic
ao nao e mais binomial. A distribuic
ao
do resduo i e conhecida como distribuic
ao binomial modificada. Apesar de
nao haver relacao entre a distribuic
ao dos dados e aquela do resduo, neste
caso, e importante salientar que no ajuste do modelo e necessario apenas a
distribuicao de yi .
Note que para ajustarmos o modelo logstico linear e necessario, primeiramente, estimar os p + 1 parametros 0 , 1 , . . . , p . Estes parametros sao esti-
MODELOS PARAMETRICOS
104
n
Y
mi
pyi i (1 pi )mi yi .
L() =
yi
i=1
n
X
mi
`() =
log
+ yi log pi + (mi yi ) log(1 pi )
yi
i=1
n
X
mi
i
=
log
+ yi i mi log(1 + e ) ,
(4.3)
yi
0s
i=1
P
onde i = pj=0 j xji e x0i = 1 para todo i = 1, . . . , n. Para tanto, e necessario
calcularmos a derivada do logaritmo da func
ao de verossimilhanca em relac
ao
aos p + 1 parametros desconhecidos , dada por
n
i=1
i=1
X
`() X
=
yi xij
mi xij ei (1 + ei )1 , j = 0, 1, . . . , p.
j
Assim, igualando estas derivadas a zero obtemos um conjunto de p + 1
equacoes nao-lineares. As estimativas j correspondem `a soluc
ao deste sistema
e podem ser obtidas atraves do algoritmo iterativo conhecido como metodo
escore de Fisher descrito na Sec
ao 2.4.
0
Uma vez calculados os s, as estimativas do preditor linear do modelo
sao dadas por i = 0 + 1 x1i + . . . + p xpi .
Conseq
uentemente, as probabilidade estimadas pi sao obtidas fazendo
pi =
ei
.
1 + ei
4.2.2
105
Bondade de ajuste
n
X
mi
lp =
log
+ yi log pi + (mi yi ) log(1 pi ) .
yi
i=1
No modelo saturado as probabilidades ajustadas sao identicas `as proporcoes observadas pi = yi /mi . Assim, a log-verossimilhanca maximizada
sob o modelo saturado e dada por
n
X
mi
ln =
log
+ yi log pi + (mi yi ) log(1 pi ) .
yi
i=1
n
X
pi
1 pi
D=2
yi log
+ (mi yi ) log
.
pi
1 pi
i=1
n
X
yi
mi yi
D=2
yi log
+ (ni yi ) log
.
yi
mi yi
i=1
MODELOS PARAMETRICOS
106
n
X
{
pi logit (
pi ) + log (1 pi )} .
i=1
Neste caso, o desvio torna-se uma estatstica de bondade de ajuste desinformativa, pois a mesma so depende das probabilidades de sucesso ajustadas
pi .
Outra estatstica que pode ser empregada para verificar a adequac
ao do
2
modelo em investigacao e a estatstica X de Pearson definida por
X2 =
n
X
(yi mi pi )2
.
mi pi (1 pi )
i=1
4.3
107
forma matricial X T
= X T y. Quando os elementos da matriz modelo X s
ao
0 ou 1, essas equacoes implicam que as estimativas das medias sao obtidas
igualando certas freq
uencias marginais totais aos seus valores esperados. De
S = (S1 , . . . , Sp )T = X T y obtem-se Cov(S) = X T W X.
Considera-se que a EMV tem, aproximadamente, distribuic
ao nor1
T
4.3.1
Modelos hier
arquicos
108
MODELOS PARAMETRICOS
4.3.2
109
Modelos hier
arquicos para tabelas de conting
encia com
3 entradas
Apresentam-se, agora, todas as nove classes de modelos hierarquicos correspondentes `a classificacao de tres fatores A, B e C. Seja yijk P (ijk ), o
n
umero de observacoes com A = i, B = j e C = k, em que 1 i r,
P
1 j s e 1 k t, e utiliza-se da notac
ao usual yi++ =
j,k yijk ,
P
yij+ = k yijk , etc.
O modelo saturado e definido por
AB
AC
BC
ABC
+ jk
+ ijk
,
log ijk = + iA + jB + kC + ij
+ ik
(4.4)
A = B = = ABC =
com as restricoes usuais da analise de vari
ancia +
+
+jk
ABC = ABC = 0. Este modelo corresponde `
a classe e tem-se
i+k
a
1
= yijk .
ijk
ij+
110
MODELOS PARAMETRICOS
Este modelo equivale `a hipotese que o fator C e independente do par (A, B),
isto e,
P (A = i, B = j, C = k) = P (A = i, B = j)P (C = k)
ou ijk = ij+ ++k /+++ . As estimativas
ijk = yij+ y++k /y+++ s
ao func
oes
explcitas das estatsticas suficientes minimais yij+ e y++k .
A 5a classe corresponde ao modelo
log ijk = + iA + jB + kC
com todas as interacoes nulas. Este modelo corresponde `a hipotese que os tres
fatores sao mutuamente independentes:
P (A = i, B = j, C = k) = P (A = i)P (B = j)P (C = k)
ou ijk = i++ +j+ ++k /2+++ . As estimativas
ijk igualam yi++ y+j+ y++k /
2
y+++
, onde os termos do numerador sao as estatsticas suficientes minimais.
A 6a classe tem 3 modelos obtidos de
AC
log ijk = + iA + kC + ik
por simples permutacao dos fatores; este modelo equivale a cada nvel de B
ser igualmente equiprovavel, dados A e C, isto e
P (B = j | A = i, C = k) = s1 .
As estimativas de maxima verossimilhanca sao
ijk = yi+k /s.
111
MODELOS PARAMETRICOS
112
4.3.3
Testes de adequac
ao
n
X
i=1
n
X
i=1
yi log (yi /
i ),
(yi
i )2
.
(4.5)
113
Graus de Liberdade
Descricao
1: ABC
modelo saturado
2: AB,AC,BC
(r 1)(s 1)(t 1)
3: AB,AC
r(s 1)(t 1)
dado A, B e C independentes
4: AB,C
(rs 1)(t 1)
5: A,B,C
rst r s t + 2
6: AC
rt(s 1)
7: A,C
rst r t + 1
8: A
r(st 1)
9: Nula
4.3.4
rst 1
modelo nulo
Testes de comparac
ao entre modelos
A estatstica D(
; y) e usada para comparac
ao de modelos log-lineares encaixados. Formula-se uma seq
uencia de interesse de modelos log-lineares encaixados Mp1 Mp2 Mpr com parametros p1 < p2 < < pr e desvios
Dp1 > Dp2 > . . . > Dpr . A diferenca entre os desvios dos modelos encaixados
MODELOS PARAMETRICOS
114
Mpj Mpi (pj < pi ) e dada por
Dpj Dpi = 2
n
X
yk log(
jk /
ik ),
(4.6)
k=1
onde
jk (
ik ) e a k-esima componente estimada do vetor
j (
i ). Esta estatstica e usada para testar se a diferenca entre os valores esperados ajustados, segundo os modelos Mpi e Mpj e, simplesmente, devido `a uma variac
ao
aleatoria, dado que os valores esperados verdadeiros satisfazem o modelo mais
pobre Mpj . Segundo Mpj , Dpj Dpi tem distribuic
ao assint
otica 2pi pj .
Se a seq
uencia e formada por modelos hierarquicos, Goodman (1969)
demonstra, baseando-se na forma multiplicativa das estimativas das medias,
que a expressao (4.6) iguala
Dpj Dpi = 2
n
X
jk log(
jk /
ik ).
(4.7)
k=1
115
n
X
(
jk
ik )2
k=1
ik
(4.8)
4.4
MODELOS PARAMETRICOS
116
4.4.1
Momentos e cumulantes
nr (1 r )
cov(Yr , Ys ) =
n
r s
3 (Yr , Ys , Yt ) =
4.4.2
se
r=s
se
r 6= s.
nr (1 r )(1 2r )
se
r=s=t
nr t (1 2r )
se
r = s 6= t
2nr s t
se
r 6= s 6= t
Log verossimilhan
ca e func
ao desvio
117
p
X
yij log ij .
j=1
4.5
MODELOS PARAMETRICOS
118
4.5.1
Par
ametros na func
ao de vari
ancia
(y + k 1)!
y
;
y!(k 1)! (1 + )y+k
y = 0, 1, 2, . . .
var(Y ) = k + k2 = + /k 2 .
= log
,
= log
1+
+k
e funcao de variancia
V = + 2 /k.
O termo pode ser interpretado como a func
ao de vari
ancia de uma Pois2
son e o termo /k como uma componente extra resultante da combinac
ao
de uma distribuicao de Poisson com uma distribuic
ao gama, no processo de
obtencao da binomial negativa. A princpio k e desconhecido e, claramente,
nao se trata de um parametro de dispersao. Estimativas de k para amostras
univariadas e multivariadas foram discutidas por Anscombe (1949). A sua esti-
119
4.5.2
Par
ametros na func
ao de ligac
ao
, para 6= 0
=
log , para = 0,
MODELOS PARAMETRICOS
120
ou, supondo continuidade em = 0,
=
1
.
(4.10)
121
=0
( + ) 1
,
1 (1 )+ 1
(1)
g(; ) = log
4.5.3
Par
ametros n
ao-lineares nas covari
aveis
Uma funcao de x como, por exemplo, ekx pode ser includa na matriz modelo
substituindo-se, simplesmente, x por ekx (desde que k seja conhecido). Entretanto, se k precisa ser estimado, ent
ao temos um problema de nao-linearidade.
MODELOS PARAMETRICOS
122
g
=
0
e = ( 0 ).
4.6
O uso do modelo classico de regressao e justificado admitindo-se: (i) linearidade da estrutura de E(y); (ii) vari
ancia constante do erro, V ar(y) = 2 ; (iii)
normalidade e (iv) independencia das observac
oes. Se as suposic
oes (i) a (iii)
nao sao satisfeitas para os dados originais, uma transformac
ao nao-linear de
y podera verifica-las, pelo menos aproximadamente. Em alguns problemas de
regressao deve-se transformar tanto a vari
avel dependente quanto as vari
aveis
explicativas para que as suposic
oes acima sejam satisfeitas. Transformac
oes
das variaveis explicativas nao afetam as suposic
oes (ii), (iii) e (iv).
123
V () = e V () = 2 , as func
oes estabilizadoras sao y e log y, respectivamente. Entretanto, nao ha garantia que g(y) escolhido desta maneira
satisfaca tambem a condicao (iii) de normalidade dos dados transformados.
Muitas vezes os dados apresentam um ou mais pontos aberrantes que implicam em detectar nao-normalidade e heterocedasticidade. Algum cuidado deve
ser tomado ainda com o mecanismo gerador de dados e a precisao com que
estes sao obtidos.
Dificuldades com o modelo classico de regressao nao so ocorrem devido `a
violacao de uma das hipoteses basicas. Muitas vezes sao devidas `a problemas
fora do contexto da forma dos dados, como por exemplo, a multicolinearidade,
quando existem relacoes aproximadamente lineares entre as vari
aveis explicativas. Esta multicolinearidade podera causar problemas com as rotinas de
inversao da matriz X T X. Outro tipo de dificuldade ocorre quando se dispoe
de um grande n
umero de vari
aveis explicativas e, portanto, surge um problema
de ordem combinatoria para selecionar o modelo. Tambem e comum os dados
apresentarem estruturas especiais, tais como, replicac
oes da vari
avel resposta
em certos pontos ou mesmo ortogonalidade. Neste caso, nao se deve proceder
a analise usual embora, em geral, seja difcil detectar essas caractersticas em
grandes massas de dados.
Nesta secao introduz-se a classe de modelos de Box e Cox que visa transformar a variavel dependente para satisfazer as hipoteses (i) a (iv) do modelo
classico de regressao. O modelo de Box e Cox (1964) supoe que os dados
y = (y1 , . . . , yn )T sao independentes e que existe um escalar tal que os dados
transformados por
(y 1)/ se 6= 0
z = z() =
(4.11)
log y se = 0
MODELOS PARAMETRICOS
124
X
n
1
l(, 2 , ) = log(2 2 ) 2 (z X)T (z X)+(1)
log yi , (4.12)
2
2
i=1
n
X
log yi .
(4.13)
i=1
125
1 2
,
W =
n
P
2
(zi z)
i=1
n
X
i=1
v
)
u n
X
u
iz(i)
n3/2 t
zi2 .
i=1
c) teste de Anderson-Darling
A2 = n1
n
X
(2i 1) [1 + log{ti (1 tn+1i )}] ,
i=1
126
MODELOS PARAMETRICOS
z
z
onde ti = (i)s
e s2 e a vari
ancia amostral. Valores grandes de A
sao significantes.
4.7
estimativas e
. Se este nao for o caso, deve-se estimar os 0 s condicionalmente ao parametro , isto e, calculando o desvio fixando (Dp ()). Um
grafico de Dp () versus possibilitara escolher a estimativa
como o valor
de correspondente ao menor Dp (). Deve-se esperar que
esteja proximo
de .
127
4.8
(4.15)
MODELOS PARAMETRICOS
128
4.9
Modelos Semi-Param
etricos
4.10
p
X
j=1
fj (xj ),
129
a
ij e bij , sao, respectivamente, as estimativas do intercepto e da declividade
na regressao linear simples ajustada somente aos pontos (ye , xej ) em alguma
vizinhanca Nij de xij . Pode-se considerar vizinhancas simetricas do tipo Nij =
{x(ir)j , . . . , xij , . . . , x(i+r)j }, onde o parametro r determina o tamanho de Nij .
Tem-se
X
X
bij =
(xej xij ),
(xej xij )ye /
xej Nij
xej Nij
a
ij = y i bij xij ,
onde xij e a media dos valores em xej em Nij e y i e a media dos y 0 s correspondentes.
Para estimar os fj (xj ) no modelo normal-linear utiliza-se o seguinte algoritmo:
1. Inicializar f(xij ) = 0,
i, j e = y;
rij = yi
fk (xik );
k=1
k6=j
3. Calcular fj (xij ) = S(rj |xij ) ajustando uma regressao linear simples aos
pontos (rej , xej ) pertencentes `a uma vizinhanca Nij de xij ;
P
P
4. Quando SQR = n {yi p fj (xij )}2 convergir para-se; caso
i=1
j=1
MODELOS PARAMETRICOS
130
Observe-se que a cada etapa o algoritmo suaviza resduos versus a covariavel seguinte. Estes resduos sao obtidos removendo as func
oes estimadas
ou efeitos de todas as outras vari
aveis. Propriedades interessantes deste algoritmo sao discutidas por Hastie e Tibshirani (1986, 1987). A extensao do
algoritmo para os MLGs e baseada nas equac
oes normais da regressao da
variavel dependente modificada y sobre X usando pesos W (Sec
ao 2.4). O
algoritmo fica sendo:
W
= (y) e
1. Inicializar fj (xij ) = 0, j = 1, . . . , p, = g(y), = 1,
2
1);
1
Ppk=1 fk (xk ) para j =
y 1
2. Calcular os resduos parciais rj = W
k6=j
1, . . . , p;
3. Obter fj (xij ) = S(rj /xij ) atraves da regressao linear simples sobre os
pares (rej , xej ) em Nij , i = 1, . . . , p;
P
T
= H(
4. Atualizar = g( 1 Wn y 1 ), = + pj=1 fj (xj ), u
= g 1 (
), H
),
= W (
W
) e y = + H(y
);
5. Calcular o desvio D(y;
) do modelo usando as formulas da Sec
ao 2.7.1
como funcao de y e
. Quando D(y;
) convergir para-se; caso contr
ario,
volta-se para 2.
4.11
Modelos de Quase-Verossimilhanca
Var(yi ) = Vi (i ).
131
(4.17)
MODELOS PARAMETRICOS
132
(4.18)
i=1
n
X
(yi
i )2 /
i .
i=1
133
isto e, D(y;
) = 2{Q(y; y) Q(y;
)}. A func
ao quase-desvio para os dados
P
iguala i D(yi ;
i ). Para as func
oes de vari
ancia dos MLGs, a func
ao quasedesvio reduz-se aos desvios desses modelos.
A Tabela 4.2 apresenta log-quase-verossimilhancas para algumas func
oes
de variancia, com a excecao do escalar , deduzidas integrando (4.16). Desta
tabela os desvios sao facilmente obtidos.
Agora admite-se o seguinte modelo de quase-verossimilhanca com func
ao
de variancia parametrica:
E(yi ) = i (),
Var(yi ) = V (i ),
MODELOS PARAMETRICOS
134
Log-quase-Verossimilhanca Q(y; )
y
2
1
2
(1 )
2 (1 )2
+ 2 /
y log
(2y 1) log
y log
+ log(1 )
+ log
1y
1
2
Var(y) = V () + (d/d) e, portanto, a func
ao de vari
ancia torna-se
parametrizada por . Uma outra situac
ao ocorre quando a vari
avel resposta
y representa a soma de vari
aveis i.i.d. cujo n
umero de vari
aveis e tambem
facil verificar que os
uma variavel aleatoria de media e vari
ancia V (). E
parametros extras que aparecem na func
ao de vari
ancia de y incluirao os dois
primeiros momentos das vari
aveis i.i.d.
Para um valor fixo de pode-se ainda utilizar as equac
oes dadas em (4.18)
para obter as estimativas de maxima quase-verossimilhanca dos 0 s. A estimativa de correspondera ao maior valor da quase-verossimilhanca estendida
maximizada tratada como func
ao de , obtida de Q+ (), ou ainda ao menor
valor do desvio estendido 2Q+ () dado por min 2Q+ (). Seria melhor
maximizar conjuntamente Q+ em relac
ao a e , embora este processo exija o calculo da funcao escore em relac
ao ao parametro , o que e bastante
complicado.
Considera-se agora uma classe de modelos de quase-verossimilhanca com
135
= h() = Z,
(4.19)
1
U+ = = Z T L(D ),
2
=
X
=
H
H
0
X
0
0
C 1 L
0
Z
W
0
=
, W
,
0 1/2C
, y =
+H
,
136
MODELOS PARAMETRICOS
4.12
Modelos para An
alise de Dados de Sobreviv
encia
Nesta secao serao apresentados alguns modelos usuais para analise de dados em
que a variavel resposta e o tempo de sobrevivencia. Por exemplo, o tempo que
um certo tipo de maquina demora para quebrar ou o tempo de sobrevivencia de
um paciente submetido a um determinado tratamento. Geralmente esses dados
apresentam uma caracterstica especfica chamada de censura, em virtude
dos estudos terminarem quase sempre antes de se conhecer o resultado final de
todas as unidades amostrais. No caso do tempo ate a quebra de um certo tipo
de maquina, e possvel que o mesmo nao seja conhecido para algumas unidades,
pois as analises podem terminar antes da quebra de algumas maquinas. Os
tempos dessas maquinas sao tratados como censuras. Mesmo assim, esses sao
incorporados nos modelos de analise de sobrevivencia.
O tempo de sobrevivencia pode ser descrito formalmente atraves das
seguintes funcoes: (i) f (t), a densidade de probabilidade do tempo de sobrevivencia; (ii) S(t), a funcao de sobrevivencia, onde S(t) = 1 F (t), sendo
F (t) a funcao de distribuicao acumulada de t; (iii) h(t), a func
ao de risco, que
e uma medida do risco instant
aneo de morte no tempo t, sendo definida por
h(t) = F 0 (t)/{1 F (t)}.
Conhecendo-se apenas uma dessas func
oes tem-se diretamente as outras
duas. Por exemplo, para a distribuic
ao exponencial com S(t) = exp(t),
fica claro que a funcao de risco e constante e dada por h(t) = . Para a
distribuicao de Weibull tem-se h(t) = t1 ; logo, S(t) = exp(t ). A func
ao
de risco nesse caso cresce com o tempo se > 1 e descresce se < 1. O livro
de Cox e Oakes (1984) apresenta um estudo completo da analise de dados de
sobrevivencia.
4.12.1
137
(4.21)
(4.22)
Rt
onde (t) = (u)du. Similarmente, a densidade de probabilidade de
t fica expressa na forma
f (t; x) = 0 (t) exp{ (t) exp()}.
A distribuicao do tempo de sobrevivencia t do modelo acima pertence `a famlia
exponencial nao-linear, mas nao `a famlia (2.1). Em particular, E{(t)} =
exp() e Var{(t)} = exp(2).
A estimacao dos 0 s para uma func
ao (t) especificada foi desenvolvida
por Aitkin e Clayton (1980). Admite-se durante o tempo de obtenc
ao dos
dados, que foram registrados os tempos de morte de n m indivduos e os
tempos de censura de m indivduos. Seja uma vari
avel dicotomica yi que
assume valor um se o indivduo xi morreu e valor zero se esse foi censurado no
tempo ti . Logo, um indivduo que morreu no tempo ti contribui com o fator
log f (ti ; xi ) para a log-verossimilhanca `(), enquanto um indivduo censurado
MODELOS PARAMETRICOS
138
n
X
j=1
que pode ser expressa numa forma mais conveniente usando (4.22) como
`() =
n
X
j=1
(yi log i i ) +
n
X
(4.23)
j=1
139
= (n m)/
n
X
(
i yi ) log ti .
(4.24)
i=1
(t)
densidade
offset
exponencial
exp{ t exp()}
log(t)
Weibull
t1
t1 exp{ t exp()}
log t
valor-extremo
exp(t)
exp{ t exp(t + )}
4.12.2
MODELOS PARAMETRICOS
140
sR(tj )
X
exp(xTs ) ,
log Pj = yiT log
sR(tj )
141
exp(xT1 )
X
exp(xTs ) X
sR(tj )
sR(tj )
exp(xT2 )
X
exp(xTs ) X
sR(tj )
sR(tj )
exp(xT2 )
exp(xTs ) exp(xT1 )
exp(xT1 )
exp(xTs ) exp(xT2 )
Cox (1975) mostra que toda a teoria usual para a estatstica da razao de
verossimilhancas continua valendo para os modelos de riscos proporcionais.
4.13
MODELOS PARAMETRICOS
142
(ou funcao de probabilidade) na forma
(4.25)
(4.26)
143
R
V = d/d e = V 1 d = q() e uma func
ao conhecida unvoca de . A
componente sistematica usual para a media e f () = = X, onde f () e
a funcao de ligacao, = (1 , . . . , n )T e o preditor linear, X e uma matriz
conhecida n p de posto p < n e = (1 , . . . , p )T e um vetor de parametros
> 0 sao chamados de
desconhecidos a ser estimado. Os parametros l e 1
l
parametros canonico e de dispersao, respectivamente. Ambos os parametros
variam sobre as observacoes atraves de modelos de regressao. Para as distribuicoes normal, gama e Gaussiana inversa, as medias e as vari
ancias sao
1 3
1
1 1 2
1
1/2
e l , l 1 e l 1 , respectivamente.
l , l , (2l )
Definimos a componente sistematica do vetor de parametros de precisao
= (1 , . . . , n )T como
g() = = S,
(4.27)
onde e o preditor linear da dispersao, S = (s1 , . . . , sn )T , com sl =
(sl1 , . . . , slp )T , e uma matriz nq de posto q (q < n) representando as vari
aveis
T
independentes que modelam a dispersao e = (1 , . . . , q ) e, tambem, um
vetor de parametros desconhecidos. O MLG com covari
aveis de dispersao tem,
portanto, dois preditores lineares: o preditor linear da media e o preditor linear da dispersao. Ambas f () e g() sao func
oes um a um conhecidas
e duplamente diferenciaveis. A func
ao g() e chamada de func
ao de ligac
ao
da dispersao. Assume-se, tambem, que e independente de . Temos, ent
ao,
p + q parametros a serem estimados.
Considere a log-verossimilhanca total como func
ao de e
n
X
`(, ) =
[l {yl l b(l ) + c(yl )} + d1 (yl ) + d2 (l )],
l=1
sendo o vetor de dados y = (y1 , . . . , yn )T fixado, onde yl denota o valor observado da variavel aleatoria Yl . Na expressao acima, est
a associado a
atraves da funcao de ligacao f () ( e uma func
ao de ) e esta relacionado
com atraves de g().
MODELOS PARAMETRICOS
144
`(, )/
U = U (, ) =
`(, )/,
cujas componentes sao
`(, )/ = X T W 1/2 V 1/2 (y ) e `(, )/ = S T 1 v,
onde = diag{1 , . . . , n }, W = diag{w1 , . . . , wn } com wl =
Vl1 (dl /dl )2 , V = diag{V1 , . . . , Vn }, 1 = diag{1l , . . . , 1n } com 1l =
l /l e v = (v1 , . . . , vn )T com vl = yl l b(l ) + c(yl ) + d2 (l )/l .
A particao ( T , T ) induz uma correspondente matriz de informac
ao particionada para estes parametros. A matriz de informac
ao total de Fisher
K = K(, ) pode ser deduzida de E{U (, )U T (, )}. Esta matriz e blocodiagonal dada por
K(, ) =
K,
K, ,
(m+1)
(m)
=
+ K (m)1 U (m) .
(4.28)
(m+1)
(m)
145
onde
=
X
=
W
D2 21
W 1/2 V 1/2
D21 1
1
y =
(4.29)
4.14
146
MODELOS PARAMETRICOS
(4.30)
147
hecido. As u
nicas distribuic
oes contnuas da forma (2.1) sao baseadas nas
distribuicoes normal, gama e Gaussiana inversa.
Note-se que a famlia de distribuic
oes em (2.1) e uma sub-famlia simples de (4.30) e difere desta no sentido de que tem uma forma geral de dois
parametros para modelos exponenciais, enquanto (2.1) e apenas um modelo
exponencial de um parametro quando e mantido fixo. Entretanto, como
um modelo de dois parametros (, ), (4.30) nao tem a forma do modelo exponencial. Deste modo, o MLG com super-dispersao, como definido acima, e
uma extensao dos MLGs.
Para um determinado MLG com super-dispersao o objetivo e calcular as
estimativas dos parametros e simultaneamente, desde que eles representam
os efeitos das variaveis explicativas da media e do parametro de dispersao,
respectivamente. Denotamos a amostra aleatoria por y1 , . . . , yn e a func
ao de
log-verossimilhanca total por
`(, ) =
n
n
X
X
log A(yl ). (4.31)
{(yl l ) (1,0) (, l )+l T (yl )+(l , l )}+
l=1
l=1
`(, )
T (2,0) M (y )
X
1
,
U = U (, ) =
=
(4.32)
`(, )
S T 1
(1,1)
MODELOS PARAMETRICOS
148
K,
0
K(, ) =
(4.33)
,
0
K,
onde K, = X T (2,0) M12 X e K, = S T (0,2) 21 S sao as matrizes de informacao de e , respectivamente. Deste modo, os parametros e s
ao
X T (2,0)(m) M1
(m)2 (m)
1 ,
X (m+1) = X T (2,0)(m) M1
(m)2
S T (0,2)(m) 1 S (m+1)
(m)
S T (0,2)(m) 1
(4.34)
(m)
2 ,
1
modificada
sobre a matriz modelo (X S) com os pesos modificados
2
149
definidos por
(2,0) M 2
0
1
(0,2)
2
0
4.15
Exerccios
8.300
70.00
10.30
18.00
80.00
51.50
14.20
80.00
31.70
16.000
72.00
38.30
11.100
80.00
22.60
11.200
75.00
19.90
8.800
63.00
10.20
20.600
87.00
77.00
11.000
66.00
15.60
13.300
86.00
27.40
13.700
71.00
25.70
11.400
76.00
21.00
10.700
81.00
18.80
12.900
74.00
22.20
17.500
82.00
55.70
17.900
80.00
58.30
14.000
78.00
34.50
11.700
69.00
21.30
16.300
77.00
42.60
8.600
65.00
10.30
18.000
80.00
51.00
14.500
74.00
36.30
11.000
75.00
18.20
11.300
79.00
24.20
10.500
72.00
16.40
10.800
83.00
19.70
12.900
85.00
33.80
13.800
64.00
24.90
11.400
76.00
21.40
12.000
75.00
19.10
17.300
81.00
55.40
Fazer uma analise desses dados via o modelo de Box e Cox (1964).
2. Analisar os dados seguintes (Freedman, Pisani e Purves, 1978) sobre a
admissao de estudantes em 6 cursos de graduac
ao da Universidade da
MODELOS PARAMETRICOS
150
California.
Homens
Curso
A
B
C
D
E
F
Inscritos
825
560
325
417
191
373
Mulheres
Admitidos
512
353
121
138
53
22
Inscritos
108
25
393
375
393
341
Admitidos
89
17
134
131
94
24
0
0
7
20
2
8
25
5
8
30
6
8
35
6
8
40
7
8
Graus de liberdade
IJKL-IJ-JK-IK-L+I+J+K
IJKL-IJ-JK-IK-KL+I+J+2K-1
IJKL-IJ-JK-IK-JL-KL+I+2J+2K+L-2
IJKL-IJ-IK-IL-JK-JL-KL+2(I+J+K+L)-3
IJKL-IJK-JL-KL+J+K+L-1
IJKL-IJK-IL-JL-KL+I+J+K+2L-2
(IJ-1)(K-1)(L-1)
(IJ-J+1)(K-1)(L-1)
(I-1)(J-1)(K-1)(L-1)
151
6. Demonstrar que o desvio do modelo correspondente `a hipotese de interacao zero entre os tres fatores de uma classificac
ao de tres entradas
numa tabela I J K, e dado por:
X
X
X
Sp = 2
yijk log yijk
y+jk log y+jk
yi+k log yi+k
i,j,k
j,k
i,j
X
i
i,k
onde p = IJK (I 1)(J 1)(K 1). Demonstrar que Sp converge em distribuicao para a vari
avel 2(I1)(J1)(K1) quando y+++
tende para , se e somente se, a tabela e perfeita, no sentido de que
ijk = +jk i+k ij+ /i++ +j+ ++k .
7. Analisar os dados abaixo referentes a quatorze estudos retrospectivos
sobre a associacao entre o fumo e o cancer no pulmao.
Estudo
Pacientes
total
86
93
136
82
444
605
93
com cancer
nao-fumantes
12
32
total
86
270
100
522
430
780
186
nao-fumantes
14
43
19
125
131
114
12
Estudo
10
11
12
13
14
Pacientes
total
1357
63
477
728
518
490
265
com cancer
nao-fumantes
18
19
39
total
1357
133
615
300
518
2365
287
nao-fumantes
61
27
81
54
56
636
28
controle
controle
MODELOS PARAMETRICOS
152
10-10.99
11-11.99
Idade
12-12.99
621
292
132
50
27
Desenvolvimento
251
353
273
182
69
do busto
50
214
337
397
273
72
160
333
501
39
132
289
13-13.99
14-14.99
peso do carro
motorista jogado
para fora
pequeno
padrao
classificacao do acidente
colisao
capotagem
grave nao-grave grave nao-grave
sim
23
26
80
19
nao
150
350
112
60
sim
161
111
265
22
nao
1022
1878
404
148
14
58
9 12
13 16
17 ou mais
74
108
124
56
47
95
171
112
108
147
121
19
189
127
37
98
137
34
Captulo 5
5.1
E() = 0,
Cov() = = 2 ,
(5.1)
154
MODELOS PARAMETRICOS
X )
e o estimador viesado de 2 . Se o interesse e testar a
hipotese nula de restricoes lineares H0 : R = 0, onde R e uma matriz r p
de coeficientes conhecidos, a estatstica
F = T RT [R(X T 1 X)1 RT ]1 R/r
2
tem distribuicao nula Fr, np , que pode ser usada tanto para testar H0 quanto
na estimacao restrita de intervalos para .
Quando e desconhecido, situac
ao mais comum na pratica, o EMQG
dado anteriormente e inviavel. Neste caso, pode-se formar o estimador
= (X T 1 X)1 X T 1 y,
(5.2)
()
= (X T ()1 X)1 X T ()1 y
(5.4)
()2 = (y X ())
()1 (y X ())/n.
(5.5)
155
(5.6)
A maximizacao de (5.6), em geral, nao produz forma fechada para e procedimentos iterativos devem ser usados para obter o EMV , e, ent
ao, = (
).
2
Os estimadores incondicionais de e sao facilmente deduzidos de (5.4)
) e
(5.5) como = (
2 =
(
)2 .
Pode-se demonstrar que a matriz de informac
ao conjunta para =
e dada por
2 T 1
X X
0
0
n
1 2
1 T
,
I() =
0
2 vec( ) A
2 4
1 T
1 2 T
1
1
1
)A
0
2 A vec( )
2 A (
( T , 2 , T )T
versus
H1 : g() 6= 0,
g()T
T (F T I()
1 F )1 g(),
W = g()
e a
onde e o EMV irrestrito de , F e a matriz F avaliada em = e I()
2
informacao em . A distribuic
ao nula assint
otica de W e r .
Uma estatstica alternativa a de Wald e a estatstica escore de Rao que
Seja U () a func
envolve o EMV restrito .
ao escore para , i.e., U () = `()
.
A estatstica escore para testar H0 e dada por
T I()
1 U (),
SR = U ()
MODELOS PARAMETRICOS
156
w = 2{`()
As tres estatsticas W, SR e w tem propriedades assint
oticas, em geral, equivalentes. Em varios modelos de regressao do tipo (5.1), os EMV restritos sao
mais faceis de serem computados, o que representa uma vantagem de SR em
relacao a w e W .
Suponha agora que as restric
oes sao lineares apenas em , ou seja, H0 :
2
R = 0 e que e sao conhecidos. Neste caso, as tres estatsticas de teste,
W, SR e w sao identicas e reduzem-se a
2,
W = SR = w = T RT [R(X T 1 X)1 RT ]1 R/
onde = (X T 1 X)1 X T 1 y e o EMV de quando e conhecido.
5.2
Modelo de Regress
ao Rgida
O modelo de regressao rgida objetiva superar os problemas de multicolinearidade das variaveis explicativas adicionando-se uma pequena constante positiva
k aos termos da matriz X T X. Outra alternativa para superar a multicolinearidade e aplicar transformac
oes do tipo Box e Cox `as vari
aveis explicativas.
T
O estimador de regressao rgida e obtido resolvendo-se (X X + kI) = X T y,
que produz = (X T X + kI)1 X T y. Sejam 1 2 p os autovalores ordenados de X T X e v1 , . . . , vp seus autovetores correspondentes. Pode-se
demonstrar que
p
X
T
1
(X X + kI) =
(i + k)1 vi viT ,
i=1
157
p
X
i=1
1
di v i ,
i + k
MODELOS PARAMETRICOS
158
5.3
Modelo Normal N
ao-Linear
Ate o incio da decada de 70 as principais tecnicas desenvolvidas para os modelos de regressao nao-lineares se restringiam `a suposic
ao de normalidade para a
variavel resposta. Em 1972, Nelder e Wedderburn ampliaram a distribuic
ao da
variavel resposta para a famlia exponencial de distribuic
oes, definindo os Modelos Lineares Generalizados. Mesmo assim, os modelos normais nao-lineares
continuaram recebendo um tratamento especial, surgindo diversos trabalhos
nas decadas de 70 e 80, destacando-se o livro de Ratkowsky (1983).
A principal caracterstica dos modelos nao-lineares e que eles sao deduzidos a partir de suposicoes teoricas (quase sempre equac
oes diferenciais) e os
parametros resultantes sao interpret
aveis. Assim, aproxim
a-los pelos modelos
normais lineares, mesmo que sejam alcancados ajustes satisfatorios, prejudicaria bastante a obtencao de estimativas mais realistas dos parametros de
interesse.
Nem sempre os modelos normais nao-lineares sao expressos numa forma
parametrica adequada, que facilite a convergencia rapida dos processos iterativos utilizados na estimacao dos parametros, sendo necessario procurar, em
muitos casos, uma parametrizac
ao mais apropriada.
Embora as tecnicas de diagnostico da regressao normal nao-linear sejam
simples extensoes das tecnicas da regressao linear, as interpretac
oes nao sao
diretamente aplicadas, particularmente em virtude dos resduos ordinarios nao
terem mais distribuicao aproximadamente normal. Isso levou ao desenvolvimento de tecnicas especficas de diagnostico para os modelos normais naolineares (Cook e Tsai, 1985). Similarmente, as propriedades das somas de
quadrados contidas nas tabelas classicas de analise de vari
ancia nao sao estendidas diretamente para o caso nao-linear. Entretanto, alguns pesquisadores
continuam construindo tais tabelas apos o ajuste de modelos nao-lineares e
utilizam apenas descritivamente os valores obtidos para a estatstica F.
A forma classica do modelo normal nao-linear e dada por
yi = fi (; x) + i , i = 1, . . . , n,
(5.7)
159
5.3.1
Estimac
ao de m
axima verossimilhan
ca
MODELOS PARAMETRICOS
160
funcao quadratica
S() =
n
X
{yi i ()}2 ,
i=1
obter :
(m)T X
(m) }1 X
(m)T {y ( (m) )},
(m+1) = (m) + {X
(5.8)
161
5.3.2
Resultados assint
oticos
MODELOS PARAMETRICOS
162
S() = S(){1
+
p
Fp, np ()}.
np
ada em . Essa u
ltima expressao e uma adaptac
ao da regiao de confianca da
regressao normal linear.
Para testar a hipotese H : B, onde B e um subconjunto do espaco
parametrico, utiliza-se usualmente a estatstica da razao de verossimilhancas,
dada por
S()},
2 log = n log{S()
e a soma dos quadrados dos resduos para o modelo ajustado em
onde S()
H. Sob essa hipotese, a estatstica acima tem assintoticamente distribuic
ao
2 com (p m) graus de liberdade, onde m = dim(B).
Uma estatstica alternativa para testar H e dada por
F =
S()}
(n p) {S()
,
(p m)
S()
5.3.3
163
T
ecnicas de diagn
ostico
r
= (I H)r X
n
X
i=1
1
ri Wi (I H)T W ,
2
(5.9)
MODELOS PARAMETRICOS
164
(I H)Xkj .
Logo, as contribuicoes desses dois termos, que possivelmente explicam os
problemas encontrados nas analises de diagnostico baseadas em r, podem ser
W ).
removidas projetando-se r em C (X,
W ) e
Sejam H2 e H1 os operadores de projec
ao ortogonal em C (X,
(5.10)
165
2 =
2 )r
rT (I H
.
2)
tr(H
1 )r}i
{(I H
,
2 )r}1/2
{(I H
i = 1, . . . , n.
(5.11)
ii
i3/8
de probabilidades dos resduos projetados ordenados s(i) versus 1 n+1/4
pode ser u
til, onde () e a func
ao acumulativa da normal padrao. A analise
dos resduos em (5.11) procede-se similarmente ao modelo normal linear.
MODELOS PARAMETRICOS
166
5.3.4
Medidas de Influ
encia
(5.12)
ex
Logo, 1 depende
onde X
i sao avaliados em e x
i e a i-esima coluna de X.
(i)
de quantidades correspondentes ao i-esimo ponto e de quantidades conhecidas
que envolvem todas as observac
oes.
A distancia de Cook e expressa por
2
T (X
T X)(
(i) )/ps
Di = ((i) )
,
onde s2 foi definido anteriormente. Usando (5.12) na expressao acima, obtemse a forma aproximada
ii
t2
h
Di1 = i
,
ii )
p (1 h
ii )1/2 } e o i-esimo resduo ordinario Studentizado, i =
onde t2i = ri /{s(1 h
1, . . . , n. Os criterios de calibrac
ao para a regressao normal linear podem ser
P
estendidos para o caso nao-linear desde que os contornos de S() = {yi
i ()}2 sejam aproximadamente elpticos. Isso porque em muitos problemas
de regressao normal nao-linear as regioes de confianca usuais para podem ser
seriamente viesadas (Beale, 1960), e o vies pode depender da parametrizac
ao
167
5.3.5
Gr
afico da Vari
avel Adicionada
5.4
Modelos Heteroced
asticos
MODELOS PARAMETRICOS
168
s2
i
X
,
(ij hij )2 (yi y)(yj y)
(5.13)
i,j
(5.14)
169
= e
facil verificar que o EMQ = (X T X)1 X T y satisfaz E()
E
T
1
T
T
1
Cov() = (X X) X X(X X) .
As principais formas de modelar a heterocedasticidade sao:
(i) i2 = (ziT )2 , ou seja, o desvio padrao de yi e uma func
ao linear de
variaveis exogenas;
(ii) i2 = 2 (xTi )2 , ou seja, a vari
ancia e proporcional a uma potencia (em
geral par) do valor esperado;
(iii) i2 = exp(ziT ), ou seja, o logaritmo da vari
ancia e uma func
ao linear de variaveis exogenas. Esta u
ltima suposic
ao define o modelo heteroced
astico multiplicativo.
Apresenta-se agora o processo de estimac
ao dos 0 s e dos parametros das
funcoes de variancia acima, supondo que os dados sao nao-correlacionados.
(i)
i=1
(5.15)
i=1
MODELOS PARAMETRICOS
170
n
X
i=1
!1
(ziT )1 zi ziT
n
X
(ziT )2 zi |ri |.
i=1
0
O metodo de MV fornece a 3a
ao
alternativa para estimar . Se os i s s
normais, a log-verossimilhanca para e e
2
n
X
1 X yi xTi
T
`(, ) =
log zi
.
T
2
z
i
i
i=1
(y X )
e
timativas de MV restritas a = 0, ou seja,
1 = n1 (y X )
T
1
T
2 diag{(xTi )2 }.
171
de e, entao, definir .
T 1
2 = (n p)1 (y X )
(y X ).
Se y tem distribuicao normal multivariada, pode-se usar o metodo de MV para
estimar conjuntamente e . A dependencia de sobre implica que tanto
a funcao (y X)T 1 (y X) quanto a log-verossimilhanca nao sao agora
funcoes quadraticas de . Metodos iterativos sao necessarios para obter os
EMV neste caso.
(iii)
yi = xTi + i , E(i ) = 0, Var(i ) = i2 = exp(ziT ),
T
onde zi e um vetor 1q contendo vari
aveis explicativas adicionais para estimar
q
R . O primeiro elemento de zi e comumente 1. O EMQG de e
( n
)1 n
X
X
=
exp(z T )xi xT
exp(z T )xi yi .
(5.16)
i
i=1
i=1
(5.17)
i=1
MODELOS PARAMETRICOS
172
i=1
i=1
1X T
1X
zi
exp(ziT )(yi xTi )2 .
2
2
X X
0
K=
.
1 T
0
2Z Z
A ortogonalidade entre e facilita o calculo da estrutura de covari
ancia
assintotica dos EMV de e bastando inverter K.
5.5
Modelos Autocorrelacionados
1
v
= v2 =
1 2
n1
n2
..
.
n3
n1
n2
.
(5.19)
173
A inversa de e
1 = v2 1
1 + 2
2
= v
0
0
0
0
1 + 2
..
.
0
0
0
1 + 2
0
0
0
0
0
P =
1 0
1
..
.
0
0
0
0
0
0
0
0
1
1
e definida de P T P = 1 .
Quando e desconhecido, deve-se estima-lo por para obter o estimador
n
X
ri ri1
i=2
n
.X
ri2 ,
i=1
n
X
i=2
(ri ri1 )2
n
.X
i=1
ri2 ;
MODELOS PARAMETRICOS
174
(c) estatstica de Theil-Nagar
3 =
5.6
n2 2 + p2
.
n 2 p2
Exerccios
1.3,
1.3,
1.9,
3.4,
5.3,
20.9
175
i = 1 i1 + 2 i2 + vi ,
0
1
2
2
1
1 + 1 1 + 1 2 2
0
2
2
2 1 + 1 2 2
1
+
0
1
2
1 =
.
.
..
0
0
0 1
0
0
0
1
Sendo P T P = 1 mostre que
v /e
0
0
p
p
1 1 22
1 22
0
2
1
1
P =
0
2 1
0
0
0
0
0
0
v
=
onde
e
0
0
0
1
..
.
0
0
0 0
0 0
0 0
0 0
,
1 0
1 1
1/2
(1 + 1 )
2
2
[(1 2 ) 1 ]
e 1 = 1 /(1 2 ).
(1 2 )
MODELOS PARAMETRICOS
176
H0 : 2 = 1.
x
10
17
22
25
20
45
66
85
para
7. Considere o modelo parcialmente nao-linear = E(y) = + +x
explicar a resistencia y de um termostato pela temperatura x. Utilize o
conjunto de dados:
yi :
34.780
28.610
23.650
19.630
16.370
13.720
11.540
9.744
8.261
7.030
6.005
5.147
4.427
3.820
3.307
2.872
e xi = 50 + 5i, i = 0, 1, . . . , 15.
Mostre utilizando o algoritmo iterativo (5.8) que as estimativas dos
parametros sao
= 5.145, = 6.14 105 e = 3.44 104 .
10. Considere o modelo normal nao-linear
y = {1 exp(x)} +
ajustado ao seguinte conjunto de dados:
x
4.3
8.2
9.5
10.4
12.1
13.1
Captulo 6
An
alise de Dados Reais
atrav
es dos Sistemas GLIM e
S-Plus
6.1
O sistema S-Plus
178
MODELOS PARAMETRICOS
6.2
Sistema de Avaliac
ao - Uma Introduc
ao
Um Sistema de Avaliacao re
une um conjunto amplo de conhecimentos na area
de engenharia e arquitetura, bem como em outras areas de ciencias sociais,
exatas e da natureza, com o objetivo de determinar tecnicamente o valor de
um bem, de seus direitos, frutos e custos de reproduc
ao, etc. Os Sistemas de
Avaliacao sao empregados para subsidiar tomadas de decisao com respeito aos
valores, custos e alternativas de investimento, envolvendo bens de qualquer
natureza, tais como: imoveis, maquinas e equipamentos, automoveis, moveis e
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
179
6.3
O Banco de Dados
Foram analisados dois bancos de dados que podem ser solicitados aos autores.
O primeiro, chamado de ND1CA, corresponde a 376 casas de uma area prederterminada da Regiao Metropolitana do Recife (RMR). O segundo, chamado
de ND1AP, corresponde a 847 apartamentos de uma area pre-derterminada
da RMR. Em ambos, a variavel dependende corresponde ao Valor do Im
ovel
em Reais, sendo expressa por val. Inicialmente, um total de 17 vari
aveis
explicativas de natureza qualitativa - dicotomica (0: ausencia; 1: presenca) ou
categorica - e quantitativa foram utilizadas, sendo expressas por:
Vari
aveis dicot
omicas
pri - o imovel encontra-se situado em uma via primaria de trafego;
sec - o imovel encontra-se situado em uma via secundaria de trafego;
col - o imovel encontra-se situado em uma via coletora;
loc - o imovel encontra-se situado em uma via de trafego local;
cor - o imovel encontra-se situado em um corredor;
MODELOS PARAMETRICOS
180
6.4
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
181
Figura 6.1:
MODELOS PARAMETRICOS
182
res
pre
z4
z6
z7
z8
ord
des
are
ida
pad
con
-0.356266106
NA
0.317888997
-0.030744086
-0.186307728
NA
-0.207511917
NA
0.002500768
-0.002069625
0.122875582
0.062027793
0.1279168269
NA
0.4644359886
0.4707628986
0.4646634260
NA
0.2298971411
NA
0.0002238083
0.0019946574
0.0394806771
0.0440757947
-2.78513871
NA
0.68446246
-0.06530694
-0.40095200
NA
-0.90262939
NA
11.17370479
-1.03758398
3.11229673
1.40729835
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
183
ord, ida e con apresentam desvio residual inferior a 21,0.05 = 3, 841, sendo
excludas do modelo.
Apos os ajustes citados anteriormente, obtemos o seguinte modelo:
*** Generalized Linear Model ***
Call: glm(formula = val ~ sec + col + z4 + z6 + are + pad, family = Gamma(
link = log), data = ND1CA, na.action = na.exclude, control =
list(epsilon = 0.0001, maxit = 50, trace = F))
Deviance Residuals:
Min
1Q
Median
3Q
Max
-3.032018 -0.4416364 -0.1736085 0.2251939 3.089711
Coefficients:
Value
Std. Error
t value
(Intercept) 10.298084396 0.0723736857 142.2904512
sec 0.320533577 0.1474347065
2.1740714
col 0.051003938 0.0912540983
0.5589222
z4 0.473329928 0.0868856134
5.4477365
z6 0.149000473 0.1064030890
1.4003397
are 0.002530693 0.0002362635 10.7113171
pad 0.114787876 0.0413550475
2.7756678
Dispersion Parameter for Gamma family taken to be 0.4784381
Null Deviance: 348.8528 on 375 degrees of freedom
Residual Deviance: 178.379 on 369 degrees of freedom
Number of Fisher Scoring Iterations: 4
Analysis of Deviance Table
Gamma model
Response: val
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev
NULL
375
348.8528
sec 1 6.63122
374
342.2216
col 1 5.28585
373
336.9357
z4
1 46.24801
372
290.6877
z6
1 11.07410
371
279.6136
are 1 97.77260
370
181.8410
pad 1 3.46200
369
178.3790
MODELOS PARAMETRICOS
184
2370,0.05
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
185
Figura 6.2:
res.pear
-1
-30
-20
-10
10
20
30
40
50
nova.cov - idade
MODELOS PARAMETRICOS
186
Figura 6.3:
Nao Linearidade de um Sub-conjunto de Covariaveis
7
6
res.pear
5
4
3
2
1
0
-1
-0.1
0.0
0.1
constructed residuals
(residuos construidos)
Regression Analysis
The regression equation is
res.pearson = -0.135 constr
Predictor
Noconstant
constr
Coef
StDev
-0.1350
0.8477
-0.16
0.874
S = 0.6822
Analysis of Variance
Source
Regression
Error
Total
DF
1
375
376
ss
0.0118
174.5466
174.5584
ms
0.0118
0.4655
F
0.03
p
0.874
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
187
Figura 6.4:
MODELOS PARAMETRICOS
188
Figura 6.5:
Figura 6.6:
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
189
significativa no desvio. Este resultado pode implicar que algumas das vari
aveis
explicativas aparecam sob forma nao-linear. Entretanto, deve-se salientar que
para as demais ligacoes o metodo iterativo de Fisher nao obteve convergencia.
*** Generalized Linear Model ***
Coefficients:
Value Std. Error
t value
(Intercept) 40.29830814 4.300141234 9.371392
sec
2.59200294 0.352392682 7.355439
col
0.26403989 0.090640058 2.913060
z4
3.68476056 0.456969306 8.063475
z6
1.17327321 0.172771254 6.790905
are
0.02318127 0.002955007 7.844742
neta.2 -0.28126320 0.040448882 -6.953547
Residual Deviance: 165.0336 on 369 degrees of freedom
Number of Fisher Scoring Iterations: 4
Analysis of Deviance Table
Terms added sequentially (first to last)
Df Deviance Resid.
Df Resid. Dev
NULL
375
348.8528
V2 1 6.63122
374
342.2216
V3 1 5.28585
373
336.9357
V8 1 46.24801
372
290.6877
V9 1 11.07410
371
279.6136
V15 1 97.77260
370
181.8410
neta.2 1 16.80741
369
165.0336
Figura 6.7:
MODELOS PARAMETRICOS
190
Figura 6.8:
191
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
6.5
Figura 6.9:
Apartamentos - ND1AP
Freqncia
200
100
0
0
100000
200000
300000
Valor do Imovel
400000
MODELOS PARAMETRICOS
192
A ligacao logartmica foi utilizada devido aos problemas que podem ocorrer com a ligacao canonica no modelo gama. Em relac
ao `a importancia de
cada variavel, sabemos que pode ser medida atraves de uma analise de desvio
para uma seq
uencia de modelos encaixados. Estes resultados sao apresentados
a seguir.
*** Generalized Linear Model ***
Call: glm(formula = val ~ pri + sec + col + loc + cor + res + pre + z4 + z6 +
z7 + z8 + ord + des + are + ida + pad + con, family = Gamma(
link = log), data = ND1AP, na.action = na.exclude, control =
list(epsilon = 0.0001, maxit = 50, trace = F))
Deviance Residuals:
Min
1Q
median
3Q
Max
-2.386343 -0.1522035 -0.003152855 0.1456799 3.027486
Coefficients: (3 not defined because of singularities)
(Intercept)
pri
sec
col
loc
cor
res
pre
z4
z6
z7
Z8
ord
des
are
ida
pad
con
Value
9.782878704
-0.523239183
-0.339563690
-0.425028464
-0.446994646
-0.267121977
-0.111789602
NA
0.311544824
-0.021372095
-0.037993131
NA
0.103537981
NA
0.005259481
0.010170396
0.057711376
-0.053680467
Std. Error
0.6326473324
0.3882009237
0.3955977960
0.3981416096
0.3977108488
0.0623660334
0.0543454901
NA
0.1074950889
0.1065759066
0.1115294913
NA
0.3783041202
NA
0.0002037686
0.0014754314
0.0201323875
0.0430135225
t value
15.4633999
-1.3478566
-0.8583559
-1.0675309
-1.1239187
-4.2831324
-2.0570171
NA
2.8982238
-0.2005340
-0.3406555
NA
0.2736898
NA
25.8110547
6.8931679
2.8665938
-1.2479905
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
193
Gamma model
Response: val
Terms added sequentially (first to last)
Df Deviance Resid. Df Resid. Dev
NULL
846 504.3072
pri 1
8.3309
845 495.9763
sec 1
17.0703
844 478.9060
col 1
3.7657
843 475.1403
loc 1
0.5409
842 474.5994
cor 1
4.2090
841 470.3904
res 1
19.3292
840 451.0612
pre 0
0.0000
840 451.0612
z4 1 175.6190
839 275.4423
z6 1
0.1511
838 275.2912
z7 1
0.6240
837 274.6672
Z8 0
0.0000
837 274.6672
ord 1
0.8410
836 273.8262
des 0
0.0000
836 273.8262
are 1 154.2938
835 119.5325
ida 1
13.0076
834 106.5249
pad 1
1.1794
833 105.3454
con 1
0.2241
832 105.1213
MODELOS PARAMETRICOS
194
Deviance Residuals:
Min
1Q
Median
3Q
Max
-2.379498 -0.1561799 -0.002628095 0.1450961 3.034516
Coefficients:
Value
Std. Error
(Intercept) 9.167502083 0.1053944762
pri -0.099153328 0.0874509834
sec 0.093994106 0.0374541477
cor -0.258538798 0.0613611537
res -0.103498193 0.0539980078
z4 0.331896269 0.0342282873
are 0.005265093 0.0002036334
ida 0.010045124 0.0014284290
pad 0.054710266 0.0194984129
t value
86.982757
-1.133816
2.509578
-4.213395
-1.916704
9.696549
25.855742
7.032288
2.805883
Finalmente, apos as u
ltimas alterac
oes, obtemos o modelo abaixo:
*** Generalized Linear Model ***
Call: glm(formula = val ~ pri + sec + cor + res + z4 + are + ida, family =
Gamma(link = log), data = ND1AP, na.action = na.exclude,
control = list(epsilon = 0.0001, maxit = 50, trace = F))
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
195
Deviance Residuals:
Min
1Q
Median
3Q
Max
-2.381841 -0.1651449 -0.002783275 0.1451711 3.13695
Coefficients:
Value
Std. Error
(Intercept) 9.095695865 0.1029743775
pri -0.113232118 0.0893524666
sec 0.095537348 0.0382937153
cor -0.264712457 0.0627466859
res -0.105657393 0.0552163316
z4 0.353537504 0.0341939889
are 0.005547092 0.0001869459
ida 0.011735283 0.0012856030
t value
88.329700
-1.267252
2.494857
-4.218748
-1.913517
10.339171
29.672174
9.128233
Da mesma forma que no caso das casas, o desvio residual do modelo para
os apartamentos (106,676) esta abaixo do valor crtico 2839,0.05 = 907, 50,
levando-nos a aceitar o modelo proposto. Tem-se, ainda, que todas as vari
aveis
explicativas includas sao significantes devido aos seus respectivos desvios
estarem acima do valor crtico 21,0.05 = 3, 841. Alem disso, o n
umero reduzido
de iteracoes ate a convergencia das estimativas dos parametros colabora com
o modelo ajustado.
Pela Figura 6.10 podemos observar que as observac
oes 191, 346, 631, 752
e 811 encontram-se afastadas da massa de dados por apresentarem desvios
MODELOS PARAMETRICOS
196
Figura 6.10:
Desvio Residual versus Valores Ajustados
631
811
Deviance Residuals
346
214
212
463
-1
213
211
-2
419
752
0
191
200000
400000
600000
800000
197
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
Figura 6.11:
Pontos de Alavanca
0.07
0.06
0.05
h
0.04
0.03
0.02
h =0,01 5
0.01
0.00
100 200 300 400 500 600 700 800
Obs.
Figura 6.12:
Pontos de Influncia
631
4
419
3
2
346
463
191
752
211
212
213
214
811
T = 0,1944
0
100 200 300 400 500 600 700 800
Obs.
MODELOS PARAMETRICOS
198
Value
27.93498860
-0.79471882
0.47215794
-0.26973313
0.15092937
1.93465476
0.03726713
0.06997701
-0.24354429
Std. Error
2.068248783
0.122676308
0.057370926
0.066893504
0.065877635
0.175324754
0.003511148
0.006547747
0.026740149
t value
13.506590
-6.478177
8.229917
-4.017929
2.291056
11.034693
10.613943
10.687188
-9.107813
199
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
Figura 6.13:
res.pear
5
4
3
2
1
0
-1
-2
-1
nova.cov - neta2.ap
MODELOS PARAMETRICOS
200
Figura 6.14:
Verificao da Funo de Varincia
191
0.5
1.0
752
0.0
sqrt(abs(Deviance Residuals))
1.5
631
10
11
12
Figura 6.15:
13
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
201
6.6
t value
109.722683
-1.809862
2.203425
-2.732981
-0.100770
12.093466
38.170352
13.483144
O sistema GLIM
202
MODELOS PARAMETRICOS
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
6.7
203
Admitindo-se que o sistema GLIM esta pronto para ser usado, o primeiro
passo sera a entrada dos dados. A maneira mais simples de entrada de dados
no GLIM ocorre quando o n
umero de observac
oes e pequeno e sua entrada
e realizada via teclado. Muitas vari
aveis nos MLGs representam vetores de
um mesmo comprimento, usualmente, o n
umero observado de casos. Para
especificar que o n
umero de dados e INT usa-se a diretiva $UNITS INT $.
Com a definicao do comprimento padrao dos vetores, deve-se citar aqueles
que correspondem aos dados que serao lidos e, depois, inserir esses dados. Isto
e feito atraves das diretivas $DATA [INT] LISTA DE VETORES $ READ ...
DADOS ...$. O comando READ implica numa leitura cclica dos dados na
ordem mencionada pela declarac
ao DATA.
Entretanto, normalmente estamos interessados em analisar uma grande
quantidade de dados armazenados em arquivo. Neste caso, a leitura das observacoes sera realizada atraves do comando $DINPUT INT1 [INT2] $, onde
INT2 e a largura declarada, opcionalmente, do arquivo INT1. Para checar
os valores lidos o comando $LOOK [INT1 [INT2]] LISTA DE VETORES $
imprime, em paralelo, as componentes sucessivas, entre as posic
oes INT1 e
INT2, dos vetores lidos.
6.8
Uma seq
u
encia tpica de diretivas
MODELOS PARAMETRICOS
204
definir o n
umero de dados
$FACTOR
identificar as vari
aveis independentes qualitativas e
definir as suas quantidades de nveis
$DATA
rotular as vari
aveis cujos valores serao lidos
$READ
$CALCULATE
$PLOT
observar a relac
ao funcional entre as vari
aveis
$CALCULATE
$PLOT
$YVARIATE
definir a vari
avel dependente
$ERROR
definir a distribuic
ao da vari
avel resposta
$LINK
definir a ligac
ao
$FIT
realizar um ajustamento
$FIT
$DISPLAY
$PLOT
$END
$STOP
sair do GLIM
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
6.9
205
Definic
ao e Ajustamento de um MLG
6.10
Assinaturas de TV a Cabo
Esta parte do livro tem como objetivo desenvolver modelos lineares generalizados para analisar dados de assinaturas de TV a cabo, demanda de energia
eletrica e importacao brasileira.
MODELOS PARAMETRICOS
206
350.000
255.631
31.000
34.840
153.434
26.621
18.000
9.324
32.000
28.000
8.000
5.000
15.204
97.889
93.000
3.000
2.600
18.284
55.000
1.700
270.000
46.540
20.417
120.000
46.390
14.500
9.500
81.980
39.700
4.113
8.000
99.750
33.379
35.500
9839
10606
10455
8958
11741
9378
10433
10167
9218
10519
10025
9714
9294
9784
8173
8967
10133
9361
9085
10067
8908
9632
8995
7787
8890
8041
8605
8639
8781
8551
9306
8346
8803
8942
14.95
15.00
15.00
10.00
25.00
15.00
15.00
15.00
10.00
15.00
17.50
15.00
10.00
24.95
20.00
9.95
25.00
15.50
15.00
20.00
15.00
15.00
5.95
25.00
15.00
9.95
20.00
18.00
20.00
10.00
10.00
9.95
15.00
17.50
10.00
7.50
7.00
7.00
10.00
7.66
7.50
7.00
5.60
6.50
7.50
8.95
7.00
9.49
7.50
10.00
7.55
6.30
7.00
5.60
8.75
8.73
5.95
6.50
7.50
6.25
6.50
7.50
6.00
6.85
7.95
5.73
7.50
6.50
16
15
11
22
20
18
12
17
10
6
8
9
7
12
9
13
6
11
16
6
15
9
10
10
9
6
6
8
9
11
9
8
8
8
13
11
9
10
12
8
8
7
8
6
6
9
7
7
7
6
5
5
6
6
5
6
6
5
7
4
5
4
4
4
6
5
4
5
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
207
208
MODELOS PARAMETRICOS
1.0000
7
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
209
MODELOS PARAMETRICOS
210
Figura 6.18: Resduos ordenados de Anscombe versus quantis da normal N (0, 1).
$PLOT ORD NN * $
0.8000 |
0.7200 |
*
0.6400 |
0.5600 |
0.4800 |
** *
0.4000 |
***
0.3200 |
**
0.2400 |
0.1600 |
**
0.0800 |
**2**
0.0000 |
**
-0.0800 |
*2
-0.1600 |
**2
-0.2400 |
*2**
-0.3200 |
****
-0.4000 |
*
-0.4800 |
*
-0.5600 |
* *
-0.6400 |
-0.7200 |
*
-0.8000 |
----------:---------:---------:---------:---------:---------:---------:
-3.00
-2.00
-1.00
0.00
1.00
2.00
3.00
$DIS ME $
Current model:
number of units is
y-variate
weight
offset
ASSI
*
*
40
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
211
estimate
s.e.
parameter
1
-2.190
2.117
1
2
0.4006
0.03043
DOMI
3
0.1786
0.06360
TAXA
4
-0.6937
0.2153
CUST
5
0.5508
0.1602
CADI
scale parameter taken as 0.1274
Apesar desse novo modelo ter um desvio um pouco maior do que o desvio
do modelo anterior, o mesmo tambem e aceito pelo teste aproximado da distribuicao qui-quadrado. Todas as covari
aveis sao significativas, mas o sinal da
covariavel TAXA nao e o esperado, pois se a taxa de instalac
ao e acrescida
de US$ 1 o n
umero esperado de assinantes cresce, diferentemente do que se
esperaria. Neste caso, a taxa teria que ser negativa para que tivessemos um
decrescimo no n
umero esperado de assinantes. Com isso iremos tambem retirar do modelo a covariavel TAXA, pois o valor da taxa de instalac
ao cobrado
pelas empresas de TV a cabo e irrelevante para o nvel de renda americano.
$YVAR ASSIN $ERR G $LIN I $
model changed
$FIT DOMIC+CUSTO+CADI $
deviance = 5.2985 at cycle
d.f. = 36
$DIS ME $
Current model:
number of units is
y-variate
weight
offset
40
ASSI
*
*
MODELOS PARAMETRICOS
212
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
213
$DIS ME $
Current model:
number of units is
40
MODELOS PARAMETRICOS
214
y-variate
weight
offset
ASSI
*
*
estimate
s.e.
parameter
1
0.5643
3.372
1
2
0.4037
0.03030
DOMI
3
-0.6899
0.2015
CUST
4
0.5050
0.1608
CADI
5
-0.1212
0.2954
TAXA
6
0.008338
0.008228
TX2
scale parameter taken as 0.1274
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
215
MODELOS PARAMETRICOS
216
6.11
Demanda de Energia El
etrica
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
217
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
MODELOS PARAMETRICOS
218
$DATA 92 ANO T ELAR
20 2
0.68406653
20 3
0.89883024
20 4
0.73912853
21 1
0.85256535
21 2
0.69459844
21 3
0.88925880
21 4
0.73861104
22 1
0.86724007
22 2
0.69785839
22 3
0.84755844
22 4
0.73958969
23 1
0.82811236
23 2
0.68105930
23 3
0.94196534
23 4
0.74517667
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
ELAR
*
*
92
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
219
estimate
s.e.
parameter
1
-2.228
0.2395
1
2
-0.1125
0.02396
PER
3
0.07300
0.02012
PGR
4
163.0
14.16
RECA
5
0.1262
0.02217
D1
6
-0.04949
0.02409
D2
7
0.1102
0.02369
D3
scale parameter taken as 0.002020
MODELOS PARAMETRICOS
220
$CAL Z=LP*LP $
$Yvar ELAR $ERR N $LIN L $
model changed
$FIT PER+PGR+RECA+D1+D2+D3+Z $
deviance = 0.16957 at cycle 3
d.f. = 84
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
221
Figura 6.25: Resduos ordenados de Anscombe versus quantis da normal N (0, 1).
$PLOT ORD NN * $
0.1000 |
*
0.0900 |
* *
0.0800 |
*
0.0700 |
**
0.0600 |
22
0.0500 |
22
0.0400 |
3
0.0300 |
4433
0.0200 |
*4
0.0100 |
53
0.0000 |
*4
-0.0100 |
*4
-0.0200 |
243
-0.0300 |
*42
-0.0400 |
332
-0.0500 |
*22
-0.0600 |
2
-0.0700 |
**
-0.0800 |
-0.0900 |
* * *
-0.1000 |
----------:---------:---------:---------:---------:---------:---------:
-3.60
-2.40
-1.20
0.00
1.20
2.40
3.60
MODELOS PARAMETRICOS
222
(PGR) aumentar e quando a renda per capita (REC) aumentar. Isto pode
ser analisado pela sensibilidade marginal, isto e, para cada 1% de aumento do
preco da tarifa implicara uma reduc
ao de cerca de 10% da demanda de eletricidade; entretanto, um aumento de 1% no preco do gas natural acarretaria
um aumento de 7,57% na demanda de eletricidade.
Figura 6.26: Resduos de Pearson versus valores ajustados.
$PLOT R FV * $
0.1600 |
0.1440 |
*
0.1280 |
0.1120 |
* *
0.0960 |
*
*
*
0.0800 |
*
*
0.0640 |
22
*
* **
** * *
0.0480 |
* *
*
*
*
0.0320 |
2
* * *
3 *
*
0.0160 |
**
*
* 2
*
0.0000 |
* *
* 22
*
*
-0.0160 |
*
*
*
*
-0.0320 |
**
2
22*
* *
-0.0480 |
2 * 2**
2
-0.0640 |
*
* * * *
2 *
** *
-0.0800 |
*
*
-0.0960 |
-0.1120 |
*
*
-0.1280 |
* *
-0.1440 |
-0.1600 |
----------:---------:---------:---------:---------:---------:---------:
0.160
0.320
0.480
0.640
0.800
0.960
1.120
6.12
Importac
ao Brasileira
O impacto das variaveis que influenciam a balanca comercial tem sido amplamente discutido apos a abertura economica diante do processo de inserc
ao
da economia brasileira na globalizac
ao dos anos 90. Do ponto de vista da
poltica economica e importante identificar estes impactos, bem como, o efeito
dinamico de polticas monetarias e cambiais frente aos setores que se relacionam com o comercio internacional.
Dentro deste contexto, ha um particular interesse em examinar detalhadamente a dinamica da desvalorizac
ao e/ou valorizac
ao cambial sobre as
importacoes, dado a evidencia emprica no sentido de que esse efeito possa
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
223
ser negativo (Braga e Rossi, 1987). Para isso, utiliza-se os instrumentais estatsticos tradicionais de regressao comparativamente ao metodo que trata os
erros de estimacao de forma aleatoria.
A violacao de pressupostos sobre o erro, muitas vezes e inevitavel pelo
criterio tradicional e, por isso, utiliza-se neste trabalho a metodologia dos
modelos lineares generalizados com a expectativa de melhorar as estimativas
das relacoes de importacoes no Brasil. O objetivo e encontrar uma equac
ao
para a importacao brasileira (IM), tendo como vari
aveis explicativas a taxa de
cambio (TCI) e o Produto Interno Bruto representando a renda nacional (RN).
O modelo e calculado com dados trimestrais das contas externas do Brasil no
perodo de 1980 `a 1998 (Banco Central). As importac
oes estao especificadas
em milhoes de dolares, a taxa de cambio representa a relac
ao entre reais e
dolar, isto e, quantos reais sao gastos para comprar um dolar americano e,
por fim, a renda nacional em n
umero ndice (dez90=100). Segue-se todas as
observacoes das variaveis do modelo.
$DATA 74 IM TCI RN $READ
5482 1.629
82.17
5749 1.517
88.80
6043 1.331
87.94
5679 1.181
85.28
5605 1.315
82.06
5565 1.217
86.49
5610 1.177
82.62
5309 1.135
78.30
4804 1.434
78.34
4872 1.306
87.11
5071 1.209
85.77
4646 1.156
80.91
3824 1.740
75.88
3651 2.004
83.65
3907 1.957
82.80
4044 1.959
80.10
3155 1.971
79.10
3406 2.015
87.59
3730 2.024
87.19
3623 2.027
85.94
3094 2.036
84.55
3016 2.219
92.47
3132 2.201
95.23
MODELOS PARAMETRICOS
224
3925 2.131
3352 2.013
$DATA 74 IM TCI RN
2760 2.023
3661 1.991
4270 1.924
3565 1.832
3610 1.792
3987 1.914
3888 1.789
3516 1.692
3349 1.657
3776 1.643
3963 1.607
3548 1.557
4046 1.423
5495 1.356
5173 1.244
4576 1.046
4265 1.091
5474 1.091
6345 1.300
4330 1.380
5034 1.354
5614 1.314
6015 1.452
4630 1.499
4725 1.626
5221 1.467
5976 1.441
5230 1.421
6007 1.388
7328 1.340
6914 1.305
6049 1.283
7087 1.279
8023 1.075
11814 0.957
12065 0.942
13651 0.955
11917 0.951
12030 0.970
10738 0.980
12478 0.995
14235 1.012
15837 1.030
94.44
90.69
$READ
99.48
102.87
101.15
97.65
106.21
103.45
101.10
97.72
105.78
105.84
98.87
95.01
109.40
111.36
105.50
97.60
96.39
106.01
100.01
91.70
104.02
108.26
101.05
97.02
101.71
103.80
101.30
99.90
106.90
108.92
106.01
104.01
109.66
115.30
116.45
113.92
116.09
115.67
114.93
111.63
118.06
122.90
120.69
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
13150 1.049
15405 1.067
$DATA 74 IM TCI RN
16930 1.086
15873 1.106
13415 1.126
14591 1.147
225
116.90
123.85
$READ
126.37
122.55
118.11
125.74
E(IM)
= 3203.3 4210.7TCI + 158.92RN,
tendo como desvio D = 0.31177E + 09, (no caso soma dos quadrados dos
resduos), indicando que a vari
ancia dos dados e muito grande. O coeficiente
2
de determinacao R = 0.7106 indica que as duas vari
aveis explicativas (TCI e
RN) sao responsaveis por 71.06% da variac
ao total da importac
ao (IM). A estatstica de Durbin-Watson d = 0.2715 detectou a presenca de autocorrelac
ao
positiva.
Numa analise grafica verifica-se que a vari
ancia nao e constante ao longo
do tempo, indicando a presenca de heterocedasticidade. E foi feita uma transformacao logartmica nos dados com o objetivo de corrigir a heterocedasticidade, mas nao corrigiu a autocorrelac
ao. Para eliminar os efeitos da autocorrelacao foi feito uma transformac
ao nas vari
aveis, com isso obtemos uma
estimativa corrigida da equac
ao original, implicando na seguinte equac
ao corrigida:
E(LIM)
= 0.044203 0.26109LTCI + 1.9123LRN,
com desvio D = 1.2203. O coeficiente de determinac
ao R2 = 0.9321 indica que
93.21% da variacao total da importac
ao e explicada pelas covari
aveis LTCI e
LRN. A estatstica de Durbin-Watson d = 2.2317 indica que nao ha autocorrelacao dos erros.
Usando o GLIM tambem fizemos a analise do modelo com erro normal e
ligacoes identidade e logartmica, respectivamente. O comando FIT ajusta o
modelo com todas as variaveis explicativas.
MODELOS PARAMETRICOS
226
$units 74 $
$YVAR IM
$FIT TCI+RN $
deviance = 315765888.
d.f. =
71
$DIS MEC $
Current model:
number of units is
y-variate
weight
offset
74
IM
*
*
74
IM
*
*
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
227
1 + TCI + RN
estimate
s.e.
parameter
1
7.037
0.3855
1
2
-0.8180
0.1161
TCI
3
0.02744
0.002559
RN
scale parameter taken as 2063992.
Os dois modelos usando erro normal nao sao aceitos pelo valor tabelado
da qui-quadrado com 71 graus de liberdade ao nvel de 5%. Iremos ajustar
um novo modelo usando erro gama, ligac
oes identidade e logartmica.
$YVAR IM $ERR G $LIN I $
$FIT TCI+RN $
deviance = 6.1914 at cycle
d.f. = 71
$DIS MEC $
Current model:
number of
y-variate
weight
offset
units is
IM
*
*
74
MODELOS PARAMETRICOS
228
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
229
MODELOS PARAMETRICOS
230
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
231
Com um desvio de 3.9075 o modelo tem um bom ajuste pois esta estatstica
e muito inferior ao ponto crtico da qui-quadrado com 71 graus de liberdade.
Pela estatstica T observa-se que todas as estimativas dos parametros sao
significativas. A Figura abaixo indica que nao houve um bom ajuste dos
dados, sendo necessario ajustar um novo modelo.
Figura 6.30: Valores observados versus valores ajustados.
$PLOT YV FV * $
17600. |
16800. |
*
16000. |
**
15200. |
*
14400. |
* *
13600. |
*
*
12800. |
* *
12000. |
22
11200. |
10400. |
*
9600. |
8800. |
8000. |
*
7200. |
** *
6400. |
*
* * **
5600. |
*
* * * *2 2*
**
*
4800. |
*
4*
* **
4000. |
**2*2
*** * ****
**
3200. |
***** *
*
* * *
2400. |
*
1600. |
----------:---------:---------:---------:---------:---------:---------:
7.800
8.100
8.400
8.700
9.000
9.300
9.600
MODELOS PARAMETRICOS
232
74
LIM
*
*
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
$DIS MERC $
Current model:
number of units is
y-variate
weight
offset
74
LIM
*
*
1 + LTCI + LRN
estimate
s.e.
parameter
1
1.525
0.1262
1
2
-0.1441
0.01430
LTCI
3
0.1479
0.02687
LRN
scale parameter taken as 0.0006928
233
MODELOS PARAMETRICOS
234
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
235
236
MODELOS PARAMETRICOS
An
alise de Dados Reais atraves dos Sistemas GLIM e S-Plus
237
Modelo 1: E(LIM)
= 0.044203 0.26109LTCI + 1.9123LRN,
com erro normal;
Modelo 2: E(IM)
= 2284 4441TCI + 152.5RN, via GLIM,
com erro normal;
Modelo 3: E(LIM)
= 1.525 0.1441LTCI + 0.1479LRN, via GLIM,
com erro gama.
A literatura economica sugere modelos com erros com distribuic
ao normal.
Considerando a estimacao no GLIM para testar os erros, observou-se que os
erros nao tem distribuicao normal. Assim, testou-se varios procedimentos
obtendo-se como melhor especificac
ao aquela com distribuic
ao gama.
Observando os parametros estimados verifica-se diferencas significativas
entre os modelos, isto e, com um aumento de uma unidade no logaritmo da
taxa de cambio do modelo 1, temos um decrescimo de 0.2610 unidades no
logaritmo das importacoes, enquanto um mesmo aumento na taxa de cambio
do modelo 3, teremos uma reduc
ao menor de 0.1441 unidades no logaritmo das
importacoes brasileiras. Como o modelo 3 apresenta uma menor reduc
ao nas
importacoes, podemos considera-lo o melhor modelo dentre os tres modelos
apresentados.
238
MODELOS PARAMETRICOS
Bibliografia
[1] Aitkin, M., Anderson, D., Francis, B. e Hinde, J. (1989). Statistical modelling in GLIM. Clarendon Press, Oxford, UK.
[2] Aitkin, M. e Clayton, D. (1980). The fitting of exponencial, Weibull
and extreme value distributions to complex censored survival data using GLIM. Appl. Statist., 29, 156-163.
[3] Anscombe, F.J. (1948). The transformation of Poisson, binomial and negative binomial data. Biometrika, 37, 358-383.
[4] Anscombe, F.J. (1949). The statistical analysis of insect counts based on
the negative binomial distribution. Biometrics, 15, 229-230.
[5] Anscombe, F.J. (1953). Contribution to the discussion of H. Hotellings
paper. J. R. Statist. Soc. B, 15, 229-230.
[6] Andrews, D.F., Bickel, P.J., Hampel, F.R., Huber, P.J., Rogers, W.H.
e Tukey, J.W. (1972). Robust estimates of location. Princeton University
Press, Princeton, N.J.
[7] Andrews, D.F. e Pregibon, D. (1978). Finding the outliers that matter.
J. R. Statist. Soc. B, 40, 87-93.
[8] Aranda-Ordaz, F. (1981). On the families of transformations to additivity
for binary response data. Biometrika, 68, 357-363.
[9] Arnold, S.F. (1981). The theory of linear models and multivariate analysis. John Wiley, New York.
239
240
MODELOS PARAMETRICOS
[10] Atkinson, A.C. (1981). Robustness, transformations and two graphical displays for outlying and influential observations in regression. Biometrika, 68, 13-20.
[11] Barndorff-Nielsen, O.E. (1978). Information and exponencial families in
statistical theory. Wiley, Chichester.
[12] Barndorff-Nielsen, O.E. e Jrgensen, B. (1991). Proper dispersion models.
Aarhus, Department of Statistics - Aarhus University. (Research Report,
200).
[13] Bates, D.M. e Watts, D.G. (1980). Relative curvature measures of nonlinearity. J. R. Statist. Soc. B, 42, 1-25.
[14] Beale, E.M.L. (1960). Confidence region in nonlinear estimation. J. R.
Statist. Soc. B, 22, 41-76.
[15] Bernoulli, J. (1713). Ars conjectandi. Thurnisius, Basilea.
[16] Belsley, D.A. , Kuh, E. e Welsch, R. E. (1980). Regression diagnostics:
identifying influential data and sources of collinearity. John Wiley, New
York.
[17] Bishop, Y.M.M., Fienberg, S.E. e Holland, P.W. (1975). Discrete multivariate analysis: theory and pratice. MIT Press, Cambridge, MA.
[18] Bliss, C.I. (1935). The calculator of the dosage-mortality curve. Ann.
Appl. Biol., 22, 134-167.
[19] Box, G.E.P. e Cox, D.R. (1964). An analysis of transformation. J. R.
Statist. Soc. B, 26, 211-252.
[20] Box, G.E.P. e Tidwell, P.W. (1962). Transformations of the independent
variables. Technometrics, 4, 531-550.
[21] Braga, N.C. e Rossi, J.W. (1987). A dinamica da balanca comercial do
Brasil, 1970-84. Revista Brasileira de Economia, 41, 237-248.
[22] Collet, D. (1994). Modelling binary data. Chapman and Hall, London.
Bibliografia
241
[23] Cook, R.D. (1977). Detection of influential observations in linear regression. Technometrics, 19, 15-18.
[24] Cook, R.D. e Tsai, C.L. (1985). Residual in nonlinear regression. Biometrika, 72, 23-29.
[25] Cook, R.D. e Weisberg, S. (1982). Residuals and influence in regression.
Chapman and Hall, London.
[26] Copas, J.B. (1988). Binary regression models for contaminated data (with
discussion). J. R. Statist. Soc. B, 50, 225-265.
[27] Cordeiro, G.M. (1986). Modelos lineares generalizados. VII SINAPE,
UNICAMP.
[28] Cordeiro, G.M. e Demetrio, C.G.B. (1989). An algorithm for fitting a
quasi-likelihood model with a non-constant dispersion parameter. Lecture
Notes in Statistics, Proceedings of the GLIM89 International Conference.
Springer-Verlag, Berlin.
[29] Cordeiro, G.M e Paula, G.A. (1989). Fitting non-exponencial family nonlinear models in GLIM by using the offset facilities. Lecture Notes in
Statistics, 57, 105-144.
[30] Cordeiro, G.M e Botter, D. (1998). Improved Estimators for Generalized
Linear Models with Dispersion Covariates. Journal Statistical Computation and Simulation, 62, 91-104.
[31] Cordeiro, G.M e Paula, G.A. (1992). Estimation, large-samples parametric tests and diagnostics for non-exponencial family nonlinear models.
Communications in Statistics, Simulation and Computation, 21, 149-172.
[32] Cox, D.R. (1972). Regression models and life tables (with discussion). J.
R. Statist. Soc. B, 74, 187-220.
[33] Cox, D.R. (1975). Partial likelihood. Biometrika, 62, 269-276.
[34] Cox, D.R. e Hinkley, D.V. (1974). Theoretical Statistics. Chapmand and
Hall, London.
242
MODELOS PARAMETRICOS
[35] Cox, D.R. e Oakes, D. (1984). Analysis of survival data. Chapman and
Hall, London.
[36] Cox, D.R. e Snell, E.J. (1968). A general definition of residual (with
discussion). J. R. Statist. Soc. B, 30, 248-275.
[37] Dey, D.K., Gelfand, A.E. e Peng, F. (1997). Overdispersion generalized
linear models. Journal of Statistical Planning and Inference, 68, 93-107.
[38] Draper, N.R. e Smith, H. (1981). Applied regression analysis. John Wiley,
New York.
[39] Duffy, D.E. (1990). On continuity-corrected residuals in logistic regression. Biometrika, 77, 2, 287-293.
[40] Fisher, R.A. (1925). Statistical methods for research workres. Oliver and
Boyd, Edinburgh.
[41] Folks, J.L. e Chhikara, R.S. (1978). The inverse Gaussian distribution and
its statistical application, a review. J. R. Statist. Soc. B, 40, 263-289.
[42] Francis, B., Green, M. e Payne, C. (1993). The GLIM system generalized
linear iteractive modelling. New York.
[43] Gart, J.J. e Zweifel, J.R. (1967). On the bias of various estimators of the
logit and its variance with application to quantal bioassy. Biometrika, 54,
181-187.
[44] Gelfand, A.E. e Dalal, S.R. (1990). A note on overdispersed exponencial
families. Biometrika, 77, 55-64.
[45] Gigli, A. (1987). A comparasion between Cox & Snell residuals and deviance residuals. MSc thesis, Imperial College, London.
[46] Giltnan, D.M., Capizzi, T.P. e Malani, H. (1988). Diagnostic tests for
similar action of two compunds. Appl. Statist., 37, 39-50.
[47] Goodman, L.A. (1969). On partitioning 2 and detecting partial association in three-way contingency tables. J. R. Statist. Soc. B, 31, 486-498.
Bibliografia
243
[48] Goodman, L.A. (1970). The multivariate analysis of qualitative data: interactions among multiple classification. Journal of American Statistical
Association, 65, 226-256.
[49] Goodman, L.A. (1971). The analysis of multidimensional contingency
tables: stepwise procedures and direct estimation methods for building
models for multiple classification. Technometrics, 13, 33-61.
[50] Goodman, L.A. (1973). The analysis of multidimensional contingency tables when some variables are posterior to others: a modified path analysis
approach. Biometrika, 60, 179-192.
[51] Green, P.J. (1984). Iteratively reweighted least squares for maximum likelihood estimation and some robust and resistant alternatives (with discussion). J. R. Statist. Soc. B, 46, 149-192.
[52] Green, P.J. e Yandell, B.S. (1985). Semi-parametric generalized linear
models. Lecture Notes in Statistics, 32, 44-55, Springer-Verlag, Berlin.
[53] Haberman, S.J. (1974). The analysis of frequence data. Univ. of Chicago
Press, Chicago, Illinois.
[54] Hastie, T. e Tibshirani, R. (1986). Generalized aditive models. Statistical
Science, 1, 297-318.
[55] Hastie, T. e Tibshirani, R. (1987). Generalized aditive models. Some applications. Journal of the American Statistical Association, 82, 371-386.
[56] Hinkley, D.V. (1985). Transformation diagnostic for linear models. Biometrika, 72, 487-496.
[57] Hoaglin, D.C. e Welsch, R. (1978). The hat matrix in regression and
ANOVA. The American Statistician, 32, 17-22.
[58] Huber, P. (1973). Robust regression: asymptotics, conjectures and monte
carlo. Ann. Statist., 1, 799-821.
[59] Jennrich, R.I. (1969). Asymptotic properties of nonlinear least-squares
estimation. Annals Math. Statist., 20, 633-643.
244
MODELOS PARAMETRICOS
Bibliografia
245
246
MODELOS PARAMETRICOS
[85] Wang, P.C. (1985). Adding a variable in generalized linear models. Technometrics, 27, 273-276.
[86] Wang, P.C. (1987). Residual plots for detecting nonlinearity in generalized
linear models. Technometrics, 29, 435-438.
[87] Wedderburn, R.W.M. (1974). Quasi-likelihood function, generalized linear models and the Gauss-Newton method. Biometrika, 61, 439-477.
[88] Weisberg, S. (1985). Applied linear regression. John Wiley, New York.
[89] Wetherill, G.B. , Duncombe, P., Kenward, M., Kollerstrom, J., Paul, S.
R.e Vowden, B.J. (1986). Regression analysis with applications. Chapman
and Hall.
[90] Wilkinson, G.N. e Rogers, C.E. (1973). Symbolic description of factorial
models for analysis of variance. Appl. Statist., 22, 392-399.
Indice
adequacao do modelo, 47, 77, 104, 210 estimac
ao de maxima verossimilhanca,
analise de variancia, 11, 1315, 48, 50,
29, 152
68, 72, 105, 107, 112, 156
func
ao de ligac
ao, 3537, 40, 41, 51,
analise do desvio, 50, 51
55, 58, 66, 70, 77, 91, 94, 100,
componente aleatoria, 37, 49, 66, 69,
115, 117119, 124, 141, 144,
83, 126, 131, 134, 178
176, 179, 186, 195, 197, 207,
componente sistematica, 37, 40, 44,
226, 227, 232
49, 66, 101, 125, 126, 128, func
ao de vari
ancia, 39, 50, 53, 65, 69,
129, 141, 163
77, 95, 98, 115117, 124, 129,
131, 132, 138, 188, 197, 203
desvio residual, 79, 8189, 91, 95, 97,
func
ao desvio, 48, 50, 51, 61, 62, 64,
115, 181, 182, 184, 185, 188,
69, 71, 114
191, 193
distribuicao de Poisson, 62
ligac
oes canonicas, 41, 98
distribuicao binomial, 40, 52, 53, 60,
metodo de mnimos quadrados, 2, 130
62, 76, 101, 116
metodo escore de Fisher, 43, 44, 46,
distribuicao de Poisson, 40, 52, 54, 62
61, 102, 146, 170, 183
66, 90, 104, 116
medida de alavancagem, 20, 2325, 96
distribuicao gama, 68, 69, 71, 74, 87,
medidas de influencia, 82, 96, 164
100, 116, 117, 172, 207, 227,
modelo de Box e Cox, 100, 120, 121,
235
123, 147
equacoes normais, 3, 4, 128
modelo de regressao rgida, 154
estatstica de Cook, 2325
modelo gama, 46, 6771, 76, 78, 178,
estatstica modificada de Cook, 97
179, 189, 190, 206
estatsticas suficientes, 31, 32, 41, 70, modelo log-linear, 63, 75, 104, 105,
100, 104108, 110
110, 136, 137
247
248
MODELOS PARAMETRICOS
modelo logstico linear, 100, 101, 104, soma de quadrados dos resduos, 6, 7,
10, 160
148
modelo normal, 66, 79, 99, 100
tecnicas de diagnostico, 19, 20, 156,
modelo normal inverso, 72
161, 163
modelo normal nao-linear, 156, 159,
teste
de
normalidade, 87
164, 165
modelo normal-linear, 10, 98, 127
modelos aditivos generalizados, 126
modelos autocorrelacionados, 151, 170
modelos de quase-verossimilhanca, 128
130, 132
modelos de riscos proporcionais, 135,
137, 139
modelos heterocedasticos, 151, 152,
165
modelos hierarquicos, 105107, 111,
112, 148
modelos lineares generalizados, 35, 77,
99, 125, 139, 143, 156, 177
modelos semi-parametricos, 126
quase-verossimilhanca estendida, 131
133
regressao linear, 1, 94, 133, 146, 156,
159, 161, 163, 164
regressao linear m
ultipla, 5, 13, 26
regressao linear simples, 4, 18, 127,
128, 159, 165
resduo de Anscombe, 78, 79
resduo de Cox-Snell, 83
resduo de Pearson, 77, 78, 80, 81, 97,
176
resduo Studentizado, 22, 25
resduos padronizados, 21, 23, 25, 26