Sei sulla pagina 1di 18

ANLISE DE REGRESSO

ANLISE DOS RESDUOS

Na anlise de regresso linear, assumimos que os erros E1, E2, , En satisfazem os


seguintes pressupostos:
seguem uma distribuio normal;
tm mdia zero;
tm varincia 2 constante (homocedasticidade);
so independentes.

ANLISE DE REGRESSO

A verificao das hipteses fundamental, visto que toda a inferncia estatstica no


modelo de regresso linear (testes de hipteses) se baseia nesses pressupostos. Nesse
sentido, se houver violao dos mesmos, a utilizao do modelo deve ser posta em
causa.

A anlise dos resduos uma ferramenta popular para detectar violaes de tais
pressupostos.

Recorda-se que o i-simo resduo di a diferena entre o valor observado yi e o valor


estimado y i = Y / xi dado pela equao de regresso linear estimada.

ANLISE DE REGRESSO

NORMALIDADE DOS Eis

O pressuposto de normalidade pode ser testado recorrendo a testes de ajustamento tais


como o Teste Kolmogorov-Smirnov ou o Teste da Normalidade de Lilliefors, que sero
abordados posteriormente no captulo IV.

Essa condio tambm pode ser verificada usando um grfico de probabilidade


normal (Normal Probability Plot).

ANLISE DE REGRESSO

Existem dois tipos de grficos de probabilidade normal:


1 tipo: representa a probabilidade acumulada que seria de esperar se a

distribuio fosse normal, em funo da probabilidade observada acumulada dos


erros (Normal P-P Plot);
2 tipo: representa o quantil de probabilidade esperado se a distribuio fosse

normal em funo dos resduos (Normal Q-Q Plot).


Para produzir estes grficos, comea-se por estandardizar os resduos de forma a terem
um desvio padro unitrio:
n

di 0
onde
S
e ordenam-se por ordem crescente.
di ' =

S2 =

2
d
i

SSE
= i =1
,
n k 1 n k 1

ANLISE DE REGRESSO

Em funo do tipo de grfico, calcula-se:

Normal P-P Plot o valor da funo de distribuio para cada resduo

estandardizado, assumindo que tm uma distribuio normal; estes valores so


representados no eixo das ordenadas
a probabilidade observada acumulada usando a frmula

i 0.5
;
n
estes valores representam-se no eixo das abcissas.

ANLISE DE REGRESSO

os quantis de probabilidade esperados, ou seja, os z i tais

Normal Q-Q Plot

que P(Z < z i ) =

i 0.5
; estes valores so representados no eixo das ordenadas
n
no eixo das abcissas representam-se os resduos

estandardizados.

Se os erros possurem distribuio Normal, todos os pontos dos grficos devem


posicionarem-se mais ou menos sobre uma recta.

ANLISE DE REGRESSO

Exemplo:

Para o exemplo que temos vindo a estudar, apresentam-se os resduos estandardizados


(ordenados) e os clculos necessrios para construir os grficos de probabilidade normal.

i
1
2
3
4
5
6
7
8
9
10

Distribuio observada Quantil esperado zi:


Resduos
i 0.5
i 0.5
Resduos estandardizados
(
)
<
=
P
Z
z
i
di
di=di /S
10
10
-1,05932
-0,99153
-0,65254
-0,5678
-0,22881
-0,14407
0,09322
0,77119
1,17797
1,60169

(abcissa Q-Q Plot)

(abcissas P-P Plot)

(ordenadas Q-Q Plot)

-1,02456
-0,95899
-0,63113
-0,54917
-0,2213
-0,13934
0,090161
0,745883
1,139315
1,549131

0,05
0,15
0,25
0,35
0,45
0,55
0,65
0,75
0,85
0,95

-1,644853627
-1,036433389
-0,67448975
-0,385320466
-0,125661347
0,125661347
0,385320466
0,67448975
1,036433389
1,644853627

Distribuio
esperada
(ordenadas P-P Plot)

0,152786
0,168781
0,263979
0,291445
0,412429
0,44459
0,53592
0,772131
0,872714
0,939325

ANLISE DE REGRESSO

Distribuio esperada

Normal P-P Plot


1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
0

0,2

0,4

0,6

0,8

Distribuio observada

Os pontos do grfico tendem a concentrar-se em torno da recta de declive 1 que passa na


origem, o que d evidncia de que a distribuio dos erros normal.

ANLISE DE REGRESSO

Normal Q-Q Plot

Quantil esperado

1,5

0,5

0
-2

-1,5

-1

-0,5

0,5

1,5

-0,5

-1

-1,5

-2

Resduos

Da mesma forma, da observao do Q-Q Plot, verifica-se a presuno de normalidade


pois os resduos esto aproximadamente em linha recta.
9

ANLISE DE REGRESSO

MDIA NULA, VARINCIA CONSTANTE E INDEPNDENCIA DOS ERROS

Estes pressupostos podem ser verificados graficamente, representando os resduos em


funo dos valores estimados da varivel dependente y i (grfico residual) ou em funo

Resduos

dos valores duma das variveis independentes xi.

10

ANLISE DE REGRESSO

Os pontos do grfico devem distribuir-se de forma aleatria em torno da recta que


corresponde ao resduo zero, formando uma mancha de largura uniforme. Dessa
forma ser de esperar que os erros sejam independentes, de mdia nula e de varincia
constante.

Quando os resduos no se comportam de forma aleatria, ou seja, seguem um padro, a


condio de independncia no satisfeita.

Isto pode traduzir o facto de no existir uma relao linear entre as variveis ou ento,
no constam no modelo uma ou vrias variveis independentes que influenciam
significativamente a varivel dependente e portanto tambm os erros.

11

Resduos

Resduos

Resduos

Resduos

ANLISE DE REGRESSO

Nos 3 primeiros grficos, os resduos apresentam comportamentos padronizados, logo


no h independncia. Pelo contrrio, no ltimo grfico os resduos parecem estar
distribudos de forma aleatria, sustentando a independncia dos erros.

12

ANLISE DE REGRESSO

Se a disperso dos resduos aumentar ou diminuir com os valores das variveis


independentes xi, ou com os valores estimados da varivel dependente y i , deve ser posta

Resduos

Resduos

em causa a hiptese de varincias constante dos EiS.

No grfico da esquerda, os resduos apresentam um comportamento tendencialmente


crescente, no da direita, o comportamento tendencialmente decrescente, indicando que
h violao da hiptese de homogeneidade da varincia.

13

ANLISE DE REGRESSO

Usando um grfico residual, as violaes dos pressupostos do modelo no so sempre


fceis de detectar e podem ocorrer apesar dos grficos parecerem bem comportados.
A anlise de resduos, usando grficos residuais um mtodo subjectivo.

Nesse sentido, a verificao da independncia usualmente feita atravs do teste de


Durbin-Watson correlao entre resduos sucessivos.

Se houver independncia, a magnitude de um resduo no influencia a magnitude do


resduo seguinte. Neste caso, a correlao entre resduos sucessivos nula ( = 0). As
hipteses do teste, para aferir se a relao entre dois resduos consecutivos
estatisticamente significativa, so ento:

H0 : = 0
H1 : 0

existe independncia
existe dependncia

14

ANLISE DE REGRESSO

Estatstica d de Durbin-Watson:
n 1

d=

(d i +1 d i )
i =1

di

.
2

i =1

Tomada de deciso:
Compara-se o valor obtido para a estatstica d com os valores crticos da tabela de
Durbin-Watson, d L e dU , e toma-se a deciso recorrendo seguinte tabela:

d
Deciso

[0, d L [

[d L , dU [

[dU ,4 dU [

[4 dU ,4 d L [

[4 d L ,4[

Rejeitar H0 Nada se pode No rejeitar H0 Nada se pode Rejeitar H0


Dependncia
concluir
Independncia
concluir
Dependncia

S quando d [dU ,4 dU [, se pode concluir que os diferentes valores de Ei so


independentes.

15

ANLISE DE REGRESSO

Exemplo:

Resduos

Construmos o grfico residual relativo ao exemplo em estudo.


4

0
0

y i

10

-2

-4

A anlise grfica dos resduos, d indicao de que os resduos parecem distribuir-se


aleatoriamente volta da recta x=0, com disperso constante, sugerindo que no h
violaes srias dos pressupostos de homocedasticidade, mdia nula e de independncia
dos erros.

16

ANLISE DE REGRESSO

Para verificar o pressuposto de independncia vamos, tambm, utilizar o teste de


Durbin-Watson.
Com os dados:
Vendedor
1
2
3
4
5
6
7
8
9
10
Soma

di

-1,05932
-0,99153
-0,65254
-0,5678
-0,22881
-0,14407
0,09322
0,77119
1,17797
1,60169

di
1,122159
0,983132
0,425808
0,322397
0,052354
0,020756
0,00869
0,594734
1,387613
2,565411
7,48305

di+1 - di
-0,91526
-0,50847
1,83051
-2,23729
0,06779
0,76272
-0,33899
2,16949
-1,50847

(d i +1 d i )2
0,837700868
0,258541741
3,35076686
5,005466544
0,004595484
0,581741798
0,11491422
4,70668686
2,275481741
17,13589612

17

ANLISE DE REGRESSO

Obtm-se:

d=

17,13589612
= 2,28996
7,48305

Com n = 10, k = 2 e = 0.05, os valores crticos da tabela de Durbin-Watson so:


d L = 0.7 e

dU = 1.64

e,

[dU ,4 dU [ = [1.64, 4-1.64[ = [1.64, 2.36[


Uma vez que d=2.28996 [1.64, 2.36[, no rejeitada a hiptese de independncia.
Podemos pois admitir que os erros so independentes, ou seja, que se verifica o
pressuposto da independncia, o que vai de encontro ao que verificamos graficamente.

18

Potrebbero piacerti anche