Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
.4
100
80
Fraction
60
.2
40
20
0
0
0 20 40 60 80 100 120
SO2
Análise exploratória de dados
♦ Não quer dizer que deva ser retirada (a princípio, mas deve-se ficar
“de olho” nela).
Análise dos resíduos
♦ Resíduo:
diferença entre o valor observado (Yi) e o valor predito pela
regressão (Yˆ = βˆ + βˆ X )
i 0 1
i
ε ~ N (0 , σ ε )
2
i
Média zero
1 n
_
ε = ∑εi = 0
n i =1
Variância σ2 constante
1 n
∑
n − k − 1 i =1 ε i
2 2
Sε =
Padronização dos resíduos
Qtos DP está afastado ei Resíduo original
zi =
Não subtrais µ, pois é 0
ei − µ
S e Desvio padrão dos resíduos
zi =
S e
zi ~N(0,1)
n ε 2
1 n
2 1 i 1 1 n
2
∑ Z = ∑ = ∑ ε = 1
S 2 n − k − 1 i =1
i
n − k − 1 i =1 i n − k − 1 i =1 S
Resíduos studentizados
ei zi
ri = =
S 1 − hi 1 − hi 0 ≤ hi ≤ 1
Se eliminarmos o
média ponto, qto que alteram
os parâmetros?
Resíduo Jackknife Variância usando todos os pontos
S2 ei ( n − k − 1) − 1
r( − i ) = ri = = ri
2
S( −i ) S ( − i ) (1 − hi )
2
( n − k − 1) − ri 2
Variância tirando 1 ponto se a diferença dos modelos, das variâncias (razão grande), o ponto é influente
Se tiro, não
afeta a reta
A fórmula para hi obtida da
matriz de dados das variáveis
independentes transposta
Análise Univariada dos Resíduos Padronizados , studentizados ou
do tipo jacknife :
Análise Descritiva: Utilizando os resíduos padronizados, espera-se que, caso
sigam uma distribuição normal:
Metade deve ser negativa e metade positiva .
A média, mediana e a moda sejam “0”.
A variância é aproximadamente 1?
Aproximadamente 68% deles caiam entre os valores -1 e +1.
Aproximadamente 95% deles caiam entre os valores -2 e +2.
Aproximadamente 99% deles caiam entre os valores -3 e +3.
Comparar os maiores valores com os percentis p95 ou p99 e os menores
valores com os percentis p1 ou p5 .
Valores absolutos maiores do que 2,5 ou 3 indicariam a presença de um
possível outlier.
Coeficiente de assimetria:
3
>0 assimtria +
n 1 ei −e
n
sk (e) = ∑ , sk (e) = = 0
n − 2 n − 1 < 0
simétrico
i =1
Se assimetria −
Kurtose:
n(n + 1) 1 ei −e
norm01 norm2
norm12
n
kurt (e) = ∑ , .8
( n − 2 )( n − 3) n − 1 i =1
Se .6
.4
-4 -3 -2 -1 0 1 2 3 4
abs
observado
esperado
Gráficos bidimensionais
O ideal seria uma reta no zero, ou uma
nuvem de pontos em torno dela
180
170
1 2
160
160
Melhor Menor
150
y_pred
140
erros 1 em
140
relação ao 2
120
130
piora à
120
100
120 130 140
y
150 160 170
120 130 140 150 160 170
medida que
y
avança p/ 4
Pas = β0 + β1 Idade + e
200
3 4
180
160
150
Qualidade
y_pred
y_pred
pior
140
100
120
100
50
120 130 140 150 160 170 120 130 140 150 160 170
y y
Linearidade:
O gráfico dos resíduos
^
vs. valores preditos [leitura instrumento
f(poluente)] Y = 15.39 + 3.79 X
Não
linearidade
Violação do
poressuposto
de linearidade
Incorporar
termo
quadrático para
melhorar
ajuste?
Embora haja grande espalhamento dos pontos (em parte em função do tamanho
da amostra), a figura mostra um padrão de faixa horizontal em torno do zero.
Variância não
homogênea
Pensar em
transformação
da variável,
como termo de
maior poitência
Ex: Incluir
x2?
Resíduos vs. variáveis independentes X
O que é "muito"?
Arredondado do 2,58 que equivale a 99% da
Detecção de outliers normal (≈ da de Student g.l.?);
2 (1,96) 95%
1
2 hi e
2
i hi
di = ri =
2
k + 1 1 − hi (k + 1) S i (1− hi )
2
Resíduo Jacknife
DFbeta:
Permite avaliar o efeito de cada observação nas estimativas de
cada um dos parâmetros do modelo ajustado.
Yi = β 0 + β 1 X 1i + β 2 X 2 i + ε i
Pode-se demonstrar que
ˆ 1 Β depende das observações (cj), mas tb
β j = cj da correlação
1 − r 2
( X 1
, X )
2
para j = 1 ou j = 2
cj valor que depende dos dados.
r2(X1,X2) é ao quadrado da correlação entre X1 e X2.
Colinearidade
Colinearidade
1
Y − βˆ0 , βˆ1 e βˆ2 são proporcionais a 2 (VIF)
1 − r ( X 1 , X 2 )
Se r2(X1,X2) 1 então :
1
[1 - r2(X1,X2)] 0 e 2 →∞
1 − r ( X 1 , X )
2
1
VIF =
1 − r 2
( X 1 , X )
2
Transformações
Y1
As transformações mais usadas são:
1/x