Sei sulla pagina 1di 20

14/11/2016

[0312.000284-6] ECONOMETRIA – 2016.2


C.H.: 68 horas
quarta-feira - 08h00min a 10h00min
quinta-feira – 08h00min a 10h00min
Prof. Dr. Adriano Marcos Rodrigues Figueiredo
(UFMS – Economia)
E-mail: adriano.figueiredo@ufms.br ou
amrofi@gmail.com

Econometria - Prof. Adriano M.R. Figueiredo 1

Regressão - estimação

 obtenção dos parâmetros da relação


 Análise de regressão é o estudo da dependência de
uma variável, a variável dependente, em uma ou
mais variáveis, variáveis explicativas ou
independentes.
 Yi =  + Xi + ui
  => coeficiente linear (intercepto ou constante de
regressão)
  => coeficiente angular ou inclinação
 ui => resíduo ou erro aleatório.

1
14/11/2016

Regressão simples x múltipla

 Simples – apenas um X
Y = f (X)
 Exemplo: demanda = f(preço)

 Múltipla – vários X
Y = f (X1, X2, ..., Xn)
 Exemplo: demanda = f(preço, renda, gosto)

Resíduo na regressão

 componente aleatório: inclusão de um erro


que captará os efeitos das variáveis
importantes para explicar Y mas que não
estão no modelo
 Resíduo ou erro: efeito das demais variáveis
explicativas por um termo aditivo ui
 O modelo torna-se:
Y = f (X) + ui

2
14/11/2016

Forma funcional linear

 Forma matricial
 Y = Xβ + µ

 Forma algébrica
 Yi = 0 + 1X1i + 2X2i + ... + ui

Exemplo gráfico

14

12

10

6 Y
Yest
4 residuo estimado

0
1 2 3 4 5 6 7 8

-2

-4

3
14/11/2016

Regressão

6000
5000
Produção

4000
3000
y = 104.93x + 1239.6
2000 2
R = 0.5639
1000
0
0 10 20 30 40
Número de funcionários

Figura 11. Número de funcionários e produção de uma empresa no período 1981-2000.


Fonte: Tabela 21.

Pressuposições Clássicas do Modelo


de Regressão Linear

1. Y = X +  - forma funcional / inclusão e


omissão de variáveis
2. E() = 0 - erros têm média zero
3. E(’) = σ2I - erros são homocedásticos e não
autocorrelacionados
4. X’s são Fixos ou não-aleatórios
5. i ~ N(0, 2) - erros normais
6. X’s são independentes ou ausência de
multicolinearidade
8

4
14/11/2016

1. Forma Funcional Linear


Yi = 0 + 1X1i + 2X2i + ... + εi

Y1  1 X 11  X 1k    0    1 
Y  1 X  X 2 k   1   2 
 2   21
 
          
       
Yn  1 X n1  X nk    k   n 

Y  X  
nx1 n x ( k 1) ( k 1) x1 nx1

Outras Formas Funcionais

n
Cobb-Douglas logaritmizada: log y  a 0   a i log x i
i 1

n
CES: y   a 0   a i x i
i 1

n n n
Generalizada Leontief: y  a 0   a i x i   a ij x i x j
i 1 i 1 j1

n n n
Translog: log y  a 0   a i log x i   a ij log x i log x j
i 1 i 1 j1

10

5
14/11/2016

Transformação de variáveis

 Por exemplo:
X2= W
Z = ln X
Q = ln X1/2

11

Especificação do Modelo

 Adição de variável irrelevante


 Omissão de Variáveis relevantes
 Erro de Especificação

12

6
14/11/2016

RLAME x Z
0.07

0.06

0.05

0.04

y = 0.2541x2 - 0.0188x + 0.0016


0.03

0.02

0.01
y = 0.0018x + 0.0048

0
-0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0.5
Z Linear (Z) Polinômio (Z)

13

2. Média do erro é zero

 O efeito das variáveis não explicadas é,


na média, zero
 E(ε) = 0 => senão, terei erro de
especificação

14

7
14/11/2016

Resultados de RLAME = f(RREN, RBVSP) e resíduos

.4

.2

.0

.3
-.2
.2

.1 -.4

.0

-.1

-.2

-.3
2005 2006 2007 2008 2009 2010 2011

Residual = observado menos estimado


Actual - observado
Fitted - estimado

15

16

8
14/11/2016

3. Erros homocedásticos e
não-autocorrelacionados

 Variância do erro constante para todo εi


 Normalmente se valida esta pressuposição quando usando dados de
série temporal
 Se forem diferentes, ocorre heterocedasticidade, caso típico de seção
cruzada

 Erros independentes entre si


 Pressuposição típica de dados de seção cruzada
 Se forem dependentes, ocorre autocorrelação dos erros – caso típico
de série temporal

 E(εε´)=σ2.I

17

Matriz de variância-covariância

  12  1 2   1 n 
 
  2 1  22   2 n 
E    E

     
 
 n 1  n 2   n2 

 2 0  0
  Se i=j => E(ε ε´)=σ2
0 2  0
  
E    I  E 
2
     
  Se i≠j => E(ε ε´)=0
 0 0   2 

18

9
14/11/2016

Presença de heterocedasticidade dos resíduos

19

Presença de Autocorrelação dos resíduos

20

10
14/11/2016

Autocorrelação dos resíduos

21

4. Xs são fixos ou não-estocásticos

 Não existe distribuição de probabilidade


associada aos valores de X, ou seja, X é
conhecido antes de observar Y
 Covariância entre X e os resíduos é nula
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 𝐸 𝑢𝑖 − 𝐸 𝑢𝑖 𝑋𝑖 − 𝐸 𝑋𝑖
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 𝐸 𝑢𝑖 𝑋𝑖 − 𝐸 𝑋𝑖 𝑝𝑜𝑖𝑠 𝐸 𝑢𝑖 = 0
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 𝐸 𝑢𝑖 𝑋𝑖 − 𝐸 𝑋𝑖 𝐸 𝑢𝑖 𝑝𝑜𝑖𝑠 𝐸 𝑋𝑖 é 𝑛ã𝑜 𝑒𝑠𝑡𝑜𝑐á𝑠𝑡𝑖𝑐𝑎
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 𝐸 𝑢𝑖 𝑋𝑖 𝑝𝑜𝑖𝑠 𝐸 𝑢𝑖 = 0
𝑐𝑜𝑣 𝑢𝑖 , 𝑋𝑖 = 0 𝑝𝑜𝑟 𝑝𝑟𝑒𝑠𝑠𝑢𝑝𝑜𝑠𝑖çã𝑜

22

11
14/11/2016

5. Ausência de multicolinearidade entre as


variáveis explicativas

 Micronumerosidade x multicolinearidade
 Se ocorre multicolinearidade, existe uma
relação linear entre as variáveis explicativas,
ou seja, posto de X é menor que seu número
de colunas

 Exemplo de relação linear: x1= x2 + 3X3 - 5X7


23

6. Erro tem distribuição normal

 Notação:

 ~ N 0,  2 I 

24

12
14/11/2016

Estimação::MQO::Objetivo

 Obter parâmetros que minimizam a soma


dos quadrados dos resíduos
 Obter parâmetros e matriz de variância-
covariância dos erros e variância-
covariância dos parâmetros
 Min ∑ei2 = ∑(Yi – β0 – β1X1i – β2X2i)2
 Min e’e
25

Equações normais dos Mínimos


Quadrados

ˆ 
ee  Y Y  Y X  ˆ X Y  
ˆ X X 
ˆ
( ee ) ˆ 0
 2 X Y  2 X X 
ˆ
ˆ  X Y
X X 
ˆ   X X 1 X Y
 Estimador de MQO para os
parâmetros do modelo

26

13
14/11/2016

Estimador para Var(e)

ee SQRes SQRes


s2   
n p n p G.L.


Var  Cov( ˆ )  E  ˆ   ˆ     
 
Var  Cov( ˆ )   2  X X 
1

ou
Var  Cov( ˆ )  s 2  X X 
1

27

Teste de significância dos


coeficientes estimados

 Testar a hipótese nula

H0 :  j  0
H1 :  j  0 (bilateral)
ˆ j
tcalculado  ~ tn p
sˆ G . L.
j

28

14
14/11/2016

Significância dos parâmetros II

 P-value: probabilidade associada ao valor


de t calculado: nível exato do teste t
 Comparar com valores usuais de 1%, 5%
ou 10%
 Quanto menor, melhor!!!

29

Ver exerc.xlsx

 Pasta com planilhas com estimacao


pelo excel com matrizes e pela
ferramenta de analise de dados do
excel

30

15
14/11/2016

Decomposição da variação de Y

+ (reta estimada)

Variação total = variação explicada por X + variação não-explicada

: variação devida à regressão 31

Decomposição da variação de Y

SQTot   yi2   ˆyi2  2 ˆyi eˆ i   eˆ i2   Yi  Y   Y Y  nY 2


2

SQRes   êi2  e' e  Y Y  


ˆ X Y


SQReg   ŷi2  Yˆi  Y 
2
 Yˆ Yˆ  nY 2

SQTot  SQReg + SQRes

32

16
14/11/2016

Decomposição da variação de Y

SQReg  Yˆ Yˆ  nY 2
SQRes  Y Y  ˆ X Y

 Y=f(X)+ε SQTot  Y Y  nY 2

 Variação total = variação explicada por


X + variação não-explicada
 SQTot = SQReg + SQRes

33

Coeficiente de determinação (R2)

SQReg SQRes
R²  1
SQTot SQTot

 0 < R2 < 1 se SQRes=SQT então R2=0


 se SQRes ≈ 0 então R2=1
 Quanto da Variação de Y está sendo
explicada por Variações de X
 Mede a qualidade do ajustamento
34

17
14/11/2016

Forma matricial de R2

ˆ X Y  nY 2
 ˆ X Y
Y Y  
R2   1 
Y Y  nY 2 Y Y  nY 2

SQRes

R2  1
 n-p   R 2 ajustado pelos graus de liberdade
SQTot
 n-1

35

Teste de F da regressão

 Saber se o modelo tem H 0 : 1  0,  2  0,...,  k  0


suporte estatístico
H1 : pelo menos um  i  0
 Hipótese de pelo menos SQReg
um parâmetro não nulo p -1
F ~ Fp 1,n  p
 Teste de significância SQRes G . L.

global da regressão: os n-p


X’s em conjunto explicam
Y de forma significativa

36

18
14/11/2016

Teste F da regressão II

 Fcalculado > Ftabelado => rejeitar H0 =>


existe ao menos um X explicando Y
 Quero P-value (F de significação)
menor que 10%, 5% ou 1%

37

Tabela 1. Exemplo de saída do Eviews para o Ramsey RESET Test.

Estimação

 Softwares : Excel, Eviews, Stata, SAS, SPSS, Gauss,


MatLab, TSP, R, Gretl
 Outros nos sites:
 http://www.oswego.edu/~economic/econsoftware.htm
 http://www.economicsnetwork.ac.uk/teaching/Software/Ec
onometrics
 http://emlab.berkeley.edu/eml/index.shtml
 http://www.ats.ucla.edu/stat/
 http://saree.com.mx/econometriaR

38

19
14/11/2016

Resumo

 Ideia básica: minimizar soma dos


quadrados dos resíduos
 Pressupostos clássicos
 ˆ   X X 1 X Y
Estimador dos parâmetros: 
Estimador da Var  Cov( ˆ )  s 2  X X 
1

 Ajustamento: significância dos parâmetros,


coeficiente de R², F
39

20

Potrebbero piacerti anche