Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
- eteroschedasticit
- autocorrelazione
L autoc.si presenta solo quando le osservazioni ha dimensione temporale.
INTRODUZIONE
Lo stimatore pi utilizzato in econometria quello dei minimi quadrati ordinari (OLS). Questo
perch, sotto certe condizioni, OLS il miglior stimatore possibile.
1 PROPRIET DELLO STIMATORE OLS in campioni finiti
Le ipotesi di Gauss-Markov
Quando queste ipotesi sono rispettate, allora lo stimatore OLS BLUE (Best Linear Unbiased
Estimator), cio il migliore stimatore non distorto (o corretto
1
) tra i vari stimatori lineari .
Le condizioni di Gauss-Markov sono 4:
1) in media la regressione vera; cio in media ci aspettiamo che le osservazioni si trovino
sulla retta. Detto in modo statistico: la media della parte stocastica (e quindi dellerrore
stocastico) condizionata alla parte deterministica (cio alle x che includiamo ) pari a zero
0 ) \ ( X i E
i
, e
0
2
Y
sar funzione del
quadrato e dei prodotti incrociati di tutte le j
X
(cio sar funzione delle
2
j
X
e delle
h j
X X
). Pertanto, occorre regredire il quadrato dei residui (
2
u ) su
Y
e
2
Y
; poi uso
2
R
per calcolare la statistica F o LM (penso come indicato al punto precedente, vedi elenco
puntato con quadratini).
LO STIMATORE WLS
Sebbene sia sempre possibile stimare errori standard robusti per le stime OLS (strategia n2), se si
conosce la forma specifica delleteroschedasticit, possibile calcolare stime pi efficienti di quelle
ottenute con il metodo OLS. Questo possibile utilizzando WLS.
Lidea di base del WLS consiste nel trasformare il modello in un altro con errori omoschedastici.
Per, ripeto, necessario conoscere la forma delleteroschedasticit.
Non facciamo ipotesi precise sulla forma delleteroschedasticit; supponiamo soltanto che
leteroschedasticit possa essere modellata nella forma:
) ( ) \ (
2
X X h u V a r
dove i
h h ) (X
(e dunque la varianza dipende dalle X (cio c eterosch.)).
Si ha che, dividendo
5
il modello (cio la y e tutte le x) per
i
h
(cio pondero il modello
moltiplicandolo per il reciproco di h) otteniamo un nuovo modello con errori standard
omoschedastici:
0 ) \ / ( X
i i
h u E
perch
i
h
solo funzione delle X e
2
) \ / ( X
i i
h u V a r
, dato che
i
h u V a r
2
) \ ( X
costante
ora c omoschedast.
( cio penso:
2 2
2
1
) (
1
) \ ( ) \ / (
'
|
'
|
i
i
i i
h
h
h
u V a r h u V a r X X X
)
(Se voglio fare questo in excel, dopo aver esplicitato la forma di h, devo dividere la y e le x per
i
h
, poi applico OLS e ottengo stime corrette, consistenti, efficienti; in gretl invece non divido
perch basta scegliere WLS piuttosto che OLS)
LO STIMATORE GLS
5
Divido per radice di h e non per h perch Var(ax)=a
2
Var(x)
6
costante Funzione, che
dipende da x
Il problema sorge quando lespressione di h complicata e quindi la trasformazione potrebbe essere
non semplice.
GLS permette di ottenere le stesse stime senza effettuare la trasformazione.
Lidea consiste nel:
1. prendere ogni residuo al quadrato e pesarlo con linverso della radice della varianza
dellerrore corrispondente (cio con linverso di ) \ (
i i
u V a r X ).
2. minimizzare la somma ponderata dei quadrati dei residui
Esso pu essere derivato direttamente minimizzando la somma dei quadrati dei residui dopo aver
diviso ogni addendo allinterno della sommatoria per
i
h
(non per
i
h
ma per
i
h
perch il min
del quadrato dei residui).
LO STIMATORE FGLS (Feasible GLS = minimi quadrati generalizzati
calcolabili)
WLS (e GLS) applicabile quando sappiamo la forma di ) \ (
i i
u V a r X .
Il problema che nella maggior parte dei casi non si conosce il modello di eteroschedasticit; le
varianze dei termini derrore non sono note.
In questi casi necessario stimare i pesi
i
h
, perch non si conoscono ( questo che prevede
FGLS): quindi al posto dei parametri ignoti
i
h
, utilizziamo una loro stima.
Per fare questa stima, di solito si inizia con un modello per la varianza che sia il pi generico
possibile
6
, ad esempio
7
:
) . . . e x p ( ) \ (
1 1 0
2
k k
X X u V a r + + + X
Stimando il modello originario (iniziale) normalmente con OLS, ottengo dei residui (stimati
ovviam; quindi li indico col cappello) ; li salvo e ne prendo il quadrato; lassunzione fatta implica
che avranno questa forma:
v X X u
k k
) ... exp(
1 1 0
2
2
+ + +
dove
1 ) \ ( X v E
.
Prendo il log di qta espressione e ottengo:
e X X u
k k
+ + + +
... ) ln(
1 1 0
2
dove E(e\x) = E(e) = 0
6
In modo che catturi tutte le possibili forme della varianza
7
Ha la forma di esponenziale perch lexp sempre positiva (nb:la varianza per definiz deve essere sempre positiva) ed
una forma funzionale molto flessibile. una forma di eteroschedasticit detta eteroschedasticit moltiplicativa.
7
OLS
2
ln
una costante, che chiamo
0
u
su tutte le variabili esplicative e calcolo i valori stimati (cio ottengo le
stime di
0
h
) ottenuta da
) exp(
g h
(cio exp della somma dei coeff stimati) , il cui
inverso rappresenta il peso. Quindi ottenuto h stimato, posso avere una stima della varianza. Quindi
procedo come sopra.
(infine) calcolo GLS usando 1/exp(
g
) come pesi.
AUTOCORRELAZIONE (o correlazione seriale)
Si ha nel caso in cui viene violata una ipotesi di Gauss-Markov per cui non tutte le covarianze tra i
termini di errore diversi sono uguali a zero.
Le conseguenze dellautocorrelazione sono simili a quelle delleteroschedasticit: OLS resta
corretto ma diventa inefficiente (non ha pi la varianza minima tra tutti gli stimatori lineari)
Di norma lautocorrelazione si verifica solo usando campioni in serie storica. Quindi indicizzeremo
le osservazioni con t=1,2,, T anzich con i=1,2,, N.
Quindi, dire che gli errori stocastici sono correlati vuol dire che esiste una certa dipendenza
temporale tra essi; ad es lerrore stoc al tempo t (
t
u
) correlato con lerrore stoc al tempo t-1.
8
La presenza di autocorrelazione pu essere il sintomo dellesistenza di variabili omesse, di una
forma funzionale sbagliata, o di un errata specificazione del modello.
Pertanto, ci che si vuole testare se gli errori stocastici siano correlati o meno. Quindi:
0 :
0
H
, (dove
lindice di correlazione)
nel modello
t t t
e u u +
1
,
n t ,..., 2
TEST PER TESTARE LA PRESENZA DI AUTOCORRELAZ. DEL PRIMO ORDINE - AR(1)
Quando ho un modello di regressione con Y e le X che sono strettamente esogene (Con
regressori strettamente esogeni)
9
, la verifica dellipotesi semplice: basta regredire i
residui
10
sul suo ritardo (oppure sui residui ritardati) (cio regredisco t
u
su 1 t
u
:
questa la regressione ausiliaria) e utilizzare la statistica t per decidere se rifiutare o meno
lhp nulla (
0 :
0
H
, cio
:
0
H
assenza di autocorrelazione).
8
Lesempio pi importante del fenomeno dellautocorrelazione si verifica quando 2 o pi termini di errore consecutivi
sono correlati.
9
2 v.a. (o regressori) sono strettamente esogene quando una di esse al tempo t indipendente dallaltra variabile non
solo allo stesso tempo t ma anche in tutti gli altri periodi. Invece, si dicono debolmente esogene quando lindipendenza
si ha solo nello stesso periodo di tempo.
10
Quindi prima devo aver stimato il modello (con OLS), e da questa stima ottengo i residui.
8
indipendente da x
t
u un modello del termine di errore
t
e i.i.d.
Un test alternativo il test Durbin-Watson.
Quando la statistica DW assume valore intorno al 2 rifiuto lipotesi di correlazione
seriale
11
; invece se significativamente (di molto) < 2 non rifiuto.
Nel caso di s.s. i regressori sono quasi sempre debolmente esogeni.
Se i regressori non sono strettamente esogeni, non sono valide n la statistica t n la
statistica DW.
Devo regredire i residui (o Y) sui valori ritardati dei residui e sulle X (Linclusione delle X
permette di tener conto della correlazione delle tj
X
con le
1 t
u
, pertanto non abbiamo
bisogno dellassunzione di stretta esogeneit)
TEST PER TESTARE LA PRESENZA DI AUTOCORRELAZIONE DI ORDINE SUPERIORE
Si pu testare una correlazione seriale AR(q) nello stesso modo di una correlazione seriale AR(1).
Bisogna, come prima, regredire i residui sui residui ritardati solo che in questo caso devo includere
q ritardi dei residui nella regressione, e verificare congiuntamente la significativit
Si pu utilizzare il test F o il test LM. La versione LM utilizzata qui chiamata Breusch-Godfrey
test
12
: uguale a
2
) ( R q n (dove
2
R
quello della regressione dei residui, detta su).
Poi confronto il valore di LM col valore critico che troviamo sulle tavole del chi-quadro
13
, per poter
decidere se rifiutare o non lhp nulla, e quindi per capire se c autocorrelazione.
CORREZIONE DELLAUTOCORRELAZIONE (Soluzioni al problema dellautocorrelazione)
Una volta accertato, attraverso i test, che esista correlazione seriale, devo agire per correggere
questo problema. Posso agire in 2 modi (come per leteroschedasticit):
1. trasformo il modello per pulirlo dalla correlazione seriale (metodo 1) oppure
2. correggo la varianza in modo tale che tenga conto dellautocorrrelaz. (metodo 2)
Iniziamo con il caso di regressori strettamente esogeni.
Si assuma che gli errori seguano un processo AR(1); pertanto
t t t
e u u +
1
, t=2,,n.
Inoltre si dimostra che quando c autocorrelaz ed di ordine 1, la varianza uguale a:
) 1 /( ) (
2
2
e t
u Var (dove
2
e
la varianza dellerrore dei residui, cio varianza dellerrore
della regressione ausiliaria, della regressione delle u).
necessario trasformare lequazione per avere errori non correlati: (metodo 1)
Questa quasi - differenziazione ci permette di ottenere un modello senza errori autocorrelati.
Il problema per applicare questo modello rappresentato dl fatto che non conosciamo
.
Dobbiamo quindi stimarlo stimatore Feasible GLS
11
H0:c autocorrelazione
12
Questo test si pu utilizzare anche in presenza di AR(1).
13
Con le tavole della chi-quadro, perch ricorda che la LM si distribuisce come una chi-quadro
9
Trasformazione:
Considero che, poich
t t t
u X Y + +
1 0
, allora il modello ritardato di 1 periodo sar
1 1 1 0 1
+ +
t t t
u X Y
.
Moltiplicando la seconda equazione per
si ottiene regredendo i residui (ottenuti applicando OLS sul modello iniziale) sui
ritardi degli stessi: la relazione esistente tra essi (cio tra i residui al tempo t e i residui al tempo t-1)
la stima di
.
Questo metodo viene detto stima di Cochrane-Orcutt
C-O calcolato iterativamente: per avere stime efficienti, si ripete tutta la procedura finch non
converge, cio finch il
1
alliterazione t e
1
a
nel suo calcolo (perch
a
proviene dalla regressione delle
X su tutte le altre X, quindi coglie la relazione tra i regressori).
NB: il fatto che nella formula c anche il prodotto in periodi diversi, fa capire che il metodo 2 si
pu usare anche se i regressori sono strettamente esogeni. Cio in caso di stretta esogeneit posso
applicare sia il metodo 1 sia il metodo 2; invece in caso di esogeneit debole posso solo applicare la
correzione della varianza (metodo 2).
(Quello nel riquadro non lo dico; dico solo ci che scritto sotto).
10
1. Stimare OLS e salvare i residui, radice di MSE
2. Effettuare la regressione ausiliare di
1 t
X
su
2 t
X
,.,
tk
X
3. Ottenere
t a
'
|
+ +
+
n
h t
h t t
g
h t
n
t
a a g h a v
1 1
2
1
1 / 1 2 (1)
(dove h il n dei ritardi)
e
]
]
]
v E S e s
2
1
/ . . ) .( .
(dove S.E.= Standard Error OLS di
j