(1)
(2)
1 I materiali di questa nota sono tratti da Verbeek (2006), Econometria, ed. Zanichelli e da Greene (2011),
Econometric Analysis, ed. Pearson.
(3)
Lipotesi nulla `e che i parametri del modello di regressione sono identici nei due sottoinsiemi
di dati:
H0 : A = B
dove in A raccogliamo tutti i k + 1 parametri per il gruppo A e in B tutti i k + 1 parametri
per il gruppo B. Se lipotesi nulla `e vera A = B = e il modello (1) `e valido per tutte le n
osservazioni.
Per calcolare il test di Chow:
Stimiamo la regressione di yi su xi (= x1i , ..., xki ) utilizzando tutte le n osservazioni e
calcoliamo la somma dei quadrati dei residui (RSS) questo `e il modello vincolato, valido
se lipotesi nulla `e verificata: indichiamo la somma dei quadrati dei residui di questo modello
come RSSV .
Calcoliamo la somma dei quadrati dei residui del modello non vincolato, RSSN V come la
somma dei quadrati dei residui delle due regressioni (2) e (3) sui due sottogruppi: RSSN V =
RSSA + RSSB .
Calcoliamo la statistica test:
F =
(4)
Avremo dunque:
Se i A: yi =0 + 1 x1i + ... + k xki + ui
Se i B: yi =(0 + 0 ) + (1 + 1 )x1i + ... + (k + k )xki + ui
Siano = (0 , 1 , ..., k ) e = (0 , 1 , ..., k ), `e possibile mostrare che = A e = B A .
La somma dei quadrati dei residui del modello completo (4) `e quindi uguale alla somma dei
quadrati dei residui ottenuti dai due modelli separati, RSSN V .
:
:
Il test `e basato su una regressione ausiliaria (cio`e , una regressione senza significato economico,
usata solamente per condurre il test).
Per condurre il test:
Stimiamo i coefficienti del modello (1) utilizzando OLS e calcoliamo i valori predetti yi
Verifichiamo se funzioni non lineari di yi aiutano a spiegare yi includendo yi2 , yi3 , ... , yiq
come regressori addizionali nel modello (1):
yi = 0 + 1 x1i + 2 x2i + ... + k xki + 2 yi2 + ... + q yiq + ui
(5)
Spesso si considera q = 3 o q = 4.
Il test RESET `e ottenuto sottopondendo a verifica lipotesi nulla:
H0 : 2 = 3 = ... = q = 0
Per sottoporre a verifica H0 si pu`
o calcolare un test F per i q 1 vincoli appena citati,
oppure si pu`
o considerare il test costruito calcolando nR2 della regressione ausiliaria (5).
Questa statistica test `e asintoticamente distribuita come un 2q1 (chi-quadrato con q 1
gradi di libert`
a).
Il rifiuto dellipotesi nulla informa che la specificazione del modello (1) `e sbagliata. Tuttavia
non `e raro che il test RESET rifiuti la nulla a causa dellomissione di variabili dal modello
piuttosto che per forma funzionale errata. Spesso, lintroduzione di una nuova variabile pu`
o
catturare la non linearit`a indicata dal test.
(c) Eteroschedasticit`
a e autocorrelazione
La presenza di eteroschedasticit`
a o autocorrelazione pone seri problemi per il processo di inferenza
nelle analisi basate sul metodo dei minimi quadrati. In entrambi i casi, il coefficiente stimato con
il metodo dei minimi quadrati ordinari rimane corretto e consistente. Tuttavia, poich`e non sono
pi`
u soddisfatte le ipotesi del teorema di Gauss Markov, lo stimatore non `e efficiente. Inoltre,
sono necessarie formule specifiche per il calcolo degli standard error.
Per risolvere i problemi posti dalla presenza di eteroschedasticit`
a o autocorrelazione si possono
adottare due soluzioni:
Se la forma delleteroschedasticit`
a o dellautocorrelazione `e nota, si pu`
o applicare il metodo
dei minimi quadrati generalizzati, che risulta essere lo stimatore efficiente in questo contesto.2
2 Si
I coefficienti possono essere stimati tramite il metodo dei minimi quadrati ordinari, utilizzando formule robuste per il calcolo degli standard error dei coefficienti stimati.3
Tratteremo dapprima il caso delleteroschedasticit`
a, presentando i test che possono essere utilizzati per individuare il problema. Passeremo quindi ad analizzare il problema dellautocorrelazione
degli errori, maggiormente rilevante in un contesto di serie storiche.
Eteroschedasticit`
a
Nelle applicazioni empiriche, `e utile sottoporre a test lipotesi di omoschedasticit`
a, in modo da
individuare il problema. I test che seguono possono essere utilizzare per sottoporre a test lipotesi
nulla di omoschedasticit`
a contro lalternativa che i residui siano eteroschedastici. In letteratura
sono stati proposti diversi tipi di test, che si distinguono in base alla specificazione dellipotesi
alternativa. Questi sono presentati in modo crescente per generalit`
a dellipotesi H1 (in termini
decrescenti per potenza del test).
In generale, i test per leteroschedasticit`
a si basano sulla strategia seguente: (i) stima OLS
di e conseguente calcolo dei residui di regressione u
i ;4 (ii) regressione ausiliaria con variabile
dipendente il quadrato di u
i . In tutti i casi
H0 : Var(ui |X) = 2
s2j
2nj k1
j2
s2A
FnA k1,nB k1
s2B
2
2
Nel caso di unipotesi alternativa bilaterale (H1 : A
6= B
), lipotesi nulla di omoschedasticit`
a
`e rifiutata se il rapporto delle due varianze stimate `e troppo piccolo o troppo grande; mentre nel
2
2
caso di unipotesi alternativa unilaterale (H1 : A
> B
), lipotesi nulla di omoschedasticit`
a `e
rifiutata se il rapporto delle due varianze stimate `e troppo grande.6
3 Nel caso di eteroschedasticit`
a, la formula robusta degli standard error `
e discussa sul libro di testo. Si rimanda
dunque al libro di testo per le formule: si analizzano qui i test che possono essere utilizzati per individuare la
presenza di eteroschedasticit`
a, che non sono invece trattati nel libro di testo.
4 Si ricorda che lo stimatore OLS di rimane corretto e consistente in presenza di eteroschedasticit`
a.
5 Tale propriet`
a`
e esatta se possiamo assumere una distribuzione normale dei termini di errore, altrimenti vale
in modo approssimato.
6 Se lipotesi alternativa `
2 > 2 , si pu`
e H 1 : B
o considerare la statistica test s2B /s2A , distribuita come una
A
FnB k1,nA k1 .
(6)
lineare di u
2 su una costante, yi e y2 (dove yi = x ).
i
Autocorrelazione
Il problema dellautocorrelazione `e tipico di dati osservati in serie storica.8 In questo contesto
spesso non pu`
o essere ritenuta valida lassunzione di dati i.i.d. e spesso si osservano variabili che
7 Bisogna fare attenzione al problema della multicollinearit`
a nella regressione ausiliaria. Ad esempio, se nel
modello originale (1) `
e inclusa una variabile dummy, la dummy e il suo quadrato non potranno essere contemporaneamente incluse nella regressione ausiliaria.
8 Pu`
o essere anche riscontrato in dati sezionali, quando si hanno fenomeni di clustering delle osservazioni.
Tuttavia in questa nota faremo maggiormente riferimento al caso di dati in serie storica.
presentano correlazione nel corso del tempo. Per evidenziare la differenza di contesto, indicizziamo con t le variabile, dove t = 1, ..., T (assume rilevanza lordinamento delle osservazioni).
Consideriamo il modello di regressione lineare con errori autocorrelati:9
yt = xt + ut
(7)
con
ut = ut1 + vt
(8)
v2
2
2
V (u|X) = u
..
..
.
.
T 1
T 2
2
. . . T 1
. . . T 2
1
. . . T 3
..
..
..
.
.
.
T 3
...
1
(xt xt1 ) + vt
notando che u1 `e incorrelato con v2 , ..., vt e ha varianza pari a u2 = v2 /(1 2 ). Per far s`
che il modello che include la prima osservazione presenti termini di errore omoschedastici e non
autocorrelati, si considera la seguente trasformazione:
p
p
p
1 2 y1 = 1 2 x1 + 1 2 u1
(9)
p
dove il termine di errore 1 2 u1 ha varianza v2 .
Naturalmente, il valore di `e ignoto e deve essere stimato. Una stima di pu`
o essere ottenuta
considerando la seguente regressione basata sui residui OLS:
u
t =
ut1 + et
(10)
Questo stimatore di `e consistente sotto condizioni molto generali. La stima OLS del modello
(10) pu`
o anche essere utilizzata per testare la presenza di autocorrelazione nel modello (7). La
statistica test da considerare `e (T 1) R2 , asintoticamente distribuita come un 21 con R2 il
coefficiente di determinazione della regressione in (10).
Come ottenere una matrice di varianza e covarianza robusta alla presenza di autocorrelazione per lo stimatore OLS?
In alternativa, lo stimatore OLS pu`
o essere utilizzato per ottenere una stima consistente del
parametro , utilizzando una formula robusta per il calcolo degli standard error. In generale la
varianza di pu`
o essere scritta come:
V (|X)
= (X X)
(X V (u|X)X) (X X)
Nel caso di autocorrelazione viene stimata, utilizzando i residui della regressione OLS u
t , tramite
la formula di Newey-West:
1
1
V (|X)
= (X X) T S (X X)
con
S=
T
H1
T
X
1X
1 X
xt xt u
2t +
wj
u
s u
sj (xs xsj + xsj xs )
T t=1
T j=1
s=j+1
dove wj = 1 j/H. Questa formula per il calcolo degli standard error `e nota come formula
robusta alla presenza di eteroschedasticit`
a e autocorrelazione.10
10 Si noti che ponendo w = 0 si ottiene la formula per il calcolo degli standard error robusta alla presenza di
j
eteroschedasticit`
a.