Sei sulla pagina 1di 43

Dispensa di introduzione a Gretl preparata per gli studenti di

Econometria - CLED - A.A. 2009/2010


Chiara Monfardini
Alessia Russo

November 11, 2009

1 Introduzione a Gretl
1.1 Fonti
Gretl è un programma statistico opensource (dunque liberamente scaricabile da internet) creato
per la rielaborazione econometrica di dati di varia natura (cross-section, time-series, panel-data).
Può essere direttamente scaricato dal sito http://gretl.sourceforge.net/gretl_italiano.html, men-
tre la guida in italiano è scaricabile dal sito http://ricardo.ecn.wfu.edu/pub//gretl/manual/it/gretl-
guide-it.pdf. Seguite le procedure per il download della versione del software gretl-1.7.9.

1.2 Importazione, apertura e salvataggio di dati


Si possono importare diversi tipi di …le di dati: File gretl (*.gdt), di testo (*.txt), di tipo ASCII
(*.dat), di tipo STATA (*.dta), e altri.

1.2.1 Importazione dati con Gretl

File ! Apri dati ! Importa! ASCII (*.txt)!c:n.....ncaschool.txt


Questo …le contiene i dati sui distretti scolastici della California descritti nell’appendice 4.1
del testo di Stock & Watson, il dataset ha le seguenti caratteristiche:

- Numero di osservazioni: 420

- Numero di variabili: 16

1
Una volta caricato il dataset viene visualizzato l’elenco delle variabili e la loro breve de-
scrizione entrando nella …nestra Dati. Nel caso in cui non sia presenta una descrizione dei
dati è possibile aggiungerla selezionando la variabile, cliccando sopra con il tasto destro e se-
lezionando l’opzione Modi…ca attributi. E’inoltre possibile vedere la matrice di dati (dataset)
entrando nella …nestra Visualizza ! Finestre icone ! Dataset.

1.2.2 Salvataggio dati formato Gretl

Il salvataggio dei dati in formato Gretl avviene invece seguendo la seguente procedura: File !
Salva dati come ! Gretl ! (seleziona variabili da salvare) ! OK.

1.2.3 Apertura di …le formato Gretl

Nel caso in cui vogliate aprire un …le salvato in formato Gretl seguite la seguente procedura:
File ! Apri dati ! File utente ! c:n.....ncaschool.gdt.

1.2.4 Salvataggio dati formato CSV

Il salvataggio dei dati in formato CSV avviene seguendo la seguente procedura: File ! Esporta
dati ! CSV ! (seleziona "tab" come separatore per le colonne dei dati) ! OK.

1.3 Trasformazione dati


Entrare nella …nestra Aggiungi ! De…nisci nuova variabile. Nello spazio bianco si possono
digitare espressioni per e¤ettuare trasformazioni delle variabili esistenti e aggiungere nuove
variabili al dataset (la stessa operazione può essere fatta entrando nella …nestra Variabile).

* Esempio 1: creazione della costante (nel dataset-caschool è già presente)

const=1

* Esempio 2: trasformazione logaritmica

ltest=log(testscr)

* Esempio 3: di¤ erenza prima

d1_testscr=testscr-testscr(-1)

* Esempio 4: cambiamento unità di misura

expnstu_d=expnstu/1000

2
1.4 Analisi preliminare dei dati
Nella …nestra Variabile si possono selezionare i comandi per visualizzare vari tipi di statistiche
descrittive relative ad una sola variabile.

a1. Istogramma di una variabile:

Gra…co frequenze !numero di intervalli (n=20) ! OK

b1. Statistiche descrittive di sintesi:

Statistiche descrittive ! OK

Nella …nestra Visualizza si possono selezionare i comandi per visualizzare vari tipi di gra…ci
ed alcune statistiche descrittive relative a più variabili contemporaneamente.

a2 Gra…co scatterplot :

Gra…co! X-Y a dispersione: testscr (variabile asse-Y) str (variabili asse-X)!OK

b2 Correlazione fra due o più variabili :

Matrice di correlazione!(testscr, str) ! OK

c2 Statistiche descrittive di sintesi relative a più variabili:

Selezionare testscr str ! Visualizza ! Statistiche descrittive ! OK


Selezionare testscr str ! Visualizza ! Matrice di correlazione ! OK (procedura alter-
nativa alla precedente, b2)

Esempio: str; pctel; exp nstu

3
Prendiamo l’output dei gra…ci scatterplot per mostrare la procedura di salvataggio di oggetti
sulla …nestra delle icone.
Riprendiamo la procedura per gra…ci scatterplot:
Visualizza ! Gra…co ! X-Y a dispersione: testscr (variabile asse-Y) str (variabili asse-X)
!OK
Cliccare sul gra…co ottenuto col tasto destro del mouse e selezionare la voce "Salva alla
sessione come icona". A questo punto l’oggetto Gra…co sarà stato salvato sulla …nestra delle
icone. Per recuperare il vostro oggetto salvato seguite la seguente procedura partendo dalla
…nestra principale di lavoro:
Visualizza ! Finestra icone
Il gra…co scatterplot risulterà salvato sotto il nome di Gra…co 1, in quanto questo è il primo
oggetto Gra…co che salvate nella sessione corrente.

1.5 Salvataggio dei dati modi…cati in formato GRETL


Durante la sessione di lavoro possono essere salvati come icone vari oggetti (un esempio è
l’oggetto Gra…co salvato sopra), che compariranno sulla …nestra "Sessione corrente". Questi
oggetti possono essere: informazioni sui dati, dataset, modelli, note, correlazioni, statistiche,
gra…ci. Alla …ne della sessione di lavoro procediamo al salvataggio delle rielaborazioni seguendo
la procedura:
File ! Sessioni ! Salva sessione come ! Gretl data …le ! a:ncaschool2.gdt
Riaprendo il …le recupereremo l’ultima sessione di lavoro con tutti gli oggetti salvati sulla
…nestra delle icone.

2 Regressione lineare con Gretl: stima OLS con standard error


robusti (caso di eteroschedasticità)
Partiamo dalla stima di regressione lineare sotto l’ipotesi di eteroschedasticità nella distribuzione
degli errori. Per ottenere gli errori standard robusti all’eteroschedasticità, allo scopo di e¤et-
tuare inferenza valida anche se il termine di errore non è omoschedastico, è necessario e¤ettuare
la procedura per la stima OLS robusta. Nel …le di lavoro pricipale selezionare Modello !

4
OLS-minimi quadrati ordinari ! testscr (aggiungi in variabile dipendente), str, pctel, expn-
stu_d (aggiungi in variabili indipendenti). Notate che la costante compare di default nella lista
delle variali indipendenti. Nella …nestra Speci…ca modello selezionare la voce “Errori standard
robusti ” e cliccare Con…gura. Selezionare nella …nestra HCCME la voce “Usa la matrice di
covarianza robusta in modo prede…nito”.

Nella tabella di output della stima OLS del modello di regressione troviamo varie infor-
mazioni. Nella prima parte in alto sono riportate: le stime dei parametri del modello (Coe¢ -
ciente), gli errori standard (Standard Error), la statistica t (Rapporto-T), ed in…ne il p-value.
Gli asterischi associati al valore del p-value devono essere interpretati nel modo seguente: no
asterischi ! parametro statisticamente non diverso da zero; un asterisco (*) ! parametro
diverso da zero a livello di signi…catività del 10%; due asterischi (**) ! parametro diverso da
zero a livello di signi…catività del 5%; tre asterischi (***) ! parametro diverso da zero a livello
di signi…catività dell’1%. Nella seconda parte in basso sono invece riportate insieme ad altre
quantità: il coe¢ ciente di determinazione R2 , anche nella sua versione corretta per i gradi di
libertà (R2 corretto), la statistica F per la veri…ca della signi…catività dell’intera regressione (la
q
consideriamo come la F1 del testo per n su¢ ciente grande), la media e la deviazione standard
della variabile dipendente, e la somma dei quadrati dei residui Residual Sum of Squares (SSR).
Si tralascino le restanti quantità, (che sono utili nel contesto dell’analisi delle serie storiche).
Procediamo al salvataggio della …nestra di output del modello. Per il salvataggio dell’oggetto

5
Modello sulla …nestra delle icone selezionare, partendo dalla …nestra di output del modello, File
! Salva alla sessione come icona. Potete sempre veri…care, dopo questo tipo di salvataggio,
come nella …nestra icone compaiano nuovi oggetti. Ripetiamo la procedura descritta sopra per la
visualizzazione della …nestra delle icone partendo dalla …nestra principale di lavoro: Visualizza
! Finestra icone.
Il modello OLS robusto risulterà salvato sotto il nome di Modello 1, in quanto questo è il
primo oggetto Modello che salvate nella sessione corrente.
Potete salvare l’output del modello anche in formato ASCII seguendo la procedura: File !
Salva come ! Oggetto semplice.

Possono inoltre essere costruiti gli intervalli di con…denza per i parametri stimati seguendo
la seguente procedura. Partendo dall’output del modello, selezionate: Analisi ! Intervalli di
con…denza per i coe¢ cienti.

Notate che vengono utilizzati i valori critici della statistica t e non N s tan dard validi in
piccoli campioni sotto l’ipotesi di normalità.
La matrice di varianza-covarianza robusta all’eteroschedasticità, di dimensioni (K + 1)
(K + 1), è visualizzata selezionando nella …nestra di output del modello Analisi ! Matrice di
covarianza dei coe¢ cienti. L’output è riportato qui sotto:

6
2.1 Veri…ca di ipotesi congiunte con F-robusta
2.1.1 Veri…ca signi…catività dell’intera regressione

Per veri…care la signi…catività congiunta di tutti i parametri della regressione del modello ver-
i…chiamo che il p value associato alla statistica F robusta sia inferiore del livello di signi-
…catività considerato. La statistica F robusta di riferimento è quella riportata nella scheda
act = 147; 204 ed il rela-
di output della stima OLS robusta . Nel nostro caso particolare F3;1
tivo p value ' 0. Ne deduciamo che possiamo ri…utare l’ipotesi nulla di uguaglianza a zero
congiunta di tutti i parametri della regressione ad ogni livello di signi…catività.

2.1.2 Veri…ca signi…catività di un sottinsieme di coe¢ cienti

Per veri…care la signi…catività congiunta di un sottinsieme di coe¢ cienti quando le stime sono
robuste per l’eteroschedasticità, è su¢ ciente, partendo dalla …nestra di output della stima OLS
robusta, selezionare Test ! OMIT (ometti variabili) ! str pctel (variabili da omettere nel
modello ristretto). Otteniamo il seguente output.

act robusta = 220; 778, con p value ' 0: Ri…utiamo l’ipotesi nulla di assenza
La statistica F2;1

7
di signi…catività per il sottinsieme di parametri selezionato.

2.1.3 Veri…ca di vincoli lineari su più coe¢ cienti

Quando invece dobbiamo testare vincoli lineare su più coe¢ cienti congiuntamente, può essere
utilizzata la seguente procedura. Dalla …nestra di output della regressione OLS robusta se-
b[const]=0
lezionare Test ! Vincoli lineari ! b[str]=1
. Otteniamo il seguente output:

act robusta = 3928; 56, con p value ' 0: Ri…utiamo l’ipotesi nulla congiunta
La statistica F2;1
di: 1) uguaglianza a zero per il coe¢ ciente di intercetta e 2) di coe¢ ciente associato alla variabile
str uguale a uno.

2.2 Veri…ca di una restrizione signola che coinvolge più coe¢ cienti
Per veri…care restrizioni singole che coinvolgono più regressori possiamo utilizzare due metodi.
Il primo (metodo diretto) utilizza la statistica F robusta, mentre il secondo (metodo di
trasformazione della regressione) utilizza la statistica t:

2.2.1 Uso del metodo diretto

Utilizzando la stessa procedura del paragrafo 2.1.3. è possibile in Gretl testare anche restrizioni
singole che coinvolgono più regressori. Veri…chiamo ad esempio la restrizione 2 =2 1 :Dalla
…nestra di output della regressione OLS robusta selezionare Test ! Vincoli lineari ! b[pctel]-
2*b[str]=0. Otteniamo il seguente output:

8
1 robusta = 0; 007365, con p
La statistica F1 value = 0; 9316: Non ri…utiamo l’ipotesi nulla
di esistenza di vincolo lineare 2 =2 1 fra 2 e 1.

2.2.2 Uso del metodo di trasformazione della regressione

In presenza di un solo vincolo lineare una possibilità più immediata per veri…carne la valid-
ità è trasformare la regressione in maniera tale che nella regressione trasformata veri…care la
signi…catività di un singolo coe¢ ciente (tramite un test t) corrisponda alla veri…ca del vin-
colo di interesse. Questa procedura consiste in una riparametrizzazione del modello, ovvero una
trasformazione in un nuovo modello tale che i parametri di quest’ultimo siano in corrispondenza
biunivoca con quelli del modello di partenza.
Consideriamo sempre l’ipotesi nulla:

H0 : 2 =2 1

Aggiungendo e sottraendo al lato destro del modello non vincolato la quantità 2 1 P CT ELi
si ottiene:

testscri = 0 + 1 stri +2 1 pcteli 2 1 pcteli + 2 pcteli + 3 exp nstui + ui


testscri = 0 + 1 (stri + 2pcteli ) + ( 2 2 1 )pcteli + 3 exp nstui + ui
testscri = 0 + 1 Z1i + 2 pcteli + 3 exp nstui + ui
con Z1i = stri + 2pcteli ; 2 = 2 2 1

Per stimare il modello riparametrizzato (ovvero la regressione trasformata) dovremo allora


prima costruire la nuova variabile Z1i seguendo la procedura sopra descritta che riportiamo qui
di seguito. Dalla …nestra principale di lavoro selezionare Aggiungi ! De…nisci nuova variabile

9
e digitare Z1 = str + 2 pctel . Dopo aver creato la nuova variabile speci…care in Modello !
OLS il nuovo modello di regressione. Otteniamo il seguente output:

La statistica t associata alla variabile pcteli è pari a 0; 08582 ed il suo p value = 0; 9316.
Come nel caso diretto anche in questo caso non possiamo ri…utare l’ipotesi nulla di 2 = 2
2 1 = 0 ossia di esistenza di vincolo lineare fra 2 e 1.

3 Regressione lineare con Gretl: stima OLS con standard error


classici (ipotesi di omoschedasticità)
Stimiamo ora il nostro modello sotto l’ipotesi restrittiva di esistenza di omoschedasticità e
ripetiamo la procedura per la veri…ca di ipotesi congiunte utilizzando la F classica.
Per ottenere la stima OLS non robusta ripetiamo la procedura del paragrafo 2, senza se-
lezionare l’opzione "Errori standar robusti". Otteniamo la seguente stima:

10
3.1 Veri…ca di ipotesi congiunte con F classica
La statistica F , riportata nella …nestra di output della stima, veri…ca la signi…catività congiunta
di tutti i parametri utilizzati nel modello. Dato il p-value prossimo allo zero possiamo ri…utare
l’ipotesi nulla. La statistica F in questo caso può essere replicata utilizzando le formule per la
F classica, che riportiamo qui di seguito:

(SSRrestr SSRunrestr )=q


Fnq K 1 =
SSRunrestr =(n Kunrestr 1)
Nell’output di stima del modello abbiamo, fra le varie informazioni, anche la "Somma dei
P 2
quadrati dei residui", ossia SSR = u ^i . Utilizzando gli SSR sia per la regressione ristretta
i
sia per quella non ristretta applichiamo la formula per la F classica:

3.1.1 Veri…ca signi…catività dell’intera regressione con SSR del modello ristretto
e non ristretto

Veri…chiamo la signi…catività dell’intera regressione usando la formula della F classica e


trovando "manualmente" il valore 3
F1 = 107; 455:
Stimiamo, sempre con OLS classico, il modello ristretto in cui tutti i parametri, esclusi
l’intercetta, sono posti uguali a zero. Otteniamo il seguente output:

11
Il modello stimato al paragrafo precedente è il nostro modello non ristretto. Dalla tabello
di output di stima del modello non ristretto abbiamo l’informazione su SSRunrestr :

SSRunrestr = 85699; 7

In questo paragrafo abbiamo invece stimato il modello ristretto con numero di restrizioni
pari a 3 (q = 3), ossia il numero di regressori diversi dall’intercetta. Il valore di SSRrestr_intera
è pari a:

SSRrestr_intera = 152110

Abbiamo ora tutti gli elementi per applicare la formula della F classica:

3 (152110 85699; 7)=3


F1 = = 107; 45
85699; 7=(420 3 1)
Il p-value associato è prossimo allo zero (si veda il valore del p value associato alla sta-
tistica F riportato nella tabella di output del paragrafo 3.), dunque ri…utiamo l’ipotesi nulla di
uguaglianza a zero dell’intera regressione.

3.1.2 Veri…ca signi…catività di un sottinsieme di coe¢ cienti

La stessa procedura può essere utilizzata per veri…care la signi…catività di un sottinsieme di


coe¢ cienti. Ipotizziamo di voler veri…care la signi…catività congiunta dei parametri associati ai
regressori (str; pctel).
Stimiamo il modello ristretto. Qui di seguito l’output della stima OLS classica del modello
ristretto con q = 2 (numero di restrizioni).

12
Il valore SSRrestr_sott del nuovo modello ristretto è pari a:

SSRrestr_sott = 146545

Abbiamo ora tutti gli elementi per applicare la formula della F classica:

2 (146545 85699; 7)=2


F1 = = 147; 67
85699; 7=(420 3 1)
Per determinare il p-value associato alla statistica F sopra determinata (ma in generale
tutte le volte che desiderate determinare il p-value associato a qualche statistica), andate nella
…nestra principale di lavoro e seguite la seguente procedura. Selezionare Strumenti ! Calcola
p-value ! F, dfn: 2, dfd : 416, valore: 147,67.
Il p-value associato è prossimo allo zero, dunque ri…utiamo l’ipotesi nulla di uguaglianza a
zero del sottinsieme di regressori scelto.
Possiamo ottenere il medesimo risultato procedendo come nel paragrafo 2.1.2. Partendo
dalla stima OLS classica del modello non ristretto otteniamo il seguente output:

13
2 = 147; 675, come determinato manualmente sopra. Anche in questo caso
La statistica F1
dunque ri…utiamo l’ipotesi nulla di assenza di signi…catività congiunta del sottinsieme di para-
metri scelto.

3.1.3 Veri…ca di vincoli lineari su più coe¢ cienti

Per la veri…ca di vincoli lineari su più coe¢ cienti possiamo procedere come nel paragrafo 2.1.3.
Ipotizziamo, come nel caso precedente di voler testare il seguente vincolo lineare 0 =0e 1 = 1:
Dalla …nestra di output della regressione OLS classica selezionare Test ! Vincoli lineari !
b[const]=0
b[str]=1
. Otteniamo il seguente output:

14
2 classica = 5198; 26, con p
La statistica F1 value ' 0: Ri…utiamo l’ipotesi nulla congiunta
di: 1) uguaglianza a zero per il coe¢ ciente di intercetta e 2) coe¢ ciente associato alla variabile
str uguale a uno.

3.2 Veri…ca di una restrizione signola che coinvolge più coe¢ cienti
Come nel caso della F robusta anche nel caso della F classica possiamo utilizzare due metodi
per veri…care restrizioni singole che coinvolgono più regressori. Il primo (metodo diretto) utilizza
la statistica F classica, mentre il secondo (metodo di trasformazione della regressione) utilizza
la statistica t:

3.2.1 Uso del metodo diretto

Veri…chiamo ad esempio la restrizione 2 =2 1 :Dalla …nestra di output della regressione OLS


robusta selezionare Test ! Vincoli lineari ! b[pctel]-2*b[str]=0. Otteniamo il seguente output:

15
1 classica = 0; 00737692;con p
La statistica F1 value = 0; 931596: Non ri…utiamo l’ipotesi
nulla di esistenza di vincolo lineare 2 =2 1 fra 2 e 1.

3.2.2 Uso del metodo di trasformazione della regressione

Ripetendo la procedura del paragrafo 2.2.2. per la riparametrizzazione del modello possiamo
stimare l’ipotesi nulla

H0 : 2 =2 1

utilizzando la statistica t:
Per stimare il modello riparametrizzato (ovvero la regressione trasformata) costruiamo come
prima la nuova variabile Z1i = stri + 2 pcteli e speci…chiamo in Modello ! OLS-classico il
modello di regressione. Otteniamo il seguente output:

La statistica t associata alla variabile pcteli è pari a 0; 08589 ed il suo p value = 0; 9316.
Come nel caso diretto anche in questo caso non possiamo ri…utare l’ipotesi nulla di 2 = 2
2 1 = 0 ossia di esistenza di vincolo lineare fra 2 e 1.

4 Test diagnostici
4.1 Test di eteroschedasticità
Il test di eteroschedasticità sottopone a veri…ca l’ipotesi che la varianza del termine di errore
sia costante (omoschedasticità).

16
L’ipotesi nulla che stiamo testando è quindi H 0 : presenza di omoschedasticità.
In Gretl è possibile veri…ca l’ipotesi di omoschedasticità dei residui della regressione stimata
selezionando nella …nestra di output del modello OLS classico Test ! LMTEST ! BREUSCH-
PAGAN TEST. Otteniamo il seguente output:

La statistica si distribuisce come una Chi quadro(3). Dato il valore del p value prossimo
allo zero possiamo ri…utare l’ipotesi nulla di presenza di omoschedasticità.

4.2 Test di normalità


Il test, proposto da Jarque e Bera, veri…ca congiuntamente che la skewness e la kurtosis della
distribuzione dei residui assumano valori statisticamente uguali a quelli che caratterizzano la
distribuzione normale.
L’ipotesi nulla che stiamo testando in questo caso è quindi uguale a: H 0 :gli errori sono
distribuiti normalmente.
In Gretl è possibile veri…care l’ipotesi di normalità dei residui della regressione stimata
selezionando nella …nestra di output del modello OLS Test ! TESTUHAT (prendiamo il
modello OLS-robusto). Otteniamo il seguente output:

17
La statistica si distribuisce come un Chi quadro2 : Nel nostro caso dato il p value =

18
0; 97222 non possiamo ri…utare l’ipotesi nulla di distribuzione normale degli errori.

Nella regressione dei punteggi del test presentata in queste dispense i test diagnostici evi-
denziano che gli errori hanno distribuzione normale ma sono eteroschedastici. La conseguenza
è che solo i risultati basati sulle formule robuste all’eteroschedasticità (paragrafo 2) sono da
considerare validi, mentre l’utilizzo delle formule classiche per gli errori standard e la statistica
F risulta inappropriato (paragrafo 3).

4.3 Analisi dei residui


Dalla …nestra di output del modello OLS è possibile e¤ettuare una serie di opzioni relative alla
visualizzazione dei valori stimati della regressione e dei relativi residui. In particolare possiamo
e¤ettuare le seguenti procedure:

1. per visualizzare l’elenco dei valori stimati, dei valori e¤ettivi e dei residui per ogni osser-
vazione, ad esempio per individuare con precisione a quali osservazioni corrispondono
valori anomali (individuati con un asterisco):

Analisi ! Mostra valori stimati, e¤ ettivi e residui

2. per salvare nel dataset i valori stimati, i residui, la somma dei quadrati dei residui, l’R2 :

Salva ! Valori stimati

Salva ! Residui

Salva ! Somma dei quadrati degli errori (SSR) (Questo valore viene salvato come oggetto
scalare e può essere visualizzato partendo dalla …nestra principale di lavoro selezionando
Dati ! Scalari..)

Salva ! R-quadro

3. per visualizzare gra…ci dei residui e dei valori e¤ettivi e stimati (ha senso solo nel caso di
regressione semplice, ad esempio: testscr const str ):

Gra…ci ! Residui ! rispetto a str

Gra…ci ! Valori e¤ ettivi e stimati ! rispetto a str

5 Introduzione con Gretl a regressioni temporali e previsioni


Analizziamo le principali procedure previste da Gretl per l’analisi econometrica di dati in serie
storica. In questa seconda parte indicizziamo le variabili con t per denotare il tempo anzichè i;
utilizzato invece per variabili di tipo sezionale. La dimensione campionaria è pari a T:
L’analisi econometrica che usa serie storiche appartiene tipicamente alla parte di econome-
tria che studia fenomeni macroeconomici, ossia che considera dati a livello aggregato e non
individuale.

19
Le serie storiche si di¤erenziano dai dati di tipo sezionale fondamentalmente per la non
possibilità di imporre l’ipotesi di incorrelazione fra osservazioni.
Ad esempio la variazione di in‡azione al tempo t (D_IN Ft ) plausibilmente dipenderà, fra
gli altri, anche dalla variazione dell’in‡azione al periodo precedente (D_IN Ft 1 ). Conseguente-
mente la correlazione fra le due variabili (D_IN Ft ; D_IN Ft 1) risulterà essere diversa da zero,
come vedremo in maggior dettaglio nei paragra… successivi.

5.1 Importazione di dati temporali


Dopo aver eseguito la procedura di importazione dati, in Gretl appare una …nestra nella quale
viene proposto la rielaborazione dei dati importati in formato serie storiche. Dopo aver accettato
la reimpostazione del dataset in formato serie storiche dovete scegliere la frequenza temporale
di rilevazione delle osservazioni (anno, trimestre, mese,...) e la data dell’osservazione iniziale
(ad esempio 1957:01 per indicare gennaio 1957).
Procediamo all’importazione dei dati macro.gdt con frequenza trimestrale a partire dal primo
trimestre 1960 (1960:1).

5.2 Trasformazioni e descrizione di dati temporali


Prima di e¤ettuare stime econometriche su modelli di regressione temporale, è necessario anal-
izzare qualitativamente i dati a nostra disposizione. In generale il dataset originario presenta
solo dati nei livelli, ossia variabili non trasformate. Spesso siamo però interessati ad analiz-
zare variabili economiche trasformate. Ad esempio nel nostro dataset è presente la variabile
CP It (Consumer Price Index, ossia l’indice dei prezzi al consumo), ma l’analisi econometrica
viene e¤ettuata sulla variabile tasso di in‡azione (IN Ft ) che ne è una sua trasformazione (come
vedremo nel paragrafo successivo).
Nel paragrafo seguente mostriamo le principali trasformazioni che possono essere e¤ettuate
su variabili economiche temporali di interesse.

5.2.1 Principali trasformazioni

Seguendo la procedura di trasformazione dei dati con creazione di nuove variabili, prevista in
Gretl (vedi paragrafo 1.3), e¤ettuiamo le seguenti fondamentali trasformazioni (consideriamo
le seguenti trasformazioni in sequenza ed utilizziamo ad ogni trasformazione il risultato della
trasformazione precedente se necessario):

* Primo ritardo

CPI_1=CPI(-1)

* j-esimo ritardo (ad esempio terzo ritardo)

CPI_3=CPI(-3)

* Di¤ erenza prima

20
D_CPI=CPI-CPI_1

* Trasformazione logaritmica

L_CPI=log(CPI)

* Di¤ erenza prima del logaritmo (Variazione)

DL_CPI=L_CPI-L_CPI(-1)

* Variazione percentuale

VP_CPI=DL_CPI*100

Tutte le trasformazioni sopra e¤ettuate manualmente (eccetto la Variazione percentuale)


possono essere più velocemente e¤ettuate tramite una procedura automatica prevista in Gretl
selezionando la/le variabile/i da trasformare e aprendo dalla …nestra di menù principale la
tendina Aggiungi e l’opzione di trasformazione scelta.
La nostra principale variabile economica di interesse è il tasso di in‡azione su base annuale
(IN Ft ): Costruiamo la nostra variabile di interesse seguendo la procedura di creazione di una
nuova variabile e e¤ettuiamo le seguente trasformazioni (il tasso di in‡azione su base annuale è
ottenuto moltiplicando prima per 100, per ottenere la variazione percentuale trimestrale, e poi
per 4, per ottenere l’in‡azione annualizzata, quindi 4 100 = 400):

* Tasso di in‡azione annualizzata

INF=400*(DL_CPI)

* Primo ritardo del tasso di in‡azione

INF_1=INF(-1)

* Di¤ erenza prima del tasso di in‡azione (Variazione)

D_INF=INF-INF_1

5.2.2 Descrizione

Dopo aver trasformato adeguatamente le variabili economiche possiamo analizzare qualitativa-


mente le variabili di interesse trasformate tramite analisi gra…ca e calcolando l’autocovarianza
e l’autocorrelazione campionaria (fondamentali in caso di serie storiche).

Gra…ci Riportiamo qui di seguito i gra…ci delle due variabili economiche che prenderemo
in considerazione nell’analisi econometrica che seguirà, ossia il tasso di in‡azione annualizzato
(IN Ft ) e il tasso di disoccupazione (U N EM Pt ) negli USA nel periodo 1960-1999.

21
Osserviamo come il tasso di in‡azione negli USA mostri un andamento crescente dal 1960
al 1980, diminuendo poi rapidamente durante i primi anni ottanta. Il tasso di disoccupazione
segue un andamento medio simile ma appare molto meno volatili. I picchi di disoccupazione
coincidono con le fasi di recessione dell’economia statunitense.

Autocovarianza e autocorrelazione Come abbiamo già intuito il valore di IN Ft è tipica-


mente correlato con il suo valore al periodo precedente. Determiniamo il grado di autocovarianza
e autocorrelazione campionario della variabile di interesse per avere un’idea del livello di "memo-
ria" del processo stocastico in esame (in altri termini, per vedere …no a quale ritardo esiste una
autocorrelazione statisticamente diversa da zero della variabile di interesse).
Riportiamo qui di seguito le formule per la determinazione rispettivamente della autocovar-
a a
ianza (cov) e della autocorrelazione (corr) campionaria di ordine j della variabile IN Ft :
_ a
Date IN F la media campionaria di IN Ft sull’intervallo considerato e var(IN Ft ) la varianza
campionaria di IN Ft , otteniamo le seguenti formule:

T
X _ _
a 1
cov(IN Ft ; IN Ft j) = (INFt -IN F j+1;T )(INFt j -IN F 1;T j)
T j 1 t=j+1

a
a cov(IN Ft ; IN Ft j)
corr(INFt ,INFt j )= a
var(IN Ft )

Gretl dispone di una procedura automatica per la determinazione del valore di autocorre-
lazione, chiamato anche AutoCorrelation Function (ACF ): Selezionare dalla …nestra di lavoro
principale la variabile di interesse, nel nostro caso IN Fi , selezionare Variabile!Correlogramma!Ritardo
massimo (ad esempio j=10). Otteniamo il seguente output:

22
Osserviamo sia dal primo output (in cui non prendiamo in considerazione la statistica Q-
stat), sia dal secondo output gra…co o autocorrelogramma, (qui le barre rosse indicano il valore
di autocorrelazione ad ogni ritardo, mentre le linee orizzontali blue rappresentano gli intervalli
di con…denza campionari) come esista una autocorrelazione signi…cativamente diversa da zero
…no al decimo ritardo (vedi i tre asterischi associati al valore dell’autocorrelazione ad ogni livello
di ritardo). In altri termini il processo generatore dati della variabile IN Ft è caratterizzato da
una lunga "memoria":
Ripetiamo l’operazione per analizzare il grado di autocorrelazione della variabile D_IN Ft =
IN Ft IN Ft 1, ovvero la di¤erenza prima del tasso di in‡azione annualizzato. Otteniamo il
seguente output:

23
Osserviamo come l’autocorrelazione della variabile trasformata, ottenuta come di¤erenza
prima della variabile IN Ft ; sia statisticamente diversa da zero …no al terzo ritardo a livello
di signi…catività 1%, mentre ai ritardi successivi l’autocorrelazione campionaria appare solo
parzialmente signi…cativa (potete notare osservando anche l’autocorrelogramma come le linee
rosse escano fuori dall’intervallo di con…denza solo nei primi tre ritardi ed in pochi ritardi
sucessivi). Altra sostanziale di¤erenza fra il grado di autocorrelazione della variabile IN Ft e
quello della variabile D_IN Ft è l’evidente andamento ciclico nel caso dell’autocorrelazione della
seconda variabile e quello più persistente e solo decrescente della prima variabile.

6 Autoregressioni
Un’autoregressione è un modello di regressione, come quelli visti nella prima parte di queste
dispense, ma i cui regressori sono i valori passati della variabile dipendente ed eventualmente
i valori passati di altre variabili (come nel modello autoregressivo misto). Nei paragra… che
seguono descriviamo i principali modelli autoregressivi prendendo come variabile dipendente
del nostro modello la variazione percentuale dell’in‡azione su base annua D_IN Ft :

24
6.1 Modello autoregressivo del primo ordine
Nei modelli autoregressivi del primo ordine la variabile esplicativa del modello è il primo ritardo
della variabile che vogliamo spiegare. Tali modelli sono anche detti AR(1), ossia AutoRegressivi
del primo ordine. Nel nostro caso il modello AR(1) è uguale a:

D_IN Ft = 0 + 1 D_IN Ft 1 + ut (1)

Il suo modello stimato (o il suo valore predetto) è uguale a:

a
D_IN F t = ^ 0 + ^ 1 D_IN Ft 1 (2)

La stima OLS robusta del modello (1) risulta pari a:

Osserviamo come il coe¢ ciente associato alla variabile ritardata risulti essere signi…cativo al
5% e pari a ^ = 0:22, indicando una presenza di autocorrelazione di primo ordine negativa che
1
poteva già essere individuata dall’analisi dell’autocorrelogramma (vedi il primo valore associato
alla ACF della variabile D_IN Ft ).

6.1.1 Previsione, valori predetti, errore di previsione e incertezza di previsione

Previsione Con dati in serie storica siamo principalmente interessati a determinare il val-
ore futuro previsto della variabile di interesse data l’informazione passata. Indichiamo con
a a
D_IN F tjt 1 = E(D_IN F t jD_IN Ft 1) il valore previsto di D_IN Ft condizionato all’informazione

25
di D_IN F …no al tempo t 1: Nel caso del modello AR(1), partendo dall’equazione (2), otte-
niamo la seguente previsione stimata:

a a
D_IN F tjt 1 = E(D_IN F t jD_IN Ft 1) (3)
= E( ^ 0 + ^ 1 D_IN Ft 1 jD_IN Ft 1 ) = ^ 0 + ^ 1 D_IN Ft 1

Attenzione! L’equazione (3) appare simile all’equazione (2), tuttavia i due valori di¤eriscono
a
sostanzialmente. Mentre il valore predetto D_IN F t è calcolato per le osservazioni interne
a
al campione utilizzato per stimare la regressione, la previsione D_IN F tjt 1è fatta per istanti
temporali esterni al campione dei dati utilizzati per la stima.

Errore di previsione L’errore di previsione è pari all’errore commesso dalla previsione, ossia
è pari alla di¤erenza fra il valore osservato di D_IN Ft ed il suo valore previsto:

a
EPt = D_IN Ft D_IN F tjt 1

Incertezza di previsione Una misura del grado di incertezza della previsione è data dalla
radice quadrata dell’errore di previsione quadratico medio (RMSFE, acronomico in-
glese per Root Mean Squared Forecast Error ), che misura l’entità dell’errore di previsione. Il
RMSFE è pari a:
r
a
RM SF E = E[(D_IN Ft D_IN F tjt 2
1) ]

Il RMSFE combina due fonti di errore. La prima deriva dal fatto che la distribuzione di ut
non è nota. La seconda dalla stima dei parametri del modello ^ 0 e ^ 1 : Se la seconda fonte di
incertezza è su¢ cientemente piccola da poter essere trascurata il RMSFE può essere stimato
dall’errore standard della regressione (SER).

6.1.2 Esempio

Vediamo come possiamo fare previsione utilizzando Gretl.


Il nostro campione di dati arriva …no al primo trimestre del 2000. Restringiamo il campione
…no al quarto trimestre 1999 ed e¤ettuiamo nuovamente la stima sul sottocampione. Otteniamo
il seguente output:

26
Dalla …nestra di output selezionare Analisi!Previsione!Intervallo di previsione 2000:1-
2000:1, previsione statica. Otteniamo il seguente output:

27
a
Il valore di D_IN F 2000:Ij1999:IV = 0:023%: Possiamo ottenere il medesimo risultato man-
ualmente utilizzando l’equazione (3):

a
D_IN F 2000:Ij1999:IV = 0:0181084 0:227798 (D_IN F1999:IV )
= 0:0181084 + 0:227798 (0:021765) = 0:023

a
Il valore previsto di IN F 2000:Ij1999:IV è quindi pari a:

a a
IN F 2000:Ij1999:IV = IN F1999:IV + D_IN F 2000:Ij1999:IV
= 2:93973 + 0:023 = 2:96273

(ovvero si prevede un’in‡azione pari al 2.96%). Il modello quindi prevede un aumento


dell’in‡azione per il trimestre successivo.
Il valore osservato di D_IN F2000:I = 0; 998861: L’errore di previsione è quindi pari a:

a
EP2000:I = D_IN F2000 D_IN F 2000j1999
= 0; 998861 0:023 = 0:975861

(0.97 punti percentuali). lgnorando l’incertezza dovuta alla stima dei parametri del modello,
e conseguentemente approssimando lo RMSFE con SER, l’incertezza di previsione risulta pari
a 1; 65875:
In…ne notiamo che dall’output di Gretl sul valore previsto di D_IN Ft per 2000 : I otteni-

28
amo anche una informazione sull’intervallo di previsione puntuale con con valore critico 1:975.
L’intervallo di previsione al 95% è un intervallo che contiene il valore futuro di una serie con il
95% di probabilità. Notiamo che l’intervallo di previsione è diverso dall’intervallo di con…denza.
In questo caso infatti non possiamo utilizzare l’usuale valore critico 1:96 giusti…cato dal teorema
del limite centrale per la costruzione degli intervalli di con…denza. La formula utilizzata per
determinare l’intervallo di previsione da Gretl è:

a a
D_IN F tjt 1 1:975 SE(D_IN Ft D_IN F tjt 1)

6.2 Modello di regressione di ordine p


Nei modelli autoregressivi di ordine p le variabili esplicative del modello sono i primi p ritardi
della variabile che vogliamo spiegare. Tali modelli sono anche detti AR(p), ossia AutoRegressivi
di ordine p. Nel nostro caso il modello AR(p) è uguale a:

D_IN Ft = 0 + 1 D_IN Ft 1 + ::: + p D_IN Ft p + "t (4)

con E("t jD_IN Ft 1 ; D_IN Ft 2 ; D_IN Ft 3 ; D_IN Ft 4 ) = 0:


Il suo modello stimato (o il suo valore predetto) è uguale a:

a
D_IN F t = ^ 0 + ^ 1 D_IN Ft 1 + ::: + ^ p D_IN Ft p (5)

E¤ettuiamo la stima di un modello autoregressivo di ordine 4 (AR(4)) dopo aver creato le


quattro variabili di ritardo. La stima OLS robusta del modello (4) con p=4 risulta pari a:

29
Testiamo l’ipotesi nulla utilizzando la procedura OMIT

H0 : 2 = 3 = 4 = 0; H1 : j 6= 0 per qualche j 2 f2; 3; 4g

Otteniamo il seguente output:

30
3 = 7:88 con p-value prossimo allo zero. Ri…utiamo quindi l’ipotesi nulla di
La statistica F1
uguaglianza a zero congiunta dei parametri associati alle tre variabili esplicative aggiunte nel
nostro modello autoregressivo. Inoltre osserviamo che l’R2 del modello AR(4) risulta pari a
0:208, dunque AR(4) ha una capacità esplicativa maggiore rispetto a AR(1).

6.2.1 Previsione, valori predetti, errore di previsione e incertezza di previsione


a a
Previsione Indichiamo con D_IN F tjt 1 = E(D_IN F t jD_IN Ft 1) il valore previsto di
D_IN Ft condizionato all’informazione di D_IN F …no al tempo t 1: Nel caso del modello

31
AR(p), partendo dall’equazione (5), otteniamo la seguente previsione stimata:

a a
D_IN F tjt 1 = E(D_IN F t jD_IN Ft 1) (6)
= E(^ 0 + ^ 1 D_IN Ft 1 + :: + ^ p D_IN Ft p jD_IN Ft 1 )

= ^ 0 + ^ 1 D_IN Ft 1 + :: + ^ p D_IN Ft p

Attenzione! Come nel modello AR(1) valgono anche per il modello AR(p) le medesime
a
considerazioni sulla di¤erenza fra (6) e (5), ossia fra valore predetto D_IN F t e previsione
a
D_IN F tjt 1:

Errore di previsione e incertezza di previsione Vedi quanto detto per modelli AR(1),
paragrafo 6.1.1.

6.2.2 Esempio

Vediamo come possiamo fare previsione con modelli AR(p) utilizzando Gretl. Consideriamo
p=4.
Restringendo il campione …no al quarto trimestre 1999 otteniamo il seguente output:

32
Dalla …nestra di output selezionare Analisi!Previsione!Intervallo di previsione 2000:1-
2000:1, previsione statica. Otteniamo il seguente output:

a
Il valore di D_IN F 2000:Ij1999:IV = 0:3727%: Possiamo ottenere il medesimo risultato man-
ualmente utilizzando l’equazione (6):

a
D_IN F 2000:Ij1999:IV = 0:0218729 0:203692 (D_IN F1999:IV ) 0:326004 (D_IN F1999:III )
+0:211239 (D_IN F1999:II ) 0:0418501 (D_IN F1999:I )
= 0:0218729 0:203692 ( 0:021765) 0:326004 ( 0:022090)
+0:211239 (1:524024) 0; 0418501 ( 0:413217)
= 0:3727
a
Il valore previsto di IN F 2000:Ij1999:IV è quindi pari, in termini percentuali, a:

a a
IN F 2000:Ij1999:IV = IN F1999:IV + D_IN F 2000:Ij1999:IV
= 2:93973 + 0:3727 = 3:31243

Il modello quindi prevede un aumento dell’in‡azione per il trimestre successivo ma più forte

33
rispetto a quanto previsto dal modello AR(1).
Il valore osservato di D_IN F2000:I = 0; 998861%: L’errore di previsione è quindi pari, in
termini percentuali, a:

a
EP2000:I = D_IN F2000 D_IN F 2000j1999
= 0; 998861 0:3727 = 0:626161

Quindi inferiore rispetto al modello con una sola variabile di ritardo.


lgnorando l’incertezza dovuta alla stima dei parametri del modello, e conseguentemente ap-
prossimando lo RMSFE con SER, l’incertezza di previsione risulta pari a 1; 51; dunque inferiore
rispetto a quella del modello AR(1).

6.3 Modello autoregressivo misto e modello con predittori multipli


Spesso la teoria economica suggerisce altre variabili i cui ritardi potrebbero migliorare la capacità
esplicativa del modello autoregressivo. Un modello autoregressivo misto è caratterizzato dalla
presenza dei ritardi della variabile dipendente e dei ritardi di altre variabili esplicative diverse
dalla variabile dipendente. Tali modelli sono anche chiamati ADL(p,q), dove ADL è acronimo di
Autoregressive Distributed Lag, p è pari al numero dei ritardi della variabile dipendente mentre
q è pari al numero di ritardi della variabile esplicativa inclusa nel modello autoregressivo diversa
dalla variabile dipendente.
Nel nostro modello autoregressivo (4) possiamo ad esempio aggiungere il ritardo primo della
variabile tasso di disoccupazione (U N EM Pt 1) creando un modello ADL(4,1): Tale relazione
ci viene suggerita dalla teoria economica. La curva di Phillips di breve periodo prevede una
relazione negativa fra tasso di disoccupazione e variazione annuale del tasso di in‡azione. Per
testare tale ipotesi costruiamo il modello autoregressivo misto ADL(4,1) aggiungendo a (4) la
variabile U N EM Pt 1:

D_IN Ft = 0 + 1 D_IN Ft 1 + 2 D_IN Ft 2 + 3 D_IN Ft 3 + 4 D_IN Ft 4 + 1 U N EM Pt 1 + t


(7)
E( t jD_IN Ft 1 ; D_IN Ft 2 ; D_IN Ft 3 ; D_IN Ft 4 ; U N EM Pt 1 ) = 0:
Il suo modello stimato (o il suo valore predetto) è uguale a:

a
D_IN F t = ^ 0 +^ 1 D_IN Ft ^
1 +^ 2 D_IN Ft 2 +^ 3 D_IN Ft 3 +^ 4 D_IN Ft 4 + 1 U N EM Pt 1
(8)
E¤ettuiamo la stima robusta del modello autoregressivo misto. Otteniamo il seguente out-
put:

34
Il parametro associato alla variabile U N EM Pt 1 è signi…cativamente diverso da zero al 5%,
inoltre R2 = 0:23726 quindi la capicità esplicativa del modello ADL(4,1) è maggiore del modello
AR(4).
Prima di passare ad analizzare le capacità di previsione del modello ADL (4,1) stimiamo
anche un modello ADL(4,4) aggiungendo i quattro ritardi anche della variabile U N EM Pt :

D_IN Ft = 0 + 1 D_IN Ft 1 + 2 D_IN Ft 2 + 3 D_IN Ft 3 + 4 D_IN Ft 4 (9)


+ 1 U N EM Pt 1 + 2 U N EM Pt 2 + 3 U N EM Pt 3 + 4 U N EM Pt 4 + vt

con E(vt jD_INFt 1 ,D_INFt 2 ,D_INFt 3 ,D_INFt 4 ,UNEMPt 1 ,UNEMPt 2 ,UNEMPt 3 ,UNEMPt 4 )=0.
Il suo modello stimato (o il suo valore predetto) è uguale a:

a
D_IN F t = ^ 0 + ^ 1 D_IN Ft 1 + ^ 2 D_IN Ft 2 + ^ 3 D_IN Ft 3 + ^ 4 D_IN Ft 4 (10)
+ ^ 1 U N EM Pt 1 + ^ 2 U N EM Pt 2 + ^ 3 U N EM Pt 3 + ^ 4 U N EM P

Otteniamo il seguente output:

35
Testiamo l’ipotesi nulla utilizzando la procedura OMIT

H0 : 2 = 3 = 4 = 0; H1 : j 6= 0 per qualche j 2 f2; 3; 4g

Otteniamo il seguente output:

36
3 = 9:85 ed il suo p-value è prossimo allo zero. Rigettiamo quindi l’ipotesi
Il valore della F1
nulla di non signi…catività congiunta dei tre parametri associati ai ritardi maggiori o uguali
a 2 associati alla variabile U N EM Pt : L’R2 = 0:36 quindi la capacità esplicativa del modello
ADL(4,4) è maggiore di quella del modello ADL(4,1). Osserviamo tuttavia che alcuni para-
metri sono non signi…cativi se considerati individualmente. Il modello quindi può essere ancora
migliorato togliendo uno alla volta i ritardi non signi…cativi delle variabili esplicative, partendo
dai ritardi di grado maggiore. Vedremo nei paragra… successivi quali sono i criteri informativi
usati per determinare il numero di ritardi ottimale delle variabili esplicative del modello.

37
6.3.1 Previsione, valori predetti, errore di previsione e incertezza di previsione

Previsione ed errore di previsione Il valore previsto dal modello ADL(4,1) è pari a:

a a
D_IN F tjt 1 = E(D_IN F t jD_IN Ft 1 ; U N EM Pt 1 ) (11)
= E(^ 0 + ^ 1 D_IN Ft 1 + ^ 2 D_IN Ft 2 + ^ 3 D_IN Ft 3 + ^ 4 D_IN Ft 4

+ ^ 1 U N EM Pt 1 jD_IN Ft 1 ; U N EM Pt 1 )

= ^ 0 + ^ 1 D_IN Ft 1 + ^ 2 D_IN Ft 2 + ^ 3 D_IN Ft 3 + ^ 4 D_IN Ft 4 + ^ 1 U N EM Pt 1

a
Procediamo come nei paragra…precedenti per ottenere il valore previsto di D_IN F 2000:Ij1999:IV
e otteniamo il seguente output, che può essere replicato con la solita procedura manuale utiliz-
zando l’equazione (11):

a a
Il valore di D_IN F 2000:Ij1999:IV = 0:726503%, mentre il valore previsto di IN F 2000:Ij1999:IV è
pari, in termini percentuali, a:

a a
IN F 2000:Ij1999:IV = IN F1999:IV + D_IN F 2000:Ij1999:IV
= 2:93973 + 0:726503 = 3:666233

Il modello quindi prevede un aumento dell’in‡azione per il trimestre successivo ma più forte
rispetto a quanto previsto sia dal modello AR(1) sia dal modello AR(4).
Il valore osservato di D_IN F2000:I = 0; 998861%: L’errore di previsione è pari, in termini
percentuali, a:

a
EP2000:I = D_IN F2000 D_IN F 2000j1999
= 0; 998861 0:726503 = 0:272358

Quindi molto più basso rispetto ai modelli autoregressivi non misti.

Ripetiamo la procedura di previsione per il modello ADL(4,4), che abbiamo visto avere una
capacità esplicativa maggiore rispetto al modello ADL(4,1). Il valore previsto è in questo caso

38
pari a:

a a
D_IN F tjt 1 =E(D_IN F t jD_INFt 1 ,UNEMPt 1 ) (12)
=E(^ 0 +^ 1 D_INFt 1 +^ 2 D_INFt 2 +^ 3 D_INFt 3 +^ 4 D_INFt 4

+ ^ 1 UNEMPt 1 + ^ 2 UNEMPt 2 + ^ 3 UNEMPt 3 + ^ 4 UNEMPt 4 jD_INFt 1 ,UNEMPt 1 )

=^ 0 +^ 1 D_INFt 1 +^ 2 D_INFt 2 +^ 3 D_INFt 3 +^ 4 D_INFt 4

+ ^ 1 UNEMPt ^ ^
1 + 2 UNEMPt 2 + 3 UNEMPt 3 + 4 UNEMPt 4
^

a
Procediamo come nei paragra…precedenti per ottenere il valore previsto di D_IN F 2000:Ij1999:IV
e otteniamo il seguente output, che può essere replicato con la solita procedura manuale utiliz-
zando l’equazione (12):

a a
Il valore di D_IN F 2000:Ij1999:IV = 0:97047%, mentre il valore previsto di IN F 2000:Ij1999:IV è
pari, in termini percentuali, a:

a a
IN F 2000:Ij1999:IV = IN F1999:IV + D_IN F 2000:Ij1999:IV
= 2:93973 + 0:97047 = 3:9102

Il modello quindi prevede un aumento dell’in‡azione per il trimestre successivo ma più forte
rispetto a tutti i modelli stimati nei paragra… precedenti.
Il valore osservato di D_IN F2000:I = 0; 998861%: L’errore di previsione è quindi pari, in
termini percentuali, a:

a
EP2000:I = D_IN F2000 D_IN F 2000j1999
= 0; 998861 0:97047 = 0:028391

Quindi molto più basso rispetto ai modelli autoregressivi precedenti, prossimo al valore
e¤ettivo.

6.3.2 Modello con predittori multipli, stazionarietà, test di Granger

Il modello (9) può essere ulteriormente generalizzato in modo tale da introdurre come regressori
altre variabili esplicative ed i loro ritardi (le ipotesi utilizzate per la stima OLS di un modello

39
con predittori multipli sono riportate a pag.441 del libro di testo Stock e Watson (SW)). Fra le
principali ipotesi alla base della stima OLS di questi modelli autoregressivi abbiamo l’ipotesi di
stazionarietà della distribuzione delle variabili aleatorie utilizzate nel modello (la de…nizione di
stazionarietà è riporata a pag.440 di SW).
Un test di ipotesi rilevante nel caso dei modelli autoregressivi con predittori multipli è il
test di Granger. Prendiamo il modello (9) che può essere considerato un caso particolare di
modello con predittori multipli con una sola variabile diversa da quella dipendente compresa
fra i regressori del modello.
L’ipotesi nulla alla base del test di Granger è uguale a:

H0 : 1 = 2 = 3 = 4 = 0; H1 : j 6= 0 per qualche j 2 f1; 2; 3; 4g

Procediamo utilizzando la procedura OMIT partendo dall’output di stima del modello (9).
Otteniamo il seguente output:

40
4 = 8:222 ed il suo p-value. Ri…utiamo dunque l’ipotesi nulla e diciamo
La statistica F1
che la variabile U N EM Pt causa-nel senso di Granger-la variazione del tasso di in‡azione, ossia
contiene informazioni utili per spiegare la variazione annuale del tasso di in‡azione.

7 Criteri di informazione
Come abbiamo visto passando in rassegna le principali varianti di modelli autoregressivi, un
problema cruciale è la determinazione del numero ottimale di ritardi delle variabili esplicative
da introdurre nel modello. Il principio alla base della scelta è il giusto bilanciamento fra 1)

41
bene…cio derivante da aggiungere più ritardi, 2) costo della maggiore incertezza della stima.
Come abbiamo già accennato nei paragra… precedenti un primo metodo è quello che utilizza
la statistica F implementando una serie di test di ipotesi congiunte sui ritardi maggiori delle
variabile esplicative usate nel modello. Ad esempio partendo dal modello (9) e ripetendo la
stima su modelli via via più parsimoniosi arriviamo …no alla stima del seguente modello:

In versioni ancora più parsimoniose del modello (con minor numero di ritardi) l’ipotesi
nulla di non signi…catività congiunta o non congiunta di parametri è rigettata. Utilizzando
la statistica F dunque il modello ADL(2,2) risulta essere la migliore speci…cazione del nostro
modello.
Esiste tuttavia un altro metodo, spesso più utile, che consiste nella minimizzazione di "criteri
di informazione". Fra i principali criteri di informazione prendiamo in considerazione il BIC
(Bayes Informazion Criterion) e l’AIC (Akaike Information Criterion), le cui formule generali
(che valgono per qualunque versione di modello autoregressivo) riportiamo qui di seguito. K è

42
pari al numero di coe¢ cienti, inclusa l’intercetta, presenti nel modello di autoregressione scelto.
Ad esempio nel modello ADL(2,2) K = 2 + 2 + 1 = 5:

SSR(K) ln T
BIC(K) = ln +K
T T
SSR(K) 2
AIC(K) = ln +K
T T

Il BIC(K) è sempre superiore rispetto all’AIC(K). Il modello da preferire è quello i cui criteri
di informazione sono i più bassi possibili. Fra tutte le nostre varianti di modello autoregressivo
analizzate in questi paragra… (AR(1), AR(4), ADL(4,1), ADL(4,4), ADL(2,2)) potete facilmente
veri…care che nel modello ADL(2,2) BIC(5) e AIK(5) assumono i valori più bassi. Confermiamo
dunque la scelta di due ritardi sia per la variabile D_IN Ft sia per la variabile U N EM Pt :

43