Sei sulla pagina 1di 31

Capitolo 10

Regressione con
dati panel

Copyright © 2012 Pearson Italia, Milano – Torino


I Dati panel

Un panel contiene osservazioni su più unità (individui, stati,


imprese) in cui ogni unità è osservata in due o più istanti
temporali diversi.
Esempi:
– Dati su 420 distretti scolastici della California nel 1999 e ancora
nel 2000, per 840 osservazioni in totale.
– Dati su 50 stati USA, ognuno è osservato per 3 anni, per un
totale di 150 osservazioni.
– Dati su 1000 individuali, in quattro mesi diversi, per 4000
osservazioni in totale.

Copyright © 2012 Pearson Italia, Milano – Torino


10-2
Notazione per dati panel

Un doppio pedice distingue unità (stati) e periodi temporali (anni)

i = unità (stato), n = numero di unità, perciò i = 1,…,n

t = periodo temporale (anno), T = numero di periodi temporali


perciò t =1,…,T

Dati panel con k regressori:

(Yit , X1it, X2it,…,Xkit) dove i = 1,…,n t = 1,…,T

Copyright © 2012 Pearson Italia, Milano – Torino


10-3
Panel =
Pannello i t Y X1 …
1 1 𝑌11 𝑋111
2 1 𝑌21 𝑋121

n 1 𝑌𝑛1 𝑋1𝑛1
1 2 𝑌12 𝑋112
2 2 𝑌22 𝑋122

n 2 𝑌𝑛2 𝑋1𝑛2

1 T 𝑌1𝑇 𝑋11𝑇
2 T 𝑌2𝑇 𝑋12𝑇

n T 𝑌𝑛𝑇 𝑋1𝑛𝑇

Copyright © 2012 Pearson Italia, Milano – Torino


10-4
Un po’ di gergo…

• I dati panel sono chiamati anche dati longitudinali

• panel bilanciato: non ci sono osservazioni che mancano,


cioè tutte le variabili sono osservate per tutte le unità (stati)
e tutti i periodi temporali (anni)

Copyright © 2012 Pearson Italia, Milano – Torino


10-5
Caso studio: morti sulle strade e imposte
sugli alcolici

Il contesto spazio-temporale:
• 48 stati USA, perciò n =48
• 7 anni (1982,…, 1988), perciò T =7
• Panel bilanciato, perciò numero totale di osservazioni
= 7×48 = 336

Variabili:
• Tasso di mortalità stradale (numero di morti sulle strade per
10.000 residenti nello stato)
• Imposta su una cassa di birra
• Altre (età minima per guidare, leggi sulla guida in stato di
ebbrezza, ecc.)

Copyright © 2012 Pearson Italia, Milano – Torino


10-6
Mortalità stradale USA nel 1982:

Imposte sugli alcolici più elevate e maggiore mortalità?

Copyright © 2012 Pearson Italia, Milano – Torino


10-7
Proviamo ad analizzare meglio

Perché si osservano più morti sulle strade in stati in cui


ci sono imposte più elevate sugli alcolici?

Altri fattori che influenzano il tasso di mortalità stradale:


• Qualità (età) delle automobili
• Qualità delle strade
• “Cultura” sul bere e guidare
• Densità di auto sulle strade

Copyright © 2012 Pearson Italia, Milano – Torino


10-8
Questi fattori omessi potrebbero causare
distorsione da variabili omesse.

Esempio 1: densità del traffico e tasse sugli alcolici

I. Elevata densità del traffico significa più morti sulle strade


II. Gli stati con minore densità di traffico (all’ovest) hanno imposte
sugli alcolici minori

Esempio 2: attitudini culturali verso il bere e la guida


I. sono presumibilmente un determinante della mortalità stradale
II. sono potenzialmente correlate con le imposte sulla birra

N.B. In entrambi gli esempi le due condizioni per la distorsione da


variabili omesse sono soddisfatte.

Copyright © 2012 Pearson Italia, Milano – Torino


10-9
Dati panel con due periodi temporali

Consideriamo il modello dei dati panel,

FatalityRateit = β0 + β1BeerTaxit + β2Zi + uit

Zi (ad es. ‘‘attitudini culturali’’) è un fattore che non cambia nel


tempo (densità), almeno durante gli anni per cui abbiamo dati.
• Supponiamo che Zi non sia osservato: la sua omissione
potrebbe comportare distorsione da variabili omesse.
• L’effetto di Zi può essere eliminato usando T = 2 anni.

Copyright © 2012 Pearson Italia, Milano – Torino


10-10
• Supponiamo E(uit|BeerTaxit, Zi) = 0 per ogni i e t
• Consideriamo due anni: 1982 e 1988:
FRi1988 = β0 + β1BTi1988 + β2Zi + ui1988
FRi1982 = β0 + β1BTi1982 + β2Zi + ui1982
perciò
(FRi1988 – FRi1982)= β1(BTi1988 – BTi1982) + (ui1988 – ui1982)

• Il nuovo termine d’errore, (ui1988 – ui1982), non è correlato


con BeerTaxi1988 o BeerTaxi1982.
• Questa equazione può essere stimata con OLS
• La variabile omessa Zi non ha più alcun ruolo
• Manca β0 ma noi possiamo comunque stimarlo: la stima sarà
prossima a zero

Copyright © 2012 Pearson Italia, Milano – Torino


10-11
Esempio: mortalità stradale e imposte
sulla birra
Dati del 1982:
FR = 2,01 + 0,15BeerTax (n = 48)
(0,15) (0,13)
Dati del 1988:
FR = 1,86 + 0,44BeerTax (n = 48)
(0,11) (0,13)

Regressione differenze (n = 48)


(FR1988-FR1982)= –0,072 – 1,04(BT1988–BT1982)
(0,065) (0,36)

Copyright © 2012 Pearson Italia, Milano – Torino


10-12
ΔFatalityRate v. ΔBeerTax:

Copyright © 2012 Pearson Italia, Milano – Torino


10-13
Regressione con effetti fissi

E se si hanno più di 2 periodi temporali (T > 2)?

Yit = β0 + β1Xit + β2Zi + uit, i =1,…,n T = 1,…,T

Possiamo riscrivere il modello in due modi utili:


1. modello di regressione “con effetti fissi”
2. modello di regressione “n-1 regressori binari”

Copyright © 2012 Pearson Italia, Milano – Torino


10-14
2 Regressioni per un modello

Scriviamo il modello in termini generali:

𝑌𝑖𝑡 = 𝛽0 + 𝛽1 𝑋𝑖𝑡 + 𝛽2 𝑍𝑖 + 𝑢𝑖𝑡

poiché 𝛽2 𝑍𝑖 non cambia nel tempo, il modello può essere riscritto


come:

1) 𝑌𝑖𝑡 = 𝛽1 𝑋𝑖𝑡 + 𝛼𝑖 + 𝑢𝑖𝑡 dove 𝛼𝑖 = 𝛽0 + 𝛽2 𝑍𝑖

o anche:

2) 𝑌𝑖𝑡 = 𝛽0 + 𝛽1 𝑋𝑖𝑡 + 𝛾2 𝐷2𝑖 + ⋯ 𝛾𝑛 𝐷𝑛𝑖 + 𝑢𝑖𝑡


dove: 𝐷2𝑖 = 1 𝑠𝑒 𝑖 = 2; = 0 𝑎𝑙𝑡𝑟𝑖𝑚𝑒𝑛𝑡𝑖; … .
è facile notare che: 𝛼1 = 𝛽0 , 𝛼2 = 𝛽0 + 𝛾2 , … , 𝛼𝑛 = 𝛽0 + 𝛾𝑛

Copyright © 2012 Pearson Italia, Milano – Torino


10-15
Stima dei modelli

1) 𝑌𝑖𝑡 = 𝛽1 𝑋𝑖𝑡 + 𝛼𝑖 + 𝑢𝑖𝑡

2) 𝑌𝑖𝑡 = 𝛽0 + 𝛽1 𝑋𝑖𝑡 + 𝛾2 𝐷2𝑖 + ⋯ 𝛾𝑛 𝐷𝑛𝑖 + 𝑢𝑖𝑡

• Il modello 2) si stima come un normale modello con il metodo OLS ma se le


unità sono tante è ‘‘molto pesante’’

• Nell’esempio, il modello 2) avrebbe 48 regressori (X e 47 dummy-stato)!

• I computer moderni ce la possono fare, ma serve proprio calcolare gli effetti


stato, se non sono il nostro focus?

Copyright © 2012 Pearson Italia, Milano – Torino


10-16
Stima dei modelli

1) 𝑌𝑖𝑡 = 𝛽1 𝑋𝑖𝑡 + 𝛼𝑖 + 𝑢𝑖𝑡

Il modello 1) può essere stimato agevolmente con una opportuna procedura:


• Si calcola 𝑌ത𝑖 media intertemporale di 𝑌 nell’unità 𝑖
• Si calcola 𝑋ത𝑖 media intertemporale di 𝑋 nell’unità 𝑖
• Si calcolano 𝑌෨𝑖𝑡 = 𝑌𝑖𝑡 − 𝑌ത𝑖 , 𝑋෨𝑖𝑡 = 𝑋𝑖𝑡 − 𝑋ത𝑖
• Il modello 1) diventa:
𝑌෨𝑖𝑡 = 𝛽1 𝑋෨𝑖𝑡 + 𝑢෤ 𝑖𝑡 (*)

Il modello (*) è :
• più leggero da stimare
• non stima direttamente 𝛼𝑖 , ma con semplici passaggi si recuperano

Copyright © 2012 Pearson Italia, Milano – Torino


10-17
Riassumendo

Tre metodi di stima:


1. Regressione OLS con “n-1 regressori binari”
2. Regressione OLS con “unità in deviazioni dalle medie”
3. Specificazione “prima e dopo”, senza intercetta (ma solo per T = 2)

• Questi tre metodi producono identiche stime dei coefficienti di regressione


e identici errori standard.
• Abbiamo già utilizzato la specificazione “prima e dopo” (1988 meno 1982)
• I metodi 1 e 2 funzionano per un generico T
• Il metodo 1 è praticabile solo quando n non è troppo grande

Copyright © 2012 Pearson Italia, Milano – Torino


10-18
Esempio: mortalità stradale e imposte
sulla birra in Gretl
Model 7: Fixed-effects, using 336 observations
Included 48 cross-sectional units
Time-series length = 7
Dependent variable: FR
Robust (HAC) standard errors
Coefficient Std. Error t-ratio p-value
const 2.37707 0.149797 15.87 <0.0001 ***
beertax −0.655874 0.291856 −2.247 0.0294 **

Mean dependent var 2.040444 S.D. dependent var 0.570194


Sum squared resid 10.34537 S.E. of regression 0.189859
LSDV R-squared 0.905015 Within R-squared 0.040745
Log-likelihood 107.9727 Akaike criterion −117.9454
Schwarz criterion 69.09307 Hannan-Quinn −43.38661
rho 0.251243 Durbin-Watson 1.071816

N.B. Qui const è la media degli effetti fissi 𝛼𝑖

Copyright © 2012 Pearson Italia, Milano – Torino


10-19
Regressione con effetti temporali

Una variabile omessa potrebbe variare nel tempo ma non tra gli stati.
Esempio:
• auto più sicure (air bag, ecc.);
• modifiche nelle leggi nazionali

Producono effetti 𝜆𝑡 che variano nel tempo:

𝑌𝑖𝑡 = 𝛽𝑋𝑖𝑡 + 𝜆𝑡 + 𝑢𝑖𝑡

Copyright © 2012 Pearson Italia, Milano – Torino


10-20
Tre differenti modelli
1. Modello con solo effetti fissi:
𝑌𝑖𝑡 = 𝛽𝑋𝑖𝑡 + 𝛼𝑖 + 𝑢𝑖𝑡
N.B. Si usa se si ritiene che non ci siano effetti temporali costanti (possibile)

2. Modello con solo effetti temporali:


𝑌𝑖𝑡 = 𝛽𝑋𝑖𝑡 + 𝜆𝑡 + 𝑢𝑖𝑡
N.B. Si usa se si ritiene che non ci siano effetti locali costanti (difficile)

3. Modello con effetti fissi e temporali:


𝑌𝑖𝑡 = 𝛽𝑋𝑖𝑡 + 𝛼𝑖 + 𝜆𝑡 + 𝑢𝑖𝑡
Modello più realistico

Copyright © 2012 Pearson Italia, Milano – Torino


10-21
Modello con effetti fissi e dummy temporali

Gli effetti temporali (se i periodi non sono molti) sono generalmente
trattati con variabili ‘‘dummy’’.
La formulazione più frequente del modello con effetti fissi e temporali è:

𝑌𝑖𝑡 = 𝛽𝑋𝑖𝑡 + 𝛼𝑖 + 𝛿2 𝐵2𝑡 + ⋯ + 𝛿𝑇 𝐵𝑇𝑡 + 𝑢𝑖𝑡

dove:
• 𝐵𝑘𝑡 = 1 𝑠𝑒 𝑡 = 𝑘; 0 𝑎𝑙𝑡𝑟𝑖𝑚𝑒𝑛𝑡𝑖
• 𝛿𝑘 è l’effetto relativo del tempo 𝑘 rispetto al tempo 1
• I parametri 𝛽 e 𝛿2 , … , 𝛿𝑇 si stimano direttamente su un modello alle
differenze come visto precedentemente
• Gli effetti locali 𝛼 si stimano indirettamente

Copyright © 2012 Pearson Italia, Milano – Torino


10-22
Esempio
Model 9: Fixed-effects, using 336 observations
Included 48 cross-sectional units
Time-series length = 7
Dependent variable: FR
Robust (HAC) standard errors
Coefficient Std. Error t-ratio p-value
const 2.42847 0.201688 12.04 <0.0001 ***
beertax −0.639980 0.357078 −1.792 0.0795 *
dt_2 −0.0799029 0.0350861 −2.277 0.0274 **
dt_3 −0.0724205 0.0438809 −1.650 0.1055
dt_4 −0.123976 0.0460559 −2.692 0.0098 ***
dt_5 −0.0378645 0.0570604 −0.6636 0.5102
dt_6 −0.0509020 0.0636084 −0.8002 0.4276
dt_7 −0.0518038 0.0644023 −0.8044 0.4252

Mean dependent var 2.040444 S.D. dependent var 0.570194


Sum squared resid 9.919301 S.E. of regression 0.187883
LSDV R-squared 0.908927 Within R-squared 0.080251

Copyright © 2012 Pearson Italia, Milano – Torino


10-23
Assunzioni dei minimi quadrati per dati
panel
Si consideri una singola X:

Yit = β1Xit + αi + uit, i = 1,…,n, t = 1,…, T

1. E(uit|Xi1,…,XiT,αi) = 0.
2. (Xi1,…,XiT,ui1,…,uiT), i =1,…,n, sono i.i.d.
3. (Xit, uit) hanno momenti quarti finiti.
4. Non vi è collinearità perfettà (molteplicità di X)

Le assunzioni 3 e 4 sono identiche al caso dei minimi quadrati,


le assunzioni 1 e 2 sono diverse.

Copyright © 2012 Pearson Italia, Milano – Torino


10-24
Assunzione 1: E(uit|Xi1,…,XiT,αi) = 0
• uit ha media zero, dato l’effetto fisso e l’intera storia delle X per
l’unità corrispondente
• Questa è un’estensione temporale della precedente assunzione 1
della regressione multipla
• Non c’è feedback da u su X futuri:
– il fatto che uno stato abbia un tasso di mortalità particolarmente
alto quest’anno non influisce sull’aumento delle imposte sulla
birra.
– talvolta questa assunzione di “assenza di feedback” è plausibile,
talvolta no.

Copyright © 2012 Pearson Italia, Milano – Torino


10-25
Assunzione 2: (Xi1,…,XiT,ui1,…,uiT), i =1,…,n,
sono i.i.d. dalla distribuzione congiunta.

• È un’estensione dell’assunzione 2 per la regressione multipla con dati


sezionali

• È soddisfatta se le unità sono prese a caso dalla popolazione mediante


campionamento casuale semplice.

• Non richiede che le osservazioni siano i.i.d. nel tempo per la stessa unità –
sarebbe irrealistico. Il fatto che uno stato abbia un’imposta sulla birra
elevata quest’anno è correlato con fatto che avrà un’imposta sulla birra
elevata l’anno seguente.

• Similmente, il termine d’errore per un’unità in un anno è plausibilmente


correlato con il suo valore l’anno dopo, cioè corr(uit, uit+1) è plausibilmente
diverso da zero (autocorrelazione).

Copyright © 2012 Pearson Italia, Milano – Torino


10-26
Sotto le assunzioni dei minimi quadrati
per dati panel:
• Lo stimatore OLS con effetto fisso di 𝛽1 è non distorto, consistente e ha
distribuzione asintotica normale
• Tuttavia, i consueti errori standard OLS (sia di omoschedasticità pura sia
robusti all’eteroschedasticità) saranno in generale sbagliati perché
assumono che uit non sia serialmente correlata.
• Il problema si risolve usando errori standard consistenti in presenza di
eteroschedasticità e autororrelazione (HAC)

Copyright © 2012 Pearson Italia, Milano – Torino


10-27
Esempio
Model 9: Fixed-effects, using 336 observations
Included 48 cross-sectional units
Time-series length = 7
Dependent variable: FR
Robust (HAC) standard errors
Coefficient Std. Error t-ratio p-value
const 2.42847 0.201688 12.04 <0.0001 ***
beertax −0.639980 0.357078 −1.792 0.0795 *
dt_2 −0.0799029 0.0350861 −2.277 0.0274 **
dt_3 −0.0724205 0.0438809 −1.650 0.1055
dt_4 −0.123976 0.0460559 −2.692 0.0098 ***
dt_5 −0.0378645 0.0570604 −0.6636 0.5102
dt_6 −0.0509020 0.0636084 −0.8002 0.4276
dt_7 −0.0518038 0.0644023 −0.8044 0.4252

Mean dependent var 2.040444 S.D. dependent var 0.570194


Sum squared resid 9.919301 S.E. of regression 0.187883
LSDV R-squared 0.908927 Within R-squared 0.080251

Copyright © 2012 Pearson Italia, Milano – Torino


10-28
Il modello di rgressione multipla per dati panel:
Fatality ratio e tasse su alcolici e leggi

Variabili
• Tasso di mortalità stradale (morti per 10.000 residenti)
• Imposta su una cassa di birra (Beertax)
• Età minima di legge per bere alcolici
• Pene minime per la prima violazione:
– Pena obbligatoria
– Servizio sociale obbligatorio
– Pena soltanto pecuniaria
• Miglia per veicolo per guidatore (US DOT)
• Dati economici sullo stato (reddito pro capite, ecc.)

Copyright © 2012 Pearson Italia, Milano – Torino


10-29
Copyright © 2012 Pearson Italia, Milano – Torino
10-30
Analisi empirica: risultati principali

• Il segno del coefficiente dell’imposta sulal birra cambia quando sono inclusi
gli effetti fissi dello stato
• Gli effetti temporali sono statisticamente significativi ma la loro inclusione
non ha un grande impatto sui coefficienti stimati
• L’effetto stimato dell’imposta sulla birra diventa non significativo quando si
includono altre leggi.
• Sembra che le condizioni socio-economiche siano i fattori che incidono
maggiormente
• Se si considerano solo due periodi, distanti nel tempo, il contributo degli
effetti fissi cala, e l’effetto dell’imposta sulla birra potrebbe essere distorto.

Copyright © 2012 Pearson Italia, Milano – Torino


10-31

Potrebbero piacerti anche