Sei sulla pagina 1di 52

Introduzione: Econometria è la misurazione di grandezze economiche, significa usare dati

economici per stimare relazioni, verificare ipotesi e prevedere esiti economici

Per questo compito useremo funzioni che analizzano una variabile in funzione di altre
Esempio: Q d = f (P, P s, P c, R E DD) per studiare la quantità domandata in funzione del prezzo del bene, prezzo dei
beni sostituti, prezzo dei beni complementari e reddito

➝ queste funzioni rappresentano il modello economico, attraverso il modello econometrico si


analizza la dimensione quantitativa di queste relazioni ➝ “di quanto cambia una variabile in
risposta alla variazione di altre”

Per raggiungere il nostro risultato ci avvaliamo di p a r a m t r i che identifichino l’effetto marginale,


l’econometria di occupa di stimare il valore di questi parametri, utilizzando dati econometrici
presi a campione

Essendo il fine del modello econometrico spiegare la realtà, bisogna considerare sia le
componenti sistematiche che quelle stocastiche:
• Componente sistematica: derivata dalla teoria economica, è rappresentata dai coefficienti
β1, β2, β3 . . . che rappresentano la relazione tra le variabili della funzione ➝ forma funzionale
I coefficienti vengono chiamati parametri
Per la correttezza dell’analisi è necessario che la forma funzionale sia coerente con la teoria
economica e compatibile con le osservazioni empiriche
• Componente causale: componente di disturbo che complica la comprensione della relazione tra
le variabili, è rappresentata da +e al termine della forma funzionale
L’errore incorpora molti fattori che hanno effetto ma che sono stati omessi dal modello per
semplificazione
L’econometria, lavorando su campioni e non sulla popolazioni, è solo capace di stimare i
parametri, e lo scarto derivante dalla stima campionaria è incorporato nell’errore e

Q d = f (P, P s, P c, R EDD) = β1 + β2 P + β3P s + β4 P c + β5 R EDD + e


modello economico modello econometrico

L’inferenza statistica sul mondo reale produce:


• Stime di parametrici economiche
• Previsioni di grandezze economiche
• Verifica di ipotesi economiche

Generazione dei dati


1. Dati sperimentali: effettuare o osservare l’esito di un esperimento ➝ permette di fissare le
variabili allo stesso valore in sessioni ripetute dell’esperimento
2. Dati non sperimentali: indagine campionaria casuale ➝ i valori di tutte le variabili non sono ne
fissi ne replicabili (per via della casualità del campione)

Classificazione dei dati


A. Livello di aggregazione a cui vengono raccolti i dati
A.1.Micro: unità economiche individuali
A.2.Macro: riunioni o aggregazione di individui
B. Modalità di misurazione
B.1.Flusso: raccolta riferita ad un periodo di tempo
B.2.Stock: raccolta in uno specifico punto del tempo
C. Valore del dato
C.1.Quantitativi: grandezze espresse in termini numerici o come trasformazione di questi
C.2.Qualitativi: grandezze riferite alla scelta effettuata fra un numero discreto di alternative

Modelli Econometrici Pagina 1 di 52


Modalità Carattere e Tempo Esempio grafico

Serie storica Il medesimo carattere è osservato ad intervalli


differenti di tempo ➝ gli intervalli di tempo sono
regolari

Cross-section Raccolta di osservazioni da unità campionarie


diverse in un particolare periodo temporale ➝
diversi caratteri, diverse unità medesimo tempo

Panel / dati longitudinali Raccolta di osservazioni da unità campionarie


diverse in diversi intervalli temporali ➝ diversi
caratteri, diverse unità, diversi tempi

Se le osservazioni temporali sono dello stesso


numero per tutte le unità è detto panel bilanciato

Processo di ricerca:
1. Individuazione della 2. Creazione del modello 5. Verifica della vanità delle
teoria economica, econometrico ipotesi
elencando i quesiti e 3. Raccolta di dati 6. Analisi e valutazione delle
scegliendo il modello campionari implicazioni economiche
economico 4. Stima dei parametri legate al modello

Modello di regressione lineare SEMPLICE ➝ strumento utile in tutte le situazioni in cui è chiesto
a quanto ammonterà l'effetto su una variabile di una variazione in un'altra variabile

Utilizzare l’esempio composto dalle variabili spesa alimentare (y) e reddito (x), i cui dati utilizzabili
su STATA sono raccolti in food.dta ➝ Food_exp e Income saranno le nostre variabili

Per la variabile casuale continua yfood−exp ha una sua funzione di


densità fd d che descrive la probabilità di osservare valori diversi
della spesa alimentare ➝ questo valore varia di famiglia in
famiglia, pure mantenendo la variabile reddito costante ➝ avremo
quindi fd d f (y | x) descrive la distribuzione intorno alla media della
spesa nella popolazione, e assumeremo per dato che
graficamente è rappresentato da una campana

La media condizionale (valore atteso ≠ media aritmetica) di y è


dato da E(y | x = 1000) = μy|x ➝ E è la funzione che permette di
ricavare il valore medio condizionato

Chiameremo varianza condizionale di y la misura della dispersione della spesa attorno alla
media μy|x ➝ è dato da Var (y | x = 1000) = σ 2

➝ se i parametri varianza e media fossero noti fornirebbero informazioni importanti sulla


popolazione in esame
Modelli Econometrici Pagina 2 di 52
Chiameremo variabile dipendente la y e variabile esplicativa la x ➝ nell’analisi econometria sono
variabili casuali della popolazione

Partiamo dal modello economico per giungere al modello econometrico


Per semplificazione, analizzeremo un modello economico lineare (in una sola variabile) di media
condizionale
E(y | x) = μy|x = β1 + β2 x ➝ chiamato funzione di regressione semplice (lineare), di cui i
parametri β1 e β2 rappresentano rispettivamente intercetta a x = 0
e pendenza della retta di regressione ➝ in particolare β2 indica la
d E(y | x)
propensione marginale al consumo β2 = (per il modello
dx
considerato)

Nel modello economico, β1, β2 sono quantità caratterizzanti del


comportamento della popolazione ➝ costanti della popolazione

Nel nostro studio, questi saranno gli elementi che andremo a


stimare ➝ dato che y, x sono variabili osservate sulla popolazione

Estraendo campioni casuali dalla popolazione, sappiamo che le


osservazione sarebbe disperse attorno alla media E(y | x)
➝ nella figura a destra sono state sovrapposte le fd d e la retta di
regressione per illustrarne il comportamento dispersivo

Per completare il modello econometrico è necessario considerare


l’errore causale, cioè la componente stocastica che rappresenta la differenza fra y e la sua media
condizionale E(y | x) ➝ e = y − E(y | x) = y − β1 − β2 x

Il modello di regressione lineare semplice diventa y = β1 + β2 x + e


Sapendo che la media del termine di errore risulta nulla ➝ questo
perché nella sommatoria gli scostamenti negativi assorbono quelli
positivi e viceversa ➝ E(e) = 0
➝ Equivale ad assumere E(y) = β1 + β2 x

Utilizziamo il modello econometrico per stimare i parametri β1, β2 ➝


il risultato non sono i valori dei parametri, ma stime pari a b1, b2 nel
campione

- Gli stimatori sono formule generali e dunque variabili casuali


- Le știme sono numeri che otteniamo applicando le formule generali ai dati osservati
Attraverso i dati del campione food.dta ricaviamo un grafico di dispersione, rappresentativo del
campione e non della popolazione
E su di esso dobbiamo stimare la retta di regressione semplice
yî = b1 + b2 xi

Ci avvaleremo del principio dei minimi quadrati per stimare b1, b2 ➝


da ora in poi chiamate stime dei minimi quadrati dei parametri β1, β2
Con tale principio riduciamo al minimo le distanze verticali dei punti
della dispersione dalla retta di regressione

Partiamo dunque da due rette, passanti per la dispersione


1. yî = b1 + b2 xi ➝ retta stimata con i minimi quadrati
̂
2. y*
i
= b*
1
+ b* x ➝ retta qualsiasi
2 i

Modelli Econometrici Pagina 3 di 52


Sappiamo che la distanza verticale delle due rette è
esprimibile come
1. eî = yi − yî = yi − b1 − b2 xi per la retta stimata
2. e*
i
̂ = yi − y*î per la retta qualsiasi

Applicando il principio dei minimi quadrati sappiamo che la


somma dei quadrati dei residui ad esse associati è minore
della somma dei quadrati dei residui associati ad qualsiasi
altra retta
N N
e2̂ ; e*î 2 allora SQ R < SQ R*
∑ i ∑
SQ R = SQ R* =
i=1 i=1
Il calcolo di queste stime, matematicamente, è
N
(yi − β1 − β2 xi )2 ➝ non sarà

min S(β1, β2) =
β1,β 2
i=1
necessario ricavare matematicamente i parametri in quanto
noi utilizzeremo il programma STATA a tale fine

STATA:
Bisogna utilizzare il comando reg+[variabile y]+[variabile x]
Il risultato del comando è una tabella, concentriamoci
sulla seconda riga prima colonna

Alla voce income equivale la stima del


parametro b2, mentre alla voce _cons
equivale la stima del parametro b1

È possibile richiedere a stata anche la rappresentazione grafica del campione

Per un grafico istogramma basta inserire il comando hist+[variabile], il quale risultato è


un’istogramma con specifiche standard del programma. Se vogliamo aumentare il numero di
colonne basterà completare il comando con +, bin([numero colonne]) ➝ è importante la virgola
.004

.005
.004
.003

.003
Density

Density
.002

.002
.001

.001
0

100 200 300 400 500 600 100 200 300 400 500 600
household food expenditure per week household food expenditure per week

Per avere un grafico di dispersione invece bisogna passare dal menu-graphics-twoway graph-
create-basic plots-scatter

Mandando il comando verrà creato il grafico a dispersione

Modelli Econometrici Pagina 4 di 52


600
household food expenditure per week
200 300 400
100 500
0 10 20 30 40
weekly household income

Per avere una retta di regressione sopra al grafico di dispersione bisogna tornare su menu-
graphics-twoway graph-create-fit plots-linear prediction

600
500
400
300
200
100

0 10 20 30 40
weekly household income

household food expenditure per week Fitted values

Per alcuni modelli economici sarà necessario calcolare la regressione senza valore b1, in quanto
non ha valore la stima che interseca l’asse (a x = 0 ) ➝ in queste occasioni la regressione va
stimata con il comando reg+[variabile y]+[variabile x]+, noconstant
Il risultato sarà una nuova tabella, con stime differenti dalla precedente, che calcola solo b2

Altri comandi utili per lavorare con stata sono:

sum Genera una tabella che riporta i


valori (rispetto alle variabili del
campione) di: media, varianza,
devianza standard, minimo e
massimo

gen+[nome variabile]+=+ Genera una nuova variabile che


[relazione] rispetta la relazione scelta

Modelli Econometrici Pagina 5 di 52


Interpretazione delle stime:
A. b2 : può essere inteso come effetto marginale della variabile esplicativa sulla variabile
dipendente ➝ nel nostro esempio, un aumento unitario del reddito (1 = 100$) coincide con un aumento della
spesa in alimenti pari a b 2 ( = 10.20)
B. b1 : coincide con l’intercetta dell’asse x, cioè il valore della variabile dipendente quando la
variabile esplicativa è nulla ➝ attenzione ➝ in molti modelli economici questa stima non è una
buona approssimazione della realtà in quanto valori nulli nella variabile esplicativa non
vengono osservati

Residui: approssimazione degli errori, calcolabili a differenza degli errori e ̂ = y − b1 − b2 x ➝ e ≠ e ̂

Previsione del valore medio: ŷ = b1 + b2 x ➝ rappresenta la stima della media di y


STATA:
• Si utilizza il comando predict[nome variabile] ➝ crea una nuova
variabile contenente la stima di ŷ per i valori del campione
• Si utilizza il comando predict[nome variabile]+, res ➝ crea una
nuova variabile contenente la stima di e ̂ per i valori del campione

Elasticità: caratterizza la reattività di una variabile rispetto un’altra ➝ concettualmente ha lo


stesso effetto della marginalità, ma è un numero puro ➝ non ha unità di misura
variazione percentuale di y
Δy x
Per y rispetto ad x possiamo usare la formula generale ϵ =
Δx y
variazione percentuale di x
Δy x
Nel modello lineare abbiamo = β2 e dunque ϵ = β2 ➝ in un modello lineare l’elasticità è
Δx y
diversa in ogni punto della retta di regressione (perché dipendente da x), dunque è preferibile
x x
b2( b + ib x ) b2( yî )
1 2 i i
calcolarla nei punti delle medie della retta: ϵ ̂ = =
N N
STATA:
Si utilizza il comando gen+[eps]+=+[relazione] per creare
la nuova variabile elasticità ➝ come relazione utilizziamo
xi
b2( ) nel nostro esempio _b[income]*[income]/yhat,
yî
infine si calcola la media della variabile creata con il
comando sum+[nome variabile]

Modello Log Log: log (y) = β1 + β2log(x) + e ➝ consideriamo questo modello poiché,
essendo logaritmico e non lineare, ha elasticità costante

➝ il modello rimane lineare nei parametri β1, β2, mentre non è lineare nelle variabili y, x
dy x
ϵ= = β2 ➝ ϵ ̂ = b2
dx y
La particolarità del modello è che la stima dell’elasticità coincide con la stima di b2, e questa è
facilmente stimabile attraverso il modello di regressione lineare

Δy y ex p(β1 + β2logx)
Per l’effetto marginale nel modello log-log ricaviamo = β2 = β2
Δx x x
Modelli Econometrici Pagina 6 di 52
STATA:
Si utilizza il comando gen+[nome variabile]+=+[relazione] per creare le
nuove variabili logaritmiche ➝ come relazione utilizziamo log+( [nome
variabile] ) per creare il logaritmo di y e x ➝ attraverso il comando reg+
[variabile y]+[variabile x] stimo i parametri della regressione b1, b2

Ulteriore informazione sulla tabella dei valori della regressione:


nella prima colonna, SS, abbiamo la stima della somma quadratica dei
residui

Ulteriori comandi di Stata


_b[variabile] Prende il valore contenuto nell’ultima
regressione calcolata alla colonna
coefficiente per la variabile selezionata

_s[variabile] Prende il valore contenuto nell’ultima


regressione calcolata alla colonna standard
error per la variabile selezionata

If+[variabile]+ Restringe il campione utilizzato imponendo != diverso > maggiore


[condizione] una condizione logica == uguale <= minore uguale
Il comando può essere completato con i < minore >= maggiore uguale
connetti & (and) e | (or)

In+[N1][N2] Restringe il campione utilizzato imponendo di


utilizzare solo le osservazioni dalla N1 alla N2
Infine si può utilizzare direttamente stata come calcolatrice, per esempio ricavare una stima per
un preciso punto del campione, attraverso il comando display+[relazione] ➝ nell’esempio
calcoliamo la stima di ŷ per x = 20, sostituendo nella relazione _b[_cons]+_b[income]*20

Proprietà degli stimatori


Partiamo dal ricordare che gli stimatori b1, b2 sono variabili casuali, generali per il modello di
regressione lineare
N
xi − x̄

➝ b2 = wi yi è la forma lineare dello stimatore di β2 ➝ il termine wi = dipende
i=1
∑ (xi − x̄)2
solo da valori non stocastici x, dunque anch’esso è non stocastico


Giungiamo attraverso passaggi aritmetici alla forma b2 = β2 + wi ei ➝ e è l’errore casuale del
modello regressione

Definiamo uno stimatore corretto se il valore atteso equivale al vero valore del parametro stimato
➝ E(b2 ) = β2 ➝ nella pratica questa proprietà è dimostrabile con i campioni ripetuti
➝ presi numerosi campioni della popolazione aventi la stessa numerosità, la media aritmetica
delle stime di β2 attraverso lo stimatore b2 è il valore corretto del parametro β2

Per giungere a questo risultato è fondamentale l’ipotesi secondo la quale il valore atteso del
=0

termine di errore è nullo E(e) = 0 ➝ E(b2) = β2 + wi E(e) = β2

In caso contrario lo stimatore è definito distorto E(b2 ) ≠ β2

Modelli Econometrici Pagina 7 di 52


➝ il fatto che lo stimatore sia corretto non rende la stima giusta ➝ nel campione preso
singolarmente non possiamo sapere se la stima è corretta ➝ la correttezza vale solo su campioni
ripetuti

Per il modello di regressione lineare, anche lo stimatore b1 è corretto ➝ E(b1) = β1


Varianza e covarianza dello stimatore:
Var (b2) = E[(b2 − E(b2))2] misura l’ampiezza della
distribuzione di probabilità di b2

Prese due stime di varianza, dal punto di vista di


correttezza, scegliamo quella più con il valore più basso
f2(b2) ➝ più concentrata attorno al valore centrale
E(b2) = β2 e quindi con maggiore probabilità di ottenere
una stima prossima al valore di β2

➝ la varianza è anche chiamata precisione campionaria


↓ Var ianza ↑ Precisione
Ipotesi fondamentali:
- I residui hanno varianza costante: omoschedastiità ➝ Var (eî ) = σ 2 / eteroschedastiità ➝
Var (eî ) ≠ σ 2
- La covarianza fra ei, ej = 0 ➝ è una misura della dipendenza fra fenomeni casuali
➝ in particolare mi dice se i residui di i e j tendono a muoversi nella stessa direzione, direzioni
opposte o se non c’è legame
In formule:
N
∑i=1 xi2 1 2 − x̄
2 Var(b ) = σ 2
[ ] Cov(b1 , b2 ) = σ [ ]
Var(b1) = σ [ ] 2 N ∑
N
(x − x̄) 2
N
N ∑i=1 (xi − x̄)2 ∑i=1 (xi − x̄) 2
i=1 i

Analizziamo la crescita dei fattori che influenzano la varianza e covarianza:


1. Varianza del termine di errore σ 2: misura la dispersione dei valori y attorno al proprio valore
atteso E(y)
➝ maggiore è il termine di varianza σ 2 tanto maggiore è la dispersione e aumenta l’incertezza
sullo stimatore (aumenta la varianza dello stimatore)
N
(xi − x̄)2: misura quanto dispersi attorno alla proprio

2. Somma dei quadrati degli scarti
i=1
media siano i valori campionari della variabile esplicativa x
➝ maggiore è la somma dei quadrati tanto maggiore è la dispersione e diminuisce l’incertezza
sullo stimatore (diminuisce la varianza dello stimatore)
3. Numerosità campionaria N: misura il numero di osservazioni che compone il campione
➝ maggiore è numero di osservazioni tanto minore è la varianza dello stimatore
appare esplicitamente in Var (b1), mentre per Var (b2 ), Cov(b1, b2 ) ha effetto indiretto nella
sommatoria dei quadrati degli scarti, che essendo tutti positivi (quadrati) aumenta
all’aumentare della numerosità
N
xi2: compare solo in Var (b1) ➝ misura la distanza

4. Somma dei quadrati della variabile
i=1
dei valori dell’osservazione x da x = 0 dove è stimato b1
➝ maggiore è il valore della somma tanto maggiore è la varianza dello stimatore

Modelli Econometrici Pagina 8 di 52


5. Media campionaria delle osservazioni x̄: compare solo in Cov(b1, b2 )
➝ maggiore è il valore tanto maggiore è la covarianza degli stimatori

Teorema di Gauss-Markov ➝ Best Linear Unbiased Estimator (BLUE)


Il teorema afferma che, sotto le opportune ipotesi, lo stimatore dei MQ è il più efficiente (a
varianza minima) fra quelli lineari e corretti (il più preciso)

➝ il teorema è valido per gli stimatori dei minimi quadrati, non le stime calcolate a partire da un
campione

Distribuzione di probabilità degli stimatori ➝ proprietà


accessoria
La distribuzione equivale alla probabilità che un dato valore della
variabile si verifichi, è rappresentato da un grafico sull’asse
cartesiano ➝ l’area del grafico deve essere = 1

Data questa proprietà, numerose curve la possono rappresentare


➝ se la distribuzione di una variabile ha come curva una
campana, è definita normale
La campana dipende da due elementi:
• La media: identifica il punto di centralità
• La varianza: misura l’apertura (quanto è schiacciata la curva)

Se è valida l’ipotesi che gli errori e abbiamo distribuzione normale


(a campana) e ∼ N (0,σ 2 ), quindi E(e) = 0 e varianza σ 2 , allora anche gli stimatori hanno
distribuzione normale
→ b1 ∼ N [β1, var (b1)]
→ b2 ∼ N [β2, var (b2)]

Teorema del limite centrale: se la numerosità campionaria N è sufficientemente grande, gli


stimatori dei minimi quadrati hanno una distribuzione simile alla distribuzione normale N
~ quanto grande dipende dal modello

Stima della varianza del termine di errore


2
∑ ei2
Sappiamo che la varianza degli errori è σ = E(ei2)
= , ma non potendo osservare gli
N
2 2
∑ e2î
errori lavoriamo con i residui ➝ abbiamo σ ̂ = E(eî ) = =
N
Per ricavare uno stimatore corretto (E(σ ̂ 2 ) = σ 2) dividiamo per N − 2 ➝ gradi di libertà

➝ gradi di libertà: la differenza tra la numerosità N e i numero di parametri di regressione (nel


nostro caso β1, β2 ) ➝ N − 2
∑ e2î
2
Dunque lo stimatore corretto della varianza degli errori è σ ̂ =
N−2
Ora possiamo ricavare la stima della varianza degli stimatori dei minimi quadrati, sostituendo nelle
formule la stima della varianza degli errori σ ̂ 2
N
∑i=1 xi2 1 − x̄
̂ ] Cov(b̂ 1, b2) = σ ̂ [
2
2 ]
̂ ) = σ ̂ 2[
Var(b ] Var(b2) = σ ̂ [ N N
∑i=1 (xi − x̄)2
1 N
N ∑i=1 (xi − x̄)2 ∑i=1 (xi − x̄)2

Modelli Econometrici Pagina 9 di 52


avendo la stima della varianza degli stimatori dei minimi quadrati, possiamo ricavarci lo standard
error attraverso la radice quadrata di questi valori

se(b1) = ̂ )
Var(b se(b2) = ̂ )
Var(b
1 2
STATA:
Attraverso il comando reg+[variabile y]+[variabile x] ritorniamo sulla tabella delle stime generata

Nella tabella dei dati della regressione lineare viene riportata lo standard error degli stimatori, la
stima di σ 2 e la stima di σ

Questi valori vengono identificati anche dai comandi lincom e nlcom ➝ questi comandi si usano
rispettivamente per calcolare espressioni di stime lineari e non lineare (al pari del comando dis )

Modelli non lineari ➝ modello quadratico e modello log-lineare


Sono modelli non rappresentati da una retta ➝ possono ancora essere stimati attraverso la
regressione lineare semplice in quanto questa accetta con flessibilità variabili quadratiche e
logaritmiche ➝ l’aggettivo lineare è rispetto ai parametri (che non vengono trasformati) e non alle
variabili

Di questi modelli ci interessa conoscere la forma, l’effetto marginale e l’elasticità

Modello Quadratico: y = α1 + α2 x 2 + e
È definito quadratico quando la variabile esplicativa è al quadrato

Il modello ha sia pendenza che elasticità che variano in tutti i punti della funzione
d(y)
➝ Pendenza: va calcolata la derivata rispetto ad x della y = 2α2 x
d(x)

x 2α2 x 2
➝ Elasticità: equivale al prodotto tra pendenza e rapporto tra le variabili ϵ = 2α2 x * =
y y

Modelli Econometrici Pagina 10 di 52


Modello Log-Lineare: log(y) = γ1 + γ2 x + e
È definito Log-Lineare quando la variabile dipendente è un logaritmo, mentre la variabile
esplicativa è lineare
log(y)
Osserviamo che e = y = e γ1+γ2 x ➝ in questa equazione e = numero di Eulero
Viene spesso usato il modello log-lineare perché rende più regolari dati distribuiti in maniera
asimmetrica (code a destra/sinistra)

Il modello ha sia pendenza che elasticità che variano in tutti i punti della funzione
dlog(y)
➝ Pendenza: va calcolata la derivata rispetto ad x della y = γ2 y = γ2 * e γ1+γ2 x
d(x)
x
➝ Elasticità: equivale al prodotto tra pendenza e rapporto tra le variabili ϵ = γ2 y * = γ2 x ➝
y
viene chiamata semielasticità

STATA:
Per stimare il modello quadratico ŷ = α1 + α2 x 2 dobbiamo
innanzitutto creare la variabile quadratica con il comando gen+
[nome variabile]=[relazione] e all’interno della relazione bisogna
inserire il quadrato della variabile esplicativa x

Una volta fatto ciò calcoliamo la recessione con il solito


comando reg+[variabile y]+[variabile x] e ricaviamo la tabella con
le stime

Per ricavare la pendenza si può procedere o attraverso il


comando dis+[relazione] oppure attraverso il comando lincom+
[relazione] il quale si riferisce direttamente all’ultima regressione
che abbiamo ricavato, calcolando stime di funzioni lineari ➝ per
il nostro esempio la relazione è 2*[nome variabile
quadratica]*[valore xi] ➝ il comando lincom utilizzerà
direttamente la stima di α2 per il calcolo

Per ricavare l’elasticità si procede alla medesima maniera,


attraverso il comando dis+[relazione]

Per stimare il modello log-lineare log(y) ̂ = γ + γ x dobbiamo


1 2
innanzitutto creare la variabile logaritmica con il comando gen+
[nome variabile]=[relazione] e all’interno della relazione bisogna
inserire il logaritmo della variabile dipendente y

Una volta fatto ciò calcoliamo la recessione con il solito comando


reg+[variabile y]+[variabile x] e ricaviamo la tabella con le stime

Per ricavare la pendenza si può procedere o attraverso il


comando dis+[relazione] oppure attraverso il comando nlcom+
[relazione] il quale si riferisce direttamente all’ultima
regressione che abbiamo ricavato, calcolando stime di
funzioni non lineari
➝ per il nostro esempio la relazione è _b{nome variabile
esplicativa]*exp( _b[_cons]+_b[nome variabile
esplicativa]*[valore xi] )

Per ricavare l’elasticità si procede alla medesima maniera,


attraverso il comando dis+[relazione]

Modelli Econometrici Pagina 11 di 52


➝ osserviamo che con i comandi lincom e nlcom oltre alle stime viene calcolato anche lo
standard error ➝ una stima di non è completa senza conoscerne l’errore

➝ per la scelta del modello economico (lineare o meno) non c’è una regola, bisogna analizzare
ogni modello economico e ricavarne una teoria economica che ci aiuti a scegliere il modello
adatto. Ci possiamo aiutare confrontando la somma dei quadrati degli errori, oppure la varianza
σ 2 o la deviazione standard σ di questi ➝ ma il confronto è valido solo per modelli aventi la
medesima y (non si può confrontare la stima in un modello lineare con la stima in un modello
logaritmico)

Quella descritta fino ad ora è chiamata stima puntuale

̂ , β sup
Stima intervallare: coppia di numeri ( β inf ̂ ) tale che la probabilità che il vero valore di β sia
k k k
compreso tra i valori inferiore e superiore dell’intervallo sia uguale a P scelto da me

̂ ≤ β ≤ β sup
Prob{β inf ̂ }=P
k k k

Per convenzione la P si sceglie pari a 0.9 → 90 % oppure 0.95 → 95 %

Il significato di ciò è che, su campioni ripetuti, il 90 % /95 % degli intervalli calcolati contiene il
vero valore di bk
̂ , β sup
I valor di β inf ̂ dipendono dallo stimatore e dallo standard error dello stimatore
k k

STATA:
Riprendiamo il comando reg+[variabile y]+[variabile x] ritorniamo sulla tabella delle stime generata

Le stime intervallari di b1, b2 sono riportare al termine della tabella


Le stime in questo caso sono state calcolate con una P = 0.95 , è possibile cambiare il livello di
confidenza con il comando reg+[variabile y]+[variabile x]+,+level(90) impostando così il livello a
P = 0.9

Modelli Econometrici Pagina 12 di 52


➝ notiamo che aumentano il livello di confidenza da 95 % → 99 % la stima intervallare aumenta
➝ maggiore è la probabilità maggiore è la forbice dell’intervallo ➝ concettualmente a livello 100
l’intervallo diventa {−∞, + ∞}

Una stima intervallare ampia (a causa di un elevato standard error) segnala che il campione non
contiene molta informazione su β2
Al contrario una stima intervallare stretta segnala che abbiamo un'idea abbastanza precisa su
dove si trovi β2
Verifica di ipotesi ➝ verifichiamo che una congettura che ricaviamo è compatibile con il
campione

Componenti di una verifica di ipotesi:


• Formulare un’ipotesi nulla H0 : specifica un valore per un parametro di regressione ➝
H0 : βk = c ➝ congettura della popolazione statistica
importante: l’ipotesi nulla può essere rifiutata o non rifiutata ➝ non si accetta
• Formulare un’ipotesi alternativa H1 : valida solo se viene rifiutata l’ipotesi nulla H0 ➝ ci indica
in che direzione si sposta il valore ed è suggerita dalla teoria economica
può essere
- H1 : βk > c ➝ verrà chiamata coda a destra
- H1 : βk < c ➝ verrà chiamata coda a sinistra
- H1 : βk ≠ c ➝ verrà chiamata a due code
• Formulare una statistica test ➝ funzione del campione che riassume tutte le informazione
necessarie per decide s H0 è compatibile o meno ➝ stimatore per la verifica di ipotesi
l’espressione dipende unicamente da H0
Proprietà:
bk − βk b −c
-
Distribuzione nota se H0 è vera ➝ t = = k ∼ t(N−2)
se(bk ) se(bk )
- Distribuzione ignota e diversa se H0 è falsa ➝ non abbiamo informazioni sulla sua
distribuzione, ma sappiamo per certo che non è pari a t(N−2)
t(N−2) : è chiamata distribuzione t di student ➝ ha la particolarità di avvicinarsi alla distribuzione
normale all’aumentare dei gradi libertà (N − 2)
• Individuare una regione di rifiuto: contiene valori improbabili della statistica test per H0 vera
➝ La forma dipende unicamente dalla ipotesi alternativa H1 (coda a destra, coda a sinistra o due
code), dalla distribuzione della statistica test e dal livello di significatività α
Se l’ipotesi alternativa fosse vera, i valori della statistica test tendono ad essere molto grandi o
molto piccoli ➝ il range di questo valore dipende dal livello di significatività assunto ➝
α = {0.01, 0.05, 0.10}
Definiamo errore di prima specie: se rifiuto l’ipotesi nulla quando questa è vera ➝ scegliendo noi
α questo errore viene commesso ogni volta che rifiutiamo l’ipotesi nulla
Definiamo errore di seconda specie: quando non rifiutiamo l’ipotesi nulla quando questa è falsa
bk − c
• Conclusione: calcolato il valore della statistica testse(bk )
lo confrontiamo con la regione di

rifiuto e concludiamo se rifiutare o meno l’ipotesi nulla H0 ➝ se non viene rifiutata l’ipotesi nulla,
allora la congettura è compatibile con il cambio (non significa che sia necessariamente vera)

L’area del sotto grafico coincide con l’errore di prima specie


mi calcola la probabilità di rifiutare l’ipotesi nulla quando
questa è vera

Modelli Econometrici Pagina 13 di 52


H0 : βk = c Posizione Graficamente

H1 : βk > c Coda a destra

H1 : βk < c Coda a sinistra

H1 : βk ≠ c Doppia coda

P-value di un test: il valore più piccola di α per cui H0 è rifiutata

Graficamente possiamo osservare che il più piccolo valore di α per


cui vale la regola coincide proprio con il valore della statistica test
bk − c
Allora p =t = ➝ pvalue è l’area associata
se(bk )

➝ regola: rifiutiamo l’ipotesi nulla H0 se il p-value è minore o uguale


al livello di significatività α, non rifiutiamo in caso contrario

pvalue ≤ α ⟺ H0 r i f iutata pvalue > α ⟺ H0 non r i f iutata


STATA:
Per prima cosa calcoliamo la stima della regressione attraverso il comando reg+[variabile y]+
[variabile x]
A questo punto possiamo calcolare la statistica test con il comando dis+[relazione] inserendo
b2 − c
nella relazione la formula
se(b2)
In alternativa si può considera la funzione lineare
H0 : βk − c = 0 e utilizzare il comando lincom+[relazione]
e osservare il valore alla colonna t

Si procede calcolando il p-value associato, sempre con il comando dis+[relazione], inserendo


come relazione ttail( [ gradi di libertà N-1 ] , [statistica test t ] ) per calcolare la probabilità a destra
di un valore (H1 : βk > c) e t( [ gradi di libertà N-1 ] , [statistica test t ] ) per calcolare la probabilità
a sinistra di un valore (H1 : βk < c)

Modelli Econometrici Pagina 14 di 52


Infine confrontiamo il valore p-value con livello di significatività α scelto{0.01, 0.05, 0.10} e
deduciamo se H0 va rifiutato o non rifiutato

Solo per un test a due code, il comando lincom


calcola autonomamente il valore di p-value nella
colonna p > | t |
➝ nella tabella della regressione il p-value a due
code è calcolato rispetto a H1 : βk ≠ 0

Previsione dei minimi quadrati


Partendo sempre dal modello econometrico y = β1 + β2 x + e abbiamo stimato dei valori per i
parametri β1, β2 attraverso gli stimatori b1, b2 ➝ così facendo siamo capaci di prevedere un punto
y0 dato un certo valore x0 ⟺ y0 = b1 + b2 x0 ➝ a questo punto dobbiamo capire quanto
questa previsione sia affidabile, cercando un intervallo di previsione che mi misuri la probabilità di
riscontrare questo valore nella popolazione

Partiamo dal modello econometrico di una previsione del valore y0 = E(y0 ) + e0 = β1 + β2 x 0 + e0


➝ e0 è l’errore casuale che possiamo stimare con l’errore di previsione f = (y0 − ȳ)

Essendo b1, b2 variabili casuali, y0̂ è una variabile casuale che chiamiamo predittore puntuale

Contemporaneamente
y0̂ Stima della y media
b1 + b2 x0
E( y0̂ ) Previsione y
Così come abbiamo studiato lo stimatore intervallare per la stima puntuale, definiamo il predittore
intervallare
Stima intervallare Predittore intervallare
costante variabile casuale
pr ob{ ̂
β inf ≤ β ≤ ̂
β sup } pr ob{ ŷinf
0
≤ y0 ≤ ŷ sup
0
}
variabile casuale variabile casuale variabile casuale variabile casuale

1 (x0 − x̄)2
Concentriamoci sulla varianza dell’errore di previsione Var ( f ) = σ 2[1 + + ]
N ∑ (xi − x̄)2
Notiamo similitudini con la varianza degli stimatori b1, b2 già analizzati
la varianza dell’errore di previsione diminuisce quando:
• Diminuisce la varianza degli errori σ 2
• Aumenta la numerosità campionaria N
2
• Aumenta la variabilità della variabile esplicativa ∑ (xi − x̄)
Notiamo però un nuovo elemento che influenza la
varianza, (x0 − x̄)2, il quale valore aumenta
allontanandosi dalla media e agisce direttamente
sulla varianza (aumenta la varianza all’aumentare
del valore)

Questo elemento è ciò che ci fa osservare che


quanto più lontano è x 0 dalla media campionaria
x̄ tanto maggiore è la varianza ➝ tanto minore è
la precisione del predittore

Modelli Econometrici Pagina 15 di 52


STATA:
Calcoliamo la stima della regressione attraverso il solito comando reg+[variabile y]+[variabile x]
Abbiamo detto che b1 + b2 x0 è contemporaneamente la stima del valore medio e la previsione
del valore
Attraverso il comando lincom+[relazione] e la relazione _cons+[nome variabile x]+[valore x0]
calcoliamo la previsione per x0 ➝ y0̂

Per calcolare la previsione intervallare bisogna:

• Aprire l’editor dei dati e aggiungere, infondo, l’osservazione x0 per cui vogliamo calcolare
la previsione intervallare
• Eseguire il comando predict [nome variabile] in [numero osservazione aggiuntiva] per calcolare la
previsione y0̂
• Eseguire il comando predict [nome variabile] in [numero osservazione aggiuntiva] , stdf per
calcolare lo standard error di previsione
• Calcolare l’intervallo di previsione con il comando gen+[nome variabile]+=+[relazione] inserendo
nella relazione [variabile y0̂ ]-1.96*[standard error di previsione] per il limite inferiore e [variabile
y0̂ ]+1.96*[standard error di previsione] per il limite superiore ➝ è possibile anche procedere con
il comando dis per calcolare direttamente i valori

Un intervallo largo ci dice che la previsione puntuale non è molto precisa ➝ nel nostro caso
perché il reddito, pur essendo un indicatore importante per la spesa delle famiglie, non è
sufficiente per predirne il comportamento

Adattamento ai dati: indice R 2


➝ misuriamo la capacità della retta di regressione di stimare il comportamento del campione

(y − ȳ)2 per questo fine, ma ora



Abbiamo già utilizzato la somma dei quadrati dei residui
vogliamo costruirci uno strumento di più facile lettura ➝ senza unità di misura e con un range
0 ∼ 1 ➝ un indice
Modelli Econometrici Pagina 16 di 52
Scomposizione della variabilità osservata:
N N N
∑i=1 (yi − ȳ)2 ∑i=1 ( yî − ȳ)2 ∑i=1 (eî )2
= +
N N N
Varianza osservata di y Varianza spiegata di y Varianza non spiegata
campione modello
Sotto l’ipotesi: il modello contiene un parametro di intercetta b1 = ȳ − b2 x̄ ➝ altrimenti l’R 2 non
ha valore

Per cui :
1 N 1 N 1 N 1 N =0 =0

N∑ N∑ N∑ N∑
eî = (yi − yî ) = (yi − b1 − b2 xi ) = ( yi − ȳ − b2(xi − x̄) = 0
i=1 i=1 i=1 i=1

La media dei residui è nulla

( yî − ȳ)2 (yi − ȳ)2 + ei2


∑ ∑ ∑
Da questa ipotesi ricaviamo: =
variazione totale in y quota spiegata quota non spiegata
attorno alla media campionaria
Var ̂ ( y)̂ SQ M
Sistemandola ricaviamo che la quota non spiegata è pari a ➝ R 2 = = ➝
Var ̂ (y) SQT
coefficiente di determinazione
Il valore va da 0 → 1
Per R 2 =0 Per R 2 =1

Modello che non spiega la variabilità di y Modello spiega perfettamente la variabilità di y


STATA:
Calcoliamo la stima della regressione attraverso il solito comando reg+[variabile y]+[variabile x]

Modelli Econometrici Pagina 17 di 52


Il coefficiente ci comunica la percentuale di varianza di y spiegata dal modello nel campione ➝
non c’è un valore che sia migliore rispetto ad un altro, dipende dal tipo di y esaminato ➝ mi
interessa la popolazione non il campione

Correlazione e R 2
La correlazione è un indice che misura il tipo di dipendenza fra due variabili
Cov(x, y) ̂
cov(x, y)
In formule è Cor r (x, y) = utilizzando le stime campionarie
var (x) var (y) ̂
se(x) ̂
* se(y)

Il range di questo Indice è [−1,1]


Per cor r =−1 Per cor r =1

Esiste una relazione lineare negativa tra x, y ed Esiste una relazione lineare positiva tra x, y ed

yi = a + bxi ⟺ b < 0 yi = a + bxi ⟺ b > 0


Per valori da −1 → 0 mi dice che le osservazioni Per valori da 0 → 1 mi dice che le osservazioni
hanno la tendenza di muoversi nello stesso verso hanno la tendenza di muoversi nello stesso verso
negativo positivo

Per cor r (x, y) = 0 non c’è alcuna relazione sull’andamento di x, y ➝ i punti sono casuali
STATA:
Si utilizza il comando corr+[variabile x] [variabile y]

Nella tabella formata abbiamo la correlazione fra


(y, y) = 1 e (x, x) = 1
Nell’incrocio abbiamo la correlazione tra (x, y) che è il
valore che stavamo cercando

Osserviamo due importanti proprietà:



̂ y)2 : significa che i valori sono algebricamente uguali
R 2 = Cor r (x,
̂
• R 2 = Cor r (x, y)̂ 2 : significa che il coefficiente di determinazione può essere calcolato come
quadrato del coefficiente di correlazione ➝ permette di misurare l’associazione lineare
(adattamento ai dati) fra le osservazioni campionarie e i valori previsti della variabile dipendente

Riportare i risultati
• Assegnare nomi significativi alle variabili y, x e riportare le stime dei parametri
• Si può utilizzare un sistema ad asterischi * per riportare il livello di significatività accettato
• Riportare lo standard error
• Riportare l’R 2
Modelli Econometrici Pagina 18 di 52
Scala dei dati ➝ il modello è invariabile rispetto alla scala
➝ questo ci permette di scegliere la scala dei dati in relazione alle nostre necessità esplicative

Nell’esempio della spesa alimentare, riportare i dati del reddito in centinaia di dollari rispetto a
dollari rendeva la lettura del risultato più comprensibile e significativa, pur non modificando la
relazione del modello

Cambiare la Rimangono uguali i


Cambiano i valori di
scala valori di
X
di X → b1, statistica test, R 2 b2 → cb2 ⟺ se(b2 ) → cse(b2 )
c
Y L’interpretazione bk se(bk )
di Y → statistica test, R 2 bk → ⟺ se(bk ) →
c economica c c
rimane la stessa
di b1 se(b1)
X Y b2, statistica test, R 2 b1 → ⟺ se(b1) →
X→ eY→ c c
c c

Ricavare effetto marginale e elasticità in regressioni lineari con variabili modificate


Y = β1 + β2 X + e
Effetto Marginale X, Y Elasticità Y, X
X
Calcolare la derivata del modello rispetto ad X Moltiplicare l’effetto marginale per
dY(X ) Y
→ dY(X ) X
dX → *
dX Y(X )

Test di significatività ≠ test di specificazione


H0:βk =c H0:e∼N(0,σ 2 )
Il test di significatività verifica un parametro mentre il test di specificazione verifica un proprietà
generale del modello

➝ Test di normalità degli errori ➝ test di Jarque-Bera


È una relazione tra:
• S : Asimmetria di una variabile ➝ misura il grado di simmetria dei residui rispetto allo zero
• K : Curtosi di una variabile ➝ misura quanto sia concentrata una distribuzione

N 2 (K − 3)2
JB = [S + ] ➝ da cui si calcola il pvalue e lo si confronta con i livelli di significatività
6 4
α = {0.01, 0.05, 0.10}
Modelli Econometrici Pagina 19 di 52
STATA:
Per prima cosa calcoliamo i residui con
il comando predict[nome variabile]+, res

Si utilizza il comando sktest+[nome


variabile] ➝ dalla tabella generata
troviamo il pvalue associato e lo
confrontiamo con
l’α = {0.01, 0.05, 0.10} scelto

Nel nostro esempio volevamo verificare H0 : e ∼ N(0,σ 2 ) ➝ il pvalue è notevolmente più grande
di tutti i livelli di significatività α = {0.01, 0.05, 0.10} ➝ per cui non si rifiuta l’ipotesi nulla

Predittore Normale e Predittore Corretto


Quando vogliamo prevedere ŷ in un modello Log-
Lineare commettiamo “l’errore” di trasportare
l’esponenziale all’interno della media ➝ questo è alla
base del predittore normale ŷ = ex p(b1 + b2 xi )
➝ questo perché consideriamo E [ex p(e)] = E(e) = 0

Per correggere il predittore bisogna considerare la


correzione della media dell’esponenziale, che in per
errori con distribuzione normale
1
e ∼ N(0,σ 2 ) ⟺ E [ex p(e)] = ex p( σ 2 )
2
➝ per cui un predittore corretto è
1
ŷ = ex p(b1 + b2 xi ) * ex p( σ 2 ) ➝ sapendo che σ 2 è
2
̂
sempre > 0 possiamo dedurre che yNormale ̂
< yCorretto
R 2 generalizzato ➝ si utilizza per misurare l’adattamento in modelli di regressione in cui la variabile è
misurata in maniera diversa rispetto a come entra nel modello ➝ per y e non log(y)

Si utilizza R 2 ̂ 2 ➝ dove ŷ = ex p[log(y)]


= [Cor r (y, y)]

STATA:
Si procede in 4 step:
1. Con il comando predict[variabile y] si genera la previsione di
log(y)
2. Con il comando gen+[nome variabile]=[relazione] , dove la
relazione è il predittore naturale (oppure corretto, in questo caso
è indifferente perché il correlatore è identico in caso di
moltiplicazione per costanti)
3. Con il comando corr+[variabile y][variabile y]̂ per calcolare la
correlazione tra la variabile e la previsione della variabile
logaritmica
4. Con il comando dis+[relazione] , dove la relazione è il quadrato
del correlatore calcolato nel punto precedente, per calcolare R 2

Nel comando di regressione lineare l’R 2 calcolato è rispetto alla


variabile logaritmica, non a quella lineare ➝ log(wage) ≠ wage

Modelli Econometrici Pagina 20 di 52


Modello di regressione lineare MULTIPLA ➝ più variabili esplicative x spiegano il comportamento della
variabile dipendente
y = β1 + β2 x2 + . . . + βk xk + e
Il significato economico dei parametri rimane il medesimo ➝ per cui:
• β1 → intercetta per x1 = 0
ΔE(y) d E(y)
• β2 = effetto marginale parziale |x costante → |
Δ(x 2 ) k d(x 2 ) xk costante

Per quanto riguarda la rappresentazione grafica il risultato della regressione


non è più una retta, ma dipende dal numero di variabili esplicative
utilizzate.

In caso il modello dipenda da due variabili


x ⟺ y = β1 + β2 x 2 + β3 x3 + e ➝ graficamente rappresenta il piano di
regressione lineare multipla rispetto al campione

➝ per questo non sarà più possibile rappresentare graficamente la


regressione

Sotto le stesse ipotesi viste per la regressione semplice, lo stimatore dei


minimi quadrati è definito coretto ➝ per cui gli stimatori di βk → bk sono BLUE

STATA:
Calcoliamo la stima della regressione attraverso il solito comando reg+[variabile y]+[variabile x 2]+
[variabile x3]

Tutti i valori calcolati precedentemente per la regressione lineare hanno il medesimo significato
applicati alla regressione multipla ➝ bisogna fare attenzione ai gradi di libertà ➝ non è più N − 2
ma N − k perché abbiamo più di due parametri da sottrarre ➝ nel nostro esempio N − 3 = 72

Allo stesso tutti i comandi analizzati inizialmente per la regressione semplice rimangono invariati

Rendimenti non lineari


Aver aggiunto una variabile quadratica al modello ha come effetto l’aver reso non costante
l’effetto marginale ➝ questo è visibile nel modello che abbiamo utilizzato noi in quanto la

Modelli Econometrici Pagina 21 di 52


pubblicità ha un rendimento di scala decrescente ➝ l’effetto positivo decresce al crescere della
spesa pubblicitaria

Graficamente sappiamo che la funzione quadratica ha come rappresentazione la parabola ➝ ∪


per coefficiente lineare positivo e ∩ per coefficiente lineare negativo

Condizione di ottimabilità
Nell’esempio abbiamo considerato il fatturato in funzione di prezzo e costo di pubblicità ➝ se
consideriamo ora il modello economico Sales = β1 + β2 Pr ice + β3 Ad ver t + β4 Ad ver t 2 + e

Per l’impresa la pubblicità rappresenta un costo, dunque è profittevoli solo se inferiore al ricavo
marginale

d E(Sales)
Il ricavo marginale è ➝ |Price costante = β3 + 2β4 Ad ver t 2
d(Ad ver t)
Il costo marginale è → = 1
1 − β3
β3 + 2β4 Ad ver t 2 = 1 → Ad ver t =
2β4
Variabili di interazione nel modello lineare
➝ si utilizzano all’interno del modello lineare quando vogliamo rendere l’effetto marginale di una
variabile in funzione dell’altra ➝ rendo non costante l’effetto marginale

Per fare ciò bisogna aggiungere al modello una variabile che sia prodotto delle due variabili
Sales = β1 + β2 Pr ice + β3 Ad ver t + β4(Pr ice * Ad ver t) + e

L’effetto marginale di Pr ice dipende ora da Ad ver t e viceversa


δSales
• = β2 + β4 Ad ver t
δPr ice
δSales
• = β3 + β4 Pr ice
δ Ad ver t
Una volta inserita la variabile di interazione è utile fare una test di significatività delle variabili per
valutarne l’effetto all’interno del modello

Nel modello precedente abbiamo visto un’altra variabile di interazione che agisce sull’effetto
marginale ➝ Ad ver t 2 = Ad ver t * Ad ver t è un caso particolare

STATA:
Con il comando gen+[nome variabile]=[variabile_1]*[variabile_2], calcoliamo la stima della
regressione attraverso il solito comando reg
Per calcolare l’effetto marginale procediamo con il comando lincom+[relazione] inserendo
come relazione la derivata condizionata del modello

Variabili di interazione nel modello log-lineare


➝ come già sappiamo in questo modello i parametri βk non identificano l’effetto marginale ma la
semi-elasticità, per cui una variabile di interazione in questo modello agisce sulla semi-elasticità di
una variabile rendendola dipendente dall’altra variabile

Indice di adattamento ai dati → R 2


Rimane invariato il significato di R 2 all’eterno del modello di regressione lineare multiplo: misura
della quota di dispersione della variabile dipendente spiegata dalla variazione della variabile
esplicativa

Modelli Econometrici Pagina 22 di 52


SQ M SQ R
La formula per calcolare è R 2 = =1−
SQT SQT
dove SQ M è la variazione in y "spiegata" dal modello (somma dei quadrati della regressione),
SQT è la variazione totale in y rispetto alla propria media (somma dei quadrati totale) e SQ R è la
somma dei quadrati dei residui dei minimi quadrati (errori) e rappresenta la componente di
variazione di y non spiegata dal modello

Un valore elevato di R 2 segnala l’esistenza di una relazione stretta fra i valori osservati di yi e
quelli previsti dal modello yî ➝ il modello si adatta bene ai dati
Un valore basso di R 2 segnala l’inesistenza di una associazione stretta fra yi e i valori previsti yî , e
il modello
non si adatta bene ai dati

Osservazione: è necessario che il modello contenga un valore di intercetta β1 ➝ in caso contrario


non esisterebbe l’uguaglianza SQT ≠ SQ M + SQ R per cui il valore di R 2 perde di significato

➝ se per la teoria economica il modello non deve avere un valore β1 non ha senso indicare l'R 2
nei risultati

Verifica di ipotesi congiunte


Si utilizza il test F quando bisogna fare più congetture simultaneamente sui parametri
L’esempio classico di ipotesi congiunta è verificare che un modello includa un gruppo di variabili
Ipotesi congiunta ➝ H0 : β3 = 0,β4 = 0,β5 = 0 ➝ verifica simultaneamente che tutte tre le
congetture siano vere

Il test F prende in analisi due modelli, e ne confronta la somma dei quadrati degli errori
Data una ipotesi nulla H0 : β2 = 0,β3 = 0,β4 = 0 si definisce
• Modello non vincolato: nel quale i vincoli imposti dalla congettura non sono applicati
y = β1 + β2 x2 + β3 x3 + β4 x4 + β45x5 + e
• Modello vincolato: nel quale i vincoli imposti dalla congettura sono applicati
y = β1 + β2 x2 + e ➝ è derivato dal modello non vincolato imponendo la congettura
Sappiamo per costruzione che un modello non vincolato, per cui con più variabili esplicative, si
adatta sempre meglio ai dati
➝ ricordiamo lo stimatore dei minimi quadrati, cioè la funzione che minimizza SQ R
N
(yi − β1 − β2 − β3 − β4 . . . )2 ➝ per cui un modello vincolato con un numero di

SQ R =
i=1
parametri inferiori per forza un SQ R maggiore rispetto allo stesso modello non vincolato

Il risultato di una ipotesi congiunta è allora:


H0 : β2 = 0,β3 = 0... le congetture sono vere simultaneamente
H1 : b2 ≠ 0 o b3 ≠ 0 oppure entrambi
Formula: SQRv − SQRnv
J = numero di vincoli
J
F= SQRnv
N = gradi di libertà
K = numero di parametri
N−K

Modelli Econometrici Pagina 23 di 52


SQ Rnv 2
In particolare osserviamo che = σnv è la stima della varianza del modello non vincolato
N−K
e SQ Rv − SQ Rnv è la differenza di due elementi per forza positivi (quadrati) per cui è
sicuramente positiva

La logica dietro al test F è guidata dal nominatore ➝ sapendo che un modello vincolato ha una
SQ R più grande, se la differenza è molto piccola allora l’aggiunta dei vincoli crea un modello
che si adatta ai dati quasi come quello vincolato. Viceversa se la differenza è molto grande,
allora l’aggiunta dei vincoli crea un modello che si adatta ai dati peggio rispetto a quello vincolato

Tutti gli altri elementi del test ci servono per creare


una distribuzione avente una forma che conosciamo
➝ distribuzione di F(J,N−K )

Se l'ipotesi nulla non è rifiutata, la statistica F ha


una distribuzione chiamata F con J gradi di libertà al
numeratore e N − K gradi di libertà al denominatore
Se l'ipotesi alternativa è accettata, la differenza fra
SQ Rv − SQ Rnv è grande, il che implica che i vincoli
imposti dall'ipotesi nulla sul modello riducono in
maniera significativa la sua capacità di adattarsi ai dati

Come vediamo graficamente, la ragione di rifiuto è solo a destra ➝ per cui se utilizziamo il pvalue
dobbiamo considerare la coda a destra. Questo significa che:
• Per un pvalue < α rifiutiamo l’ipotesi nulla e accettiamo quella alternativa
• Per un pvalue > α non rifiutiamo l’ipotesi nulla
STATA:
Con il comando test è possibile applicare il test F. La
sintassi generale prevede di inserire ogni vincolo tra
parentesi e separare ogni parentesi con uno spazio
test (vincolo_1) (vincolo_2)
Però quando i vincoli solo semplici (βk = 0) si può
utilizzare la sintassi semplificata inserendo solo i nomi
delle variabili di sul quale parametro vogliamo testare
un vincolo
test [variabile_1] [variabile_2]
Ovviamente con le due sintassi si giunge al medesimo
risultato

Il risultato del comando è la statistica test ed il pvalue

Confrontiamo il secondo valore con i livelli di


significatività α per giungere alla conclusione se
rifiutare o meno l’ipotesi nulla H0

Test di significatività complessiva del modello di regressione


Consiste in una verifica della significatività complessiva del modello ➝ una congettura su tutte le
variabili esplicative

H0 : tutti i parametri βk escluso β1 sono simultaneamente nulli ➝ questo significa che nessuna
delle variabili esplicative influenza y e quindi il modello ha poca o nessuna utilità
Modelli Econometrici Pagina 24 di 52
H1 : almeno un parametro non è nullo e di conseguenza una o più variabili esplicative ha effetto
su y

In questo caso il test F ha come componenti il modello non vincolato yi = β1 + β2 . . . + e e il


modello vincolato yi = β1 + e
STATA:
Il test di significatività del modello viene calcolato automaticamente da stata nel comando reg

Il test F può essere utilizzato anche per verificare una sola congettura ➝ caso particolare
➝ vale solo per congetture “diverso da” ➝ due code
Relazione tra statistica t & F
2
Vi è una relazione esatta tra il valore del test t e il valore del test F : t(N−K ) = F(1,N−K ) e tra il
valore critico di questi due test: tc2 = Fc per cui il pvalue dei due test coincide

Limite del test F


Può essere applicato solo a congetture βk ≠ j ➝ ovvero un test a due code

Questo lo si può dedurre anche dalla relazione con il test t ➝ l’elevare al quadrato il valore fa
perdere l’informazione sul segno, che è fondamentale per i test a coda destra/sinistra

Elemento fondamentale perché il test F sia esatto è che gli errori abbiano distribuzione normale,
oppure approssimato per campioni con numerosità elevata

Test F generale
Si può verificare qualsiasi congettura con l’unico limite che sia H0 che H1 non devono essere
“maggiore” o “minore” di e che il vincolo sia lineare

1 − β3
Consideriamo il vincolo di ottimibilità della spesa pubblicitaria Ad ver t* =
2β4
Per verificare l’ipotesi che Ad ver t* = 1.9 si può procedere per due vie:
Modelli Econometrici Pagina 25 di 52
• Utilizzando un test t ed il relativo pvalue ➝ su stata si utilizza il comando nlcom per calcolare i
valori relativi al vincolo non lineare
1 − β3
Ad ver t* = 1.9 → Ad ver t* − 1.9 = 0 → − 1.9 = 0
2β4
• Utilizzando un test F ed il relativo pvalue ➝ bisogna rendere il vincolo lineare

Per rendere lineare un vincolo non lineare compatibile con il test F si può utilizzare il minimo
comune denominatore
1 − β3 1 − β3 − (1.9)2β4
Ad ver t* − 1.9 = 0 → − 1.9 = 0 → =0
2β4 2β4
Analizziamo ora quali sono i valori del denominatore 2β4 che rendono l’equazione = 0
➝ l’unico valore sarebbe β4 = ∞ , ma come sappiamo non è un valore realistico per un
parametro nel modello ➝ possiamo eliminare il denominatore

1 − β3 − (1.9)2β4
Il vincolo diventa: = 0 → 1 − β3 − (1.9)2β4 = 0
2β4
Ora possiamo inserirlo in un test F

STATA:

Osserviamo però che il pvalue calcolato con il


test F è diverso da quello calcolato con il test
t ➝ questo perché abbiamo eliminato un
elemento dal vincolo orribile (2β4 al
denominatore) che invece viene considerato
nel test t ➝ in questo caso non c’è nessun
effetto sul risultato finale in quanto non
rifiutiamo comunque l’ipotesi nulla

➝ consiglio del prof: per un singolo vincoli non lineari utilizzare strumenti (test t) che funzionano
al meglio con essi

Esempio più complesso:


Due congetture: Ad ver t = 1.900 e Bu dget : Pr ice = 6; Ad ver t = 1.900; Sales = 80.000

In questo caso dobbiamo per forza utilizzare il test F perché le due congetture vanno verificate
contemporaneamente

H0 : β3 + 3.8β4 = 1; β1 + 6β2 + 1.9β3 + 1.92 β4 = 80


H1 : almeno uno dei due vincoli non è valido
STATA:

Si utilizza il comando test


(vincolo_1) (vincolo_2)
inserendo i vincoli come
indicati in H0

Confrontata il pvalue con α si trae la conclusione


Ancora una volta la criticità di questo test è il vincolo di linearità delle congetture

Modelli Econometrici Pagina 26 di 52


Informazione non campionaria
Si tratta di informazioni aggiuntive alle osservazioni campionarie, tratte solitamente dalla teoria
economica, che hanno effetto sul modello ➝ se corretta, aumenta la precisione della stima dei
parametri

Utilizziamo un modello di domanda formulato in L ogL og e applichiamo la teoria


A IM : assenza di illusione monetaria ➝ moltiplico tutte le variabili esplicative per una costante λ
ma il risultato non cambia ➝ possiamo questo in un vincolo sui parametri da verificare

log(Q) = β1 + β2log(PB) + β3log(PL) + β4log(PR) + β5log(I )


log(Q) = β1 + β2log(λ PB) + β3log(λ PL) + β4log(λ PR) + β5log(λ I )
log(Q) = β1 + β2log(PB) + β3log(PL) + β4log(PR) + β5log(I )+logλ(β2 + β3 + β4 + β5)
invariato =0
STATA:
Per cui dalla teoria economica ho estratto l’informazione non
campionaria di assenza di illusione monetaria e l’ho trasformata nel
vincolo
logλ(β2 + β3 + β4 + β5) = 0 → β2 + β3 + β4 + β5 = 0

Ora posso procedere attraverso un test t oppure F per verificare la


congettura

È però anche possibile incorporare direttamente nel modello l’informazione non campionaria,
rendendo questa partecipe della regressione

STATA:
Per inserire un’informazione non campionaria all’interno della regressione si utilizza prima il
comando cons + [numero da 1 a 99] + [vincolo] per specificare il vincolo da assegnare al modello
(cioè l’informazione non campionaria). Nel nostro caso sarà β2 + β3 + β4 + β5 = 0.
Una volta specificati tutti i vincoli, si utilizza il comando cnsreg + [modello] + , cons( [numero
assegnato al vincolo] ) per eseguire la regressione integrando l’informazione non campionaria

Modelli Econometrici Pagina 27 di 52


l’informazione non campionaria può essere
più di una, su stata ne supporta fino a 99
Nel assegnare più vincoli alla regressione è
importante separare ogni numero da uno
spazio

Con le informazioni non campionarie


abbiamo introdotto un nuovo stimatore:
stimatore dei minimi quadrati vincolati

Proprietà:
• E(b* k
) ≠ βk ➝ in generale lo stimatore
non è corretto, a meno che il vincolo sia
valido, per cui conviene sempre fare una
verifica di ipotesi prima di imporlo
• Tuttavia Var (b* k
) < Var (bk ) ➝ la varianza diminuisce per cui la precisione aumenta, anche
se il vincolo non è valido ➝ questo perché aumentano le fonti d’informazione sulla popolazione
(bisogna stimare meno parametri)
• Un vincolo non campionario può essere utile solo se valido

Il teorema di Gauss-Markov rimane valido, in quanto esso enuncia che lo stimatore dei minimi
quadrati è il più preciso tra quelli corretto, è la correttezza dello stimatore dei minimi quadrati
vincolato non è garantita

Corretta specificazione del modello


➝ il modello che sto utilizzando rispetta il modo in cui i dati si generano nella popolazione
L’errore principale è quello di omettere variabili necessarie della popolazione oppure includere
variabili esplicative che non sono adatte per la popolazione

Variabili omesse: accade per svariati motivi, in primis la complessità della natura che ci circonda.
Ci sono inevitabilmente caratteristiche della realtà che non siamo capaci di riportare sotto forma
di dati misurabili

Preso un modello di salario famigliare

Osserviamo che l’omissione di una variabile


esplicativa ha come effetto una distorsione dei
parametri della regressione

Possiamo interpretare la distorsione come un


modello vincolato dalla informazione non
campionaria che β3 = 0 per cui la regressione è una regressione vincolata creata con lo stimatore
dei minimi quadrati vincolato ➝ inoltre sapendo che l’informazione non è corretta, lo stimatore è
distorto

Matematica si dimostra che differenza tra la media dello stimatore e il parametro della
Cov(x̂ 2, x3)
popolazione è E(b* ) − β2 = β3
2 ̂ 2)
Var (x
Osserviamo che b* è corretto solo se Cov(x̂ 2, x3) = 0 ➝ omettere variabili
k
non è un problema solo se le variabili non sono tra di loro correlate (accade
raramente in ambito economico)

Le variabili esplicative sono altamente correlate in questo campione (~ 60%)


➝ per cui diamo significato alla distorsione dei parametri nel modello
vincolato
Modelli Econometrici Pagina 28 di 52
Variabili irrilevanti:
Come effetto le stime dei minimi quadrati restano corretti, ma gli standard error delle stime
crescono

Per cui se aggiungiamo delle variabili


casuali al modello precedente

Vediamo che i parametri X5 e X6 sono irrilevanti per il modello ( pvalue>α ) e gli standard error
10/5/1
(se) sono aumentanti per HEDU e WEDU
Strumenti per la specificazione del modello
1. Scegliere variabili e forma funzionale coerenti con conoscenze economiche
2. Stime col segno sbagliato o della dimensione sbagliata possono essere sintomi di errata
specificazione
3. Fare test di significatività ➝ test t a due code o test F , servono però osservazioni per il
parametro che pensiamo sia omesso o superfluo
4. Controllare i criteri di selezione del modello ➝ confrontare modelli fra di loro nested (per cui
che uno è riconducibile all’altro attraverso imposizione di vincoli M1 ∈ M2) ➝ è importante
controllare che la variabile dipendente sia comune fra i modelli confrontati
SQ R
➝ non si utilizza R 2 =1− perché fortemente influenzato dal numero di variabili
SQT
esplicative ➝ aumenta sempre all’aumentare di variabili esplicative
➝ è utile solo nel confronto tra modelli nested con lo stesso numero di variabili k

SQ R /(N − K )
4.a. R̄2 corretto : R̄2 = 1 −
SQT /(N − 1)
dividendo numeratore e denominatore per
il loro grado di libertà ➝ questo valore non
è più la percentuale di varianza spiegata
nel modello, è un indicatore differente che
serve per la selezione del modello

R̄2 ≤ R 2
in particolare al crescere di k ⟺ R̄2
può sia diminuire che crescere

Matematicamente si dimostra che


aggiungendo
xk+1 : R̄2k < R̄2k+1 ⟺ tH0:βk+1=0 > 1
STATA:
con il comando reg il programma ci calcola
autonomamente l’R̄2

Confrontando il valore, quello con R̄2 più


grande è migliore rispetto all’altro

4.b. Criteri di informazione : anche questi strumenti misurano l’adattamento ai dati tenendo
conto dell’aumento di variabili k
SQ R 2K
noi ne analizziamo due Akaike (A IC ) = log + e Schwarz Bayesiano
N N
SQ R KlogN
SC(BIC ) = = log +
N N

Modelli Econometrici Pagina 29 di 52


SQ R
condividono la struttura sottostante di analisi dell’adattamento ai dati log , mentre la
N
seconda parte è una penalità per il modello con più variabili (SC penalizza maggiormente
rispetto a A IC )

Per cui va preferito il modello con criterio di informazione più basso


STATA:
con il comando estat ic vengono calcolati gli indicatori di adattamento ai dati per l’ultimo
modello di regressione calcolato

5. Usare il test di specificazione R ESET ➝ si utilizza nel caso ci sembri manchino variabili
esplicative, ma senza avere osservazioni per esse e quindi senza poter fare i passaggi
precedenti

si parte stimando il modello y = β1 + β2 x2 + β3 x3 + e e calcolando i valori previsti


ŷ = b1 + b2 x2 + b3 x3 + e
➝ questi valori vanno inseriti in una regressione ausiliaria: strumento tecnico semplice per
calcolare una statistica test, ma senza alcun significato economico particolare (i parametri non
sono né elasticità né effetto marginale né altro)

Ne costruiamo due:
1. Aggiunge al modello il quadrato dei valori previsti y = β1 + β2 x 2 + β3 x3 + γ1ŷ2 + e
2. Aggiunge al modello il quadrato ed il cubo dei valori previsti
y = β1 + β2 x2 + β3 x3 + γ1ŷ2 + γ2 ŷ3 + e

Modelli Econometrici Pagina 30 di 52


perché valga l’equivalenza in questi tre modelli deve essere valido il vincolo
H0 : γ1 = 0 con un test t oppure F nel primo modello ausiliare
H0 : γ1 = 0,γ2 = 0 con un test F nel secondo modello ausiliare
Se l’ipotesi nulla è rifiutata vuol dire che il modello può essere migliorato, se invece non è
rifiutata significa che il test non è stato in grado di rilevare errori di specificazione

Questo test ci permette di individuare la mancanza di una variabile nel modello senza avere
osservazioni di essa ➝ la variabile deve essere però un polinomio di secondo/terzo grado del
modello originale

STATA:
Con il comando estat ovtest
viene eseguito il reset test
l’ultimo modello di regressione
calcolato

confrontando il pvalue con α si


determina se l’ipotesi nulla va
rifiutata o meno

in questo caso il pvalue rifiuta


l’ipotesi nulla per un livello di
significatività α = 10 % ,5 % ma
non per un α = 1 %

Collinearità
È la situazione in cui all’interno del modello ci sono variabili esplicative linearmente dipendenti

Preso un modello yi = β1 + β2 x2i + β3 x3i + β4 x4i + ei per i ∈ N si definiscono (1,x2i, x3i, x4i )
collineari se esistono αk per cui vale α11 + α2 x 2i + α3 x3i + α4 x4i = 0 per ∀i

Per cui ogni variabile è definibile come funzione lineare delle altre
1
x2i = − (α1 + α3 x3i + α4 x4i ) il che significa che la variabile è inutile ➝ perché l’informazione
α2
aggiuntiva è già presente nel modello ➝ non sarà possibile distinguere l’effetto della singola
variabile

Questo effetto fa si che non sia possibile stimare attraverso lo stimatore dei minimi quadrati

STATA:
Su stata quando viene
rilevata una collinearità, una
variabile viene
automaticamente eliminata
dal programma, senza
nessun criterio specifico e
per cui in maniera arbitraria

Modelli Econometrici Pagina 31 di 52


Trappola della variabile dummy ~ collinearità esatta
Si presenta quando in modello sono presenti troppe variabili binarie (0,1)

Prendiamo l’esempio Wage = β1 + β2 D + β3U + e dove D e U sono variabili dummy.


Se volessimo dimostrare la discriminazione per cui le donne percepiscono un reddito inferiore a

{β1 + β3 uom o
β1 + β2 donn a
parità di tutto il resto ➝ E(Wage) = per cui basterebbe una verifica di

ipotesi H0 : βD = βU; H1 : βD < βU


α1 : −1
Possiamo però dimostrare la presenza di collinearità tale che −1 + Di + Ui = 0 → α2 : 1
α3 : 1
Per risolvere questo modello basta eliminare una delle variabili che crea collinearità

{β1
β1 + β2 d on n a
➝ eliminando U il modello diventa Wage = β1 + β2 D + e per cui E(Wage) =
u om o
per cui si verifica l’ipotesi H0 : βD = 0; H1 : βD < 0
È la medesima cosa che fa STATA in automatico, ma così abbiamo controllo su quale variabile
viene eliminata ➝ equivale ad imporre una informazione non campionaria nel modello

Collinearità approssimata
Per cui α11 + α2 x 2i + α3 x3i + α4 x4i ≈ 0 ➝ per qualche osservazione è poco sopra a 0 e per
altre è poco sotto 0
Un modo per individuare la collinearità è stimare la regressione ausiliare
1
x2i = − (α1 + α3 x3i + α4 x4i ) e osservare l’R 2 ➝ per valori vicini ad 1 c’è collinearità
α2
approssimata, mentre per valori lontani da 1 non c’è collinearità

➝ conseguenze della collinearità: rende meno preciso il processo di stima dei parametri ➝ agisce
σ2
sulla Var dello stimatore Var (bk ) = 2
dove r23 = Cor r (x̂ 2, x3) ➝ per cui
(1 − r23) ∑ (x2i − x̄2)
2 2
per correlazione ~ 1, la varianza aumenta fino a raggiungere un valore infinito
Anche in questo caso la soluzione del modello è eliminare una variabile che crea collinearità

Per variabili esplicative approssimativamente collineari:


• Standard error sono elevati
• Stime non sono significative
• R 2 può comunque essere alto
• Test F di significatività del modello rifiuta H0
• Il modello prevede bene fuori dal campione di stima
• Stime estremamente sensibili all'aggiunta o all'eliminazione di qualche osservazione o di una
variabile - anche se apparentemente irrilevante

{0 caratteristica assente
1 caratteristica presente
Variabili indicatrici ~ variabili dummy D =
È una variabile artificiale che indica la presenza di una caratteristica qualitativa (uomo - donna)
misurata con un indicatore binario ➝ 0 e 1 non sono da considera come numeri, ma etichette
(vero o falso)

Scelta del caso base


Il caso base coincide con D = 0 ➝ scelgo io quale caratteristica legare al caso base in modo da
trarre la maggiore valenza informativa per la mia analisi econometrica

{0 caratteristica presente
1 caratteristica assente
LD = = 1 − D posso decidere di invertire il valore della dummy

Modelli Econometrici Pagina 32 di 52


Consideriamo un modello Pr ice
= β1 + β2 SQFT + e a cui vogliamo aggiungere una variabile

{0 cat t iva
1 buon a
indicatrice Posit ion = → è qualitativa e binaria
La variabile indicatrice entrare nel modello in due forme principalmente: con effetto sull’intercetta
o con effetto sulla pendenza

Effetto sull’intercetta
Analizziamo quindi il modello completo Pr ice
= β1 + β2 SQFT + δPosit ion + e

{β1+β2 SQFT
(β1 + δ )+β2 SQFT Posit ion = 1
Per cui E(Pr ice) =
Posit ion = 0
Graficamente osserviamo che l’effetto della
variabile indicatrice è traslare in alto la retta di
regressione di una misura pari a δ

I parametri vengono stimati minimizzando i


quadrati dei residui dividendo il campione in
due, seguendo la caratteristica rappresentata
dalla variabile dummy

Caso particolare: variabile dummy puntuale

{0 qualsiasi altra caratteristica


1 caratteristica specifica
D=
Essendo che D = 1 per una sola
osservazione, la retta parallela deve essere
quella passante per il punto specifico
➝ in questo punto il residuo vale eî = 0
➝ nell’R 2 questa osservazione non viene
considerata ➝ posso misurare l’adattamento
ai dati in tutte le osservazioni del campione
con esclusione dell’osservazione a cui è
legata la dummy puntuale

➝ questo è un modo per manipolare l’R 2 ➝


posso gonfiarne il valore eliminando il residuo dell’osservazione divergente rispetto alle altre

Effetto sulla pendenza


Analizziamo quindi il modello completo Pr ice = β1 + β2 SQFT + γ (SQFT * Posit ion) + e
Inseriamo quindi una variabile di interazione
Per cui

{β1+β2 SQFT {β2


β1+(β2 + γ)SQFT Posit ion = 1 δE(Pr ice) β2 + γ Posit ion = 1
E(Pr ice) = → =
Posit ion = 0 δSQFT Posit ion = 0

Modelli Econometrici Pagina 33 di 52


Graficamente osserviamo che l’effetto della
variabile indicatrice è ruotare in alto la retta di
regressione di una misura pari a γ

L’effetto economico di questa scelta si vede


all’interno dell’effetto marginale

E possibile inserire entrambi gli effetti all’interno di un modello econometrico


Pr ice = β1 + β2 SQFT + δPosit ion + γ (SQFT * Posit ion) + e

{β1+β2 SQFT
(β1 + δ )+(β2 + γ)SQFT Posit ion = 1
Per cui E(Pr ice) =
Posit ion = 0
Osservando un esempio empirico
PR ICE = β1 + δ1U TOW N + β2 SQFT + γ (SQFT * U TOW N ) + β3 AGE + δ2 POOL + δ3FPL ACE + e
Dove U TOW N, POOL, FPL ACE sono variabili dummy

Come vediamo l’effetto della variabile dummy U TOW N è vincolato all’intercetta e all’effetto
marginale di SQFT ➝ gli altri parametri non sentono dell’effetto di questa variabile indicatrice

Interazione tra fattori qualitativi ➝ fattori sinonimo variabili indicatrici


Spiegato attraverso un esempio. Preso il modello W = β1 + β2 ED + δ1B + δ2 F + γ (B * F ) + e
dove B, F sono variabili dummy che indicano B : Black; F : Fem ale

Osserviamo che ciò equivale a dividere in 4 il campione


β1 + β2 ED maschio bianco
(β1 + δ1) + β2 ED maschio nero
E(W ) =
(β1 + δ2) + β2 ED donna bianca
(β1 + δ1 + δ2 + γ) + β2 ED donna nera
In questo caso l’interazione è solo tra variabili indicatrici, per cui l’effetto di ognuno di questi
gruppi è sull’intercetta e nessun effetto sulla pendenza

Modelli Econometrici Pagina 34 di 52


Fattori qualitative con più categorie ➝ variabili con categorie multiple
Spiegato attraverso un esempio. Preso il modello W = β1 + β2 ED + δR EGION + e
In questo caso osserviamo che la variabile confine 4 categorie R EGIONE : N, S, M, W

Se volessimo assegnare ad ogni categoria un numero arbitrariamente N : 1,S : 2,M : 3,W : 4


cadremmo nella trappola di imporre al modello un parametro non verificato nella popolazione ➝
cioè in questo modello abbiamo imposto che il salario di un lavoratore del West sia 4 volte il
salario di un lavoratore nel Northeast ➝ in maniera arbitraria e non verificata per la popolazione

Ciò che dobbiamo fare per inserire queste caratteristiche nel modello è creare una dummy
N norheast
S south
binaria per ogni categoria ➝ ➝ questo creerebbe collinearità perfetta, per cui
M midwest
W west
N norheast
S south
bisogna renderne una il caso base, eliminandola ➝
M midwest
W west
Il modello diventa per cui W = β1 + β2 ED + δ1S + δ2 M + δ3W + e ➝ il caso base è verificato
quando S =M=W=0
Ancora una volta l’effetto delle dummy è sull’intercetta, analizziamola:
β1 + β2 ED Northeast
(β1 + δ1) + β2 ED South
E(W ) =
(β1 + δ2) + β2 ED Midwest
(β1 + δ3) + β2 ED West
Test di Chow ~ test F di equivalenza di due regressioni
Serve per verificare che due campioni condividano la stessa funzione di regressione (lo stesso
modello)

Forma generale: y = β1 + β2 x2 + . . . + βk xk + e ⟺ i = 1,2,...,N

{N − N1 gruppo 2
N1 gruppo 1
Distinguiamo due campioni:

Dire che il modello è il medesimo per i due campioni equivale a dire che i parametri βk sono
uguali nei due modelli

➝ primo modo: stimare separatamente il modello nei due campioni e verificare l’ipotesi nulla
βk1 = βk2 ⟺ H0 : β11 = β12, β21 = β22, . . . , βk1 = βk2
Problema: per costruzione non è possibile eseguire il test F, in quanto non è possibile creare la
COV di due variabili tra di loro non collegati
➝ secondo modo (corretto): utilizzare variabili indicatrici per dividere un campione in due gruppi,
stimare poi la regressione per il modello con il campione integrale e integrando la variabile dummy

{0 gruppo 1
1 gruppo 2
Definiamo D = ⟺ y = β1 + β2 x 2 + . . . + βk xk + δ1D + δ2(Dx 2 ) + . . . + δk (Dxk ) + e

{(β1 + δ1) + (β2 + δ2 )x 2 + . . . + (βk + δk )xk gruppo 2 ∼ D = 1


β1 + β2 x 2 + . . . + βk xk gruppo 1 ∼ D = 0
Analizziamo separatamente E(y) =

Verifichiamo l’ipotesi nulla H0 : δ1 = δ2 = . . . = δk = 0 con un test F

Modelli Econometrici Pagina 35 di 52


Problema: con questa strategia la varianza degli errori σ è uguale nei due modelli, essendo la
regressione stimano una sola ➝ nel primo modo (quello sbagliato) stimando due regressioni
separatamente la varianza degli errori poteva essere differente

Questo significa che noi assumiamo che le


osservazioni siano diverse in media, ma uguali
in varianza

STATA:
➝ Primo modo:
Con il comando sum + [variabile] + , d posso
individuare la mediana (percentile 50) ed
utilizzarla come carattere discriminatorio per i
due gruppi nel campione. Con il comando reg
calcolo separatamente le regressioni,
imponendo il vincolo con if [carattere
qualitativo]. Attraverso la tabella di regressione
posso osservare alcune informazioni importanti,
ad esempio controllare che la varianza degli
errori σ nelle due regressioni ➝ nel nostro
esempio c’è una grande differenza fra σ 1 ≠ σ 2

. Non posso però vare una verifica di ipotesi


congiunte per il motivo sopraindicato

➝ secondo metodo:
Con il comando gen+
[nome]=[relazione] creo la variabile
indicatrice, inserendo come relazione
0. Con il comando replace+[nome
variabile]=[relazione]+if [carattere
qualitativo] modifico la variabile
indicatrice, inserendo come relazione 1

A questo punto utilizzo gen+


[nome]=[relazione] per creare la
variabile di interazione tra D e income.
Con il comando reg calcolo la
regressione ausiliare contenente le
variabili generate al punto precedente
➝ osservazione K 2 in questa
regressione è uguale a 2K 1

Osservando i test t so già che


separatamente β3, β4 non sono
significativi. Mi serve però una verifica
di ipotesi congiunta (test F )
Modelli Econometrici Pagina 36 di 52
Non utilizzo il test F calcolato autonomamente perché contiene anche il parametro β2 che a noi
non interessa. Dobbiamo verificare che tutti gli effetti interazione siano nulli ➝ H0 : β3 = 0,β4 = 0
Utilizzo quindi il comando test + [vincolo 1] [vincolo 2] per eseguire un test di Chow di confronto
dei due modelli

Nel nostro esempio il risultato del test è non rifiuto H0 per cui i due gruppi hanno modello
equivalente ➝ tuttavia sono consapevole che questo risultato non è affidabile in quanto il test
impone (per costruzione) equivalenza della varianza degli errori σ , cosa che so non essere valida
(vedi regressioni separate al “primo modo”)

Modello di probabilità lineare


Modelli in cui la variabile dummy è al posto della variabile dipendete y ➝ succede nei casi in cui

{0 se viene scelta un'altra alternativa


1 se viene scelta la prima alternativa
modello deve spiegare una scelta qualitativa ➝ y =

➝ è uno strumento utilizzato in microeconometria ➝ econometria delle scelte individuali

Se p è la probabilità che venga scelta la prima alternativa, allora P(y = 1) = p; la probabilità che
venga scelta la seconda alternativa è P(y = 0) = 1 − p

La funzione di probabilità per la variabile indicatrice binaria y è: f (y) = p y(1 − p)1−y, y = 0,1

➝ la distribuzione di y è chiamata distribuzione di Bernoulli ➝ E(y) = p; Var (y) = p(1 − p)

Per cui la media di y è la probabilità di osservare 1, in un modello di probabilità lineare vogliamo


spiegarla attraverso le x che la compongono

E(y) = p = β1 + β2 x2 + . . . + βk xk + e

➝ la probabilità di osservare 1 è una funzione lineare di x

➝ il modello è estremamente semplice ma è anche impreciso rispetto alla realtà:


1. Ci sono valori di xi per cui la funzione lineare ha risultato negativo oppure > 1
2. Viene a mancare il vincolo che gli effetti marginali siano costanti per qualsiasi xi
3. Per costruzioni gli errori non sono omoschedastici ➝ non vale il teorema di Gauss-Markov

La comodità di questo modello è che noi lo utilizziamo, consapevoli che sia errato, perché è in
grado di fornire in maniera semplice buone stime degli effetti marginali sulla probabilità di scelta p
di variazione nelle variabili esplicative xk a condizione che p non sia troppo vicino a 0 e 1

STATA:
➝ tutto ciò che abbiamo studiato sui modelli lineari fino ad ora vale uguale sul modello di
probabilità lineare, l’unica differenza è che y è in termini di probabilità

➝ in particolare gli effetti marginali posso scriverli anche in percentuale, perché probabilità.
Questo non va confuso con la semielasticità

L’R 2 continua ad essere un indicatore dell’adattamento ai dati, esistono però modi più precisi e
semplici: tasso di successo

Sappiamo che il modello calcola una variabile continua, mentre la variabile dummy è binaria per

{0 se la probabilità <0.5
1 se la probabilità >0.5
costruzione. Utilizziamo una variabile dammi che rispetti il vincolo =

Modelli Econometrici Pagina 37 di 52


A questo punto faccio un confronto, attraverso una tabella a doppia entrata,
tra le osservazioni y e la previsione ŷ ➝ attraverso un test di successo ne
N00 + N11
calcolo al percentuale TS =
N

STATA:
Con il comando predict + [nome variabile] calcolo le
previsioni di y.̂ Ora genero una nuova variabile con
gen+ [nome variabile] + [relazione] per associare 0
quando ŷ < 0.5 e 1 quando ŷ ≥ 0.5 ➝ come
relazione iniziale metterò 0, con il comando repliche
+ [nome variabile] [sostituzione] + if [relazione]
sostituisco 1 dove la probabilità è ≥ 0.5

Con il comando tab [variabile righe] [variabile


colonne] creo la tabella a doppia entrata, infine con
il comando display + [relazione] calcolo il tasso di
successo

Interpretazione del tasso di successo:


A differenze dell’R 2, il tasso di successo non ha come limite
inferiore 0 ➝ va calcolato per ogni modello

STATA:
Sappiamo che il limite inferiore coincide con il valore per un
modello senza variabili esplicative, costruiamolo

Con il comando reg calcoliamo una regressione che contiene


solo la variabile y, a questo punto ripetiamo la procedura per il
calcolo del tasso di successo

Nel nostro esempio il limite inferiore è 55,26%, per cui il valore


ricavato dal modello completo ( 66,14%) va confrontato con il
limite inferiore ➝ ci dice che il modello da noi scelto non
migliora di molto l’adattamento ai dati

Bisogna fare attenzione a non interpretare male il valore di TS

Spesso viene utilizzato in sostituzione del tasso di successo, il tasso di errore ➝ TE = 1 − TS


In particolare può essere interessante calcolare il tasso di falsi negativi e tasso di falsi positivi
N01 N10
TFP = TFN =
N00 + N01 N10 + N11
➝ solitamente è molto più importante il tasso di falsi negativi ➝ un modo per agire sul tasso di
falsi negativi è modificare il vincolo di confronto

Modelli Econometrici Pagina 38 di 52


STATA:
Ripetiamo la procedura per il calcolo del tasso di
successo, imponiamo però un vincolo inferiore rispetto a
1
in maniera da diminuire il tasso di falsi negativi
2
Se il nostro intento fosse stato agire sul tasso di falsi
1
positivi avremmo dovuto aumentare il vincolo rispetto
2
➝ attenzione: ogni volta che si agisce a favore del tasso
di falsi negativi, verrà riequilibrato (con effetto negativo) il
tasso di falsi positivi

Omoschedasticità e Eteroschedasticità
Un modello è chiamato omoschedastico se la varianza dei
residui (e di conseguenza degli errori) è costante σ 2➝ in
caso contrario è chiamato eteroschedastico σ 2

Come individuare?
Un modo semplice per individuare l’andamento della
varianza degli errori è utilizzare un grafico scatter, ponendo
sull’asse verticale i residui e su quello orizzontale la
variabile esplicativa ➝ funziona una x alla volta

➝ costruiamo dei test diagnostici di eteroschedasticità


H0 : σ 2 costante

Test dei moltiplicatori di Lagrange / Breusch - Pagan

Il test parte dal presupposto che la varianza degli errori sia


Var (ei ) = σi2 = h(α1 + α2 zi2 + . . . + αs zis) dove h è una funzione di zi

- Non abbiamo bisogno di specificare la funzione h


- Le z possono essere diverse dalle x ➝ a corretta specificazione di queste variabili è
fondamentale per il giusto risultato del test
- Se α2 = α3 = . . . = αs = 0 ⟺ h(α1 + α2 zi2 + . . . + αs zis) = h(α1) = σ 2

Per cui il test verifica congiuntamente le congetture


H0 : α2 = α3 = . . . = αk = 0
H1 : almeno un parametro α è diverso da zero

1. Stimo la regressione ausiliaria e2î = α1 + α2 zi2 + . . . + αs zis + vi ➝ lo scopo è cercare di


capire se la varianza degli errori dipende dalle z
2. Calcolo χ 2 = N * R 2
3. Se H0 è vera R 2 ≈ 0 e χ 2 ≈ 0 ; Se H0 non è vera R 2 e χ 2 sono valori elevati

Modelli Econometrici Pagina 39 di 52


STATA:
Dopo aver stimato il modello econometrico, apro il menu
statistics e clicco sulla penultima voce postestimation

➝ si apre una finestra, clicco su specification, diagnostic, and


goodness-of-fit analysis
seleziono tests for heteroskedasticity e clicco su launch

➝ a questo punto bisogna specificare le variabili


z che agiscono sulla varianza degli errori
➝ posso scegliere arbitrariamente qualsiasi
variabili esplicativa ➝ mai quella dipendente

Il risultato di questa procedura è il test di


Breusch-Pagan

Il medesimo risultato si svolge utilizzando


il comando estat hettest [variabili z ]

I gradi di libertà del test dipendono dal


numero di variabili z che utilizziamo per
spiegare la varianza degli errori

Una volta eseguito il test utilizzo il pvalue


calcolato per fare un confronto con i livelli
di significatività α

➝ nel nostro esempio pvalue = 0.0067 < ∀α ➝ rifiuto l’ipotesi nulla di omoschedasticità ➝ il
modello è eteroschedastico

Problema: la specificazione delle variabili z da utilizzare è il vincolo più grande di questo test ➝ al
cambiare delle variabili il test cambia risultato, e un’errata specificazione delle variabili z porta ad
un’errata interpretazione del risultato

Caratteristiche del test


1. È asintotico – la distribuzione vale per N elevato
2. È valido per ogni h – purché regolare

➝ Varianti del test di Breusch e Pagan

Modelli Econometrici Pagina 40 di 52


Test di White: si utilizzano come variabili z : x, x 2, prodotti incrociati
Per cui in un modello y = β1 + β2 x 2 + β3 x3 + e utilizziamo come variabili
z2 = x2; z3 = x3; z 4 = x22; z5 = x32 + z6 = x2 x3 ➝ attenzione alle collinearità: va eliminata una
variabile tra quelle che creano collinearità

Test di Koenker: si utilizzano come variabili z : ŷ = b1 + b2 xx + . . . + bk xk


➝ utilizzo i valori previsti non osservati

STATA:
WHITE: Dopo aver stimato il modello econometrico, apro il menu statistics e clicco sulla penultima
voce postestimation

➝ si apre una finestra, clicco su specification, diagnostic, and goodness-of-fit analysis


seleziono information matrix test e clicco su launch

Clicco su utilizza il test originale di White e invio il test

➝ non devo scegliere io le variabili z in quanto il test le


genera in automatico seguendo il criterio di White

Il risultato di questa procedura è il test di Breusch-Pagan


nella variante White

Il medesimo risultato si svolge utilizzando il comando


estat imtest , white

Anche questo test è asintotico ed è valido per campioni


grandi

KOENKER: Dopo aver stimato il modello econometrico, apro il menu statistics e clicco sulla
penultima voce postestimation ➝ si apre una finestra, clicco su specification, diagnostic, and
goodness-of-fit analysis ➝ seleziono tests for heteroskedasticity e clicco su launch

➝ anziché specificare le
variabili x seleziono utilizza valori previsti

Il risultato di questa procedura è il test di Breusch-Pagan nella variante di Koenker

Il medesimo risultato si svolge utilizzando il comando estat hettest


Modelli Econometrici Pagina 41 di 52
STATA:
VARIABILE DUMMY: Dopo aver stimato il modello econometrico, apro il menu statistics e clicco
sulla penultima voce postestimation

➝ si apre una finestra, clicco su specification, diagnostic, and goodness-of-fit analysis


seleziono tests for heteroskedasticity e clicco su launch

Clicco su utilizza le seguenti variabili e inserisco la variabile dummy bianaria che separa il
campione in due gruppi, invio il test cliccando su ok

Il risultato di questa procedura è il test di Breusch-Pagan utilizzando la variabile dummy

Il pvalue lo confronto con i livelli di significatività α : (10,5,1) %

Il medesimo risultato si svolge utilizzando il comando estat hettest [variabile dummy]

Test di Goldfeld-Quandt
Approccio simile al test di Chow, ma utilizzando la varianza ➝ il confronto avviene sempre con
una regressione ausiliaria

A differenza del test di Breusch-Pagan, questo test indivia un risultato esatto e non asintotico per
campioni molto grandi

➝ questo test funzione bene anche per campioni piccoli

Per cui il test verifica che:


H0 : Var (ei ) = σ 2
H1 : Var (ei ) ≠ σ 2 → dipende dal gruppo osservato, utilizziamo ancora una volta una variabile
dummy binaria per dividere il campione di osservazione

Il test stima separatamente due regressioni (una per gruppo di campione), viene stimata la
varianza separatamente nelle due regressioni e applico un test F per verificare la congettura che
σ12 = σ22 → cioè σ 2 costante
σ12
Il valore della statistica F = ➝ il risultato è indipendentemente da quale gruppo metto al
σ22
dominatore e quale al denominatore ➝ la particolarità di questo test F è
che ha due regioni di rifiuto, una per lato ➝ questo fa si che sia
indifferente quale gruppo è messo al denominatore e quale al
numeratore, H0 verrà rifiutato per tutti i valori di pvalue lontani da 1

Il test F avrà come gradi di libertà quelli del numeratore e del


denominatore F(N1 − K, N2 − K )

Modelli Econometrici Pagina 42 di 52


STATA:
Con il comando reg+[variabili di regressione]+if
[relazione] calcoliamo le due regressioni,
separandole utilizzando la variabile dummy ≥1
e <1

A questo punto memorizziamo la varianza


degli errori nei due modelli, utilizzando il
comando dis +[relazione] calcoliamo la
σ12
statistica test F = , scegliendo noi quale
σ22
gruppo mettere al numeratore e quale al
denominatore. A questo punto, poiché il
calcolo del pvalue a due code in una
distribuzione non simmetrica come questa è
molto complesso, procediamo con il calcolo
del valore critico (il valore oltre al quale il test
rifiuta l’ipotesi nulla in favore di quella
alternativa)

Guardando anche il grafico della distribuzione


F per questo test, se il risultato della statistica
test è ≥ 1, andrò a calcolare il valore critico
per la coda destra con il comando dis +
invFtail([gradi libertà numeratore] [gradi libertà
α
denominatore] [probabilità ] , se il risultato
2
della statistica test è < 1, andrò a calcolare il
valore critico per la coda sinistra con il
comando dis + invF([gradi libertà
α
denominatore] [gradi libertà numeratore] [probabilità ]
2
Infine, confrontando il valore critico ed il valore calcolato della statistica test, decido se rifiutare o
non rifiutare l’ipotesi nulla H0 di omoschedasticità

Quali sono le conseguenze sullo stimatore dei minimi quadrati dell’eteroschedasticità


• Lo stimatore dei minimi quadrati rimane lineare e corretto, ma non è più il più efficiente
(BLUE), cioè non è più quello con variano minima
• Gli standard error non sono più validi, in quanto per costruzione si basano sull’ipotesi di
omoschedasticità ➝ di conseguenza nemmeno le statistiche t sono corrette
• Il test F, l’intervallo di confidenza e tutti gli altri elementi che abbiamo analizzato fino non sono
più validi ➝ tutto ciò che dipende dallo standard error non è più valido

Individuiamo un altro stimatore efficiente


Stimatore dei minimi quadrati generalizzati
Si tratta di una forma generalizzata della formula utilizzata fino ad ora ➝ non va utilizzato perché
è interessante ma richiede si assumere σi2 noti ➝ cosa mia vera, per cui non è applicabile nella
realtà

In alternativa si può utilizzare il valore σ ̂ 2i (le stime degli errori), per cui lo stimatore efficiente
diventa lo stimatore dei minimi quadrati generalizzati calcolabile: efficiente per N →∞

➝ nel pratico non viene quasi mai utilizzato perché necessita di calcolare ogni σ ̂ 2i singolarmente e
se si vuole uno stimatore efficiente (di conseguenza un campione grande) è molto laborioso e
poco preciso
Modelli Econometrici Pagina 43 di 52
Soluzione ➝ Standard Error Robusti (HC)
Valgono anche se gli errori sono eteroschedastici ➝ valgono sempre

Sono elementi asintotici, per cui valgono per campioni molto grandi N →∞
STATA:
Con il comando reg+[variabili di regressione] ,
robust
Notiamo che manca la tabella di studio delle
varianza, perché questa riporta un unico
valore di varianza (omeschedasticità )

Facendo un confronto con i risultati della


regressione senza il comando aggiuntivo
robust, notiamo che i coefficienti rimangono
invariati così come l’R 2, al contrario gli
standard error variano (generalmente il valore
aumenta, nel nostro esempio è successo il contrario) e questo ha effetto sulla statistica t , il pvalue
e il test F

Per cui per campioni che presentano errori eteroschedastici basterà utilizzare gli standard error
robusti, integrandoli in tutto ciò che abbiamo studiato fino ad ora (verifica di ipotesi), in STATA
basterà completare il comando con robust

Analizziamo un’altra violazione di una ipotesi di Gauss-Markov: E(e) = 0 ⟺ E(bk ) = βk


Questa ipotesi è quella che garantisce la correttezza dello stimatore dei minimi quadrati ➝ è una
proprietà molto importante

Per prima affrontiamo l’ipotesi per cui le X del modello non sono stocastiche, ovvero che
cambiano in campioni ripetuti
➝ per lo studio del modello di regressione questa ipotesi non ha alcun effetto, cioè tutto rimane
uguale sia che le x siano costanti che variabili

Modifichiamo le ipotesi della regressione semplice:


1. y = β1 + β2 x + e descrive in maniera corretta la relazione tra y e x nella popolazione
2. Le coppie (yi, xi )i=1,...,N sono ottenute mediante un campionamento casuale ➝ le
osservazioni sono estratte dalla stessa popolazione in modo che ogni coppia si indipendente
da tutte le altre ➝ IID : Indipendenti e Identicamente Distribuite
3. E(e | x) = 0 il valore atteso del termine di errore condizionato al valore di x è nullo
4. x assume almeno due valori diversi nel campo
5. Var (e | x) = σ 2 la varianza del termine di errore condizionato al valore di x è costante e
uguale a σ 2
6. e | x ∼ N (0,σ 2) {non necessario} il termine di errore ha distribuzione normale

Ancora una volta l’ipotesi cruciale è la terza: il valore atteso del termine di errore condizionato al
valore di x è nullo ➝ è necessari condizionare in quanto la x non è più costante

Implica che:
- Non sono state omesse variabili (correlate con quelle incluse)
- La forma funzionale del modello è corretta
- Il termine di errore e non è correlato con x
Senza queste ipotesi lo stimatore non è corretto, tanto meno efficiente
Sotto queste ipotesi vale tutto ciò che abbiamo studiato fino ad ora (verifiche d’ipotesi)
Modelli Econometrici Pagina 44 di 52
Proprietà per campioni finiti N < ∞ sono basate su ipotesi più resistenti rispetto alle proprietà
asintotiche N → ∞

➝ proprietà asintotiche per variabili endogene


• Lo stimatore non è corretto, ma consistente ➝ converge verso β per N → ∞
uno stimatore corretto è anche consistente, ma non viceversa
• Lo stimatore è asintoticamente normale ➝ ha distribuzione normale per N → ∞

Per E(e | x) = 0 si dimostra che le x ed e sono anche incorrelate → Cov(x, e) = 0


Le variabili che rispettano questa ipotesi sono variabili esogene: determinate fuori dal sistema

Per Cov(x, e) ≠ 0 si dimostra che le x ed e sono anche correlate → E(e | x) ≠ 0


Le variabili che rispettano questa ipotesi sono variabili endogene: determinate dentro al sistema
➝ le x sono endogene solo per variabili casuali

➝ per x endogene i Minimi Quadrati non possono più essere utilizzati

Effetto sullo stimatore dei minimi quadrati


Quando la x è endogena, per cui una situazione in cui
x ed e sono correlati ➝ il grafico della funzione
economica è in grassetto, il grafico della funzione
prevista è tratteggiata, vediamo che questa passa al
centro della nuvola di punti (le osservazioni)

Osserviamo che la pendenza è sovrastimata nella


regressione prevista

Questo accade perché lo stimatore dei minimi


quadrati attribuisce la variazione di y alla variazione di
x, ma se la x è endogena (interna al sistema) la
variazione è influenzata anche dalla e ➝ l’effetto di e
viene sommato all’effetto di x e quindi è
sovrastimato

Casi in cui si hanno variabili endogene:


Errore di Misura: la variabile esplicativa è misurata (osservata) con errore ➝ la situazione tipica
è l’utilizzo di una variabile approssimativa (variabile proxy) che individua un effetto, ma che non è
quella realmente coinvolta nell’effetto

Per cui io voglio stimare y = β1 + β2 x + e, ma non riuscendo a stimare x utilizzo x* = x − u per


lo stesso scopo ➝ finirò per stimare y = β1 + β2 x*+e → y = β1 + β2(x − u)+e
Il modello diventa per cui y = β1 + β2 x + e−β2u → y = β1 + β2 x+e

Per costruzione la x è endogena ed è correlata con il termine di errore e (data dalla quota β2u )
➝ questo porta lo stimatore dei minimi quadrati a non essere ne consistente ne corretto

Le l’errore di misura fosse sulla variabile dipendente y non ci sarebbe nessun problema di
specificazione

L’errore di misura nella variabile esplicativa x è molto frequente

Distorsione da equazione simultanee: situazione in cui le variabili del modello sono


determinate in maniera endogena ma attraverso un sistema di equazioni in due incognite
Modelli Econometrici Pagina 45 di 52
{Q s
Qd = β1 + β2 P + u d
s
→ Q d = Q s ⟺ β1 + β2 P + u d = γ1 + γ2 P + u s
γ1 + γ2 P + u domanda of ferta

1
Per cui →P= (γ1 − β1 + u s − u d )
β1 − γ1
La conseguenza di questa relazione è che le quantità e i prezzi osservati sono determinati
simultaneamente dalla funzione di equilibrio ➝ la variabile x è endogena per costruzione ed è
correlato al termine di errore e

➝ questo porta lo stimatore dei minimi quadrati a non essere ne consistente ne corretto

Variabili omesse: nel caso in cui la variabile omessa è correlata con un’esplicativa inclusa nel
modello, l’errore di regressione sarà correlato con la variabile esplicativa rendendola endogena

Per cui se analizziamo un modello di reddito, dipendente da variabili come il sesso, l’educazione e
la residenza, possiamo dire per certo che esistono variabili omesse che identificano altri elementi
che hanno effetto sul reddito ➝ abilità (es nel lavoro e nello studio), questa caratteristica oltre ad
avere effetto sul salario avrà effetto anche sull’educazione (più anni di studio) e per cui sarà
correlata con il termine di errore del modello

Per cui nell’esempio la variabile dell’istruzione è endogeno e per cui l’effetto è sovrastimato
➝ questo porta lo stimatore dei minimi quadrati a non essere ne consistente ne corretto

Stimatori alternativi da utilizzare in queste situazioni


➝ metodo dei momenti: modalità alternativa per ricavare stime consistenti quando le x nel modelli
sono endogene e correlate con il termine di errore e

Il kesimo momento di una variabile casuale X è il valore atteso (media) della variabile casuale
elevata alla kesima potenza → E(X k ) = μk = kesimo momento di X ➝ questa è la relazione che
vale sulla popolazione (infinito)

Nel campione utilizziamo il corrispondente momento campionario (basato su N osservazioni)


N
∑i=1 xik
→ E(X̂ k ) = μk̂ = kesimo momento campionario di X =
N
Il metodo consiste nel uguagliare il momento campionario (variabile calcolabile) con il momento
nella popolazione (costante ignota) per stimare i parametri ignoti

Caratteristiche:
• Sempre consistente (non sempre corretto) ➝ stima asintotica
• Non sempre il migliore o il più preciso (efficienza)

È possibile dimostrare attraverso dei calcoli che il metodo dei momenti per Cov(x, e) = 0 è un
caso particolare dello stimatore dei minimi quadrati ➝ variabili esogene

Per variabili endogene: Cov(x, e) ≠ 0 si utilizza lo stimatore In str um ental Var ia ble
Va quindi considerata un’altra variabile z tale che:
1. z non ha effetto diretto su y ➝ non è una variabile esplicativa di y
2. Cov(z, e) = 0 ➝ z è esogena
3. z è molto correlata con xendogena
➝ z è chiamata variabile strumentale o strumento ➝ serve per raggiungere il nostro obbiettivo,
ovvero avere stime consistenti per un modello con variabili x endogene

Modelli Econometrici Pagina 46 di 52


Utilizzando il metodo dei momenti con la variabile strumentale calcoliamo le stime di β1 e β2
1
N
∑ (yi − β1̂ − β2̂ xi ) = 0
1
N
∑ zi(yi − β1̂ − β2̂ xi ) = 0

Risolvendo il sistema si ricavano gli stimatori delle variabili strumentali


∑ (zi − z̄ )(yi − ȳ)
β2̂ =
∑ (zi − z̄ )(xi − x̄)
β1̂ = ȳ − β2̂ x̄
Questi stimatori sono differenti rispetto agli stimatori dei minimi quadrati studiati fino ad ora, e
sono validi per modelli aventi x endogene

Proprietà:
1. Se z è esogena, lo stimatore strumentale è consistente, ma non è necessariamente corretto
ne efficiente
2. Gli stimatori delle variabili strumentali hanno distribuzione asintotica normale N
σ2
nel modello di regressione semplice β2̂ ∼ N [β2, ]
rz2x ∑ (xi − x̄)2
3. La varianza dell’errore può essere approssimata usando lo stimatore
∑ (yi − β1̂ − β2̂ xi )2
σ ̂ 2VS =
N−2
1 σ2 Var (b2)
Sapendo che la varianza dello stimatore è Var ( β2̂ ) = =
rz2x ∑ (xi − x̄)2 rz2x
Dato che rz2x < 1, possiamo dare per certo che lo stimatore strumentale è sempre meno preciso
dello stimatore dei minimi quadrati, ma è anche l’unico valido per variabili endogene quindi va
utilizzato comunque ➝ in particolare però rimane valido il teorema di Gauss-Markov dello
stimatore BLUE

Strumenti deboli e forti


Lo strumento è detto debole quando rz2x è basso, forte in caso contrario
➝ questo agisce sulla varianza dello stimatore, che sarà molto grande anche se è consistente

rz2x è un indice della correlazione tra z e x

➝ per cui, quando non necessario, lo stimatore strumentale non va utilizzato, perché produce
stime con intervallo di confidenza molto ampio rispetto a ciò che si ottiene con lo stimatore dei
minimi quadrati (anche in grandi campioni)

In un modello di regressione multipla ~ una sola variabile endogena


Per una variabile x endogena, lo stimatore strumentale si ricava in due passaggi
1. Regressione di primo stadio: si stima una regressione ausiliare la cui variabile dipendente è la
variabile endogena, mentre le variabili esplicative sono le variabili esogene e gli strumenti
xk = γ1 + γ2 x2 + . . . + γk−1 + θ1z1 + . . . + θl zl + vk
A partire da questa si calcolano i valori previsti xk̂ ➝ sarà una variabile esogena, combinazione
lineare di tutte le variabili esogene e degli strumenti a disposizione
In questa prima fase viene estratta la parte esogena della variabile endogena
2. Regressione di secondo grado: si stima la regressione del modello originale, sostituendo xk̂
alla variabile endogena xk

Modelli Econometrici Pagina 47 di 52


Viene anche chiamata stimatore dei minimi quadrati a due stati

STATA:
Si parte da un modello, dove si ipotizza la presenza di variabili endogene attraverso considerazioni
teoriche oppure evidenze empiriche. Nell’esempio del salario, sappiamo che sono state omesse
variabili che potrebbero avere correlazione con variabili presenti nel modello, inoltre il coefficiente
per l’educazione ha un valore troppo elevato

A questo punto la parte più difficile è individuare strumenti (variabili esogene) che rispettino i tre
punti fondamentali:
1. z non ha effetto diretto su y ➝ non è una variabile esplicativa di y
2. Cov(z, e) = 0 ➝ z è esogena
3. z è molto correlata con x

Nel nostro modello proviamo utilizzando il livello di istruzione della madre

Per creare la stima strumentale apro il


menu statistics e clicco sulla seconda
voce Linear models and related

➝ si apre una tendina, clicco su


Endogenous covariates, seleziono la
prima voce Linear regression

Aperta la finestra bisogna


compilarla, inserendo prima la
variabile dipendente del modello y,
poi tutte quelle esplicative
esogene x, nella parte sottostante
la esplicativa endogena xk (una
sola) e infine gli strumenti z

Nella parte sottostante è già


reimpostata la stima a due stati
(per modelli di regressione
multipla)

In alto è possibile scegliere, per


modelli eteroschedastici, la
creazione di standard error robusti

Possiamo aggiungere anche più di


uno strumento nel box

È anche possibile utilizzare


direttamente il comando ivregress
2sls +[variabile dipendente]+
[variabili esplicative esogene]
( [variabile endogena] = [strumenti])

Ma è ovviamene più complessa


Modelli Econometrici Pagina 48 di 52
Analizzando il risultato di questa stima strumentale, confrontandolo con la stima dei minimi
quadrati, possiamo notare innanzitutto che tra i coefficienti non appare quello dello strumento,
essendo appunto z (per costruzione) una variabile non esplicativa del modello.

Proseguendo evidenziamo che tutti i coefficienti sono cambiati, oltre ovviamente a quello della
variabile endogena ➝ questo ci dice che, se una variabile è endogena, lo stimatore dei minimi
quadrati non è consistente per nessun parametro

Proseguendo con l’analisi, notiamo che lo standard error per i coefficienti (sopratutto da notare la
variabile endogena) cambia, nel caso particolare è aumentato a tal punto da non rendere più
significativo il parametro ➝ ricordiamo che il metodo è consistente, ma non è efficiente (varianza
bassa). A confermare ciò anche l’R 2 è cambiato, diminuendo.

Ricordiamo però che le stime sono consistenti solo se gli strumenti sono validi

Test diagnostici: misura della qualità degli strumenti

➝ il primo test è verificare la correlazione tra gli strumenti e la variabile endogena: strumenti forti o
deboli?

Si analizzano i risultati della regressione di primo grado (quella che scinde la parte esogena da
quella endogena nella variabile endogena)

xk = γ1 + γ2 x2 + . . . + γk−1 + θ1z1 + . . . + θl zl + vk

almeno uno strumento z deve essere significativo

Si verifica allora:
H0 : Cov(xk , zl ) = 0 ⟺ H0 : θ1 = 0,...,θl = 0 ➝ gli strumenti non sono correlati con xendogena
H1 : Cov(xk , zl ) ≠ 0
Perché gli strumenti siano utili, l’ipotesi nulla va rifiutata

Per eseguire questo test ci basterà un test F che abbia come regressione ausiliaria quella di
primo grado e come ipotesi nulla la significatività degli strumenti
Modelli Econometrici Pagina 49 di 52
STATA:
Si parte utilizzando il comando reg per
stimare la regressione ausiliaria di primo
grado (utilizzo il comando if perché il mio
campione ha valori di wage nulli) .
Utilizzo ora un test F per verificare
congiuntamente che i coefficienti degli
strumenti siano uguali a zero, attraverso il
comando test + [variabili strumentali] . Il
risultato del test lo confronto con il livello
di significatività α(10,5,1) prescelto.

In particolare, uno strumento è detto forte se la statistica test F > 10 , questo valore è frutto di
studi empirici e quindi non è dimostrabile

Se lo strumento non è ABBASTANZA forte il risultato non è buono e potrebbe essere peggio dello
stimare con i minimi quadrati

STATA:
Un ulteriore metodo per eseguire il test di
significatività degli strumenti è:
1. Utilizzare la procedura di stima a due stati
vista in precedenza
2. Utilizzare il comando estat firststage

Il risultato dei due test deve essere il


medesimo

Dalla tabella superiore leggo il valore della


statistica test F > 10 e del pvalue

È più conveniente utilizzare il test automatico


perché evita errori di distrazione o di
imposizione della regressione ausiliare

In un modello di regressione multipla ~ multiple variabili endogene


Per variabili x endogene, lo stimatore strumentale si ricava in due passaggi
È importante notare che il numero di strumenti deve essere almeno pari al numero di variabili
endogene

Il modello è:
- Sotto-identificato: se il numero di strumenti è inferiore al numero di variabili endogene
in questo caso lo stimatore non è utilizzabile, non esiste ➝ questo per via della formula alla
base del calcolo dei momenti ➝ stata segnala autonomamente il problema se il numero di
strumenti è inferiore al numero di endogene
- Esattamente identificato: se il numero di strumenti è uguale al numero di variabili endogene
- Sovra-identificato: se il numero di strumenti è superiore al numero di variabili endogene
y = γ1 + γ2 xeso1 + γ3 xeso2 + γ4 xendo1 + γ5 xendo2 + e ➝ 2 endogene, almeno 2 strumenti
1. Regressione di primo stadio: si stima una regressione ausiliare per ogni variabile endogena,
per ognuna la variabile dipendente è la variabile endogena, mentre le variabili esplicative sono
le variabili esogene e gli strumenti
xendo1 = γ1 + γ2 xeso1 + γ3 xeso2 + θ1z1 + θ2 z2 + v
xendo2 = γ1 + γ2 xeso1 + γ3 xeso2 + θ1z1 + θ2 z2 + v
̂
A partire da queste si calcolano i valori previsti xendo1 ̂
e xendo2 ➝ saranno una variabili
Modelli Econometrici Pagina 50 di 52
esogene, combinazione lineare di tutte le variabili esogene e degli strumenti a disposizione

2. Regressione di secondo grado: si stima la regressione del modello originale, sostituendo


̂
xendo1 ̂
e xendo2 alle variabili endogene xendo1 e xendo2

̂
y = γ1 + γ2 xeso1 + γ3 xeso2 + γ4 xendo1 ̂
+ γ5 xendo2 +e
STATA:
Si utilizza il medesimo metodo visto per
modelli aventi una sola variabile endogena

Ancora una volta tutti gli standard error


possono essere resi robusti con l’aggiunta al
comando di , robust

Verificare la qualità degli strumenti: nel


modello con più variabili endogene è più
complicato
Se su tre strumenti solo uno fosse correlato
con le 3 variabili endogene, il test F non ci
identificale quale di questi sia, ma ci comunica
solo che su tre strumenti ALMENO uno è significativo

➝ per cui con il test F non mi accorgo se tutti gli strumenti sono validi o se è valido solo uno di essi
e gli altri sono incorrelati

Inoltre nella stima strumentale l’indice R 2 non indica più la percentuale di variabilità spiegata.
La presenza di variabili endogene nel modello crea effetti di retroazione che portano l’R 2 ad avere
anche valori negativi e cessa il legame dell’indice con la variabilità di y spiegata

Test di specificazione degli strumenti


Usiamo due test: uno per individuare se x è endogena, uno per individuare se z è esogeno

Verificare se la x è endogena ➝ Test di Hausman


Si verifica l’ipotesi
H0 : Cov(x, e) = 0
H1 : Cov(x, e) ≠ 0
L’idea è confrontare il risultato dello stimatore dei minimi quadrati ed il risultato dello stimatore
strumentale
Per H0 è vera, sia b che β ̂ sono consistenti ➝ in grandi campioni, la loro differenza converge a
zero ➝ b − β ̂ ≃ 0 ➝ in questo caso va preferito lo stimatore dei MQ in quanto più efficiente

Per H0 non è vera, b non è consistente mentre β ̂ è consistenti ➝ in grandi campioni, la loro
differenza non converge a zero ➝ b − β ̂ = c ≠ 0 ➝ in questo caso va utilizzato lo stimatore
strumentale perché è consistente

Esistono più versioni di questo test, la più facile è composta da due passaggi:
1. Stimare il modello ausiliario di primo grado con il minimi quadrati, calcolare i residui
2. Aggiungere i residui alla regressione originaria e applicare i minimi quadrati
3. Utilizzare un test F congiunto per la verifica di ipotesi

Modelli Econometrici Pagina 51 di 52


STATA:
Una volta stimata la regressione con il comando apposito, si utilizza il comando estat endog per
eseguire il test di endogenità

Il problema di questo test è che funziona solo gli strumenti adottati sono effettivamente esogeni,
altrimenti il risultato può essere falsato come in questo caso

In sostanza il test di endogenità di Hausman è da prendere con le “pinze”

Verificare se la z è esogena ➝ Test di Validità degli strumenti


Il test è applicabile solo per modelli sovra-identificati ➝ più strumenti che variabili endogene
Il caso contrario l’ipotesi nulla coincide con l’ipotesi alla base della stima strumentale, quindi la
verifica non sarebbe applicabile

Si verifica l’ipotesi
H0 : Cov(z, e) = 0
H1 : Cov(z, e) ≠ 0
1. Stima strumentale usando x esogene e z
2. Calcolare e ̂
3. Stimare con i minimi quadrati la regressione ausiliaria di e ̂ su tutte le z
e ̂ = δ1 + δ2 z1 + . . . + δl zl + v
4. Statistica test: NR 2. Se H0 è vera, NR 2 ∼ χ(L−B)
2
se N è elevato
5. Si rifiuta per valori elevati (e ̂ è correlato con le z) ➝ gli strumenti sono buoni se non si rifiuta H0

STATA:
Una volta stimata la regressione con il comando apposito, si utilizza il comando estat overid per
eseguire il test di validità degli strumenti

Anche questo test si basa sull’ipotesi che gli strumenti siano validi

I test di specificazione degli strumenti sono da utilizzare solo a supporto di valide ipotesi
economiche ed evidenze teoriche per gli strumenti

Modelli Econometrici Pagina 52 di 52

Potrebbero piacerti anche