Modelli Econometrici Scheda

Introduzione: Econometria è la misurazione di grandezze economiche, significa usare dati
economici per stimare relazioni, verificare ipotesi e prevedere esiti economici
Per questo compito useremo funzioni che analizzano una variabile in funzione di altre
Esempio: Q d = f (P, P s, P c, R E DD) per studiare la quantità domandata in funzione del prezzo del bene, prezzo dei
beni sostituti, prezzo dei beni complementari e reddito
➝ queste funzioni rappresentano il modello economico, attraverso il modello econometrico si

analizza la dimensione quantitativa di queste relazioni ➝ “di quanto cambia una variabile in
risposta alla variazione di altre”
Per raggiungere il nostro risultato ci avvaliamo di p a r a m t r i che identifichino l’effetto marginale,

l’econometria di occupa di stimare il valore di questi parametri, utilizzando dati econometrici
presi a campione
Essendo il fine del modello econometrico spiegare la realtà, bisogna considerare sia le
componenti sistematiche che quelle stocastiche:
• Componente sistematica: derivata dalla teoria economica, è rappresentata dai coefficienti
β1, β2, β3 . . . che rappresentano la relazione tra le variabili della funzione ➝ forma funzionale
I coefficienti vengono chiamati parametri
Per la correttezza dell’analisi è necessario che la forma funzionale sia coerente con la teoria
economica e compatibile con le osservazioni empiriche
• Componente causale: componente di disturbo che complica la comprensione della relazione tra
le variabili, è rappresentata da +e al termine della forma funzionale
L’errore incorpora molti fattori che hanno effetto ma che sono stati omessi dal modello per
semplificazione
L’econometria, lavorando su campioni e non sulla popolazioni, è solo capace di stimare i
parametri, e lo scarto derivante dalla stima campionaria è incorporato nell’errore e
Q d = f (P, P s, P c, R EDD) = β1 + β2 P + β3P s + β4 P c + β5 R EDD + e

modello economico modello econometrico
L’inferenza statistica sul mondo reale produce:

• Stime di parametrici economiche
• Previsioni di grandezze economiche
• Verifica di ipotesi economiche
Generazione dei dati

1. Dati sperimentali: effettuare o osservare l’esito di un esperimento ➝ permette di fissare le
variabili allo stesso valore in sessioni ripetute dell’esperimento
2. Dati non sperimentali: indagine campionaria casuale ➝ i valori di tutte le variabili non sono ne
fissi ne replicabili (per via della casualità del campione)
Classificazione dei dati

A. Livello di aggregazione a cui vengono raccolti i dati
A.1.Micro: unità economiche individuali
A.2.Macro: riunioni o aggregazione di individui
B. Modalità di misurazione
B.1.Flusso: raccolta riferita ad un periodo di tempo
B.2.Stock: raccolta in uno specifico punto del tempo
C. Valore del dato
C.1.Quantitativi: grandezze espresse in termini numerici o come trasformazione di questi
C.2.Qualitativi: grandezze riferite alla scelta effettuata fra un numero discreto di alternative
Modelli Econometrici Pagina 1 di 52

Modalità Carattere e Tempo Esempio grafico
Serie storica Il medesimo carattere è osservato ad intervalli

differenti di tempo ➝ gli intervalli di tempo sono
regolari
Cross-section Raccolta di osservazioni da unità campionarie

diverse in un particolare periodo temporale ➝
diversi caratteri, diverse unità medesimo tempo
Panel / dati longitudinali Raccolta di osservazioni da unità campionarie

diverse in diversi intervalli temporali ➝ diversi
caratteri, diverse unità, diversi tempi
Se le osservazioni temporali sono dello stesso

numero per tutte le unità è detto panel bilanciato
Processo di ricerca:
1. Individuazione della 2. Creazione del modello 5. Verifica della vanità delle
teoria economica, econometrico ipotesi
elencando i quesiti e 3. Raccolta di dati 6. Analisi e valutazione delle
scegliendo il modello campionari implicazioni economiche
economico 4. Stima dei parametri legate al modello
Modello di regressione lineare SEMPLICE ➝ strumento utile in tutte le situazioni in cui è chiesto
a quanto ammonterà l'effetto su una variabile di una variazione in un'altra variabile
Utilizzare l’esempio composto dalle variabili spesa alimentare (y) e reddito (x), i cui dati utilizzabili
su STATA sono raccolti in food.dta ➝ Food_exp e Income saranno le nostre variabili
Per la variabile casuale continua yfood−exp ha una sua funzione di

densità fd d che descrive la probabilità di osservare valori diversi
della spesa alimentare ➝ questo valore varia di famiglia in
famiglia, pure mantenendo la variabile reddito costante ➝ avremo
quindi fd d f (y | x) descrive la distribuzione intorno alla media della
spesa nella popolazione, e assumeremo per dato che
graficamente è rappresentato da una campana
La media condizionale (valore atteso ≠ media aritmetica) di y è

dato da E(y | x = 1000) = μy|x ➝ E è la funzione che permette di
ricavare il valore medio condizionato
Chiameremo varianza condizionale di y la misura della dispersione della spesa attorno alla
media μy|x ➝ è dato da Var (y | x = 1000) = σ 2
➝ se i parametri varianza e media fossero noti fornirebbero informazioni importanti sulla

popolazione in esame
Chiameremo variabile dipendente la y e variabile esplicativa la x ➝ nell’analisi econometria sono
variabili casuali della popolazione
Partiamo dal modello economico per giungere al modello econometrico

Per semplificazione, analizzeremo un modello economico lineare (in una sola variabile) di media
condizionale
E(y | x) = μy|x = β1 + β2 x ➝ chiamato funzione di regressione semplice (lineare), di cui i
parametri β1 e β2 rappresentano rispettivamente intercetta a x = 0
e pendenza della retta di regressione ➝ in particolare β2 indica la
d E(y | x)
propensione marginale al consumo β2 = (per il modello
dx
considerato)
Nel modello economico, β1, β2 sono quantità caratterizzanti del

comportamento della popolazione ➝ costanti della popolazione
Nel nostro studio, questi saranno gli elementi che andremo a

stimare ➝ dato che y, x sono variabili osservate sulla popolazione
Estraendo campioni casuali dalla popolazione, sappiamo che le

osservazione sarebbe disperse attorno alla media E(y | x)
➝ nella figura a destra sono state sovrapposte le fd d e la retta di
regressione per illustrarne il comportamento dispersivo
Per completare il modello econometrico è necessario considerare

l’errore causale, cioè la componente stocastica che rappresenta la differenza fra y e la sua media
condizionale E(y | x) ➝ e = y − E(y | x) = y − β1 − β2 x
Il modello di regressione lineare semplice diventa y = β1 + β2 x + e

Sapendo che la media del termine di errore risulta nulla ➝ questo
perché nella sommatoria gli scostamenti negativi assorbono quelli
positivi e viceversa ➝ E(e) = 0
➝ Equivale ad assumere E(y) = β1 + β2 x
Utilizziamo il modello econometrico per stimare i parametri β1, β2 ➝

il risultato non sono i valori dei parametri, ma stime pari a b1, b2 nel
campione
- Gli stimatori sono formule generali e dunque variabili casuali

- Le știme sono numeri che otteniamo applicando le formule generali ai dati osservati
Attraverso i dati del campione food.dta ricaviamo un grafico di dispersione, rappresentativo del
campione e non della popolazione
E su di esso dobbiamo stimare la retta di regressione semplice
yî = b1 + b2 xi
Ci avvaleremo del principio dei minimi quadrati per stimare b1, b2 ➝

da ora in poi chiamate stime dei minimi quadrati dei parametri β1, β2
Con tale principio riduciamo al minimo le distanze verticali dei punti
della dispersione dalla retta di regressione
Partiamo dunque da due rette, passanti per la dispersione

1. yî = b1 + b2 xi ➝ retta stimata con i minimi quadrati
̂
2. y*
i
= b*
1
+ b* x ➝ retta qualsiasi
2 i

Sappiamo che la distanza verticale delle due rette è
esprimibile come
1. eî = yi − yî = yi − b1 − b2 xi per la retta stimata
2. e*
i
̂ = yi − y*î per la retta qualsiasi
Applicando il principio dei minimi quadrati sappiamo che la

somma dei quadrati dei residui ad esse associati è minore
della somma dei quadrati dei residui associati ad qualsiasi
altra retta
N N
e2̂ ; e*î 2 allora SQ R < SQ R*
∑ i ∑
SQ R = SQ R* =
i=1 i=1
Il calcolo di queste stime, matematicamente, è
N
(yi − β1 − β2 xi )2 ➝ non sarà
∑
min S(β1, β2) =
β1,β 2
i=1
necessario ricavare matematicamente i parametri in quanto
noi utilizzeremo il programma STATA a tale fine
STATA:
Bisogna utilizzare il comando reg+[variabile y]+[variabile x]
Il risultato del comando è una tabella, concentriamoci
sulla seconda riga prima colonna
Alla voce income equivale la stima del

parametro b2, mentre alla voce _cons
equivale la stima del parametro b1
È possibile richiedere a stata anche la rappresentazione grafica del campione
Per un grafico istogramma basta inserire il comando hist+[variabile], il quale risultato è

un’istogramma con specifiche standard del programma. Se vogliamo aumentare il numero di
colonne basterà completare il comando con +, bin([numero colonne]) ➝ è importante la virgola
.004
.005
.004
.003
.003
Density
Density
.002
.002
.001
.001
0
100 200 300 400 500 600 100 200 300 400 500 600
household food expenditure per week household food expenditure per week
Per avere un grafico di dispersione invece bisogna passare dal menu-graphics-twoway graph-
create-basic plots-scatter
Mandando il comando verrà creato il grafico a dispersione

600
household food expenditure per week
200 300 400
100 500
0 10 20 30 40
weekly household income
Per avere una retta di regressione sopra al grafico di dispersione bisogna tornare su menu-
graphics-twoway graph-create-fit plots-linear prediction
600
500
400
300
200
100
0 10 20 30 40
weekly household income
household food expenditure per week Fitted values
Per alcuni modelli economici sarà necessario calcolare la regressione senza valore b1, in quanto
non ha valore la stima che interseca l’asse (a x = 0 ) ➝ in queste occasioni la regressione va
stimata con il comando reg+[variabile y]+[variabile x]+, noconstant
Il risultato sarà una nuova tabella, con stime differenti dalla precedente, che calcola solo b2
Altri comandi utili per lavorare con stata sono:
sum Genera una tabella che riporta i

valori (rispetto alle variabili del
campione) di: media, varianza,
devianza standard, minimo e
massimo
gen+[nome variabile]+=+ Genera una nuova variabile che

[relazione] rispetta la relazione scelta

Interpretazione delle stime:
A. b2 : può essere inteso come effetto marginale della variabile esplicativa sulla variabile
dipendente ➝ nel nostro esempio, un aumento unitario del reddito (1 = 100$) coincide con un aumento della
spesa in alimenti pari a b 2 ( = 10.20)
B. b1 : coincide con l’intercetta dell’asse x, cioè il valore della variabile dipendente quando la
variabile esplicativa è nulla ➝ attenzione ➝ in molti modelli economici questa stima non è una
buona approssimazione della realtà in quanto valori nulli nella variabile esplicativa non
vengono osservati
Residui: approssimazione degli errori, calcolabili a differenza degli errori e ̂ = y − b1 − b2 x ➝ e ≠ e ̂
Previsione del valore medio: ŷ = b1 + b2 x ➝ rappresenta la stima della media di y

STATA:
• Si utilizza il comando predict[nome variabile] ➝ crea una nuova
variabile contenente la stima di ŷ per i valori del campione
• Si utilizza il comando predict[nome variabile]+, res ➝ crea una
nuova variabile contenente la stima di e ̂ per i valori del campione
Elasticità: caratterizza la reattività di una variabile rispetto un’altra ➝ concettualmente ha lo

stesso effetto della marginalità, ma è un numero puro ➝ non ha unità di misura
variazione percentuale di y
Δy x
Per y rispetto ad x possiamo usare la formula generale ϵ =
Δx y
variazione percentuale di x
Δy x
Nel modello lineare abbiamo = β2 e dunque ϵ = β2 ➝ in un modello lineare l’elasticità è
Δx y
diversa in ogni punto della retta di regressione (perché dipendente da x), dunque è preferibile
x x
b2( b + ib x ) b2( yî )
1 2 i i
calcolarla nei punti delle medie della retta: ϵ ̂ = =
N N
STATA:
Si utilizza il comando gen+[eps]+=+[relazione] per creare
la nuova variabile elasticità ➝ come relazione utilizziamo
xi
b2( ) nel nostro esempio _b[income]*[income]/yhat,
yî
infine si calcola la media della variabile creata con il
comando sum+[nome variabile]
Modello Log Log: log (y) = β1 + β2log(x) + e ➝ consideriamo questo modello poiché,
essendo logaritmico e non lineare, ha elasticità costante
➝ il modello rimane lineare nei parametri β1, β2, mentre non è lineare nelle variabili y, x
dy x
ϵ= = β2 ➝ ϵ ̂ = b2
dx y
La particolarità del modello è che la stima dell’elasticità coincide con la stima di b2, e questa è
facilmente stimabile attraverso il modello di regressione lineare
Δy y ex p(β1 + β2logx)
Per l’effetto marginale nel modello log-log ricaviamo = β2 = β2
Δx x x
STATA:
Si utilizza il comando gen+[nome variabile]+=+[relazione] per creare le
nuove variabili logaritmiche ➝ come relazione utilizziamo log+( [nome
variabile] ) per creare il logaritmo di y e x ➝ attraverso il comando reg+
[variabile y]+[variabile x] stimo i parametri della regressione b1, b2
Ulteriore informazione sulla tabella dei valori della regressione:

nella prima colonna, SS, abbiamo la stima della somma quadratica dei
residui
Ulteriori comandi di Stata

_b[variabile] Prende il valore contenuto nell’ultima
regressione calcolata alla colonna
coefficiente per la variabile selezionata
_s[variabile] Prende il valore contenuto nell’ultima

regressione calcolata alla colonna standard
error per la variabile selezionata
If+[variabile]+ Restringe il campione utilizzato imponendo != diverso > maggiore

[condizione] una condizione logica == uguale <= minore uguale
Il comando può essere completato con i < minore >= maggiore uguale
connetti & (and) e | (or)
In+[N1][N2] Restringe il campione utilizzato imponendo di

utilizzare solo le osservazioni dalla N1 alla N2
Infine si può utilizzare direttamente stata come calcolatrice, per esempio ricavare una stima per
un preciso punto del campione, attraverso il comando display+[relazione] ➝ nell’esempio
calcoliamo la stima di ŷ per x = 20, sostituendo nella relazione _b[_cons]+_b[income]*20
Proprietà degli stimatori

Partiamo dal ricordare che gli stimatori b1, b2 sono variabili casuali, generali per il modello di
regressione lineare
N
xi − x̄
∑
➝ b2 = wi yi è la forma lineare dello stimatore di β2 ➝ il termine wi = dipende
i=1
∑ (xi − x̄)2
solo da valori non stocastici x, dunque anch’esso è non stocastico
∑
Giungiamo attraverso passaggi aritmetici alla forma b2 = β2 + wi ei ➝ e è l’errore casuale del
modello regressione
Definiamo uno stimatore corretto se il valore atteso equivale al vero valore del parametro stimato
➝ E(b2 ) = β2 ➝ nella pratica questa proprietà è dimostrabile con i campioni ripetuti
➝ presi numerosi campioni della popolazione aventi la stessa numerosità, la media aritmetica
delle stime di β2 attraverso lo stimatore b2 è il valore corretto del parametro β2
Per giungere a questo risultato è fondamentale l’ipotesi secondo la quale il valore atteso del
=0
∑
termine di errore è nullo E(e) = 0 ➝ E(b2) = β2 + wi E(e) = β2
In caso contrario lo stimatore è definito distorto E(b2 ) ≠ β2

➝ il fatto che lo stimatore sia corretto non rende la stima giusta ➝ nel campione preso
singolarmente non possiamo sapere se la stima è corretta ➝ la correttezza vale solo su campioni
ripetuti
Per il modello di regressione lineare, anche lo stimatore b1 è corretto ➝ E(b1) = β1

Varianza e covarianza dello stimatore:
Var (b2) = E[(b2 − E(b2))2] misura l’ampiezza della
distribuzione di probabilità di b2
Prese due stime di varianza, dal punto di vista di

correttezza, scegliamo quella più con il valore più basso
f2(b2) ➝ più concentrata attorno al valore centrale
E(b2) = β2 e quindi con maggiore probabilità di ottenere
una stima prossima al valore di β2
➝ la varianza è anche chiamata precisione campionaria

↓ Var ianza ↑ Precisione
Ipotesi fondamentali:
- I residui hanno varianza costante: omoschedastiità ➝ Var (eî ) = σ 2 / eteroschedastiità ➝
Var (eî ) ≠ σ 2
- La covarianza fra ei, ej = 0 ➝ è una misura della dipendenza fra fenomeni casuali
➝ in particolare mi dice se i residui di i e j tendono a muoversi nella stessa direzione, direzioni
opposte o se non c’è legame
In formule:
N
∑i=1 xi2 1 2 − x̄
2 Var(b ) = σ 2
[ ] Cov(b1 , b2 ) = σ [ ]
Var(b1) = σ [ ] 2 N ∑
N
(x − x̄) 2
N
N ∑i=1 (xi − x̄)2 ∑i=1 (xi − x̄) 2
i=1 i
Analizziamo la crescita dei fattori che influenzano la varianza e covarianza:

1. Varianza del termine di errore σ 2: misura la dispersione dei valori y attorno al proprio valore
atteso E(y)
➝ maggiore è il termine di varianza σ 2 tanto maggiore è la dispersione e aumenta l’incertezza
sullo stimatore (aumenta la varianza dello stimatore)
N
(xi − x̄)2: misura quanto dispersi attorno alla proprio
∑
2. Somma dei quadrati degli scarti
i=1
media siano i valori campionari della variabile esplicativa x
➝ maggiore è la somma dei quadrati tanto maggiore è la dispersione e diminuisce l’incertezza
sullo stimatore (diminuisce la varianza dello stimatore)
3. Numerosità campionaria N: misura il numero di osservazioni che compone il campione
➝ maggiore è numero di osservazioni tanto minore è la varianza dello stimatore
appare esplicitamente in Var (b1), mentre per Var (b2 ), Cov(b1, b2 ) ha effetto indiretto nella
sommatoria dei quadrati degli scarti, che essendo tutti positivi (quadrati) aumenta
all’aumentare della numerosità
N
xi2: compare solo in Var (b1) ➝ misura la distanza
∑
4. Somma dei quadrati della variabile
i=1
dei valori dell’osservazione x da x = 0 dove è stimato b1
➝ maggiore è il valore della somma tanto maggiore è la varianza dello stimatore

5. Media campionaria delle osservazioni x̄: compare solo in Cov(b1, b2 )
➝ maggiore è il valore tanto maggiore è la covarianza degli stimatori
Teorema di Gauss-Markov ➝ Best Linear Unbiased Estimator (BLUE)

Il teorema afferma che, sotto le opportune ipotesi, lo stimatore dei MQ è il più efficiente (a
varianza minima) fra quelli lineari e corretti (il più preciso)
➝ il teorema è valido per gli stimatori dei minimi quadrati, non le stime calcolate a partire da un
campione
Distribuzione di probabilità degli stimatori ➝ proprietà

accessoria
La distribuzione equivale alla probabilità che un dato valore della
variabile si verifichi, è rappresentato da un grafico sull’asse
cartesiano ➝ l’area del grafico deve essere = 1
Data questa proprietà, numerose curve la possono rappresentare

➝ se la distribuzione di una variabile ha come curva una
campana, è definita normale
La campana dipende da due elementi:
• La media: identifica il punto di centralità
• La varianza: misura l’apertura (quanto è schiacciata la curva)
Se è valida l’ipotesi che gli errori e abbiamo distribuzione normale

(a campana) e ∼ N (0,σ 2 ), quindi E(e) = 0 e varianza σ 2 , allora anche gli stimatori hanno
distribuzione normale
→ b1 ∼ N [β1, var (b1)]
→ b2 ∼ N [β2, var (b2)]
Teorema del limite centrale: se la numerosità campionaria N è sufficientemente grande, gli

stimatori dei minimi quadrati hanno una distribuzione simile alla distribuzione normale N
~ quanto grande dipende dal modello
Stima della varianza del termine di errore

2
∑ ei2
Sappiamo che la varianza degli errori è σ = E(ei2)
= , ma non potendo osservare gli
N
2 2
∑ e2î
errori lavoriamo con i residui ➝ abbiamo σ ̂ = E(eî ) = =
N
Per ricavare uno stimatore corretto (E(σ ̂ 2 ) = σ 2) dividiamo per N − 2 ➝ gradi di libertà
➝ gradi di libertà: la differenza tra la numerosità N e i numero di parametri di regressione (nel

nostro caso β1, β2 ) ➝ N − 2
∑ e2î
2
Dunque lo stimatore corretto della varianza degli errori è σ ̂ =
N−2
Ora possiamo ricavare la stima della varianza degli stimatori dei minimi quadrati, sostituendo nelle
formule la stima della varianza degli errori σ ̂ 2
N
∑i=1 xi2 1 − x̄
̂ ] Cov(b̂ 1, b2) = σ ̂ [
2
2 ]
̂ ) = σ ̂ 2[
Var(b ] Var(b2) = σ ̂ [ N N
∑i=1 (xi − x̄)2
1 N
N ∑i=1 (xi − x̄)2 ∑i=1 (xi − x̄)2

avendo la stima della varianza degli stimatori dei minimi quadrati, possiamo ricavarci lo standard
error attraverso la radice quadrata di questi valori
se(b1) = ̂ )
Var(b se(b2) = ̂ )
Var(b
1 2
STATA:
Attraverso il comando reg+[variabile y]+[variabile x] ritorniamo sulla tabella delle stime generata
Nella tabella dei dati della regressione lineare viene riportata lo standard error degli stimatori, la
stima di σ 2 e la stima di σ
Questi valori vengono identificati anche dai comandi lincom e nlcom ➝ questi comandi si usano
rispettivamente per calcolare espressioni di stime lineari e non lineare (al pari del comando dis )
Modelli non lineari ➝ modello quadratico e modello log-lineare

Sono modelli non rappresentati da una retta ➝ possono ancora essere stimati attraverso la
regressione lineare semplice in quanto questa accetta con flessibilità variabili quadratiche e
logaritmiche ➝ l’aggettivo lineare è rispetto ai parametri (che non vengono trasformati) e non alle
variabili
Di questi modelli ci interessa conoscere la forma, l’effetto marginale e l’elasticità
Modello Quadratico: y = α1 + α2 x 2 + e
È definito quadratico quando la variabile esplicativa è al quadrato
Il modello ha sia pendenza che elasticità che variano in tutti i punti della funzione
d(y)
➝ Pendenza: va calcolata la derivata rispetto ad x della y = 2α2 x
d(x)
x 2α2 x 2
➝ Elasticità: equivale al prodotto tra pendenza e rapporto tra le variabili ϵ = 2α2 x * =
y y

Modello Log-Lineare: log(y) = γ1 + γ2 x + e
È definito Log-Lineare quando la variabile dipendente è un logaritmo, mentre la variabile
esplicativa è lineare
log(y)
Osserviamo che e = y = e γ1+γ2 x ➝ in questa equazione e = numero di Eulero
Viene spesso usato il modello log-lineare perché rende più regolari dati distribuiti in maniera
asimmetrica (code a destra/sinistra)
Il modello ha sia pendenza che elasticità che variano in tutti i punti della funzione
dlog(y)
➝ Pendenza: va calcolata la derivata rispetto ad x della y = γ2 y = γ2 * e γ1+γ2 x
d(x)
x
➝ Elasticità: equivale al prodotto tra pendenza e rapporto tra le variabili ϵ = γ2 y * = γ2 x ➝
y
viene chiamata semielasticità
STATA:
Per stimare il modello quadratico ŷ = α1 + α2 x 2 dobbiamo
innanzitutto creare la variabile quadratica con il comando gen+
[nome variabile]=[relazione] e all’interno della relazione bisogna
inserire il quadrato della variabile esplicativa x
Una volta fatto ciò calcoliamo la recessione con il solito

comando reg+[variabile y]+[variabile x] e ricaviamo la tabella con
le stime
Per ricavare la pendenza si può procedere o attraverso il

comando dis+[relazione] oppure attraverso il comando lincom+
[relazione] il quale si riferisce direttamente all’ultima regressione
che abbiamo ricavato, calcolando stime di funzioni lineari ➝ per
il nostro esempio la relazione è 2*[nome variabile
quadratica]*[valore xi] ➝ il comando lincom utilizzerà
direttamente la stima di α2 per il calcolo
Per ricavare l’elasticità si procede alla medesima maniera,

attraverso il comando dis+[relazione]
Per stimare il modello log-lineare log(y) ̂ = γ + γ x dobbiamo

1 2
innanzitutto creare la variabile logaritmica con il comando gen+
[nome variabile]=[relazione] e all’interno della relazione bisogna
inserire il logaritmo della variabile dipendente y
Una volta fatto ciò calcoliamo la recessione con il solito comando

reg+[variabile y]+[variabile x] e ricaviamo la tabella con le stime
Per ricavare la pendenza si può procedere o attraverso il

comando dis+[relazione] oppure attraverso il comando nlcom+
[relazione] il quale si riferisce direttamente all’ultima
regressione che abbiamo ricavato, calcolando stime di
funzioni non lineari
➝ per il nostro esempio la relazione è _b{nome variabile
esplicativa]*exp( _b[_cons]+_b[nome variabile
esplicativa]*[valore xi] )
Per ricavare l’elasticità si procede alla medesima maniera,

attraverso il comando dis+[relazione]

➝ osserviamo che con i comandi lincom e nlcom oltre alle stime viene calcolato anche lo
standard error ➝ una stima di non è completa senza conoscerne l’errore
➝ per la scelta del modello economico (lineare o meno) non c’è una regola, bisogna analizzare
ogni modello economico e ricavarne una teoria economica che ci aiuti a scegliere il modello
adatto. Ci possiamo aiutare confrontando la somma dei quadrati degli errori, oppure la varianza
σ 2 o la deviazione standard σ di questi ➝ ma il confronto è valido solo per modelli aventi la
medesima y (non si può confrontare la stima in un modello lineare con la stima in un modello
logaritmico)
Quella descritta fino ad ora è chiamata stima puntuale
̂ , β sup
Stima intervallare: coppia di numeri ( β inf ̂ ) tale che la probabilità che il vero valore di β sia
k k k
compreso tra i valori inferiore e superiore dell’intervallo sia uguale a P scelto da me
̂ ≤ β ≤ β sup
Prob{β inf ̂ }=P
k k k
Per convenzione la P si sceglie pari a 0.9 → 90 % oppure 0.95 → 95 %
Il significato di ciò è che, su campioni ripetuti, il 90 % /95 % degli intervalli calcolati contiene il
vero valore di bk
̂ , β sup
I valor di β inf ̂ dipendono dallo stimatore e dallo standard error dello stimatore
k k
STATA:
Riprendiamo il comando reg+[variabile y]+[variabile x] ritorniamo sulla tabella delle stime generata
Le stime intervallari di b1, b2 sono riportare al termine della tabella

Le stime in questo caso sono state calcolate con una P = 0.95 , è possibile cambiare il livello di
confidenza con il comando reg+[variabile y]+[variabile x]+,+level(90) impostando così il livello a
P = 0.9

➝ notiamo che aumentano il livello di confidenza da 95 % → 99 % la stima intervallare aumenta
➝ maggiore è la probabilità maggiore è la forbice dell’intervallo ➝ concettualmente a livello 100
l’intervallo diventa {−∞, + ∞}
Una stima intervallare ampia (a causa di un elevato standard error) segnala che il campione non
contiene molta informazione su β2
Al contrario una stima intervallare stretta segnala che abbiamo un'idea abbastanza precisa su
dove si trovi β2
Verifica di ipotesi ➝ verifichiamo che una congettura che ricaviamo è compatibile con il
campione
Componenti di una verifica di ipotesi:

• Formulare un’ipotesi nulla H0 : specifica un valore per un parametro di regressione ➝
H0 : βk = c ➝ congettura della popolazione statistica
importante: l’ipotesi nulla può essere rifiutata o non rifiutata ➝ non si accetta
• Formulare un’ipotesi alternativa H1 : valida solo se viene rifiutata l’ipotesi nulla H0 ➝ ci indica
in che direzione si sposta il valore ed è suggerita dalla teoria economica
può essere
- H1 : βk > c ➝ verrà chiamata coda a destra
- H1 : βk < c ➝ verrà chiamata coda a sinistra
- H1 : βk ≠ c ➝ verrà chiamata a due code
• Formulare una statistica test ➝ funzione del campione che riassume tutte le informazione
necessarie per decide s H0 è compatibile o meno ➝ stimatore per la verifica di ipotesi
l’espressione dipende unicamente da H0
Proprietà:
bk − βk b −c
-
Distribuzione nota se H0 è vera ➝ t = = k ∼ t(N−2)
se(bk ) se(bk )
- Distribuzione ignota e diversa se H0 è falsa ➝ non abbiamo informazioni sulla sua
distribuzione, ma sappiamo per certo che non è pari a t(N−2)
t(N−2) : è chiamata distribuzione t di student ➝ ha la particolarità di avvicinarsi alla distribuzione
normale all’aumentare dei gradi libertà (N − 2)
• Individuare una regione di rifiuto: contiene valori improbabili della statistica test per H0 vera
➝ La forma dipende unicamente dalla ipotesi alternativa H1 (coda a destra, coda a sinistra o due
code), dalla distribuzione della statistica test e dal livello di significatività α
Se l’ipotesi alternativa fosse vera, i valori della statistica test tendono ad essere molto grandi o
molto piccoli ➝ il range di questo valore dipende dal livello di significatività assunto ➝
α = {0.01, 0.05, 0.10}
Definiamo errore di prima specie: se rifiuto l’ipotesi nulla quando questa è vera ➝ scegliendo noi
α questo errore viene commesso ogni volta che rifiutiamo l’ipotesi nulla
Definiamo errore di seconda specie: quando non rifiutiamo l’ipotesi nulla quando questa è falsa
bk − c
• Conclusione: calcolato il valore della statistica testse(bk )
lo confrontiamo con la regione di
rifiuto e concludiamo se rifiutare o meno l’ipotesi nulla H0 ➝ se non viene rifiutata l’ipotesi nulla,
allora la congettura è compatibile con il cambio (non significa che sia necessariamente vera)
L’area del sotto grafico coincide con l’errore di prima specie

mi calcola la probabilità di rifiutare l’ipotesi nulla quando
questa è vera

H0 : βk = c Posizione Graficamente
H1 : βk > c Coda a destra
H1 : βk < c Coda a sinistra
H1 : βk ≠ c Doppia coda
P-value di un test: il valore più piccola di α per cui H0 è rifiutata
Graficamente possiamo osservare che il più piccolo valore di α per

cui vale la regola coincide proprio con il valore della statistica test
bk − c
Allora p =t = ➝ pvalue è l’area associata
se(bk )
➝ regola: rifiutiamo l’ipotesi nulla H0 se il p-value è minore o uguale

al livello di significatività α, non rifiutiamo in caso contrario
pvalue ≤ α ⟺ H0 r i f iutata pvalue > α ⟺ H0 non r i f iutata

STATA:
Per prima cosa calcoliamo la stima della regressione attraverso il comando reg+[variabile y]+
[variabile x]
A questo punto possiamo calcolare la statistica test con il comando dis+[relazione] inserendo
b2 − c
nella relazione la formula
se(b2)
In alternativa si può considera la funzione lineare
H0 : βk − c = 0 e utilizzare il comando lincom+[relazione]
e osservare il valore alla colonna t
Si procede calcolando il p-value associato, sempre con il comando dis+[relazione], inserendo

come relazione ttail( [ gradi di libertà N-1 ] , [statistica test t ] ) per calcolare la probabilità a destra
di un valore (H1 : βk > c) e t( [ gradi di libertà N-1 ] , [statistica test t ] ) per calcolare la probabilità
a sinistra di un valore (H1 : βk < c)

Infine confrontiamo il valore p-value con livello di significatività α scelto{0.01, 0.05, 0.10} e
deduciamo se H0 va rifiutato o non rifiutato
Solo per un test a due code, il comando lincom

calcola autonomamente il valore di p-value nella
colonna p > | t |
➝ nella tabella della regressione il p-value a due
code è calcolato rispetto a H1 : βk ≠ 0
Previsione dei minimi quadrati

Partendo sempre dal modello econometrico y = β1 + β2 x + e abbiamo stimato dei valori per i
parametri β1, β2 attraverso gli stimatori b1, b2 ➝ così facendo siamo capaci di prevedere un punto
y0 dato un certo valore x0 ⟺ y0 = b1 + b2 x0 ➝ a questo punto dobbiamo capire quanto
questa previsione sia affidabile, cercando un intervallo di previsione che mi misuri la probabilità di
riscontrare questo valore nella popolazione
Partiamo dal modello econometrico di una previsione del valore y0 = E(y0 ) + e0 = β1 + β2 x 0 + e0

➝ e0 è l’errore casuale che possiamo stimare con l’errore di previsione f = (y0 − ȳ)
Essendo b1, b2 variabili casuali, y0̂ è una variabile casuale che chiamiamo predittore puntuale
Contemporaneamente
y0̂ Stima della y media
b1 + b2 x0
E( y0̂ ) Previsione y
Così come abbiamo studiato lo stimatore intervallare per la stima puntuale, definiamo il predittore
intervallare
Stima intervallare Predittore intervallare
costante variabile casuale
pr ob{ ̂
β inf ≤ β ≤ ̂
β sup } pr ob{ ŷinf
0
≤ y0 ≤ ŷ sup
0
}
variabile casuale variabile casuale variabile casuale variabile casuale
1 (x0 − x̄)2
Concentriamoci sulla varianza dell’errore di previsione Var ( f ) = σ 2[1 + + ]
N ∑ (xi − x̄)2
Notiamo similitudini con la varianza degli stimatori b1, b2 già analizzati
la varianza dell’errore di previsione diminuisce quando:
• Diminuisce la varianza degli errori σ 2
• Aumenta la numerosità campionaria N
2
• Aumenta la variabilità della variabile esplicativa ∑ (xi − x̄)
Notiamo però un nuovo elemento che influenza la
varianza, (x0 − x̄)2, il quale valore aumenta
allontanandosi dalla media e agisce direttamente
sulla varianza (aumenta la varianza all’aumentare
del valore)
Questo elemento è ciò che ci fa osservare che

quanto più lontano è x 0 dalla media campionaria
x̄ tanto maggiore è la varianza ➝ tanto minore è
la precisione del predittore

STATA:
Calcoliamo la stima della regressione attraverso il solito comando reg+[variabile y]+[variabile x]
Abbiamo detto che b1 + b2 x0 è contemporaneamente la stima del valore medio e la previsione
del valore
Attraverso il comando lincom+[relazione] e la relazione _cons+[nome variabile x]+[valore x0]
calcoliamo la previsione per x0 ➝ y0̂
Per calcolare la previsione intervallare bisogna:
• Aprire l’editor dei dati e aggiungere, infondo, l’osservazione x0 per cui vogliamo calcolare
la previsione intervallare
• Eseguire il comando predict [nome variabile] in [numero osservazione aggiuntiva] per calcolare la
previsione y0̂
• Eseguire il comando predict [nome variabile] in [numero osservazione aggiuntiva] , stdf per
calcolare lo standard error di previsione
• Calcolare l’intervallo di previsione con il comando gen+[nome variabile]+=+[relazione] inserendo
nella relazione [variabile y0̂ ]-1.96*[standard error di previsione] per il limite inferiore e [variabile
y0̂ ]+1.96*[standard error di previsione] per il limite superiore ➝ è possibile anche procedere con
il comando dis per calcolare direttamente i valori
Un intervallo largo ci dice che la previsione puntuale non è molto precisa ➝ nel nostro caso
perché il reddito, pur essendo un indicatore importante per la spesa delle famiglie, non è
sufficiente per predirne il comportamento
Adattamento ai dati: indice R 2

➝ misuriamo la capacità della retta di regressione di stimare il comportamento del campione
(y − ȳ)2 per questo fine, ma ora

∑
Abbiamo già utilizzato la somma dei quadrati dei residui
vogliamo costruirci uno strumento di più facile lettura ➝ senza unità di misura e con un range
0 ∼ 1 ➝ un indice
Scomposizione della variabilità osservata:
N N N
∑i=1 (yi − ȳ)2 ∑i=1 ( yî − ȳ)2 ∑i=1 (eî )2
= +
N N N
Varianza osservata di y Varianza spiegata di y Varianza non spiegata
campione modello
Sotto l’ipotesi: il modello contiene un parametro di intercetta b1 = ȳ − b2 x̄ ➝ altrimenti l’R 2 non
ha valore
Per cui :
1 N 1 N 1 N 1 N =0 =0
N∑ N∑ N∑ N∑
eî = (yi − yî ) = (yi − b1 − b2 xi ) = ( yi − ȳ − b2(xi − x̄) = 0
i=1 i=1 i=1 i=1
La media dei residui è nulla
( yî − ȳ)2 (yi − ȳ)2 + ei2

∑ ∑ ∑
Da questa ipotesi ricaviamo: =
variazione totale in y quota spiegata quota non spiegata
attorno alla media campionaria
Var ̂ ( y)̂ SQ M
Sistemandola ricaviamo che la quota non spiegata è pari a ➝ R 2 = = ➝
Var ̂ (y) SQT
coefficiente di determinazione
Il valore va da 0 → 1
Per R 2 =0 Per R 2 =1
Modello che non spiega la variabilità di y Modello spiega perfettamente la variabilità di y

STATA:
Calcoliamo la stima della regressione attraverso il solito comando reg+[variabile y]+[variabile x]

Il coefficiente ci comunica la percentuale di varianza di y spiegata dal modello nel campione ➝
non c’è un valore che sia migliore rispetto ad un altro, dipende dal tipo di y esaminato ➝ mi
interessa la popolazione non il campione
Correlazione e R 2
La correlazione è un indice che misura il tipo di dipendenza fra due variabili
Cov(x, y) ̂
cov(x, y)
In formule è Cor r (x, y) = utilizzando le stime campionarie
var (x) var (y) ̂
se(x) ̂
* se(y)
Il range di questo Indice è [−1,1]

Per cor r =−1 Per cor r =1
Esiste una relazione lineare negativa tra x, y ed Esiste una relazione lineare positiva tra x, y ed
yi = a + bxi ⟺ b < 0 yi = a + bxi ⟺ b > 0

Per valori da −1 → 0 mi dice che le osservazioni Per valori da 0 → 1 mi dice che le osservazioni
hanno la tendenza di muoversi nello stesso verso hanno la tendenza di muoversi nello stesso verso
negativo positivo
Per cor r (x, y) = 0 non c’è alcuna relazione sull’andamento di x, y ➝ i punti sono casuali
STATA:
Si utilizza il comando corr+[variabile x] [variabile y]
Nella tabella formata abbiamo la correlazione fra

(y, y) = 1 e (x, x) = 1
Nell’incrocio abbiamo la correlazione tra (x, y) che è il
valore che stavamo cercando
Osserviamo due importanti proprietà:

•
̂ y)2 : significa che i valori sono algebricamente uguali
R 2 = Cor r (x,
̂
• R 2 = Cor r (x, y)̂ 2 : significa che il coefficiente di determinazione può essere calcolato come
quadrato del coefficiente di correlazione ➝ permette di misurare l’associazione lineare
(adattamento ai dati) fra le osservazioni campionarie e i valori previsti della variabile dipendente
Riportare i risultati
• Assegnare nomi significativi alle variabili y, x e riportare le stime dei parametri
• Si può utilizzare un sistema ad asterischi * per riportare il livello di significatività accettato
• Riportare lo standard error
• Riportare l’R 2
Scala dei dati ➝ il modello è invariabile rispetto alla scala
➝ questo ci permette di scegliere la scala dei dati in relazione alle nostre necessità esplicative
Nell’esempio della spesa alimentare, riportare i dati del reddito in centinaia di dollari rispetto a
dollari rendeva la lettura del risultato più comprensibile e significativa, pur non modificando la
relazione del modello
Cambiare la Rimangono uguali i

Cambiano i valori di
scala valori di
X
di X → b1, statistica test, R 2 b2 → cb2 ⟺ se(b2 ) → cse(b2 )
c
Y L’interpretazione bk se(bk )
di Y → statistica test, R 2 bk → ⟺ se(bk ) →
c economica c c
rimane la stessa
di b1 se(b1)
X Y b2, statistica test, R 2 b1 → ⟺ se(b1) →
X→ eY→ c c
c c
Ricavare effetto marginale e elasticità in regressioni lineari con variabili modificate

Y = β1 + β2 X + e
Effetto Marginale X, Y Elasticità Y, X
X
Calcolare la derivata del modello rispetto ad X Moltiplicare l’effetto marginale per
dY(X ) Y
→ dY(X ) X
dX → *
dX Y(X )
Test di significatività ≠ test di specificazione

H0:βk =c H0:e∼N(0,σ 2 )
Il test di significatività verifica un parametro mentre il test di specificazione verifica un proprietà
generale del modello
➝ Test di normalità degli errori ➝ test di Jarque-Bera

È una relazione tra:
• S : Asimmetria di una variabile ➝ misura il grado di simmetria dei residui rispetto allo zero
• K : Curtosi di una variabile ➝ misura quanto sia concentrata una distribuzione
N 2 (K − 3)2
JB = [S + ] ➝ da cui si calcola il pvalue e lo si confronta con i livelli di significatività
6 4
α = {0.01, 0.05, 0.10}
STATA:
Per prima cosa calcoliamo i residui con
il comando predict[nome variabile]+, res
Si utilizza il comando sktest+[nome

variabile] ➝ dalla tabella generata
troviamo il pvalue associato e lo
confrontiamo con
l’α = {0.01, 0.05, 0.10} scelto
Nel nostro esempio volevamo verificare H0 : e ∼ N(0,σ 2 ) ➝ il pvalue è notevolmente più grande
di tutti i livelli di significatività α = {0.01, 0.05, 0.10} ➝ per cui non si rifiuta l’ipotesi nulla
Predittore Normale e Predittore Corretto

Quando vogliamo prevedere ŷ in un modello Log-
Lineare commettiamo “l’errore” di trasportare
l’esponenziale all’interno della media ➝ questo è alla
base del predittore normale ŷ = ex p(b1 + b2 xi )
➝ questo perché consideriamo E [ex p(e)] = E(e) = 0
Per correggere il predittore bisogna considerare la

correzione della media dell’esponenziale, che in per
errori con distribuzione normale
1
e ∼ N(0,σ 2 ) ⟺ E [ex p(e)] = ex p( σ 2 )
2
➝ per cui un predittore corretto è
1
ŷ = ex p(b1 + b2 xi ) * ex p( σ 2 ) ➝ sapendo che σ 2 è
2
̂
sempre > 0 possiamo dedurre che yNormale ̂
< yCorretto
R 2 generalizzato ➝ si utilizza per misurare l’adattamento in modelli di regressione in cui la variabile è
misurata in maniera diversa rispetto a come entra nel modello ➝ per y e non log(y)
Si utilizza R 2 ̂ 2 ➝ dove ŷ = ex p[log(y)]

= [Cor r (y, y)]
STATA:
Si procede in 4 step:
1. Con il comando predict[variabile y] si genera la previsione di
log(y)
2. Con il comando gen+[nome variabile]=[relazione] , dove la
relazione è il predittore naturale (oppure corretto, in questo caso
è indifferente perché il correlatore è identico in caso di
moltiplicazione per costanti)
3. Con il comando corr+[variabile y][variabile y]̂ per calcolare la
correlazione tra la variabile e la previsione della variabile
logaritmica
4. Con il comando dis+[relazione] , dove la relazione è il quadrato
del correlatore calcolato nel punto precedente, per calcolare R 2
Nel comando di regressione lineare l’R 2 calcolato è rispetto alla

variabile logaritmica, non a quella lineare ➝ log(wage) ≠ wage

Modello di regressione lineare MULTIPLA ➝ più variabili esplicative x spiegano il comportamento della
variabile dipendente
y = β1 + β2 x2 + . . . + βk xk + e
Il significato economico dei parametri rimane il medesimo ➝ per cui:
• β1 → intercetta per x1 = 0
ΔE(y) d E(y)
• β2 = effetto marginale parziale |x costante → |
Δ(x 2 ) k d(x 2 ) xk costante
Per quanto riguarda la rappresentazione grafica il risultato della regressione

non è più una retta, ma dipende dal numero di variabili esplicative
utilizzate.
In caso il modello dipenda da due variabili

x ⟺ y = β1 + β2 x 2 + β3 x3 + e ➝ graficamente rappresenta il piano di
regressione lineare multipla rispetto al campione
➝ per questo non sarà più possibile rappresentare graficamente la

regressione
Sotto le stesse ipotesi viste per la regressione semplice, lo stimatore dei

minimi quadrati è definito coretto ➝ per cui gli stimatori di βk → bk sono BLUE
STATA:
Calcoliamo la stima della regressione attraverso il solito comando reg+[variabile y]+[variabile x 2]+
[variabile x3]
Tutti i valori calcolati precedentemente per la regressione lineare hanno il medesimo significato
applicati alla regressione multipla ➝ bisogna fare attenzione ai gradi di libertà ➝ non è più N − 2
ma N − k perché abbiamo più di due parametri da sottrarre ➝ nel nostro esempio N − 3 = 72
Allo stesso tutti i comandi analizzati inizialmente per la regressione semplice rimangono invariati
Rendimenti non lineari

Aver aggiunto una variabile quadratica al modello ha come effetto l’aver reso non costante
l’effetto marginale ➝ questo è visibile nel modello che abbiamo utilizzato noi in quanto la

pubblicità ha un rendimento di scala decrescente ➝ l’effetto positivo decresce al crescere della
spesa pubblicitaria
Graficamente sappiamo che la funzione quadratica ha come rappresentazione la parabola ➝ ∪

per coefficiente lineare positivo e ∩ per coefficiente lineare negativo
Condizione di ottimabilità
Nell’esempio abbiamo considerato il fatturato in funzione di prezzo e costo di pubblicità ➝ se
consideriamo ora il modello economico Sales = β1 + β2 Pr ice + β3 Ad ver t + β4 Ad ver t 2 + e
Per l’impresa la pubblicità rappresenta un costo, dunque è profittevoli solo se inferiore al ricavo
marginale
d E(Sales)
Il ricavo marginale è ➝ |Price costante = β3 + 2β4 Ad ver t 2
d(Ad ver t)
Il costo marginale è → = 1
1 − β3
β3 + 2β4 Ad ver t 2 = 1 → Ad ver t =
2β4
Variabili di interazione nel modello lineare
➝ si utilizzano all’interno del modello lineare quando vogliamo rendere l’effetto marginale di una
variabile in funzione dell’altra ➝ rendo non costante l’effetto marginale
Per fare ciò bisogna aggiungere al modello una variabile che sia prodotto delle due variabili
Sales = β1 + β2 Pr ice + β3 Ad ver t + β4(Pr ice * Ad ver t) + e
L’effetto marginale di Pr ice dipende ora da Ad ver t e viceversa

δSales
• = β2 + β4 Ad ver t
δPr ice
δSales
• = β3 + β4 Pr ice
δ Ad ver t
Una volta inserita la variabile di interazione è utile fare una test di significatività delle variabili per
valutarne l’effetto all’interno del modello
Nel modello precedente abbiamo visto un’altra variabile di interazione che agisce sull’effetto
marginale ➝ Ad ver t 2 = Ad ver t * Ad ver t è un caso particolare
STATA:
Con il comando gen+[nome variabile]=[variabile_1]*[variabile_2], calcoliamo la stima della
regressione attraverso il solito comando reg
Per calcolare l’effetto marginale procediamo con il comando lincom+[relazione] inserendo
come relazione la derivata condizionata del modello
Variabili di interazione nel modello log-lineare

➝ come già sappiamo in questo modello i parametri βk non identificano l’effetto marginale ma la
semi-elasticità, per cui una variabile di interazione in questo modello agisce sulla semi-elasticità di
una variabile rendendola dipendente dall’altra variabile
Indice di adattamento ai dati → R 2

Rimane invariato il significato di R 2 all’eterno del modello di regressione lineare multiplo: misura
della quota di dispersione della variabile dipendente spiegata dalla variazione della variabile
esplicativa

SQ M SQ R
La formula per calcolare è R 2 = =1−
SQT SQT
dove SQ M è la variazione in y "spiegata" dal modello (somma dei quadrati della regressione),
SQT è la variazione totale in y rispetto alla propria media (somma dei quadrati totale) e SQ R è la
somma dei quadrati dei residui dei minimi quadrati (errori) e rappresenta la componente di
variazione di y non spiegata dal modello
Un valore elevato di R 2 segnala l’esistenza di una relazione stretta fra i valori osservati di yi e
quelli previsti dal modello yî ➝ il modello si adatta bene ai dati
Un valore basso di R 2 segnala l’inesistenza di una associazione stretta fra yi e i valori previsti yî , e
il modello
non si adatta bene ai dati
Osservazione: è necessario che il modello contenga un valore di intercetta β1 ➝ in caso contrario

non esisterebbe l’uguaglianza SQT ≠ SQ M + SQ R per cui il valore di R 2 perde di significato
➝ se per la teoria economica il modello non deve avere un valore β1 non ha senso indicare l'R 2
nei risultati
Verifica di ipotesi congiunte

Si utilizza il test F quando bisogna fare più congetture simultaneamente sui parametri
L’esempio classico di ipotesi congiunta è verificare che un modello includa un gruppo di variabili
Ipotesi congiunta ➝ H0 : β3 = 0,β4 = 0,β5 = 0 ➝ verifica simultaneamente che tutte tre le
congetture siano vere
Il test F prende in analisi due modelli, e ne confronta la somma dei quadrati degli errori
Data una ipotesi nulla H0 : β2 = 0,β3 = 0,β4 = 0 si definisce
• Modello non vincolato: nel quale i vincoli imposti dalla congettura non sono applicati
y = β1 + β2 x2 + β3 x3 + β4 x4 + β45x5 + e
• Modello vincolato: nel quale i vincoli imposti dalla congettura sono applicati
y = β1 + β2 x2 + e ➝ è derivato dal modello non vincolato imponendo la congettura
Sappiamo per costruzione che un modello non vincolato, per cui con più variabili esplicative, si
adatta sempre meglio ai dati
➝ ricordiamo lo stimatore dei minimi quadrati, cioè la funzione che minimizza SQ R
N
(yi − β1 − β2 − β3 − β4 . . . )2 ➝ per cui un modello vincolato con un numero di
∑
SQ R =
i=1
parametri inferiori per forza un SQ R maggiore rispetto allo stesso modello non vincolato
Il risultato di una ipotesi congiunta è allora:

H0 : β2 = 0,β3 = 0... le congetture sono vere simultaneamente
H1 : b2 ≠ 0 o b3 ≠ 0 oppure entrambi
Formula: SQRv − SQRnv
J = numero di vincoli
J
F= SQRnv
N = gradi di libertà
K = numero di parametri
N−K

SQ Rnv 2
In particolare osserviamo che = σnv è la stima della varianza del modello non vincolato
N−K
e SQ Rv − SQ Rnv è la differenza di due elementi per forza positivi (quadrati) per cui è
sicuramente positiva
La logica dietro al test F è guidata dal nominatore ➝ sapendo che un modello vincolato ha una
SQ R più grande, se la differenza è molto piccola allora l’aggiunta dei vincoli crea un modello
che si adatta ai dati quasi come quello vincolato. Viceversa se la differenza è molto grande,
allora l’aggiunta dei vincoli crea un modello che si adatta ai dati peggio rispetto a quello vincolato
Tutti gli altri elementi del test ci servono per creare

una distribuzione avente una forma che conosciamo
➝ distribuzione di F(J,N−K )
Se l'ipotesi nulla non è rifiutata, la statistica F ha

una distribuzione chiamata F con J gradi di libertà al
numeratore e N − K gradi di libertà al denominatore
Se l'ipotesi alternativa è accettata, la differenza fra
SQ Rv − SQ Rnv è grande, il che implica che i vincoli
imposti dall'ipotesi nulla sul modello riducono in
maniera significativa la sua capacità di adattarsi ai dati
Come vediamo graficamente, la ragione di rifiuto è solo a destra ➝ per cui se utilizziamo il pvalue
dobbiamo considerare la coda a destra. Questo significa che:
• Per un pvalue < α rifiutiamo l’ipotesi nulla e accettiamo quella alternativa
• Per un pvalue > α non rifiutiamo l’ipotesi nulla
STATA:
Con il comando test è possibile applicare il test F. La
sintassi generale prevede di inserire ogni vincolo tra
parentesi e separare ogni parentesi con uno spazio
test (vincolo_1) (vincolo_2)
Però quando i vincoli solo semplici (βk = 0) si può
utilizzare la sintassi semplificata inserendo solo i nomi
delle variabili di sul quale parametro vogliamo testare
un vincolo
test [variabile_1] [variabile_2]
Ovviamente con le due sintassi si giunge al medesimo
risultato
Il risultato del comando è la statistica test ed il pvalue
Confrontiamo il secondo valore con i livelli di

significatività α per giungere alla conclusione se
rifiutare o meno l’ipotesi nulla H0
Test di significatività complessiva del modello di regressione

Consiste in una verifica della significatività complessiva del modello ➝ una congettura su tutte le
variabili esplicative
H0 : tutti i parametri βk escluso β1 sono simultaneamente nulli ➝ questo significa che nessuna
delle variabili esplicative influenza y e quindi il modello ha poca o nessuna utilità
H1 : almeno un parametro non è nullo e di conseguenza una o più variabili esplicative ha effetto
su y
In questo caso il test F ha come componenti il modello non vincolato yi = β1 + β2 . . . + e e il

modello vincolato yi = β1 + e
STATA:
Il test di significatività del modello viene calcolato automaticamente da stata nel comando reg
Il test F può essere utilizzato anche per verificare una sola congettura ➝ caso particolare
➝ vale solo per congetture “diverso da” ➝ due code
Relazione tra statistica t & F
2
Vi è una relazione esatta tra il valore del test t e il valore del test F : t(N−K ) = F(1,N−K ) e tra il
valore critico di questi due test: tc2 = Fc per cui il pvalue dei due test coincide
Limite del test F

Può essere applicato solo a congetture βk ≠ j ➝ ovvero un test a due code
Questo lo si può dedurre anche dalla relazione con il test t ➝ l’elevare al quadrato il valore fa
perdere l’informazione sul segno, che è fondamentale per i test a coda destra/sinistra
Elemento fondamentale perché il test F sia esatto è che gli errori abbiano distribuzione normale,
oppure approssimato per campioni con numerosità elevata
Test F generale
Si può verificare qualsiasi congettura con l’unico limite che sia H0 che H1 non devono essere
“maggiore” o “minore” di e che il vincolo sia lineare
1 − β3
Consideriamo il vincolo di ottimibilità della spesa pubblicitaria Ad ver t* =
2β4
Per verificare l’ipotesi che Ad ver t* = 1.9 si può procedere per due vie:
• Utilizzando un test t ed il relativo pvalue ➝ su stata si utilizza il comando nlcom per calcolare i
valori relativi al vincolo non lineare
1 − β3
Ad ver t* = 1.9 → Ad ver t* − 1.9 = 0 → − 1.9 = 0
2β4
• Utilizzando un test F ed il relativo pvalue ➝ bisogna rendere il vincolo lineare
Per rendere lineare un vincolo non lineare compatibile con il test F si può utilizzare il minimo
comune denominatore
1 − β3 1 − β3 − (1.9)2β4
Ad ver t* − 1.9 = 0 → − 1.9 = 0 → =0
2β4 2β4
Analizziamo ora quali sono i valori del denominatore 2β4 che rendono l’equazione = 0
➝ l’unico valore sarebbe β4 = ∞ , ma come sappiamo non è un valore realistico per un
parametro nel modello ➝ possiamo eliminare il denominatore
1 − β3 − (1.9)2β4
Il vincolo diventa: = 0 → 1 − β3 − (1.9)2β4 = 0
2β4
Ora possiamo inserirlo in un test F
STATA:
Osserviamo però che il pvalue calcolato con il

test F è diverso da quello calcolato con il test
t ➝ questo perché abbiamo eliminato un
elemento dal vincolo orribile (2β4 al
denominatore) che invece viene considerato
nel test t ➝ in questo caso non c’è nessun
effetto sul risultato finale in quanto non
rifiutiamo comunque l’ipotesi nulla
➝ consiglio del prof: per un singolo vincoli non lineari utilizzare strumenti (test t) che funzionano
al meglio con essi
Esempio più complesso:

Due congetture: Ad ver t = 1.900 e Bu dget : Pr ice = 6; Ad ver t = 1.900; Sales = 80.000
In questo caso dobbiamo per forza utilizzare il test F perché le due congetture vanno verificate
contemporaneamente
H0 : β3 + 3.8β4 = 1; β1 + 6β2 + 1.9β3 + 1.92 β4 = 80

H1 : almeno uno dei due vincoli non è valido
STATA:
Si utilizza il comando test

(vincolo_1) (vincolo_2)
inserendo i vincoli come
indicati in H0
Confrontata il pvalue con α si trae la conclusione

Ancora una volta la criticità di questo test è il vincolo di linearità delle congetture

Informazione non campionaria
Si tratta di informazioni aggiuntive alle osservazioni campionarie, tratte solitamente dalla teoria
economica, che hanno effetto sul modello ➝ se corretta, aumenta la precisione della stima dei
parametri
Utilizziamo un modello di domanda formulato in L ogL og e applichiamo la teoria

A IM : assenza di illusione monetaria ➝ moltiplico tutte le variabili esplicative per una costante λ
ma il risultato non cambia ➝ possiamo questo in un vincolo sui parametri da verificare
log(Q) = β1 + β2log(PB) + β3log(PL) + β4log(PR) + β5log(I )

log(Q) = β1 + β2log(λ PB) + β3log(λ PL) + β4log(λ PR) + β5log(λ I )
log(Q) = β1 + β2log(PB) + β3log(PL) + β4log(PR) + β5log(I )+logλ(β2 + β3 + β4 + β5)
invariato =0
STATA:
Per cui dalla teoria economica ho estratto l’informazione non
campionaria di assenza di illusione monetaria e l’ho trasformata nel
vincolo
logλ(β2 + β3 + β4 + β5) = 0 → β2 + β3 + β4 + β5 = 0
Ora posso procedere attraverso un test t oppure F per verificare la

congettura
È però anche possibile incorporare direttamente nel modello l’informazione non campionaria,
rendendo questa partecipe della regressione
STATA:
Per inserire un’informazione non campionaria all’interno della regressione si utilizza prima il
comando cons + [numero da 1 a 99] + [vincolo] per specificare il vincolo da assegnare al modello
(cioè l’informazione non campionaria). Nel nostro caso sarà β2 + β3 + β4 + β5 = 0.
Una volta specificati tutti i vincoli, si utilizza il comando cnsreg + [modello] + , cons( [numero
assegnato al vincolo] ) per eseguire la regressione integrando l’informazione non campionaria

l’informazione non campionaria può essere
più di una, su stata ne supporta fino a 99
Nel assegnare più vincoli alla regressione è
importante separare ogni numero da uno
spazio
Con le informazioni non campionarie

abbiamo introdotto un nuovo stimatore:
stimatore dei minimi quadrati vincolati
Proprietà:
• E(b* k
) ≠ βk ➝ in generale lo stimatore
non è corretto, a meno che il vincolo sia
valido, per cui conviene sempre fare una
verifica di ipotesi prima di imporlo
• Tuttavia Var (b* k
) < Var (bk ) ➝ la varianza diminuisce per cui la precisione aumenta, anche
se il vincolo non è valido ➝ questo perché aumentano le fonti d’informazione sulla popolazione
(bisogna stimare meno parametri)
• Un vincolo non campionario può essere utile solo se valido
Il teorema di Gauss-Markov rimane valido, in quanto esso enuncia che lo stimatore dei minimi
quadrati è il più preciso tra quelli corretto, è la correttezza dello stimatore dei minimi quadrati
vincolato non è garantita
Corretta specificazione del modello

➝ il modello che sto utilizzando rispetta il modo in cui i dati si generano nella popolazione
L’errore principale è quello di omettere variabili necessarie della popolazione oppure includere
variabili esplicative che non sono adatte per la popolazione
Variabili omesse: accade per svariati motivi, in primis la complessità della natura che ci circonda.
Ci sono inevitabilmente caratteristiche della realtà che non siamo capaci di riportare sotto forma
di dati misurabili
Preso un modello di salario famigliare
Osserviamo che l’omissione di una variabile

esplicativa ha come effetto una distorsione dei
parametri della regressione
Possiamo interpretare la distorsione come un

modello vincolato dalla informazione non
campionaria che β3 = 0 per cui la regressione è una regressione vincolata creata con lo stimatore
dei minimi quadrati vincolato ➝ inoltre sapendo che l’informazione non è corretta, lo stimatore è
distorto
Matematica si dimostra che differenza tra la media dello stimatore e il parametro della
Cov(x̂ 2, x3)
popolazione è E(b* ) − β2 = β3
2 ̂ 2)
Var (x
Osserviamo che b* è corretto solo se Cov(x̂ 2, x3) = 0 ➝ omettere variabili
k
non è un problema solo se le variabili non sono tra di loro correlate (accade
raramente in ambito economico)
Le variabili esplicative sono altamente correlate in questo campione (~ 60%)

➝ per cui diamo significato alla distorsione dei parametri nel modello
vincolato
Variabili irrilevanti:
Come effetto le stime dei minimi quadrati restano corretti, ma gli standard error delle stime
crescono
Per cui se aggiungiamo delle variabili

casuali al modello precedente
Vediamo che i parametri X5 e X6 sono irrilevanti per il modello ( pvalue>α ) e gli standard error
10/5/1
(se) sono aumentanti per HEDU e WEDU
Strumenti per la specificazione del modello
1. Scegliere variabili e forma funzionale coerenti con conoscenze economiche
2. Stime col segno sbagliato o della dimensione sbagliata possono essere sintomi di errata
specificazione
3. Fare test di significatività ➝ test t a due code o test F , servono però osservazioni per il
parametro che pensiamo sia omesso o superfluo
4. Controllare i criteri di selezione del modello ➝ confrontare modelli fra di loro nested (per cui
che uno è riconducibile all’altro attraverso imposizione di vincoli M1 ∈ M2) ➝ è importante
controllare che la variabile dipendente sia comune fra i modelli confrontati
SQ R
➝ non si utilizza R 2 =1− perché fortemente influenzato dal numero di variabili
SQT
esplicative ➝ aumenta sempre all’aumentare di variabili esplicative
➝ è utile solo nel confronto tra modelli nested con lo stesso numero di variabili k
SQ R /(N − K )
4.a. R̄2 corretto : R̄2 = 1 −
SQT /(N − 1)
dividendo numeratore e denominatore per
il loro grado di libertà ➝ questo valore non
è più la percentuale di varianza spiegata
nel modello, è un indicatore differente che
serve per la selezione del modello
R̄2 ≤ R 2
in particolare al crescere di k ⟺ R̄2
può sia diminuire che crescere
Matematicamente si dimostra che

aggiungendo
xk+1 : R̄2k < R̄2k+1 ⟺ tH0:βk+1=0 > 1
STATA:
con il comando reg il programma ci calcola
autonomamente l’R̄2
Confrontando il valore, quello con R̄2 più

grande è migliore rispetto all’altro
4.b. Criteri di informazione : anche questi strumenti misurano l’adattamento ai dati tenendo
conto dell’aumento di variabili k
SQ R 2K
noi ne analizziamo due Akaike (A IC ) = log + e Schwarz Bayesiano
N N
SQ R KlogN
SC(BIC ) = = log +
N N

SQ R
condividono la struttura sottostante di analisi dell’adattamento ai dati log , mentre la
N
seconda parte è una penalità per il modello con più variabili (SC penalizza maggiormente
rispetto a A IC )
Per cui va preferito il modello con criterio di informazione più basso

STATA:
con il comando estat ic vengono calcolati gli indicatori di adattamento ai dati per l’ultimo
modello di regressione calcolato
5. Usare il test di specificazione R ESET ➝ si utilizza nel caso ci sembri manchino variabili
esplicative, ma senza avere osservazioni per esse e quindi senza poter fare i passaggi
precedenti
si parte stimando il modello y = β1 + β2 x2 + β3 x3 + e e calcolando i valori previsti

ŷ = b1 + b2 x2 + b3 x3 + e
➝ questi valori vanno inseriti in una regressione ausiliaria: strumento tecnico semplice per
calcolare una statistica test, ma senza alcun significato economico particolare (i parametri non
sono né elasticità né effetto marginale né altro)
Ne costruiamo due:
1. Aggiunge al modello il quadrato dei valori previsti y = β1 + β2 x 2 + β3 x3 + γ1ŷ2 + e
2. Aggiunge al modello il quadrato ed il cubo dei valori previsti
y = β1 + β2 x2 + β3 x3 + γ1ŷ2 + γ2 ŷ3 + e

perché valga l’equivalenza in questi tre modelli deve essere valido il vincolo
H0 : γ1 = 0 con un test t oppure F nel primo modello ausiliare
H0 : γ1 = 0,γ2 = 0 con un test F nel secondo modello ausiliare
Se l’ipotesi nulla è rifiutata vuol dire che il modello può essere migliorato, se invece non è
rifiutata significa che il test non è stato in grado di rilevare errori di specificazione
Questo test ci permette di individuare la mancanza di una variabile nel modello senza avere
osservazioni di essa ➝ la variabile deve essere però un polinomio di secondo/terzo grado del
modello originale
STATA:
Con il comando estat ovtest
viene eseguito il reset test
l’ultimo modello di regressione
calcolato
confrontando il pvalue con α si

determina se l’ipotesi nulla va
rifiutata o meno
in questo caso il pvalue rifiuta

l’ipotesi nulla per un livello di
significatività α = 10 % ,5 % ma
non per un α = 1 %
Collinearità
È la situazione in cui all’interno del modello ci sono variabili esplicative linearmente dipendenti
Preso un modello yi = β1 + β2 x2i + β3 x3i + β4 x4i + ei per i ∈ N si definiscono (1,x2i, x3i, x4i )
collineari se esistono αk per cui vale α11 + α2 x 2i + α3 x3i + α4 x4i = 0 per ∀i
Per cui ogni variabile è definibile come funzione lineare delle altre
1
x2i = − (α1 + α3 x3i + α4 x4i ) il che significa che la variabile è inutile ➝ perché l’informazione
α2
aggiuntiva è già presente nel modello ➝ non sarà possibile distinguere l’effetto della singola
variabile
Questo effetto fa si che non sia possibile stimare attraverso lo stimatore dei minimi quadrati
STATA:
Su stata quando viene
rilevata una collinearità, una
variabile viene
automaticamente eliminata
dal programma, senza
nessun criterio specifico e
per cui in maniera arbitraria

Trappola della variabile dummy ~ collinearità esatta
Si presenta quando in modello sono presenti troppe variabili binarie (0,1)
Prendiamo l’esempio Wage = β1 + β2 D + β3U + e dove D e U sono variabili dummy.

Se volessimo dimostrare la discriminazione per cui le donne percepiscono un reddito inferiore a
{β1 + β3 uom o
β1 + β2 donn a
parità di tutto il resto ➝ E(Wage) = per cui basterebbe una verifica di
ipotesi H0 : βD = βU; H1 : βD < βU

α1 : −1
Possiamo però dimostrare la presenza di collinearità tale che −1 + Di + Ui = 0 → α2 : 1
α3 : 1
Per risolvere questo modello basta eliminare una delle variabili che crea collinearità
{β1
β1 + β2 d on n a
➝ eliminando U il modello diventa Wage = β1 + β2 D + e per cui E(Wage) =
u om o
per cui si verifica l’ipotesi H0 : βD = 0; H1 : βD < 0
È la medesima cosa che fa STATA in automatico, ma così abbiamo controllo su quale variabile
viene eliminata ➝ equivale ad imporre una informazione non campionaria nel modello
Collinearità approssimata
Per cui α11 + α2 x 2i + α3 x3i + α4 x4i ≈ 0 ➝ per qualche osservazione è poco sopra a 0 e per
altre è poco sotto 0
Un modo per individuare la collinearità è stimare la regressione ausiliare
1
x2i = − (α1 + α3 x3i + α4 x4i ) e osservare l’R 2 ➝ per valori vicini ad 1 c’è collinearità
α2
approssimata, mentre per valori lontani da 1 non c’è collinearità
➝ conseguenze della collinearità: rende meno preciso il processo di stima dei parametri ➝ agisce
σ2
sulla Var dello stimatore Var (bk ) = 2
dove r23 = Cor r (x̂ 2, x3) ➝ per cui
(1 − r23) ∑ (x2i − x̄2)
2 2
per correlazione ~ 1, la varianza aumenta fino a raggiungere un valore infinito
Anche in questo caso la soluzione del modello è eliminare una variabile che crea collinearità
Per variabili esplicative approssimativamente collineari:

• Standard error sono elevati
• Stime non sono significative
• R 2 può comunque essere alto
• Test F di significatività del modello rifiuta H0
• Il modello prevede bene fuori dal campione di stima
• Stime estremamente sensibili all'aggiunta o all'eliminazione di qualche osservazione o di una
variabile - anche se apparentemente irrilevante
{0 caratteristica assente
1 caratteristica presente
Variabili indicatrici ~ variabili dummy D =
È una variabile artificiale che indica la presenza di una caratteristica qualitativa (uomo - donna)
misurata con un indicatore binario ➝ 0 e 1 non sono da considera come numeri, ma etichette
(vero o falso)
Scelta del caso base

Il caso base coincide con D = 0 ➝ scelgo io quale caratteristica legare al caso base in modo da
trarre la maggiore valenza informativa per la mia analisi econometrica
{0 caratteristica presente
1 caratteristica assente
LD = = 1 − D posso decidere di invertire il valore della dummy

Consideriamo un modello Pr ice
= β1 + β2 SQFT + e a cui vogliamo aggiungere una variabile
{0 cat t iva
1 buon a
indicatrice Posit ion = → è qualitativa e binaria
La variabile indicatrice entrare nel modello in due forme principalmente: con effetto sull’intercetta
o con effetto sulla pendenza
Effetto sull’intercetta
Analizziamo quindi il modello completo Pr ice
= β1 + β2 SQFT + δPosit ion + e
{β1+β2 SQFT
(β1 + δ )+β2 SQFT Posit ion = 1
Per cui E(Pr ice) =
Posit ion = 0
Graficamente osserviamo che l’effetto della
variabile indicatrice è traslare in alto la retta di
regressione di una misura pari a δ
I parametri vengono stimati minimizzando i

quadrati dei residui dividendo il campione in
due, seguendo la caratteristica rappresentata
dalla variabile dummy
Caso particolare: variabile dummy puntuale
{0 qualsiasi altra caratteristica

1 caratteristica specifica
D=
Essendo che D = 1 per una sola
osservazione, la retta parallela deve essere
quella passante per il punto specifico
➝ in questo punto il residuo vale eî = 0
➝ nell’R 2 questa osservazione non viene
considerata ➝ posso misurare l’adattamento
ai dati in tutte le osservazioni del campione
con esclusione dell’osservazione a cui è
legata la dummy puntuale
➝ questo è un modo per manipolare l’R 2 ➝

posso gonfiarne il valore eliminando il residuo dell’osservazione divergente rispetto alle altre
Effetto sulla pendenza

Analizziamo quindi il modello completo Pr ice = β1 + β2 SQFT + γ (SQFT * Posit ion) + e
Inseriamo quindi una variabile di interazione
Per cui
{β1+β2 SQFT {β2

β1+(β2 + γ)SQFT Posit ion = 1 δE(Pr ice) β2 + γ Posit ion = 1
E(Pr ice) = → =
Posit ion = 0 δSQFT Posit ion = 0

Graficamente osserviamo che l’effetto della
variabile indicatrice è ruotare in alto la retta di
regressione di una misura pari a γ
L’effetto economico di questa scelta si vede

all’interno dell’effetto marginale
E possibile inserire entrambi gli effetti all’interno di un modello econometrico

Pr ice = β1 + β2 SQFT + δPosit ion + γ (SQFT * Posit ion) + e
{β1+β2 SQFT
(β1 + δ )+(β2 + γ)SQFT Posit ion = 1
Per cui E(Pr ice) =
Posit ion = 0
Osservando un esempio empirico
PR ICE = β1 + δ1U TOW N + β2 SQFT + γ (SQFT * U TOW N ) + β3 AGE + δ2 POOL + δ3FPL ACE + e
Dove U TOW N, POOL, FPL ACE sono variabili dummy
Come vediamo l’effetto della variabile dummy U TOW N è vincolato all’intercetta e all’effetto
marginale di SQFT ➝ gli altri parametri non sentono dell’effetto di questa variabile indicatrice
Interazione tra fattori qualitativi ➝ fattori sinonimo variabili indicatrici

Spiegato attraverso un esempio. Preso il modello W = β1 + β2 ED + δ1B + δ2 F + γ (B * F ) + e
dove B, F sono variabili dummy che indicano B : Black; F : Fem ale
Osserviamo che ciò equivale a dividere in 4 il campione

β1 + β2 ED maschio bianco
(β1 + δ1) + β2 ED maschio nero
E(W ) =
(β1 + δ2) + β2 ED donna bianca
(β1 + δ1 + δ2 + γ) + β2 ED donna nera
In questo caso l’interazione è solo tra variabili indicatrici, per cui l’effetto di ognuno di questi
gruppi è sull’intercetta e nessun effetto sulla pendenza

Fattori qualitative con più categorie ➝ variabili con categorie multiple
Spiegato attraverso un esempio. Preso il modello W = β1 + β2 ED + δR EGION + e
In questo caso osserviamo che la variabile confine 4 categorie R EGIONE : N, S, M, W
Se volessimo assegnare ad ogni categoria un numero arbitrariamente N : 1,S : 2,M : 3,W : 4

cadremmo nella trappola di imporre al modello un parametro non verificato nella popolazione ➝
cioè in questo modello abbiamo imposto che il salario di un lavoratore del West sia 4 volte il
salario di un lavoratore nel Northeast ➝ in maniera arbitraria e non verificata per la popolazione
Ciò che dobbiamo fare per inserire queste caratteristiche nel modello è creare una dummy
N norheast
S south
binaria per ogni categoria ➝ ➝ questo creerebbe collinearità perfetta, per cui
M midwest
W west
N norheast
S south
bisogna renderne una il caso base, eliminandola ➝
M midwest
W west
Il modello diventa per cui W = β1 + β2 ED + δ1S + δ2 M + δ3W + e ➝ il caso base è verificato
quando S =M=W=0
Ancora una volta l’effetto delle dummy è sull’intercetta, analizziamola:
β1 + β2 ED Northeast
(β1 + δ1) + β2 ED South
E(W ) =
(β1 + δ2) + β2 ED Midwest
(β1 + δ3) + β2 ED West
Test di Chow ~ test F di equivalenza di due regressioni
Serve per verificare che due campioni condividano la stessa funzione di regressione (lo stesso
modello)
Forma generale: y = β1 + β2 x2 + . . . + βk xk + e ⟺ i = 1,2,...,N
{N − N1 gruppo 2
N1 gruppo 1
Distinguiamo due campioni:
Dire che il modello è il medesimo per i due campioni equivale a dire che i parametri βk sono
uguali nei due modelli
➝ primo modo: stimare separatamente il modello nei due campioni e verificare l’ipotesi nulla
βk1 = βk2 ⟺ H0 : β11 = β12, β21 = β22, . . . , βk1 = βk2
Problema: per costruzione non è possibile eseguire il test F, in quanto non è possibile creare la
COV di due variabili tra di loro non collegati
➝ secondo modo (corretto): utilizzare variabili indicatrici per dividere un campione in due gruppi,
stimare poi la regressione per il modello con il campione integrale e integrando la variabile dummy
{0 gruppo 1
1 gruppo 2
Definiamo D = ⟺ y = β1 + β2 x 2 + . . . + βk xk + δ1D + δ2(Dx 2 ) + . . . + δk (Dxk ) + e
{(β1 + δ1) + (β2 + δ2 )x 2 + . . . + (βk + δk )xk gruppo 2 ∼ D = 1

β1 + β2 x 2 + . . . + βk xk gruppo 1 ∼ D = 0
Analizziamo separatamente E(y) =
Verifichiamo l’ipotesi nulla H0 : δ1 = δ2 = . . . = δk = 0 con un test F

Problema: con questa strategia la varianza degli errori σ è uguale nei due modelli, essendo la
regressione stimano una sola ➝ nel primo modo (quello sbagliato) stimando due regressioni
separatamente la varianza degli errori poteva essere differente
Questo significa che noi assumiamo che le

osservazioni siano diverse in media, ma uguali
in varianza
STATA:
➝ Primo modo:
Con il comando sum + [variabile] + , d posso
individuare la mediana (percentile 50) ed
utilizzarla come carattere discriminatorio per i
due gruppi nel campione. Con il comando reg
calcolo separatamente le regressioni,
imponendo il vincolo con if [carattere
qualitativo]. Attraverso la tabella di regressione
posso osservare alcune informazioni importanti,
ad esempio controllare che la varianza degli
errori σ nelle due regressioni ➝ nel nostro
esempio c’è una grande differenza fra σ 1 ≠ σ 2
. Non posso però vare una verifica di ipotesi

congiunte per il motivo sopraindicato
➝ secondo metodo:
Con il comando gen+
[nome]=[relazione] creo la variabile
indicatrice, inserendo come relazione
0. Con il comando replace+[nome
variabile]=[relazione]+if [carattere
qualitativo] modifico la variabile
indicatrice, inserendo come relazione 1
A questo punto utilizzo gen+

[nome]=[relazione] per creare la
variabile di interazione tra D e income.
Con il comando reg calcolo la
regressione ausiliare contenente le
variabili generate al punto precedente
➝ osservazione K 2 in questa
regressione è uguale a 2K 1
Osservando i test t so già che

separatamente β3, β4 non sono
significativi. Mi serve però una verifica
di ipotesi congiunta (test F )
Non utilizzo il test F calcolato autonomamente perché contiene anche il parametro β2 che a noi
non interessa. Dobbiamo verificare che tutti gli effetti interazione siano nulli ➝ H0 : β3 = 0,β4 = 0
Utilizzo quindi il comando test + [vincolo 1] [vincolo 2] per eseguire un test di Chow di confronto
dei due modelli
Nel nostro esempio il risultato del test è non rifiuto H0 per cui i due gruppi hanno modello
equivalente ➝ tuttavia sono consapevole che questo risultato non è affidabile in quanto il test
impone (per costruzione) equivalenza della varianza degli errori σ , cosa che so non essere valida
(vedi regressioni separate al “primo modo”)
Modello di probabilità lineare

Modelli in cui la variabile dummy è al posto della variabile dipendete y ➝ succede nei casi in cui
{0 se viene scelta un'altra alternativa

1 se viene scelta la prima alternativa
modello deve spiegare una scelta qualitativa ➝ y =
➝ è uno strumento utilizzato in microeconometria ➝ econometria delle scelte individuali
Se p è la probabilità che venga scelta la prima alternativa, allora P(y = 1) = p; la probabilità che
venga scelta la seconda alternativa è P(y = 0) = 1 − p
La funzione di probabilità per la variabile indicatrice binaria y è: f (y) = p y(1 − p)1−y, y = 0,1
➝ la distribuzione di y è chiamata distribuzione di Bernoulli ➝ E(y) = p; Var (y) = p(1 − p)
Per cui la media di y è la probabilità di osservare 1, in un modello di probabilità lineare vogliamo

spiegarla attraverso le x che la compongono
E(y) = p = β1 + β2 x2 + . . . + βk xk + e
➝ la probabilità di osservare 1 è una funzione lineare di x
➝ il modello è estremamente semplice ma è anche impreciso rispetto alla realtà:

1. Ci sono valori di xi per cui la funzione lineare ha risultato negativo oppure > 1
2. Viene a mancare il vincolo che gli effetti marginali siano costanti per qualsiasi xi
3. Per costruzioni gli errori non sono omoschedastici ➝ non vale il teorema di Gauss-Markov
La comodità di questo modello è che noi lo utilizziamo, consapevoli che sia errato, perché è in
grado di fornire in maniera semplice buone stime degli effetti marginali sulla probabilità di scelta p
di variazione nelle variabili esplicative xk a condizione che p non sia troppo vicino a 0 e 1
STATA:
➝ tutto ciò che abbiamo studiato sui modelli lineari fino ad ora vale uguale sul modello di
probabilità lineare, l’unica differenza è che y è in termini di probabilità
➝ in particolare gli effetti marginali posso scriverli anche in percentuale, perché probabilità.
Questo non va confuso con la semielasticità
L’R 2 continua ad essere un indicatore dell’adattamento ai dati, esistono però modi più precisi e
semplici: tasso di successo
Sappiamo che il modello calcola una variabile continua, mentre la variabile dummy è binaria per
{0 se la probabilità <0.5
1 se la probabilità >0.5
costruzione. Utilizziamo una variabile dammi che rispetti il vincolo =

A questo punto faccio un confronto, attraverso una tabella a doppia entrata,
tra le osservazioni y e la previsione ŷ ➝ attraverso un test di successo ne
N00 + N11
calcolo al percentuale TS =
N
STATA:
Con il comando predict + [nome variabile] calcolo le
previsioni di y.̂ Ora genero una nuova variabile con
gen+ [nome variabile] + [relazione] per associare 0
quando ŷ < 0.5 e 1 quando ŷ ≥ 0.5 ➝ come
relazione iniziale metterò 0, con il comando repliche
+ [nome variabile] [sostituzione] + if [relazione]
sostituisco 1 dove la probabilità è ≥ 0.5
Con il comando tab [variabile righe] [variabile

colonne] creo la tabella a doppia entrata, infine con
il comando display + [relazione] calcolo il tasso di
successo
Interpretazione del tasso di successo:

A differenze dell’R 2, il tasso di successo non ha come limite
inferiore 0 ➝ va calcolato per ogni modello
STATA:
Sappiamo che il limite inferiore coincide con il valore per un
modello senza variabili esplicative, costruiamolo
Con il comando reg calcoliamo una regressione che contiene

solo la variabile y, a questo punto ripetiamo la procedura per il
calcolo del tasso di successo
Nel nostro esempio il limite inferiore è 55,26%, per cui il valore

ricavato dal modello completo ( 66,14%) va confrontato con il
limite inferiore ➝ ci dice che il modello da noi scelto non
migliora di molto l’adattamento ai dati
Bisogna fare attenzione a non interpretare male il valore di TS
Spesso viene utilizzato in sostituzione del tasso di successo, il tasso di errore ➝ TE = 1 − TS

In particolare può essere interessante calcolare il tasso di falsi negativi e tasso di falsi positivi
N01 N10
TFP = TFN =
N00 + N01 N10 + N11
➝ solitamente è molto più importante il tasso di falsi negativi ➝ un modo per agire sul tasso di
falsi negativi è modificare il vincolo di confronto

STATA:
Ripetiamo la procedura per il calcolo del tasso di
successo, imponiamo però un vincolo inferiore rispetto a
1
in maniera da diminuire il tasso di falsi negativi
2
Se il nostro intento fosse stato agire sul tasso di falsi
1
positivi avremmo dovuto aumentare il vincolo rispetto
2
➝ attenzione: ogni volta che si agisce a favore del tasso
di falsi negativi, verrà riequilibrato (con effetto negativo) il
tasso di falsi positivi
Omoschedasticità e Eteroschedasticità
Un modello è chiamato omoschedastico se la varianza dei
residui (e di conseguenza degli errori) è costante σ 2➝ in
caso contrario è chiamato eteroschedastico σ 2
Come individuare?
Un modo semplice per individuare l’andamento della
varianza degli errori è utilizzare un grafico scatter, ponendo
sull’asse verticale i residui e su quello orizzontale la
variabile esplicativa ➝ funziona una x alla volta
➝ costruiamo dei test diagnostici di eteroschedasticità

H0 : σ 2 costante
Test dei moltiplicatori di Lagrange / Breusch - Pagan
Il test parte dal presupposto che la varianza degli errori sia

Var (ei ) = σi2 = h(α1 + α2 zi2 + . . . + αs zis) dove h è una funzione di zi
- Non abbiamo bisogno di specificare la funzione h

- Le z possono essere diverse dalle x ➝ a corretta specificazione di queste variabili è
fondamentale per il giusto risultato del test
- Se α2 = α3 = . . . = αs = 0 ⟺ h(α1 + α2 zi2 + . . . + αs zis) = h(α1) = σ 2
Per cui il test verifica congiuntamente le congetture

H0 : α2 = α3 = . . . = αk = 0
H1 : almeno un parametro α è diverso da zero
1. Stimo la regressione ausiliaria e2î = α1 + α2 zi2 + . . . + αs zis + vi ➝ lo scopo è cercare di

capire se la varianza degli errori dipende dalle z
2. Calcolo χ 2 = N * R 2
3. Se H0 è vera R 2 ≈ 0 e χ 2 ≈ 0 ; Se H0 non è vera R 2 e χ 2 sono valori elevati

STATA:
Dopo aver stimato il modello econometrico, apro il menu
statistics e clicco sulla penultima voce postestimation
➝ si apre una finestra, clicco su specification, diagnostic, and

goodness-of-fit analysis
seleziono tests for heteroskedasticity e clicco su launch
➝ a questo punto bisogna specificare le variabili

z che agiscono sulla varianza degli errori
➝ posso scegliere arbitrariamente qualsiasi
variabili esplicativa ➝ mai quella dipendente
Il risultato di questa procedura è il test di

Breusch-Pagan
Il medesimo risultato si svolge utilizzando

il comando estat hettest [variabili z ]
I gradi di libertà del test dipendono dal

numero di variabili z che utilizziamo per
spiegare la varianza degli errori
Una volta eseguito il test utilizzo il pvalue

calcolato per fare un confronto con i livelli
di significatività α
➝ nel nostro esempio pvalue = 0.0067 < ∀α ➝ rifiuto l’ipotesi nulla di omoschedasticità ➝ il
modello è eteroschedastico
Problema: la specificazione delle variabili z da utilizzare è il vincolo più grande di questo test ➝ al
cambiare delle variabili il test cambia risultato, e un’errata specificazione delle variabili z porta ad
un’errata interpretazione del risultato
Caratteristiche del test

1. È asintotico – la distribuzione vale per N elevato
2. È valido per ogni h – purché regolare
➝ Varianti del test di Breusch e Pagan

Test di White: si utilizzano come variabili z : x, x 2, prodotti incrociati
Per cui in un modello y = β1 + β2 x 2 + β3 x3 + e utilizziamo come variabili
z2 = x2; z3 = x3; z 4 = x22; z5 = x32 + z6 = x2 x3 ➝ attenzione alle collinearità: va eliminata una
variabile tra quelle che creano collinearità
Test di Koenker: si utilizzano come variabili z : ŷ = b1 + b2 xx + . . . + bk xk

➝ utilizzo i valori previsti non osservati
STATA:
WHITE: Dopo aver stimato il modello econometrico, apro il menu statistics e clicco sulla penultima
voce postestimation
➝ si apre una finestra, clicco su specification, diagnostic, and goodness-of-fit analysis

seleziono information matrix test e clicco su launch
Clicco su utilizza il test originale di White e invio il test
➝ non devo scegliere io le variabili z in quanto il test le

genera in automatico seguendo il criterio di White
Il risultato di questa procedura è il test di Breusch-Pagan

nella variante White
Il medesimo risultato si svolge utilizzando il comando

estat imtest , white
Anche questo test è asintotico ed è valido per campioni

grandi
KOENKER: Dopo aver stimato il modello econometrico, apro il menu statistics e clicco sulla
penultima voce postestimation ➝ si apre una finestra, clicco su specification, diagnostic, and
goodness-of-fit analysis ➝ seleziono tests for heteroskedasticity e clicco su launch
➝ anziché specificare le
variabili x seleziono utilizza valori previsti
Il risultato di questa procedura è il test di Breusch-Pagan nella variante di Koenker
Il medesimo risultato si svolge utilizzando il comando estat hettest

STATA:
VARIABILE DUMMY: Dopo aver stimato il modello econometrico, apro il menu statistics e clicco
sulla penultima voce postestimation
➝ si apre una finestra, clicco su specification, diagnostic, and goodness-of-fit analysis

seleziono tests for heteroskedasticity e clicco su launch
Clicco su utilizza le seguenti variabili e inserisco la variabile dummy bianaria che separa il
campione in due gruppi, invio il test cliccando su ok
Il risultato di questa procedura è il test di Breusch-Pagan utilizzando la variabile dummy
Il pvalue lo confronto con i livelli di significatività α : (10,5,1) %
Il medesimo risultato si svolge utilizzando il comando estat hettest [variabile dummy]
Test di Goldfeld-Quandt
Approccio simile al test di Chow, ma utilizzando la varianza ➝ il confronto avviene sempre con
una regressione ausiliaria
A differenza del test di Breusch-Pagan, questo test indivia un risultato esatto e non asintotico per
campioni molto grandi
➝ questo test funzione bene anche per campioni piccoli
Per cui il test verifica che:

H0 : Var (ei ) = σ 2
H1 : Var (ei ) ≠ σ 2 → dipende dal gruppo osservato, utilizziamo ancora una volta una variabile
dummy binaria per dividere il campione di osservazione
Il test stima separatamente due regressioni (una per gruppo di campione), viene stimata la
varianza separatamente nelle due regressioni e applico un test F per verificare la congettura che
σ12 = σ22 → cioè σ 2 costante
σ12
Il valore della statistica F = ➝ il risultato è indipendentemente da quale gruppo metto al
σ22
dominatore e quale al denominatore ➝ la particolarità di questo test F è
che ha due regioni di rifiuto, una per lato ➝ questo fa si che sia
indifferente quale gruppo è messo al denominatore e quale al
numeratore, H0 verrà rifiutato per tutti i valori di pvalue lontani da 1
Il test F avrà come gradi di libertà quelli del numeratore e del

denominatore F(N1 − K, N2 − K )

STATA:
Con il comando reg+[variabili di regressione]+if
[relazione] calcoliamo le due regressioni,
separandole utilizzando la variabile dummy ≥1
e <1
A questo punto memorizziamo la varianza

degli errori nei due modelli, utilizzando il
comando dis +[relazione] calcoliamo la
σ12
statistica test F = , scegliendo noi quale
σ22
gruppo mettere al numeratore e quale al
denominatore. A questo punto, poiché il
calcolo del pvalue a due code in una
distribuzione non simmetrica come questa è
molto complesso, procediamo con il calcolo
del valore critico (il valore oltre al quale il test
rifiuta l’ipotesi nulla in favore di quella
alternativa)
Guardando anche il grafico della distribuzione

F per questo test, se il risultato della statistica
test è ≥ 1, andrò a calcolare il valore critico
per la coda destra con il comando dis +
invFtail([gradi libertà numeratore] [gradi libertà
α
denominatore] [probabilità ] , se il risultato
2
della statistica test è < 1, andrò a calcolare il
valore critico per la coda sinistra con il
comando dis + invF([gradi libertà
α
denominatore] [gradi libertà numeratore] [probabilità ]
2
Infine, confrontando il valore critico ed il valore calcolato della statistica test, decido se rifiutare o
non rifiutare l’ipotesi nulla H0 di omoschedasticità
Quali sono le conseguenze sullo stimatore dei minimi quadrati dell’eteroschedasticità

• Lo stimatore dei minimi quadrati rimane lineare e corretto, ma non è più il più efficiente
(BLUE), cioè non è più quello con variano minima
• Gli standard error non sono più validi, in quanto per costruzione si basano sull’ipotesi di
omoschedasticità ➝ di conseguenza nemmeno le statistiche t sono corrette
• Il test F, l’intervallo di confidenza e tutti gli altri elementi che abbiamo analizzato fino non sono
più validi ➝ tutto ciò che dipende dallo standard error non è più valido
Individuiamo un altro stimatore efficiente

Stimatore dei minimi quadrati generalizzati
Si tratta di una forma generalizzata della formula utilizzata fino ad ora ➝ non va utilizzato perché
è interessante ma richiede si assumere σi2 noti ➝ cosa mia vera, per cui non è applicabile nella
realtà
In alternativa si può utilizzare il valore σ ̂ 2i (le stime degli errori), per cui lo stimatore efficiente
diventa lo stimatore dei minimi quadrati generalizzati calcolabile: efficiente per N →∞
➝ nel pratico non viene quasi mai utilizzato perché necessita di calcolare ogni σ ̂ 2i singolarmente e
se si vuole uno stimatore efficiente (di conseguenza un campione grande) è molto laborioso e
poco preciso
Soluzione ➝ Standard Error Robusti (HC)
Valgono anche se gli errori sono eteroschedastici ➝ valgono sempre
Sono elementi asintotici, per cui valgono per campioni molto grandi N →∞
STATA:
Con il comando reg+[variabili di regressione] ,
robust
Notiamo che manca la tabella di studio delle
varianza, perché questa riporta un unico
valore di varianza (omeschedasticità )
Facendo un confronto con i risultati della

regressione senza il comando aggiuntivo
robust, notiamo che i coefficienti rimangono
invariati così come l’R 2, al contrario gli
standard error variano (generalmente il valore
aumenta, nel nostro esempio è successo il contrario) e questo ha effetto sulla statistica t , il pvalue
e il test F
Per cui per campioni che presentano errori eteroschedastici basterà utilizzare gli standard error
robusti, integrandoli in tutto ciò che abbiamo studiato fino ad ora (verifica di ipotesi), in STATA
basterà completare il comando con robust
Analizziamo un’altra violazione di una ipotesi di Gauss-Markov: E(e) = 0 ⟺ E(bk ) = βk

Questa ipotesi è quella che garantisce la correttezza dello stimatore dei minimi quadrati ➝ è una
proprietà molto importante
Per prima affrontiamo l’ipotesi per cui le X del modello non sono stocastiche, ovvero che
cambiano in campioni ripetuti
➝ per lo studio del modello di regressione questa ipotesi non ha alcun effetto, cioè tutto rimane
uguale sia che le x siano costanti che variabili
Modifichiamo le ipotesi della regressione semplice:

1. y = β1 + β2 x + e descrive in maniera corretta la relazione tra y e x nella popolazione
2. Le coppie (yi, xi )i=1,...,N sono ottenute mediante un campionamento casuale ➝ le
osservazioni sono estratte dalla stessa popolazione in modo che ogni coppia si indipendente
da tutte le altre ➝ IID : Indipendenti e Identicamente Distribuite
3. E(e | x) = 0 il valore atteso del termine di errore condizionato al valore di x è nullo
4. x assume almeno due valori diversi nel campo
5. Var (e | x) = σ 2 la varianza del termine di errore condizionato al valore di x è costante e
uguale a σ 2
6. e | x ∼ N (0,σ 2) {non necessario} il termine di errore ha distribuzione normale
Ancora una volta l’ipotesi cruciale è la terza: il valore atteso del termine di errore condizionato al
valore di x è nullo ➝ è necessari condizionare in quanto la x non è più costante
Implica che:
- Non sono state omesse variabili (correlate con quelle incluse)
- La forma funzionale del modello è corretta
- Il termine di errore e non è correlato con x
Senza queste ipotesi lo stimatore non è corretto, tanto meno efficiente
Sotto queste ipotesi vale tutto ciò che abbiamo studiato fino ad ora (verifiche d’ipotesi)
Proprietà per campioni finiti N < ∞ sono basate su ipotesi più resistenti rispetto alle proprietà
asintotiche N → ∞
➝ proprietà asintotiche per variabili endogene

• Lo stimatore non è corretto, ma consistente ➝ converge verso β per N → ∞
uno stimatore corretto è anche consistente, ma non viceversa
• Lo stimatore è asintoticamente normale ➝ ha distribuzione normale per N → ∞
Per E(e | x) = 0 si dimostra che le x ed e sono anche incorrelate → Cov(x, e) = 0

Le variabili che rispettano questa ipotesi sono variabili esogene: determinate fuori dal sistema
Per Cov(x, e) ≠ 0 si dimostra che le x ed e sono anche correlate → E(e | x) ≠ 0

Le variabili che rispettano questa ipotesi sono variabili endogene: determinate dentro al sistema
➝ le x sono endogene solo per variabili casuali
➝ per x endogene i Minimi Quadrati non possono più essere utilizzati
Effetto sullo stimatore dei minimi quadrati

Quando la x è endogena, per cui una situazione in cui
x ed e sono correlati ➝ il grafico della funzione
economica è in grassetto, il grafico della funzione
prevista è tratteggiata, vediamo che questa passa al
centro della nuvola di punti (le osservazioni)
Osserviamo che la pendenza è sovrastimata nella

regressione prevista
Questo accade perché lo stimatore dei minimi

quadrati attribuisce la variazione di y alla variazione di
x, ma se la x è endogena (interna al sistema) la
variazione è influenzata anche dalla e ➝ l’effetto di e
viene sommato all’effetto di x e quindi è
sovrastimato
Casi in cui si hanno variabili endogene:

Errore di Misura: la variabile esplicativa è misurata (osservata) con errore ➝ la situazione tipica
è l’utilizzo di una variabile approssimativa (variabile proxy) che individua un effetto, ma che non è
quella realmente coinvolta nell’effetto
Per cui io voglio stimare y = β1 + β2 x + e, ma non riuscendo a stimare x utilizzo x* = x − u per

lo stesso scopo ➝ finirò per stimare y = β1 + β2 x*+e → y = β1 + β2(x − u)+e
Il modello diventa per cui y = β1 + β2 x + e−β2u → y = β1 + β2 x+e
Per costruzione la x è endogena ed è correlata con il termine di errore e (data dalla quota β2u )
➝ questo porta lo stimatore dei minimi quadrati a non essere ne consistente ne corretto
Le l’errore di misura fosse sulla variabile dipendente y non ci sarebbe nessun problema di
specificazione
L’errore di misura nella variabile esplicativa x è molto frequente
Distorsione da equazione simultanee: situazione in cui le variabili del modello sono

determinate in maniera endogena ma attraverso un sistema di equazioni in due incognite
{Q s
Qd = β1 + β2 P + u d
s
→ Q d = Q s ⟺ β1 + β2 P + u d = γ1 + γ2 P + u s
γ1 + γ2 P + u domanda of ferta
1
Per cui →P= (γ1 − β1 + u s − u d )
β1 − γ1
La conseguenza di questa relazione è che le quantità e i prezzi osservati sono determinati
simultaneamente dalla funzione di equilibrio ➝ la variabile x è endogena per costruzione ed è
correlato al termine di errore e
Variabili omesse: nel caso in cui la variabile omessa è correlata con un’esplicativa inclusa nel
modello, l’errore di regressione sarà correlato con la variabile esplicativa rendendola endogena
Per cui se analizziamo un modello di reddito, dipendente da variabili come il sesso, l’educazione e
la residenza, possiamo dire per certo che esistono variabili omesse che identificano altri elementi
che hanno effetto sul reddito ➝ abilità (es nel lavoro e nello studio), questa caratteristica oltre ad
avere effetto sul salario avrà effetto anche sull’educazione (più anni di studio) e per cui sarà
correlata con il termine di errore del modello
Per cui nell’esempio la variabile dell’istruzione è endogeno e per cui l’effetto è sovrastimato
Stimatori alternativi da utilizzare in queste situazioni

➝ metodo dei momenti: modalità alternativa per ricavare stime consistenti quando le x nel modelli
sono endogene e correlate con il termine di errore e
Il kesimo momento di una variabile casuale X è il valore atteso (media) della variabile casuale
elevata alla kesima potenza → E(X k ) = μk = kesimo momento di X ➝ questa è la relazione che
vale sulla popolazione (infinito)
Nel campione utilizziamo il corrispondente momento campionario (basato su N osservazioni)

N
∑i=1 xik
→ E(X̂ k ) = μk̂ = kesimo momento campionario di X =
N
Il metodo consiste nel uguagliare il momento campionario (variabile calcolabile) con il momento
nella popolazione (costante ignota) per stimare i parametri ignoti
Caratteristiche:
• Sempre consistente (non sempre corretto) ➝ stima asintotica
• Non sempre il migliore o il più preciso (efficienza)
È possibile dimostrare attraverso dei calcoli che il metodo dei momenti per Cov(x, e) = 0 è un
caso particolare dello stimatore dei minimi quadrati ➝ variabili esogene
Per variabili endogene: Cov(x, e) ≠ 0 si utilizza lo stimatore In str um ental Var ia ble
Va quindi considerata un’altra variabile z tale che:
1. z non ha effetto diretto su y ➝ non è una variabile esplicativa di y
2. Cov(z, e) = 0 ➝ z è esogena
3. z è molto correlata con xendogena
➝ z è chiamata variabile strumentale o strumento ➝ serve per raggiungere il nostro obbiettivo,
ovvero avere stime consistenti per un modello con variabili x endogene

Utilizzando il metodo dei momenti con la variabile strumentale calcoliamo le stime di β1 e β2
1
N
∑ (yi − β1̂ − β2̂ xi ) = 0
1
N
∑ zi(yi − β1̂ − β2̂ xi ) = 0
Risolvendo il sistema si ricavano gli stimatori delle variabili strumentali

∑ (zi − z̄ )(yi − ȳ)
β2̂ =
∑ (zi − z̄ )(xi − x̄)
β1̂ = ȳ − β2̂ x̄
Questi stimatori sono differenti rispetto agli stimatori dei minimi quadrati studiati fino ad ora, e
sono validi per modelli aventi x endogene
Proprietà:
1. Se z è esogena, lo stimatore strumentale è consistente, ma non è necessariamente corretto
ne efficiente
2. Gli stimatori delle variabili strumentali hanno distribuzione asintotica normale N
σ2
nel modello di regressione semplice β2̂ ∼ N [β2, ]
rz2x ∑ (xi − x̄)2
3. La varianza dell’errore può essere approssimata usando lo stimatore
∑ (yi − β1̂ − β2̂ xi )2
σ ̂ 2VS =
N−2
1 σ2 Var (b2)
Sapendo che la varianza dello stimatore è Var ( β2̂ ) = =
rz2x ∑ (xi − x̄)2 rz2x
Dato che rz2x < 1, possiamo dare per certo che lo stimatore strumentale è sempre meno preciso
dello stimatore dei minimi quadrati, ma è anche l’unico valido per variabili endogene quindi va
utilizzato comunque ➝ in particolare però rimane valido il teorema di Gauss-Markov dello
stimatore BLUE
Strumenti deboli e forti

Lo strumento è detto debole quando rz2x è basso, forte in caso contrario
➝ questo agisce sulla varianza dello stimatore, che sarà molto grande anche se è consistente
rz2x è un indice della correlazione tra z e x
➝ per cui, quando non necessario, lo stimatore strumentale non va utilizzato, perché produce
stime con intervallo di confidenza molto ampio rispetto a ciò che si ottiene con lo stimatore dei
minimi quadrati (anche in grandi campioni)
In un modello di regressione multipla ~ una sola variabile endogena

Per una variabile x endogena, lo stimatore strumentale si ricava in due passaggi
1. Regressione di primo stadio: si stima una regressione ausiliare la cui variabile dipendente è la
variabile endogena, mentre le variabili esplicative sono le variabili esogene e gli strumenti
xk = γ1 + γ2 x2 + . . . + γk−1 + θ1z1 + . . . + θl zl + vk
A partire da questa si calcolano i valori previsti xk̂ ➝ sarà una variabile esogena, combinazione
lineare di tutte le variabili esogene e degli strumenti a disposizione
In questa prima fase viene estratta la parte esogena della variabile endogena
2. Regressione di secondo grado: si stima la regressione del modello originale, sostituendo xk̂
alla variabile endogena xk

Viene anche chiamata stimatore dei minimi quadrati a due stati
STATA:
Si parte da un modello, dove si ipotizza la presenza di variabili endogene attraverso considerazioni
teoriche oppure evidenze empiriche. Nell’esempio del salario, sappiamo che sono state omesse
variabili che potrebbero avere correlazione con variabili presenti nel modello, inoltre il coefficiente
per l’educazione ha un valore troppo elevato
A questo punto la parte più difficile è individuare strumenti (variabili esogene) che rispettino i tre
punti fondamentali:
1. z non ha effetto diretto su y ➝ non è una variabile esplicativa di y
2. Cov(z, e) = 0 ➝ z è esogena
3. z è molto correlata con x
Nel nostro modello proviamo utilizzando il livello di istruzione della madre
Per creare la stima strumentale apro il

menu statistics e clicco sulla seconda
voce Linear models and related
➝ si apre una tendina, clicco su

Endogenous covariates, seleziono la
prima voce Linear regression
Aperta la finestra bisogna

compilarla, inserendo prima la
variabile dipendente del modello y,
poi tutte quelle esplicative
esogene x, nella parte sottostante
la esplicativa endogena xk (una
sola) e infine gli strumenti z
Nella parte sottostante è già

reimpostata la stima a due stati
(per modelli di regressione
multipla)
In alto è possibile scegliere, per

modelli eteroschedastici, la
creazione di standard error robusti
Possiamo aggiungere anche più di

uno strumento nel box
È anche possibile utilizzare

direttamente il comando ivregress
2sls +[variabile dipendente]+
[variabili esplicative esogene]
( [variabile endogena] = [strumenti])
Ma è ovviamene più complessa

Analizzando il risultato di questa stima strumentale, confrontandolo con la stima dei minimi
quadrati, possiamo notare innanzitutto che tra i coefficienti non appare quello dello strumento,
essendo appunto z (per costruzione) una variabile non esplicativa del modello.
Proseguendo evidenziamo che tutti i coefficienti sono cambiati, oltre ovviamente a quello della
variabile endogena ➝ questo ci dice che, se una variabile è endogena, lo stimatore dei minimi
quadrati non è consistente per nessun parametro
Proseguendo con l’analisi, notiamo che lo standard error per i coefficienti (sopratutto da notare la
variabile endogena) cambia, nel caso particolare è aumentato a tal punto da non rendere più
significativo il parametro ➝ ricordiamo che il metodo è consistente, ma non è efficiente (varianza
bassa). A confermare ciò anche l’R 2 è cambiato, diminuendo.
Ricordiamo però che le stime sono consistenti solo se gli strumenti sono validi
Test diagnostici: misura della qualità degli strumenti
➝ il primo test è verificare la correlazione tra gli strumenti e la variabile endogena: strumenti forti o
deboli?
Si analizzano i risultati della regressione di primo grado (quella che scinde la parte esogena da
quella endogena nella variabile endogena)
xk = γ1 + γ2 x2 + . . . + γk−1 + θ1z1 + . . . + θl zl + vk
almeno uno strumento z deve essere significativo
Si verifica allora:
H0 : Cov(xk , zl ) = 0 ⟺ H0 : θ1 = 0,...,θl = 0 ➝ gli strumenti non sono correlati con xendogena
H1 : Cov(xk , zl ) ≠ 0
Perché gli strumenti siano utili, l’ipotesi nulla va rifiutata
Per eseguire questo test ci basterà un test F che abbia come regressione ausiliaria quella di
primo grado e come ipotesi nulla la significatività degli strumenti
STATA:
Si parte utilizzando il comando reg per
stimare la regressione ausiliaria di primo
grado (utilizzo il comando if perché il mio
campione ha valori di wage nulli) .
Utilizzo ora un test F per verificare
congiuntamente che i coefficienti degli
strumenti siano uguali a zero, attraverso il
comando test + [variabili strumentali] . Il
risultato del test lo confronto con il livello
di significatività α(10,5,1) prescelto.
In particolare, uno strumento è detto forte se la statistica test F > 10 , questo valore è frutto di
studi empirici e quindi non è dimostrabile
Se lo strumento non è ABBASTANZA forte il risultato non è buono e potrebbe essere peggio dello
stimare con i minimi quadrati
STATA:
Un ulteriore metodo per eseguire il test di
significatività degli strumenti è:
1. Utilizzare la procedura di stima a due stati
vista in precedenza
2. Utilizzare il comando estat firststage
Il risultato dei due test deve essere il

medesimo
Dalla tabella superiore leggo il valore della

statistica test F > 10 e del pvalue
È più conveniente utilizzare il test automatico

perché evita errori di distrazione o di
imposizione della regressione ausiliare
In un modello di regressione multipla ~ multiple variabili endogene

Per variabili x endogene, lo stimatore strumentale si ricava in due passaggi
È importante notare che il numero di strumenti deve essere almeno pari al numero di variabili
endogene
Il modello è:
- Sotto-identificato: se il numero di strumenti è inferiore al numero di variabili endogene
in questo caso lo stimatore non è utilizzabile, non esiste ➝ questo per via della formula alla
base del calcolo dei momenti ➝ stata segnala autonomamente il problema se il numero di
strumenti è inferiore al numero di endogene
- Esattamente identificato: se il numero di strumenti è uguale al numero di variabili endogene
- Sovra-identificato: se il numero di strumenti è superiore al numero di variabili endogene
y = γ1 + γ2 xeso1 + γ3 xeso2 + γ4 xendo1 + γ5 xendo2 + e ➝ 2 endogene, almeno 2 strumenti
1. Regressione di primo stadio: si stima una regressione ausiliare per ogni variabile endogena,
per ognuna la variabile dipendente è la variabile endogena, mentre le variabili esplicative sono
le variabili esogene e gli strumenti
xendo1 = γ1 + γ2 xeso1 + γ3 xeso2 + θ1z1 + θ2 z2 + v
xendo2 = γ1 + γ2 xeso1 + γ3 xeso2 + θ1z1 + θ2 z2 + v
̂
A partire da queste si calcolano i valori previsti xendo1 ̂
e xendo2 ➝ saranno una variabili
esogene, combinazione lineare di tutte le variabili esogene e degli strumenti a disposizione
2. Regressione di secondo grado: si stima la regressione del modello originale, sostituendo

̂
xendo1 ̂
e xendo2 alle variabili endogene xendo1 e xendo2
̂
y = γ1 + γ2 xeso1 + γ3 xeso2 + γ4 xendo1 ̂
+ γ5 xendo2 +e
STATA:
Si utilizza il medesimo metodo visto per
modelli aventi una sola variabile endogena
Ancora una volta tutti gli standard error

possono essere resi robusti con l’aggiunta al
comando di , robust
Verificare la qualità degli strumenti: nel

modello con più variabili endogene è più
complicato
Se su tre strumenti solo uno fosse correlato
con le 3 variabili endogene, il test F non ci
identificale quale di questi sia, ma ci comunica
solo che su tre strumenti ALMENO uno è significativo
➝ per cui con il test F non mi accorgo se tutti gli strumenti sono validi o se è valido solo uno di essi
e gli altri sono incorrelati
Inoltre nella stima strumentale l’indice R 2 non indica più la percentuale di variabilità spiegata.
La presenza di variabili endogene nel modello crea effetti di retroazione che portano l’R 2 ad avere
anche valori negativi e cessa il legame dell’indice con la variabilità di y spiegata
Test di specificazione degli strumenti

Usiamo due test: uno per individuare se x è endogena, uno per individuare se z è esogeno
Verificare se la x è endogena ➝ Test di Hausman

Si verifica l’ipotesi
H0 : Cov(x, e) = 0
H1 : Cov(x, e) ≠ 0
L’idea è confrontare il risultato dello stimatore dei minimi quadrati ed il risultato dello stimatore
strumentale
Per H0 è vera, sia b che β ̂ sono consistenti ➝ in grandi campioni, la loro differenza converge a
zero ➝ b − β ̂ ≃ 0 ➝ in questo caso va preferito lo stimatore dei MQ in quanto più efficiente
Per H0 non è vera, b non è consistente mentre β ̂ è consistenti ➝ in grandi campioni, la loro
differenza non converge a zero ➝ b − β ̂ = c ≠ 0 ➝ in questo caso va utilizzato lo stimatore
strumentale perché è consistente
Esistono più versioni di questo test, la più facile è composta da due passaggi:
1. Stimare il modello ausiliario di primo grado con il minimi quadrati, calcolare i residui
2. Aggiungere i residui alla regressione originaria e applicare i minimi quadrati
3. Utilizzare un test F congiunto per la verifica di ipotesi

STATA:
Una volta stimata la regressione con il comando apposito, si utilizza il comando estat endog per
eseguire il test di endogenità
Il problema di questo test è che funziona solo gli strumenti adottati sono effettivamente esogeni,
altrimenti il risultato può essere falsato come in questo caso
In sostanza il test di endogenità di Hausman è da prendere con le “pinze”
Verificare se la z è esogena ➝ Test di Validità degli strumenti

Il test è applicabile solo per modelli sovra-identificati ➝ più strumenti che variabili endogene
Il caso contrario l’ipotesi nulla coincide con l’ipotesi alla base della stima strumentale, quindi la
verifica non sarebbe applicabile
Si verifica l’ipotesi
H0 : Cov(z, e) = 0
H1 : Cov(z, e) ≠ 0
1. Stima strumentale usando x esogene e z
2. Calcolare e ̂
3. Stimare con i minimi quadrati la regressione ausiliaria di e ̂ su tutte le z
e ̂ = δ1 + δ2 z1 + . . . + δl zl + v
4. Statistica test: NR 2. Se H0 è vera, NR 2 ∼ χ(L−B)
2
se N è elevato
5. Si rifiuta per valori elevati (e ̂ è correlato con le z) ➝ gli strumenti sono buoni se non si rifiuta H0
STATA:
Una volta stimata la regressione con il comando apposito, si utilizza il comando estat overid per
eseguire il test di validità degli strumenti
Anche questo test si basa sull’ipotesi che gli strumenti siano validi
I test di specificazione degli strumenti sono da utilizzare solo a supporto di valide ipotesi
economiche ed evidenze teoriche per gli strumenti

Modelli Econometrici Scheda

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Modelli Econometrici Scheda

Caricato da

Copyright:

Formati disponibili

Introduzione: Econometria è la misurazione di grandezze economiche, significa usare dati

economici per stimare relazioni, verificare ipotesi e prevedere esiti economici

➝ queste funzioni rappresentano il modello economico, attraverso il modello econometrico si

Per raggiungere il nostro risultato ci avvaliamo di p a r a m t r i che identifichino l’eﬀetto marginale,

Q d = f (P, P s, P c, R EDD) = β1 + β2 P + β3P s + β4 P c + β5 R EDD + e

L’inferenza statistica sul mondo reale produce:

Generazione dei dati

Classificazione dei dati

Modelli Econometrici Pagina 1 di 52

Serie storica Il medesimo carattere è osservato ad intervalli

Cross-section Raccolta di osservazioni da unità campionarie

Panel / dati longitudinali Raccolta di osservazioni da unità campionarie

Se le osservazioni temporali sono dello stesso

Per la variabile casuale continua yfood−exp ha una sua funzione di

La media condizionale (valore atteso ≠ media aritmetica) di y è

➝ se i parametri varianza e media fossero noti fornirebbero informazioni importanti sulla

Partiamo dal modello economico per giungere al modello econometrico

Nel modello economico, β1, β2 sono quantità caratterizzanti del

Nel nostro studio, questi saranno gli elementi che andremo a

Estraendo campioni casuali dalla popolazione, sappiamo che le

Per completare il modello econometrico è necessario considerare

Il modello di regressione lineare semplice diventa y = β1 + β2 x + e

Utilizziamo il modello econometrico per stimare i parametri β1, β2 ➝

- Gli stimatori sono formule generali e dunque variabili casuali

Ci avvaleremo del principio dei minimi quadrati per stimare b1, b2 ➝

Partiamo dunque da due rette, passanti per la dispersione

Modelli Econometrici Pagina 3 di 52

Applicando il principio dei minimi quadrati sappiamo che la

Alla voce income equivale la stima del

È possibile richiedere a stata anche la rappresentazione grafica del campione

Per un grafico istogramma basta inserire il comando hist+[variabile], il quale risultato è

Mandando il comando verrà creato il grafico a dispersione

Modelli Econometrici Pagina 4 di 52

household food expenditure per week Fitted values

Altri comandi utili per lavorare con stata sono:

sum Genera una tabella che riporta i

gen+[nome variabile]+=+ Genera una nuova variabile che

Modelli Econometrici Pagina 5 di 52

Residui: approssimazione degli errori, calcolabili a diﬀerenza degli errori e ̂ = y − b1 − b2 x ➝ e ≠ e ̂

Previsione del valore medio: ŷ = b1 + b2 x ➝ rappresenta la stima della media di y

Elasticità: caratterizza la reattività di una variabile rispetto un’altra ➝ concettualmente ha lo

Ulteriore informazione sulla tabella dei valori della regressione:

Ulteriori comandi di Stata

_s[variabile] Prende il valore contenuto nell’ultima

If+[variabile]+ Restringe il campione utilizzato imponendo != diverso > maggiore

In+[N1][N2] Restringe il campione utilizzato imponendo di

Proprietà degli stimatori

In caso contrario lo stimatore è definito distorto E(b2 ) ≠ β2

Modelli Econometrici Pagina 7 di 52

Per il modello di regressione lineare, anche lo stimatore b1 è corretto ➝ E(b1) = β1

Prese due stime di varianza, dal punto di vista di

➝ la varianza è anche chiamata precisione campionaria

Analizziamo la crescita dei fattori che influenzano la varianza e covarianza:

Modelli Econometrici Pagina 8 di 52

Teorema di Gauss-Markov ➝ Best Linear Unbiased Estimator (BLUE)

Distribuzione di probabilità degli stimatori ➝ proprietà

Data questa proprietà, numerose curve la possono rappresentare

Se è valida l’ipotesi che gli errori e abbiamo distribuzione normale

Teorema del limite centrale: se la numerosità campionaria N è suﬃcientemente grande, gli

Stima della varianza del termine di errore

➝ gradi di libertà: la diﬀerenza tra la numerosità N e i numero di parametri di regressione (nel

Modelli Econometrici Pagina 9 di 52

Modelli non lineari ➝ modello quadratico e modello log-lineare