Cap 07 5ed

Verifica del modello
con
regressori multipli
Capitolo 7
Introduzione all’econometria
J.H. Stock, M.W. Watson
Verifica di ipotesi su singolo coefficiente
• Avviene come nel caso del modello semplice: 𝐻0 : 𝛽ℎ = 0
• L’ipotesi alternativa 𝐻1 può essere:

– bilaterale/a due code: 𝐻1 : 𝛽ℎ ≠ 0
– unilaterale/coda destra: 𝐻1 : 𝛽ℎ > 0
– unilaterale/coda sinistra: 𝐻1 : 𝛽ℎ < 0
• Nessuna ipotesi viene fatta relativamente agli altri coefficienti
• Il test viene condotto calcolando il p-value
• La soglia 𝛼 corrisponde al rischio di rifiutare 𝐻0 pur essendo 𝐻0 vera

(rischio di prima specie)
2
Esempio: aggiungiamo la spesa per studente
OLS_2bis: OLS, usando le osservazioni 1-420
Variabile dipendente: testscr
Errori standard robusti rispetto all'eteroschedasticità, variante HC1
Coefficiente Errore Std. rapporto t p-value

const 649,578 15,4583 42,02 <0,0001 ***
str −0,286399 0,482073 −0,5941 0,5528
el_pct −0,656023 0,0317844 −20,64 <0,0001 ***
expn_stu 0,00386790 0,00158072 2,447 0,0148 **
Media var. dipendente 654,1565 SQM var. dipendente 19,05335

Somma quadr. residui 85699,71 E.S. della regressione 14,35301
R-quadro 0,436592 R-quadro corretto 0,432529
F(3, 416) 147,2037 P-value(F) 5,20e-65
Log-verosimiglianza −1712,808 Criterio di Akaike 3433,615
Criterio di Schwarz 3449,776 Hannan-Quinn 3440,003
• Se un regressore non è significativo, andrebbe escluso dal modello e il

modello andrebbe ristimato;
• I software di regola forniscono il p-value per 𝐻1 : 𝛽ℎ ≠ 0
3
Verifica di ipotesi congiunta su 2 o più coefficienti
• Spesso si ipotizza l’uguaglianza a zero (non significatività) di due o più

coefficienti: 𝐻0 : 𝛽ℎ1 = 𝛽ℎ2 = ⋯ 𝛽ℎ𝑞 = 0
• L’ipotesi alternativa è che almeno 1 di questi coefficienti non sia pari a

zero
• Fare congiuntamente q test unilaterali ognuno con soglia 𝛼 comporta un

rischio complessivo di prima specie superiore ad 𝛼
• E’ possibile effettuare la verifica ricorrendo ad un test F
4
Test F (spesso detto test di Wald)
• 𝐻0 : 𝛽1 = 𝛽2 = ⋯ 𝛽𝑞 = 0
• Si calcola una statistica 𝐹 la cui formula varia a seconda che gli errori
siano omoschedastici o eteroschedastici
• Noi non tratteremo le formule in nessun caso (tanto il calcolo lo fa il
software!!!)
• 𝐹 misura la distanza tra i valori stimati ed ipotizzati dei 𝛽𝑗
• Nel caso di errori omoschedastici il test viene detto ‘‘classico’’
• Il test classico può essere effettuato anche con campioni non numerosi se
gli errori oltre che omoschedastici sono assunti normali
• Il test F “robusto” (con errori eteroschedastici) richiede invece che il
campione sia ampio!
5
Test F
La statistica 𝐹 ha una distribuzione di 𝐹𝑖𝑠ℎ𝑒𝑟 − 𝑆𝑛𝑒𝑑𝑒𝑐𝑜𝑟:
• Si respinge 𝐻0 per valori alti di 𝐹 𝑎𝑐𝑡 , ovvero per valori del p-value piccoli
• Di default viene fornito il test:

𝐻0 : 𝛽1 = 𝛽2 = ⋯ 𝛽𝑘 = 0
6
Esempio: aggiungiamo la spesa per studente
OLS_2bis: OLS, usando le osservazioni 1-420
Errori standard robusti rispetto all'eteroschedasticità, variante HC1
Coefficiente Errore Std. rapporto t p-value

const 649,578 15,4583 42,02 <0,0001 ***
str −0,286399 0,482073 −0,5941 0,5528
el_pct −0,656023 0,0317844 −20,64 <0,0001 ***
expn_stu 0,00386790 0,00158072 2,447 0,0148 **
Media var. dipendente 654,1565 SQM var. dipendente 19,05335

Somma quadr. residui 85699,71 E.S. della regressione 14,35301
R-quadro 0,436592 R-quadro corretto 0,432529
F(3, 416) 147,2037 P-value(F) 5,20e-65
Log-verosimiglianza −1712,808 Criterio di Akaike 3433,615
Criterio di Schwarz 3449,776 Hannan-Quinn 3440,003
7
Una deroga possibile all’Assunzione 1
• l’Assunzione 1: 𝐸 𝑢𝑖 |𝑋1𝑖 , … , 𝑋𝑘𝑖 = 0 è necessaria affinchè le stime 𝛽መℎ siano

stime corrette di effetti causali
• Se si è interessati ad avere stime corrette solo delle variabili di interesse (ad es. la
prima variabile del modello), allora l’Assunzione 1 può essere ‘’ammorbidita’’
come:
𝐸 𝑢𝑖 |𝑋1𝑖 , 𝑋2𝑖 , … , 𝑋𝑘𝑖 = 𝐸 𝑢𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖
• In pratica si suppone di aver inserito sufficienti variabili di controllo, 𝑋2 , , , 𝑋𝑘 , in

modo che ciò che rimane omesso causi un effetto 𝑢 in media indipendente da 𝑋1
8
Effetto causale da confronto controfattuale
1 0
𝛼 = 𝐸 𝑌𝑖 |𝑇𝑖 = 1 − 𝐸 𝑌𝑖 |𝑇𝑖 = 1
• 𝑇𝑖 = 1 𝑠𝑒 𝑖 è 𝒆𝒇𝒇𝒆𝒕𝒕𝒊𝒗𝒂𝒎𝒆𝒏𝒕𝒆 𝑡𝑟𝑎𝑡𝑡𝑎𝑡𝑎; = 0 𝑎𝑙𝑡𝑟𝑖𝑚𝑒𝑛𝑡𝑖;

1
• 𝑌𝑖 𝑣𝑎𝑙𝑜𝑟𝑒 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑏𝑖𝑙𝑒 𝒔𝒆 𝒄𝒊 𝒇𝒐𝒔𝒔𝒆 𝒇𝒐𝒔𝒔𝒆 𝒔𝒕𝒂𝒕𝒐 𝑡𝑟𝑎𝑡𝑡𝑎𝑚𝑒𝑛𝑡𝑜;
0
• 𝑌𝑖 𝑣𝑎𝑙𝑜𝑟𝑒 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑏𝑖𝑙𝑒 𝒔𝒆 𝒏𝒐𝒏 𝒄𝒊 𝒇𝒐𝒔𝒔𝒆 (𝒇𝒐𝒔𝒔𝒆 𝒔𝒕𝒂𝒕𝒐) 𝑡𝑟𝑎𝑡𝑡𝑎𝑚𝑒𝑛𝑡𝑜
Dato il modello regressivo: 𝑌𝑖 = 𝛼𝑇𝑖 + 𝛽0 + 𝛽1 𝑋1𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖

se si può assumere: 𝐸 𝑢𝑖 |𝑇𝑖 , 𝑋1𝑖 , … , 𝑋𝑘𝑖 = 𝐸 𝑢𝑖 |𝑋1𝑖 , … , 𝑋𝑘𝑖
con OLS si stima correttamente 𝛼
9
Non considereremo:
• Restrizioni lineari sui coefficienti (no paragrafo 7.3)

ad es. 𝛽1 − 𝛽2 = 0 (𝛽1 = 𝛽2 ) o più in generale: 𝑐1 𝛽1 + 𝑐2 𝛽2 = 0
• Regioni di confidenza dei parametri (no paragrafo 7.4)
10
Specificazione del modello
1. Identificate la variabile di interesse

2. Pensate agli effetti causali omessi che potrebbero causare distorsione degli effetti
delle variabili di interesse
3. Se potete, includete tali effetti causali omessi o, in caso contrario, includete
variabili correlate ad essi per fungere da variabili di controllo.
4. Specificate anche una gamma di modelli alternativi plausibili, che includano
variabili aggiuntive.
5. Stimate il modello base e le specificazioni alternative plausibili ("controlli di
sensibilità"):
– Una variabile aggiunta cambia il coefficiente di interesse (𝛽1 )?
– Una variabile candidata è statisticamente significativa?
– Usate il giudizio e non una ricetta meccanica…
– Non cercate semplicemente di massimizzare R2!
11
Riflessioni su R2 ed R2 corretto
Spesso nella costruzione di un modello ci si fa guidare da R2 o da 𝑅ത 2 ! Ma:
1. Un elevato R2 (o 𝑅ത 2 ) non significa che le variabili incluse siano statisticamente

significative – ciò deve essere determinato mediante le verifiche di ipotesi.
2. Un elevato R2 (o 𝑅ത 2 ) non significa che i regressori siano fattori causali di Y.
3. Un elevato R2 (o 𝑅ത 2 ) non significa che avete eliminato la distorsione da variabili

omesse.
4. Un elevato R2 (o 𝑅ത 2 ) non significa che avete scelto l’insieme di regressori più

appropriato
12
Ultimo, ma non ultimo: la scala dei regressori
Esempio: Modello con inclusa la spesa per studente:
ෟ = 650 + 0,286 ∙ 𝑠𝑡𝑟 − 0,656 ∙ 𝑒𝑙𝑝𝑐𝑡 + 0,00387 ∙ 𝑒𝑥𝑝𝑛𝑠𝑡𝑢∗

𝑡𝑒𝑠𝑡𝑠𝑐𝑟
Modello_1:
15,5 0,482 0,0318 0,00158
ෟ = 650 + 0,286 ∙ 𝑠𝑡𝑟 − 0,656 ∙ 𝑒𝑙𝑝𝑐𝑡 + 3,87 ∙ 𝑒𝑥𝑝𝑛𝑠𝑡𝑢 ∗∗

𝑡𝑒𝑠𝑡𝑠𝑐𝑟
Modello_2:
15,5 0,482 0,0318 1,58
*=dollari; **=migliaia di dollari
N.B. Se si cambia la scala di un regressore, il coefficiente cambierà in senso

opposto, ma l’effetto non cambia
13
Comparazione dei risultati ottenuti
Stime OLS
(1) (2) (3) (4) (5)

const 699** 686** 700** 698** 700**
(10,4) (8,73) (5,57) (6,92) (5,54)
str -2,28** -1,10** -0,998** -1,31** -1,01**
(0,519) (0,433) (0,270) (0,339) (0,269)
el_pct -0,650** -0,122** -0,488** -0,130**
(0,0310) (0,0328) (0,0296) (0,0363)
meal_pct -0,547** -0,529**
(0,0241) (0,0381)
calw_pct -0,790** -0,0479
(0,0677) (0,0587)
n 420 420 420 420 420
R2 0,049 0,424 0,773 0,626 0,773
corretto
14

Cap 07 5ed

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Cap 07 5ed

Caricato da

Copyright:

Formati disponibili

Verifica del modello

• L’ipotesi alternativa 𝐻1 può essere:

• Nessuna ipotesi viene fatta relativamente agli altri coefficienti

• Il test viene condotto calcolando il p-value

• La soglia 𝛼 corrisponde al rischio di rifiutare 𝐻0 pur essendo 𝐻0 vera

Coefficiente Errore Std. rapporto t p-value

Media var. dipendente 654,1565 SQM var. dipendente 19,05335

• Se un regressore non è significativo, andrebbe escluso dal modello e il

• Spesso si ipotizza l’uguaglianza a zero (non significatività) di due o più

• L’ipotesi alternativa è che almeno 1 di questi coefficienti non sia pari a

• Fare congiuntamente q test unilaterali ognuno con soglia 𝛼 comporta un

• E’ possibile effettuare la verifica ricorrendo ad un test F

La statistica 𝐹 ha una distribuzione di 𝐹𝑖𝑠ℎ𝑒𝑟 − 𝑆𝑛𝑒𝑑𝑒𝑐𝑜𝑟:

• Di default viene fornito il test:

Coefficiente Errore Std. rapporto t p-value

Media var. dipendente 654,1565 SQM var. dipendente 19,05335

• l’Assunzione 1: 𝐸 𝑢𝑖 |𝑋1𝑖 , … , 𝑋𝑘𝑖 = 0 è necessaria affinchè le stime 𝛽መℎ siano

• In pratica si suppone di aver inserito sufficienti variabili di controllo, 𝑋2 , , , 𝑋𝑘 , in

• 𝑇𝑖 = 1 𝑠𝑒 𝑖 è 𝒆𝒇𝒇𝒆𝒕𝒕𝒊𝒗𝒂𝒎𝒆𝒏𝒕𝒆 𝑡𝑟𝑎𝑡𝑡𝑎𝑡𝑎; = 0 𝑎𝑙𝑡𝑟𝑖𝑚𝑒𝑛𝑡𝑖;

Dato il modello regressivo: 𝑌𝑖 = 𝛼𝑇𝑖 + 𝛽0 + 𝛽1 𝑋1𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖

• Restrizioni lineari sui coefficienti (no paragrafo 7.3)

• Regioni di confidenza dei parametri (no paragrafo 7.4)

1. Identificate la variabile di interesse

1. Un elevato R2 (o 𝑅ത 2 ) non significa che le variabili incluse siano statisticamente

2. Un elevato R2 (o 𝑅ത 2 ) non significa che i regressori siano fattori causali di Y.

3. Un elevato R2 (o 𝑅ത 2 ) non significa che avete eliminato la distorsione da variabili

4. Un elevato R2 (o 𝑅ത 2 ) non significa che avete scelto l’insieme di regressori più

Esempio: Modello con inclusa la spesa per studente:

ෟ = 650 + 0,286 ∙ 𝑠𝑡𝑟 − 0,656 ∙ 𝑒𝑙𝑝𝑐𝑡 + 0,00387 ∙ 𝑒𝑥𝑝𝑛𝑠𝑡𝑢∗

ෟ = 650 + 0,286 ∙ 𝑠𝑡𝑟 − 0,656 ∙ 𝑒𝑙𝑝𝑐𝑡 + 3,87 ∙ 𝑒𝑥𝑝𝑛𝑠𝑡𝑢 ∗∗

*=dollari; **=migliaia di dollari

N.B. Se si cambia la scala di un regressore, il coefficiente cambierà in senso

(1) (2) (3) (4) (5)

Potrebbero piacerti anche