Sei sulla pagina 1di 14

Verifica del modello

con
regressori multipli
Capitolo 7
Introduzione all’econometria
J.H. Stock, M.W. Watson
Verifica di ipotesi su singolo coefficiente
• Avviene come nel caso del modello semplice: 𝐻0 : 𝛽ℎ = 0

• L’ipotesi alternativa 𝐻1 può essere:


– bilaterale/a due code: 𝐻1 : 𝛽ℎ ≠ 0
– unilaterale/coda destra: 𝐻1 : 𝛽ℎ > 0
– unilaterale/coda sinistra: 𝐻1 : 𝛽ℎ < 0

• Nessuna ipotesi viene fatta relativamente agli altri coefficienti

• Il test viene condotto calcolando il p-value

• La soglia 𝛼 corrisponde al rischio di rifiutare 𝐻0 pur essendo 𝐻0 vera


(rischio di prima specie)

2
Esempio: aggiungiamo la spesa per studente
OLS_2bis: OLS, usando le osservazioni 1-420
Variabile dipendente: testscr
Errori standard robusti rispetto all'eteroschedasticità, variante HC1

Coefficiente Errore Std. rapporto t p-value


const 649,578 15,4583 42,02 <0,0001 ***
str −0,286399 0,482073 −0,5941 0,5528
el_pct −0,656023 0,0317844 −20,64 <0,0001 ***
expn_stu 0,00386790 0,00158072 2,447 0,0148 **

Media var. dipendente 654,1565 SQM var. dipendente 19,05335


Somma quadr. residui 85699,71 E.S. della regressione 14,35301
R-quadro 0,436592 R-quadro corretto 0,432529
F(3, 416) 147,2037 P-value(F) 5,20e-65
Log-verosimiglianza −1712,808 Criterio di Akaike 3433,615
Criterio di Schwarz 3449,776 Hannan-Quinn 3440,003

• Se un regressore non è significativo, andrebbe escluso dal modello e il


modello andrebbe ristimato;
• I software di regola forniscono il p-value per 𝐻1 : 𝛽ℎ ≠ 0
3
Verifica di ipotesi congiunta su 2 o più coefficienti

• Spesso si ipotizza l’uguaglianza a zero (non significatività) di due o più


coefficienti: 𝐻0 : 𝛽ℎ1 = 𝛽ℎ2 = ⋯ 𝛽ℎ𝑞 = 0

• L’ipotesi alternativa è che almeno 1 di questi coefficienti non sia pari a


zero

• Fare congiuntamente q test unilaterali ognuno con soglia 𝛼 comporta un


rischio complessivo di prima specie superiore ad 𝛼

• E’ possibile effettuare la verifica ricorrendo ad un test F

4
Test F (spesso detto test di Wald)
• 𝐻0 : 𝛽1 = 𝛽2 = ⋯ 𝛽𝑞 = 0
• Si calcola una statistica 𝐹 la cui formula varia a seconda che gli errori
siano omoschedastici o eteroschedastici
• Noi non tratteremo le formule in nessun caso (tanto il calcolo lo fa il
software!!!)
• 𝐹 misura la distanza tra i valori stimati ed ipotizzati dei 𝛽𝑗
• Nel caso di errori omoschedastici il test viene detto ‘‘classico’’
• Il test classico può essere effettuato anche con campioni non numerosi se
gli errori oltre che omoschedastici sono assunti normali
• Il test F “robusto” (con errori eteroschedastici) richiede invece che il
campione sia ampio!

5
Test F

La statistica 𝐹 ha una distribuzione di 𝐹𝑖𝑠ℎ𝑒𝑟 − 𝑆𝑛𝑒𝑑𝑒𝑐𝑜𝑟:

• Si respinge 𝐻0 per valori alti di 𝐹 𝑎𝑐𝑡 , ovvero per valori del p-value piccoli

• Di default viene fornito il test:


𝐻0 : 𝛽1 = 𝛽2 = ⋯ 𝛽𝑘 = 0

6
Esempio: aggiungiamo la spesa per studente
OLS_2bis: OLS, usando le osservazioni 1-420
Variabile dipendente: testscr
Errori standard robusti rispetto all'eteroschedasticità, variante HC1

Coefficiente Errore Std. rapporto t p-value


const 649,578 15,4583 42,02 <0,0001 ***
str −0,286399 0,482073 −0,5941 0,5528
el_pct −0,656023 0,0317844 −20,64 <0,0001 ***
expn_stu 0,00386790 0,00158072 2,447 0,0148 **

Media var. dipendente 654,1565 SQM var. dipendente 19,05335


Somma quadr. residui 85699,71 E.S. della regressione 14,35301
R-quadro 0,436592 R-quadro corretto 0,432529
F(3, 416) 147,2037 P-value(F) 5,20e-65
Log-verosimiglianza −1712,808 Criterio di Akaike 3433,615
Criterio di Schwarz 3449,776 Hannan-Quinn 3440,003

7
Una deroga possibile all’Assunzione 1

• l’Assunzione 1: 𝐸 𝑢𝑖 |𝑋1𝑖 , … , 𝑋𝑘𝑖 = 0 è necessaria affinchè le stime 𝛽መℎ siano


stime corrette di effetti causali

• Se si è interessati ad avere stime corrette solo delle variabili di interesse (ad es. la
prima variabile del modello), allora l’Assunzione 1 può essere ‘’ammorbidita’’
come:
𝐸 𝑢𝑖 |𝑋1𝑖 , 𝑋2𝑖 , … , 𝑋𝑘𝑖 = 𝐸 𝑢𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖

• In pratica si suppone di aver inserito sufficienti variabili di controllo, 𝑋2 , , , 𝑋𝑘 , in


modo che ciò che rimane omesso causi un effetto 𝑢 in media indipendente da 𝑋1

8
Effetto causale da confronto controfattuale
1 0
𝛼 = 𝐸 𝑌𝑖 |𝑇𝑖 = 1 − 𝐸 𝑌𝑖 |𝑇𝑖 = 1

• 𝑇𝑖 = 1 𝑠𝑒 𝑖 è 𝒆𝒇𝒇𝒆𝒕𝒕𝒊𝒗𝒂𝒎𝒆𝒏𝒕𝒆 𝑡𝑟𝑎𝑡𝑡𝑎𝑡𝑎; = 0 𝑎𝑙𝑡𝑟𝑖𝑚𝑒𝑛𝑡𝑖;


1
• 𝑌𝑖 𝑣𝑎𝑙𝑜𝑟𝑒 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑏𝑖𝑙𝑒 𝒔𝒆 𝒄𝒊 𝒇𝒐𝒔𝒔𝒆 𝒇𝒐𝒔𝒔𝒆 𝒔𝒕𝒂𝒕𝒐 𝑡𝑟𝑎𝑡𝑡𝑎𝑚𝑒𝑛𝑡𝑜;
0
• 𝑌𝑖 𝑣𝑎𝑙𝑜𝑟𝑒 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑏𝑖𝑙𝑒 𝒔𝒆 𝒏𝒐𝒏 𝒄𝒊 𝒇𝒐𝒔𝒔𝒆 (𝒇𝒐𝒔𝒔𝒆 𝒔𝒕𝒂𝒕𝒐) 𝑡𝑟𝑎𝑡𝑡𝑎𝑚𝑒𝑛𝑡𝑜

Dato il modello regressivo: 𝑌𝑖 = 𝛼𝑇𝑖 + 𝛽0 + 𝛽1 𝑋1𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖


se si può assumere: 𝐸 𝑢𝑖 |𝑇𝑖 , 𝑋1𝑖 , … , 𝑋𝑘𝑖 = 𝐸 𝑢𝑖 |𝑋1𝑖 , … , 𝑋𝑘𝑖
con OLS si stima correttamente 𝛼

9
Non considereremo:

• Restrizioni lineari sui coefficienti (no paragrafo 7.3)


ad es. 𝛽1 − 𝛽2 = 0 (𝛽1 = 𝛽2 ) o più in generale: 𝑐1 𝛽1 + 𝑐2 𝛽2 = 0

• Regioni di confidenza dei parametri (no paragrafo 7.4)

10
Specificazione del modello

1. Identificate la variabile di interesse


2. Pensate agli effetti causali omessi che potrebbero causare distorsione degli effetti
delle variabili di interesse
3. Se potete, includete tali effetti causali omessi o, in caso contrario, includete
variabili correlate ad essi per fungere da variabili di controllo.
4. Specificate anche una gamma di modelli alternativi plausibili, che includano
variabili aggiuntive.
5. Stimate il modello base e le specificazioni alternative plausibili ("controlli di
sensibilità"):
– Una variabile aggiunta cambia il coefficiente di interesse (𝛽1 )?
– Una variabile candidata è statisticamente significativa?
– Usate il giudizio e non una ricetta meccanica…
– Non cercate semplicemente di massimizzare R2!

11
Riflessioni su R2 ed R2 corretto
Spesso nella costruzione di un modello ci si fa guidare da R2 o da 𝑅ത 2 ! Ma:

1. Un elevato R2 (o 𝑅ത 2 ) non significa che le variabili incluse siano statisticamente


significative – ciò deve essere determinato mediante le verifiche di ipotesi.

2. Un elevato R2 (o 𝑅ത 2 ) non significa che i regressori siano fattori causali di Y.

3. Un elevato R2 (o 𝑅ത 2 ) non significa che avete eliminato la distorsione da variabili


omesse.

4. Un elevato R2 (o 𝑅ത 2 ) non significa che avete scelto l’insieme di regressori più


appropriato

12
Ultimo, ma non ultimo: la scala dei regressori

Esempio: Modello con inclusa la spesa per studente:

ෟ = 650 + 0,286 ∙ 𝑠𝑡𝑟 − 0,656 ∙ 𝑒𝑙𝑝𝑐𝑡 + 0,00387 ∙ 𝑒𝑥𝑝𝑛𝑠𝑡𝑢∗


𝑡𝑒𝑠𝑡𝑠𝑐𝑟
Modello_1:
15,5 0,482 0,0318 0,00158

ෟ = 650 + 0,286 ∙ 𝑠𝑡𝑟 − 0,656 ∙ 𝑒𝑙𝑝𝑐𝑡 + 3,87 ∙ 𝑒𝑥𝑝𝑛𝑠𝑡𝑢 ∗∗


𝑡𝑒𝑠𝑡𝑠𝑐𝑟
Modello_2:
15,5 0,482 0,0318 1,58

*=dollari; **=migliaia di dollari

N.B. Se si cambia la scala di un regressore, il coefficiente cambierà in senso


opposto, ma l’effetto non cambia

13
Comparazione dei risultati ottenuti
Stime OLS
Variabile dipendente: testscr

(1) (2) (3) (4) (5)


const 699** 686** 700** 698** 700**
(10,4) (8,73) (5,57) (6,92) (5,54)
str -2,28** -1,10** -0,998** -1,31** -1,01**
(0,519) (0,433) (0,270) (0,339) (0,269)
el_pct -0,650** -0,122** -0,488** -0,130**
(0,0310) (0,0328) (0,0296) (0,0363)
meal_pct -0,547** -0,529**
(0,0241) (0,0381)
calw_pct -0,790** -0,0479
(0,0677) (0,0587)
n 420 420 420 420 420
R2 0,049 0,424 0,773 0,626 0,773
corretto

14

Potrebbero piacerti anche