Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
con
regressori multipli
Capitolo 6
Introduzione all’econometria
J.H. Stock, M.W. Watson
Distorsione da variabile omessa
• Consideriamo il modello causale:
Δ𝑌
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖 con 𝛽1 = Δ𝑋𝑖 𝑐. 𝑝.
𝑖
2
4 casi per riflettere
1. Percentuale di studenti non madrelingua inglese
3
Il modello di regressione multipla con due regressori
Assumiamo che:
• esista una sola variabile 𝑋2 , correlata con 𝑋1 , avente effetto su 𝑌
• sia vera la relazione: E 𝑌𝑖 |𝑋1𝑖 , 𝑋2𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2𝑖 𝑋2𝑖
4
Che significato attribuire a 𝜷𝟏 ?
Abbiamo assunto: E 𝑌𝑖 |𝑋1𝑖 , 𝑋2𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2𝑖 𝑋2𝑖
5
Il modello di regressione multipla con k regressori
6
Il metodo OLS nella regressione multipla
• Gli stimatori OLS 𝛽መ0 , 𝛽መ1 , … , 𝛽መ𝑘 forniscono i valori di 𝑏0 , 𝑏1 , … , 𝑏𝑘 che rendono
2
minima la somma degli scarti al quadrato 𝑌𝑖 − 𝑌𝑖 :
𝑌𝑖 − 𝑏0 − 𝑏1 𝑋1𝑖 − ⋯ − 𝑏𝑘 𝑋𝑘𝑖 2
𝑖=1
• Esistono formule per calcolare 𝛽መ0 , 𝛽መ1 , … , 𝛽መ𝑘 , che però non riportiamo perché sono
complesse (per lo più riportate come calcolo matriciale)
7
Esempio sul caso allo studio
8
Misure di adattamento della regressione multipla
2
σ𝑛𝑖=1 𝑢ො 𝑖2 σ𝑛𝑖=1 𝑌𝑖 − 𝑌𝑖 𝑆𝑆𝑅
dove: 𝑠𝑢2 = = =
𝑛−𝑘−1 𝑛−𝑘−1 𝑛−𝑘−1
9
R2 ed R2 corretto
2) L’𝑹𝟐 = 1 − 𝑆𝑆𝑅Τ𝑇𝑆𝑆
– R2 cresce sempre al crescere dei regressori perché SSR decresce
(anche se il regressore aggiunto non porta informazione utile per Y)
𝟐 𝑆𝑆𝑅/(𝑛−𝑘−1) 𝑠2
3) L’𝑹 corretto = 1 − 𝑇𝑆𝑆/(𝑛−1) =1− 𝑢
𝑠2
𝑌
10
Ulteriori criteri di valutazione
11
Model 1: OLS, using observations 1-420
Dependent variable: testscr
Heteroskedasticity-robust standard errors, variant HC1
1. 𝐸 𝑢𝑖 |𝑋1𝑖 , … , 𝑋𝑘𝑖 = 0
13
Collinearità: collinearità perfetta
• Si osserva quando un regressore è funzione lineare di altri.
Esempio:
– 𝑋2 = 𝑃𝑐𝑡𝐸𝐿 = "% studenti non madrelingua inglese"
– 𝑋3 = 𝑃𝑐𝑡𝐸𝑆 = "% studenti madrelingua inglese" ⇒ 𝑋3 = 100 − 𝑋2
14
Collinearità: quasi collinearità
a) Se c’è collinearità perfetta tra 𝑋2 𝑒 𝑋3 allora 𝐶𝑜𝑟𝑟 𝑋2 , 𝑋3 = ±1
b) C’è quasi collinearità quando due o più regressori sono molto correlati:
𝐶𝑜𝑟𝑟 𝑋2 , 𝑋3 ⇒ 0.8
• Nel caso b) il metodo OLS può essere applicato, ma le stime di almeno uno dei
regressori «quasi collineari» risulta imprecisa
• Questo perché gli stimatori sono molto variabili, come dimostato da SE
elevati!
• In pratica per ogni regressore «quasi collineare» c’è poca informazione
specifica (spiegabile unicamente da quel regressore): è come se i dati utili non
fossero n , ma molti di meno!!!
15
OLS_2: OLS, usando le osservazioni 1-420
Variabile dipendente: testscr
Errori standard robusti rispetto all'eteroschedasticità, variante HC1
17