Sei sulla pagina 1di 23

Principi di Econometria

lezione 7

AA 2016-2017

Paolo Brunori

Principi di Econometria lezione 7 AA 2016-2017 Paolo Brunori Principi di Econometria lezione 7 regressione multipla

Principi di

Econometria

lezione 7

regressione

multipla

dove siamo arrivati?

- siamo interessati a studiare l’andamento congiunto

se

di

due fenomeni economici

Principi di

Econometria

lezione 7

regressione

multipla

- possiamo provare a misurare i due fenomeni e poi usare la regressione lineare semplice per valutare quanto il legame fra due fenomeni sia ben approssimato da una relazione lineare

- questo metodo ci fornisce: una stima dei due parametri che definiscono la forza della relazione fra i due fenomeni, il livello di incertezza delle stime, una quantificazione della bontà di adattamento dei dati al modello (quanto bene il modello ‘spiega’ i dati)

stime, una quantificazione della bontà di adattamento dei dati al modello (quanto bene il modello ‘spiega’

Uragani con nomi femminili sono più pericolosi di quelli con nomi maschili?

Principi di

Econometria

lezione 7

regressione

multipla

nomi femminili sono più pericolosi di quelli con nomi maschili? Principi di Econometria lezione 7 regressione
nomi femminili sono più pericolosi di quelli con nomi maschili? Principi di Econometria lezione 7 regressione

Uragani con nomi femminili sono più pericolosi di quelli con nomi maschili?

Principi di

Econometria

lezione 7

regressione

multipla

nomi femminili sono più pericolosi di quelli con nomi maschili? Principi di Econometria lezione 7 regressione
nomi femminili sono più pericolosi di quelli con nomi maschili? Principi di Econometria lezione 7 regressione

80

60

numero di morti

40

20

0

Uragani con nomi femminili sono più pericolosi di quelli con nomi maschili?

Principi di

Econometria

lezione 7

regressione

multipla

1950 1960 1970 1980 1990 2000 2010
1950
1960
1970
1980
1990
2000
2010

anno

con nomi maschili? Principi di Econometria lezione 7 regressione multipla 1950 1960 1970 1980 1990 2000

80

60

numero di morti

40

20

0

Uragani con nomi femminili sono più pericolosi di quelli con nomi maschili?

Principi di

Econometria

lezione 7

regressione

multipla

1950 1960 1970 1980 1990 2000 2010
1950
1960
1970
1980
1990
2000
2010

anno

in verde uragani con nome femminile

lezione 7 regressione multipla 1950 1960 1970 1980 1990 2000 2010 anno in verde uragani con

variabili omesse

- come visto nel caso dei dati di consumo di tabacco in Turchia, è difficile ipotizzare che una sola variabile indipendente spieghi il comportamento della dipendete

- in generale infatti u cattura l’effetto di tutte quelle variabili che influenzano Y ma non sono considerate/osservabili

- l’omissione di una variabile Z distorce lo stimatore OLS se si verificano due condizioni :

1. Z è una delle variabili che determina Y

2. corr(X , Z ) = 0

variabili che determina Y 2. corr ( X , Z ) = 0 Principi di Econometria

Principi di

Econometria

lezione 7

regressione

multipla

esempio: Y = consumo tabacco, X = prezzo, Z = reddito pro capite

Principi di

Econometria

lezione 7

regressione

multipla

- condizione 1: Z ha un impatto su Y ?

- condizione 2: Z potrebbe essere correlato con X ?

- qual’è la direzione attesa della distorsione?

su Y ? - condizione 2: Z potrebbe essere correlato con X ? - qual’è la

direzione della direzione da variabile omessa

Principi di

Econometria

lezione 7

regressione

multipla

- is segno della distorsione è pari al segno del prodotto fra le due correlazioni: corr(Z , X ) × corr(Y , Z )

ˆ

corr(Z , X ) < 0 e corr(Y , Z ) > 0 β 1 < β 1

ˆ

corr(Z , X ) < 0 e corr(Y , Z ) < 0 β 1 > β 1

ˆ

corr(Z , X ) > 0 e corr(Y , Z ) > 0 β 1 > β 1

ˆ

corr(Z , X ) > 0 e corr(Y , Z ) < 0 β 1 < β 1

0 → β 1 > β 1 ˆ corr ( Z , X ) > 0

esempio: X ore studiate, Y voto all’esame, Z domande copiate

Principi di

Econometria

lezione 7

regressione

multipla

- condizione 1: Z ha un impatto su Y ?

- condizione 2: Z potrebbe essere correlato con X ?

- qual’è la direzione attesa della distorsione?

- studenti che non studiano e copiano di più prenderanno un voto alto

- questo diminuirà la mia stima di quanto valga studiare in termini di aumento di voto β 1

ˆ

- la distorsione è verso il basso β 1 < β 1

- infatti il prodotto di corr(Z , X ) < 0 e corr(Y , Z ) > 0 è negativo

β 1 < β 1 - infatti il prodotto di corr ( Z , X )

distorsione per variabili omesse espressa in termini di covarianza di X e u

ˆ

Principi di

Econometria

lezione 7

regressione

multipla

- lim n+ ( β 1 β 1 ) = 0 sotto l’assunzione:

- in caso contrario:

cov(X i , u i ) = 0

σ u ˆ lim n→+∞ ( β 1 − β 1 ) = σ X
σ u
ˆ
lim n→+∞ (
β 1 − β 1 ) =
σ X ρ u,X

0.2

0.0

Residuals

-0.2

-0.4

segnali di possibili variabili omesse

- con R possiamo verificare l’assunzione creando un grafico dei residui e dei valori predetti di Y

ˆ

Principi di

Econometria

lezione 7

regressione

multipla

- Y sono una combinazione lineare di X

Residuals vs Fitted

19
19
19 25 27
19 25 27

25

19 25 27

27

19 25 27
19 25 27
19 25 27
19 25 27
19 25 27

2.0

2.1

2.2

2.3

lm(Q Fitted ~ values P + Y)

2.4 2.5
2.4
2.5

cosa vogliamo misurare con β 1 ?

Principi di

Econometria

lezione 7

regressione

multipla

- β 1 può essere semplicemente la pendenza della retta che interpola un grafico a dispersione

- β 1 può invece servire a predirre Y |X

- β 1 come effetto causale di X su Y

che cosa si intende per nesso di causalità?

servire a predirre Y | X - β 1 come effetto causale di X su Y

regressione con due regressori

- Y, X 1 , X 2

- siamo alla ricerca della relazione:

E(Y i |X 1,i = x i , X 2,i

= x 2 )

- se lineare ha la forma generica:

Principi di

Econometria

lezione 7

regressione

multipla

E(Y i |X 1,i = x i , X 2,i = x 2 ) = β 0 + β 1 x 1 + β 2 x 2

E ( Y i | X 1 , i = x i , X 2 ,

Q 1.8 2.0 2.2 2.4 2.6 2.8

P

Consumo di tabacco, prezzo, reddito in Turchia

2.6 2.8 P Consumo di tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4.
2.6 2.8 P Consumo di tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4.
2.6 2.8 P Consumo di tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4.
1.0
1.0
2.8 P Consumo di tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4. 3.5
3.0 2.5 2.0 1.5
3.0
2.5
2.0
1.5
tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000 3500 4000
tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000 3500 4000
tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000 3500 4000
tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000 3500 4000
tabacco, prezzo, reddito in Turchia 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000 3500 4000

4.

3.5

2500 3000 3500 4000 4500 5000 5500 6000

Y

2.0 1.5 4. 3.5 2500 3000 3500 4000 4500 5000 5500 6000 Y Principi di Econometria

Principi di

Econometria

lezione 7

regressione

multipla

definizioni

Principi di

Econometria

lezione 7

regressione

multipla

- Y = β 0 + β 1 x 1 + β 2 x 2 è la retta (in realtà un piano!) di regressione della popolazione

- β 0 è l’intercetta

- β 1 , β 2 sono i coefficienti associati alle variabili X 1 , X 2

- analogamente a quanto visto per un solo regressore:

Y +∆Y = β 0 + β 1 (X 1 +∆X 1 )+ β 2 X 2

- quindi β 1 = costante X 2 )

∆Y 1 è l’effetto parziale di X 1 (tenendo ∆X
∆Y
1 è l’effetto parziale di X 1 (tenendo
∆X

Q 1.8 2.0 2.2 2.4 2.6 2.8

P

il piano di regressione

Q 1.8 2.0 2.2 2.4 2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0
Q 1.8 2.0 2.2 2.4 2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0
Q 1.8 2.0 2.2 2.4 2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0
1.0
1.0
Q 1.8 2.0 2.2 2.4 2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0
3.0 2.5 2.0 1.5
3.0
2.5
2.0
1.5
2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000
2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000
2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000
2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000
2.6 2.8 P il piano di regressione 1.0 3.0 2.5 2.0 1.5 4. 3.5 2500 3000

4.

3.5

2500 3000 3500 4000 4500 5000 5500 6000

Y

1.5 4. 3.5 2500 3000 3500 4000 4500 5000 5500 6000 Y Principi di Econometria lezione

Principi di

Econometria

lezione 7

regressione

multipla

P

Q

il piano di regressione

3.5 3.0 2.5 2.0 1.5 1.0 2500 3000 3500 4000 4500 5000 5500 6000 1.8
3.5
3.0
2.5
2.0
1.5
1.0
2500 3000 3500 4000 4500 5000 5500 6000
1.8 2.0 2.2 2.4 2.6 2.8

Y

4.

3500 4000 4500 5000 5500 6000 1.8 2.0 2.2 2.4 2.6 2.8 Y 4. Principi di

Principi di

Econometria

lezione 7

regressione

multipla

regressione multipla

Principi di

Econometria

lezione 7

regressione

multipla

- seppur difficile da vedere graficamente Y può essere una funzione di molte variabili

- per un numero generico k di regressori il modello di regressione multipla prende la forma:

Y i = β 0 + β 1 X 1,i + β 2 X 2,i +

+ β k X k,i +u i

la forma: Y i = β 0 + β 1 X 1 , i + β

stimatore OLS della regressione multipla

ˆ

- gli stimatori β i che vengono normalmente utilizzati

sono quelli che minimizzano:

n

i=1

(Y i b 0 b 1 X 1,i

b k X k,1 ) 2

Principi di

Econometria

lezione 7

regressione

multipla

- le formule per ottenerli sono in formula matriciale e potete consultarli qui

- la terminologia è la stessa usata per il modello con un regressore:

ˆ ˆ

stimatori OLS: β 0 , β 1 ,

valore predetto:

residuo uˆ i

ˆ

Y i

per il modello con un regressore: ˆ ˆ stimatori OLS: β 0 , β 1 ,

Regressione multipla del consumo di tabacco

Principi di

Econometria

lezione 7

regressione

multipla

 

coefficiente errore standard

t

valore p

β

0

1.6572

0.1237

13.394

0.0000

β Y

0.0003

0.0000

6.518

0.0000

β P

-0 .0423

0.0096

-4.3662

0.0001

- come posso interpretare questi coefficienti?

6.518 0.0000 β P -0 .0423 0.0096 -4.3662 0.0001 - come posso interpretare questi coefficienti?

R 2

- è la frazione della varianza campionaria spiegata dai regressori

R 2 = ESS

TSS

TSS = 1 SSR

R 2 [0, 1]

-

- nella regressione multipla R 2 cresce all’aumentare dei regressori

- k = n 1 regressori mi garantiscono sempre un’interpolazione perfetta (se i regressori sono k oltre l’intercetta β 0 )

- nel modello del fumo di tabacco R 2 = 0.6406

) - nel modello del fumo di tabacco R 2 = 0 . 6406 Principi di

Principi di

Econometria

lezione 7

regressione

multipla

R 2 corretto

Principi di

Econometria

lezione 7

regressione

multipla

- è possibile tener conto del numero di regressori

R ¯ 2 = R 2 (1 R 2 )

k

n k 1

- R 2 > R 2 sempre

- due effetti dell’aggiunta di un regressorie: ↑↓

¯

- R 2 può essere minore di zero

- nel modello del fumo di tabacco R 2 = 0.6129

¯

¯

↑↓ ¯ - R 2 può essere minore di zero - nel modello del fumo di