Sei sulla pagina 1di 5

SOLUZIONI PROVA D’ESAME

PARTE A

ESERCIZIO 1

a) Errore standard robusto


Si tratta di errori standard robusti alla presenza di eteroschedasticità per gli stimatori OLS.
Consentono di utilizzare le procedure standard per il test delle ipotesi su uno (t-test) o più parametri
(F-test) anche quando gli errori sono eteroschedastici.

b) R2 corretto
Versione modificata dell’R2 che non aumenta necessariamente quando alla regressione viene
aggiunto un nuovo repressore e fornisce una penalità per il numero di regressori inclusi.
RSS /( n − 1)
R 2adj = 1 −
TSS /( n − k )

c) Collinearità perfetta
Si verifica quando uno dei regressori è una funzione lineare esatta degli altri regressori. In tale
circostanza non è possibile ottenere lo stimatore OLS un quanto la matrice (X’X) non è invertibile.

ESERCIZIO 2

a) Il modello specificato è già lineare nei parametri. Dunque per Z i = 1 / X i , il modello può essere
stimato nella sua forma corrente.
b) ln(Yi ) = β1 + β 2 X i + u i
c) Il modello non può essere stimato in quanto non è possibile renderlo lineare nei parametri

ESERCIZIO 3

b) Le due interpretazioni sono compatibili. In entrambi i casi l’esperienza contribuisce


positivamente alla determinazione del salario. Nel primo caso il salario predetto aumenta
proporzionalmente con l’esperienza di un ammontare pari al coefficiente β1 (la relazione è lineare);
nel secondo caso, il salario aumenta con l’esperienza a tassi decrescenti (la relazione è descritta da
un ramo di iperbole).

∂wi ∂wi
c) = βˆ 2 ; = −αˆ 2 espi−2
∂espi ∂espi

ESERCIZIO 4

a) Falsa. Se l’ipotesi nulla viene accettata ad un livello di significatività del 5%, vuol dire che nel
95% dei casi il parametro stimato assumerà un valore pari all’ipotesi nulla. Dunque sicuramente lo
farà al 90%. Il contrario tuttavia non è detto: se nel 90% dei casi il parametro stimato assumerà un
valore pari all’ipotesi nulla, non è detto che lo faccia anche nel 95% dei casi.

1
b) La prima parte è vera; la seconda è falsa. In caso di eteroschedasticità, lo stimatore GLS è
BLUE.
c) Falso. Se la collinearità è perfetta, lo stimatore OLS non è calcolabile. Se la collinearità è
imperfetta ci potrebbero essere problemi per lo stimatore OLS in quanto aumenta la varianza dei
coefficienti di regressione e quindi i coefficienti di regressione stimati per diversi campioni tendono
a essere poco stabili e con standard error elevati.

PARTE B

ESERCIZIO 1

Se esiste sostituzione tra ore di sonno e ore lavorate, ci attendiamo β 2 < 0 . Il coefficiente dice
pertanto che all’aumento di un minuto di lavoro, i minuti dedicati al sonno diminuiscono di β 2 .
a) Guardando al coefficiente di min_lav esiste un trade-off negativo tra tempo dedicato al sonno e
tempo dedicato al lavoro: per un minuto di lavoro in più, i minuti di sonno diminuiscono di 0.148.
Se un individuo lavora 5 ore in più a settimana, il tempo dedicato al sonno diminuisce di circa 44
minuti.
− 11.13 − 0
t istr = = 1.99 > 1.96 ⇒ Significativo al 5% e dunque anche al 10%
5.58
b)
2.20 − 0
t eta = = 1.52 < 1.65 ⇒ Non significativo al 10% e dunque anche al 5%
1.45

c) H0: β 3 = β 4 = 0 ; H1: β 3 ≠ 0 o β 4 ≠ 0
Test F per significatività congiunta dei regressori con 2 gradi di libertà al numeratore e 701 gradi di
libertà al denominatore:

F(2;701) =
( 2
Runrestrict )
ed − Rrestricted / q
2
=
(0.113 − 0.103) / 2 = 0.005 = 5 > 3.01 ⇒ Rifiuto H
( )
1 − Runrestricted / (n − k unrestricted − 1) (1 − 0.113) / (706 − 4 − 1) 0.001
2 0

∂ min_ sonno
d) i) = −8.70 + 2 * 0.128 * eta
∂eta

L’effetto marginale è dunque negativo ma a tassi decrescenti con l’aumentare dell’età. Oltre i 34
anni infatti l’età incide positivamente sui minuti di sonno. La relazione è rappresentata da una U-
rovesciata.

ii) Non è possibile costruire formalmente un test per la significatività congiunta di eta ed eta2 in
quanto non sono disponibili i dati necessari del rispettivo modello vincolato, ossia la somma dei
quadrati dei residui della regressione:
min _ sonno = βˆ1 + βˆ2 min_lav + βˆ2istr + βˆ4 M + uˆ
Tuttavia data la significatività individuale di entrambi i coefficienti al 95% e dato il loro grado di
correlazione possiamo intuire che siano congiuntamente significativi.

87.75 − 0
iii) t M = = 2.56 > 1.96 ⇒ Significativo al 5%
34.33
Dunque gli uomini dormono in media 87.75 minuti più delle donne.

2
iv) Per valutare se il tradeoff è più forte per gli uomini che per le donne dobbiamo stimare la
seguente regressione:

min_sonno = β1 + β 2 min_lav + β 3istr + β 4 eta + β 5 eta 2 + β 6 M + β 7 M * min_lav + u i


Se la sostituzione tra min_lav e min_sonno è più forte per gli uomini piuttosto che per le donne ci
aspettiamo β 7 < 0 dato che β 2 < 0 . Per valutarne la significatività effettuiamo il test t sul
β7
coefficiente della variabile interagita: t = , valore critico 1.96.
s.e.( β 7 )

ESERCIZIO 2

1.a) 19.78%+2.20%=21.98%
1.b) 9.72% per il primo quartile di appezzamento; 19.55% per il secondo quartile di appezzamento;
14.93% per il terzo quartile di appezzamento; 35.56% per l’ultimo quartile di appezzamento.

2.a) β 2 rappresenta l’elasticità del prezzo dell’abitazione alla dimensione dell’appezzamento:


all’aumento dell’1% della dimensione dell’appezzamento il prezzo dell’abitazione varia del β 2 % ;
β 3 rappresenta la semi-elasticità del prezzo dell’abitazione al numero di camere da letto: una
camera da letto in più induce una variazione del prezzo dell’abitazione pari a 100* β 3 % ;
β 4 rappresenta la semi-elasticità del prezzo dell’abitazione al numero di bagni: un bagno in più
induce una variazione del prezzo dell’abitazione pari a 100* β 4 % ;
β 5 rappresenta la semi-elasticità del prezzo dell’abitazione alla presenza di aria condizionata: la
presenza di aria condizionata induce una variazione del prezzo dell’abitazione pari a 100* β 5 % .

E(Diff. log prices) = 0.078 *1 + 0.216 *1 + 0.212 = 0.506


2.b)
E(Diff. prices) = exp(0.506) = 1.659 migliaia di dollari

2.c) L’R2 della regressione è pari al 56%; dunque il modello spiega oltre il 50% della varianza della
variabile dipendente. I regressori sono singolarmente e congiuntamente significativi. La capacità di
adattamento ai dati è buona.

2.d) Il coefficiente del logaritmo della dimensione dell’appezzamento non è in grado di catturare la
relazione causale tra dimensione dell’appezzamento e prezzo di vendita dell’abitazione in quanto la
regressione stimata omette una serie di variabili potenzialmente rilevanti per la variabile dipendente
e correlate con la stessa dimensione dell’appezzamento (es. garagepl). Pertanto il coefficiente di
quest’ultima potrebbe di fatto catturare in parte l’impatto delle variabili omesse sulla variabile
dipendente.

3.a.) La nuova specificazione è senz’altro migliore: l’R2 corretto è più elevato, lo standard error
della regressione è più basso, i repressori aggiuntivi sono tutti significativi e l’impatto delle variabili
preesistenti si modifica, suggerendo quindi la presenza di errori di specificazione nella stima
precedente.

3.b) Come accennato precedentemente il coefficiente di log(lotsize) nella prima specificazione


catturava in parte l’impatto delle variabili omesse sulla variabile dipendente. Dunque essendo le
variabili omesse positivamente legate alla variabile dipendente e positivamente correlate con la

3
dimensione dell’appezzamento il segno della distorsione è positivo ed il grado della distorsione è
tanto maggiore quanto più numerose sono le variabili omesse.

ESERCIZIO 3

1.a)
∂ n n
(
∑ i 1 i
Y − β X ) 2
= − 2 ∑ (Yi − β1 X i )X i = 0
∂β 1 i =1 i =1
n

1 n n ∑Y X i i
ˆ 1

n i =1
Yi X i − β 1 ∑
n i =1
X i2 = 0 ⇒ βˆ1 = i =1
n

∑X
i =1
i
2

 n

1.b) Given E  ∑ u i X i  = 0 :
 i =1 
 n
  n  n
 n  n
 ∑ Yi X i   ∑ (β 1 X i + u i ) X i  β 1 ∑ X i + E  ∑ u i X i  β1 ∑ X i2
2

ˆ( ) 
E β1 = E n

i =1 

= E  i =1
 n
 = i =1
 n
 i =1 =
n
i =1
= β1
 ∑ i  ∑ ∑ ∑
2
X  X i2  Xi2
Xi2

 i =1   i =1  i =1 i =1

1.c) Le risposte non cambierebbero perché l’eteroschedasticità influenza gli standard error dei
coefficienti stimati e quindi l’affidabilità delle procedure inferenziali.

2.a) i) Lo stimatore non è BLUE.

ii) In questo caso, la matrice Ω sarà ancora diagonale, gli elementi extradiagonale sono infatti pari
a 0 in quanto le unità sono tra loro indipendenti, ma non identità. Gli elementi della diagonale
principale non sono pari ad uno ma uguali al reddito di quella unità. Le osservazioni quindi non
sono identicamente distribuite in quanto la varianza di ciascuna unità dipende dal suo reddito. In
questo caso, è possibile definire la matrice H, tale che Ω = HH ′ , come una matrice diagonale con
il reddito di ogni unità di osservazione sulla diagonale principale. La matrice inversa, H-1, è pertanto
una matrice con elementi extradiagonali nulli e l’inverso del reddito di i sulla diagonale principale.
Il modello di partenza può essere modificato nel seguente modo per renderlo omoschedastico

(
H −1Y = H −1 X β + H −1u )
ossia

si yi ui
= β1 + β 2 +
yi yi yi
.
ui
Definiamo il nuovo termine di errore come ε i = e calcoliamone la varianza. Essa è pari a
yi

4
var(u i ) σ 2 y i
var(ε i ) = = =σ 2
yi yi

quindi il termine di errore del modello trasformato, ε , è omoschedastico, come voluto. Dunque il
lo stimatore OLS dell’equazione trasformata è BLUE.

2.b) Nel caso in cui, invece, la varianza del termine errore dipenda da una variabile nel modo
seguente

Var (u ) = ς 0 + ς 2 (reddito ) + ε (1)

la procedura da seguire per risolvere il problema dell’eteroschedasticità si compone di due stadi.


Nel primo, si stima il modello con gli OLS e si ottengono i residui. Precisamente
uˆ i = si − βˆ1 − βˆ 2 yi con i = 1,K , N

I residui così ottenuti vengono poi elevati al quadrato e utilizzati come realizzazione campionaria
della variabile var(u) in (1). Pertanto si stima il seguente modello
uˆi2 = ς 0 + ς 2 (reddito ) + ε (2)

In ultimo dalla (2) si ottiene la variabile εˆi = ςˆ0 + ςˆ2 ( reddito ) per i = 1,K , N e si forma la
2

matrice diagonale Ω̂ con ε%i sulla diagonale principale (e zero altrove). Con Ω̂ a disposizione si
2

può applicare la procedura GLS per ottenere

βˆGLS = ( X ′Ω −1 X ) ( X ′Ω Y )
−1
−1

Tale procedura prende il nome di FGLS, feasible generalized least squares: è una procedura
asintotica pertanto può essere applicata solo per grandi campioni (n grande).