Sei sulla pagina 1di 8

ISTRUZIONI

Il candidato deve rispondere a tutti i quesiti contenuti nella PARTE A dell’esame e due quesiti a scelta
contenuti nella PARTE B dell’esame.
Il punteggio complessivo dell’esame verrà ripartito nel modo seguente: 40% del voto verrà assegnato sulla
base delle risposte ai quesiti della PARTE A (10% su ciascuna delle domande); il restante 60% verrà
assegnato sulla PARTE B (30% su ciascuna delle domande).
Nessun punto aggiuntivo verrà assegnato a coloro che tenteranno di rispondere a più di due quesiti nella
PARTE B.
PARTE A

1) Si definiscano brevemente i seguenti concetti:


a) Errori standard robusti
b) R2 corretto
c) Collinearità perfetta

2) Mostrare se e in che modo i seguenti modelli possono essere ricondotti al modello lineare standard:
 1 
a) ln Yi  1   2    ui
 Xi 
b) Yi  e1  2 X i ui
c) Yi  1  e1  2 X i ui
X 2i
d) Yi  u
1  2 X 3 i i

3) Sia dato il modello di regressione


wi  ˆ1  ˆ2espi  uˆi (1)

dove wi è il salario individuale orario e esp sono gli anni di esperienza. Si supponga che gli anni di esperienza
siano l’unica determinante del livello dei salari. Assumendo ˆ1  0 e ˆ2  0

a) si mostri in un grafico la retta stimata (indicare esplicitamente la variabile sull’asse delle ascisse, delle
ordinate, l’intercetta e la pendenza della retta)
In un secondo modello si vuole verificare l’ipotesi che la relazione tra salario ed esperienza sia di tipo non
lineare. Si stima quindi il modello
ˆ 2
wˆ i  ˆ1   uˆi (2)
espi

Assumendo ˆ1  0 e ˆ 2  0 ,

b) si dia un’interpretazione del coefficiente negativo


̂ 2 . E’ il segno del coefficiente ̂ 2 nella
ˆ
specificazione (2) compatibile con il segno del coefficiente 2 nella specificazione (1)? Spiegare.
c) si ricavi l’effetto marginale di esp su w nella specificazione (1) e (2).

4) Per ciascuna affermazione dire se è vera o falsa e motivare brevemente la risposta:


a) Se un parametro stimato del modello lineare è significativo per un livello di significatività del
10%, lo è anche per un livello di significatività del 5%
b) L’utilizzo degli errori standard robusti (White) rende le procedure di inferenza standard valide
anche in presenza di errori eteroschedastici e lo stimatore dei minimi quadrati ordinari più preciso
rispetto allo stimatore dei minimi quadrati generalizzati.
c) Quando i regressori sono correlati, le stime OLS presentano necessariamente un problema di
multicollinearità.

Esame-Prova, 30 aprile 2014 2


PARTE B

Esercizio n. 1

1. Un ricercatore stima il seguente modello per studiare se esiste sostituzione (tradeoff) tra ore di sonno e ore di
lavoro e per studiare l’effetto di altri fattori che possono influenzare le ore di sonno:
min_sonno  1  2 min_lav  3istr  4eta  
dove min_sonno sono i minuti dedicati al sonno in una settimana, min_lav sono i minuti dedicati all’attività
lavorativa in una settimana, istr sono gli anno di istruzione e eta è l’età (in anni) dell’individuo.
Se esiste sostituzione tra ore dedicate al sonno e ore dedicate all’attività lavorativa, qual è il segno atteso del
coefficiente β1? Come è possibile interpretare tale coefficiente?
Utilizzando un campione di 706 individui, viene stimata la seguente equazione (errori standard in parentesi):

min _ sonno  3638.25 0.148 min _ lav  11.13 istr  2.20 eta
(112.28) (0.017) (5.58) (1.45)

n  706 (1)
R 2  0.113

(a) Guardando al coefficiente di min-lav, esiste tradeoff (relazione negativa) tra ore di lavoro e di sonno? Se un
individuo lavora 5 ore in più a settimana, di quanti minuti diminuisce il tempo dedicato al sonno?
(b) Discutere se le variabili istr e eta sono individualmente significative al 5% di confidenza. E al 10%?
(c) Se si eliminano istr e eta dalla specificazione (1), si ottengono i seguenti risultati:

min _ sonno  3586.38 0.151 min_lav


(38.91) (0.016)

n  706 (2)
R  0.103
2

Utilizzando la relazione tra R2 e somma dei quadrati dei residui (RSS) testare se istr e eta sono
congiuntamente significative (specificare l’ipotesi nulla, l’ipotesi alternativa, la statistica test utilizzata , i
gradi di libertà e il valore critico).

(d) Il ricercatore decide di stimare una terza equazione in cui introduce due nuove esplicative: eta2 e la dummy
M che prende valore 1 se l’individuo osservato è di sesso maschile. I risultati sono i seguenti:

min _ sonno  3640.83 0.163 min_lav  11.71istr  8.70 eta  0.128 eta 2  87.75 M
(235.11) (0.018) (5.86) (4.21) (0.064) (34.33)

n  706 (3)
R  0.123
2

(i) Qual è l’ effetto marginale dell’età dell’individuo sul tempo dedicato a dormire? Stabilire se tale
effetto è negativo oppure positivo e argomentare la risposta.

Esame-Prova, 30 aprile 2014 3


(ii) Date le informazioni disponibili è possibile stabilire se i coefficienti dei regressori eta e eta2 nella
specificazione (3) sono congiuntamente significativi? Motivare la risposta.
(iii) I minuti di sonno differiscono in maniera significativa tra individui di sesso maschile e femminile?
Di quale ammontare?
(iv) Partendo dalla specificazione (3), assumendo che la sostituzione tra ore si sonno e ore lavorate sia
più forte per gli uomini, qual è il segno che ti aspetti assuma il coefficiente del nuovo regressore?
Quale test suggerisci per verificare che il tradeoff è più forte per gli uomini che per le donne
(mostrare la specificazione che si vuole stimare, la statistica test rilevante e riportare il valore
critico della statistica ad un livello di significatività del 5%)

Esame-Prova, 30 aprile 2014 4


Esercizio n. 2

Un ricercatore vuole analizzare la relazione esistente tra i prezzi delle abitazioni e le loro caratteristiche. I dati che
utilizziamo provengono da uno studio di Anglin e Gencay (Journal of Applied Econometrics, 1996), e contengono
i prezzi di 546 abitazioni vendute nei mesi di luglio, agosto e settembre 1987 nella città di Windsor in Canada,
nonché le loro principali caratteristiche. Il database contiene le seguenti variabili:

price: prezzo di vendita dell’abitazione


lotsize: dimensione dell’appezzamento in piedi quadrati (min 1650, max 16200)
lotsize_c: variabile categorica, =1 se la dimensione dell’appezzamento è compresa tra 1650 e 3600, =2 se la
dimensione dell’appezzamento è compresa tra 3620 e 4600, =3 se la dimensione
dell’appezzamento è compresa tra 4632 e 6360, =4 se la dimensione dell’appezzamento è
compresa tra 6400 e 16200
bedrooms: numero di camere da letto
bathrms: numero di bagni
stories: numero di piani
driveway: variabile dummy, =1 se c’è un passo carrabile, 0 altrimenti
recroom: variabile dummy, =1 se c’è un locale ricreativo, 0 altrimenti
fullbase: variabile dummy, =1 se c’è un seminterrato, 0 altrimenti
gashw: variabile dummy, =1 se l’impianto di riscaldamento dell’acqua funziona a gas, 0 altrimenti
airco: variabile dummy, =1 se c’è un impianto di climatizzazione centralizzato, 0 altrimenti
garagepl: numero di posti auto coperti
prefarea: variabile dummy, =1 se la casa è localizzata in un’area di pregio

1. Sulla base delle informazioni riportate nella tabella a doppia entrata (tabella 1) ottenuta come segue
utilizzando il comando tab di Stata

a. Indicare la percentuale di abitazioni che hanno più di un posto macchina

Esame-Prova, 30 aprile 2014 5


b. Indicare la percentuale di abitazioni che hanno due posti macchina per ciascuna dimensione
dell’appezzamento

2. Il ricercatore stima il seguente modello:


log( prezzoi )  1  2 log(lotsizei )  3bedroomsi  4bathrmsi  5aircoi   i

L’output di Stata che ottiene (tabella 2) è il seguente:

a. Cosa rappresentano i coefficienti stimati? (Si commenti la risposta per ciascuna variabile)
b. Quale è la differenza nel valore atteso del logaritmo del prezzo di vendita di una casa con 4 camere da
letto, un bagno, un appezzamento di 5000 piedi quadrati e priva di climatizzazione centralizzata e
quello di una casa con 5 camere da letto, due bagni, un appezzamento di 5000 piedi quadrati e con
climatizzazione centralizzata?
c. Si argomenti la bontà di adattamento del modello ai dati.
d. Ritieni che il coefficiente della variabile log(lotsizei ) catturi la relazione causale tra il logaritmo
della dimensione dell’appezzamento (in piedi quadrati) e il logaritmo del prezzo di vendita
dell’abitazione? Si argomenti la risposta usando anche le informazioni riportate nella tabella a doppia
entrata (tabella 1) .

3. Successivamente il ricercatore stima un nuovo modello, includendo tra i regressori le variabili omesse in
precedenza. I risultati (tabella 3) sono riportati di seguito:

Esame-Prova, 30 aprile 2014 6


a. Dal confronto tra i due output quale specificazione ritieni sia migliore?
b. Da un confronto dei coefficienti stimati dell’impatto di log(lotsizei ) su log( pricei ) nei due modelli, sei
in grado di trarre alcuna conclusione in merito alla possibile presenza di errori di specificazione? Spiegare.
c. Da cosa dipende il grado e il segno della distorsione in presenza di errore di specificazione da variabile
omessa?

Esame-Prova, 30 aprile 2014 7


Esercizio n. 3

1. Si consideri il seguente modello di regressione (senza intercetta):

Yi  1 X i  ui
dove ui è un termine di errore iid, con media 0 e varianza 2 . Il numero complessivo delle osservazioni è pari a n.

(a) Utilizzando il metodo OLS di minimizzazione della somma dei quadrati degli scarti tra i valori
osservati e quelli predetti (cioè, minimizzando la somma dei quadrati dei residui), dimostrare che lo
  n

XY i i
stimatore OLS di 1 (ossia ˆ1 ) è il seguente: ˆ1  i
n

X i
i
2

(b) Dimostrare che ˆ1 è uno stimatore corretto di 1



(c) Spiegare come le tue risposte ai punti a, e b cambierebbero se il termine di errore di ciascuna
osservazione i fosse distribuito con varianza i2 . Motivare la risposta.
[Suggerimento: non è richiesta una dimostrazione formale per rispondere alla domanda di cui al punto
(d)]

2.

Si consideri la seguente equazione di risparmio
si  1  2 yi  ui (1)

dove si e yi sono rispettivamente risparmio e reddito annuale della famiglia i-esima per un campione di N
famiglie in un dato anno.
(a) Si supponga che la varianza dell’errore sia proporzionale al reddito, ossia

var(ui )   2 yi (2)

L’equazione (2) significa che la volatilità del risparmio aumenta all’aumentare del reddito
o Che cosa comporta l’assunzione (2) sullo stimatore OLS dei coefficienti 1 e  2 ?

o Come è possibile utilizzare l’ informazione nell’equazione (2) per ottenere a partire dall’equazione
(1) un modello che soddisfi le condizioni standard di Gauss- Markov?
o Nella specificazione suggerita nel punto precedente lo stimatore OLS è BLUE? Argomentare la
risposta.
(b) Assumendo ora che la relazione tra var(ui) e yi non valga esattamente, ossia:
var(ui )  1   2 yi   i (3)
indicare una procedura alternativa per tener conto della relazione tra la varianza dell’errore e il reddito e
specificare in quali circostanze tale procedura è valida..

Esame-Prova, 30 aprile 2014 8