Sei sulla pagina 1di 28

Principi di

Econometria
lezione 2
i dati

Principi di Econometria
lezione 2

AA 2016-2017
Paolo Brunori

Regressione
lineare
univariata

correlazioni

Principi di
Econometria
lezione 2
i dati

- la concomitanza di due eventi non ha significato


statistico
- se una donna che indossa il velo disoccupata questo
non mi dice nulla sulla discriminazione dei datori del
lavoro
- ma una sistematica covarianza di due fenomeni ci
possono insegnare qualcosa sul funzionamento del
mondo

Regressione
lineare
univariata

correlazione

Principi di
Econometria
lezione 2

- se le donne che indossano il velo hanno una


probabilit minore di ottenere un lavoro a parit di
altre condizioni allora c discriminazione
- uno studio pubblicato questo mese dalleconomista
austriaca Doris Weichselbaumer (2016) ha indagato
se vi fosse una probabilit inferiore di essere
contattati per un colloquio di lavoro
- ha mandato 1474 mail ad altrettanti posti di lavoro
includendo CV (identico) e foto (diverse) di una
candidata immaginaria
- verificando lesistenza di una forte discriminazione
verso donne con nome turco e che indossano il velo

i dati
Regressione
lineare
univariata

correlazione che dimostra discriminazione

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

fonte: Weichselbaumer (2016)

correlazione che dimostra discriminazione

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

fonte: Weichselbaumer (2016)

lo studio della correlazione

Principi di
Econometria
lezione 2
i dati

- il caso dello studio di Weichselbaumer molto


particolare
- siamo in una situazione simile a quella del laboratorio
in cui si possono controllare tutte le variabili (il CV,
la mail di accompagnamento, il tipo di lavoro)
- non siamo sempre cos fortunati e spesso occorre
accontentarsi di dati molto meno ad hoc
- quando non si possono considerare tutte le altre
condizioni una correlazione potrebbe essere spuria
- una correlazione spuria una correlazione che non
deriva da un nesso causa-effetto

Regressione
lineare
univariata

il mantra: correlazione non causalit

Principi di
Econometria
lezione 2
i dati

- i nessi di causalit sono i meccanismi di


funzionamento dei fenomeni
- un esercizio per cominciare a ragionare come un
econometrico: quando vedete due cose correlate
chiedetevi sempre correlazione o causalit?
- possiamo pensare una teoria che spieghi come uno
fenomeno implichi laltro?
- la nostra teoria credibile?

Regressione
lineare
univariata

causa ed effetto: titolo di studio e reddito

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

causa ed effetto: cibo biologico e autismo

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

causa ed effetto: margarina e divorzi

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

causa ed effetto: annegati e Nicolas Cage

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

il processo che genera i dati (DGP)

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

- i nostri modelli ci suggeriscono relazioni fra variabili:


I
I
I

sport peso
P QD
PVINO Qualit

- in questi casi potremmo essere interessati a conoscere


lentit del legame fra le due variabili

il processo che genera i dati (DGP)

Principi di
Econometria
lezione 2
i dati

- in alcuni casi difficile sapere in anticipo qual la


direzione della relazione:
I

I
I

cosa accade accade alla fertilit degli italiani se


organizzo il Fertility Day?
cosa accade al PIL se diminuisco la spesa pubblica?
cosa accade alla disoccupazione se abolisco lart. 18?

- in questi casi vogliamo capire se esiste una relazione e


qual il segno della relazione

Regressione
lineare
univariata

regressione lineare

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

- prima approssimazione: la relazione ipotiziamo sia


lineare
- equivalente a dire che Y = 0 + 1 X
- dove Y leffetto (variabile dipendente) e X la causa
(variabile indipendente)

PIL pro capite e felicit

Principi di
Econometria
lezione 2
i dati

- tornando al problema di ieri


- possiamo verificare la relazione fra felicit (variabile
dipendente) e PIL pro capite (variabile indipendente)
guardando a due fonti di dati:
- la media della felicit percepita pubblicato nel
World Happiness Report
- il PIL pro capite dalla Banca Mondiale
- i due dati sono disponibili sulla pagina del corso

Regressione
lineare
univariata

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

il modello lineare in questo caso

Principi di
Econometria
lezione 2
i dati

- il nostro DGP ipotizza una relazione:


felicit mediai = 0 + 1 PIL pro capitei

- felicit: variabile dipendente


- PIL pro capite: variabile indipendente (chiamata
anche regressore o variabile esplicativa)

Regressione
lineare
univariata

Principi di
Econometria

il modello lineare in questo caso

lezione 2
i dati

- immaginiamo ad esempio che in un paese con PIL


pro capite zero tutti rispondano indicando il minimo
possibile livello di felicit
- questo valore identifica il coefficiente 0
(Y = 0 + 1 0 = 0 )
- immaginiamo poi che ogni 5.000 dollari di PIL pro
capite in pi la felicit salga di un gradino nella scala
(ununit)
- X = 5000 Y = 1
- questo identifica il coefficiente 1 =

1
5000

= 0.0002

Regressione
lineare
univariata

PIL pro capite e felicit: relazione


perfettamente lineare

10
5

felicit

15

Se la realt corrisponde esattamente alla nostra ipotesi


dovremmo osservare questo:

20000

40000
PIL pro capite 2011

60000

80000

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

il modello lineare in questo caso

Principi di
Econometria
lezione 2

- in realt sappiamo:
1 che potrebbero esserci molte altre variabili che
influenzano la felicit
2 che la relazione fra le due potrebbe non essere
lineare, stiamo facendo unapprossimazione

- quindi ci aspettiamo che i dati non siano


perfettamente coerenti con il modello
felicit mediai = 0 + 1 PIL pro capitei + ui

- dove ui la distanza fra quello che supponiamo


essere il livello di felicit associato con un certo
livello di PIL e la realt

i dati
Regressione
lineare
univariata

Principi di
Econometria

PIL pro capite e felicit


I dati reali, come sappiamo mostrano una relazione solo
molto vagamente positiva e lineare:

lezione 2
i dati

6
5
3

felicit (2010-2014)

Regressione
lineare
univariata

20000

40000

60000

80000

PIL pro capite 2011

fonte: World Bank (2011), World Happiness Report (2015)

Principi di
Econometria

PIL pro capite e felicit


I dati reali, come sappiamo mostrano una relazione solo
molto vagamente positiva e lineare:

lezione 2
i dati
Regressione
lineare
univariata

CR
MX

DK

CO
VE PA

6
5
4

felicit (2010-2014)

DO

OM
IL
MT
CY
SI ES

IS
CACH
FI
SE
AU NL
IE

GT TM
BE
DEAT
NI
AR
GB
HN
PH
UY
BR
UZPY EC
TH
CL PL
SV
JM
BZ
MY
CZ IT
PE KZ
GR
FR
JP
BO
ZA
SK
SA
MW
LA JOCN
EE
VN
ID
KR
PK
ROTR HR
MU
KG
BA
AZ
LT PT
MN DZ
BT RS RU
IN EG TN BY
LV HU
TD
GH
LB
NP
BD
NG
MD
MA
LS
ME
YE
TJ LKUA
ZM
SD
RW
KH
MR
IQAM
ML
MK BW
CF
AL BG
GN
UG
SN
LR
BF
CI
GE
AO
ET
GA

NO
LU
AE
US
HK

QA
KW

SG

KM
HT
CM
NE
MZ
MG
KE
SL
BJ
BI
TG
TZ

20000

40000

60000

80000

PIL pro capite 2011

fonte: World Bank (2011), World Happiness Report (2015)

Principi di
Econometria

PIL pro capite e felicit


la nostra ipotesi non fa un gran lavoro nellappossimare
questa relazione

lezione 2
i dati
Regressione
lineare
univariata

CR
MX

DK

CO
VE PA

6
5
4

felicit (2010-2014)

DO

OM
IL
MT
CY
SI ES

IS
CACH
FI
SE
AU NL
IE

GT TM
BE
DEAT
NI
AR
GB
HN
PH
UY
BR
UZPY EC
TH
CL PL
SV
JM
BZ
MY
CZ IT
PE KZ
GR
FR
JP
BO
ZA
SK
SA
MW
LA JOCN
EE
VN
ID
KR
PK
ROTR HR
MU
KG
BA
AZ
LT PT
MN DZ
BT RS RU
IN EG TN BY
LV HU
TD
GH
LB
NP
BD
NG
MD
MA
LS
ME
YE
TJ LKUA
ZM
SD
RW
KH
MR
IQAM
ML
MK BW
CF
AL BG
GN
UG
SN
LR
BF
CI
GE
AO
ET
GA

NO
LU
AE
US
HK

QA
KW

SG

KM
HT
CM
NE
MZ
MG
KE
SL
BJ
BI
TG
TZ

20000

40000

60000

80000

PIL pro capite 2011

fonte: World Bank (2011), World Happiness Report (2015)

Principi di
Econometria

la migliore approssimazione lineare


Per migliorare la situazione possiamo cercare la migliore
possibile approssimazione lineare della relazione che
vediamo nei dati

CR

DK

MX

IS
CO

FI

VE PA

6
5
4

felicit (2010-2014)

DO

OM
IL

CA CH
SE
AU NL
IE

GT TM
MT
BEDE AT
NI
AR
CY
GB
HN
PH
UY
SI ES
BR
UZ PY EC
TH
CL PL
SV
JM
BZ
MY
CZ IT
PE KZ
GR
FR
JP
BO
ZA
SK
SA
MWLA JO CN
EE
VNID
KR
PK
RO TR HR
MU
KG
BAAZ
LT
PT
MN DZ
BT
RS
RU
IN EG TN
BY
LV HU
TD
GH
LB
NP
BD
NG
MDMA
LS
ME
YE
TJ LKUA
ZM
SD
RW
KH
MRIQAM
ML
MK BW
CF
AL
BG
GN
UG
SN
LR
BF
CI
GE
AO
ET
GA

NO
LU
AE
US
HK

QA
KW

SG

KM
HT
CM
NE
MZ
MG
KE
SL
BJ
BI
TG
TZ

20000

40000

60000

80000

PIL pro capite 2011

fonte: World Bank (2011), World Happiness Report (2015)

lezione 2
i dati
Regressione
lineare
univariata

Principi di
Econometria

la migliore approssimazione lineare

lezione 2
i dati

CR

IS
CO

FI

VE PA

6
5

felicit (2010-2014)

DO

Regressione
lineare
univariata

DK

MX

OM
IL

CA CH
SE
AU NL
IE

GT TM
MT
BEDE AT
NI
AR
CY
GB
HN
PH
UY
SI ES
BR
UZ PY EC
TH
CL PL
SV
JM
BZ
MY
CZ IT
PE KZ
GR
FR
JP
BO
ZA
SK
SA
MWLA JO CN
EE
VNID
KR
PK
RO TR HR
MU
KG
BAAZ
LT
PT
MN DZ
BT
RS
RU
IN EG TN
BY
LV HU
TD
GH
LB
NP
BD
NG
MDMA
LS
ME
YE
TJ LKUA
ZM
SD
RW
KH
MRIQAM
ML
MK BW
CF
AL
BG
GN
UG
SN
LR
BF
CI
GE
AO
ET
GA

NO
LU
AE
US

QA

u_i

HK

KW

SG

KM
HT
CM
NE
MZ
MG
KE
SL
BJ
BI
TG
TZ

20000

40000

60000

80000

PIL pro capite 2011

fonte: World Bank (2011), World Happiness Report (2015)

la migliore approssimazione lineare:


retta dei minimi quadrati

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

- migliore la capacit di spiegare i dati della retta


minori gli errori commessi
- ui = Yi [0 + 1 Xi ] lerrore di interpolazione per
losservazione i-esima
- gli stimatori dei minimi quadrati 0 , 1 minimizzano:
n
X

(Yi 0 1 Xi )2 =

1=1

n
X
1=1

ui2

il modello lineare in generale

Principi di
Econometria
lezione 2
i dati

- in generale: Yi = 0 + 1 Xi + ui il modello di
regressione lineare con un solo regressore
- Y : variabile dipendente
- X : variabile indipendente (anche chiamata regressore
o variabile esplicativa)
- coefficienti o paramentri:
0 : intercetta
1 : pendenza

- ui : errore di disturbo

Regressione
lineare
univariata

interpretazione del modello lineare in


generale

Principi di
Econometria
lezione 2
i dati
Regressione
lineare
univariata

0 : intercetta, il valore che ha la Y quando X = 0


1 : pendenza, mi dice di quanto aumenta Y quando
X aumenta di ununit
ui : errore, mi indica di quanto sbaglio ad
approssimare linearmente la relazione che lega X e Y