Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2
Definiamo un modello previsionale
Un modello è una rappresentazione formalizzata e semplificata della realtà
basata su assunzioni!
• 𝑌 = 𝑇𝑒𝑠𝑡𝑆𝑐𝑜𝑟𝑒
• 𝑋 = 𝐶𝑙𝑎𝑠𝑠𝑆𝑖𝑧𝑒 = 𝑆𝑇𝑅 𝑠𝑡𝑢𝑑𝑒𝑛𝑡/𝑡𝑒𝑎𝑐ℎ𝑒𝑟 𝑟𝑎𝑡𝑖𝑜
3
Modello di regressione classico
𝐸(𝑌𝑖 |𝑋𝑖 ) = 𝛽0 + 𝛽1 𝑋𝑖
⇓
1. 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑢𝑖
2. 𝐸 𝑢𝑖 |𝑋𝑖 = 0
𝛽0 + 𝛽1 𝑋
N.B. Supponiamo che i punti sopra siano una buona rappresentazione della popolazione
2
Quindi: (𝛽መ0 , 𝛽መ1 ) ⇒ min σ𝑛𝑖=1 𝑌𝑖 − 𝑌𝑖
5
Formule degli stimatori OLS
6
Esempio numerico con tre osservazioni
ഥ ) (𝒀 − 𝒀
ഥ) ഥ 𝟐 ഥ )(𝒀 − 𝒀
ഥ)
obs. 𝑿 𝒀 (𝑿 − 𝑿 𝑿−𝑿 (𝑿 − 𝑿 𝒀 ෝ
𝒖 ത 𝑖 − 𝑌)
σ𝑖(𝑋𝑖 − 𝑋)(𝑌 ത
1 22 643 -4 5 16 -20 646 -3 𝛽መ1 =
2 26 644 0 6 0 0 638 6
σ𝑖 𝑋𝑖 − 𝑋ത 2
64
3 30 627 4 -11 16 -44 630 -3 = − 32 = −2
somma 78 1914 32 -64 1914 0
media 26 638 638 0
Y
650
𝛽መ0 = 𝑌ത − 𝛽መ1 𝑋ത
645
= 638 − −2 26
= 690 640
635
630
625
18 20 22 24 26 28 30 32
7
Applicazione al Caso Studio
La teoria del Capital Assets Pricing Model (CAPM) sostiene che in un mercato
efficiente:
𝑅 − 𝑅𝑓 = 𝛽 𝑅𝑚 − 𝑅𝑓
• 𝛽 indica quanto il titolo è più rischioso 𝛽 > 1 o meno rischioso (𝛽 < 1) rispetto
al mercato.
N.B. Quindi I titoli che rendono di più (meno) della media del mercato, sono
inevitabilmente più (meno) rischiosi!!
9
Il metodo OLS per stimare il beta di un titolo
La relazione:
𝑅 − 𝑅𝑓 = 𝛽 𝑅𝑚 − 𝑅𝑓
𝑅𝑡 = 𝛽0 + 𝛽𝑅𝑚,𝑡 + 𝑢𝑖
dove 𝛽0 = 1 − 𝛽 𝑅𝑓
Il coefficiente 𝛽 può quindi essere stimato con il metodo OLS utilizzando i rendimenti,
𝑅𝑡 e 𝑅𝑚,𝑡 di un periodo
10
Esempio (un po’ datato!)
ALERTS COEFFICIENTI
Rilevazione al
Rilevazione al 12.3.1999
17.3.1999
TITOLI Beta_0 BETA VOLATILITA'
ALITALIA 0,04 0,86 13,54
ALLEANZA -0,11 1,17 9,06
B.CA DI ROMA -0,30 1,33 15,51
B.CA
-0,03 1,35 15,18
FIDEURAM
B.CA INTESA -0,04 1,13 12,04
BENETTON -0,05 0,96 7,51
COMIT -0,06 1,25 11,18
COMPART -0,17 1,17 13,72
EDISON 0,05 0,85 13,11
ENI 0,01 0,77 4,65
FIAT -0,18 1,20 12,52
FINMECCANIC
0,09 1,03 16,62
A
11
Misure di bontà di adattamento: l’indice 𝑹𝟐
La seguente uguaglianza è valida per ogni regressione stimata con il metodo OLS:
𝑛 𝑛 𝑛
2 2
𝑌𝑖 − 𝑌ത 2
= 𝑌𝑖 − 𝑌ത + 𝑌𝑖 − 𝑌𝑖
𝑖=1 𝑖=1 𝑖=1
𝑬𝑺𝑺 𝑺𝑺𝑹
Definiamo l’indice: 𝑹𝟐 = =𝟏−
𝑻𝑺𝑺 𝑻𝑺𝑺
0 ≤ 𝑅2 ≤ 1
12
L’errore standard della regressione, SER
Stima l’ampiezza media degli errori 𝑢𝑖 :
𝑆𝐸𝑅 = 𝑠𝑢ෝ2
dove:
𝑛
1 𝑆𝑆𝑅
𝑠𝑢ෝ2 = 𝑢ො 𝑖2 =
𝑛−2 𝑛−2
𝑖=1
Nota 𝑆𝐸𝑅 ≥ 0;
𝑆𝐸𝑅 = 0 ⇔ adattamento perfetto
1
𝑠𝑌2 = 𝑌𝑖 − 𝑌ത 2
𝑆𝐸𝑅 ≈ 𝑠𝑌2 ⇔ adattamento nullo 𝑛−1
13
Modello classico e Modello causale
14
Modello causale
Definiamo il modello regressivo causale:
𝒀𝒊 = 𝜷𝟎 + 𝜷𝟏 𝑿𝒊 + 𝒖𝒊
𝜷𝟏 = 𝚫𝒀𝒊 Τ𝚫𝑿𝒊 𝒄. 𝒑.
• In questo modello 𝑢𝑖 è l’errore dovuto all’effetto pieno di tutti gli altri fattori influenti su 𝑌
• Le stime OLS di 𝛽0 e 𝛽1 per essere accettabili richiedono opportune assunzioni
15
Assunzioni del metodo OLS
ASSUNZIONE 1 (A1): 𝐸 𝑢𝑖 𝑋𝑖 = 0
Significato: L’effetto 𝑢𝑖 dei fattori omessi deve essere mediamente nullo
ad ogni livello di 𝑋𝑖
16
Assunzioni del metodo OLS
A1: 𝐶𝑜𝑚𝑒 𝑐𝑎𝑝𝑖𝑟𝑒 𝑠𝑒 è 𝑠𝑜𝑑𝑑𝑖𝑠𝑓𝑎𝑡𝑡𝑎?
17
Correlazione e indipendenza in media
𝐸 𝑢𝑖 𝑋𝑖 = 0 ⇒ 𝐶𝑜𝑟𝑟 𝑢𝑖 , 𝑋𝑖 = 0
⇓
𝐶𝑜𝑟𝑟 𝑢𝑖 , 𝑋𝑖 ≠ 0 ⇒ 𝐸 𝑢𝑖 𝑋𝑖 ≠ 0
• Nell’esempio dei distretti, i distretti con classi più grandi potrebbero avere più alunni di
famiglia straniera (alunni che hanno difficoltà con la lingua inglese!)
18
Esperimento Controllato Casualizzato
Esempio: Si vuole capire di quanto si riducono i giorni di guarigione, Y, se si utilizza
una nuova terapia, codificata con X=1 (terapia tradizionale X=0)
Nell ECC le unità di osservazione (pazienti) vengono assegnate casualmente al
gruppo di trattamento (X=1) o al gruppo di controllo (X=0).
Giorni di guarigione con ECC
14
12
y = -3x + 10
10
• 𝐸 𝑢𝑖 𝑋𝑖 = 0 = 0
8
6 • 𝐸 𝑢𝑖 𝑋𝑖 = 1 = 0
4
2
Retta di regressione nella popolazione
0
-0.5 0 0.5 1 1.5
19
Esperimento sbagliato
Esempio: Stesso esempio di prima, ma adesso il gruppo di trattamento (X=1) sono
pazienti anziani e quello di controllo sono giovani (X=0)
Giorni di guarigione
14
12
y = -3x + 10
10
8 • 𝐸 𝑢𝑖 𝑋𝑖 = 0 < 0
y=x+8
6 • 𝐸 𝑢𝑖 𝑋𝑖 = 1 > 0
4
0
-0.5 0 0.5 1 1.5
20
Assunzioni del metodo OLS
Nei casi a) e b) il metodo OLS può funzionare ancora, ma bisogna stare molto attenti
che l’A1 sia soddisfatta.
21
Assunzioni del metodo OLS
ASSUNZIONE 3 (A3): gli outliers (dati che si discostano molto dalla media)
sono improbabili
SI’
L’A3 è sempre soddisfatta quando:
𝑌𝑖 |𝑋𝑖 ~𝑁 ⟹
NO
⟸ Se l’A3 non è vera, allora gli outliers si
ripetono non di rado nei grandi campioni
creando problemi vari
22
Ricapitoliamo per non fare confusione
23
Distribuzione campionaria degli stimatori OLS
• Non dimentichiamo mai che uno stimatore è una v.c., ovvero fornisce stime
che variano al variare del campione!!!
• Gli stimatori 𝛽መ0 e 𝛽መ1 sono v.c. e quindi hanno una loro distribuzione;
• Se valgono le assunzioni fatte, le distribuzioni degli stimatori 𝛽መ0 e 𝛽መ1 sono
Normali, anche se Y e X non lo sono, purché il campione sia abbastanza
grande;
24
Esempio di output di stima OLS con Gretl
25