Statistica economica
a.a. 2012/13
• Poichè Galton notò una tendenza delle altezze dei figli a spostarsi nella
generazione successiva verso l’altezza media, scrisse che ciò
costituiva una “regression towards mediocrity” e la relazione statistica
stimata dalle osservazioni fu chiamata il modello della regressione.
regressione
2
Se la correlazione misura l’intensità e il
segno del legame lineare tra due
variabili, l’obiettivo delle tecniche di
regressione è, invece, quello di
individuare il tipo di relazione funzionale
che esiste tra una variabile dipendente
(o spiegata o endogena) e una o più
variabili indipendenti (o esplicative o
esogene).
3
Affermare che il fenomeno Y “dipende” dal fenomeno X secondo la
relazione matematica
Y=f(X)
Y=f(X)+u
Dove u costituisce la componente stocastica del modello ed è
rappresentata da una variabile casuale che compendia l’insieme di
circostanze che impediscono a tale relazione di essere un legame teorico
di tipo matematico.
4
Perché si introduce la componente di errore nel modello?
Negli studi empirici la relazione tra due variabili non è mai una relazione funzionale
esatta del tipo Y=f(X)
Esempi:
Nello studio della relazione di dipendenza del consumo familiare (Y) dal reddito
familiare (X), è ragionevole ipotizzare che famiglie con lo stesso reddito abbiano
comportamenti di consumo differenti;
La dimensione di un punto vendita non può essere la sola variabile esplicativa del
fatturato del punto vendita stesso;
Il termine di errore u tiene conto di ogni altro fattore (non osservato o non
osservabile) che, oltre alla variabile esplicativa, può influenzare la risposta Y.
Esempio: Il consumo delle famiglie può dipendere, oltre che dal reddito disponibile, anche dal
numero di componenti, dalla loro età e dal livello di istruzione 5
Perché si introduce la componente di errore nel modello?
6
La regressione
7
Principali caratteristiche delle analisi di regressione
8
Principali fasi di un’analisi di regressione lineare
ii. Si stimano i parametri di tale relazione funzionale sulla base dei dati
campionari a disposizione;
iii. L’analisi è completata con appropriati test statistici sulla significatività dei
parametri e la valutazione della bontà dell’adattamento del modello ai
dati;
9
Semplice
Regressione
Lineare
Multipla
10
Partiamo da un esempio… [rif. Bracalente et al.2009]
Per decidere le dimensioni di nuovo punto vendita, una catena di supermercati ha effettuato
un’indagine per studiare la relazione tra dimensione del negozio e le vendite settimanali. A tale
proposito viene estratto un campione di 10 supermercati:
IPOTESI DI RICERCA: Si ipotizza che a maggiori spazi espositivi tendano a corrispondere valori più elevati
delle vendite
11
¾Per mettere in evidenza la relazione lineare esistente tra due caratteri è possibile rappresentare
l’insieme delle coppie di punti su un asse cartesiano (in cui sull’asse delle ascisse viene riportata,
come di consueto, la variabile X e sull’asse delle ordinate la variabile Y).
Dalla forma che assume la nuvola di punti è possibile “stabilire” il tipo di correlazione lineare
esistente tra le due variabili.
Correlazione lineare
ρXY = −1 perfetta discordanza
n
σXσ Y n n
∑ (xi − x ) ∑ (yi − y )
2 2
ρXY = 0 assenza di legame lineare
i =1 i=1
Dal diagramma di dispersione (scatter plot) si può avere conferma della linearità e della direzione
della relazione ipotizzata.
V 350
o La relazione è evidenziata
l 300 anche dal valore del
u coefficiente di
250
m correlazione lineare
e 200 r=0.893
v 150
e
100
n
d 50
i
t 0
e 0,0 50,0 100,0 150,0 200,0
Spazio espositivo
14
IL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Yi = β 0 + β1 X i + ui
i = 1, 2,…, n
Dove, per ogni osservazione i nel campione:
ei =Yi − β0 (
i +β
i X =Y −β
1 i i
i −β
0
iX )
1 i
∑e = ∑( )
n n 2
2 i −β
Yi − β i X
i 0 1 i
i =1 i =1
Gli stimatori OLS minimizzano la somma dei quadrati degli errori e sono indicati con b0 e
b1
16
Per minimizzare la somma dei quadrati degli errori si calcolo innanzitutto le derivate parziali
∂ n
( ) ( )
2 n
∂β
∑
i i =1
Yi − β 0 − β 1 X i = −2∑ Yi − β
i i
=1
i −β
0
i X
1 i
0 i
∂ n
( ) ( )
2 n
∂β
∑
i i =1
i −β
Yi − β 0
i X = −2
1 i ∑
i =1
i −β
Yi − β 0
i X X
1 i i
1
i e β
Gli stimatori OLS sono i valori di β i per i quali le derivate sono uguali a zero.
0 1
⎧ n
⎪⎪ ∑ (Yi − b0 − b1 X i ) = 0
i =1
⎨ n
⎪ (Y − b − b X ) X = 0
⎪⎩∑
i =1
i 0 1 i i
Equazioni normali
Quindi si ha:
⎧ n n
⎧ n n
⎪⎪ ∑ Yi = nb0 + ∑ b1 X i ⎪⎪ ∑ Yi = nb0 + b1 ∑ X i
i =1 i =1 i =1 i =1
⎨ n n n ⎨ n n n
⎪ YX = ⎪ YX =b
⎪⎩∑ ∑ ∑ ⎪⎩∑ 0∑ 1∑
i i X b
i 0 + X 2
i b1 i i X i + b X i
2
i =1 i =1 i =1 i =1 i =1 i =1
17
Risolvendo il sistema si ricava:
n
n ∑Y i =1
i
n n n n n
∑ X ∑Y X i i i n∑ Yi X i − ∑ X i ∑ Yi
b1 = i =1 i =1
n
= i =1 i =1 i =1
2
⎛ ⎞
∑X
n n
n i n∑ X i2 − ⎜ ∑ X i ⎟
i =1 i =1 ⎝ i =1 ⎠
n n
∑ Xi
i =1
∑ i
X 2
i =1
n n
∑Y i =1
i ∑X i =1
i
n n n n n n
∑Y X ∑ X i i i
2
∑Y ∑ X − ∑ X ∑ X Y
i i
2
i i i
b0 = i =1 i =1
n
= i =1 i =1 i =1 i =1
2
⎛ n ⎞
∑X
n
n i n∑ X i − ⎜ ∑ X i ⎟
2
i =1 i =1 ⎝ i =1 ⎠
n n
∑X ∑X
i =1
i
i =1
i
2
18
Attraverso semplici passaggi algebrici e ricordando le definizioni di varianza e
covarianza si ottiene la seguente espressione per b1
∑( X )( ) ∑( X )( )
N N
− X Yi − Y − X Yi − Y n
i i
σ XY
b1 = i =1
= i =1
= 2
σX
∑( X ) ∑( X )
N 2 N 2
i −X i −X n
i =1 i =1
1 n 1 n
b0 = ∑ Yi − b1 ∑ X i = Y − b1 X
n i =1 n i =1
Yl i = b0 + b1 X i
eˆ i = y i − yˆ i
19
Rappresentazione grafica del
residuo
Y
(xi,yi ) Ŷ = ˆ
β0 + ˆ
β1x
yi ê i = y i − ŷ i
ŷ i
xi X
20
Rappresentazione grafica del
metodo dei minimi quadrati
Y
Ŷ = ˆ
β0 + ˆ
β1x
21
Stima della risposta media
(valore previsto o predetto di Y)
Le stime dei parametri della retta possono essere
utilizzate per stimare il valore medio di Y per un dato
valore di X
La stima è data da
ŷ i = ˆ
β0 + ˆ
β1 x i
22
Tornando all’esempio…
V 250
o
l
il coefficiente di regressione ci dice che
u
m
200
ad ogni incremento unitario della variabile
e 150 X la variabile Y subisce anch’essa un
v 100
e
incremento, di intensità 0,67 -ossia ad ogni
n
d
50 incremento di un m2 nella superficie del
i
t 0
supermercato il volume delle vendite
e 0 50 100 150 200
Spazio espositivo
250 300 350
settimanali aumenta di 67 euro
23
Esempio2: in un campione di 10 famiglie italiane si
rilevano il reddito mensile (X) e il consumo mensile
per generi alimentari (Y), in euro
consumo
420
670 340 400
760 430
550 600 650 700 750 800 850
reddito
780 440
790 470
800 480 Il diagramma di dispersione suggerisce la
presenza di un legame lineare di tipo
crescente
conosciamo il 440
consumo
420
valore 400
380
dell’intercetta
360
340
all’origine e del
320
300
coefficiente
550 600 650 700 750 800 850
reddito
angolare
(pendenza)
25
Utilizziamo il metodo dei minimi quadrati ordinari
X Y y i − y x i − x (xi − x )(yi − y ) (x i − x )2
600 310 -89 -116 10324 13456
650 320 -79 -66 5214 4356
670 340 -59 -46 2714 2116
690 380 -19 -26 494 676
700 400 1 -16 -16 256
720 420 21 4 84 16
760 430 31 44 1364 1936
780 440 41 64 2624 4096
790 470 71 74 5254 5476
800 480 81 84 6804 7056
716 399 34860 39440
y = 399 n n
x = 716 ∑ (x − x )(yi − y ) ∑ (x − x)
2
i i
i=1 i=1
ˆ 34860
ˆ
β0 = 399 − 0,884* 716 = −233,8 β1 = = 0,884
39440
26
Rappresentazione grafica della
retta
500
Per un incremento
480
460
y = 0.8839x - 233.85 unitario di reddito il
440 consumo aumenta in
media di 0,8839
Consumo
420
400
380 (se il reddito
360
340
aumenta di 1000€, il
320 consumo in media
300 cresce di 884€)
550 600 650 700 750 800 850
reddito
ˆ
β 0 = − 233 ,85
ˆ
β 1 = 0 , 8839
27
Valori previsti e residui
Valori osservati Valori osservati Valori stimati (previsti) di Y
di X di Y ŷ i = ˆ
β 0 + ˆ
β 1x i
ei = yi − yˆ i
X Y Y prevista Residui
600 310 296,47 13,53
650 320 340,66 -20,66
670 340 358,34 -18,34
690 380 376,02 3,98
700 400 384,86 15,14
720 420 402,54 17,46
760 430 437,89 -7,89
780 440 455,57 -15,57
790 470 464,41 5,59
800 480 473,25 6,75
28
MISURE DI BONTA’ DI ADATTAMENTO
∑( ) ( ) ∑
n n n
i =1
Yi − Y = ∑ i =1
Yl i − Y +
i =1
e i2
∑Y = ∑Yl
i i e ∑e X
i =1
i i =0
29
Sotto questa condizione la devianza di Y può essere scomposta in:
2 2
∑ (Y ) ( )
n n
i =1
i −Y = ∑
i =1
Y − Yl i + Yl i − Y =
2 2
(Y ) + ∑ (Yl ) ( ) (Yl )
n n n
= ∑
i =1
− Yl i
i =1
i −Y + 2 ∑ Y − Yl i
i =1
i −Y
( )( ) ( ) ( )
n
∑
i =1
Y − l Yl
Y i i − Y = ∑ ei Yl i − Y = b1 ∑ ei X i − X =
= b1 ⎡⎣ ∑ ei X i − X ∑ ei ⎤⎦ = b1 [ 0 − 0] = 0 Sostituendo le stime
dei parametri in Yl i
30
Il coefficiente di determinazione R2
Sulla base di tale scomposizione della varianza di Yi può essere computata
una misura della bontà di adattamento del modello ai dati denominata
coefficiente di determinazione lineare
n 2
2 2
( ) ( )
n n
1 ( n − 1) ∑ Yl i − Y 1 ( n − 1) ∑ Y − Yl i
R2 =
( )=
V Yl i
i =1
R2 = 1 −
V ( ei )
= 1− i =1
V (Yi ) n 2
V (Yi ) n 2
1 ( n − 1) ∑ (Yi − Y ) 1 ( n − 1) ∑ (Yi − Y )
i =1 i =1
SER =
1 n
∑
n − 2 i =1
(
ei − e
2
)
1 n 2
= ∑
n − 2 i =1
ei
n
( )
n n n
∑ ( yi
i =1
− y ) = ∑
i =1
yi − y + ∑
i =1
e i2
yi n 2
ei = yi − y i
TSS = ∑ (y
i =1
i − y )
(y )
2
yi − y
n
y *
ESS = ∑i =1
i − y
i
y i−y
n
y
RSS = ∑
i =1
e i2
xi X
33
L’interpretazione del coefficiente R2 - casi limite
Il modello si adatta perfettamente ai dati R2 = 1
34
L’interpretazione del coefficiente R2 - casi limite
12.5 5.5
12 y = 10.8
11.5 R2 = 0 5
11 4.5
10.5
4
10
35
…alcuni esempi
25 12
y = 10.6 -0.2x
R2 = 0.0026
20 10
8
15
6
10
4
5 y = 8.8 -0.6x
2
R2 = 0.18
0 0
0 1 2 3 4 5 6 0 1 2 3 4 5 6
30 9
25
y = 12.3+2.3x 8 y = 1.6+1.2x
20 R2 = 0.7472 7 R2 = 0.973
6
15 5
4
10
3
5 2
0 1
0 1 2 3 4 5 6 0
0 1 2 3 4 5 6
36
Le assunzioni dei minimi quadrati
E(Yi | X = xi ) = β0 + β1xi
x1 x2 x3 x 38
L’assunzione circa la media condizionata implica che Xi e ui siano
incorrelati, ovvero
corr ( X i , ui ) = 0
39
Assunzione 2
(Xi, Yi) sono indipendentemente e identicamente distribuite (i.i.d.). Tale
assunzione è una formalizzazione matematica di come viene estratto il
campione. Se le osservazioni sono estratte con campionamento casuale
semplice da un’ampia popolazione, allora (Xi, Yi) i=1,..,n sono i.i.d. In altre
parole, ogni insieme di (Xi, Yi) rappresenta un’estrazione casuale dalla
distribuzione che caratterizza la popolazione.
L’assunzione di i.i.d. è ragionevole per molti schemi di campionamento
Assunzione 3
Gli outlier (ossia osservazioni con valori di Xi o Yi molto lontani) sono
improbabili. Tale assunzioni può essere formulata in termini matematici
affermando che X e Y hanno curtosi finita. L’assunzione di curtosi finita è
plausibile in molte applicazioni che coinvolgono dati economici.
Un modo per scoprire gli outlier è quello di rappresentare graficamente i
dati. Se si decide che un outlier è dovuto, ad esempio, ad un errore di
inserimento dati allora si può correggere l’errore, oppure, nel caso in cui
ciò sia impossibile, si può eliminare l’osservazione dai dati.
40
LE ASSUNZIONI DEI MINIMI QUADRATI
41
APPLICAZIONE EMPIRICA
Esempio tratto dal testo Stock J.H. e Watson, M.W. Introduzione all’econometria,
Pearson, 2009
42
Riepilogo statistiche descrittive di Y e X (Utilizzando in Excel, tra gli strumenti di
analisi, “statistiche descrittive”
Retribuzione oraria media Età
43
Diagramma di dispersione
60
50
40
30
20
10
0
0 5 10 15 20 25 30 35 40
Età
44
Utilizzando in Excel, tra gli strumenti di analisi, “regressione” e selezionando come
variabile dipendente la retribuzione media oraria e indipendente l’età si ottiene il
seguente output:
OUTPUT RIEPILOGO
ANALISI VARIANZA
gdl SQ MQ F Significatività F
Regressione 1,0 13631,814 13631,814 181,716 0,000
Residuo 7984,0 598935,455 75,017
Totale 7985,0 612567,269
Coefficienti Errore standard Stat t Valore di significatività Inferiore 95% Superiore 95%
Intercetta 3,324 1,002 3,317 0,001 1,360 5,289
Età 0,452 0,034 13,480 0,000 0,386 0,518
yˆ i = 3,324 + 0,452 xi
Si ottiene rapportando
n 2
∑ ( yˆ i − y ) 1 3 .6 3 1 ,8 1 4 5 9 8 ,9 3 5 ,4 5 5
R2 = i =1
2
= =1− = 0, 0223
n 6 1 2 .5 6 7 ,2 6 9 6 1 2 .5 6 7 ,2 6 9
∑ (y
i =1
i − y )
46
Inferenza sulla regressione
Le stime dei coefficienti del modello β0 e β1 e la stima della
risposta media dipendono dal campione osservato
Al variare dei campioni si generano le v.c. stimatori dei
coefficienti di regressione che indichiamo con b0 e b1 .
47
La distribuzione campionaria di b1
Per derivare la distribuzione in grandi campioni sono necessarie
solo le seguenti assunzioni:
⎛ σ v2 ⎞
b1 ~ N ⎜ β1 , 2 2⎟ , dove vi = (Xi – μX)ui
⎝ n(σ X
) ⎠
1) E(ui)=0 i=1…n
49
Proprietà dello stimatore OLS
Sotto le assunzioni dei minimi quadrati (1-3) e ipotesi 1-4, lo
stimatore OLS gode delle seguenti proprietà:
50
ERRORE STANDARD DELLO STIMATORE b1
⎛∧ ⎞ σ u2
⎛ ⎞
∧
⎛ ⎞∧
VAR⎜ β 1 ⎟ =
SE ⎜ β 1 ⎟ = var⎜ β 1 ⎟ ⎝ ⎠
∑ (X )
n
2
⎝ ⎠ ⎝ ⎠ i −X
i =1
51
OMOSCHEDASTICITA’
52
ETEROSCHEDASTICITA’
Eteroschedasticità o omoschedasticità?
54
LIMITI DEL TEOREMA DI GAUSS MARKOV
55
Stime e stimatori nella regressione
Parametro Stima Stimatore
Media Varianza
⎛ ⎞
ˆ
β0 = ⎜ ⎟
2 1 x2
σ ⎜ + ⎟
= Y −ˆ
n
β1 X b0 β0 ⎜n (xi − x)2 ⎟⎟
β0 ⎜
⎝
∑
i=1 ⎠
σ2
ˆ
β1 = n
β1 = σ xy σ 2
b1 β1 ∑
i=1
(xi − x)2
x
56
Stima della varianza σ2
∑ ê i2
s 2
= i=1
n − 2
Questo stimatore presenta una correzione per i gradi di
libertà, dato che a denominatore troviamo il numero delle
osservazioni meno il numero dei regressori.
57
STIMA DELL’ERRORE STANDARD DI bo e b1
Ipotesi di Omoschedasticità
s2
VAR(b1 ) = SE (b1 ) = VAR(b1 )
nσ X2
La radice quadrata viene di solito chiamata standard error (o
errore standard) di bo e b1 , indicato con se(b0) e se(b1) e
rappresenta una stima dello scarto quadratico medio dello stimatore
OLS e dunque uno strumento per misurarne la precisione.
Var(b1)è inversamente proporzionale a var(X): maggiore dispersione in
X significa più informazioni su b1.
58
STIMA DELL’ERRORE STANDARD DI bo e b1
Esiste una formula più generale per la stima della varianza di b1
che vale anche nel caso di errori eteroschedastici (si parla di
stimatore robusto all’eteroschedasticità). Si ha:
1 n 2
VAR(b1 ) = 1 ∑
n − 2 i =1
vˆi vˆi = ( X i − X )uˆi
× 2
n ⎡1 n ⎤
⎢n ∑ ( X i − X ) 2
⎥
⎣ i =1 ⎦
SE (b1 ) = VAR(b1 )
Abbiamo ora due formule per gli errori standard per b1
• Il principale vantaggio degli errori standard per l'omoschedasticità
pura è che la formula è più semplice. Lo svantaggio, però, è che
la formula è corretta solo se gli errori sono omoschedastici.
59
STIMA DELL’ERRORE STANDARD DI bo e b1
Implicazioni pratiche…
60
Distribuzione campionaria di b0 e b1
Con un campione di N osservazioni (finito), l’inferenza
statistica esatta è possibile solo formulando esplicitamente
ipotesi sulla forma della distribuzione dei termini di errore.
L’ipotesi più comune è che gli errori abbiano distribuzione
normale
( )
ui ∼ NID 0, σ 2 i = 1,..., N
5)
b1 ~ N ⎜ β1; n ⎟ i =1
⎜ 2 ⎟
⎜ ∑ i ( x − x ) ⎟
⎝ i =1 ⎠ b0 − β 0
⎛ ~ N ( 0;1)
⎛ ⎞⎞ ⎛ ⎞
⎜ ⎜1 ⎟⎟
x 2
⎜ x2 ⎟
b0 ~ N ⎜ β0 ;σ 2 ⎜ + n ⎟⎟ 2 1
⎜ σ ⎜ + ⎟
⎜n 2 ⎟⎟
n
∑ ⎜n ( x i − x )2 ⎟⎟
⎜ ⎜
⎝
( xi − x ) ⎟ ⎟
⎠⎠
⎜
⎝
∑ ⎠
⎝ i =1 i =1
Y i ~ N(β 0 + β 1 x i; σ 2 )
62
Distribuzione campionaria di b0 e b1
b1 − β 1
~ tn − 2 b1 − β 1
n ~ tn − 2
s2 ∑ i
( x
i =1
− x ) 2
s ( b1 )
Errore
standard di b1
b0 − β 0 b0 − β 0
~ tn − 2 ~ tn − 2
⎛ ⎞ s ( b0 )
⎜1 x2 ⎟
Errore
s2 ⎜ + ⎟
⎜n
n
2 ⎟
standard di b0
⎜ ∑ ( x i − x ) ⎟
⎝ i =1 ⎠
Distribuzione t di Student con n-2
gradi di libertà
63
Intervalli di confidenza dei
coefficienti di regressione
Al livello di confidenza 1-α
β1
β0
64
Stima per intervallo.
Esempio Dati consumo-reddito
êResidui
i = yi − ŷi ê i2
n
∑ i
ê 2
1878,14
13,53 183,04 s =
2
=
i=1
= 234,77
-20,66 427,01 n−2 8
-18,34 336,42 Errore standard della regressione
3,98 15,85
15,14 229,28 s = 234 ,77 = 15,32
17,46 305,01
-7,89 62,26 Errore standard di b1
-15,57 242,36 234,77
5,59 31,29 s(b1 ) = = 0,078
39440
6,75 45,62
1878,14 Errore standard di b0
n
∑ ê 2
i
⎛ 1
s(b0 ) = 234,77 ⎜ +
7162 ⎞
⎟ = 55, 45
⎝ 10 39440 ⎠
i= 1
65
Stima per intervallo.
Esempio Dati consumo-reddito
β0 P(− 233,85 − 2,31 × 55,45 < β0 < −233,85 + 2,31 × 55,45) = 0,95
66
Verifica di ipotesi sui coefficienti di
regressione
Possiamo essere interessati a verificare:
H0 : β1 = β10 H0 : β1 = β10 H0 : β1 = β10
1) 2) 3)
H1 : β1 ≠ β10 H1 : β1 > β10 H1 : β1 < β10
Statistica test b 1 − β 10
t = ~ t n −2
s (b 1 )
H0 : β1 = 0 H0 : β0 = 0
H1 : β 1 ≠ 0 H1 : β 0 ≠ 0
Test di significatività
69
Statistica test
La statistica test si risolve nel rapporto tra il parametro
stimato e il rispettivo errore standard; se tale rapporto
supera il livello critico (individuato dalle tavole), si può
rifiutare H0 e quindi mantenere il parametro stimato
nel modello di regressione.
b1
t = ~ t n −2
s (b 1 )
H0:β1=0 Al livello di significatività α, accetto H0
H1:β1≠0 se il valore della statistica test
calcolato sul campione cade nell’area
di accettazione dell’ipotesi nulla, cioè
se
βˆ1
− tα < < tα
s ( b1 )
2; n − 2 2; n − 2
70
Nei software statistici (ma anche in Excel), la
presentazione dei risultati sul modello di regressione
include la stima dei parametri con i rispettivi errori
standard e il loro rapporto (che costituisce la
statistica test calcolata t per verificare che i
parametri siano nulli), assieme al p-value (valore di
significatività in excel) dato dalla probabilità di
osservare un valore della statistica test uguale o
maggiore del valore ottenuto mediante i dati
campionari sotto ipotesi nulla.
∑ (ŷ − y) 1
2
SQR 1 i
= i=1
~ F(1;n − 2)
SQE (n − 2) n
∑ (n − 2)
ê
i=1
2
i
72
Tavola ANOVA
Sorgente Somma gdl Media F
di variazione dei dei quadrati
quadrati
Regressione SQR 1 MQR=SQR/1 F=MQR/MQE
Errore SQE n-2 MQE=SQE/(n-2)
Totale SQT n-1
73
Test F
Ad un livello di
significatività α, si accetta
H0 se F<Fα;1,n-2
In questo caso si conclude
che non c’è relazione
statisticamente
significativa.
Si rifiuta H0 se F>Fα;1,n-2,
concludendo che Y
dipende linearmente da X
Fα; 1,n-2
74
Confronto test t – test F
Per verificare H0 : β1 = 0 contro H1 : β1 ≠ 0
valgono le uguaglianze (tα 2;n−2 ) = Fα;1;n−2
2
(tosservato)
2
= Fosservato
(t ) = 4,57 = 20,89 = F
osservato
2 2
osservato
75
ESERCIZIO
In un ipermercato di Viterbo è stata svolta
un‘indagine per rilevare il prezzo del pane negli ultimi
cinque mesi (in euro al Kg) e le quantità consumate
in media in un giorno (in Kg)
prezzo quantità
1,65 210
1,67 198
1,68 176
1,69 175
1,7 174
76
Stima dei coefficienti di regressione - Output Excel
Coefficienti
Intercetta 1529
Variabile X 1 -800
77
Rappresentazione punti osservati e retta di
regressione - Output Excel
250
y = -800x + 1529
2
R = 0.8744
200
150
1.64 1.68 1.72
78
Test t - Output Excel
Coefficienti Errore standard Stat t p-value
Intercetta 1529 293,69 5,21 0,01
Variabile X 1 -800 175,02 -4,57 0,02
Per verificare H0 : β1 = 0
H1 : β1 ≠ 0
βˆ1 −800
t = = = − 4, 5 7
s ( b1 ) 1 7 5, 0 2
-4,57<-3,18 t3
79
Esempio Test F ANOVA - Output Excel
ANALISI VARIANZA
gdl SQ MQ F p-value
Regressione R 1 947,20 947,20 20,89 0,02
Errore E 3 136,00 45,33
Totale 4 1083,20
Per verificare H0 : β1 = 0
H1 : β1 ≠ 0
MQR 947 ,20
F = = = 20 ,89
MQE 45,33
Al livello α=0,05 F0,05;1;3 = 10,13
20,89>10,13 Si rifiuta H0
C’è evidenza sufficiente per concludere che la quantità
consumata di pane dipende linearmente dal prezzo
80
Utilizzo del modello di
regressione per la previsione
Fare una previsione può significare due cose :
1) prevedere il valore atteso E(Yi|X=xi) della
variabile risposta in corrispondenza di un dato
valore di X, diciamo xi
[è un parametro, cioè la media di tutte le Y per le
unità per le quali X=xi, ad esempio il consumo medio
previsto per tutte quelle famiglie con un reddito pari a
40.000€]
2) prevedere il valore singolo della variabile risposta
in corrispondenza di un dato valore di x, diciamo xi
[è una singola determinazione di Yi, ad esempio il
consumo previsto per una particolare famiglia con un reddito
di 40.000€]
81
Previsione puntuale e intervallare
Nei due casi, la stima puntuale del valore previsto
coincide ed è pari a:
ŷ i = ˆ
β 0 +ˆ
β 1x i
La stima per intervallo, invece, è diversa nei due casi.
Il grado di incertezza associato alla previsione di una
media è minore del grado di incertezza associato alla
previsione di un singolo valore.
82
Inferenza per la risposta media
Abbiamo visto che lo stimatore di E(Yi|X=xi) è
Ŷ i = ˆ
β 0 +ˆ
β1x i
83
Esempio: Riprendiamo l’esempio dell’ ipermercato
di Viterbo e costruiamo l’intervallo di confidenza al
95% per la quantità media quando il prezzo è pari a
1,66 (valore non osservato di X)
⎢ + ⎥ = 4 ,62
⎣5 0,00148 ⎦
n
t 3 ,0 ,025 = ± 3,18 ∑ (x h − x)
2
h =1
84
Inferenza per la previsione di un
singolo valore
Ad un livello di confidenza 1-α gli estremi
dell’intervallo di confidenza per la previsione di un
singolo valore sono dati da:
⎡ ⎤
Ŷi ± t α 2;n − 2 ⋅
⎢ 1
s ⎢1 + +
2 (x i − x ) ⎥
2
n ⎥
n (x h − x ) ⎥
∑
2
⎢
⎣ h =1 ⎦
85
Esempio: Riprendiamo l’esempio dell’ipermercato di
Viterbo e costruiamo l’intervallo di previsione al 95%
per la quantità prevista per quella unità il cui prezzo
è pari a 1,66
Ŷi = 1529 − 800 × 1,66 = 201
⎡ 1 (1,66 − 1,68 ) ⎤
2
86
Intervalli di confidenza al 95% per il
valore medio e per il valore singolo
250 per il valore singolo L’int. di confidenza
240 per il valore medio per il valore medio è
230
220
meno ampio dell’int.
210 per la previsione del
200 valore singolo.
190 Per entrambi
180
170
l’ampiezza aumenta
160 quanto più xi si
150 discosta dal valore
1.62 1.64 1.66 1.68 1.7 1.72 medio x = 1.68
x
87