Rossi MRLM Test 2022

Verifica di ipotesi e intervalli di
confidenza nella regressione multipla
Eduardo Rossi
Università di Pavia
Maggio 2022
Rossi MRLM Econometria - 2022 1 / 53

Sommario
Verifica di ipotesi e intervalli di confidenza per un singolo

coefficiente
Verifica di ipotesi congiunte su più coefficienti
Altri tipi di ipotesi che implicano più coefficienti
Variabili di interesse, variabili di controllo e come decidere quali
variabili includere in un modello di regressione

singolo coefficiente
Verifica di ipotesi e intervalli di confidenza per un

Per la verifica di ipotesi e la costruzione di intervalli di confidenza

nella regressione multipla si segue la stessa logica utilizzata per la
pendenza in un modello a singolo regressore.
β̂1 −E[β̂1 ]
√ ≈ N (0, 1) (TLC).
Var[β̂1 ]
Perciò le ipotesi su β1 possono essere verificate mediante la
consueta statistica-t e gli intervalli di confidenza costruiti come
{β̂1 ± 1, 96SE(β̂1 )}.
Lo stesso vale per β2 , . . . , βk .

Esempio
\ = 698, 933 − 2, 2798 STR

TestScr (1)
(10,364) (0,5195)
\ = 686, 032 − 1, 1013 STR − 0, 649777 PctEL

TestScr (2)
(8,7282) (0,4329) (0,031032)
Il coefficiente di STR in (2) è l’effetto su TestScore della variazione

in STR, mantenendo costante la percentuale di studenti non di
madrelingua nel distretto.
Il coefficiente di STR si dimezza.
L’intervallo di confidenza al 95% per il coefficiente di STR in (2) è
{−1, 10 ± 1, 960, 43} = {−1, 95, −0, 26}.
la statistica test t dell’ipotesi nulla βSTR = 0 è
t = −1, 10/0, 43 = −2, 54, perciò rifiutiamo l’ipotesi al livello di
significatività del 5%.
Verifica di ipotesi congiunte
Sia Expn = spese per studente e si consideri il modello di

regressione:
TestScorei = β0 + β1 STRi + β2 Expni + β3 PctELi + ui
L’ipotesi nulla per cui ”le risorse scolastiche non contano“, e

l’alternativa per cui invece contano, corrisponde a:
H0 : β1 = 0 e β2 = 0
l’ipotesi alternativa
H1 : o β1 ̸= 0 o β2 ̸= 0 o entrambi

H0 : β1 = 0 e β2 = 0
H1 : o β1 ̸= 0 o β2 ̸= 0 o entrambe
Un’ipotesi congiunta specifica un valore per due o più coefficienti,
ossia impone una restrizione su due o più coefficienti:
H0 : βi = βi,0 , . . . , βj = βj,0
per un totale di q restrizioni.

Nell’esempio precedente, q = 2 e le due restrizioni sono
β1 = β2 = 0.
Se una (o più) delle uguaglianze sotto l’ipotesi nulla è falsa, allora
l’ipotesi nulla congiunta è falsa.
Ipotesi alternativa è che almeno una delle uguaglianze della H0
non valga.
Si può effettuare la verifica delle ipotesi congiunte usando la statistica

test t sui singoli coefficienti?
Un’idea di ”buon senso” è quella di rifiutare se l’una o l’altra delle
statistiche-t supera 1,96 in valore assoluto.
Ma questa verifica ”coefficiente per coefficiente” non è valida: la
verifica risultante ha un tasso di rifiuto troppo elevato sotto
l’ipotesi nulla (più del 5%)!

Perchè non possiamo verificare coefficiente per

coefficiente?
Perchè il tasso di rifiuto sotto l’ipotesi nulla non è il 5%.
Calcoleremo la probabilità di rifiutare in modo non corretto
l’ipotesi nulla usando la verifica del ”buon senso” basata sulle due
statistiche- t singole. Per semplificare il calcolo, supponete che
siano distribuite in modo indipendente (non è vero in generale - lo
è solo in questo esempio).
Siano t1 e t2 le statistiche-t:
β̂1 − 0 β̂2 − 0
t1 = t1 =
SE(β̂1 ) SE(β̂2 )
La verifica ”coeff. per coeff.” è: Rifiuta H0 : β1 = β2 = 0 se
|t1 | > 1, 96 e/o |t2 | > 1, 96
Qual è la probabilità che questa verifica ”coeff. per coeff.” rifiuti
H0 , quando H0 è effettivamente vero? (Dovrebbe essere 5%.)
Perchè non possiamo verificare coefficiente per

coefficiente?
Ipotesi t1 e t2 sono indipendenti (falso!) La probabilità di rifiutare in

modo non corretto l’ipotesi nulla mediante la verifica ”coeff. per coeff.”
= PrH0 {|t1 | > 1, 96 e/o |t2 | > 1, 96}

= 1 − PrH0 {|t1 | ≤ 1, 96 e |t2 | ≤ 1, 96}
= 1 − PrH0 {|t1 | ≤ 1, 96} × PrH0 {|t2 | ≤ 1, 96}
= 1 − (0, 95)2 = 0, 0975 > 0, 05

Dimensione del test
La dimensione del test (la percentuale di rifiuto della nulla quando

è vera) usando le singole statistiche per decidere sull’ipotesi
congiunta non è il 5%!
In effetti, la sua dimensione dipende dalla correlazione tra t1 e t2
(e quindi dalla correlazione tra β̂1 e β̂2 ).
Due soluzioni:
1 Utilizzare un valore critico diverso in questa procedura - non 1,96
(questo è il ”metodo Bonferroni”, raramente utilizzato nella
pratica).
2 Utilizzare una statistica test diversa studiata per verificare subito
sia β1 = 0 sia β2 = 0(ipotesi congiunta): la statistica F (questa è
la pratica comune).

Statistica F
Ipotesi congiunte in notazione matriciale
Si consideri un’ipotesi congiunta che è lineare nei coefficienti e impone

q restrizioni, con q ≤ k + 1.
Ognuna di queste restrizioni può riguardare uno o più coefficienti di
regressione (un sistema di restrizioni). Restrizioni lineari
H0 : Rβ = r
H1 : Rβ ̸= r
r (q × 1)
R (q × (k + 1))
r(R) = q ≤k+1

Statistica F
Restrizioni lineari - Esempio
Dato il MRLM:
Yi = β0 + β1 X1i + . . . + βk Xki + ui
Ipotesi nulla:
H0 : β1 + β2 = 0

R = 0, 1, 1, 0, . . . , 0 r=0
 
β0
β1 


Rβ = 0, 1, 1, 0, . . . , 0  .  = β1 + β2
 .. 
βk

Statistica F
Restrizioni lineari - Esempio modello partizionato
Y = X1 β 1 + X2 β 2 + u
X1 (n × k1 )
X2 (n × k2 )
β 1 (k1 × 1)
β 2 (k2 × 1)
k + 1 = k1 + k2
H0 : β 1 = 0
H0 : Rβ = 0

Statistica F
Restrizioni lineari - Esempio modello partizionato
dove
..
h i
R= Iq . 0(q×k2 )
i β
.
h
1
Rβ = Iq .. 0(q×k2 ) β2
= β1
dove q = k1 . Sotto H0 il modello si riduce a
Y = X2 β 2 + u

Statistica F
Statistica F
La statistica F per verificare l’ipotesi congiunta
H0 : Rβ = r
è h i−1
(Rβ̂ − r)′ RΣ̂β̂ R′ (Rβ̂ − r)
F =
q

Statistica F
Distribuzione asintotica della statistica F

Dato che √ d
n(β̂ − β) −→ N (0, Σ√n(β̂−β) )
√ √
segue che sotto H0 : Rβ = r, n(Rβ̂ − Rβ) = n(Rβ̂ − r)
√ √ d
n(Rβ̂ − r) = nR(β̂ − β) −→ N (0, RΣ√n(β̂−β) R′ )
dati i risultati sulle forme quadratiche di vettori di v.c. asintoticamente
normali, sotto H0 :
h i−1
[(Rβ̂ − r)]′ RΣβ̂ R′ [(Rβ̂ − r)]
√ h i−1 √
d
= [ n(Rβ̂ − r)]′ RΣ√n(β̂−β) R′ [ n(Rβ̂ − r)] −→ χ2q
perchè Σβ̂ = Σ√n(β̂−β) /n. Poichè

p
Σ̂√n(β̂−β) −→ Σ√n(β̂−β)

Statistica F
Distribuzione asintotica della statistica F

Per il teorema di Slutsky:
√ h i−1 √
d
n(Rβ̂ − r)]′ RΣ̂√n(β̂−β) R′ [ n(Rβ̂ − r)] −→ χ2q
o h i−1
d
[(Rβ̂ − r)]′ RΣ̂β̂ R′ [(Rβ̂ − r)] −→ χ2q
segue che
h i−1
(Rβ̂ − r)′ RΣ̂β̂ R′ (Rβ̂ − r) d χ2q
F = −→
q q
d
cioè F −→ Fq,∞ = χ2q /q. E’ equivalente calcolare
h i−1
qF = [(Rβ̂ − r)]′ RΣ̂β̂ R′ [(Rβ̂ − r)], in questo caso
d
qF −→ χ2q
Statistica F
Regione di rifiuto statistica F
Valore critico:
α α
Fq,∞ : Pr{Fq,∞ > Fq,∞ }=α
per un livello di significatività 0 ≤ α ≤ 1.
La procedura di test consiste nel calcolare F e rifiutare H0 se il suo
valore cade nella regione critica, cioè se {F act > Fq,∞
α }, tale che abbia
una probabilità minore di α di essere estratta dalla distribuzione Fq,∞ .

P-value della statistica F:
p-value = Pr{Fq,∞ > F act }
Se p-value > α (prefissato) accetto H0 altrimenti rifiuto.

Statistica F
Significatività della regressione
L’ipotesi nulla che tutti i coefficienti siano nulli ad eccezione

dell’intercetta.
H0 : β1 = β2 = . . . = βk = 0
H1 : βj ̸= 0 per almeno un j, j = 1, 2, . . . , k
Sotto H0 nessuno dei regressori spiega alcunchè della variazione in Yi .
L’intercetta, sotto H0 , è la media di Yi :
E(Yi ) = β0

Statistica F
Statistica F quando q = 1
Quando q = 1, la statistica F verifica una sola restrizione
R (1 × (k + 1)), r (1 × 1)
h i−1
[(Rβ̂ − r)]′ RΣ̂β̂ R′ [(Rβ̂ − r)] [(Rβ̂ − r)]2
= h i = t2
1 RΣ̂β̂ R′
è il quadrato della statistica t.

Statistica F
Statistica F - Esempio
Coefficiente S.E. t-ratio p-value

const 649.578 15.4583 42.0212 0.0000
STR −0.2864 0.4821 −0.5941 0.5528
EXPN stu 0.0039 0.0016 2.4469 0.0148
EL PCT −0.6560 0.0318 −20.6397 0.0000
Media variabile dipen 654.1565 S.Q.M. variabile dipen 19.05335
SSR 85699.71 S.E. della regressione 14.35301
R2 0.436592 R̄2 0.432529
F (3, 416) 147.2037 P-value(F ) 5.20e–65
H0 : βstr = 0, βexpn = 0
Statistica Test: F (2, 416) = 5.434, con p − value = 0.00468.

Statistica F
Regioni di confidenza per coefficienti multipli
Una regione di confidenza asintoticamente valida per due o più

elementi di β può essere costruita come l’insieme dei valori che, se
considerati come ipotesi nulla, non sono rifiutati dalla statistica F .
Sia δ (q × 1) formato dagli elementi di β per i quali si desidera una
regione di confidenza
δ = Rβ
La statistica test F per l’ipotesi nulla H0 : δ = δ 0 è
F = (δ̂ − δ 0 )′ [RΣ̂β̂ R′ ]−1 (δ̂ − δ 0 )/q
con δ̂ = Rβ̂. Una regione di confidenza al 95% per δ è l’insieme di

valori δ 0 che non sono rifiutati dalla F .

Statistica F
Regioni di confidenza per coefficienti multipli
Una regione di confidenza 1 − α per δ è
{δ : (δ̂ − δ)′ [RΣ̂β̂ R′ ]−1 (δ̂ − δ)/q ≤ Fq,∞

0.95
}
La regione di confidenza è costituita dai punti interni all’ellissoide che

si ottiene quando vale l’uguaglianza.

Statistica F
Ellisse di confidenza (k = 2)
Yi = β1 X1i + β2 X2i + ui i = 1, 2, . . . , n
Regione di confidenza per (β1 , β2 ):

1 0 β1
Rβ =
0 1 β2
Nel caso k = 2, la forma quadratica:
b −1 (β̂ − β)
(β̂ − β)′ Σ β̂
dato
σ̂12 σ̂1,2

b −1 =
Σ β̂
σ̂1,2 σ̂22
è uguale a
(βb1 − β1 )2 σ̂12 + 2(βb1 − β1 )(βb2 − β2 )σ̂1,2 + (βb2 − β2 )2 σ̂22
Statistica F
Ellisse di confidenza (k = 2)
Il contorno della funzione implicita
ax2 + byx + cy 2 = K
è un’ellisse con centro (x = 0, y = 0), inclinata positivamente quando

b < 0.
In questo caso, ellisse inclinata
positivamente quando σ̂1,2 < 0
negativamente quando σ̂1,2 > 0

Statistica F
Regioni di confidenza per coefficienti multipli - Esempio
\eval = 4, 082 + 0, 149 beauty − 0, 198 female

course
(0,033) (0,032) (0,051)
2
T = 463 R̄ = 0, 0622 F (2, 460) = 16, 331 σ̂ = 0, 53732
Ellisse di confidenza al 95% e intervalli marginali al 95%

-0,05
-0,1
-0,15
0,149, -0,198
female
-0,2
-0,25
-0,3
-0,35
0,06 0,08 0,1 0,12 0,14 0,16 0,18 0,2 0,22 0,24
beauty

Errori normali e omoschedastici
Se gli errori sono normali (condizionatamente a X) e omoschedastici,
u|X ∼ N (0, σu2 In )
allora lo stimatore ha una distribuzione normale multivariata in

campionin finiti:
β̂ = β + (X′ X)−1 X′ u
β̂ ∼ N (β, σu2 (X′ X)−1 )

Distribuzione di s2
Se valgono le assunzioni generalizzate degli OLS nel MRLM, allora
u′ MX u
s2 =
n−k−1
per la normalità condizionale di u
′
u u
MX ∼ χ2n−k−1
σu σu
quindi
s2
(n − k − 1) ∼ χ2n−k−1
σu2
σu2
s2 ∼ χ2
n − k − 1 n−k−1

Errori standard classici
Var[β̂|X] = σu2 (X′ X)−1

\
Var[β̂|X] = s2 (X′ X)−1
lo standard error di β̂i :
q
SE(β̂i ) = s e′i (X′ X)−1 ei

Statistica t̃
Data la statistica:
β̂i − βi,0
t̃ =
SE(β̂i )
se valgono le sei assunzioni generalizzate dei minimi quadrati, la
distribuzione campionaria esatta di t̃
t̃ ∼ tn−k−1

Dimostrazione
Se
1 Z ha una distribuzione N (0, 1)
2 W ha una distribuzione χ2m
3 Z e W sono indipendentemente distribuite
allora
Z
p ∼ tm
W/m
Ora
β̂i − βi,0
t̃ =
SE(β̂i )
β̂i − βi,0
=p ′
s ei (X′ X)−1 ei
2
β̂i − βi,0
=p
s2 /σu2 σu2 e′i (X′ X)−1 ei
p

Dimostrazione
(β̂i − βi,0 )/ σu2 e′i (X′ X)−1 ei

p
t̃ = p
s2 /σu2
1 Sotto H0
(β̂i − βi,0 )
|X ∼ N (0, 1)
σu2 e′i (X′ X)−1 ei
p
2
s2
(n − k − 1) ∼ χ2n−k−1
σu2

Dimostrazione
Si può scrivere
Z
t̃ = p
W/(n − k − 1)
con
(β̂i − βi,0 )
Z=p ∼ N (0, 1)
σu2 e′i (X′ X)−1 ei
e
s2
W = (n − k − 1) ∼ χ2n−k−1
σu2

Dimostrazione
Indipendenza tra β̂ e s2 . Dato che
β̂ = β + (X′ X)−1 X′ u
u′ MX u
s2 =
n−k−1
β̂ e s2 sono indipendenti se (X′ X)−1 X′ u e u′ MX u sono indipendenti.
Dato che u|X ∼ N (0, σu2 In )
(X′ X)−1 X′ u|X ∼ N (0, σu2 (X′ X)−1 )
MX u|X ∼ N (0, σu2 MX )

Dimostrazione
Poichè
Cov[(X′ X)−1 X′ u, MX u|X] = E[(X′ X)−1 X′ uu′ MX |X]

= (X′ X)−1 X′ E[uu′ |X]MX
= (X′ X)−1 X′ σu2 In MX
= 0k×n
perchè
X′ MX = 0k×n
Segue che i due vettori sono indipendenti e che β̂ e s2 sono
indipendenti.
Si può concludere che
β̂i − βi,0
t̃ = ∼ tn−k−1
SE(β̂i )
Distribuzione della statistica F̃
La statistica F con omoschedasticità si ottiene sostituendo Σ̂β̂ con

s2 (X′ X)−1
(Rβ̂ − r)′ [R(X′ X)−1 R′ ]−1 (Rβ̂ − r)

F̃ =
qs2
se valgono le sei assunzioni generalizzate degli OLS, sotto l’ipotesi nulla
F̃ ∼ Fq,n−k−1
F̃ è la versione di Wald.

Dimostrazione
Il rapporto
W1 /n1
∼ Fn1 ,n2
W2 /n2
dove
1 W1 ∼ χ2n1
2 W2 ∼ χ2n2
3 W1 e W2 sono indipendentemente distribuite.
Verifichiamo che queste tre condizioni siano verificate nel caso che
stiamo considerando.

Dimostrazione
Sia
W1 = (Rβ̂ − r)′ [σu2 R(X′ X)−1 R′ ]−1 (Rβ̂ − r)
e
s2
W2 = (n − k − 1)
σu2
possiamo scrivere
W1 /q
F̃ =
W2 /n − k − 1

Dimostrazione
Dato che
β̂|X ∼ N (β, σu2 (X′ X)−1 )
e sotto H0 , Rβ̂ − Rβ = Rβ̂ − r
(Rβ̂ − r)|X ∼ N (0, σu2 R(X′ X)−1 R′ )
quindi
(Rβ̂ − r)′ [σu2 R(X′ X)−1 R]−1 (Rβ̂ − r) ∼ χ2q
Abbiamo già visto che
s2 χ2n−k−1
∼
σu2 n−k−1

Dimostrazione
Infine, poichè β̂ e s2 sono indipendentemente distribuiti, segue che
Rβ̂ − r e s2
sono indipendentemente distribuiti, implicando che W1 e W2 sono

indipendentemente distribuite.
Le tre condizioni sono verificate, quindi
F̃ ∼ Fq,n−k−1

La distribuzione Fq,n−k−1
La distribuzione Fq,n−k−1 è tabulata in molti punti.

Per n → ∞, la distribuzione Fq,n−k−1 tende asintoticamente alla
distribuzione χ2 /q, cioè Fq,∞ .
Per q non troppo grande e n ≥ 100, la distribuzione Fq,n−k−1 e la
distribuzione χ2q /q sono sostanzialmente identiche.
Molti pacchetti di regressione calcolano il valore-p della statistica
F mediante la distribuzione Fq,n−k−1 .

Altro modo di calcolo della statistica F̃
Quando il termine di errore ui è omoschedastico, la F può essere

scritta in termini di miglioramento dell’adattamento della regressione
(misurato con la SSR o l’R2 ).
Eseguire due regressioni,
1 una sotto l’ipotesi nulla (regressione ”vincolata”)
2 una sotto l’ipotesi alternativa (regressione ”non vincolata”)
Confrontare la somma dei quadrati dei residui (SSR) delle due
regressioni.
Confrontare gli adattamenti delle regressioni - gli R2 - se il
modello ”non vincolato” si adatta sufficientemente meglio,
rifiutare l’ipotesi nulla


Dato il MRLM:
Yi = β0 + β1 X1i + . . . + βk Xki + ui ui ∼ i.i.d.N (0, σu2 )
H0 : Rβ = r
stima del modello sotto l’ipotesi nulla:
β̃ = arg min (Y − Xβ)′ (Y − Xβ)
β:Rβ−r=0
la somma dei quadrati della regressione vincolata

SSRr = (Y − Xβ̃)′ (Y − Xβ̃)
la somma dei quadrati della regressione non vincolata
SSRur = (Y − Xβ̂)′ (Y − Xβ̂)
SSRr − SSRur n − k − 1
F̃ = ∼ Fq,n−k−1
SSRur q
Denotando i residui della regressione vincolata:
ũ = Y − Xβ̃
ũ′ ũ − û′ û n − k − 1
F̃ =
û′ û q
P 2 P 2
P 2 P 2
i ũi / i (Y i − Ȳ ) − i ûi / i (Yi − Ȳ ) n − k − 1
= P 2 P 2
i ûi / i (Yi − Ȳ ) q
2 2
(1 − Rr ) − (1 − Rur ) n − k − 1
= 2
1 − Rur q
2
R −R n−k−1 2
= ur 2 r
1 − Rur q

Rr2 è l’R2 della regressione vincolata

2 è l’R2 della regressione non vincolata
Rur
q = numero di restrizioni sotto l’ipotesi nulla
Più grande è la differenza tra l’R2 vincolato e non vincolato,
maggiore è il miglioramento dell’adattamento aggiungendo le
variabili in questione – maggiore è la F in presenza di
omoschedasticità.

Regressione ”vincolata” e ”non vincolata”
Esempio: i coefficienti di STR e Expn sono zero?

Regressione senza vincolo, sotto H1 :
TestScorei = β0 + β1 STRi + β2 Expni + β3 PctELi + ui
Regressione vincolata, sotto H0 : β1 = β2 = 0:
TestScorei = β0 + β3 PctELi + ui
Il numero di vincoli sotto H0 è q = 2.

L’adattamento risulterà migliore (R2 sarà maggiore) nella
regressione non vincolata.
Di quanto dovrà aumentare R2 affinchè i coefficienti di Expn e
PctEL siano giudicati statisticamente significativi?

Esempio
Regressione vincolata:
\ i = 644, 7 − 0, 671STRi
TestScore R2 = 0, 4149
Regressione non vincolata:
\ i = 649, 6−0, 29STRi +3, 87Expni −0, 656PctELi

TestScore R2 = 0, 4366
Quindi, con q = 2, n = 420, k = 3:

2 − R2 n − k − 1
Rur r
F̃ = 2
1 − Rur q
(0, 4366 − 0, 4149) (420 − 3 − 1)
= = 8, 01
(1 − 0, 4366) 2
Valore critico al 1% = 4,61, H0 è rifiutata.

Nota: F robusta all’eteroschedasticità è 5,43...
La statistica F̃ classica-riepilogo
La statistica F̃ classica rifiuta quando aggiungendo le due variabili

si aumenta R2 di ”quanto basta” - vale a dire, quando
aggiungendo le due variabili si migliora l’adattamento della
regressione di ”quanto basta”.
Se gli errori sono omoschedastici, ma non gaussiani, la statistica
F̃ classica ha una distribuzione in grandi campioni che è χ2q /q.
Se invece gli errori sono eteroschedastici, la distribuzione in grandi
campioni della statistica F̃ classica non è χ2q /q.
Se gli errori sono omoschedastici e gaussiani la statistica F̃
classica ha una distribuzione Fq,n−k−1 .

La statistica F̃ classica e la distribuzione F
L’uso della statistica F̃ e della distribuzione F è giustificato solo

sotto condizioni molto forti - troppo forti per essere realistiche.
Dovreste utilizzare la statistica F robusta all’eteroschedasticità,
con i valori critici della χ2q /q.
Per n ≥ 100, la distribuzione Fq,n−k−1 è essenzialmente la
distribuzione χ2q /q.
Per n piccolo, a volte i ricercatori utilizzano la distribuzione F
perchè ha valori critici più grandi e in tal senso è più prudente.

Verifica di restrizioni singole su coefficienti multipli
Yi = β0 + β1 X1i + β2 X2i + ui
Considerate l’ipotesi nulla e l’ipotesi alternativa,
H0 : β1 = β2 vs H1 : β1 ̸= β2
Questa ipotesi nulla impone una singola restrizione ( q = 1) su

coefficienti multipli – non si tratta di ipotesi congiunte con restrizioni
multiple (confrontate con β1 = β2 = 0).

Verifica di restrizioni singole su coefficienti multipli
Ecco due metodi per la verifica di restrizioni singole su coefficienti

multipli:
Riorganizzare (”trasformare”) la regressione: Riorganizzare i
regressori in modo che la restrizione diventi una restrizione su un
singolo coefficiente in una regressione equivalente; oppure,
Eseguire la verifica direttamente: Alcuni software, tra cui GRETL,
consentono di verificare le restrizioni utilizzando direttamente
coefficienti multipli

Metodo 1: Riorganizzare (”trasformare”) la regressione
Yi = β0 + β1 X1i + β2 X2i + ui
Considerate l’ipotesi nulla e l’ipotesi alternativa,
H0 : β1 = β2 vs H1 : β1 ̸= β2
Sommare e sottrarre β2 X1i :
Yi = β0 + (β1 − β2 )X1i + β2 (X1i + X2i ) + ui
Yi = β0 + γ1 X1i + β2 Wi + ui
dove
γ1 = β1 − β2
Wi = (X1i + X2i )

Metodo 1: Riorganizzare (”trasformare”) la regressione

Equazione originale:
Yi = β0 + β1 X1i + β2 X2i + ui
Equazione riorganizzata (”trasformata”):
Yi = β0 + γ1 X1i + β2 Wi + ui
Quindi,
H0 = γ1 = 0 vs H1 : γ1 ̸= 0
corrisponde a
H0 : β1 = β2 vs H1 : β1 ̸= β2
Queste due regressioni hanno lo stesso R2 , gli stessi valori previsti e gli
stessi residui. Il problema di verifica è ora semplice: verificare se γ1 = 0
nella regressione trasformata.

Rossi MRLM Test 2022

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Rossi MRLM Test 2022

Caricato da

Copyright:

Formati disponibili

Verifica di ipotesi e intervalli di

confidenza nella regressione multipla

Rossi MRLM Econometria - 2022 1 / 53

Verifica di ipotesi e intervalli di confidenza per un singolo

Rossi MRLM Econometria - 2022 2 / 53

Verifica di ipotesi e intervalli di confidenza per un

Per la verifica di ipotesi e la costruzione di intervalli di confidenza

Rossi MRLM Econometria - 2022 3 / 53

\ = 698, 933 − 2, 2798 STR

\ = 686, 032 − 1, 1013 STR − 0, 649777 PctEL

Il coefficiente di STR in (2) è l’effetto su TestScore della variazione

Verifica di ipotesi congiunte

Sia Expn = spese per studente e si consideri il modello di

TestScorei = β0 + β1 STRi + β2 Expni + β3 PctELi + ui

L’ipotesi nulla per cui ”le risorse scolastiche non contano“, e

Rossi MRLM Econometria - 2022 5 / 53

Verifica di ipotesi congiunte

per un totale di q restrizioni.

Verifica di ipotesi congiunte

Si può effettuare la verifica delle ipotesi congiunte usando la statistica

Rossi MRLM Econometria - 2022 7 / 53

Perchè non possiamo verificare coefficiente per

Perchè non possiamo verificare coefficiente per

Ipotesi t1 e t2 sono indipendenti (falso!) La probabilità di rifiutare in

= PrH0 {|t1 | > 1, 96 e/o |t2 | > 1, 96}

Rossi MRLM Econometria - 2022 9 / 53

Dimensione del test

La dimensione del test (la percentuale di rifiuto della nulla quando

Rossi MRLM Econometria - 2022 10 / 53

Ipotesi congiunte in notazione matriciale

Si consideri un’ipotesi congiunta che è lineare nei coefficienti e impone

Rossi MRLM Econometria - 2022 11 / 53

Restrizioni lineari - Esempio

Rossi MRLM Econometria - 2022 12 / 53

Restrizioni lineari - Esempio modello partizionato

Rossi MRLM Econometria - 2022 13 / 53

Restrizioni lineari - Esempio modello partizionato

dove q = k1 . Sotto H0 il modello si riduce a

Rossi MRLM Econometria - 2022 14 / 53

La statistica F per verificare l’ipotesi congiunta

Rossi MRLM Econometria - 2022 15 / 53

Distribuzione asintotica della statistica F

perchè Σβ̂ = Σ√n(β̂−β) /n. Poichè

Rossi MRLM Econometria - 2022 16 / 53

Distribuzione asintotica della statistica F

Regione di rifiuto statistica F

una probabilità minore di α di essere estratta dalla distribuzione Fq,∞ .

p-value = Pr{Fq,∞ > F act }

Se p-value > α (prefissato) accetto H0 altrimenti rifiuto.

Rossi MRLM Econometria - 2022 18 / 53

Significatività della regressione

L’ipotesi nulla che tutti i coefficienti siano nulli ad eccezione

Rossi MRLM Econometria - 2022 19 / 53

Quando q = 1, la statistica F verifica una sola restrizione

è il quadrato della statistica t.

Rossi MRLM Econometria - 2022 20 / 53

Coefficiente S.E. t-ratio p-value

Rossi MRLM Econometria - 2022 21 / 53

Regioni di confidenza per coefficienti multipli

Una regione di confidenza asintoticamente valida per due o più

F = (δ̂ − δ 0 )′ [RΣ̂β̂ R′ ]−1 (δ̂ − δ 0 )/q

con δ̂ = Rβ̂. Una regione di confidenza al 95% per δ è l’insieme di

Rossi MRLM Econometria - 2022 22 / 53