Sei sulla pagina 1di 11

1

Multicollinearit
SW, cap. 6 (6.7)
Johnston, cap. 6 (6.5)
2
LE ASSUNZIONI DEL MODELLO DEI MINIMI QUADRATI
( X non stocastico)
A2: Il valore atteso del termine di disturbo pari a zero
A1: Il modello lineare nei parametri e correttamente specificato
1 1
1

+ =
n k k n
n
u X y
0 u = ) ( E
A3 & A4: Omoschedasticit e indipendenza dellerrore
I u u
2
u
E o = ') (
A5: I termini di disturbo si distribuiscono normalmente
u~N(0,
u
2
I)
A6: Le variabili esplicative sono linearmente indipendenti
k = ) (X
MULTICOLLINEARITA
3
Multicollinearit
y) X X) X
-1
' '
= ( (

Nelle lezioni precedenti abbiamo visto che lo stimatore dei minimi quadrati
pari a:
e la matrice di varianza-covarianza dello stimatore

|
Pertanto le varianze ( e covarianze) campionarie non dipendono solo dalla
varianza
2
dei disturbi ma anche dai valori campionari delle esplicative.
In particolare la varianza di (e quindi gli standard error) dipende
positivamente dalla covarianza delle esplicative
2 -1

var() (X X)
u
o
'
=
4
Multicollinearit
02 0
50 5 49
5 49 50
1 99 0
99 0 1
3
19 0
26 5 74 4
74 4 26 5
1 9 0
9 0 1
2
1
1 0
0 1
1 0
0 1
1
1
1
1
.
.
.
)
.
.
.
.
. .
. .
)
.
.
.
) .
= '
(


= '
(

= '
= '
(


= '
(

= '
= '
(

= '
(

= '

X X X X X X
X X X X X X
X X X X X X
(
(
(
Tale situazione viene detta collinearit (o multicollinearit) tra
le variabili esplicative
5
Multicollinearit
possibile mostrare che una correlazione crescente tra le variabili esplicative
comporta:
1. Un incremento delle varianze campionarie dei coefficienti: ne
consegue che in ogni singola specificazione i coefficienti
risulteranno sostanzialmente diversi dal loro valore vero (e
spesso non significativamente diversi da zero)
2. Covarianze campionarie maggiori dei coefficienti stimati (una
covarianza positiva tra le X provoca una covarianza negativa tra
i stimati.
3. Piccole variazioni nei dati (eliminazione o aggiunta di
osservazioni) pu produrre forti variazioni nei stimati.
6
Multicollinearit
Due situazioni:
1. Multicollinearit esatta
2. Quasi-multicollinearit
7
Multicollinearit
1. Multicollinearit esatta
Nel caso di due variabili esplicative la multicollinearit esatta
rappresentata da:
2 3
X X o =
2 0
2
2
2 2
2 2
2
2
2
2 2
2 2
= ' = '
(
(
(

= '



) X X X X X X (
o o o
o
o
X X X
X X X
X X n
In questo caso non possibile ricavare un unico vettore dei minimi quadrati
y) X X) X
-1
' ' = ( (

8
Multicollinearit
1. Quasi-multicollinearit
Nel caso di quasi-multicolinearit (collinearit elevata ma non esatta)
le stime dei minimi quadrati esistono e sono le migliori stime lineari
corrette.
Effetti:
Varianze campionarie elevate
Covarianze campionarie maggiori
Forte sensibilit dei coefficienti stimati a piccole variazioni dei dati
Un risultato comune in presenza di forte collinearit ottenere un R
2
elevato e i
singoli coefficienti non significativi.
9
Multicollinearit
Come individuare la presenza di problemi di collinearit tra le esplicative
1. Verificare la presenza di correlazione tra le variabili
2. Controllare gli errori standard e le statistiche t dei coefficienti stimati
3. Verificare la stabilit dei coefficienti a variazioni del campione
4. Test per identificare la collinearit (e.g.VIF variance-inflation ratio e numero
di condizionamento)
10
Multicollinearit
Come individuare la presenza di problemi di collinearit tra le esplicative
4. Test per identificare la collinearit (e.g.VIF variance-inflation ratio e numero
di condizionamento)
Entrambi i test si basano su una misura della correlazione
multipla tra le variabili esplicative (tuttavia la correlazione tra le
esplicative non necessariamente un problema per linferenza, i
quanto la precisione delle stime dipende anche dal noise
2
e
dalla varianza delle variabili esplicative.

Entrambi i test aiutano ad identificare un possibile problema di
collinearit ma non sono di grado di quantificare la gravit del
problema e quanto le stime vengono influenzate dal problema
della collinearit
11
Multicollinearit
Rimedi:
1. Eliminare una o pi variabili
2. Trasformare le variabili esplicative in modo da ottenere un insieme di
esplicative non correlate (metodo componente principale)
3. Aumentare lampiezza campionaria e quindi linformazione a disposizione
delleconometrico (aumentare la varianza delle esplicative).
Misure ad hoc che necessitano di informazione a -priori

Potrebbero piacerti anche