Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Econometrie
Econometrie
qxd
22/10/14
10:34
Page I
conomtrie
Cours et exercices corrigs
Rgis Bourbonnais
9e dition
9782100721511-Bourbo-lim.qxd
14/11/14
9:11
Page II
Dunod, 2015
5 rue Laromiguire, 75005 Paris
www.dunod.com
ISBN 978-2-10-072151-1
9782100721511-Bourbo-tdm.qxd
22/10/14
10:35
Page III
IX
I. La notion de modle
A. Dfinition
B. La construction des modles en conomtrie
II. Le rle de lconomtrie
A. Lconomtrie comme validation de la thorie
B. Lconomtrie comme outil dinvestigation
III. La thorie de la corrlation
A. Prsentation gnrale
B. Mesure et limite du coefficient de corrlation
1
1
2
5
5
5
6
6
8
13
I. Prsentation du modle
A. Exemple introductif
B. Rle du terme alatoire
C. Consquences du terme alatoire
II. Estimation des paramtres
A. Modle et hypothses
B. Formulation des estimateurs
C. Les diffrentes critures du modle : erreur et rsidu
D. Proprits des estimateurs
III. Consquences des hypothses : construction des tests
A. Hypothse de normalit des erreurs
B. Consquences de lhypothse de normalit des erreurs
C. Test bilatral, test unilatral et probabilit critique dun test
IV. quation et tableau danalyse de la variance
A. quation danalyse de la variance
B. Tableau danalyse de la variance
V. La prvision dans le modle de rgression simple
13
13
14
16
17
17
18
21
22
24
24
25
27
33
33
34
39
9782100721511-Bourbo-tdm.qxd
22/10/14
10:35
Page IV
47
47
47
48
49
49
51
54
59
59
60
75
75
76
IV CONOMTRIE
62
67
67
68
73
81
81
82
84
86
90
102
102
103
105
107
107
107
108
112
9782100721511-Bourbo-tdm.qxd
22/10/14
10:35
Page V
114
114
115
118
119
125
125
125
126
127
134
II. Lhtroscdasticit
A. Prsentation du problme
B. Correction de lhtroscdasticit
C. Tests de dtection de lhtroscdasticit
D. Autre test dhtroscdasticit : le test ARCH
142
142
144
147
153
154
154
155
156
157
165
165
165
168
170
170
172
177
177
177
178
183
183
184
9782100721511-Bourbo-tdm.qxd
22/10/14
10:35
Page VI
VI CONOMTRIE
188
192
198
198
199
217
218
218
220
221
221
221
222
223
223
223
224
236
236
239
239
239
240
241
245
245
248
256
256
259
260
260
261
262
275
276
276
9782100721511-Bourbo-tdm.qxd
22/10/14
10:35
Page VII
B. La reprsentation gnrale
C. La reprsentation ARMAX
II. Estimation des paramtres
A. Mthode destimation
B. Dtermination du nombre de retards
C. Prvision
III. Dynamique dun modle VAR
A. Reprsentation VMA dun processus VAR
B. Analyse et orthogonalisation des chocs
C. Dcomposition de la variance
D. Choix de lordre de dcomposition
IV. La causalit
A. Causalit au sens de Granger
B. Causalit au sens de Sims
277
278
279
279
279
280
284
284
285
288
288
292
292
293
297
297
299
299
301
301
302
303
303
306
306
307
308
310
313
314
319
320
322
322
323
325
330
331
9782100721511-Bourbo-tdm.qxd
22/10/14
10:35
Page VIII
335
337
338
340
345
346
346
347
348
349
349
350
355
355
357
358
363
Tables statistiques
367
Bibliographie
375
Index
379
VIII CONOMTRIE
9782100721511-Bourbo-avtpro.qxd
20/10/14
15:06
Page IX
Avant-propos
Cette neuvime dition est enrichie de nouveaux exercices et des dveloppements les plus rcents de lconomtrie. Ce livre couvre tous les champs de
lconomtrie : rgression simple et multiple, violation des hypothses (htroscdasticit, autocorrlation des erreurs, variables explicatives alatoires),
modle dcalage, analyse des sries temporelles, tests de racine unitaire, quations multiples, VAR, cointgration, VECM, conomtrie des variables qualitatives et des donnes de panel
Sur lensemble de ces thmes, ce livre vous propose un cours, des exercices corrigs, et une prsentation des logiciels dconomtrie les plus rpandus.
Souhaitons quil corresponde votre attente.
En effet, nous avons voulu, par une alternance systmatique de cours et
dexercices, rpondre un besoin pdagogique qui est de mettre rapidement en
pratique les connaissances thoriques et ainsi, dutiliser de manire oprationnelle les acquis du cours ; les exercices sont reprs grce un bandeau gris.
De surcrot, le recours des logiciels1, lors de la rsolution des exercices, permet une dcouverte de ces outils et donne une dimension pratique que recherchent ltudiant et le praticien.
Afin que le lecteur puisse lui-mme refaire les exercices, les donnes utilises (sous format Excel, ASCII, RATS et Eviews) ainsi que les programmes de
traitement Batch de Eviews ou de RATS sont disponibles gratuitement par
tlchargement sur le serveur web :
http://regisbourbonnais.dauphine.fr
Pour chaque exercice faisant appel un fichier de donnes, le nom du fichier
est cit en tte de lexercice et repr par licne suivante :
Nous avons voulu faire de ce manuel un livre dapprentissage facilement
accessible ; cest pourquoi les dmonstrations les plus complexes font lobjet de
renvois une bibliographie plus spcialise. Cependant, il convient de prciser
que lconomtrie fait appel des notions dalgbre linaire et dinduction statistique quil est souhaitable de connatre.
1. Trois logiciels sont utiliss : EXCEL ( Microsoft), RATS ( Var Econometrics version 3 et
Estima version 4), Eviews ( Quantitative Micro Software). Nous recommandons aussi particulirement le logiciel GRETL (http://gretl.sourceforge.net) qui est un logiciel dconomtrie
gratuit, complet et trs facile dapprentissage.
Avant-propos IX
9782100721511-Bourbo-avtpro.qxd
20/10/14
15:06
Page X
1. Les lecteurs souhaitant faire des commentaires ou des remarques peuvent me contacter : Rgis
Bourbonnais, universit de Paris-Dauphine, place du Marchal de Lattre de Tassigny, 75775
Paris Cedex 16, E-mail : regis.bourbonnais@dauphine.fr
X CONOMTRIE
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 1
1. Quest-ce que
lconomtrie ?
I. La notion de modle
A. Dfinition
Il est dlicat de fournir une dfinition unique de la notion de modle1. Dans le
cadre de lconomtrie, nous pouvons considrer quun modle consiste en une
prsentation formalise dun phnomne sous forme dquations dont les
variables sont des grandeurs conomiques. Lobjectif du modle est de reprsenter les traits les plus marquants dune ralit quil cherche styliser. Le
modle est donc loutil que le modlisateur utilise lorsquil cherche comprendre et expliquer des phnomnes. Pour ce faire, il met des hypothses et
explicite des relations.
1. La notion de modle est relative au point de vue auquel nous nous plaons : la physique,
lpistmologie...
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 2
2 CONOMTRIE
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 3
I = b0 + b1 r
Y C+I+I
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 4
Nous distinguons plusieurs types de donnes selon que le modle est spcifi en :
srie temporelle : cest le cas le plus frquent en conomtrie, il sagit de
variables observes intervalles de temps rguliers (la consommation
annuelle, totale France, exprime en euros courants sur 20 ans) ;
coupe instantane : les donnes sont observes au mme instant et concernent les valeurs prises par la variable pour un groupe dindividus1 spcifiques (consommation observe des agriculteurs pour une anne donne) ;
panel : la variable reprsente les valeurs prises par un chantillon dindividus intervalles rguliers (la consommation dun chantillon de mnages
de la rgion parisienne sur 20 ans) ;
cohorte : trs proches des donnes de panel, les donnes de cohorte se distinguent de la prcdente par la constance de lchantillon, les individus
sonds sont les mmes dune priode sur lautre.
4) Dcalages temporels
Dans le cadre de modle spcifi en sries temporelles, les relations entre les
variables ne sont pas toujours synchrones mais peuvent tre dcales dans le
temps. Nous pouvons concevoir que la consommation de lanne t est explique
par le revenu de lanne t 1 et non celui de lanne t . Pour lever cette ambigut, il est dusage dcrire le modle en le spcifiant laide dun indice
de temps : Ct = a0 + a1 Yt1 . La variable Yt1 est appele variable endogne
retarde .
On appelle variable exogne une variable dont les valeurs sont prdtermines, et variable endogne une variable dont les valeurs
dpendent des variables exognes.
5) Validation du modle
La dernire tape est celle de la validation2 du modle :
Les relations spcifies sont-elles valides ?
Peut-on estimer avec suffisamment de prcision les coefficients ?
Le modle est-il vrifi sur la totalit de la priode ?
Les coefficients sont-ils stables ? Etc.
toutes ces questions, les techniques conomtriques sefforcent dapporter
des rponses.
1. Le terme dindividu est employ au sens statistique, cest--dire comme un lment dune population : une personne, une parcelle de terre...
2. Validation, cest--dire en conformit avec les donnes disponibles.
4 CONOMTRIE
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 5
1. Au sens statistique, cest--dire avec un seuil (risque derreur ne pas dpasser, souvent 5 %).
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 6
1. Pour dcouvrir lutilisation de lconomtrie des fins de prvision de ventes, voir Bourbonnais
R. et Usunier J. C. (2013).
6 CONOMTRIE
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 7
Corrlation
positive
Corrlation
ngative
Absence de
corrlation
Relation linaire
Graphe 1
Graphe 2
Graphe 5
Graphe 3
Graphe 4
Graphe 5
x
Graphe 2
Graphe 1
y
Graphe 3
Graphe 4
y
x
Graphe 5
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 8
r x,y =
Cov (x,y)
i=1
=
n
n
x y
2
(xi x )
(yi y )2
i=1
[1]
i=1
avec :
Cov (x,y) = covariance entre x et y ;
x et y = cart type de x et cart type de y ;
n
= nombre dobservations.
n
r x,y =
n
n
xi yi
i=1
n
i=1
n
xi
n
i=1
yi
i=1
n
n
n
2
2
x
xi
n
yi2
yi
[2]
2
i
i=1
i=1
i=1
1 et 1 :
8 CONOMTRIE
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 9
ce coefficient empirique qui est une estimation du coefficient vrai r x,y . La thorie des tests statistiques nous permet de lever cette indtermination.
Soit tester lhypothse H0 : r x,y = 0 , contre lhypothse H1 : r x,y = 0 .
x,y
Sous lhypothse H0, nous pouvons dmontrer que
suit une loi
2
1 x,y
n2
de Student n 2 degrs de libert1. Nous calculons alors une statistique, appel le t de Student empirique :
|x,y |
t =
2
1 x,y
[3]
n2
/2
valeur lue dans une table de Student2 au seuil = 0,05 (5 %)
Si t > tn2
n 2 degrs de libert3, nous rejetons lhypothse H0, le coefficient de corrlation est donc significativement diffrent de 0 ; dans le cas contraire, lhypothse dun coefficient de corrlation nul est accepte. La loi de Student tant symtrique, nous calculons la valeur absolue du t empirique et nous procdons au test
par comparaison avec la valeur lue directement dans la table.
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 10
Exercice n 1
fichier C1EX1
16
18
23
24
28
29
26
31
32 34
Engrais y
20
24
28
22
32
28
32
36
41 41
Quantit dengrais
1) Le nuage de points (graphique 6) indique que les couples de valeurs sont approximativement aligns : les deux variables semblent corrles positivement.
Rendement
10 CONOMTRIE
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 11
Somme
x2
y2
xy
20
24
28
22
32
28
32
36
41
41
256
324
529
576
784
841
676
961
1 024
1 156
400
576
784
484
1 024
784
1 024
1 296
1 681
1 681
320
432
644
528
896
812
832
1 116
1 312
1 394
304
7 127
9 734
8 286
16
18
23
24
28
29
26
31
32
34
261
|x,y |
(1
2
x,y
)
0,89
= 5,49 > t80,025 = 2,306
0,1 620
n2
le coefficient de corrlation entre x et y est significativement diffrent de 0.
9782100721511-Bourbo-C01.qxd
20/10/14
15:07
Page 12
12 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 13
2. Le modle
de rgression simple
I. Prsentation du modle
A. Exemple introductif
Soit la fonction de consommation keynsienne :
C = a0 + a1 Y
o :
C
Y
a1
a0
=
=
=
=
consommation,
revenu,
propension marginale consommer,
consommation autonome ou incompressible.
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 14
1) Vocabulaire
La variable consommation est appele variable expliquer ou variable
endogne .
La variable revenu est appele variable explicative ou variable exogne
(cest le revenu qui explique la consommation).
a1 et a0 sont les paramtres du modle ou encore les coefficients de rgression.
2) Spcification
Nous pouvons distinguer deux types de spcifications :
Les modles en srie temporelle, les variables reprsentent des phnomnes
observs intervalles de temps rguliers, par exemple la consommation et le
revenu annuel sur 20 ans pour un pays donn. Le modle scrit alors :
Ct = a0 + a1 Yt
t = 1,. . . , 20
o :
Ct = consommation au temps t ,
Yt = revenu au temps t .
i = 1,. . . , 20
o :
Ci = consommation du pays i pour une anne donne,
Yi = revenu du pays i pour une anne donne.
14 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 15
diffrence entre les valeurs rellement observes de Ct et les valeurs qui auraient
t observes si la relation spcifie avait t rigoureusement exacte. Le terme
t regroupe donc trois erreurs :
une erreur de spcification, cest--dire le fait que la seule variable explicative nest pas suffisante pour rendre compte de la totalit du phnomne expliqu ;
une erreur de mesure, les donnes ne reprsentent pas exactement le phnomne ;
une erreur de fluctuation dchantillonnage, dun chantillon lautre les
observations, et donc les estimations, sont lgrement diffrentes.
Exercice n 1
fichier C2EX1
Revenu
1
2
3
4
5
6
7
8
9
10
8 000
9 000
9 500
9 500
9 800
11 000
12 000
13 000
15 000
16 000
Sachant que la propension marginale consommer est de 0,8 et que la consommation incompressible est 1 000, on demande :
1) de calculer la consommation thorique sur les 10 ans ;
2) considrant que notre erreur dobservation suit une loi normale de moyenne 0 et de
variance 20 000, de gnrer cette variable alatoire et de calculer une consommation
observe tenant compte de cette erreur.
Solution
Les calculs des questions 1) et 2) sont prsents dans le tableau 2.
La consommation thorique (colonne 3) est calcule par application directe de la
formule : Ct = 1 000 + 0,8 Yt .
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 16
La gnration de la variable alatoire t (t N (0 ; 20 000)) ne pose pas de difficult particulire ; bien entendu il en existe une infinit, un exemple en est prsent en
colonne 4.
La consommation observe (colonne 5) est donc gale Ct = 1 000 + 0,8 Yt + t ,
soit la somme de la colonne 3 et de la colonne 4.
Tableau 2 Calcul de la consommation observe
(1)
Anne
1
2
3
4
5
6
7
8
9
10
(2)
Revenu
disponible
8 000
9 000
9 500
9 500
9 800
11 000
12 000
13 000
15 000
16 000
(3)
Consommation
thorique
7 400
8 200
8 600
8 600
8 840
9 800
10 600
11 400
13 000
13 800
Moyenne :
cart type :
(4)
Ala
t
10,01
30,35
231,71
52,84
51,92
183,79
6,55
213,89
241,91
69,62
38,42
137,24
(5)
Consommation
observe
7 389,99
8 169,65
8 831,71
8 652,84
8 788,08
9 616,21
10 593,45
11 186,11
12 758,09
13 869,62
a de a et estimation de
a qui est la valeur particulire de
1. Il ne faut pas confondre : estimateur
lestimateur pour un chantillon.
16 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 17
Frquence
Coefficient 1
pour
t = 1,. . . ,n
9782100721511-Bourbo-C02.qxd
avec :
yt
xt
a0 ,a1
t
n
20/10/14
15:09
Page 18
=
=
=
=
Hypothses
H1 : le modle est linaire en xt (ou en nimporte quelle transformation de xt ).
H2 : les valeurs xt sont observes sans erreur (xt non alatoire).
H3 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle : en moyenne le
modle est bien spcifi et donc lerreur moyenne est nulle.
H4 : E(t2 ) = 2 , la variance de lerreur est constante1 : le risque de lamplitude de lerreur est le mme quelle que soit la priode.
H5 : E(t t ) = 0 si t = t , les erreurs sont non corrles (ou encore indpendantes) : une erreur linstant t na pas dinfluence sur les erreurs suivantes.
H6 : Cov(xt ,t ) = 0 , lerreur est indpendante de la variable explicative.
t=n
t=1
t2 = Min
t=n
(yt a0 a1 xt )2 = Min S
t=1
1. Cette hypothse sappelle lhypothse dhomoscdasticit ; dans le cas o cette hypothse nest
pas vrifie, on parle alors de modle htroscdastique.
18 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 19
xt yt
a0
xt
a1
xt2 = 0
t
yt n
a0
a1
xt = 0
a1 =
t=1
(xt x)2
t=n
t=1
a0 = y
a1 x
t=n
xt yt nx y
t=1
t=n
[1]
xt2 nx 2
t=1
[2]
1. Nous considrons les conditions du deuxime ordre comme vrifies car la fonction est convexe.
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 20
a1 =
xt yt
t=1
t=n
[3]
x
2
t
t=1
Nous remarquons quil sagit de lapplication de la formule [1] dans laquelle x et y sont nulles. Dans le cas de variables centres1, cest donc cette formule [3] quil convient demployer car le terme constant est nul.
Exercice n 2
fichier C2EX2
20 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 21
(2)
yt
(3)
xt
1
2
3
4
5
6
7
8
9
10
7 389,99
8 169,65
8 831,71
8 652,84
8 788,08
9 616,21
10 593,45
11 186,11
12 758,09
13 869,62
8 000
9 000
9 500
9 500
9 800
11 000
12 000
13 000
15 000
16 000
(4)
yt y
2 595,59
1 815,93
1 153,87
1 332,74
1 197,50
369,37
607,88
1 200,54
2 772,52
3 884,05
t=1
t=n
(xt x)2
(6)
(5)* (5)
(7)
(4)* (5)
3 280
2 280
1 780
1 780
1 480
280
720
1 720
3 720
4 720
10 758 400
5 198 400
3 168 400
3 168 400
2 190 400
78 400
518 400
2 958 400
13 838 400
22 278 400
8 513 518
4 140 300
2 053 879
2 372 268
1 772 292
103 422
437 670
2 064 920
10 313 755
18 332 692
0
0
64 156 000
6 415 600
50 104 729
5 010 472
0
0
t=n
(xt x)(yt y)
a1 =
(5)
xt x
50 104 729
= 0,78
64 156 000
t=1
a0 = y
a1 x = 9 985,57 0,78 11 280 = 1 176,08
Ces estimations sont comparer aux valeurs vraies (respectivement 0,8 et 1 000),
les diffrences importantes en ce qui concerne surtout le terme constant sont imputables
lala dobservation qui perturbe lestimation des coefficients.
Le modle de rgression simple peut scrire sous deux formes selon quil sagit
du modle thorique spcifi par lconomiste ou du modle estim partir dun
chantillon.
Modle thorique spcifi par lconomiste avec t lerreur inconnue :
yt = a0 + a1 xt + t
et = rsidu
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 22
[4]
[5]
a1 = a1 +
t=1
t=n
= a1 +
(x t x)
t=1
t=1
t=n
[6]
(x t x)
t=1
n
car
n
(x t x) =
t=1
n
x t n x = nx nx = 0 avec x =
t=1
xt
t=1
a1 = a1 +
(x t x)t
t=1
t=n
[7]
(x t x)
t=1
t=n
(xt x)E(t )
do :
E(
a1 ) = E(a1 ) +
t=1
t=n
(xt x)2
t=1
a1 ) = a1 car E(t ) = 0
Soit E(
a0 ) = a0 .
De mme on dmontre que E(
22 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
y =
a0 +
a1 x
y = a0 + a1 x +
Page 23
a1 a1 )x
a0 = a0 + (
E(
a0 ) = a0 + E() E((
a1 a1 )x) = a0
a1 a1 ) = 0 et E() = 0
car E(
n
t = 0
t=1
t=1
2
2
(daprs [7])
V (
a1 ) = E{
a1 E(
a1 )} = E(
a1 a1 ) = E t=n
(x t x)2
V (
a1 ) = E
2
wt t
=E
avec
wt =
t=1
w +2
2
t
2
t
wt wt t t
t<t
(xt x)
(xt x)2
t=n
t=1
V (
a1 ) =
wt2 E(t2 ) + 2
wt wt E(t t )
t<t
t
2
wt2 2 =
(xt x)2
[8]
Lorsque n alors
(xt x)2 tend galement vers , do V (
a1 ) tend
t
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 24
x
1
V (
a0 ) = 2 +
2
n
(xt x)
[9]
Lim V (
a0 ) 0 lorsque n .
2
+ x 2 V (
a1 )
n
a1 ) = x V (
a1 )
Cov(
a0 ,
24 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 25
Ou encore : et = yt a 1 x a 0 a 1 xt + a 1 x
Or y = a 1 x + a 0
Do : et = yt y a 1 (xt x)
En remplaant yt et y par leurs expressions [4] et [5], il vient :
et = (a1
a1 )(xt x) + (t )
et2 = (a1
a1 )2
(xt x)2 +
(t )2 + 2(a1
a1 )
(xt x)(t )
(xt x)(t ) = (a1
a1 )
(xt x)2
t
et2 =
(t )2 (a1
a1 )2
(xt x)2
et2 = E
(t )2 E (a1
a1 )2
(xt x)2
t
2
2
2
2
(t ) = E
(t 2t + ) = E
t 2
t +
2
a) E
t
t
t
t
t
2
2
2
2
2
=E
t 2n + n = E
t 2n + n
t
t
=E
t2 n2 = E
t2
t
t
=E
t
2
t
2
t
t
1 2
E( ) E
t
n
t
2
t
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 26
2
1
2
E
(t ) = n2 E 1 + 2 + . . . + n
n
t
a1 )2
b) E (a1
(xt x)2 = 2
t
2
a1 )2 =
En effet E (a1
(xt x)2
Do :
E
1 2
e
n2 t t
[10]
Ce qui nous permet de dfinir, en remplaant la variance des erreurs par son
estimateur dans les expressions [8] et [9], les estimateurs empiriques1 de la
variance de chacun des coefficients.
2
a21 =
(xt x)2
t
[11]
x
1
a20 =
2 +
2
n
(xt x)
t
et
a0 a0
a0
26 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
n
Page 27
et2
t=1
= (n 2)
2
2
t=1
Nous pouvons remarquer que (n 2) 2 = (n 2) a2 = 2
a
a
(x t x)2
t
En effet
a1 a1
a1
a1 a1
=
a1
a2
1
(n 2) 21
a1 (n 2)
centre rduite la racine carre dun chi-deux divis par son degr de libert.
Il est donc possible maintenant de mettre en place des tests statistiques afin
dapporter des rponses des problmes tels que :
comparaison dun coefficient de rgression par rapport une valeur fixe ;
comparaison de deux coefficients de rgression provenant de deux chantillons diffrents ;
dtermination dun intervalle de confiance pour un coefficient.
a1 a1
suit une loi de Student n 2 degrs de libert.
a 1
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 28
a1 0
suit donc une loi de
a 1
Student n 2 degrs de libert. Le test dhypothses bilatral consiste donc com|
a1 |
la valeur du t de Student lue dans la
parer le ratio de Student empirique t =
a 1
2) Test unilatral
Soit tester, un seuil de 5 %, lhypothse H0 : a1 = 0 contre lhypothse
H1 : a1 > 0 ou a1 < 0 selon que le coefficient estim soit positif ou ngatif.
Le test dhypothses unilatral consiste donc comparer le ratio de Student
|
a1 |
empirique t =
la valeur du t de Student lue dans la table n 2 degrs
a 1
de libert et pour un seuil de probabilit gal 5 %, soit si n 2 > 30,
0,05
0,05
t
= 1,65 . Si t* > t
= 1,65 nous rejetons lhypothse H0 (cf. graphique 5),
le coefficient thorique et inconnu a1 est significativement diffrent de 0.
Attention, la table de Student en fin du livre est tabule pour les tests bilatraux,
il faut donc lire 10 % = 2 0,05.
1. Si le degr de libert est suprieur 30, la loi de Student peut tre approxime par une loi normale.
28 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 29
Exercice n 3
fichier C2EX2
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 30
=
= ta1
loi de Student n 2 degrs de libert.
a1
a1
ta1
est appel le ratio de Student.
(colonne 6 du tableau de calcul 3). Lestimateur de la variance de lerreur nous est donn
par [10] :
et2
2 =
n2
1. Le seuil est aussi appel risque de premire espce : cest la probabilit de rejeter lhypothse H0 bien quelle soit vraie.
30 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 31
yt et de et
a) Calcul de
yt est calcule par application des estimations
a0 et
a1 :
La srie ajuste
yt =
a0 +
a1 x t
soit
y1 =
a0 +
a1 x1 e1 = y1
y1
y1 = 1 176,08 + 0,78 8 000 = 7 423,95 1 e1 = 7 389,99 7 423,95 = 33,96
y2 = 1 176,08 + 0,78 9 000 = 8 204,93
Les rsultats sont consigns dans le tableau 4. Nous remarquons bien que
et = 0 (proprit de la mthode des moindres carrs).
t
et
et2
7 423,95
8 204,93
8 595,43
8 595,43
8 829,72
9 766,90
10 547,88
11 328,87
12 890,83
13 671,81
33,96
35,28
236,28
57,41
41,64
150,69
45,57
142,76
132,74
197,81
1 153,38
1 244,98
55 830,26
3 296,40
1 733,93
22 707,42
2 076,39
20 379,08
17 620,12
39 127,38
0,00
0,00
165 169,30
16 516,93
Somme
Moyenne
soit
a1
= 0,017 9
c) Calcul du ratio de Student et rgle de dcision.
a1
a1
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 32
/2
/2
H1 tn2
+ tn2 H1
H0
cart type)
/2
/2
Si ta1
est infrieur tn2 ou suprieur +tn2 alors on rejette lhypothse H0
(nous sommes dans la zone hachure H1), le coefficient a1 est alors significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt est donc contributive
lexplication de la variable Ct.
/2
Si ta1
est compris dans lintervalle tn2 , alors nous ne sommes pas en mesure de
rejeter lhypothse H0 (donc on laccepte), le coefficient a1 nest pas significativement
diffrent de 0 (on accepte a1 = 0) ; la variable explicative Rt nest donc pas explicative de la variable Ct.
Il est plus simple de profiter de la symtrie de la loi de Student et donc de calculer
la valeur absolue du ratio de Student et de la comparer directement la valeur lue dans
la table.
La rgle de dcision pour un seuil = 0,05 est alors la suivante :
|
a1 |
0,025
si ta1
> tn2
on rejette lhypothse H0, le coefficient a1 est alors
=
a1
si ta1
tn2
on accepte lhypothse H0, le coefficient a1 nest donc
=
a1
ta1
=
|
a1 |
0,78
=
= 43,57 > t80,025 = 2,306 1 a1 = 0
a1
0,017 9
32 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 33
= tn2
, lintervalle de
suit une loi de Student n 2 degrs de libert, soit
a1
a1
1
par le point moyen
).
yt =
a0 +
a1 xt + et
yt =
a1
xt +
et
a0 +
t
t
t t
yt n
a0
a1
xt =
et or
a0 = y
a1 x , en divisant par n il apparat que
t
t
t
et = 0 .
t
yt =
yt , il y a galit entre la moyenne de la srie expliquer et la
t
t
yt
yt =
et = 0 y =
y
SC T
= SC E
+SC R
[12]
1. Cela nest vrai que pour les modles comportant un terme constant, ou bien, pour les modles
sans terme constant, si les donnes sont centres sur leur moyenne.
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 34
[13]
Somme
des carrs
SC E =
(
yt y)2
Degr
de libert
Carrs
moyens
SC E/1
n2
SC R/(n 2)
Rsidu
SC R =
et2
Total
SC T =
(yt y)2
n1
34 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
SC E
ddl SC E
F =
=
SC R
ddl SC R
Page 35
(
yt y)2
t
1
Ou encore :
SC E
ddl SC E
F =
=
SC R
ddl SC R
(n 2)
(
yt y)2
t
1
[14]
et2
et2
(n 2)
R2
1
=
(1 R 2 )
(n 2)
[15]
et2
t=1
= (n 2)
a2i
2
=
(n
2)
suit une loi du 2 (chi-deux) n 2 degrs de
2
a2i
(a 1 a1 )2
(xt x)2
t
En effectuant le rapport des deux chi-deux on obtient : F =
,
et2
t
a 12
(xt x)2
t
=
et2
t
(n 2)
(n 2)
SC E
1
suit une loi de Fisher 1
SC R
(n 2)
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 36
yt y = a 0 + a 1 xt a 0 a 1 x = a 1 (xt x) .
Nous remarquons :
2
F = ta1
=
a 1
a1
2
a 12
(xt x)2
a
t
= 2
=
et /(n 2)
2 /
(xt x)2
2
1
Exercice n 4
quivalence des tests et analyse de la variance
Un agronome cherche estimer la relation liant la production de mas yi au taux de
bauxite xi se trouvant dans la terre en formalisant la relation :
yi = a0 + a1 xi + i
partir dune tude statistique portant sur 85 parcelles de terre, un conomtre lui
fournit les rsultats suivants :
= 132,80 1,1 xi + ei i = 1,. . . , 85
yi
(4,3)
()
(10,2)
= ratio de Student
ei2
= 6 234,32
1. Le degr de libert de la loi de Student tant suprieur 30, il est licite de lapproximer par
une loi normale, 1,96 est la valeur de la loi normale un seuil de 0,05 (test bilatral).
36 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 37
Puisque t est largement suprieur 1,96, nous rejetons lhypothse H0, a1 est donc
significativement diffrent de 0. Le taux de bauxite est un facteur explicatif (ngatif) de
la production de mas.
a1 /t = 0,107.
a1
Lcart type du coefficient
a1 est gal :
=
Montrons lquivalence de ce test avec H0 : r = 0 .
Le coefficient de corrlation linaire simple est gal :
2
(xi x)(yi y)
(xi x)(yi y)
i
i
r2 =
r = "
(xi x)2
(yi y)2
(xi x)2
(yi y)2
i
(xi x)2
a1
(xi x)(yi y)
i
r2 =
(yi y)2
SC E
= R2
SC T
En effet :
a1
(xi x)(yi y) =
a1
a1
(xi x)2 =
a12
(xi x)2
i
i
i
=
(
a1 x i
a1 x)2 =
(
yi
a0 y +
a0 )2 =
(
yi y)2 = SC E
i
Pour le modle de rgression simple, nous avons galit entre le coefficient de dtermination et le carr du coefficient de corrlation.
Nous avons la relation :
F =
R2
(1
R 2 )/(n
2)
r2
(1
r 2 )/(n
2)
= (t )2
donc on en dduit :
r (n 2)
#
t =
qui suit une loi de Student n 2 degrs de libert.
(1 r 2 )
r 83
t = 10,2 = #
r 2 = 0,556 |r| = 0,745 1
(1 r 2 )
1. Nous savons que le coefficient r est en ralit ngatif puisque le coefficient de rgression
a1
est lui-mme ngatif.
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 38
SC R =
ei2
SC T =
(yi y)2
i
ei2
SC R
=1
Or, daprs [13], nous avons : R 2 = 1
SC T
(yi y)2
i
R = r = 0,556 , la connaissance de SC R =
2
SC T = 14 041,26 ainsi que, daprs [12], SC E = 7 806,94 . Nous pouvons maintenant construire le tableau 6 danalyse de la variance.
Tableau 6 Analyse de la variance
Source
de variation
Somme
des carrs
Degr
de libert
Carrs
moyens
xi
Rsidu
Total
SC E = 7 806,94
SC R = 6 234,32
SC T = 14 041,26
1
85 2
85 1
7 806,94
75,11
F =
SC E/1
7 806,94
0,05
= 3,96
=
= 103,94 > F1,83
SC R/(n 2)
75,11
H1
a1 = 0
r x,y = 0
SC E = 0
a1 =
0
r x,y = 0
SC E = 0
Le premier test porte sur la pente de la droite de rgression, le deuxime test sur le
coefficient de corrlation entre x et y et, enfin, le troisime a pour but de juger si la
somme des carrs expliqus est significative, ces trois tests nanmoins rpondent la
mme interrogation.
3) Le coefficient a1 est-il significativement infrieur 1 ?
La formulation des hypothses est la suivante :
H0 : a1 = 1
H1 : a1 < 1
38 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 39
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 40
Puisque la variable xn+1 est certaine et lerreur n+1 est non autocorrle avec les
t cette expression peut scrire :
2
V (en+1 ) = V (
a0 ) + xn+1
V (
a1 ) + 2xn+1 Cov(
a0 ,
a1 ) + V (n+1 )
En remplaant les variances et la covariance des coefficients par leurs expressions daprs [9] et connaissant V (n+1 ) = 2 , nous obtenons :
V (en+1 ) =
2
2
+ x 2 V (
a1 ) + xn+1
V (
a1 ) 2xn+1 x V (
a1 ) + 2
n
ou encore :
(xn+1 x)2
1
V (en+1 ) = V (yn+1
yn+1 ) =
2 +
+ 1
n
(xt x)2
[16]
(xn+1 x)2
en+1 = yn+1
yn+1 N 0, 2 +
+ 1
n
(xt x)2
t
Soit
a0 +
a1 xn+1 yn+1
$
tn2 (Student n 2 d.d.l.)
%
(xn+1 x)2
%1
% +
+1
&n
(xt x)2
t
/2
n2
yn+1 =
yn+1 t
$
%
%1
(x x)2
n+1
%
+
+1
&n
(xt x)2
t
40 CONOMTRIE
[17]
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 41
Cas particulier
Lorsque nous utilisons le modle de rgression simple pour calculer une droite
de tendance (moindres carrs sur le temps), le modle est spcifi ainsi :
Tt =
a0 +
a1 t + et
pour t = 1,. . . , n
Exercice n 5
fichier C2EX2
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 42
R2
(1
R 2 )/(n
2)
r2
(1
r 2 )/(n
2)
= (t )2 = 43,52
2) Augmentation de 8 % du revenu.
Nous avons :
yt =
a1
xt soit
yt = 0,78
xt = 0,78 0,08 = 0,062 4
La consommation augmente de 6,24 %, soit un peu moins que le revenu.
3) Les prvisions sont calcules par lutilisation du modle estim.
y11 = 1 176,08 + 0,78 x11 = 1 176,08 + 0,78 16 800
= 14 280,08
Lintervalle de prvision [17] peut alors tre calcul :
$
%
%1
(x x)2
/2
11
y11 =
y11 tn2
%
+1
+
&n
(xt x)2
t
avec :
n
(xt x)2
t
x
/2
tn2
x11
y11
IC
= 10
= 143,69 (daprs lexercice 3)
= 64 156 000 (daprs lexercice 3)
= 11 280 (daprs lexercice 2)
= 2,306
= 16 800
= 14 280,08 2,306 180,32
= [13 864,24 ; 14 695,91]
1. La distribution tant normale (loi continue), il est clair que la probabilit dapparition de chacune des valeurs de lintervalle nest pas identique. La valeur la plus probable se trouve au
centre de lintervalle.
42 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 43
Exercice n 6
Comparaison de coefficients de rgression
Un conomiste spcialis en conomie du travail sintresse la relation liant la
rmunration et la dure des tudes (thorie du capital humain). Pour ce faire, il dispose dun chantillon de 40 hommes et 25 femmes ayant le mme ge, dont il relve la
rmunration annuelle (yi ) , exprime en milliers deuros, et le nombre dannes
dtudes (xi ) .
Les estimations conomtriques conduisent aux rsultats suivants :
Pour les hommes :
yi = 18,60 + 1,8 xi + ei i = 1,. . . , 40 n 1 = 40
(9,3) (5,2)
() = ratio de Student
R 2 = 0,42
Pour les femmes :
yi = 14,50 + 0,7 xi + ei i = 1,. . . , 25 n 2 = 25
(12,8) (2,5)
() = ratio de Student
R 2 = 0,22
1) Linfluence de la dure des tudes sur la rmunration vous semble-t-elle significative ?
2) Existe-t-il une diffrence significative de limpact de la dure des tudes sur la rmunration des hommes et des femmes ?
Solution
1) Pour rpondre cette premire question, nous pouvons analyser soit les ratios de
Student, soit le coefficient de dtermination.
Le ratio de Student empirique de la variable annes dtudes est gal :
Pour les hommes :
tah
=
ah
0,05
= 5,2 > t38
= 1,96
ah
ta f =
af
0,05
= 2,5 > t23
= 2,06
a f
et
a f = 0,28
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 44
faible et moins significatif que celui des hommes. Les probabilits critiques1 sont, pour
les hommes, de c = 0,000 1 et de c = 0,02 pour les femmes (nous considrons le
coefficient comme non significativement diffrent de 0 au seuil de 2 %).
Le test de Fisher men sur les coefficients de dtermination conduit aux mmes
rsultats.
2) Ce problme se ramne un test de diffrence de moyennes de variables alatoires
normales indpendantes et de variances ingales.
Le rapport
H0 : ah = a f
H0 : d = ah a f = 0
H1 : ah = a f
H1 : d = ah a f = 0
a f ) (ah a f )
(
ah
suit une loi de Student n 1 + n 2 4 degrs de
a h a f
libert.
2
et d =
Avec
d2 =
a2 f +
ah
a f et sous lhypothse H0, le rapport scrit :
ah
d
(1,8 0,7)
0,05
= t =
= 2,49 > t61
= 1,96
d
0,342 + 0,282
Rappel : Var(a x1 + b x2 ) = a 2 Var(x1 ) + b2 Var(x2 ) + 2abCov(x1 ,x2 ) o x1 et x2
sont deux variables alatoires et a et b sont deux scalaires. Ici Cov(a h ,a f ) = 0 car les
deux rgressions sont indpendantes. Do Var(a f a h ) = Var(a f ) + Var(a h ) .
Nous rejetons lhypothse H0, il existe une diffrence significative des coefficients
de rgression : la dure des tudes des femmes a moins dimpact sur la rmunration
que la dure des tudes des hommes (sur cet chantillon...)
Nous pouvons dterminer la probabilit critique de ce test (probabilit partir de
laquelle nous sommes amens accepter lhypothse H0). La lecture de la table de
Student 61 degrs de libert (sur la table ) indique une probabilit comprise entre
0,01 et 0,02 (la valeur exacte dtermine par la fonction Excel loi.student
est 0,0154). Le risque de se tromper en rejetant lhypothse H0 est donc de 1,54 % ;
compte tenu de ce trs faible risque, nous rejetons lhypothse H0. Evidemment, plus la
probabilit critique est faible plus nous sommes conforts dans notre dcision.
Exercice n 7
Apprendre manipuler les formules
Soit les rsultats dune estimation conomtrique :
yt = 1,251 xt 32,95 + et
n = 20
R 2 = 0,23
= 10,66
1. Cette notion est importante : il sagit de dterminer le seuil de probabilit partir duquel on
accepte lhypothse H0. Plus ce seuil est faible, moins le risque de se tromper est important.
44 CONOMTRIE
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 45
1) A partir des informations connues, on demande de retrouver les statistiques suivantes : la somme des carrs des rsidus (SCR), la somme des carrs totaux (SCT),
la somme des carrs expliqus (SCE), la valeur de la statistique du Fisher empirique
(F ) et lcart type du coefficient a 1 ( a1
).
2) Le coefficient de la variable x est-il significativement suprieur 1 ?
Solution
1) On sait que =
"
SCR
R 2 = 0,23 = 1 SC R/SC T
SC T = SC R/(1 R 2 ) = 2045,44/(1 0,23) = 2 656,42
Or SCT = SCE + SCR SCE = 610,98
Nous pouvons calculer maintenant :
R2
SC E
F =
=
= 5,40 t = F = 2,32
2
(1 R )/(n 2)
SC R/(n 2)
(dans le cas dun modle de rgression simple t 2 = F ). Nous pouvons en dduire
a 1
1,251
= 0,54.
lcart type du coefficient : a1
= =
t
2,32
2) On pose le test dhypothses :
H0 : a1 = 1 contre lhypothse H1 : a1 > 1
Sous H0, nous pouvons crire :
a 1 a1
1,25 1
0,05
=
= 1,734 1 nous sommes donc dans la
= 0,46 < t18
ta1 =
a1
0,54
Exercice n 8
Apprendre utiliser les formules
partir dun chantillon de 190 observations, on tudie la relation entre la variable
expliquer yi et la variable explicative xi .
laide des informations fournies ci-dessous reconstituez les huit valeurs manquantes signales par VM1, ...VM8.
1. Attention, comme le test est unilatral et que la table de Student de cet ouvrage est tabule directement pour /2 (cas le plus gnral dun test bilatral), il convient donc ici de lire sur la table
un seuil de 0,10 = 2 0,05 .
9782100721511-Bourbo-C02.qxd
20/10/14
15:09
Page 46
Dependent Variable: Y
Method: Least Squares
Sample: 1 190
Included observations: 190
Variable
Coefficient
Std. Error
C
X
R-squared
S.E. of regression
Sum squared resid
VM1
16.61141
VM3
VM2
Mean dependent var
S.D. dependent var
F-statistic
4364.928
VM4
VM5
322.8850
VM7
t-Statistic
Prob.
0.0000
0.0000
VM6
VM8
778.9623
F =
a 0
= 262,76
ta0
778,96 = 27,91
VM3 : a 1 = #!
, or = 322,88 ;
(xi x)2
(xi x)2
!
x =
do1 (xi x)2 = (n 1) x2 = 189 (3,447)2 = 2245,66
n1
322,88
=
= 6,81
a 1 = #!
2
2245,66
(xi x)
do VM4 = VM3 VM2 = 190,15
VM5 : on sait que F =
R 2 /1
R2
=
2
(1 R )/(n 2)
(1 R 2 )/188
= 778,96 R 2 =
778,96
= 0,80
778,96 + 188
1. Nous prenons ici la formule de lestimateur de lcart type calcul partir dun chantillon,
donc nous divisons par n 1.
46 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 47
3. Le modle
de rgression multiple
e modle linaire gnral est une extension du modle de rgression simple abord au chapitre prcdent. Aprs avoir prsent le
modle linaire gnral (I), nous envisageons une procdure destimation des paramtres en tudiant les proprits statistiques des estimateurs (II). Les diffrents tests dhypothses concernant les coefficients
du modle sont proposs en (III), et la section (IV) est consacre lanalyse de la variance ainsi quaux tests sy rattachant.
En (V) nous prsentons une classe particulire de sries explicatives : les
variables indicatrices, puis la prvision laide du modle linaire gnral fait lobjet de la section (VI).
Enfin nous terminons ce chapitre par quelques exercices rcapitulatifs.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 48
avec :
yt = variable expliquer la date t ;
x1t = variable explicative 1 la date t ;
x2t = variable explicative 2 la date t ;
...
xkt = variable explicative k la date t ;
a0 , a1 ,. . . , ak = paramtres du modle ;
t = erreur de spcification (diffrence entre le modle vrai et le modle sp-
B. Forme matricielle
Lcriture prcdente du modle est dun maniement peu pratique. Afin den
allger lcriture et de faciliter lexpression de certains rsultats, on a habituellement recours aux notations matricielles. En crivant le modle, observation
par observation, nous obtenons :
y1
y2
...
yt
...
yn
(n,1)
= X
(n,k+1)
(k+1,1)
(n,1)
avec :
y1
1
1
y2
.
.
.
.
.
.
Y = ; X =
1
yt
.
.
..
.
.
1
yn
x11
x12
..
.
x21
x22
..
.
x1t
..
.
x2t
..
.
x1n
x2n
...
...
...
...
...
...
xk1
1
a
0
xk2
2
.
a1
.
a
; a = 2 ; =
xkt
t
...
..
ak
n
xkn
48 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 49
Min
n
[2]
t=1
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
n
x1t
x2t
.
.
.
xkt
...
x1t
x1t2
x2t x1t
...
xkt x1t
x2t
...
x1t x2t
...
x2t2
...
...
xkt x2t
...
Page 50
xkt
x1t xkt
x2t xkt
...
2
xkt
a0
yt
x1t yt
a1
=
x y
a2
2t t
...
...
ak
xkt yt
avec et = yt
yt o et est le rsidu, cest--dire lcart entre la valeur observe
de la variable expliquer et sa valeur estime (ajuste).
Attention : il convient de bien distinguer entre lerreur de spcification du
modle (not t ) qui est et restera inconnue et le rsidu (et ) qui, lui, est connu.
1) Cas particulier
Si nous raisonnons sur des donnes centres, lestimateur de a peut scrire en
fonction des matrices des variances et covariances empiriques :
a1
Var(x1 )
a Cov(x2 , x1 ) Var(x2 )
Cov(x2 , x3 ) . . . Cov(x2 , xk )
2
=
. . . Cov(x3 , xk )
... ...
ak
Cov(xk , x1 ) Cov(xk , x2 ) Cov(xk , x3 ) . . . Var(xk )
Cov(x2 , y)
Cov(x3 , y)
...
Cov(xk , y)
a0 = y
a1 x 1
a2 x 2 . . .
ak x k .
avec
Que sont des donnes centres sur la moyenne ? Soit xt une variable connue
sur n observations et x sa moyenne, nous pouvons calculer une nouvelle variable
(X t = xt x) dont la somme est par construction nulle :
n
n
(xt x) =
Xt = 0 .
t=1
50 CONOMTRIE
t=1
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 51
1) Hypothses stochastiques
H1 : les valeurs xi, t sont observes sans erreur.
H2 : E(t ) = 0 , lesprance mathmatique de lerreur est nulle.
H3 : E(t2 ) = 2 , la variance de lerreur est constante (t) (homoscdasticit).
H4 : E(t t ) = 0 si t = t , les erreurs sont non corrles (ou encore indpendantes).
H5 : Cov(xit , t ) = 0 , lerreur est indpendante des variables explicatives.
2) Hypothses structurelles
H6 : absence de colinarit entre les variables explicatives, cela implique
que la matrice (X X) est rgulire et que la matrice inverse (X X)1
existe.
H7 : (X X)/n tend vers une matrice finie non singulire.
H8 : n > k + 1, le nombre dobservations est suprieur1 au nombre des
sries explicatives.
1. Dans le cas dune galit, nous aurions un systme de n quations n inconnues, donc parfaitement dtermin.
9782100721511-Bourbo-C03.qxd
20/10/14
Y = Xa +
Y = X
a+e
= X
Y
a
15:12
Page 52
(e = rsidu)
e =Y Y
Nous obtenons :
a = (X X)1 X Y = (X X)1 X (Xa + )
a = (X X)1 X (Xa) + (X X)1 X
a = a + (X X)1 X
[4]
a ) = a + (X X)1 X E() = a
do E(
car E() = 0
Lestimateur est donc sans biais :
E(
a) = a
(
a a)(
a a) = (X X)1 X X (X X)1 do
a = (X X)1 X E( )X (X X)1 avec E( ) = = 2 I = matrice des
variances et covariances de lerreur .
E(1 1 )
E(2 1 )
= E( ) =
...
E(n 1 )
E(1 2 )
...
E(2 2 )
...
E(n 2 ) . . .
E(1 n )
E(2 n ) =
E(n n )
0
2
=
...
0
0
0 ... 0
0 ... 0
0 . . . 2
[5]
52 CONOMTRIE
9782100721511-Bourbo-C03.qxd
2
a =
n
XX
n
20/10/14
15:12
Page 53
1
Lim a = 0 si n (daprs les hypothses H3
e e
nk1
[6]
[7]
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 54
yt =
b)
yt y =
y
et = 0
= SC E
SC T
+ SC R
[8]
[9]
R 2 est appel le coefficient de dtermination, et R le coefficient de corrlation multiple. R 2 mesure la proportion de la variance de Y explique par la
rgression de Y sur X .
Y
Y
e e
=
1
Y Y
Y Y
[10]
54 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 55
libert est faible1, il convient de corriger le R 2 afin de tenir compte du relativement faible nombre dobservations compar
au nombre de facteurs explicatifs
2
par le calcul dun R 2 corrig not R :
2
R =1
2
n1
(1 R 2 )
nk1
[11]
Exercice n 1
fichier C3EX1
4) Calculer le R 2 et le R corrig.
1. Dans le cas dun modle o le nombre dobservations est gal au nombre de variables explicatives (degr de libert = 0 ), le R 2 = 1 . Cependant, le pouvoir explicatif de ce modle est nul.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 56
x1
x2
x3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12
14
10
16
14
19
21
19
21
16
19
21
25
21
2
1
3
6
7
8
8
5
5
8
4
9
12
7
45
43
43
47
42
41
32
33
41
38
32
31
35
29
121
132
154
145
129
156
132
147
128
163
161
172
174
180
Solution
1) Forme matricielle
Nous disposons de 14 observations et trois variables explicatives, le modle peut
donc scrire :
Y = Xa +
avec :
1
12
1 2 45 121
2
.
a0
14
1 1 43 132
.
1
;
=
Y = 10 ; X = 1 3 43 154 ; a =
t
a2
..
.. ..
..
..
.
. .
.
.
.
a3
..
21
1 7 29 180
14
Dimensions :
.
(14,1)
(14,4)
(4,1)
(14,1)
1
2
45
121
1
1
43
132
1
3
43
154
...
1
...
7
. . . 29
. . . 180
1
1
..
.
2
1
3
..
.
45
43
43
..
.
121
132
154
=
..
.
29
180
14
85
=
532
2 094
56 CONOMTRIE
85
631
3 126
13 132
532
3 126
20 666
78 683
2 094
13 132
78 683
317 950
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
(X X)1
20,16864
0,015065
=
0,23145
0,07617
Page 57
0,015065
0,013204
0,001194
0,00094
0,23145
0,001194
0,003635
0,000575
0,07617
0,00094
0,000575
0,000401
Calcul de X Y
X
1
2
45
121
1
1
43
132
1
3
43
154
...
...
...
...
Y
12
1
248
14
7
1 622
10 =
29 .. 9 202
.
180
37 592
21
Calcul de
a
(X X)1
20,16864
0,015065
0,23145
0,07617
0,015065
0,013204
0,001194
0,00094
X Y
0,23145
0,001194
0,003635
0,000575
248
0,07617
0,00094
1 622 =
a
9 202
0,000575
37 592
0,000401
32,89132
0,801900
=
0,38136
0,03713
Soit
a0 = 32,89 ;
a1 = 0,80 ;
a2 = 0,38 ;
a3 = 0,03
Les calculs que nous venons de dvelopper sont longs et fastidieux et mettent en vidence lintrt incontestable dutiliser un ordinateur.
3) Calcul de
2 et de
a2
Daprs [6]
2 =
Soit
e e
, nous devons donc calculer le rsidu e .
nk1
= Y X
e =Y Y
a
a0 +
a1 x1t +
a2 x2t +
a3 x3t )
et = yt (
et = yt 32,89 0,80 x1t + 0,38 x2t + 0,03 x3t
et2
e e
67,45
t=1
=
=
=
= 6,745
nk1
14 3 1
10
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 58
yt
yt
et
1
2
3
4
5
6
7
8
9
10
11
12
13
14
12
14
10
16
14
19
21
19
21
16
19
21
25
21
12,84
12,39
13,18
13,39
17,70
17,88
22,20
18,86
16,51
18,76
17,92
21,90
22,71
20,76
0,84
1,61
3,18
1,61
3,70
1,12
1,20
0,14
4,49
2,76
1,08
0,90
2,29
0,24
0,71
2,58
10,11
2,58
13,67
1,26
1,44
0,02
20,14
7,63
1,17
0,81
5,27
0,06
67,45
Somme
et2
La matrice des variances et covariances estimes des coefficients nous est donne
par [7], soit :
a =
2 (X X)1
20,16864
0,015065
a = 6,745
0,23145
0,07617
0,015065
0,013204
0,001194
0,00094
0,23145
0,001194
0,003635
0,000575
0,07617
0,00094
0,000575
0,000401
2
a3
a 0 = 11,66
= 6,745 0,013 =
0,087
a1
= 0,29
= 6,745 0,0036 =
0,024
a2
= 0,15
= 6,745 0,0004 =
0,0026
a3
= 0,05
Nous connaissons e e = 67,45 , il convient de calculer
(yt y)2 = 226,86 .
t
et2
67,45
t
2
R =1
=1
= 0,702
2
226,86
(yt y)
t
2
R =1
58 CONOMTRIE
n1
14 1
(1 R 2 ) = 1
(1 0,702) = 0,613
nk1
14 4
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 59
et2
t=1
a2i
2
= (n k 1) 2 = (n k 1) 2
ai
ai ai
ai
ai ai
=
est le rapport dune loi norEn effet,
ai
a2i
1
(n k 1) 2
ai (n k 1)
male centre rduite la racine carre dun chi-deux divis par son degr de
libert.
(
a a) a1
a a) suit une loi du 2 (chi-deux) k + 1 degrs de libert
(
(somme au carr de k + 1 variables alatoires normales centres rduites, les
k + 1 coefficients).
1
a1
(
a a)
a a)
(
k+1
1. Lensemble de ces rsultats sont une gnralisation k variables explicatives des rsultats prsents au chapitre 2, paragraphe III.B.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 60
1
1
a a)
(
a a) 2 (X X )1 (
k
+
1
En effet, F =
est le rapport de deux
2
1
(n k 1) 2
(n k 1)
chi-deux diviss par leurs degrs de libert (caractristique dune loi de Fisher
k + 1 et n k 1 degrs de libert).
[13]
/2
Si tai > tnk1
alors nous rejetons lhypothse H0, ai est significativement
diffrent de a (au seuil de ).
/2
Si tai tnk1
alors nous acceptons lhypothse H0, ai nest pas significativement diffrent de a (au seuil de ).
60 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 61
ai
[14]
tai est appel le ratio de Student, les rgles de dcision cites plus haut sappli-
quent alors.
Ce test est trs important ; en effet, si dans un modle estim, un des coefficients (hormis le terme constant) nest pas significativement diffrent de 0, il
convient dliminer cette variable1 et de r-estimer les coefficients du modle.
La cause de cette non-significativit, est due :
soit une absence de corrlation avec la variable expliquer,
soit une colinarit trop leve avec une des variables explicatives.
1
a1
(
a a)
a a) suit une loi de Fisher
(
k+1
[15]
1. En effet, elle napporte aucune contribution et dgrade lestimation des autres variables.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 62
(n k 1)
2 (n k 1)
2
IC =
;
2
2
1
2
[16]
1) La matrice HAT
La matrice HAT2 , note H, joue un rle essentiel dans la dtection de leffet
de levier.
Nous calculons la matrice HAT H = X (X X )1 X .
Les lments de la premire diagonale de cette matrice H sont appels les
leviers, qui dterminent linfluence de lobservation i sur les estimations obtenues par la rgression.
Le levier est situ sur la premire diagonale de cette matrice soit
h i = xi (X X )1 xi
n
h i = k + 1 , la somme des lments de
Deux proprits : 0 h i 1 et
i =1
62 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 63
Si chaque observation pse le mme poids, alors les valeurs des h i doivent
k+1
.
tre proches de
n
k+1
,
n
lobservation est alors considre comme un point de levier (leverage point) ou
point dinfluence.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 64
Il est aussi possible de calculer des rsidus studentiss externes, ils sont calculs de la mme manire mais en excluant du calcul lobservation i.
Exercice n 2
fichier C3EX1
=
= ta1
= 2,75 > t10 = 2,228 a1 = 0 , la variable explicative x 1 est
a1
0,29
a2
0,15
0,03
a3
= t = 0,60 < t 0,05 = 2,228 a3 = 0
=
10
a3
a3
0,05
64 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 65
0,05
I Ca1 =
a1 tnk1
a1
= 0,80 2,228 0,29 = [0,14 ; 1,45]
Nous sommes bien dans la zone dacceptation de H0 (cf. graphique 4 du chapitre 2).
Par souci de simplification, nous pouvons procder au test de Student en profitant
de la symtrie de cette loi, soit calculer :
|
a1 a1 |
|0,80 1|
0,05
=
= 1,81 acceptation de H0
= 0,68 < t10
a1
0,29
Le fait de raisonner sur la valeur absolue du numrateur entrane une lecture directe de la table et ainsi une construction et interprtation immdiate du test.
3) Le test dhypothses est le suivant :
1
a1
H0 :
=
0,5
a2
1
a1
H1 :
=
0,5
a2
Examinons les diffrents lments de la relation [15] sous H0 :
1
1 (
(
aq aq )
aq
aq aq )
q
0,80
1
et aq =
. La matrice des variances
Nous avons : q = 2 ,
aq =
0,38
0,5
et covariances des coefficients a t calcule lors de lexercice 1, nous ne retenons que
la sous-matrice de dimension 2 2 correspondant aux deux coefficients de rgression
faisant lobjet du test.
11,57140 3,80213
aq = 6,745 0,013204 0,001194
1 =
aq
0,001194 0,003635
3,80213
42,03506
1. Attention, le test est unilatral, il convient de lire sur la table de Student tabule pour /2 un
seuil de 0,10 = 2 0,05 .
9782100721511-Bourbo-C03.qxd
F =
20/10/14
15:12
1
(0,80 1; 0,38 + 0,5)
2
Page 66
11,57140 3,80213
3,80213 42,03506
0,80 1
0,38 + 0,5
0,05
= 4,10 , le F empirique est
F = 0,612 est comparer F (q, n k 1) = F2,10
infrieur au F lu dans la table, on accepte lhypothse H0. Les donnes ne sont pas
incompatibles avec la possibilit que les coefficients a1 et a2 soient simultanment et
respectivement gaux 1 et 0,5.
Rsidus
ei
hi
eiS
1
2
3
4
5
6
7
8
9
10
11
12
13
14
0,8408
1,6068
3,1800
1,6055
3,6973
1,1220
1,2015
0,1426
4,4880
2,7622
1,0830
0,8994
2,2946
0,2387
0,2790
0,2966
0,3091
0,3248
0,2609
0,1825
0,5327
0,2025
0,1804
0,1442
0,3066
0,2115
0,4086
0,3605
0,3813
0,7377
1,4732
0,7523
1,6559
0,4778
0,6768
0,0615
1,9088
1,1497
0,5008
0,3900
1,1489
0,1149
4
k+1
=2
= 0,57 , aucune valeur nest suprieure
n
14
0,57, nous ne dtectons pas de point de levier (ou de point dinfluence).
Le seuil du levier est gal 2
0,025
Les rsidus studentiss sont tous dans lintervalle t10
= 2,228, nous ne dtectons pas de valeur anormale.
66 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 67
La rgression est juge significative si la variabilit explique est significativement diffrente de 0. Le tableau 4 prsente le tableau danalyse de la
variance2 permettant deffectuer le test de Fisher.
(
yt y)2 /k
R 2 /k
t
F = 2
=
(1 R 2 )/(n k 1)
et /(n k 1)
t
(daprs [9])
[17]
1. Nous remarquons que nous pouvons rpondre cette question par le test dun sous-ensemble
de coefficients [15], le test ici prsent conduit videmment des rsultats identiques.
2. Voir chapitre 2, paragraphe 4, pour la construction de ce tableau.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 68
x1 , x2 ,. . . , xk
Degr de libert
Carrs moyens
SC E/k
nk1
SC R/(n k 1)
Rsidu
SC R =
et2
SC T =
Total
(yt y)2
n1
68 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 69
Exercice n 3
fichier C3EX1
R 2 /k
0,702/3
0,05
= 3,71
=
= 7,878 > F3,10
(1 R 2 )/(n k 1)
(1 0,702)/10
1. Le lecteur notera la prsentation standard des rsultats destimation dun modle. Les informations listes ici doivent imprativement figurer. noter que le t de Student est souvent indiqu la place de lcart type des coefficients afin de pouvoir, sans aucun calcul, procder aux
tests de significativit des coefficients.
2. Les calculs sont effectus partir dun logiciel, il peut apparatre de lgres diffrences entre
les calculs manuels et les rsultats, imputables au fait que le logiciel tient compte dun nombre
lev de dcimales.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 70
Somme
des carrs
Degr
de libert
Carrs
moyens
x1
x1 , x2 , x3
Rsidu
Total
SC E 1 = 117,65
SC E = 159,41
SC R = 67,45
SC T = 226,85
1
3
10
13
117,65
53,14
6,74
1. Sauf si la ou les variables ajoutes sont orthogonales la variable expliquer, SC E reste alors
identique. Ce cas est videmment rare.
70 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 71
(SC E SC E 1 )/(k k )
41,67/(3 1)
0,05
= 4,10
=
= 3,09 < F2,10
SC R/(n k 1)
67,45/10
Ou encore : F :
(SC R 1 SC R)/(k k )
(109,2 67,45)/2
=
= 3,09
SC R/(n k 1)
67,45/10
H0 :
a3 = a31 = a32
a0 = a01 = a02
Ce test de stabilit des coefficients (test de Chow) se ramne la question suivante :
existe-t-il une diffrence significative entre la somme des carrs des rsidus (SC R) de
lensemble de la priode et laddition de la somme des carrs des rsidus calcule partir des deux sous-priodes (SC R 1 + SC R 2 ) ?
En effet, dans le cas dune rponse ngative, cela signifie que le fait de scinder en
deux chantillons namliore pas la qualit du modle, donc quil est stable sur la totalit de la priode.
Les tapes sont alors les suivantes.
tape 1 : estimation du modle sur chacune des deux sous-priodes1 et calcul des
sommes des carrs de rsidus.
sous-priode 1 : donnes de 1 7
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 72
Lhypothse H0 est accepte, les coefficients sont significativement stables sur lensemble de la priode.
Attention, en cas dhtroscdasticit (cf. chapitre 5), le test de Chow est biais dans
le sens dune surestimation du seuil de rejet du test, nous rejetons trop souvent lhypothse H0.
3) Test de a1 = 1 et a2 = a3
Si cette hypothse est vrifie, le modle :
yt = a0 + a1 x1t + a2 x2t + a3 x3t + t
peut scrire :
yt = a0 + 1 x1t + a2 x2t + a2 x3t + t
ou encore :
72 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 73
z t = 0,0111vt + 13,74 + et
(0,051)
n = 14
R 2 = 0,0389
(.) = Ecart type
= 3,0109
Tableau 6 Variables transformes sous lhypothse
de vrification des contraintes
t
z t = yt x1t
vt = x2t + x3t
1
2
3
4
5
6
7
8
9
10
11
12
13
14
10
13
7
10
7
11
13
14
16
8
15
12
13
14
166
175
197
192
171
197
164
180
169
201
193
203
209
209
(SC R 1 SC R)/ddln
(108,78 67,45)/2
0,05
= 4,10
=
= 3,06 < F2,10
SC R/(n k 1)
67,45/10
avec ddln = (n k 1) (n k 1) = k k = 2 .
Lhypothse H0 est accepte, les contraintes envisages sur les coefficients sont compatibles avec les donnes.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 74
H0 : Ra = r
H1 : Ra = r
Ainsi le Fisher empirique est donn par :
F =
{(R
a r) [R(X X)1 R ]1 (R
a r)}/q
SC R/(n k 1)
o
a est le vecteur des coefficients estims sur le modle non contraint.
On rejette H0 si le F est suprieur au F lu q et n k degrs de libert.
Quelques exemples dutilisation pour un modle k variables explicatives :
Test sur un coefficient de rgression. Hypothse H0 : a3 = 0,5 .
Soit tester lgalit du 3e coefficient par rapport 0,5 ; la contrainte scrit
Ra = r avec R = (0 0 0 10 0 0) et r = (0 0 0 0,50 0 0) . Le premier lment
des vecteurs correspond au terme constant a0. Ce test peut aussi tre men par
un classique test de Student.
Test dgalit de coefficients. Hypothse H0 : a1 = a3 a1 a3 = 0 .
La contrainte scrit Ra = r avec R = (0 1 0 1 . . . 0 0 0)
et r = (0 0 0 0 . . . 0 0 0) .
Test de significativit globale de la rgression.
Hypothse H0 : a1 = a2 = a3 = = ak = 0 .
Ce test de Fisher (cf. quation [17]) est quivalent lcriture contrainte Ra = r
avec R = (0 1 1 11 1) et r = (0 0 0 00 0 0) .
De manire quivalente, nous pouvons utiliser la statistique :
F =
(SC Rc SC R)/q
o SC Rc est la somme des carrs des rsidus du
SC R/(n k 1)
modle contraint.
Une autre manire de procder consiste comparer le ratio de vraisemblance1 du modle contraint et non contraint : si la contrainte est valide, nous
devons avoir L c < L nc o L nc est la fonction de vraisemblance du modle non
contraint et L c est la fonction de vraisemblance du modle contraint. Soit
L c /L nc < 1 , sous forme logarithmique Ln(L c ) Ln(L nc ) < 0 ou encore
lc lnc < 0 , la diffrence entre les logarithmes des fonctions doit tre significativement ngative. On dmontre que ce test se ramne un test du 2 par calcul
de la statistique L R = 2(lc lnc ) qui suit un 2 r degrs de libert ( r tant
le nombre de contraintes). Ainsi, si L R est suprieur au 2 lu dans la table au
seuil choisi et r degrs de libert, on rejette lhypothse H0, les restrictions
ne sont pas vrifies.
Enfin, nous pouvons citer le test du multiplicateur de Lagrange ( L M test )
fond sur lestimation dune quation intermdiaire et de la valeur dune statistique L M = n R 2 (n = nombre dobservations et R 2 = coefficient de dtermi1. Dans un modle de rgression classique, la maximisation de la fonction de vraisemblance fournit des estimations identiques celle de la mthode des MCO.
74 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 75
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 76
B. Exemples dutilisation
1) Correction de valeurs anormales
Les sries statistiques sont parfois affectes de valeurs anormales lies la survenance dvnements exceptionnels : grve, guerre, aberration climatique, etc.
Deux problmes se posent alors : dtecter la valeur anormale et la corriger afin
quelle ne perturbe pas lestimation statistique des autres variables.
Exercice n 4
Dtection et correction de valeurs anormales par variable indicatrice
Un modle de production de service du secteur du tourisme est spcifi de la manire suivante :
Q P St = a0 + a1 V At + a2 P O Pt + t
avec :
Q P St = production du secteur tourisme pour lanne t ;
V At
(2,9)
(5,8)
76 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 77
Solution
0,05
La variable indicatrice Dt a un ratio de Student de t = 5,8 > t14
= 2,14 , le coefficient de rgression de cette variable est significativement diffrent de 0, la production
de service pour lanne 16 est donc anormalement basse (120,56) . Cette baisse est,
sans doute imputable leffet de la guerre.
Gnralisation
Dans le cas dun phnomne se produisant de manire sporadique, la variable indicatrice prend la valeur 1 pour la ou les priodes que lon dsire corriger et 0 pour les
autres.
Nous remarquons que nous pouvons procder au test de Chow (stabilit du modle
sur lensemble de la priode) en recourant une variable indicatrice prenant la valeur 1
pour la premire sous-priode et la valeur 0 pour la deuxime sous-priode. Le test de
Student portant sur le coefficient de la variable indicatrice permet alors de se dterminer sur un modle un rgime ou un modle deux rgimes.
2) Variable qualitative
Il peut savrer important dans certaines spcifications de modle de tenir compte de leffet, sur la variable endogne, de variables qualitatives : tre titulaire
dun diplme, genre dun individu, appartenance politique, etc. Lutilisation
dune variable indicatrice permet de segmenter les individus en deux groupes et
de dterminer si le critre de segmentation est rellement discriminant.
Attention, dans le cas de variables qualitatives plusieurs modalits, par
exemple la couleur des yeux (bleu, vert, marron, autres), ou bien la situation
familiale (clibataire, mari, divorc, veuf, autres), etc. Il convient alors de
coder autant de variables indicatrices que de modalits moins une. En reprenant
lexemple de la couleur des yeux nous dfinissons trois variables indicatrices :
bleu (= 1 si lindividu les yeux bleus, 0 sinon), vert (= 1 si lindividu les yeux
verts, 0 sinon), marron (= 1 si lindividu les yeux marrons, 0 sinon), le cas des
autres individus nappartenant pas lune des trois premires catgories est
implicitement contenu dans le terme constant. Une erreur ne pas commettre
consiste crer une seule variable explicative code, par exemple, de la manire suivante : bleu = 1, vert = 2, marron = 3,
Au chapitre 12 nous traitons du cas particulier des variables qualitatives qui
figurent en tant que variables expliquer.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 78
Exercice n 5
Intgration dune variable qualitative
Afin de dterminer les facteurs explicatifs de la russite de la licence en sciences
conomiques, on spcifie le modle suivant :
N L = a0 + a1 N D + a2 DS +
o :
N L = note moyenne obtenue en licence,
N D = note moyenne obtenue en fin de deuxime anne,
DS = variable indicatrice de genre (1 pour les hommes et 0 pour les femmes).
Lestimation partir dun chantillon de 60 tudiants conduit aux rsultats suivants :
N L = 8,5 + 0,3 N D 1,2 DS + e
(4,5 ) (7,1)
(2,3)
n = 60
R 2 = 0,72
() = t de Student
Le fait dtre homme ou femme a-t-il une influence sur la note obtenue en licence
de sciences conomiques ?
Solution
La variable indicatrice DS a un ratio de Student de
0,05
t = 2,3 > t57
= 1,96
78 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 79
3) Analyse de saisonnalit
Exercice n 6
fichier C3EX6
T2
T3
T4
164
34
168
45
197
75
223
78
298
89
198
36
201
67
209
78
245
81
309
82
85
32
98
76
100
72
119
84
124
81
179
29
197
75
216
75
260
83
267
83
Annes
1
2
3
4
5
Ventes
Pub.
Ventes
Pub.
Ventes
Pub.
Ventes
Pub.
Ventes
Pub.
Solution
1) Lestimation du modle de rgression simple
Vt = a0 + a1 Pubt + t
conduit aux rsultats suivants :
Vt = 104,89 + 1,29 Pubt + et
(1,85)
n = 20
R 2 = 0,16
() = t de Student
La publicit a-t-elle un effet significatif sur les ventes ? La valeur du ratio du Student
empirique permet de rpondre cette question.
0,05
t = 1,85 < t18
= 2,10 le coefficient a1 nest pas significativement diffrent
de 0, la publicit na pas, a priori, dimpact sur les ventes.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 80
2) Le graphique 1 de la srie des ventes et des dpenses publicitaires indique une srie
des ventes fortement saisonnire avec un creux trs affirm au troisime trimestre
alors que la variable publicit ne semble pas affecte de variations saisonnires.
La relation entre les ventes et la publicit ne peut tre dtermine puisque le mouvement saisonnier vient occulter lestimation conomtrique1. Il convient donc dintgrer ce mouvement saisonnier laide de variables muettes.
3) Le modle tenant compte de ce mouvement saisonnier scrit :
Vt = a0 + a1 Pubt + a2 D1t + a3 D2t + a4 D3t + t
avec D1t = variable indicatrice du trimestre 1 : cette variable est compose de 0, sauf
pour les premiers trimestres pour lesquels la valeur 1 figure ; D2t = variable indicatrice
du trimestre 2 : cette variable est compose de 0, sauf pour les deuximes trimestres pour
lesquels la valeur 1 figure ; D3t = variable indicatrice du trimestre 3 : cette variable est
compose de 0, sauf pour les troisimes trimestres pour lesquels la valeur 1 figure.
(0,38)
(0,47)
(6,25)
1. Dans un modle conomtrique, les variables doivent tre non saisonnires ou Corriges des
Variations Saisonnires (CVS).
80 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 81
n = 20
R 2 = 0,83
() = t de Student
Les dpenses publicitaires, dont le ratio de Student est gal 3,97, sont maintenant
explicatives1 des ventes ; la variable indicatrice D3t est la seule variable muette significative (t = 6,25), ce qui implique que la saisonnalit des ventes est lie essentiellement au creux du troisime trimestre.
Tableau 8 Variables indicatrices
pour une dsaisonnalisation trimestrielle
Vt
Pubt
D1t
D2t
D3t
164
198
85
179
168
201
98
197
197
209
100
216
223
245
119
260
298
309
124
267
34
36
32
29
45
67
76
75
75
78
72
75
78
81
84
83
89
82
81
83
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
0
0
1
0
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
T1
T2
T3
T4
A. Prdiction2 conditionnelle
Le problme consiste dterminer quelle valeur doit tre attribue la variable
endogne lorsque nous connaissons les valeurs des variables exognes.
1. Ceci est noter : dans un modle, labsence dune ou de plusieurs variables explicatives importantes peut entraner une mauvaise estimation des variables figurant dj dans le modle.
2. Il ne sagit pas toujours de prvoir une valeur dans le futur, mais dans le cadre de sries temporelles de simuler le pass ou bien dans les modles en coupe instantane de prdire des
valeurs.
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 82
= 2 (X X)1 ) )
(puisque V (a)
On connat : V (t+h ) = 2
La variance de lerreur de prvision est donc gale :
2
et+h
= 2 [X t+h
(X X)1 X t+h + 1]
Avec X t+h
[18]
1
x1t+h
=
x2t+h vecteur des valeurs prvues des variables explicatives.
...
xkt+h
82 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 83
Nous remarquons que, comme pour le modle de rgression simple, la variance de lerreur de prvision est dautant plus faible lorsque :
la variance rsiduelle est faible ;
les valeurs prvues des variables explicatives se rapprochent de leur
moyennes.
Lintervalle au seuil (1 ) de la prvision est alors :
"
/2
yt+h =
yt+h tnk1
2 [X t+h
(X X)1 X t+h + 1]
[19]
Exercice n 7
fichier C3EX1
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 84
y15 = 25,84 + 0,71 x1 15 0,33 x2 15 = 25,84 + 0,71 3 0,33 24
y15 = 20,25
De mme, pour la priode 16, on obtient :
y16 = 25,84 + 0,71 x1 16 0,33 x2 16 = 25,84 + 0,71 6 0,33 38
y16 = 17,26
Les carts types de lerreur de prvision sont donns par [18] :
2
e15
=
2 [X 15
(X X)1 X 15 + 1] . Nous devons calculer (X X)1, les autres lments tant connus.
14
85
532
X X = 85
631
3 126 (X X)1 =
532 3 126 20 666
5,707687 0,16341
0,12221
= 0,16341
0,011001
0,002542
0,12221
0,002542
0,002809
1
5,707687 0,16341
0,1222
e215 = (2,538)2 (1 3 24) 0,16341
0,011001
0,002542 3 + 1
0,12221
2
e15
0,002542
0,0022809
24
Les intervalles de la prvision semblent assez larges, cependant il convient de souligner que la distribution de probabilit suit une loi de Student et qu ce titre la valeur
la plus probable demeure la valeur centrale (la prvision estime) et que la probabilit
dapparition diminue lorsque lon sloigne de cette valeur centrale.
Nous remarquons que lcart type de lerreur de prvision de la priode 16 est infrieur celui de la priode 15. Cela est la consquence des valeurs des variables explicatives pour la priode 16 que nous avons choisies sensiblement gales leur moyenne.
84 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 85
et = yt
yt xt
at1
yt
=#
Se
X
1
(1 + xt (X t
1 t1 ) x t )
avec t = K + 2,K + 3,K + 4,. . . , n(K = k + 1 est le nombre total de paramtres estims du modle). Ce rsidu rcursif suit donc une loi normale N (0, 2 ) .
Soit les deux tests :
le CUSUM (CUmulative SUM) fond sur la somme cumule des rsidus
rcursifs,
le CUSUM SQ fond sur la somme cumule du carr des rsidus rcursifs.
partir du rsidu rcursif wt , on calcule la statistique CUSUM :
Wt =
t
nK
wj
SC R j=K +2
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 86
St =
w2j
j=K +2
n
avec t = K + 2,. . . ,n et 0 St 1 ;
w
2
j
j=K +2
Plutt que destimer des spcifications alternatives (par exemple linaire ou non
linaire), le test porte sur la significativit dun ou des coefficients dune quation intermdiaire dans laquelle figure la srie expliquer ajuste et leve la
puissance 2, 3, 4 Le test RESET est men en trois tapes :
86 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 87
Exercice n 8
fichier C3EX1
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 88
10
11
12
13
14
88 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 89
0.049866
Probability
0.827792
Coefficient
Std. Error
t-Statistic
Prob.
16.40322
42.74223
0.383771
0.7092
X1
0.326961
1.759415
0.185835
0.8563
X2
0.150146
0.809298
0.185526
0.8565
0.015484
0.069342
0.223308
0.8278
Test Equation :
Dependent Variable : Y
Included observations : 14
Variable
C
FITTED^2 =
yt2
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 90
Exercice n 9
Estimation dun modle et tests de validit partir de la connaissance de quelques lments statistiques
Sur n = 100 observations et pour trois sries (y, x1 et x2 ), nous avons les rsultats
numriques suivants :
2
2
2
V (y) = 1 000 ; r y,
x1 = 0,75 ; r x1, x2 = 0,45 ; r y, x2 = 0,85 ; y = 12
y = 10 x1 6.
1) Nous avons effectu la rgression :
Le coefficient de x1 est-il significativement diffrent de 0 ?
2) La rgression de y sur x2 a donn
y = 4 x2 + 8 , le coefficient de x2 est-il significativement diffrent de 0 ?
3) Calculer les coefficients du modle : y = a0 + a1 x1 + a2 x2 + , et le coefficient de
corrlation multiple.
4) Les coefficients a1 et a2 sont-ils significativement diffrents de 0 ? La rgression estelle globalement significative ?
Solution
1) La variance estime du coefficient de rgression est donne par :
2
a2 =
(x1t x 1 )2
t
Nous savons que dans le cadre de la rgression simple, il y a galit entre corrlation simple et corrlation multiple, soit :
2
(yt y)(x1t x 1 )
Cov (y, x1 )2
t
2
r y, x1 =
=
V (y) V (x1 )
(yt y)2
(x1t x 1 )2
t
t
et2
t
2
= R =1
= 0,75
(yt y)2
Or :
V (y) = 1 000 =
(yt y)2
t
(yt y)2
=
100
(yt y)2 = 100 000
t
Nous utilisons ici la formule de la variance dune population (division par n) et non
la formule de la variance dun chantillon (division par n 1).
Do :
et2 = (1 0,75) 100 000 = 25 000
2 = 25 000/(n 2) = 255,1
t
90 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:12
Page 91
2
(yt y)(x1t x 1 )
et
2
r y,
= 0,75
x1 =
(yt y)2
(x1t x 1 )2
t
Connaissant
(yt y)2 = 100 000 , nous trouvons :
t
(x1t x 1 )2 = 750 et
(yt y)(x1t x 1 ) = 7 500
t
(x2t x 2 )2 = 5 312,5
t
et
(yt y)(x2t x 2 ) = 21 250
t
a1
a2
=
Var(x1 )
Cov(x1 , x2 )
Cov(x1 , x2 )
Var(x2 )
1
Cov(y, x1 )
Cov(y, x2 )
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 92
2
r x1,
x2 =
[Cov(x1 , x2 )]2
t
= 0,45
=
V(x1 ) V(x2 )
(x1t x 1 )2
(x2t x 2 )2
t
a1
a2
=
7,5
13,39
13,39
53,12
1
0,242
75
=
0,061
212,5
0,061
0,034
5,19
75
=
2,69
212,5
Y
= (X
a) =
a X (X (X X)1 X Y ) =
a X Y
Car Y
a ) (X
Le coefficient de corrlation multiple est gal R = 0,98
4) Analyse des rsultats et tests statistiques.
Significativit des coefficients
Pour calculer les ratios de Student, il convient dabord de connatre les carts types
de chacun des coefficients.
1
1
Var(x1 )
Cov(x1 , x2 )
2
2
1
2
ai =
(X X) =
Cov(x1 , x2 ) Var(x2 )
n
Or :
(yt y)2
(1 R 2 )
2
)
SC
T
SC
R
(1
R
(1 0,96) 100 000
t
2 =
=
=
=
nk1
nk1
nk1
100 2 1
2 = 41,23
2
a1
= 41,23
0,242
5,19
= 0,097
a1
= 16,4 > t 0,05 = 1,96
= 0,316 t =
100
0,316
2
a2
= 41,23
0,034
2,69
= 0,014
a2
= 22,8 > t 0,05 = 1,96
= 0,118 t =
100
0,118
Les coefficients a1 et a2 sont significativement diffrents de 0. Nous pouvons observer des diffrences par rapport aux valeurs estimes prcdemment, sur les coefficients
et sur leurs carts types. Cela est la consquence de la colinarit1 entre x1 et
x2 (r x1, x2 = 0,67) .
92 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 93
(1
R 2 /k
0,96/2
0,05
= 3,10
=
= 1 164 > F2,97
k 1)
(1 0,96)/97
R 2 )/(n
Exercice n 10
Test dune combinaison linaire de coefficients de rgression (test de
contrainte linaire)
Pendant 23 ans nous avons relev, sur une parcelle de terre situe en Auvergne, les
rendements de la culture de bl (y) , la temprature moyenne (x1 ) et le niveau des prcipitations (x2 ) .
Lajustement de ce modle conduit aux rsultats suivants :
y = 0,510 x1 0,350 x2 + 27,3 + e
n = 23
R 2 = 0,937
0,0009
(X X)1 = 0,08
0,3
et
SC T =
0,08
0,0025
0,02
0,3
0,02
0,2
(yt y)2 = 317,46
t
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 94
(
a1 2
a2 ) 0
suit une loi de Student n k 1 degrs de
a12
a2
a2 ) :
Il convient tout dabord de calculer la variance de (
a1 2
On rappelle que Var(a x + b y) = a 2 Var(x) + b2 Var(y) + 2a b Cov(x,y) (a et b
sont deux nombres rels ; x et y sont deux variables alatoires).
a2 ) = Var(
a1 ) + Var(2
a2 ) + 2 Cov(
a1 , 2
a2 )
Var(
a1 2
a2 ) = Var(
a1 ) + (2)2 Var (
a2 ) + 2 2 Cov(
a1 ,
a2 )
Var(
a1 2
De plus, la variance rsiduelle est donne par :
Do
2
2
2
a1
a2
a1 ,
a2 )
a12
a2
=
+4
4 Cov (
2
a12
a2
= 0,0009 + 4 0,0025 4(0,08) = 0,33
a2 ) 0
(
a1 2
(0,51 + 2 0,35)
0,05
=
= 2,08
= 2,10 > t20
a12
0,57
a2
Nous rejetons (de justesse !), au seuil de 5 %, lhypothse H0. Cependant, pour un
seuil de 4 %, lhypothse H0 est accepte.
Remarque : Nous pouvons aussi procder ce test en calculant la statistique
a1 2
a2 2
qui suit un 2 1 degr de libert ; cest ainsi que ce test de restriction
a 1 2 a 2
linaire sur les coefficients du modle peut tre gnralis des restrictions non linaires
(test de Wald). Par analogie, prenons par exemple une contrainte du type
a1
a2 2
a1 a2 = 1 , la statistique
suit un 2 1 degr de libert. Cependant, la
a 1 a 2
variance de (
a1
a2 ) nest plus directement calculable, elle est alors estime par une
approximation de Taylor. Sans procder deux estimations diffrentes, lune sur le
modle non contraint et lautre sur le modle contraint (cf. exercice 3), le test de Wald
permet, donc en une seule tape, de tester des restrictions sur les valeurs des coefficients.
Les logiciels dconomtrie proposent directement ce test.
1. Nous pouvons rpondre cette question par un test danalyse de la variance (section IV).
94 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 95
Exercice n 11
Reconstitution dinformations manquantes
Un conomtre recherche une relation entre le taux de mortalit (TX), les dpenses
de sant (DS), le pourcentage de plus de 60 ans dans la population (POP) et la densit de
mdecins (DM).
Une estimation sur 10 pays effectue partir du logiciel RATS conduit aux rsultats
suivants (les donnes ont t pralablement centres sur leur moyenne) :
(X X)
0,0034229
= 0,00074442
0,018265
0,1031686
0,125482
????
(X X)1
0,0034229
= 0,00074442
0,018265
0,1031686
0,125482
0,26286
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 96
0,103
0,1
et aq =
. La matrice des variances
0,318
0,3
covariances des coefficients est gale :
0,0034229
a = 0,0482 0,00074442
0,1031686
0,018265
0,125482
0,26286
Nous avons q = 2 ,
aq =
do :
aq
= 0,0482
0,0034229
0,018265
0,018265
0,26286
1 =
aq
F =
1
(0,103 0,1
2
0,318 0,3)
9632,962
669,3578
9632,962
669,3578
669,3578
125,4386
669,3578
125,4386
0,103 0,1
0,318 0,3
0,05
F = 0,172 est comparer F (q, n k 1) = F2,7
= 4,74 , le F empirique
est infrieur au F lu dans la table, on accepte lhypothse H0.
Exercice n 12
Modle deux rgimes : estimation par variable muette
ou par analyse de la variance
Nous reprenons lexercice 6 du chapitre 2 concernant la relation liant la rmunration et la dure des tudes. Nous disposons dun chantillon de 40 hommes et 25 femmes
ayant le mme ge dont nous connaissons la rmunration annuelle (yi ) et le nombre
danne dtudes (xi ) .
96 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 97
Pour tudier linfluence du genre sur la rmunration, nous avions compar les coefficients de rgression.
1) Quel type de variable peut-on introduire pour tudier cet effet ?
2) Nous avons procd trois estimations :
sur lchantillon global et nous obtenons : SC R ;
sur lchantillon des 40 hommes
: SC Rh ;
: SC R f .
Solution
1) Une variable muette prenant la valeur 1 pour les hommes et 0 pour les femmes permet
destimer leffet du genre sur la rmunration. Si le coefficient de cette variable indicatrice est significativement diffrent de 0, alors le genre est un facteur discriminant.
2) Il sagit dune application du test de Chow un modle en coupe instantane (test
dhomognit de comportement).
Le Fisher empirique est gal :
F =
Exercice n 13
fichier C3EX13
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 98
L = facteur travail
t = terme derreur rpondant aux hypothses classiques.
Nous disposons de donnes concernant 50 entreprises du secteur des tlcommunications en Europe pour une anne donne. Le tableau 9 prsente un extrait des donnes.
Tableau 9 Extrait des donnes de production, facteur travail, facteur capital
et variable indicatrice
Entreprise
DU M
1
2
5 192 511
11 523
4 610
8 717 373
22 476,2
6 948
49
3 701 601
10 147,4
4 760
50
440 380
835
248
1) crire le modle sous sa forme originale, cest--dire non linaire. Comment sinterprtent les coefficients a1 et a2 de ce modle ?
2) On dsire mesurer lhomognit des comportements entre les entreprises publiques
et les entreprises prives, pour ce faire nous intgrons une variable muette (nomme
DUM) qui prend les valeurs 0 pour les entreprises publiques et 1 pour les entreprises prives.
Soit estimer le modle suivant :
Log Q = Log a0 + a1 Log K + a2 Log L + b0 DU M + b1 DU M Log K
+ b2 DU M Log L +
Existe-t-il une diffrence des fonctions de production entre les entreprises publiques
et prives ? Si oui, pouvez-vous la quantifier ?
3) Proposer et expliciter une autre mthode afin de tester lhomognit des comportements des entreprises.
4) Nous proposons maintenant destimer une fonction de production de type
Translog en ngligeant les spcificits public/priv :
Log Q = Log a0 + a1 Log K + a2 Log L + a3 0,5 (Log K )2
+ a4 0,5 (Log L)2 + a5 Log L Log K +
La spcification Translog vous semble-t-elle mieux adapte que la spcification
Cobb-Douglas ? Vous justifierez votre rponse par un test appropri.
Solution
1) le modle sous sa forme initiale scrit : Q = a0 K a1 L a2 e
Les coefficients sinterprtent comme tant des lasticits :
a1 = lasticit de la production au facteur capital
a2 = lasticit de la production au facteur travail
98 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 99
Il sagit dun modle linaire sur ses coefficients, cest--dire non linaire sous sa
forme initiale mais linarisable par une simple transformation logarithmique, le modle
est Log-linaire.
2) Les rsultats destimation sont les suivants :
Dependent Variable : LOG(Q)
Included observations : 50
Variable
Coefficient
Std. Error
t-Statistic
Prob.
6.477194
0.287830
22.50358
0.0000
LOG(L)
0.230860
0.143231
1.611803
0.1142
LOG(K)
DUM
0.747993
0.143545
5.210878
0.0000
1.018567
0.457088
2.228384
0.0310
DUM*LOG(L)
0.212946
0.241356
0.882290
0.3824
DUM*LOG(K)
0.091142
0.225917
0.403431
0.6886
Coefficient
Std. Error
t-Statistic
Prob.
6.517159
0.267719
24.34327
0.0000
LOG(L)
0.266781
0.111144
2.400321
0.0206
LOG(K)
0.711198
0.109808
6.476720
0.0000
1.072324
0.433148
2.475654
0.0171
0.118229
0.055440
2.132570
0.0385
DUM
DUM*LOG(L)
Les variables sont maintenant toutes significatives, nous constatons que les variables
indicatrices DUM sont explicatives : il existe donc une diffrence significative entre les
fonctions de production des entreprises publiques et prives.
Pour les entreprises publiques, la fonction de production scrit (DUM = 0) :
Log Q = 6,52 + 0,266 Log L + 0,711 Log K + e
Pour les entreprises prives, la fonction de production scrit (DUM = 1) :
Log Q = 6,52 + 0,266 Log L + 0,711 Log K 1,07DU M
+ 0,11DU M Log L + e
Log Q = 5,44 + 0,384 Log L + 0,711 Log K + e
Nous remarquons que le facteur travail contribue plus la production pour les entreprises du secteur priv que pour les entreprises du secteur public.
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 100
3) Nous pouvons procder au test de Chow en segmentant notre chantillon entre les
entreprises du secteur priv et les entreprises du secteur public.
(SC R (SC R Priv + SC R Publique ))/(k + 1)
(SC R Priv + SC R Publique )/(n 2(k + 1))
qui suit alors une loi de Fisher (k + 1) et n 2 (k + 1) degrs de libert.
Soit calculer la statistique : F =
SCR = somme des carrs des rsidus calcule sur la totalit de lchantillon
des 50 entreprises.
SCR Priv = somme des carrs des rsidus calcule sur les 21 entreprises prives.
SC R Publique = somme des carrs des rsidus calcule sur les 29 entreprises
publiques.
k = 2 et n = 50.
(1,853 (0,795 + 0,629))/3
0,05
2,84 . Nous rejetons
4,42 > F3;44
Soit F =
(0,795 + 0,629)/44
lhypothse H0, le modle est instable, il existe une diffrence significative entre les
fonctions de production des entreprises publiques et des entreprises prives.
4) Les rsultats destimation de la fonction Tranlog sont les suivants :
Coefficient
Std. Error
t-Statistic
Prob.
5.404574
1.957160
2.761437
0.0084
LOG(K)
1.686188
1.201063
1.403913
0.1674
LOG(L)
0.612883
1.071805
0.571823
0.5704
0.031900
0.939072
0.033970
0.9731
0.5*LOG(K)^2
0.5*LOG(L)^2
LOG(L)*LOG(K)
0.289379
1.031212
0.280620
0.7803
0.156205
0.978803
0.159588
0.8739
Wald Test :
Equation : TRANSLOG
Test Statistic
F-statistic
Value
df
Probability
0.401096
(3.44)
0.7529
100 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 101
Exercice n 14
Fonction conomtrique dinvestissement
Une estimation conomtrique de la part des emprunts dans les investissements
dune importante entreprise ptrolire donne :
EMP
INVO
= 0,6645 TIR + 179,07
+ 36,31 + e
INV
INVI
(1,26)
(4,69)
R 2 = 0,65 ; n = 17 (nombre dannes de la priode destimation)
Les chiffres entre parenthses sous les coefficients sont les t de Student avec :
EMP = emprunts totaux
INV = investissements totaux
TIR = taux dintrt rel
INVO = investissements de la socit dans les forages offshore
INVI = investissements industriels
e = rsidu destimation
1) Commentez les rsultats obtenus, les coefficients des variables explicatives ont-ils le
signe attendu ?
2) Quel est leffet dun passage de 13 % 15 % de INVO/INVI sur la variable endogne ?
3) Le coefficient de la variable TIR nest pas significativement diffrent de zro. Quelle
explication conomique peut-on donner ce rsultat ?
4) On estime de nouveau ce modle en retirant la variable TIR, les rsultats sont les suivants :
INVO
EMP
= 162,15
+ 41,28 + e
INV
INVI
(7,20)
R 2 = 0,57
Pourquoi a-t-on retir la variable explicative TIR (donnez deux raisons possibles de
la non-significativit statistique de cette variable) ?
Le coefficient de dtermination a diminu, est ce fortuit ?
Les coefficients du modle sont lgrement diffrents de la premire estimation,
pourquoi ?
5) Lestimation conomtrique de lquation de la question 4 permet-elle de donner une
approximation du taux dautofinancement de cette entreprise ? Donner le cas chant
une valeur lorsque INVO/INVI = 13%.
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 102
Solution
1) Le taux demprunt dpend :
ngativement du taux dintrt, ce qui est conforme lintuition conomique ; mais
le coefficient de cette variable nest pas significativement diffrent de 0
0,05
= 2,14) ;
(t = 1,26 < t14
positivement de linvestissement dans les forages offshore, ce qui est logique car
linvestissement dans les forages offshore est trs important ; le coefficient est signi0,05
= 2,14).
ficativement diffrent de 0 (t = 4,69 > t14
2) Par application du modle estim, il vient :
EMP
= 179,07 (0,15 0,13) = 3,58
INV
3) La compagnie ptrolire doit pratiquer lautofinancement, donc il nexiste pas de sensibilit au taux dintrt.
4) La variable explicative TIR nest pas significative car elle nest peut tre pas assez
corrle avec la variable expliquer ou bien colinaire avec lautre variable explicative.
Le coefficient de dtermination a diminu car le fait de retirer une variable explicative mme non significative fait augmenter mcaniquement la Somme des Carrs des
Rsidus.
Les coefficients du modle sont lgrement diffrents car la colinarit entre les
variables explicatives entraine une modification de la valeur estime des coefficients.
5) Par application du modle estim il vient :
EMP
= 162,15 0,13 + 41,28 = 62,35
INV
Autofinancement 100 62,35 = 37,65 %
Annexe
A. Interprtation gomtrique de la mthode
des moindres carrs
Soit les vecteurs Y , X 1 , X 2 ,. . . , X k composs de n lments que nous pouvons donc
reprsenter dans R n.
Nous cherchons minimiser :
n
Min
t2 = Min = Min (Y Xa) (Y Xa) = Min S
t=1
102 CONOMTRIE
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Avec X = (X 1 , X 2 ,. . . , X k ) .
Page 103
a0
a1
Le vecteur Xa = (X 1 , X 2 ,. . . , X k ) a2 appartient au sous-espace vectoriel
.
..
ak
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 104
Tableur EXCEL
par la fonction DROITEREG
0.03713
0.052023
0.702687
7.878181
159.4095
0.38136
0.156581
2.597069
10
67.44767
0.801901
0.298436
#N/A
#N/A
#N/A
32.89132
11.66331
#N/A
#N/A
#N/A
a2
a 2
ddl
SC R
a1
a 1
#N/A
#N/A
#N/A
a0
a 0
#N/A
#N/A
#N/A
104 CONOMTRIE
0,838
0,702
0,613
2,597
14
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 105
ANALYSE DE VARIANCE
Rgression
Rsidus
Total
Constante
X1
X2
X3
Degr
de libert
3
10
13
Somme
des carrs
159,409
67,447
226,857
Moyenne
des carrs
53,1368
6,74476
Coefficients
32,891
0,80190
0,3813
0,0371
Erreur-type
11,663
0,298
0,156
0,05202
Statistique t
2,820
2,687
2,435
0,713
F
7,8786
Probabilit
0,0181
0,0228
0,0351
0,4916
1. La trace dune matrice est gale la somme des valeurs de la premire diagonale.
9782100721511-Bourbo-C03.qxd
20/10/14
15:13
Page 106
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 107
4. Multicolinarit
et slection
du modle optimal
I. Corrlation partielle
A. Exemple introductif
Un marchand de glaces, situ prs de la tour Eiffel, cherche calculer le coefficient de corrlation entre ses ventes (x1 ) et le nombre de touristes visitant ce
monument (x2 ) . Ces deux variables sont influences par le climat : la consom-
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 108
mation de glaces est plus importante lorsquil fait chaud et les touristes sont peu
enclins visiter un monument extrieur en cas de froid ou de pluie, on appelle
x3 cette variable climatique.
Nous pouvons penser que la corrlation entre x1 et x2 est positive, cependant
un calcul de coefficient de corrlation simple nest pas rvlateur du degr de liaison relle entre ces deux variables ; en effet, la variable climat influence la vente
des glaces et la frquentation des touristes. En dautres termes, le coefficient de
corrlation simple calcul ainsi intgre lapport de la variabilit des conditions
climatiques sans pouvoir isoler linfluence relative du nombre de touristes.
Cette notion de corrlation partielle est trs importante car elle permet de
juger de la pertinence dinclure une variable explicative dans un modle.
Plus le coefficient de corrlation partielle dune variable est lev, plus la
contribution de cette variable est importante lexplication globale du modle.
Le coefficient de corrlation partielle peut se calculer de deux manires
partir :
108 CONOMTRIE
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 109
2) Du t de Student
Dans un modle k variables explicatives, il existe une relation entre le coefficient de corrlation partielle et le t de Student1 :
2
r yxi.(autres
variables) =
ti2
ti2 + (n k 1)
[1]
Exercice n 1
fichier C4EX1
x1
x2
x3
1
2
3
4
5
6
7
8
9
10
49,0
40,0
41,0
46,0
52,0
59,0
53,0
61,0
55,0
64,0
35,0
35,0
38,0
40,0
40,0
42,0
44,0
46,0
50,0
50,0
53,0
53,0
50,0
64,0
70,0
68,0
59,0
73,0
59,0
71,0
200,0
212,0
211,0
212,0
203,0
194,0
194,0
188,0
196,0
190,0
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 110
Pour rpondre cette question, on demande de calculer les coefficients de corrlation partielle du premier ordre et du deuxime ordre et de commenter les rsultats obtenus.
Solution
2
2
Nous traitons compltement le calcul de r yx1.x2
et r yx3.x1
x2 , les rsultats des autres
coefficients sont fournis afin que le lecteur puisse vrifier ses propres calculs.
2
a) Calcul de r yx1.x2
par corrlation entre les rsidus
1
2
3
4
5
6
7
8
9
10
e1
4,02857
4,97143
1,62857
7,56190
6,24762
2,31429
3,34286
0,40952
5,34286
4,97143
e2
3,57143
3,57143
0,57142
2,76190
5,04762
2,28571
3,14286
0,19047
9,14286
4,57143
2
2
re1,e2 = 0,6798 r yx1.x2
= re1,e2
= 0,4621
La corrlation entre les ventes et la publicit est donc gale 0,46 , lorsque linfluence de la promotion auprs des distributeurs est retire.
2
b) Calcul de r yx3.x1
x2 par corrlation entre les rsidus
110 CONOMTRIE
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 111
1
2
3
4
5
6
7
8
9
10
e1
6,66000
2,34000
2,04960
5,52693
2,52853
3,99840
1,02720
0,54986
1,39360
1,60320
e2
9,4000
2,6000
3,5440
10,7040
3,5280
4,1760
5,0080
4,8480
2,7040
0,3520
2
2
re1,e2 = 0,921 r yx3.x1
x2 = re1,e2 = 0,848
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 112
5,792
ti2
=
= 0,848
5,792 + (10 4)
+ (n k 1)
ti2
d) Autres rsultats
2
= 0,461
r yx1.x2
2
r yx2.x3
= 0,698
2
r yx1.x2
x3 = 0,225
2
r yx1.x3
= 0,212
2
r yx3.x1
= 0,734
2
r yx2.x1
x3 = 0,703
2
r yx2.x1
= 0,480
2
r yx3.x2
= 0,895
2
r yx3.x1
x2 = 0,848
et2 =
2
(yt y)2 (1 r yx
1)
2
R y.x1
= coefficient de dtermination de la rgression de y sur x1 .
La somme des carrs des rsidus, aprs avoir retir linfluence de x1 et x2 , est
gale :
SC R =
et2 =
2
y.x1 x2
2
yx2.x1
Or r
est la proportion du rsidu explique par la variable x2 seule, cette
dernire expression peut donc scrire :
2
2
) = (1 r yx2.x1
)
(yt y)2 (1 R y.x1x2
Do
112 CONOMTRIE
2
)
(yt y)2 (1 r yx1
[2]
t
2
2
2
1 R y.x1
x2 = (1 r yx2.x1 )(1 r yx1 )
[3]
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 113
Il est noter que les indices peuvent permuter, ainsi, dans lordre, 3, 4, 1, 2 ;
la relation prcdente devient :
2
2
2
2
2
1 R y.x1
x2 x3 x4 = (1 r yx3 )(1 r yx4.x3 )(1 r yx1.x3 x4 )(1 r yx2.x1 x3 x4 )
Exercice n 2
Relation entre coefficients de corrlation simple, partielle et multiple
Un conomtre estime un modle trois variables explicatives :
y = 348,4 + 56,3 x1 9,5 x2 + 234,8 x3
(4,5)
(8,3)
(2,1)
(4,6)
R = 0,76
2
n = 65
(.) = t de Student
2
Le coefficient de corrlation linaire entre y et x1 est connu, r yx1
= 0,52 .
2
On demande de calculer le coefficient de corrlation partielle r yx2.x1
.
Solution
2
Le coefficient r yx3.x1
x2 est gal :
2
ta3
2
ta3
4,62
=
2
4,6 + (65 4)
+ (n k 1)
2
r yx3.x1
x2 = 0,257
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 114
III. Multicolinarit :
consquences et dtection
Le terme de multicolinarit est employ dans le cas dun modle incorporant
des sries explicatives qui sont lies entre elles.
loppos, pour des sries explicatives de covariance nulle (Cov (x1 , x2 ) = 0) ,
nous dirons quelles sont orthogonales. Si, pour des tudes thoriques, nous
pouvons supposer que deux sries statistiques sont orthogonales, dans la pratique, lorsque lconomiste modlise des phnomnes conomiques, les sries
explicatives sont toujours plus ou moins lies entre elles. Nous allons donc examiner les consquences de la multicolinarit.
A. Consquences de la multicolinarit
Nous pouvons citer trois effets principaux :
a) augmentation de la variance estime de certains coefficients lorsque la
colinarit entre les variables explicatives augmente (le t de Student diminue) ;
b) instabilit des estimations des coefficients des moindres carrs, des faibles
fluctuations concernant les donnes entranent des fortes variations des
valeurs estimes des coefficients ;
c) en cas de multicolinarit parfaite, la matrice X X est singulire (le dterminant est nul), lestimation des coefficients est alors impossible et leur
variance est infinie.
Exercice n 3
Consquences de la multicolinarit
Soit un modle deux variables explicatives dont les matrices X X et X Y sont
calcules partir dun chantillon dobservations de variables centres.
X X =
114 CONOMTRIE
200
150
150
113
X Y =
350
263
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 115
150
a1 + 113
a2 = 263
a2 = 1
b) Estimation des coefficients aprs suppression dune observation. Les quations
normales scrivent :
199
a1 + 149
a2 = 347,5
a1 = 0,5
149
a1 + 112
a2 = 261,5
a2 = 3
2) Calcul du coefficient de corrlation
x21 ,x2 =
[Cov (x1 , x2 )]2
= 0,995 x1 ,x2 = 0,995 = 0,997
Var (x1 ) Var (x2 )
3) Commentaires : une faible modification dune des observations ou du nombre dobservations entrane une profonde modification des valeurs estimes des coefficients,
cela est la consquence directe de la trs forte colinarit entre x1 et x2 (0,997).
Afin dviter ce problme, il convient alors de dtecter une ventuelle multicolinarit lors de lestimation dun modle.
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 116
2
et les coefficients de corrlation simple r xi,
x j entre les variables explicatives
pour i
= j .
2
Si R y2 < r xi,
x j , il y a prsomption de multicolinarit.
Il ne sagit pas dun test statistique au sens test dhypothses mais simplement dun critre de prsomption de multicolinarit.
r x1 x2
1
...
r xk x2
r x1 x3
r x2 x3
...
r xk x3
. . . r x1 xk
. . . r x2 xk
... ...
...
1
Lorsque la valeur du dterminant D tend vers zro, le risque de multicolinarit est important.
Par exemple, pour un modle deux variables explicatives, si les deux sries
sont parfaitement corrles, le dterminant D scrit :
1
D =
r x2 x1
r x1 x2 1 1
=
=0
1 1 1
Dans le cas oppos o les sries explicatives sont orthogonales, le dterminant devient :
1
D =
r x2 x1
r x1 x2 1 0
=
=1
1 0 1
1
= n 1 (2 K + 5) . Ln D
6
2
116 CONOMTRIE
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 117
Exercice n 4
fichier C4EX4
Tests de multicolinarit
Un conomiste cherche expliquer la variable y laide de quatre sries explicatives
x1 , x2 , x3 et x4 . Il dsire auparavant tester une ventuelle multicolinarit entre ces
quatre sries ; pour ce faire, il dispose des donnes du tableau 2.
Tableau 2 Ces sries statistiques sont-elles colinaires ?
y
x1
x2
x3
x4
8,40
9,60
10,40
11,40
12,20
14,20
15,80
17,90
19,30
20,80
82,90
88,00
99,90
105,30
117,70
131,00
148,20
161,80
174,20
184,70
17,10
21,30
25,10
29,00
34,00
40,00
44,00
49,00
51,00
53,00
92,00
93,00
96,00
94,00
100,00
101,00
105,00
112,00
112,00
112,00
94,00
96,00
97,00
97,00
100,00
101,00
104,00
109,00
111,00
111,00
(3,66)
(0,30)
(2,20)
(2,27)
n = 10
R 2 = 0,998
(.) = t de Student
b) Calcul des coefficients de corrlation simple entre les variables explicatives :
2
r x1,
x2 = 0,976
2
r x2,
x3 = 0,938
2
r x1,
x3 = 0,960
2
r x2,
x4 = 0,938
2
r x1,
x4 = 0,974
2
r x3,
x4 = 0,982
la lecture de ces coefficients il ne semble pas ressortir des risques graves de multicolinarit puisque tous les coefficients de corrlation simple sont infrieurs au coefficient de dtermination. Toutefois, nous observons quils sont tous trs levs.
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 118
2) Test de Farrar-Glauber
Calcul du dterminant
1
r
D = x2 x1
r x3 x1
r x4 x1
r x1 x2
1
r x3 x2
r x4 x2
r x1 x3
r x2 x3
1
r x4 x3
r x1 x4
r x2 x4
=
r x3 x4
1
1
0,988
=
0,980
0,987
0,988
1
0,969
0,969
0,980
0,969
1
0,991
0,987
0,969
= 0,92198 105
0,991
1
118 CONOMTRIE
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 119
Face ces artifices de calcul, la seule parade vraiment efficace consiste, lors
de la spcification de modle, liminer les sries explicatives susceptibles de
reprsenter les mmes phnomnes et donc dtre corrles entre elles, ceci afin
dviter leffet de masque.
Au paragraphe suivant, nous prsentons des mthodes permettant de dterminer le mix optimal de variables explicatives.
AI C = Ln
SC R
n
2k
n
SC R
n
k Ln (n)
n
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 120
Avec :
Ln = Logarithme nprien,
SCR = somme des carrs des rsidus du modle,
n = nombre dobservations,
k = nombre de variables explicatives.
Nous allons examiner cinq mthodes qui vont nous permettre de retenir le
meilleur modle, celui qui est compos des variables qui sont :
les plus corrles avec la variable expliquer ;
les moins corrles entre elles.
Toutes les rgressions possibles
Il sagit de la mthode la plus simple dans son expos : nous estimons toutes
les combinaisons de rgressions possibles (2k 1 possibilits, k = nombre de
variables explicatives candidates) et le modle retenu est celui dont le critre de
Akaike ou de Schwarz est minimum pour un modle comportant des variables
explicatives toutes significatives. La limite dutilisation de cette mthode est lie
au nombre initial de variables explicatives candidates, par exemple si k = 10 , le
nombre de combinaisons possibles est de 1023 .
Llimination progressive ( Backward Elimination )
Cette procdure consiste, sur le modle complet k variables explicatives,
liminer de proche en proche (cest--dire en restimant lquation aprs chaque
limination) les variables explicatives dont les t de Student sont en dessous du
seuil critique. Cette procdure nest utilisable que si la premire quation peut
tre effectivement estime, ce qui nest pas toujours le cas. En effet, lorsque le
modle comporte un nombre important de variables explicatives, le risque de
colinarit entre ces variables est lev et la matrice X X peut tre singulire.
La slection progressive ( Forward Regression )
Dans cette procdure, on slectionne, dans une premire tape, la variable
explicative dont le coefficient de corrlation simple est le plus lev avec la
variable y , soit xi cette variable. La deuxime tape consiste alors calculer les
2
coefficients de corrlation partielle r yx
pour j
= i et retenir la variable explij xi
cative ayant le coefficient le plus lev. La slection sarrte lorsque les t de
Student des variables explicatives sont infrieurs au seuil critique.
La rgression pas pas ( Stepwise Regression )
Cette procdure est identique la prcdente, sauf quaprs avoir incorpor
une nouvelle variable explicative, nous examinons les t de Student de chacune
des variables explicatives pralablement slectionnes et nous liminons du
modle celle(s) dont le t du Student est infrieur au seuil critique.
120 CONOMTRIE
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 121
Les coefficients de corrlation simple entre le rsidu e1 et les variables explicatives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev. Soit x j cette variable explicative.
3e tape
Nous calculons un nouveau rsidu :
e2 = y
a0
a1 x i
a2 x j
Les coefficients de corrlation simple entre le rsidu e2 et les variables explicatives sont calculs, nous retenons la variable explicative dont le coefficient est
le plus lev, ce qui permet de dgager un nouveau rsidu.
La procdure est arrte lorsque les coefficients de corrlation ne sont plus
significativement diffrents de 0 .
Exercice n 5
fichier C4EX4
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 122
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
M13
M14
M15
Sries
X1
Coefs.
0,118
t de Student 41,9
Sries
X2
Coefs.
0,327
t de Student 15,3
Sries
X3
Coefs.
0,516
t de Student 12,5
Sries
X4
Coefs.
0,663
t de Student 18,6
Sries
X1
Coefs.
0,132
t de Student 6,91
Sries
X1
Coefs.
0,126
t de Student 8,42
Sries
X1
Coefs.
0,102
t de Student 5,60
Sries
X2
Coefs.
0,209
t de Student 2,55
Sries
X2
Coefs.
0,137
t de Student 2,42
Sries
X3
Coefs.
0,166
t de Student 0,73
Sries
X1
Coefs.
0,139
t de Student 5,58
Sries
X1
Coefs.
0,115
t de Student 3,55
Sries
X1
Coefs.
0,104
t de Student 7,46
Sries
X2
Coefs.
0,164
t de Student 3,32
Sries
X1
Coefs.
0,097
t de Student 3,66
R2
AIC 1
SC
0,995 2,185 2,125
0,952 0,185
0,245
1. Nous utilisons les formules de la section IV afin de calculer les critres dinformation de Akaike
et de Schwarz, le logiciel Eviews utilise des formules lgrement diffrentes.
122 CONOMTRIE
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 123
1. Nous constatons quil sagit aussi de lquation dont le R 2 est le plus lev.
2. Et pourtant nous navons que quatre variables explicatives candidates.
9782100721511-Bourbo-C04.qxd
20/10/14
15:16
Page 124
1
2
3
4
5
6
7
8
9
10
e1
0,123762
0,475231
0,127120
0,236519
0,424754
0,007913
0,419014
0,078300
0,017027
0,279659
124 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 125
5. Problmes particuliers :
la violation
des hypothses
e chapitre est consacr aux problmes particuliers lis au nonrespect des hypothses. Nous nous attachons particulirement
deux formes classiques :
en I., lautocorrlation des erreurs ;
en II., lhtroscdasticit.
Ltude de ces deux phnomnes nous permet de dfinir un nouvel estimateur : lestimateur des moindres carrs gnraliss, utilis lorsque la
matrice des variances et covariances de lerreur ne rpond plus aux hypothses classiques, telles que nous les avons supposes ralises jusqu
maintenant.
Pour chacun de ces deux cas, nous prsentons les mthodes dinvestigation : tests de dtection, consquences et procdures destimation.
Enfin, la section III. est consacre au cas o les variables sont observes
avec erreur.
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 126
E(1 1 )
E(2 1 )
= E( ) =
...
E(n 1 )
E(1 2 )
E(2 2 )
...
...
E(n 2 ) . . .
E(1 n )
E(2 n )
=
E(n n )
2 0
0 2
=
...
0
0
0 ...
0 ...
0
0
0 . . . 2
Cest--dire que
a est un estimateur dont la premire diagonale de la matrice des variances et covariances est suprieure celle de 2 (X X)1 .
Nous sommes donc amens nous poser trois questions :
Comment dterminer un nouvel estimateur pour a ?
Comment dtecter une ventuelle autocorrlation des erreurs ?
Quelles mthodes destimation doit-on utiliser ?
(n, 1)
(n, k + 1) (k + 1,1)
(n,1)
126 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 127
1
a = (X 1
(X 1
X)
Y)
a = (X
X)
[1]
[2]
1
1
= X
I
X
X
I
Y = (X X)1 (X Y )
2
2
Dans la pratique, nous ne connaissons pas la matrice , les formules ci-dessus ne sont pas utilisables, sauf dans des cas exceptionnels. Il convient donc de
prsenter des procdures destimation oprationnelles.
1) Dfinition et causes
Nous sommes en prsence dune autocorrlation des erreurs lorsque les erreurs
sont lies par un processus de reproduction1. Nous pouvons distinguer lautocorrlation positive (graphique 1) qui est caractrise par des successions de
rsidus de mme signe, de lautocorrlation ngative (graphique 2) qui est caractrise par une alternance positive et ngative des rsidus.
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 128
2) Dtection
La dtection dune ventuelle dpendance des erreurs ne peut seffectuer qu
partir de lanalyse des rsidus, en effet eux seuls sont connus.
a) Examen visuel des rsidus
Lanalyse graphique des rsidus permet le plus souvent de dtecter un processus
de reproduction des erreurs lorsque :
1. Ce terme de blanchir vient de la notion de bruit blanc ( White Noise ), qui qualifie des
processus purement alatoires.
128 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 129
les rsidus sont pendant plusieurs priodes conscutives soit positifs, soit
ngatifs : autocorrlation positive (graphique 1) ;
les rsidus sont alterns : autocorrlation ngative (graphique 2).
Cependant, le plus souvent, lanalyse graphique est dlicate dinterprtation
car le dessin des rsidus ne prsente pas des caractristiques toujours videntes.
b) Test de Durbin et Watson
Le test de Durbin et Watson (DW ) permet de dtecter une autocorrlation des
erreurs dordre 1 selon la forme :
t = t1 + vt avec vt N (0, v2 )
DW =
t=2
(et et1 )2
n
[3]
2
t
t=1
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 130
Conditions dutilisation :
le modle doit comporter imprativement un terme constant2 ;
la variable expliquer ne doit pas figurer parmi les variables explicatives (en
tant que variable retarde), il faut alors recourir la statistique h de Durbin
(cf. chapitre 7, I. B.) ou au test de Breusch-Godfrey (cf. ci-dessous) ;
pour les modles en coupe instantane, les observations doivent tre ordonnes en fonction des valeurs croissantes ou dcroissantes de la variable
expliquer ou dune variable explicative souponne tre la cause de lautocorrlation ;
le nombre dobservations doit tre suprieur ou gal 15.
Le test de Durbin et Watson est un test prsomptif dindpendance des
erreurs du fait quil utilise les rsidus ; de plus, il ne teste quune autocorrlation dordre 13.
c) Test de Breusch-Godfrey4
Ce test, fond sur un test de Fisher de nullit de coefficients ou de Multiplicateur
de Lagrange ( LM test , cf. chapitre 3), permet de tester une autocorrlation
1. Dans la pratique, on accepte lhypothse la plus dsastreuse ! Cependant il serait licite daccepter lhypothse dindpendance.
2. Les tables de DW sont gnralement tabules pour des modles comportant un terme constant,
cependant il existe des tables pour des modles sans terme constant.
3. Cela signifie que le test de Durbin et Watson ne dtecte pas une autocorrlation dordre suprieur
1 , par exemple entre t et t + 4 pour une srie trimestrielle qui ne serait pas dsaisonnalise.
4. Breusch (1978) et Godfrey (1978).
130 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 131
Exercice n 1
fichier C5EX1
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 132
x1
x2
x3
1
2
19
20
87,40
97,60
110,70
127,10
98,60
101,20
105,30
107,60
99,10
99,10
93,00
106,60
108,5
110,1
108,5
111,3
Nous nous proposons de dceler une ventuelle autocorrlation dordre 1 des erreurs,
pour cela on demande :
1) destimer les coefficients du modle ;
2) deffectuer lanalyse graphique des rsidus ;
3) de calculer la statistique de Durbin et Watson et deffectuer le test ;
4) enfin, deffectuer le test de Breusch-Godfrey.
Solution
1) Les rsultats de lestimation partir de Eviews sont les suivants :
Dependent Variable : Y
Included observations : 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
X1
X2
X3
242.7951
3.897408
0.404365
0.878886
26.79995
0.400325
0.061351
0.240216
9.059538
9.735616
6.590977
3.658727
0.0000
0.0000
0.0000
0.0021
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.938895
0.927438
3.186826
162.4937
49.32784
1.053794
97.53500
11.83048
5.332784
5.531931
81.94784
0.000000
132 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 133
Lanalyse de ce graphique rvle des rsidus qui semblent cycliques, ceci est symptomatique dune autocorrlation positive des rsidus.
3) Les conditions dutilisation du test de Durbin et Watson sont bien respectes : le
modle est spcifi en srie temporelle, le nombre dobservations (n = 20 ) est
suprieur 15 et, enfin, le modle estim comporte un terme constant.
Le calcul de la statistique partir des rsidus est alors :
n
(et et1 )2
DW =
t=2
=
et2
171,23
= 1,053
162,49
t=1
Cette valeur est comparer celles lues dans la table de Durbin et Watson n = 20
et k = 3 , soit d1 = 1,00 et d2 = 1,68 . La valeur DW se situe dans la zone de doute
(d1 < DW < d2 incertitude), cependant proximit immdiate de la zone de rejet de
H0, nous pouvons plutt conclure une autocorrlation positive des rsidus, donc une
prsomption de dpendance des erreurs.
4) Les donnes tant annuelles, nous testons une autocorrlation dordre 2, un ordre
suprieur deux ans ne semble pas justifi. Nous estimons donc le modle :
et = a1 x1t + a2 x2t + a3 x3t + a0 + 1 et1 + 2 et2 + vt
Soit : et = 17,26 + 0,5287x1t 0,0369x2t 0,3149x3t + 0,589 et1 0,497et2
avec : R 2 = 0,33 et n = 18 (car nous avons perdu deux observations du fait du dcalage).
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 134
2
L M = n R 2 = 18 0,33 = 5,94 < 0,05
(2) = 5,99 , nous sommes la limite dacceptation de lhypothse H0 pour un seuil de 5 %.
1) Principes gnraux
Si nous retenons lhypothse dune autocorrlation des erreurs dordre 1, le
modle linaire scrit :
Y = Xa +
avec
t = t1 + vt
|| < 1
[4]
[5]
1. On note les processus autorgressifs par : AR( p) , o p est lordre du processus autorgressif.
Le chapitre 9 est consacr ltude gnrale de ce type de processus.
134 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 135
2 (1 2 ) = v2 2 =
Soit :
v2
(1 2 )
[6]
i v2
(1 2 )
2
v 2
= E( ) =
1 2 . . .
n1
n2
n3
. . . n1
. . . n2
. . . n3 avec = 1
...
1
1
0
= 2
v . . .
0
0
1 + 2
...
...
1 + 2
0
0
...
...
...
...
...
...
. . . 1 + 2
0
0
0
[7]
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 136
La matrice
M
=
0
(n 1, n)
...
0
0
1
0
0
1
...
...
...
0
0
0
M M =
...
0
0
1 + 2
1 + 2
...
...
0
0
...
...
...
. . . 1 + 2
0
0
0
et v2 1
sont identiques au premier terme prs 2 au lieu de 1 .
Ainsi, nous pouvons substituer la mthode des MCG, la mthode des MCO
(si n est suffisamment grand) applique au modle linaire MY = M Xa + M
qui nest autre que le modle initial dans lequel les variables sont transformes
par un passage aux quasi-diffrences premires1. En effet :
y2 y1
xk2 xk1
y y2
xk3 xk2
MY = 3
et M X k =
...
...
yn yn1
xkn xkn1
[9]
1. Cette transformation
perte dune observation, toutefois on peut remplacer la premire
entrane la
observation par 1 2 y1 et 1 2 xk1 .
136 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 137
Si nous connaissons la technique destimation permettant de lever lautocorrlation dordre 1, nous pouvons lappliquer de manire oprationnelle, il convient
destimer le paramtre . Cest lobjet des procdures destimations suivantes.
2) Procdures destimation de
Les procdures suivantes ne sont valides que si : t = t1 + vt .
a) Estimation directe de partir des rsidus de la rgression
sur le modle initial
tape 1 : estimation de de deux manires.
par rgression directe de et sur et1
n
=
et et1
(e = 0)
et2
t=2
[10]
1
(et et1 )2 =
t=2
n
t=2
et2 +
n
t=2
2
et1
2
[11]
et et1
t=2
si n est grand,
t=1
e +e
tend vers 0.
n
2
et
2
1
2
n
t=1
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 138
0 =
1 = (1) 2
(et )
t
138 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 139
et nous
la valeur de qui minimise la somme des carrs des rsi retenons
dus
vit2 .
Il est possible daffiner la valeur estime de en remployant la mme procdure sur un intervalle restreint et avec un pas plus fin (par exemple 0,01 ).
Il est noter que cette technique est optimale selon le critre des moindres
carrs puisque lon retient le qui minimise la somme des carrs des rsidus.
Exercice n 2
fichier C5EX1
C5EX2.PRG
Coefficient
Std. Error
t-Statistic
Prob.
0.065400
0.643073
0.101700
0.9202
e( 1)
0.464845
0.241301
1.926413
0.0709
1 = 0,46
tape 2 : transformations des variables et rgression sur les quasi-diffrences
Calcul des quasi-diffrences :
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
genr dy =
genr dx1 =
genr dx2 =
genr dx3 =
Page 140
y rau1 y(1)
x1 rau1 x1(1)
x2 rau1 x2(1)
x3 rau1 x3(1)
Rgression
Dependent Variable : DY
Included observations : 19 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
135.5132
18.38346
7.371473
0.0000
DX1
3.593675
0.583072
6.163342
0.0000
DX2
0.439019
0.071365
6.151765
0.0000
DX3
0.514596
0.337097
1.526550
0.1477
2 = 1
=1
= 0,473
2
2
tape 2 : transformations des variables et rgression sur les quasi-diffrences.
Le calcul est identique au prcdent avec la nouvelle valeur de .
Dependent Variable : DY
Included observations : 19 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
133.4095
18.14245
7.353445
0.0000
DX1
3.580221
0.583673
6.133954
0.0000
DX2
0.440490
0.071400
6.169361
0.0000
DX3
0.503033
0.336991
1.492721
0.1562
140 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 141
Coefficient
Std. Error
t-Statistic
Prob.
250.3442
38.62520
6.481369
0.0000
X1
3.142385
0.573681
5.477582
0.0001
X2
0.497558
0.069854
7.122783
0.0000
X3
0.144028
0.306106
0.470517
0.6452
0.811373
0.336991
5.048921
0.0002
AR(1)
Durbin-Watson stat = 2.149
3 = 0,81
Il est noter que le logiciel calcule directement la valeur de (assortie de son cart
type) ainsi que lestimation du terme constant du modle initial.
c) Mthode du balayage ( Hildreth-Lu )
Les rsultats sont identiques ceux de la mthode de Cochrane-Orcutt.
Tableau 2 Rcapitulation des rsultats
MTHODES
Paramtres
a
Rgression
a
DW
b
C.O.
c
H.L.
(t)
0,464
(1,92)
0,473
0,81
(5.04)
0,81
(5.04)
a0
(t)
253,22
253,20
250,3
(6,49)
250,3
(6,49)
a1
(t)
3,59
(6,16)
3,58
(6,13)
3,14
(5,48)
3,14
(5,48)
a2
(t)
0,44
(6,15)
0,44
(6,16)
0,49
(7,12)
0,49
(7,12)
a3
(t)
0,51
(1,52)
0,50
(1,49)
0,14
(0,47)
0,14
(0,47)
R2
0,91
0,91
0,96
0,96
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 142
les deux mthodes destimation directe des rsidus aboutissent des rsultats quasiment identiques, il subsiste nanmoins une autocorrlation des erreurs ;
les deux mthodes itratives (C.O. et H.L.) donnent des rsultats identiques, mais
assez diffrents des deux mthodes prcdentes.
Laquelle choisir ? Cette question est sans rponse dfinitive, la plus rpandue est certainement la mthode de Cochrane-Orcutt. Les deux procdures destimation directe sont
plus un artifice de calcul quune mthode proprement dite ; la technique du balayage
aboutit des rsultats similaires celle de Cochrane-Orcutt.
Nous sommes dans le domaine de lestimation statistique donc avec des marges derreurs qui peuvent parfois dpasser le raffinement de telle ou telle mthode, cest pourquoi nous pouvons recommander dutiliser la technique la plus simple mettre en uvre
donc celle directement utilise par le logiciel habituel.
Il convient de plus de noter que ces mthodes particulires destimation constituent
une rponse technique un problme le plus souvent de spcifications conomiques.
Nous recommandons, donc, plutt que dappliquer immdiatement ces procdures, de
rflchir une spcification plus adapte du modle.
II. Lhtroscdasticit
A. Prsentation du problme
Soit le modle Y = Xa + pour lequel lhypothse H4 nest pas vrifie, la
matrice des erreurs est alors :
E(1 1 )
E(2 1 )
= E( ) =
...
E(n 1 )
E(1 2 )
E(2 2 )
...
...
E(n 2 ) . . .
E(1 n )
E(2 n )
=
E(n n )
12
0
=
...
0
0
22
0
0 ...
0 ...
0
0
0 . . . n2
Les variances des erreurs ne sont plus constantes sur la premire diagonale.
Ce problme se rencontre plus frquemment pour les modles spcifis en
142 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 143
Les consquences de lhtroscdasticit sont identiques celles de lautocorrlation des erreurs, cest--dire :
estimateur sans biais ;
lestimateur de MCO nest plus variance minimale.
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 144
B. Correction de lhtroscdasticit
Lestimateur BLUE du modle htroscdastique est alors celui des MCG :
1
a = (X 1
(X 1
X)
Y)
1
a = (X 1
X)
avec
Exercice n 3
fichier C5EX3
144 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 145
Nombre
de poulets
ni
Poids moyen
des poulets
Yi
Dose moyenne
administre
Xi
1
2
3
4
5
12
8
6
9
5
1,7
1,9
1,2
2,3
1,8
5,8
6,4
4,8
6,9
6,2
n
1
n2
1
2
2
Var(i ) = = V =
n3
n
4
1
n5
=
Puisque le modle est htroscdastique, nous allons utiliser lestimateur des MCG :
V 1
1
1
a = (X X)1 (X Y ) = (X V 1 X)1 (X V 1 Y )
n1
n2
ni
ni X i
1
=
n3
2
do (X V X) = n X
ni X i
i
i
n4
n5
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 146
ni Y i
(X V 1 Y ) =
ni X i Y i
et
Le tableau de calcul 4 permet dobtenir les rsultats dont nous avons besoin.
Tableau 4 Exemple de calcul en cas dhtroscdasticit
Yi
Xi
ni
ni Y i
ni X i
1,7
1,9
1,2
2,3
1,8
5,8
6,4
4,8
6,9
6,2
12
8
6
9
5
20,4
15,2
7,2
20,7
9,0
40
72,5
Total
ni X i
ni Y i
ni X i Y i
69,6
51,2
28,8
62,1
31,0
403,68
327,68
138,24
428,49
192,20
34,68
28,88
8,64
47,61
16,20
118,32
97,28
34,56
142,83
55,8
242,7
1 490,29
136,01
448,79
et
(X V 1 X)1 =
(X V 1
1
40
242,7
2,1040
0,3426
=
242,7 1 490,29
0,3426
0,05647
72,5
1,23
Y) =
soit
a=
448,79
0,502
n1
n2
M =
n
3
n4
n5
Lestimateur des MCG est alors gal :
a = [(M X) (M X)]1 [(M X) (MY )] = (X M M X)1 (X M MY )
Nous aurions donc trouv les mmes rsultats en employant la technique de la
rgression pondre, cest--dire par multiplication du vecteur des observations de la
variable expliquer (Y ) et du vecteur de la variable explicative (X) par la matrice M
(dont la forme gnrale est n i ). La mthode des MCO applique aux donnes transformes (y compris le terme constant) suivantes conduit donc des rsultats identiques :
Yi : 1,7 12
1,9 8
1,2 6
2,3 9
1,8 5
6,4 8
4,8 6
6,9 9
6,2 5
X i : 5,8 12
Ui : 1 12
1 8
1 6
1 9
1 5
2
Nous remarquons que : Var( n i i ) = , lhtroscdasticit est donc leve.
Estimation de la variance de lerreur
Un estimateur sans biais de 2 peut tre dduit de lapplication des MCO la relation prcdente :
a)
e e
(MY M X
a ) (MY M X
=
2 =
nk1
nk1
a)
(Y X
a ) M M(Y X
=
nk1
146 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
2 =
Nous connaissons :
15:19
Page 147
a)
(Y X
a ) V 1 (Y X
nk1
0,0161
12
0,0885
Y X a =
0,0238 ; V =
0,0575
8
6
9
0,0869
(Y X a)
V 1 (Y X a)
0,1369
=
= 0,0445
nk1
511
(n est le nombre dobservations servant estimer les paramtres, ici n = 5 ).
2 =
Exercice n 4
fichier C5EX4
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 148
5
11
13
13
15
21
Temps passs
en heures X i
6
13
14
16
17
23
8
15
15
23
22
28
8
17
21
26
34
38
4
3,5
2
1,5
1
0,5
i2 =
j=1
5
(Yi j Y i )2
ni 1
j=1
T2 =
m
(n i 1)
i2
i=1
m
i=1
(n i 1)
vi
i2
v
i=1
avec
vi = n i 1 et v =
m
i=1
148 CONOMTRIE
vi =
m
(n i 1)
i=1
9782100721511-Bourbo-C05.qxd
20/10/14
La quantit Q = v Ln
T2
15:19
Page 149
vi Ln
i2 suit une loi du 2 m 1 degrs de
i=1
libert (Ln = logarithme nprien). Cependant, lestimation peut tre amliore en divisant Q par une constante dchelle C :
m
1
1
1
Q
C =1+
ainsi Q =
2 (m 1)
3(m 1) i=1 vi
v
C
2
(m 1) , lhypothse H0 est rejete, le modle est htroscdastique.
Si Q > 0,95
1
2
3
4
5
6
Yi
4
6
9
6
11
7
5
11
13
13
15
21
6
13
14
16
17
23
8
15
15
23
22
28
8
17
21
26
34
38
Xi
i2
vi Ln (
i2 )
4
3,5
2
1,5
1
0,5
3,2
17,8
18,8
63,7
78,7
127,3
4,65
11,51
11,73
16,61
17,46
19,38
T2 = 51,58333
Q = 13,26 ; C = 1,097 ;
donc htroscdastique.
2
Q = 12,09 > 0,95
(m 1) = 11,07 , le modle est
2) Test de Goldfeld-Quandt1
Ce test nest valable que si lune des variables est la cause de lhtroscdasticit et
que le nombre dobservations est important. Il se compose de trois tapes.
tape 1 : ordonner les observations en fonction des valeurs croissantes ou dcroissantes de la variable expliquer ou bien de la variable explicative souponne tre la
source de lhtroscdasticit.
Cette opration est dj effectue puisque le nombre de dfauts constats est class
(tableau 7) en fonction du nombre dheures dcroissant de vrification.
Tableau 7 Classement des observations en fonction
du temps de vrification (extrait des donnes)
j
Yj
1
2
4
5
29
30
28
38
Xj
4
4
0,5
0,5
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 150
Y j = 16,93 2,13 X j + e j
Y j = 9,84 1,32 X j + e j
(2,31)
(9,23)
n = 11
n = 11
R = 0,08
e2j = 164,66
SC R1 =
R 2 = 0,002
e2j = 872,02
SC R2 =
(.) = t de Student
(.) = t de Student
ddl1 = n 2 = 9
ddl2 = n 2 = 9
0,05
= 3,18, lhypothse dhomoscdasticit H0 est rejete, le moF = 5,29 > F9,9
dle est donc htroscdastique.
3) Test de Gleisjer2
Le test de Gleisjer permet non seulement de dceler une ventuelle htroscdasticit, mais aussi didentifier la forme que revt cette htroscdasticit. Ce test est fond sur
la relation entre le rsidu de lestimation par les MCO effectue sur le modle de base et
la variable explicative suppose tre la cause de lhtroscdasticit.
tape 1 : rgression par les MCO de Y j en X j ( j = 1,30)
Y j = 24,09 4,12 X j + e j
(4,19)
n = 30
R 2 = 0,38
Le vecteur des rsidus e j est alors connu.
150 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 151
Forme gnrale
Estimation (J = 1,30)
|e j | = a0 + a1 X j + v j
|e j | = 8,09 1,46 X j + v j
n = 30 (2,55)
R 2 = 0,19
Htroscdasticit de type :
ej2 = k 2 X 2j (k tant une constante quelconque)
En effet, si nous avons une relation entre la valeur absolue du rsidu (ej) et la variable
Xj, cela signifie que nous avons de fait une relation entre le rsidu au carr et la variable
Xj au carr.
II
1/2
|e j | = a0 + a1 X j
+ vj
n = 30
ej2 = k 2 X j
III
=k
X 2
j
+ v j
(2,60)
R 2 = 0,19
|e j | = a0 + a1 X 1
j + vj
ej2
1/2
|e j | = 10,7 4,15 X j
|e j | = 2,79 + 2,86 X 1
j
j +v
n = 30
(2,30)
R 2 = 0,16
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 152
Nous sommes, dans les deux cas, amens rejeter lhypothse H0 pour un seuil de 5 %.
Le modle est donc htroscdastique.
5) Correction de lhtroscdasticit
Les quatre tests sont concordants : le modle est htroscdastique, il convient donc
den corriger les effets.
ej2 = k 2 X 2j ; lapplication de
Supposons, par exemple, que lon retienne la forme I :
la rgression pondre par le facteur 1/ X j conduit un modle homoscdastique :
a0
ej
Yj
=
+ a1 +
Xj
Xj
Xj
do E
ej
Xj
2
=
1 2
= k2
X 2j ej
ej2 = k 2 X j . Pour
Or, le test de Gleisjer a mis en vidence une relation (II) du type :
lever lhtroscdasticit, dans
ce
cas,
nous
employons
la
rgression
pondre sur les
donnes brutes divises par X j . En effet :
Xj
a0
ej
Yj
= + a1 +
Xj
Xj
Xj
Xj
ej 2
1 2
=
= k2
do E
X j ej
Xj
152 CONOMTRIE
Yj
Zj =
Xj
1
X1 j =
Xj
Xj
X2 j =
Xj
2,00
2,50
39,60
53,74
0,50
0,50
1,41
1,41
2,00
2,00
0,71
0,71
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 153
a1 =
a0 =
b1 = 24,96 et
b2 = 4,53. Le
Les coefficients du modle initial sont
modle estim1 est donc :
Y j = 24,96 4,53 X j + e j
(2,94)
n = 30
(.) = t de Student
Il existe bien une influence significative du temps de vrification sur le nombre de
dfauts constats, chaque heure de vrification permet de supprimer en moyenne
4,5 dfauts.
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 154
2
i eti
;
i=1
X = X + et Y = Y +
154 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 155
On a alors :
E( ) = E{(Y X a) } = E(Y ) a E(X ) = 0
E( ) = E{(Y X a) } = E(Y ) a E(X ) = 0
Nous avons donc indpendance entre les erreurs sur les variables et , et lerreur de spcification du modle .
La relation entre les variables observes X et Y est la suivante :
Y = Y = (X )a + Y = Xa + a + = Xa +
= a +
avec
et
Z = (z 1 , z 2 , . . . , z k )
Cov (Z X) = 0
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 156
a = (Z X)1 Z Y
soit
[12]
2 (Z X)1 (Z Z )(X Z )1
[13]
156 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 157
2) Rgression augmente
La procdure propose par Hausman est en quatre tapes :
Estimation dun modle par les MCO avec pour variable expliquer la
variable dont nous dsirons tester lexognit et comme variables explicatives le ou les instruments, le plus souvent les variables explicatives dcales
dune priode.
Estimation de la ou des variables ajustes xit partir de la ou des rgressions
prcdentes.
Estimation du modle augment (modle initial dans lequel nous rajoutons la
ou les variables explicatives ajustes xit).
Test de significativit par rapport 0 du ou des coefficients de la ou des
variables explicatives ajustes. Si ce ou ces coefficients ne sont pas significativement de 0 (test de Student ou de Fisher), alors nous retenons lhypothse
H0 : Cov(xt ,t ) = 0 .
[14]
avec :
y = la variable expliquer
X = les variables explicatives
Z = les instruments
= la matrice des variances covariances des rsidus estims dans une premire
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 158
Exercice n 5
fichier C5EX5
yi
xi
zi
1
2
3
18
19
20
15,30
19,91
20,94
25,83
25,15
25,06
17,30
21,91
22,96
29,43
28,95
28,86
3,00
7,00
5,40
22,20
24,60
24,60
On demande :
1) de tester une ventuelle endognit de la variable xi laide du test dHausman ;
2) destimer la relation entre yi et xi par une mthode adapte.
Solution
1) Test de diffrence : Nous calculons la statistique dHausman :
H = ( aV I a MC O ) [Var( aV I ) Var( a MC O )]1 ( aV I a MC O )
Avec :
0,795
0,822
0,0004489 0,01106
aV I =
; a MC O =
; Var( aV I ) =
;
2,153
1,471
0,01106
0,27613
0,0003486 0,00859
0,0276
Var( a MC O ) =
; ( aV I a MC O =
;
0,00859 0,214867
0,6817
0,0001 0,0024
[Var( aV I ) Var( a MC O )] =
0,0024 0,0612
158 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 159
1568341,7 63248,1
0,0276
= 7,63 > 2 (2)
63248,1
2566,99
0,6817
pour un seuil de 5 % = 5,99. Nous rejetons lhypothse H0, lestimateur des MCO est
biais, il convient dutiliser lestimateur des VI.
H = [0,0276
0,6817]
Rgression augmente
Nous procdons au test dHausman en quatre tapes.
Estimation par les MCO de la rgression de xi sur linstrument z i :
Dependent Variable : X
Method : Least Squares
Included observations : 20
Variable
Coefficient
Std. Error
t-Statistic
Prob.
18.37253
0.622495
29.51436
0.0000
0.440680
0.039908
11.04238
0.0000
t-Statistic
Prob.
Coefficient
Std. Error
1,010328
0,022324
45,25680
0.0000
XF
0,215107
0,023915
8,994504
0.0000
2,153561
0,212721
10,12386
0,0000
(Z
(2,20)
X)1
(20,2)
Z
(2,20)
Y
(20,1)
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 160
492,78
7 369,53
(Z X)1 =
1,02
0,04
0,07
0,00
;
Z Y =
a=
soit
a0
a1
2,15
=
0,795
434,94
6472,88
Ces coefficients sont comparer ceux trouvs lors de lestimation du modle par
les MCO.
Nous pouvons calculer lestimation de la variance de lerreur :
ei2
1,29
i
2
=
=
= 0,071
n2
18
a est alors daprs [13] :
La matrice des variances et covariances de
a =
2 (Z X)1 (Z Z )(X Z )1
ZZ =
20,00
284,40
284,40
4 866,08
;
soit
a = 0,071
3,85
0,15
0,15
0,00
a1
= 0,0211
Le modle estim partir de la mthode des variables instrumentales est donc le suivant :
yi = 2,15 + 0,795 X i
(37)
n = 20
(.) = t de Student
Exercice n 6
fichier C5EX6
160 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 161
Le chef de produit estime un premier modle dont les rsultats sont prsents ci-dessous :
Log(P Mt ) = 2,91 + 1,03 Log(D Nt ) + et
(48,5) (6,83)
n = 41
R 2 = 0,54
DW = 1,29
(.) = t de Student
Log = Logarithme nprien
1) Que reprsente le coefficient a1 du modle ? Est-il significativement de 0 ?
2) Le graphique des rsidus est le suivant quen pensez-vous ?
543,63
6,38 114,92
(X X)1 = 6,38
0,54
1,32
114,92 1,32
24,29
Solution
1) Le cofficient a1 du modle reprsente une lasticit car le modle est sous la forme
Log-Log. Ce coefficient est significativement de 0 car la valeur empirique du t de Student
est largement suprieure au t lu dans la table (t 0,05 = 1,96) .
2) Le graphique laisse supposer une autocorrlation des erreurs. Puisque les conditions dapplication du test de Durbin et Watson sont vrifies, nous pouvons interprter
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 162
cette statistique : DW = 1,29 < 1,44 (valeur lue dans la table). Il existe une prsomption dautocorrlation des erreurs dordre 1.
3) Commentaires des rsultats
Commentaires statistiques :
la statistique de Fisher indique que le modle est globalement significatif,
les t de Student ont des probabilits critiques infrieures 0,05, les coefficients sont
donc tous significatifs,
la statistique de DW = 1,82 ne laisse plus prsager dune autocorrlation des
erreurs.
Nous constatons que le fait davoir ajouter au modle une variable explicative corrige lautocorrlation des erreurs. Le modle est valid sur le plan statistique.
Commentaires conomiques :
la variable DN agit positivement, plus lentreprise est prsente dans lunivers de
vente plus la part de march augmente (10 % daugmentation entrane 12,5 % daugmentation de part de march),
la variable IP agit ngativement, il sagit dun effet prix classique (10 % daugmentation entrane 47 % de baisse de part de march),
Les coefficients des variables ont bien le signe attendu.
4) On calcule le logarithme nprien : LN(DV ) = 0,51; LN(I P) = 4,605
La prvision en semaine 42 est donne par :
Log( P
M) = 25,22 + 1,285 0,51 4,716 4,605 = 2,84
Do P M = e2,84 = 17,18. La part de march prvue est de 17,18 %
Lcart type de lerreur de prvision est gal :
2 1 + X t+h
(X X)1 X t+h = (0,16132)2 (1 + 0,27) = 0,033.
e2t+h =
1
avec X t+h = 0,51
4,605
Exercice n 7
fichier C5EX7
162 CONOMTRIE
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 163
Les graphiques 7 montrent les variations des variables Y1, Y2, DY1, DY2 en fonction du temps.
Graphique 7 volution des variables Y1, Y2, DY1, DY2 en fonction du temps
En vous aidant des graphiques, de la statistique de Durbin-Watson et du coefficient
de dtermination, on demande de marier chacune des 4 rgressions proposes (Rsultats
du modle) avec le couple Variable dpendante/Variable explicative .
Variables
Rsultats du modle
Modle 1
Modle 2
Modle 3
Modle 4
Durbin et Watson
R2
Dpendante
Explicative
1,97
3,91
0,03
0,053
0,52
0,55
0
0,52
Y1
DY1
Y2
Y1
TENDANCE
TENDANCE
TENDANCE
DY2
Solution
On procde par dduction et limination.
Modle 3 : Y1/DY2 car coefficient de dtermination quasi nul et trs forte autocorrlation des erreurs.
Modle 2 : Y2/TENDANCE car coefficient de dtermination lev et trs forte
autocorrlation ngative des erreurs.
Modle 1 : DY1/TENDANCE car coefficient de dtermination lev et absence
dautocorrlation.
Modle 4 : Y1/TENDANCE car forte autocorrlation positive des erreurs et coefficient de dtermination lev.
9782100721511-Bourbo-C05.qxd
20/10/14
15:19
Page 164
300
500
50
900
200
400
40
800
100
300
30
700
200
20
600
-100
100
10
-200
500
5
10
15
20
Y1
25
30
35
40
60
50
40
40
20
30
0
-20
-40
15
DY1
15
20
25
20
Y2
60
10
10
DY2
80
0
5
30
TENDANCE
35
40
25
30
35
40
TENDANCE
1000
50
900
40
800
30
20
700
20
10
600
10
500
0
5
10
15
Y1
20
25
30
35
TENDANCE
164 CONOMTRIE
40
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 165
6. Les modles
non linaires
Exercice n 1
fichier C6EX1
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 166
3
6
L
23
14
10
71
Q
106,00
81,08
43,21
121,24
Solution
1) Les coefficients 1 et 2 reprsentent respectivement llasticit de la production au
facteur capital et llasticit de la production au facteur travail.
Dmonstration :
Nous avons une relation du type : Q = 0 K 1 L 2 .
Une transformation logarithmique conduit :
Log(Q) = Log(0 ) + 1 Log(K ) + 2 Log(L)
Or llasticit de y x se dfinit comme tant un rapport de variation relative :
e=
y/y
Log(y)
=
= rapport de drives logarithmiques.
x/x
Log(x)
Dans tout modle spcifi sous forme Log-Log, les coefficients sinterprtent directement en termes dlasticits.
=
=
Log(0 )
a0
+
+
1 Log(K )
1
LK
+
+
2 Log(L)
2
LL
+
+
166 CONOMTRIE
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 167
0,05
= 2,07), les coefficients
Les t de Student calculs sont tous suprieurs au t lu (t22
sont donc significativement diffrents de 0 au seuil de 5 %.
0,48
0,78
LL =
Log(L)
LQ =
Log(Q)
1,36
1,15
1,00
1,85
2,03
1,91
1,64
2,08
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 168
2 1
1 +
1+
2
Or la matrice des variances et covariances des coefficients est fournie par Eviews :
2
2
2
1
2
1 ,
2 )
1+
Soit
2
=
+
+ 2 cov (
2 1
1 +
0,64 + 0,25 1
0,020
=
= 2,14 t22
1+
0,05136
2
168 CONOMTRIE
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 169
ymax
1 + br t
2) Le modle de Gompertz
Ce modle est dfini par la formulation suivante :
yt = ebr
t +a
Ln(yt ) = br t + a
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 170
170 CONOMTRIE
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 171
Algorithme de Gauss-Newton
Soit le modle non linaire : yt = f (X, a) + t o X est la matrice des observations des variables explicatives (de dimension n , k + 1 ) et a est le vecteur (de
dimension k + 1 ) des paramtres estimer.
Sous les hypothses classiques concernant t , lestimateur des moindres carrs est la valeur de a qui minimise la somme des carrs des rsidus :
S(a) = e e = [yt f (X, a)] [yt f (X, a)]
Avec
f (X, a)
= Z (a) =
a0
..
.
f (xn , a)
a0
...
..
...
f (x1 , a)
ak
..
f (xn , a)
ak
f (xt , a)
f (xt , a) f (xt , a ) +
a0
a=a1
f (xt , a)
...
ak
(a a 1 )
a=a1
Soit
ou encore :
y = f (X, a 1 ) + Z (a 1 )(a a 1 ) +
y = f (X, a 1 ) + Z (a 1 )a Z (a 1 )a 1 +
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 172
B. Exemples dapplication
Exercice n 2
fichier C6EX2
Ventes
44,7
61,0
18
607,0
19
633,9
On demande :
1) Destimer les paramtres dun modle de diffusion de type Logistique.
2) Destimer les paramtres dun modle de diffusion de type Gompertz.
Solution
Le graphique 2 prsente lvolution des ventes cumules en fonction des semaines. Ce
graphique peut suggrer une volution selon un modle de diffusion, nous serions alors
proximit du point dinflexion.
172 CONOMTRIE
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 173
700
600
500
400
300
200
100
0
10
11
12
13
14
15
16
17
18
19
R-squared
Prob.
C(1)
718.0033
11.87762
60.45008
0.0000
C(2)
14.77212
0.536144
27.55254
0.0000
C(3)
0.784909
0.004580
171.3614
0.0000
0.999009
ymax
718
=
1 + br t
1 + 14,77 0,785t
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 174
Exercice n 3
fichier C6EX1
174 CONOMTRIE
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 175
NLS Q = C(1)*(C(3)*K^C(4))+(1C(3))*L^C(4))^C(2)
quation
Rsultats
9782100721511-Bourbo-C06.qxd
20/10/14
15:21
Page 176
9782100721511-Bourbo-C07.qxd
20/10/14
15:24
Page 177
7. Les modles
dcalages temporels
9782100721511-Bourbo-C07.qxd
20/10/14
15:24
Page 178
Dans ce modle, lhypothse H5, dindpendance entre les variables explicatives et lerreur, nest plus satisfaite car les variables yt1 , yt2 , . . . , yth qui
dpendent de t1 , t2 , . . . , th sont alatoires puisque yt+1 est fonction de yt
qui dpend de t , soit : E(yt+1 t ) = 0 .
Nous remarquons que si les variables exognes xit et les erreurs t sont
fixes, les variables endognes sont solutions de lquation de rcurrence :
yt = b1 yt1 + b2 yt2 + . . . + bh yth + St
avec St = Xa + t .
Il est dmontr que la solution gnrale de cette quation de rcurrence est
explosive si une des h racines de son quation caractristique1 a son module
suprieur 1 .
Or nous devons considrer les processus explosifs que ce soit dune faon
monotone ou oscillatoire comme des phnomnes rares en conomie (les
variables sont limites gnralement dans leur croissance), cest pourquoi il
convient dajouter lhypothse de stabilit du processus.
Cas particulier : le modle autorgressif dordre 1
Le modle gnral spcifi ci-dessus est rarement utilis, le plus souvent
nous nous limitons des processus autorgressifs dordre 12, de la forme :
yt = b1 yt1 + a0 + a1 x1t + a2 x2t + . . . + ak xkt + t
[1]
178 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:24
h=
Page 179
n
2
1 n
b1
[2]
avec
= 1 dw/2 (dw est la statistique de Durbin et Watson calcule sur la
modle [1]) ;
n = nombre dobservations ;
2
b1
= variance estime du coefficient b1 partir du modle [1].
Cette statistique h est distribue de manire asymptotique comme une
variable normale centre rduite. Ainsi, il y a quivalence entre les deux tests
dhypothses suivants :
H0 : = 0
H0 : h = 0
H1 : = 0
H1 : h = 0
avec
[3]
t = t1 + vt
9782100721511-Bourbo-C07.qxd
20/10/14
15:24
Page 180
Il sagit dun modle autocorrlation des erreurs, nous avons montr lors
du chapitre 5 que la transformation en quasi-diffrences premires peut lever
lautocorrlation des erreurs dordre 1.
Nous pouvons citer diffrentes mthodes destimation.
a) Rgression sur les diffrences premires
On procde deux rgressions par la mthode des MCO : la premire sur le
modle spcifi avec des variables non transformes et la seconde sur le modle spcifi avec des variables transformes en diffrences premires.
Si les deux rsultats destimation sont proches, nous pouvons conclure que
les paramtres du modle sont suffisamment bien dtermins sans rechercher la
liaison ventuelle des erreurs.
b) Correction de lautocorrlation des erreurs par rgression sur les quasidiffrences premires
Par une des mthodes prsentes au chapitre 5, nous procdons la correction
de lautocorrlation des erreurs : estimation directe de , Hildreth-Lu,
Cochrane-Orcutt.
c) Dautres mthodes
Nous pouvons aussi citer :
la mthode des variables instrumentales (cf. chapitre 5), o nous retenons
comme variable instrumentale la variable yt2 ;
la mthode du maximum de vraisemblance.
La mthode des variables instrumentales rsout le problme de convergence
des estimateurs lorsque nous sommes en prsence derreurs moyenne mobile
de type :
t = vt 1 vt1 2 vt2 . . . p vt p
Dans le cas derreurs autocorrles, nous devons utiliser une des mthodes
destimation robuste prsentes au chapitre 5.
180 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:24
Page 181
Exercice n 1
fichier C7EX1
PO
PE
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
455,0
500,0
555,0
611,0
672,0
748,5
846,0
954,5
1 090,0
1 243,5
1 390,0
1 559,0
1 781,0
2 046,5
2 311,0
2 551,0
615,0
665,0
725,0
795,0
870,0
970,0
1 095,0
1 235,0
1 415,0
1 615,0
1 795,0
2 015,0
2 315,0
2 660,0
2 990,0
3 280,0
On demande :
1) destimer la relation et de tester une ventuelle autocorrlation des erreurs ;
2) den corriger les effets, le cas chant.
9782100721511-Bourbo-C07.qxd
20/10/14
15:24
Page 182
Solution
1) Les rsultats de lestimation sont les suivants :
Dependent Variable : PO
Included observations : 15 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
PO(1)
PE
7.078673
0.224016
0.622340
1.851077
0.037090
0.025520
3.824084
6.039727
24.38636
0.0024
0.0001
0.0000
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.999980
0.999976
3.236240
125.6790
37.22668
0.625901
1257.267
663.5723
5.363558
5.505168
294296.0
0.000000
Lquation est estim sur 15 priodes (n 1) car dans le modle figure une variable
retarde dune priode.
La statistique de Durbin et Watson laisse augurer dune autocorrlation des erreurs,
ce qui est confirm par le h de Durbin [2] :
n
h=
= 0,687
2
1 n
a1
15
= 2,68 > t 0,05 = 1,96
1 15 0,0013
182 CONOMTRIE
Coefficient
Std. Error
t-Statistic
Prob.
2.891649
0.240680
0.598017
1.298314
0.024114
0.018553
2.227234
9.981022
32.23277
0.0478
0.0000
0.0000
0.999299
0.999172
2.197504
53.11925
29.19951
1.781510
146.5000
76.37030
4.599930
4.736871
7845.105
0.000000
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 183
Nous observons que les diffrences entre les coefficients de rgression sont assez
faibles pour a1 (0,224 et 0,240) comme pour a2 (0,622 et 0,598); nous pouvons considrer les rsultats obtenus la premire rgression comme valides.
Cependant, titre pdagogique, nous allons utiliser la mthode de correction dautocorrlation des erreurs.
Le modle estim, selon la mthode de Hildreth-Lu, est alors :
P Ot = 2,765 + 0,234 P Ot1 + 0,6135 P E t + et
(1,67)
(15,5)
(57,9)
et = 0,418 et1 + vt
R 2 = 0,99 ; n = 14 ; DW = 2,08 ; (.) = t de Student
Les prix officiels de la priode t sont donc plus influencs par les prix rellement pratiqus en t que par les prix officiels de lanne prcdente.
h
a j xt j + b0 + t
[6]
j=0
h
j=0
a j xt j + b0 + t =
h
a j D xt + b0 + t =
j
j=0
h
aj D
xt + b0 + t
j=0
yt = A(D)xt + b0 + t
[7]
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 184
D=
ja j
j=0
aj
a1 + 2 a2 + . . . + hah
A (1)
=
a0 + a1 + a2 + . . . + a h
A(1)
[8]
j=0
1) Test de Fisher
Le test le plus naturel est celui de Fisher dans lequel nous testons lhypothse de
la nullit des coefficients de rgression pour les retards suprieurs h .
La formulation des hypothses est la suivante, lorsque lon teste, dune manire
descendante, une valeur de h comprise entre 0 et M : 0 < h < M .
1. Il sagit de dterminer quelle est la priode maximum dinfluence de la srie explicative. Il peut
trs bien arriver, cest mme souvent le cas, que des coefficients de rang infrieur au dcalage
h ne soit pas significativement diffrents de 0.
184 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
H01 : h = M 1 a M = 0
H02 : h = M 2 a M1 = 0
..
.
i
H0 : h = M i a Mi+1 = 0
15:25
Page 185
H11 : h = M
H12 : h = M 1
a M = 0
a M1 = 0
..
.
i
H1 : h = M i + 1 a Mi+1 = 0
[9]
[10]
[11]
1. Le degr de libert du dnominateur est gal au nombre dobservations (n) moins le nombre de
paramtres estimer dans le modle [6]. Soit pour h = M i + 1 et en tenant compte du terme
constant et du coefficient de rgression pour la variable x 0 retard :
n (M i + 1) 1 1 = n M + i 3 .
2. Akaike H., 1973 ; 1974.
3. Schwarz G., 1978.
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 186
Exercice n 2
fichier C7EX2
yt
xt
1
2
43
44
2 072
2 077
2 840
2 837
1 660
1 926
3 449
3 764
Solution
Nous procdons aux estimations des modles sur 34 trimestres, puisque le dcalage
maximum test est de 10, on limine les 10 premires observations.
Nous calculons les trois critres : Akaike, Schwarz et Fisher laide dun programme Eviews en tlchargement (C7EX2).
Les rsultats sont consigns dans le tableau 3.
Tableau 3 Rsultats de la recherche du nombre de dcalages optimal
Dcalage
0
1
2
3
4
5
6
7
8
9
10
186 CONOMTRIE
Akaike
Schwarz
Fisher
11,96
11,50
11,04
10,55
10,25
9,99
9,84
9,88
9,96
10,03
10,10
11,96
11,54
11,12
10,68
10,42
10,21
10,10
10,19
10,31
10,43
10,55
16,82
18,91
19,18
10,89
8,59
6,86
1,09
0,13
0,77
0,25
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 187
Nous observons immdiatement que les minima des deux critres (AI C(h) et
SC(h) ) sont situs sur la ligne 6, correspondant donc 6 dcalages. La premire valeur
du Fisher empirique qui est significative en partant du retard 10 est celle de la ligne
5. Elle est gale 6,86, ce qui vient confirmer une influence de la variable explicative
allant jusqu un dcalage de 6 priodes.
Nous allons dtailler le calcul des critres1 de Akaike et Schwarz pour le retard 6. Le
rsultat de lestimation pour 6 retards est le suivant :
Variable expliquer : Y
n = 38
Variable
Coefficient
cart type
t de Student
Prob.
501,5414
154,8486
3,238915
0,0029
0,011389
0,081532
0,139687
0,8898
X( 1)
0,061265
0,124906
0,490487
0,6274
X( 2)
0,227569
0,119635
1,902194
0,0668
X( 3)
0,167932
0,112997
1,486158
0,1477
X( 4)
0,118734
0,127454
0,931580
0,3590
X( 5)
0,000169
0,136907
0,001235
0,9990
X( 6)
0,237174
0,084065
2,821310
0,0084
R2 = 0,92
0,921953
521116,1
26
521116
+
= 9,84
38
38
Et daprs [11] :
SC(6) = Ln
6 Ln (38)
521116
+
= 10,10
38
38
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 188
D=
j
aj
j=0
6
=
aj
j=0
Le dlai moyen de raction est 3,64 trimestres, soit presque une anne.
188 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 189
q
j i j
[12]
j=0
= 0
a0
1
= 0 + 1 + 2
a1 1
ou encore =
1
a2
= 0 + 21 + 42
a
1
3
= 0 + 31 + 92
0 0
0
1 1
1
2
2 2
2
2
3 3
H
a0
1
a1 1
a2 1
=
a3 1
. .
.. ..
ah
(h + 1, 1)
0
1
2
3
..
.
0
1
22
32
..
.
1 h
h2
..
.
..
.
(h + 1, q + 1)
0
0
1
1
q
2
2
q
3
.3
..
. ..
hq
[13]
q
(q + 1, 1)
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 190
190 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 191
Exercice n 3
fichier C7EX2
Coefficient
Std. Error
t-Statistic
Prob.
C
PDL01
PDL02
PDL03
PDL04
511.6833
0.193452
0.215794
0.055823
0.004228
143.4181
0.120131
0.103537
0.025884
0.001956
3.567774
1.610334
2.084228
2.156616
2.160957
0.0011
0.1169
0.0450
0.0384
0.0381
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.921681
0.912187
125.8826
522932.5
234.9825
0.583162
2567.553
424.8027
12.63066
12.84613
97.08789
0.000000
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 192
Les coefficients du polynme (i ) sont reprsents par les variables PDLi, ils sont
(presque) tous significativement diffrents de 0. La prsence dune contrainte entrane la
perte dun degr de polynme.
Le calcul des coefficients et la structure de pondration apparaissent directement
aprs, les coefficients (ai ) sont tous significativement diffrents de 0, sauf ceux des
variables xt et xt5 .
Le graphique 4 prsente les coefficients calculs lors de lexercice 2 et les coefficients ajusts laide du polynme estim.
a j xt j + b0 + t =
j=0
j=0
a j D xt + b0 + t =
j
aj D
xt + b0 + t [14]
j=0
192 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 193
Soit
yt = b0 + a0 xt + a0 xt1 + 2 a0 xt2 + . . . + i a0 xti + . . . + t
ou encore :
yt = b0 + a0 (xt + xt1 + 2 xt2 + . . . + i xti + . . .) + t
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 194
[15]
i=
i
(1 )r+1 Cr+i
i xti + t ou encore
i=0
yt = A(D)xt + b0 + t
[16]
194 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 195
avec :
pour r = 0 B(D) = (1 D)/a0 , soit le modle prcdent
pour r = 1 B(D) = (1 D)2 /a0
Soit :
yt = 2yt1 2 yt2 + a0 xt + (1 2 + 2 )b0 + vt
[17]
avec vt = (1 2D + 2 D 2 )t = t 2t1 + 2 t2
pour r = 2 B(D) = (1 D)3 /a0
Soit :
yt = 3yt1 32 yt2 + 3 yt3 + a0 xt + (1 3 + 32 3 )b0 + vt
[18]
avec vt = (1 3D + 32 D 2 3 D 3 )t = t 3t1 + 32 t2 3 t3
Afin de dterminer les valeurs du paramtre r , Maddala et Rao (1971) suggrent lutilisation dune procdure de balayage dont2 la fonction objectif maximiser est le coefficient de dtermination corrig (R )
Exercice n 4
fichier C7EX2
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 196
Il sagit donc destimer des modles autorgressifs dordre 1, 2, 3, etc. Afin de dterminer lordre, nous avons procd toutes les estimations de ces modles. partir dun
modle autorgressif dordre 3, les coefficients ne sont plus significativement diffrents
de 0. Le modle autorgressif dordre 1 ayant dj t estim, nous avons procd lestimation du modle dordre 2.
Daprs [17], nous obtenons en procdant par identification :
+
2 ) = 40,78/0,0784 = 520,15
b0 = 40,78/(1 2
Le modle estim est alors :
yt = 1,426 yt1 0,541 yt2 + 0,096 xt + 40,78 + et
ou encore : yt = 520,15 +
i=
i
(1 0,72)2 C1+i
0,72i xti + et
i=0
196 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 197
Non
Almon
contraint1
q=4
0,01138
0,06126
0,22756
0,16793
0,11893
0,00016
0,23717
0,0292
0,09733
0,19701
0,18851
0,0920
0,02912
0,22298
0,1795
0,1623
0,1472
0,1335
0,1211
0,1098
0,0996
0,0784
0,0169
0,2438
0,2926
0,3160
0,3185
0,3058
Somme
0,0814
0,7977
0,9530
1,7246
Dlai moyen
3,6421
3,6459
2,1026
3,6104
i
0
1
2
3
4
5
6
Koyck
Pascal
r=1
la lecture de ces rsultats, nous constatons la diversit des profils des coefficients
estims. En effet, nous avons tent, des fins pdagogiques, de faire correspondre les
coefficients des structures bien dtermines qui reprsentent des spcifications de
modles diffrentes les unes des autres. Dans la pratique, cette dmarche est absurde car
il convient de tester une seule forme de spcification :
soit celle que la rflexion conomique nous conduit retenir ;
soit celle dont le profil du modle non contraint semble la plus proche.
4) Calcul de llasticit de long terme des dpenses dinvestissement au profit.
En considrant le modle distribution gomtrique des retards o la variable exogne et la variable endogne sont sous forme logarithmique :
Log yt = b0 + a0 Log xt + a0 Log xt1 + 2 a0 Log xt2 + . . . + t
Le modle, sous forme rduite, sexprime par :
Log yt = Log yt1 + a0 Log xt + c0 + vt
Llasticit de long terme est gal 2 : e LT = a0 /(1 ) , llasticit de court terme
est donne par : eC T = a0 , et le paramtre dajustement est .
Lestimation du modle Dpenses dInvestissement/Profit sous forme logarithmique
conduit aux rsultats suivants :
1. Modle non contraint = estimation libre des coefficients.
2. Llasticit de long terme est la somme des lasticits (les coefficients) aux diffrents dcalages,
soit une somme dune progression gomtrique de premier terme a0 et de raison .
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 198
(8,48)
( 2,36)
n = 43
R 2 = 0,95
() = t de Student
a0 /(1
) = 0,184/(1 0,904) = 1,91.
Soit : e LT =
Llasticit de long terme est donc gale 1,91, nous sommes dans la zone des rendements croissants. Lorsque le profit augmente par exemple de 10 %, linvestissement
long terme augmente de 19,1 %.
[19]
198 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 199
de y Dt . En revanche, nous connaissons les valeurs de yt et nous pouvons spcifier une relation entre ytD et yt :
yt yt1 = (ytD yt1 ) avec 0 1
[20]
ou encore
[21]
[22]
[23]
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 200
[24]
i=0
i=
(1 )i xti + t
i=0
qui est un modle retards chelonnes1 dont une transformation de Koyck permet de mettre sous une forme autorgressive :
yt = a0 + a1 xt + (1 )yt1 + [t (1 )t1 ]
Exercice n 5
fichier C7EX2
1. Nous remarquons que la valeur de la variable expliquer y dpend dune pondration gomtriquement dcroissante de la variable explicative x . Cette structure de pondration est le fondement de la mthode de prvision appele lissage exponentiel .
200 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 201
Exercice n 6
Modlisation du prix dune matire premire
Nous nous intressons modliser lvolution du prix dune matire premire yt
selon un modle autorgressif dordre 1 et une variable exogne xt la demande partir dune quation de la forme : yt = a1 yt1 + a2 xt + t [E1] avec t rpondant aux
hypothses classiques. Les donnes ont t pralablement centres sur leur moyenne.
Lestimation de lquation [E1] sur 22 priodes donne :
yt = 0,757yt1 + 0,256xt + et
(0,025)
[E2]
(0,02)
[E3]
(0,044)
R2 = 0,981 ; DW = 1,64 ; n = 22
Est-il normal ou fortuit que le R2 soit plus lev dans lquation [E2] que dans
lquation [E3] ?
6) En tant la variable xt dans la rgression [E3] le coefficient de yt1 a t modifi,
pourquoi ?
7) Que signifierait un modle du type yt = ayt1 + t dans lequel a serait suprieur l ?
8) Lestimation selon une mme spcification mais pour une autre matire premire
donne :
yt = 0,695yt1 + 0,336xt + et
(0,053)
R2
[E4]
(0,046)
= 0,984 ; DW = 2,27 ; n = 22
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 202
n = nombre dobservations
2
a1
1 de la variable dcale
= variance estime du coefficient a
Cette statistique h est distribue de manire asymptotique comme une variable normale centre rduite. Ainsi, il y a quivalence entre les deux tests dhypothses suivants :
H0 : = 0
H0 : h = 0
H1 : 0
H1 : h 0
Si |h| < t
/2
(t 0,05 = 1,96 valeur issue de la loi normale pour un test bilatral au seuil de 5%).
22
= 0,40 < t 0,05 = 1,96 , nous acceptons lhypo|h| = 0,085
1 22 0,0252
thse dindpendance des erreurs.
4) la priode 1 : yt = 0,757yt1 + 0,256xt = 0,757 0 + 0,256 1 = 0,256
la priode 2 : yt = 0,757 0,256 = 0,194
la priode 3 : yt = 0,757 0,194 = 0,146
Il sagit dune progression gomtrique de premier terme U0 = 0,256 et de raison
q = 0,757 < 1.
La somme tend vers une limite finie et est gale : U0 / (1 q) = 0,256 / ( 1 0,757)
= 1,053.
Le prix augmentera de 1,053 unit long terme.
5) Il est normal que le R2 soit plus lev dans lquation [E2] que dans lquation [E3]
car une variable explicative a t retire du modle ce qui entraine une diminution de la
somme des carres des rsidus.
6) cause de la covariance existant entre les variable yt1 et xt .
7) Un modle du type yt = ayt1 + t dans lequel le coefficient a serait suprieur l
conduirait une solution explosive (croissance infinie) ce qui impossible.
8) Tests de comparaison de coefficient
H0 : a1,MP1 = a1,MP2
H1 : a1,MP1 a1,MP2
(a 1,M P1 a 1,M P2 ) 0
0,757 0,695
=
= 1,05 suit une Student
a 1,M P 1 a 1,M P 2
0,0252 + 0,0532
n 1 + n 2 6 = 38 degrs de libert, la covariance entre a1,MP1 et a1,MP2 est nulle car les
deux rgressions sont indpendantes (les deux chantillons sont diffrents),
0,05
= 1,96 donc non rejet de H0.
t = 1,05 < t
t =
202 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 203
Exercice n 7
Un modle dvaluation de la politique marketing
Nous intressons mesurer limpact de la publicit et des promotions sur les ventes
dun produit. Les impacts sont mesurs au moyen destimations en coupe instantane
menes sur des chantillons reprsentatifs de produit de grande consommation forte
pression marketing de deux secteurs : les produits cosmtiques et les dtergents.
Les chiffres entre parenthses sous les coefficients de rgression sont les carts types
des coefficients.
Partie A
Le premier modle test est le suivant :
Vit = a0 + a1 Pu it + a2 Prit + it
[E1]
i = 1, ..., 20
(8,23)
i = 1, ..., 20
(5,57)
i = 1, ..., 40
SCRT = 926
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 204
Tester lhomognit des comportements dans ces deux secteurs. Quen concluezvous ?
4) Dans le mme esprit nous disposons pour le secteur des cosmtiques dune estimation pour lanne suivante (t = 2), nous allons donc chercher tester la stabilit temporelle pour ce secteur.
Sachant que lestimation du modle en t = 2 indique SCR2 = 316 (i = 1, ... , 20) et
quune estimation pour t = 1 et t = 2 indique SCRT = 1054, quen concluez-vous ?
Partie B
Un des problmes de ce type de modlisation consiste en un biais d des variables
omises, en particulier des variables caractristiques du produit.
1) Supposons que ces variables soient additives et peuvent tre synthtises globalement
par une seule note Fi , cette variable est constante dans le temps car il sagit dune
caractristique permanente du produit. Cependant cette variable nest pas mesurable.
Le modle scrit donc maintenant :
Vit = a0t + a1t Pu it + a2t Prit + Fit + it
[E2]
V
+ ei
Vi = 582 + 25,19Pu i + 23,81Pri 0,97
M i(t1)
(9,3)
(5,7)
(0,37)
i = 1,...,20
R2 = 0,967
Dtergent :
V
Vi = 328 + 17,78Pu i + 18,74Pri 0,49
+ ei
M i(t1)
(5,7)
(8,2)
(0,21)
R2 = 0,967
204 CONOMTRIE
i = 1,...,20 .
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 205
Partie C
Un des biais envisageables dans lquation [E1] est que les ventes dun produit
soient fonction dun vnement imprvu. Dans cette situation, cela peut crer un biais
sur les ventes du produit qui diffre de ce quelles seraient dans des conditions normales.
Pour effectuer des prvisions correctes, on peut redresser ce biais en introduisant comme
variable supplmentaire dans [E1] les ventes de la priode prcdente :
Vit = a0 + a1 Pu it + a2 Prit + a3 Vit1 + it
[E3]
On a obtenu pour les secteurs des cosmtiques les rsultats pour lanne t = 1.
Vit = 1,52 + 2,52Pu it + 6,36Prit + 0,75Vit1 + eit
(1,1)
(1,7)
i = 1,...,20
[E4]
(0,3)
R2 = 0,979
1) Interprter dun point de vue statistique et conomique ces rsultats, est-il envisageable dans lquation [E3] de tester une ventuelle autocorrlation des erreurs ?
2) Pour ce modle cosmtique nous avons effectu la rgression suivante :
eit2 = 2,1Pu it + 0,18Prit + 5,8 + u it
(0,2)
i = 1,...,20
(0,5)
R 2 /k
0,868/2
=
k 1)
(1 0,868)/(20 2 1)
R 2 )/(n
(1
0,05
= 3,59 , nous rejetons lhypothse H0, il existe au moins une variables
= 55,89 > F2;17
Pu i ou/et Pri dexplicative de Vi
Tester H0 : a1 = 0 contre lhypothse H1 : a1 0
Le test dhypothses bilatral consiste donc comparer le ratio de Student empia 1
ta1
=
2,79
>
t
=
2,11
a1 est donc
,
nous
refusons
lhypothse
H0,
le
coefficient
17
significativement diffrent de 0.
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 206
ta2
=
|(a 1 a 2 ) 0|
suit une loi de Student 17 degrs de
a 1 a 2
libert.
Il convient de calculer : a 1 a 2
Var(a 1 a 2 ) = Var(a 1 ) + Var(a 2 ) 2 Cov(a 1 ,a 2 )
= 10,732 + 8,232 2 6,75 = 169,36
|29,94 21,31|
0,05
2,11 . Nous acceptons lhypothse
= 0,66 < t17
169,36
H0, la politique optimale est donc respecte.
Do : t =
A.4) Il sagit toujours du test de Chow mais men maintenant en donnes temporelles.
(1 054 (291 + 316))/3
0,05
2,92 . Nous rejetons lhy 8,34 > F3;34
Soit, F =
(291 + 316)/(34)
pothse H0, les comportements sont diffrents, sur les deux annes tudies, pour le secteur des cosmtiques.
B.1) Nous avons :
Vit = a0t + a1t Pu it + a2t Prit + Fit + it
Vit1 = a0t1 + a1t1 Pu it1 + a2t1 Prit1 + Fit1 + it1
Puisque les effets sont constants nous avons : Fit = Fit1
Nous pouvons alors crire :
Vit Vit1 = (a0t a0t1 ) + a1t Pu it a1t1 Pu it1 + a2t Prit a2t1 Prit1
+it it1
Lestimation de ce modle permet de lever le biais du aux caractristiques de
produit.
206 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 207
V
Vi(t1)
Vi(t1)
V(t1)
=
kt1 =
B.2) La variable
ta3
= 2,33, les deux ratios sont suprieurs t17
= 2,11. Lajout de la
=
0,21
V
variable
contribue significativement lexplication des ventes, il existe des
M i(t1)
effets individuels par produit. De plus, les coefficients des variables Publicit et
Promotion sont significativement diffrents de 0 et leurs valeurs se rapprochent, ce qui
correspond mieux lintuition thorique.
B.4) Le test dhypothse est : H0 : a3C = a3D
Sous lhypothse H0, t =
|(a 3C a 3D ) 0|
suit une loi de Student
a 3C a 3D
Do : t
0,181
les deux coefficients ne sont pas significativement diffrents entre eux.
C.1) Les coefficients du modle sont tous significativement diffrents de 0, les t de
0,05
= 2,11 nous refusons
Student empiriques des trois coefficients sont suprieurs t17
lhypothse H0 de nullit des coefficients. Nous ne pouvons pas interprter la statistique
de Durbin et Watson car le modle est estim en coupe instantane pour lanne t et nous
ne savons pas si les donnes ont t pralablement tries.
C.2) Lestimation de ce modle permet de tester une ventuelle htroscdasticit des
rsidus (test de White), le coefficient de la variable Pu it est significativement diffrent
de 0, il existe donc une htroscdasticit lie la variable Publicit.
Il convient donc de corriger le modle de lhtroscdasticit en procdant une
1
rgression pondre, dont le facteur de pondration est :
.
Pu it
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 208
Exercice n 8
fichier C7EX8
208 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 209
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 210
14
14
12
12
10
INFUSA
INFFRA
10
8
6
8
6
4
0
2
CHOFRA
CHOUSA
Coefficient
Std. Error
t-Statistic
Prob.
8.918367
CHOFRA(1)
0.442073
1.304888
6.834582
0.0000
0.173685
2.545262
0.0161
DW = 0,23
On remarque que la probabilit critique de la variable chofra(1) est infrieure
5 %, donc le taux de chmage retard est une variable significative et dont le coefficient
est ngatif, ce qui est conforme lintuition conomique.
Estimons maintenant la relation entre linflation et le taux de chmage contemporain.
Dependent Variable: INFFRA
Included observations: 34
Variable
Coefficient
Std. Error
t-Statistic
Prob.
8.273400
CHOFRA
0.345105
1.322230
6.257158
0.0000
0.171588
2.011250
0.0528
Dans ce cas, nous remarquons que le taux de chmage contemporain nest pas aussi
significatif. En effet, la probabilit critique est lgrement suprieure 5 % mais reste
quand mme acceptable.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints
Variable
Coefficient
Std. Error
5.718162
CHOUSA(1)
0.093347
DW = 0,42
210 CONOMTRIE
t-Statistic
Prob.
2.147358
2.662883
0.0122
0.343655
0.271629
0.7877
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 211
Coefficient
Std. Error
t-Statistic
Prob.
2.329524
2.082007
1.118884
0.2715
CHOUSA
0.449518
0.335099
1.341446
0.1892
On remarque que ni le taux de chmage retard, ni le taux de chmage contemporain ne sont significatifs car leurs probabilits critiques sont suprieures 5 %.
Nous pouvons donc conclure que le fait de prendre le chmage retard ou le chmage contemporain ne change pas significativement les rsultats. Nous prendrons donc
dans la suite le chmage retard afin de rester homogne par rapport la France.
3) La reprsentation graphique (graphique 8) des rsidus de la relation inflation-chmage retard pour la France et pour les tats-Unis laisse supposer une prsence dautocorrlation positive des rsidus car il semblerait que les rsidus soient lis par une dynamique cyclique. En ce qui concerne les points aberrants, il apparat des rsidus loigns
pour les priodes 10 et 18 pour la France alors que pour les tats-Unis, les rsidus sont
levs pour les priodes 10 et 17.
8
10
4
6
2
4
0
2
-2
-4
-6
-2
-8
-4
10
15
20
25
30
INFFRA Residuals
10
15
20
25
30
INFUSA Residuals
73.24807
Probability
0.000000
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 212
48.13823
Probability
0.000000
(1)
yt = 1 u t
(2)
p t = c yt + w
(3)
En remplaant dans lexpression (3) yt et w t par les relations (2) et (3), on trouve que :
p t = c( 1 u t ) + (u u t1 )
p t = 1 c(u t u t1 ) + (u u t1 ) car u t = (u t u t1 )
Do p t = c u t ( + 1 c)u t1 + u
Nous pouvons alors estimer cette quation.
Pour la France :
Dependent Variable: INFFRA
Included observations: 33 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
8.195813
1.341090
6.111305
0.0000
CHOFRA
1.978700
1.187570
1.666176
0.1061
CHOFRA(1)
2.412074
1.194353
2.019565
0.0524
Durbin-Watson stat
0.436616
On remarque que les deux variables ne sont pas significatives car leurs probabilits
critiques sont suprieures 5 %.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
4.123759
2.073971
1.988340
0.0560
CHOUSA
1.363228
0.533217
2.556610
0.0159
CHOUSA(1)
1.192817
0.533991
2.233777
0.0331
Durbin-Watson stat
0.683192
212 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 213
En ce qui concerne les tats-Unis, ce modle est plus adapt que les deux prcdents
car les deux variables (chmage et chmage retard) sont significatives.
7) Estimation dun nouveau le modle en introduisant la variable DUM et en prenant en
compte lautocorrlation des rsidus.
Pour la France :
Dependent Variable: INFFRA
Included observations: 32 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
15.14060
6.269402
2.414999
0.0228
CHOFRA
0.254229
0.522127
0.486910
0.6303
CHOFRA(1)
0.788179
0.495101
1.591958
0.1230
DUM
2.674737
0.797477
3.354000
0.0024
AR(1)
0.866577
0.081842
10.58842
0.0000
Durbin-Watson stat
1.791241
On constate dans ce modle que les chmages retards et contemporains ne sont pas
significatifs.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 32 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
12.66870
CHOUSA
0.221311
3.475067
3.645597
0.0011
0.292094
0.757670
0.4552
CHOUSA(1)
0.963667
0.296656
3.248427
0.0031
DUM
2.293875
0.767918
2.987137
0.0059
AR(1)
0.895121
0.086378
10.36288
0.0000
Durbin-Watson stat
1.552390
On remarque que dans ce cas, le chmage contemporain nest plus significatif, alors
que le chmage contemporain ltait dans le modle prcdent, non corrig des autocorrlations des rsidus et des points aberrants.
8) On cherche maintenant estimer le modle suivant :
p t = a0 + a1 p t1 + a2 u t + a3 u t1 + t .
Il sagit dun modle autorgressif dordre 1.
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 214
Pour la France :
Dependent Variable: INFFRA
Included observations: 33 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
1.663308
0.625929
2.657345
0.0129
INFFRA(1)
0.831080
0.063433
13.10170
0.0000
CHOFRA
0.360813
0.439505
0.820953
0.4186
CHOFRA(1)
0.225252
0.448785
0.501916
0.6197
DUM
4.995335
0.898138
5.561881
0.0000
Durbin-Watson stat
2.195938
Nous remarquons que les variables choffra et choffra(1) ne sont pas significatives ; en
revanche, le terme autorgressif est bien significativement diffrent de 0.
Nous effectuons le test h de Durbin car nous avons un modle autorgressif (prsence
de la variable expliquer comme variable explicative retarde).
Soit le test dhypothses H0 : h = 0 contre H1 : h 0.
DW
n
h = ||
donc = 0,098
avec = 1
2
2
1 n
a1
33
h = |0,98|
= 0,60 < t 0,05 = 1,96 . Il nexiste donc plus dauto1 33 0,06342
corrlation des erreurs.
Pour les tats-Unis :
Dependent Variable: INFUSA
Included observations: 33 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
3.704137
0.966380
3.833004
0.0007
INFUSA(1)
0.916993
0.115893
7.912443
0.0000
CHOUSA
1.025115
0.356171
2.878159
0.0076
CHOUSA(1)
0.442910
0.295441
1.499151
0.1450
DUM
4.630472
1.005135
4.606815
0.0001
Durbin-Watson stat
2.047469
Dans ce modle, seul le taux de chmage dcal nest pas significatif. On peut galement effectuer le test du h de Durbin, h = 0,182 qui est trs infrieur 1,96. Il nexiste donc plus dautocorrlation des erreurs.
214 CONOMTRIE
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 215
9) Tests de Chow1.
Pour la France :
Le test de Chow est effectu la priode 20 comme priode charnire. Comme pour la
deuxime priode, la variable DUM est gale 0 (colinarit avec le terme constant),
nous la retirons pour les deux priodes.
Nous obtenons : SCR = 83,25 ; SCR1 = 70,03 ; SCR2 = 5,056.
Chow Breakpoint Test: 21
F-statistic
0.678912
Probability
0.613020
2.148648
Probability
0.104452
Nous acceptons lhypothse que le fait de scinder en deux sous priodes namliore pas le modle pour la France et les tats-Unis.
10) Nous construisons les deux sries phi = pt a 1 pt1 a 4 dum pour la France et les
tats-Unis :
phi f rat = in f f rat 0,83in f f rat1 4,99dum t
phiusat = in f usat 0,91in f usat1 4,63dum t
la lecture de la reprsentation graphique (graphique 9) pour les tats-Unis et la France
de la relation entre le chmage et phi, nous remarquons que la tendance de la courbe de
la France a une pente moins importante que celle des tats-Unis, ce qui nous permet
dmettre lhypothse quune politique de dsinflation a moins deffets ngatifs aux
tats-Unis quen France. Nous pouvons donc en conclure quune politique de dsinflation est plus coteuse en termes de chmage en France quaux tats-Unis.
4
5
4
2
PHIUSA
PHIFRA
1
0
1
0
-1
-1
-2
-2
-3
-3
-4
7
CHOFRA
10
11
12
13
10
CHOUSA
Graphique 9 Relation entre le chmage et phi pour la France et pour les tats-Unis
1. titre dexercice, le lecteur vrifiera les rsultats proposs par le logiciel, cf. chapitre 3, IV. B.
9782100721511-Bourbo-C07.qxd
20/10/14
15:25
Page 216
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 217
8. Introduction
aux modles
quations simultanes
1. Dans le cadre de ce manuel, nous limitons volontairement les dveloppements thoriques qui
peuvent se rvler complexes dans le domaine de lconomtrie en gnral, et des quations
simultanes en particulier. Le lecteur dsirant approfondir ce chapitre peut se rfrer Greene
W.H. chapitre 16, 2000.
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 218
I. quations structurelles
et quations rduites
Lorsque nous sommes en prsence dun modle linaire quations multiples,
il arrive frquemment quune variable endogne dune quation apparaisse en
tant que variable explicative dune autre quation. Ce double statut de certaines
variables entrane un biais dans les estimations des coefficients lorsque nous
employons les MCO, quation par quation.
Nous allons donc chercher transformer le modle initial en un modle o
les variables endognes ne sont exprimes quen fonction des variables exognes.
A. Exemple introductif
Considrons le modle macro-conomique trois quations :
Ct = a0 + a1 Yt + 1t
[E1]
It = b0 + b1 Yt1 + 2t
[E2]
Yt = Ct + It
[E3]
avec :
Ct = consommation totale pour lanne t ;
It = investissement total pour lanne t ;
Yt = revenu total pour lanne t .
218 CONOMTRIE
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 219
Pour lever ce problme, nous allons exprimer les trois variables endognes
(Ct ,It ,Yt ) en fonction de la seule variable exogne (Yt1 ) .
ou encore :
Ct =
a0 + a1 b0
a1 b1
a1 2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1
Il en rsulte que :
Yt = Ct + It =
a0 + a1 b0
a1 2t + 1t
a1 b1
+ b0 +
+ b1 Yt1 +
+ 2t
1 a1
1 a1
1 a1
Yt =
a0 + b0
b1
2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1
a0 + a1 b0
a1 b1
a1 2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1
[E4]
Yt =
a0 + b0
b1
2t + 1t
+
Yt1 +
1 a1
1 a1
1 a1
[E5]
It = b0 + b1 Yt1 + 2t
[E6]
Lquation [E5] indique que la variable Yt est fonction de 1t et par consquent E(Yt 1t ) = 0 . Il en rsulte que, dans lquation [E1], lhypothse dindpendance entre la variable explicative Yt et lerreur 1t nest pas respecte et
lapplication des MCO sur le modle [E1] conduit des estimateurs biaiss et
non convergents.
En revanche, lutilisation des MCO sur les quations rduites est licite
puisque la variable Yt1 est indpendante de 1t et 2t .
Il est noter que la forme rduite permet de mesurer leffet total, direct et indirect, dune modification de la variable exogne Yt1 sur les variables endognes.
Par exemple, le schma suivant illustre la cascade des causalits :
[E2] [E3] [E1]
Yt1 It Yt Ct ce qui est rsum dans [E4].
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 220
B. Le modle gnral
Soit le systme gnral de g quations structurelles liant g variables endognes
k variables prdtermines :
b11 y1t + b12 y2t + . . . + b1g ygt + c11 x1t + c12 x2t + . . . + c1k xkt = 1t
b21 y1t + b22 y2t + . . . + b2g ygt + c21 x1t + c22 x2t + . . . + c2k xkt = 2t
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt
+ C
Y
(g,1)
(g, k)
=
X
(k,1)
(g,1)
[1]
[2]
et nous pouvons appliquer les MCO. En effet, les erreurs B 1 sont indpendantes de X .
Si, sur le plan de la prsentation, la formalisation est simple, sa mise en
uvre pratique est plus complexe. En effet, la connaissance des g k lments
de la matrice (B 1 C) ne permet pas de dterminer didentifier la matrice
B (compose de g g lments) ainsi que la matrice C (compose de g k
lments). Nous sommes alors en prsence de g k quations
(g g) + (g k) inconnues qui, sans restrictions supplmentaires, savrent
impossibles rsoudre, il sagit du problme de lidentification.
Nous allons donc prsenter en II. des rgles simples permettant, partir de
restrictions sur les paramtres, de dterminer des conditions didentification.
titre dillustration le modle introductif peut scrire sous forme matricielle :
Y =
=
Ct
It
Yt
1t
2t
0
;
B=
1
0 a1
0
1
0 ;
1 1
1
220 CONOMTRIE
U
X=
;
Yt1
C=
a0
b0
0
0
b1 ;
0
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 221
2t.
Les modles rcursifs sont aussi appels systme triangulaire car les
coefficients des variables endognes forment un triangle au sein de la matrice B .
1) Restrictions dexclusion
Nous pouvons considrer que chaque fois quune variable endogne ou exogne napparat pas dans une quation structurelle, cela revient laffecter dun
coefficient nul. Par exemple, dans notre modle introductif, la variable It ne
figure pas dans lquation [E1], son coefficient est donc nul : dans la matrice B ,
llment de la premire ligne et de la deuxime colonne est gal 0.
2) Restrictions linaires
Certaines spcifications de modle imposent que des variables soient affectes
dun coefficient identique, il sagit l encore de restrictions a priori sur les paramtres du modle.
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 222
B. Conditions didentification
Les conditions didentification se dterminent quation par quation. Nous pouvons distinguer trois cas didentifications :
le modle est sous-identifi si une quation du modle est sous-identifiable
(il y a moins dquations que de paramtres identifier dans la forme
structurelle, le systme est donc impossible rsoudre) ;
le modle est juste identifi si toutes les quations sont justes identifiables ;
le modle est sur-identifi si les quations du modle sont soit justes identifiables, soit sur-identifiables.
Si le modle est sous-identifi, il nexiste aucune possibilit destimation des
paramtres du modle, celui-ci doit tre respcifi.
Les conditions didentification peuvent faire lobjet dun dveloppement
complexe, nous nous bornons ici dicter des rgles simples qui sont, dans la
pratique, appliques en premier lieu.
Soit :
g = nombre de variables endognes du modle (ou encore nombre dquations
du modle) ;
k = nombre de variables exognes du modle ;
g = nombre de variables endognes figurant dans une quation ;
k = nombre de variables exognes figurant dans une quation.
Lorsque les restrictions ne sont que des restrictions dexclusion, les conditions ncessaires didentifiabilit snoncent ainsi :
g
g
g
Ce qui peut se rsumer ainsi : pour quune quation ne soit pas sous-identifie, le nombre de variables exclues de lquation doit tre au moins gal au
nombre dquations du modle moins 1.
Lorsque nous avons r restrictions, autres que celles dexclusion, concernant
les paramtres dune quation (galit de deux coefficients, par exemple), les
conditions prcdentes deviennent :
g
g
g
222 CONOMTRIE
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 223
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 224
Cette mthode des DMC est fonde, comme son nom lindique, sur lapplication en deux tapes des MCO.
Soit le modle quations simultanes g variables endognes et k
variables exognes :
b11 y1t + b12 y2t + . . . + b1g ygt + c11 x1t + c12 x2t + . . . + c1k xkt = 1t
b21 y1t + b22 y2t + . . . + b2g ygt + c21 x1t + c22 x2t + . . . + c2k xkt = 2t
...
bg1 y1t + bg2 y2t + . . . + bgg ygt + cg1 x1t + cg2 x2t + . . . + cgk xkt = gt
Puis, dans une deuxime tape, il convient de remplacer les variables endognes figurant droite des quations structurelles par leurs valeurs ajustes
laide des modles estims :
y1t = 12
y2t + . . . + 1g
ygt + c11 x1t + c12 x2t + . . . + c1k xkt + 1t
y1t + . . . + 2g
ygt + c21 x1t + c22 x2t + . . . + c2k xkt + 2t
y2t = 21
...
y1t + g2
y2t + . . . + cg1 x1t + cg2 x2t + . . . + cgk xkt + gt
ygt = g1
Les proprits de lestimateur des DMC sont identiques, de manire asymptotique, celles dun estimateur classique ; cest--dire que pour les petits
chantillons les estimations des paramtres peuvent tre biaises.
Il est noter que lestimateur des DMC peut sinterprter comme tant un
estimateur de la mthode des Variables Instrumentales1, les variables exognes
des autres quations tant les instruments.
224 CONOMTRIE
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 225
Exercice n 1
fichier C8EX1
[E1]
[E2]
Nous disposons des donnes du tableau 1 dans lequel les variables ont t pralablement centres.
Tableau 1 Variables macro-conomiques centres
t
Y1t
Y2t
X 1t
1
2
3
4
5
6
7
8
9
30,0
4,0
19,0
6,0
9,0
11,0
9,0
19,0
29,0
14,0
10,0
19,0
11,0
6,0
12,0
10,0
11,0
19,0
26,0
5,0
36,0
6,0
13,0
25,0
5,0
32,0
14,0
Y1t1
20,0
30,0
4,0
19,0
6,0
9,0
11,0
9,0
19,0
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 226
n=9
() = t de Student
[E4]
Y2t = 0,518 Y1t + 0,040 Y1t1 + e2t
(2,58)
(0,18)
R = 0,50
2
n=9
Ces estimateurs ne sont pas BLUE. En effet, si on explicite Y1t en fonction de X 1t et
de Y1t1, on obtient :
a
ac
2t
Y1t =
X 1t +
Y1t1 +
1 ab
1 ab
1 ab
Or, dans lquation [E2], on rgresse Y2t sur Y1t qui dpend alatoirement de 2t , ce
qui est en contradiction avec lhypothse dindpendance entre la variable explicative et
lerreur. Les estimateurs ne sont donc pas BLUE.
3) Pour appliquer la mthode des MCI, il convient dabord de mettre le modle sous
forme rduite, soit :
a
ac
2t
1t
X 1t +
Y1t1 +
+
1 ab
1 ab
1 ab
1 ab
ab
c
2t + b1t
Y2t =
X 1t +
Y1t1 +
1 ab
1 ab
1 ab
Y1t =
ou encore :
Y1t = 1 X 1t + 2 Y1t1 + v1t
Y2t = 3 X 1t + 4 Y1t1 + v2t
226 CONOMTRIE
[E5]
[E6]
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 227
X
=
ou encore Y = B 1 C X + B 1 = AX + v qui est le modle sous forme rduite avec
A = B 1 C (A est la matrice des coefficients estims de la forme rduite).
Nous avons donc B A = C , soit :
1 a
0,717
b
1
0,355
0,190
a
=
0,139
0
0
c
ce qui donne :
0,717 a 0,355 = a
0,190 a 0,139 = 0
b 0,717 + 0,355 = 0
b 0,190 + 0,139 = c
Nous pouvons, partir des deux dernires relations, estimer
b = 0,495 et
c = 0,045 (puisque lquation [E2] est juste identifie), mais, en revanche, le coefficient
a est indtermin (lquation [E1] est sur-identifie).
Nous appliquons maintenant la mthode des DMC afin destimer tous les coefficients
de ce modle.
Nous allons dvelopper le calcul pour la premire quation.
tape 1 : rgresser la variable endogne Y2t sur toutes les variables exognes (X 1t et
Y1t1 ).
Le rsultat est dj connu, puisquil sagit de lquation [E8].
2t
tape 2 : calculer la srie ajuste : Y
soit :
2t dans lquatape 3 : la variable endogne Y2t est remplace par sa valeur ajuste Y
2t + X 1t ) + 1t .
tion [E1] : Y1t = a(Y
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 228
n=9
() = t de Student
Cette procdure des DMC est donc un peu lourde mettre en uvre, cest pourquoi les
logiciels permettent en une seule instruction dutiliser cette mthode. Par exemple, pour
estimer la deuxime quation de notre modle, linstruction de Eviews est la suivante :
TSLS Y2 Y1(-1) Y1 @ X1 Y1( 1)
o TSLS est labrviation de Two-Stage Leasts Squares. La variable expliquer (Y2)
figure suivie des variables exognes Y1( 1), la seule dans cette quation et, enfin, on
cite, la variable endogne que lon dsire remplacer par sa valeur ajuste laide des
sries exognes (elles sont spares de la variable endogne par le signe @).
Le rsultat, fourni par Eviews, est le suivant :
Dependent Variable : Y2
Method: Two-Stage Least Squares
Included observations: 9
Instrument list: X1 Y1D
Variable
Y1D
Y1
R-squared
Adjusted R-squared
S.E. of regression
F-statistic
Prob(F-statistic)
Coefficient
Std. Error
t-Statistic
Prob.
0.045084
0.495344
0.220336
0.228271
0.204614
2.169985
0.8437
0.0666
0.503610
0.432697
10.45016
5.176628
0.057037
0.000000
13.87444
764.4403
3.011822
Nous remarquons que lestimation des coefficients est exactement la mme que par
la mthode des MCI. En effet, nous rappelons que la mthode des MCI fournit des rsultats strictement identiques la mthode des DMC. Cest pourquoi, dans la pratique, seule
cette dernire est utilise car elle se rvle dun maniement bien plus ais.
4) Nous pouvons au sein du tableau 2 comparer lensemble des rsultats obtenus.
Tableau 2 Rsultats destimation par les MCO et DMC
a
b
c
228 CONOMTRIE
MCO
DMC
0,516
(5,89)
0,518
(2,58)
0,040
(0,18)
0,535
(5,29)
0,495
(2,17)
0,045
(0,20)
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 229
la lecture de ces rsultats, nous constatons des diffrences assez faibles entre les
estimations des MCO et celles des DMC. En effet, les proprits des estimateurs des
DMC ne sont quasymptotiques, or le nombre dobservations dans cet exemple est limit 9.
Exercice n 2
Le problme de lidentification lorsque la structure
dun modle change
On considre le systme dquations :
Y1t + aY2t + b = 1t
cY1t + Y2t + dZ t + e = 2t
[E1]
[E2]
dans lequel Y1t et Y2t sont des variables endognes et Z t une variable exogne.
1) Mettre ce systme sous forme matricielle et tudier les conditions didentifiabilit.
2) Vrifier les conditions didentifiabilit partir du calcul matriciel.
3) Rpondre aux mmes questions avec e = 0 .
Solution
1) Le modle sous forme matricielle scrit :
0 b
Zt
1t
1 a
Y1t
+
=
soit BY + C X =
d e
Y2t
Ut
2t
c 1
avec U = vecteur unit.
Nous avons g = 2 variables endognes : Y1t , Y2t et k = 2 variables exognes Z t et
U . Examinons les conditions didentifiabilit :
pour
lquation
[E1] :
g = 2 ,
k = 1
et
r =0
g g + k k + r = 1 = g 1 , lquation [E1] est juste identifie ;
soit
pour
lquation
[E2] :
g = 2 ,
k = 2
et
r =0
g g + k k + r = 0 < g 1 , lquation [E2] est sous-identifie.
soit
2) Par le calcul matriciel, nous allons exprimer les variables endognes par les variables
exognes : Y = B 1 C X + B 1 .
Posons A = B 1 C
B
1
=
1 ac
1
c
1
a
ad
A=
1
d
1 ac
b ae
bc + e
=
c 1
d
3
4
b
e
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 230
[E3]
c
1 +
3 = d
[E5]
2 + a
4 = b
[E4]
c
2 +
4 = e
[E6]
Les quations [E3] et [E4] constituent deux quations deux inconnues. Les coefficients
a et b sont donc parfaitement identifiables ds lors que lon connat les coefficients de la
forme rduite. Ces deux coefficients a et b appartiennent lquation [E1] qui est juste
identifie, ce qui est une vrification des rgles nonces.
En revanche, les quations [E5] et [E6] forment deux quations trois inconnues,
soit un systme indtermin. Lquation [E3] est bien sous-identifie.
3) Si e = 0 , lquation [E1] reste juste identifie et lquation [E2] devient, ds lors,
juste identifie. Matriciellement, le systme scrit :
1 a
1
2
0 b
=
c 1
d 0
3
3
Soit, en explicitant cette relation matricielle :
1 + a
3 = 0
[E7]
c
1 +
3 = d
[E9]
2 + a
4 = b
[E8]
c
2 +
4 = 0
[E10]
Exercice n 3
fichier C8EX3
Le modle de Klein
Ce modle1 macro-conomique fournit un excellent exemple pdagogique des problmes qui peuvent se poser dans le cadre des quations simultanes.
Soit le modle suivant :
Const = a0 + a1 Pt + a2 Pt1 + a3 (Wt + Wt ) + 1t
It = b0 + b1 Pt + b2 Pt1 + b3 K t1 + 2t
Wt = c0 + c1 X t + c2 X t1 + c3 t + 3t
X t = Const + It + G t
Pt = X t Wt T axt
K t = It + K t1
avec :
Const
Pt
Wt et Wt
It
230 CONOMTRIE
[E1]
[E2]
[E3]
[E4]
[E5]
[E6]
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 231
Kt
Xt
Gt
T axt
1920
1921
1940
1941
Constt
Gt
39,8
41,9
65,0
69,7
2,4
3,9
7,4
13,8
It
K t1
Pt
T axt
Wt
Wt
Xt
2,7
0,2
3,3
4,9
180,1
182,8
201,2
204,5
12,7
12,4
21,1
23,5
3,4
7,7
9,6
11,6
28,8
25,5
45,0
53,3
2,2
2,7
8,0
8,5
44,9
45,6
75,7
88,4
Solution
1) Ce modle comporte six quations et onze variables conomiques (y compris le vecteur et la tendance). Les trois dernires quations sont des identits (aucun paramtre
nest estimer).
Les variables exognes sont les variables non expliques par une relation :
les variables retardes : Pt1 , X t1 , K t1 et
les variables vritablement exognes : la tendance t, les dpenses gouvernementales G t , les salaires des administrations Wt , les impts sur les profits T axt et
le vecteur unit U. Soit, k = 8.
Les variables endognes sont celles qui sont dtermines par une relation de comportement : Constt , It , Wt . En ce qui concerne les identits, on choisit comme variables
endognes, compte tenu de leur signification, X t , Pt et K t . Soit g = 6.
Nous remarquons que, dans ce choix de variables endognes et exognes, la rflexion
conomique joue un grand rle. Nanmoins, il subsiste une part darbitraire reprsentative du schma de pense de lconomiste.
2) Les estimations par les MCO sont les suivantes :
Constt = 16,23 + 0,193 Pt + 0,089 Pt1 + 0,796(Wt + Wt ) + e1t
[E7]
(12,4) (2,11)
(0,99)
(19,9)
n = 21
DW = 1,36
() = t de Student
R 2 = 0,98
[E8]
It = 10,12 + 0,479 Pt + 0,333 Pt1 0,111 K t1 + e2t
(1,85) (4,93)
(3,30)
(4,189)
n = 21
DW = 1,81
() = t de Student
R 2 = 0,93
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 232
[E9]
() = t de Student
Les estimateurs des MCO sont biaiss, cette mthode destimation est donc inapproprie pour ce type de modle. Nous devons tudier les conditions didentification de ce
modle et utiliser, le cas chant, la mthode des DMC.
3) Les conditions didentification conditions dordre studient quation par quation.
Le modle comporte g = 6 variables endognes et k = 8 variables exognes (cf. la
rponse la question 1).
Pour lquation [E1], nous avons g = 3 , variables endognes prsentes et k = 3 ,
variables exognes prsentes, soit (g g + k k = 8) restrictions dexclusion. De
plus, lgalit entre le coefficient de Wt et Wt introduit une restriction supplmentaire
r = 1.
g g + k k + r = 9 > g 1 = 5 lquation [E1] est sur-identifie.
Pour lquation [E2] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E2] est sur-identifie.
Pour lquation [E3] : g = 2 , k = 3 et r = 0 soit :
g g + k k + r = 9 > g 1 = 5 , lquation [E3] est sur-identifie.
Les quations tant toutes sur-identifies, il est licite destimer les coefficients de ce
modle laide de la mthode des DMC.
4) Nous avons appliqu la mthode des DMC pour chacune des trois quations estimer
de trois manires diffrentes.
quation [E1] en dcomposant la mthode des DMC.
Les variables endognes Pt et Wt apparaissent droite de lquation ; il convient
donc de les remplacer par leurs valeurs en fonction des 8 variables exognes.
tape 1 : estimation du modle pour Pt et calcul de la variable ajuste P At .
Dependent Variable : P
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
P(-1)
K
X(-1)
WP
TREND
G
TAX
46.55153
0.802501
0.216103
0.022000
0.079608
0.319405
0.439016
0.923098
23.15829
0.518856
0.119113
0.282164
2.533823
0.778129
0.391143
0.433759
2.010145
1.546674
1.814267
0.077969
0.031418
0.410478
1.122394
2.128133
0.0656
0.1459
0.0928
0.9390
0.9754
0.6881
0.2820
0.0530
232 CONOMTRIE
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 233
Coefficient
Std. Error
t-Statistic
Prob.
C
P(1)
K
X(1)
WP
TREND
G
TAX
34.87254
0.871921
0.122952
0.095329
0.443726
0.713584
0.866220
0.60415
18.61034
0.416960
0.095721
0.226751
2.036218
0.625316
0.314328
0.348575
1.873826
2.091137
1.284477
0.420412
0.217917
1.141158
2.755783
-1.733206
0.0836
0.0567
0.2214
0.6811
0.8309
0.2744
0.0164
0.1067
Coefficient
Std. Error
16.55476
0.017302
0.216234
0.810183
2.571080
0.229797
0.208810
0.078351
t-Statistic
6.438834
0.075294
1.035554
10.34044
Prob.
0.0000
0.9409
0.3149
0.0000
quation [E2] par application directe de la mthode des DMC laide de Eviews,
linstruction unique est la suivante (la liste des instruments les variables exognes
figurent aprs @ :
TSLS I C P(1) K P @ C P(1) K X(1) WP TREND G TAX
Dependent Variable : I
Method: Two-Stage Least Squares
Sample (adjusted): 1921 1941
Included observations: 21 after adjusting endpoints
Instrument list: C P(1) K X(1) WP TREND G TAX
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
P(1)
K
P
20.27821
0.615943
0.157788
0.150222
8.383247
0.180926
0.040152
0.192534
2.418897
3.404398
3.929752
0.780238
0.0271
0.0034
0.0011
0.4460
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 234
quation [E3] par application directe de la mthode des DMC laide de RATS,
les instructions sont les suivantes :
INSTRUMENTS CONSTANT TREND WP TAX G P{1} K X{1}
LINREG(INST) W
# CONSTANT TREND X{1} X
Dependent Variable W Estimation by Instrumental Variables
Annual Data From 1921: 01 To 1941: 01
Usable observations 21 Degrees of Freedom 17
Centered R**2
0.987414 R Bar **2
0.985193
Variable
Coeff
1. Constant
2. TREND
3. X{1}
4. X
0.064451360
0.130395687
0.146673821
0.438859065
Std Error
1.147038221
0.032388389
0.043163948
0.039602662
T-Stat
0.05619
4.02600
3.39806
11.08155
Signif
0.95584607
0.00087642
0.00342209
0.00000000
Nous pouvons aussi appliquer la mthode des triples moindres carrs. Le systme
(SYS01) scrit :
cons = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
I = C(5) + C(6) P + C(7) P( 1) + C(8) K
W = C(9) + C(10) X + C(11) X( 1) + C(12) @trend(1919)
inst C @trend(1919) WP TAX G P( 1) K X( 1)
Les rsultats (SYS01.3SLS) sont les suivants :
System : SYS01
Estimation Method : Three-Stage Least Squares
Sample : 1921 1941
Included observations : 21
Total system (balanced) observations 63
Coefficient
Std Error
t-Statistic
Prob.
C(1)
16.44079
1.304549
12.60267
0.0000
C(2)
0.124891
0.108129
1.155014
0.2535
C(3)
0.163144
0.100438
1.624322
0.1105
C(4)
0.790081
0.037938
20.82563
0.0000
C(5)
28.17784
6.793769
4.147601
0.0001
C(6)
0.013079
0.161896
0.080786
0.9359
C(7)
0.755724
0.152933
4.941532
0.0000
C(8)
0.194848
0.032531
5.98974
0.0000
C(9)
0.001128
1.009957
0.001117
0.9991
C(10)
0.400492
0.031813
12.58878
0.0000
C(11)
0.181291
0.034159
5.307308
0.0000
C(12)
0.149674
0.027935
5.357897
0.0000
Equation : CONS = C(1) + C(2) P + C(3) P( 1) + C(4) (W + WP)
Equation : I = C(5) + C(6) P + C(7) P( 1) + C(8) K
Equation : W = C(9) + C(10) X + C(11) X( 1)+C(12) @TREND(1919)
Instruments : C @TREND(1919) WP TAX G P( 1) K X( 1)
234 CONOMTRIE
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 235
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 236
Annexe
Identification : les conditions de rang
Soit le modle sous forme matricielle :
B
Y + C
(g,g) (g,1)
(g,k)
X =
(k,1)
(g,1)
On appelle P la matrice des structures qui est forme par la juxtaposition des
matrices B et C, soit P = [BC], P est donc de dimension (g,g + k).
Soit i , une matrice des restriction affrente lquation i construite telle que :
Pi i h = 0, i est la i -ime ligne de la matrice P et h la h -ime colonne de la matrice
i .
Soit i = rang[Pi ] (rang de la matrice Pi ), et g le nombre de variables endognes du modle, la condition de rang est alors la suivante :
si i < g 1 lquation i est sous-identifie ;
si i = g 1 lquation i est juste identifie ;
si i > g 1 lquation i est sur-identifie.
Cette condition ncessaire et suffisante didentification est, bien entendu, plus lourde mettre en uvre, cest pourquoi le plus souvent on se satisfait des conditions
dordre.
partir du modle de lexercice 1, nous allons construire ces matrices et appliquer
les conditions de rang.
Ce modle sous forme matricielle scrit :
1 a
Y1t
a
0
X 1t
1t
+
=
b
1
0 c
Y2t
Y1t1
2t
B
Y +
C
X
=
1 a a 0
.
Soit P = [BC] =
b
1
0 c
La matrice 1 , matrice des restrictions de la premire quation, est donc construite
de la manire suivante :
autant de lignes que de variables endognes et exognes, chaque ligne est reprsentative dune variable (ligne 1 = Y1t , ligne 2 = Y2t , ligne 3 = X 1t , ligne
4 = Y1t1 ) ;
une colonne par restriction dexclusion (variable endogne ou exogne manquante) et par restriction linaire sur les coefficients ;
pour les relations dexclusion, les colonnes sont composes de 0, sauf pour les
variables dont le coefficient est nul o lon met la valeur 1 ;
236 CONOMTRIE
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 237
pour les restrictions de contraintes sur les coefficients, on explicite la relation entre
les coefficients. Dans notre modle, nous avons c11 c12 = 0 (Y2 et X 1 ont le
mme coefficient).
Nous pouvons alors rcrire la condition : Pi i h = 0 .
Soit, pour lquation 1, nous avons une seule variable manquante et une restriction
sur le coefficient des variables Y2 et X 1 qui doit tre identique, soit deux colonnes :
0
0
i =
0
1
0
1
1
0
Pour 2 , nous avons une seule restriction : la variable X 1 est absente de lquation
2, soit :
0
0
2 =
1 la variable X 1 est absente de lquation 2
0
P1 =
1
b
a
1
a
0
0
0
0
c 0
1
0
0
1
=
c
1
0
1
rang de P1 = 1 = g 1.
Lquation 1 est juste identifie.
0
1 a a
0
0 = a
P2 =
0
b
1
0 c 1
0
rang de P2 = 2 = 1 = g 1
Lquation 2 est juste identifie (sauf si a = 0 ).
Nous remarquons que la condition de rang vient modifier la condition dordre de la
premire quation, puisque dun statut de sur-identifie, elle devient juste identifie.
Toutefois, cela ne remet aucunement en cause les rsultats trouvs lors de lexercice 1.
9782100721511-Bourbo-C08.qxd
22/10/14
9:23
Page 238
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 239
9. lments danalyse
e chapitre est consacr une prsentation sommaire des techniques danalyse des sries chronologiques. Ce thme, lui seul,
peut faire lobjet de longs dveloppements et de nombreux
ouvrages1 y sont intgralement consacrs. Nous tudions en I. les caractristiques statistiques en terme de stationnarit des sries temporelles en prsentant les diffrents tests (Dickey-Fuller, corrlogramme,
etc.) sy rapportant. Puis en II., nous prsentons diffrentes classes de
modles (AR, MA, ARMA) en tudiant leurs proprits. Enfin, la mthode Box et Jenkins qui systmatise une dmarche danalyse des sries temporelles fait lobjet de la section III.
I. Stationnarit
A. Dfinition et proprits
Avant le traitement dune srie chronologique, il convient den tudier les caractristiques stochastiques. Si ces caractristiques cest--dire son esprance et
sa variance se trouvent modifies dans le temps, la srie chronologique est
considre comme non stationnaire ; dans le cas dun processus stochastique
invariant, la srie temporelle est alors stationnaire. De manire formalise, le
processus stochastique yt est stationnaire si :
1. Pour un approndissement de ce chapitre, se rfrer au livre de Bourbonnais R. et Terraza M.,
Dunod, 2010.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 240
temps ;
var(yt ) < t , la variance est finie et indpendante du temps ;
cov(yt ,yt+k ) = E[(yt )(yt+k )] = k , la covariance est indpendante du
temps.
Il apparat, partir de ces proprits, quun processus de bruit blanc1 t dans
lequel les t sont indpendants et de mme loi N (0,2 ) est stationnaire.
Une srie chronologique est donc stationnaire si elle est la ralisation dun
processus stationnaire2. Ceci implique que la srie ne comporte ni tendance, ni
saisonnalit et plus gnralement aucun facteur nvoluant avec le temps.
(yt y)(ytk y)
cov(yt ,ytk )
t=k+1
k =
=
n
n
yt ytk
(yt y)2
(ytk y)2
t=k+1
[1]
t=k+1
Cette formule [1] est malaise manier puisquelle exige de recalculer pour
chaque terme k les moyennes et les variances, cest pourquoi on lui prfre la
fonction dautocorrlation dchantillonnage :
n
k =
(yt y)(ytk y)
t=k+1
n
(yt y)2
[2]
t=1
240 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 241
yt
yt1
yt2
yt3
yt4
1
2
3
4
5
6
7
8
9
10
11
12
123
130
125
138
145
142
141
146
147
157
150
145
123
130
125
138
145
142
141
146
147
157
150
123
130
125
138
145
142
141
146
147
157
123
130
125
138
145
142
141
146
147
123
130
125
138
145
142
141
146
Moyenne yt
Moyenne ytk
Variance yt
Variance ytk
140,75
140,75
95,02
95,02
1
142,36
140,36
72,41
101,87
0,77
143,60
139,40
62,84
101,84
0,62
145,67
137,44
24,11
74,91
0,59
146,63
136,25
22,23
71,44
0,55
Lorsque le nombre dobservations n est suffisamment grand, les deux formules [1] et [2] donnent des rsultats trs proches.
La fonction dautocorrlation partielle (FAP) sapparente la notion de corrlation partielle. Nous avons dfini au chapitre 4 le coefficient de corrlation
partielle comme tant le calcul de linfluence de x1 sur x2 en liminant les
influences des autres variables x3 , x4 , . . . , xk .
Par analogie, nous pouvons dfinir lautocorrlation partielle de retard k
comme le coefficient de corrlation partielle entre yt et ytk , cest--dire comme
tant la corrlation entre yt et ytk linfluence des autres variables dcales de k
priodes (yt1 , yt2 , . . . , ytk+1 ) ayant t retire.
Afin dviter par la suite toutes ambiguts entre les deux fonctions dautocorrlation, nous appelons fonction dautocorrlation simple, la fonction dautocorrlation.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 242
n = nombre dobservations.
1. Il sagit mme dun test de dtection de saisonnalit.
2. Quenouille M. H., 1949.
242 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 243
Si le coefficient calcul
k est lextrieur de cet intervalle de confiance, il
est significativement diffrent de 0 au seuil (en gnral = 0,05 et
t /2 = 1,96) . La plupart des logiciels fournissent, avec le corrlogramme, lintervalle de confiance, ce qui autorise une interprtation instantane.
Nous devons souligner une limite des tests 5 %. En effet, lorsquune fonction dautocorrlation est calcule pour un nombre important de retards, nous
pouvons nous attendre ce que quelques-uns soient, de manire fortuite, significativement diffrents de 0. Si h est le nombre de retards, le nombre possible de
faux rejets est alors de 0,05 h , pour un seuil de confiance de 5 %.
Dans le cas o le corrlogramme ne laisse apparatre aucune dcroissance de
ses termes (absence de cut off ), nous pouvons en conclure que la srie nest
pas stationnaire en tendance.
h
k2
k=1
h
k2
qui est aussi distribue selon un 2 h degrs de libern
k
k=1
t et dont les rgles de dcisions sont identiques au prcdent. Ces tests sont
appels par les anglo-saxons : portmanteau test soit littralement test
fourre-tout .
1. Box G E. P. et Pierce D. A., 1970.
2. Ljung G. M. et Box G E. P., 1978.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 244
3) Tests de normalit
Pour calculer des intervalles de confiance prvisionnels et aussi pour effectuer
les tests de Student sur les paramtres, il convient de vrifier la normalit des
erreurs. Le test de Jarque et Bera (1984), fond sur la notion de Skewness (asymtrie) et de Kurtosis (aplatissement), permet de vrifier la normalit dune distribution statistique.
a) Les tests du Skewness et du Kurtosis
n
1
(xi x)k le moment centr dordre k, le coefficient de Skewness
n i=1
3
4
(11/2 ) est gal : 11/2 = 3/2 et le coefficient de Kurtosis : 2 = 2 .
2
2
Soit k =
1/2
1
6
24
et 2 N 3;
N 0;
n
n
|11/2 0|
|2 3|
et 2 =
que lon compare 1,96 (valeur de la loi nor
6
24
n
n
Ces tests de normalit servent galement dans le cas o il y a htroscdacit. En effet, lhtroscdacit se manifeste sur le graphe de la distribution par
des queues de probabilit plus paisses (distribution leptokurtique) que les
queues de la loi normale.
4) Tests dhomoscdasticit
Un processus de bruit blanc doit tre homoscdastique, les tests dhtroscdasticit du chapitre 5, Section II peuvent tre utiliss.
244 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 245
Si t est un bruit blanc (gaussien ou non), les caractristiques de ce processus sont alors :
E[x t ] = a0 + a1 t + E[t ] = a0 + a1 t
V [x t ] = 0 + V [t ] = 2
cov[x t ,x t
] = 0 pour t =
/ t
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 246
fet produit par un choc (ou par plusieurs chocs alatoires) un instant t est transitoire. Le modle tant dterministe, la chronique retrouve son mouvement de
long terme qui est ici la droite de tendance. Il est possible de gnraliser cet
exemple des fonctions polynmiales de degr quelconque.
b) Les processus DS
Les processus DS sont des processus que lon peut rendre stationnaires par lutilisation dun filtre aux diffrences : (1 D)d xt = + t o t est un processus
stationnaire, une constante relle, D loprateur dcalage et d lordre du filtre
aux diffrences.
Ces processus sont souvent reprsents en utilisant le filtre aux diffrences premires (d = 1) . Le processus est dit alors processus du premier ordre. Il scrit :
(1 D)xt = + t xt = xt1 + + t
Par exemple :
cov(x 4 ,x 2 ) = E[(x 0 + 1 + 2 + 3 + 4 )(x 0 + 1 + 2 )]
= E(1 1 ) + E(2 2 ) = 22 .
/ t
.
En effet tous les produits E(t t
) = 0 si t =
246 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 247
etc.
Si on suppose la valeur dorigine x 0 connue et dterministe, on a alors :
t
x t = x 0 + t +
i
i =1
t
i et en calculant : x t1 = x 0 + (t 1) +
t1
i =1
i =1
On a : x t x t1 = (1 B)x t = + t .
Dans les processus de type DS, un choc un instant donn se rpercute
linfini sur les valeurs futures de la srie ; leffet du choc est donc permanent et
va en dcroissant.
En rsum, pour stationnariser un processus TS, la bonne mthode est celle
des moindres carrs ordinaires ; pour un processus DS, il faut employer le filtre
aux diffrences. Le choix dun processus DS ou TS comme structure de la chronique nest donc pas neutre.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 248
248 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 249
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 250
p
j xt j+1 + t
j=2
p
j xt j+1 + c + t
j=2
p
j xt j+1 + c + bt + t
j=2
avec t i.i.d.
Le test se droule de manire similaire aux tests DF simples, seules les tables
statistiques diffrent. La valeur de p peut tre dtermine selon les critres de
Akaike ou de Schwarz, ou encore, en partant dune valeur suffisamment importante de p, on estime un modle p 1 retards, puis p 2 retards, jusqu ce
que le coefficient du pime retard soit significatif.
c) Le test de Phillips et Perron (1988)
Ce test est construit sur une correction non paramtrique des statistiques de
Dickey-Fuller pour prendre en compte des erreurs htroscdastiques. Il se
droule en quatre tapes :
1) Estimation par les moindres carrs ordinaires des trois modles de base
des tests de Dickey-Fuller et calcul des statistiques associes, soit et le rsidu
estim.
2 =
2) Estimation de la variance dite de court terme
n
1
e2
n t=1 t
3) Estimation d'un facteur correctif st2 (appel variance de long terme) tabli
partir de la structure des covariances des rsidus des modles prcdemment
estims de telle sorte que les transformations ralises conduisent des distributions identiques celles du Dickey-Fuller standard :
st2 =
n
l
1
i
1 n
et2 + 2
1
et eti .
n t=1
l + 1 n t=i+1
i=1
avec k =
1 1) n(k 1)
1
(
k
+
1
k
2
(qui est gal 1 de manire asymptotique si et est un bruit
st2
250 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 251
d) Stratgie de tests
Nous constatons que pour raliser un test de racine unitaire, le rsultat nest pas
identique selon lutilisation de lun des trois modles comme processus gnrateur de la chronique de dpart. Les conclusions auxquelles on parvient sont donc
diffrentes et peuvent entraner des transformations errones. Cest la raison pour
laquelle Dickey et Fuller, et leur suite dautres auteurs, ont labor des stratgies de tests1. Nous prsentons un exemple simplifi (schma 1) dune stratgie
de tests. Les valeurs critiques des tc et tb permettant de tester la nullit des coefficients c et b des modles [2] et [3] sont donnes en fin douvrage (table 7).
e) Le test KPSS (1992)
Kwiatkowski et al. (1992) propose dutiliser un test du multiplicateur de
Lagrange (L M) fond sur lhypothse nulle de stationnarit. Aprs estimation
des modles [2] ou [3], on calcule la somme partielle des rsidus : St =
t
ei et
i=1
on estime la variance de long terme (st2 ) comme pour le test de Phillips et Perron.
Estimation du modle [3]
yt = c + bt + 1yt 1 + at
Test b = 0
non
Test 1 = 1
oui
oui
non
Processus TS :1<1
yt = c + bt + 1yt 1 + at
Processus DS
Estimation du modle [2]
yt = c + 1yt 1 + at
Test c = 0
non
Test 1 = 1
oui
Processus DS
oui
non
Processus stationnaire
Estimation du modle [1]
yt = 1yt 1 + at
Test 1 = 1
oui
Processus DS
non
Processus stationnaire
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
n
1
st2
Page 252
St2
t=1
n2
rit si cette statistique est suprieure aux valeurs critiques lues dans une table
labore par les auteurs.
Il est noter que les logiciels RATS et Eviews permettent directement l'utilisation de ces tests.
Exercice n 1
fichier C9EX1
252 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 253
1. Ces tests trs brivement prsents ici doivent faire lobjet dune stratgie afin de tester les cas
des hypothses jointes. Cf. Bourbonnais R. et Terraza M., 2010.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 254
t Statistique
Probabilit critique
Modle [4]
0,46
0,81
Modle [5]
2,03
0,27
Modle [6]
2,28
0,44
Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhypothse H0 ; nous pouvons donc conclure que le processus CAC40 possde une racine
unitaire et nest donc pas stationnaire.
Nous procdons ensuite au test de Phillips-Perron avec une troncature l = 6.
Hypothse H0 : CAC possde une racine unitaire
Troncature l = 6
Test de Phillips-Perron
t Statistique ajust
Probabilit critique
Modle [1]
0,50
0,82
Modle [2]
1,94
0,31
Modle [3]
2,20
0,49
Les probabilits critiques sont toutes suprieures 0,05, nous ne rejetons pas lhypothse H0 ; le processus CAC40 possde une racine unitaire.
Enfin, nous procdons aux tests KPSS.
Hypothse H0 : CAC ne possde pas une racine unitaire
Troncature l = 6
Test de Kwiatkowski-Phillips-Schmidt-Shin
LM Statistique
Valeur critique 5%
Modle [2]
2,58
0,46
Modle [3]
1,31
0,14
La statistique LM est suprieure la valeur critique (pour un seuil de 5%) pour les
deux spcifications, nous rejetons lhypothse H0, le processus CAC40 possde donc une
racine unitaire.
Tous les rsultats sont convergents, nous pouvons donc conclure que le processus
CAC40 nest pas stationnaire.
Sagit-il dun processus de marche au hasard sans drive ? Nous allons le vrifier en
calculant le corrlogramme de la srie filtre par les diffrences premires ceci afin de
stationnariser le processus :
DCACt = CACt CACt1.
254 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 255
La statistique Q a une probabilit critique de 0,182 (pour k = 15) largement suprieure 0,05 ; nous acceptons lhypothse H0 de nullit des coefficients du corrlogramme. Le corrlogramme de la srie CAC40 filtre par les diffrences premires est caractristique dun bruit blanc. La srie CAC40 est donc bien un processus DS sans drive.
Sagit-il dun bruit blanc gaussien ?
Lhistogramme de la distribution et les valeurs empiriques des Skewness, Kurtosis
et de la statistique de Jarque-Bera sont donns par :
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 256
|2 3|
|6,83 3|
= 26,61 > 1,96 .
2 =
=
24
24
1 159
n
Nous rejetons lhypothse de normalit en ce qui concerne la symtrie et laplatissement
de la distribution, ce qui est confirm par la statistique de Jarque-Bera :
2
JB = 741,3 > 0,05
(2) = 5,99 . Le processus CAC40 en diffrences est donc un bruit
blanc non gaussien.
et
[4]
256 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 257
[5]
Dans ce processus, tout comme dans le modle auto-rgressif AR, les alas
sont supposs tre engendrs par un processus de type bruit blanc. Nous pouvons interprter le modle MA comme tant reprsentatif dune srie chronologique fluctuant autour de sa moyenne de manire alatoire, do le terme de
moyenne mobile car celle-ci, en lissant la srie, gomme le bruit cr par lala.
Il est noter quil y a quivalence entre un processus MA(1) et un processus
AR dordre p infini :
MA(1) = AR().
i=qk
k =
i i+k
i=0
i=q
2
i
i=0
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 258
Nous avons :
ARMA(1,0) = AR(1); ARMA(0,1) = MA(1).
(1 1 2 ... p )
Donc connaissant lesprance du processus (Eviews calcule directement lesprance du processus), la constante du processus ARMA est dtermine par :
= E(x t ) (1 1 2 ... p )
AR(1)
AR(2)
AR(p)
1. Il suffit de remplacer chaque terme E(x t ) = E(x t1 ) = E(x t2 ) = ... = E(x t p ) car la srie
est stationnaire.
258 CONOMTRIE
9782100721511-Bourbo-C09.qxd
Processus
22/10/14
9:34
Page 259
MA(1)
MA(2)
MA(q)
ARMA(1, 1)
ARMA(p, q)
4) Conditions dutilisation
Les modles AR, MA, ARMA ne sont reprsentatifs que de chroniques :
stationnaires en tendance ;
corriges des variations saisonnires.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 260
Exercice n 2
Gnration de processus ARMA et analyse des corrlogrammes
On demande de gnrer sur 200 observations, de manire artificielle, les processus
suivants et den tudier les corrlogrammes.
1) MA(1) : yt = 2 + (1 + 0,8 D)t
2) AR(1) : (1 0,9 D)yt = 2 + t
3) MA(2) : yt = 2 + (1 + 0,6 D 0,3 D 2 )t
4) AR(2) : (1 0,9 D + 0,7 D 2 )yt = 2 + t
5) ARMA(1, 1) : (1 0,9 D)yt = 2 + (1 + 0,8 D)t
avec t N (0 ; 1).
Solution
Le programme Eviews (
ponible en tlchargement.
260 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 261
fonde sur ltude des corrlogrammes simple et partiel. Nous pouvons essayer
ddicter quelques rgles simples facilitant la recherche des paramtres p, d, q
du modle ARIMA.
1) Dsaisonnalisation
Dans le cas dune srie affecte dun mouvement saisonnier, il convient de la retirer pralablement tout traitement statistique. Cette saisonnalit est ajoute la
srie prvue la fin du traitement afin dobtenir une prvision en terme brut.
9782100721511-Bourbo-C09.qxd
22/10/14
yt =
Nous posons vt =
9:34
Page 262
1
(1 1 D 2 D 2 )t
1 1 D 2 D 2
1
t ,
1 1 D 2 D 2
il vient alors :
vt 1 vt1 2 vt2 = t
[6]
[7]
[8]
262 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 263
le test de Durbin Watson, bien quil ne permette de dtecter que des autocorrlations dordre 1 ;
les tests de Box et Pierce et de Ljung et Box (cf. I, C de ce chapitre) qui
permettent de tester lensemble des termes de la fonction dautocorrlation. Si le rsidu est mmoire, cela signifie que la spcification du modle est incomplte et quil convient dajouter au moins un ordre au processus ;
le test ARCH dhtroscdasticit (cf. chapitre 5, II, D) effectu partir de
la fonction dautocorrlation du rsidu au carr.
La phase de validation du modle est trs importante et ncessite le plus souvent un retour la phase didentification.
Lorsque le modle est valid, la prvision peut alors tre calcule un horizon de quelques priodes, limites car la variance de lerreur de prvision crot
trs vite avec lhorizon.
Nous pouvons rsumer les diffrentes tapes de la mthodologie de Box et
Jenkins partir du schma 2.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 264
Exercice n 3
fichier C9EX3
800
700
600
500
400
300
200
100
0
25
50
75
100
125
150
175
200
X1
264 CONOMTRIE
Adj. t-Stat
2.148148
Prob.
0.5157
t-Statistic
1.824772
4.591160
1.862974
Prob.
0.0694
0.0000
0.0638
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 265
Nous acceptons lhypothse H0 de racine unitaire, nous ne pouvons donc pas interprter les probabilits critiques calcules directement selon les lois de Student. Nous
devons nous rfrer la table statistique 7 en fin douvrage : tb = 1,86 < tb0,05 = 2,79
(valeur lue 5%, modle [3]), acceptation de lhypothse b = 0. Selon la stratgie
squentielle de test nous estimons le modle [2].
Estimation du modle [2]
Null Hypothesis: X1 has a unit root
Exogenous: Constant
Bandwidth: 4 (Fixed using Bartlett kernel)
Phillips-Perron test statistic
Dependent Variable: D(X1)
Included observations: 219 after adjustments
Variable
Coefficient
Std. Error
X1(-1)
0.000673
0.001830
C
3.128542
0.749736
Adj. t-Stat
0.307267
Prob.
0.9783
t-Statistic
0.367843
4.172860
Prob.
0.7133
0.0000
Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 266
Coefficient
3.327748
0.760134
- 0.604867
0.500890
Std. Error
0.346054
0.066149
0.062249
0.073470
t-Statistic
9.616272
11.49128
- 9.716905
6.817644
Prob.
0.0000
0.0000
0.0000
0.0000
d) Validation de la reprsentation
Tests de Student sur les coefficients :
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05)
Analyse des rsidus
Corrlogramme du rsidu
266 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 267
x1t
x1t
t = rsidus
218
219
220
221
222
223
721,75
734,14
741,90
743,55
742,92
744,26
10,2
12,39
7,76
1,65
0,63
1,34
4,07
2,28
0,87
0
0
0
2) Analyse du processus x2
Le graphique 3 prsente lvolution du processus x2 et son corrlogramme, leur
lecture le processus semble non stationnaire.
35
30
25
20
15
10
5
0
25
50
75
100
125
150
175
200
X2
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 268
t-Statistic
2.253814
4.001108
3.430766
3.138998
Prob.*
0.4570
Coefficient
Std. Error
t-Statistic
Prob.
X2( 1)
D(X2( 1))
D(X2( 2))
D(X2( 3))
C
@TREND(1)
0.080344
0.229159
0.209633
0.168372
1.314041
0.002458
0.035648
0.070487
0.069319
0.067849
0.575187
0.003842
2.253814
3.251071
3.024181
2.481571
2.284546
0.639940
0.0252
0.0013
0.0028
0.0139
0.0233
0.5229
268 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 269
donc nous rfrer la table statistique 7 en fin douvrage : tb = 0,64 < tb0,05 = 3,12
(valeur lue 5 %, modle [3]), acceptation de lhypothse b = 0. Nous estimons le
modle [2].
Estimation du modle [2]
Null Hypothesis: X2 has a unit root
Exogenous: Constant
Lag Length: 3 (Fixed)
Augmented Dickey-Fuller test statistic
Test critical values:
1% level
5% level
10% level
t-Statistic
2.306282
3.460596
2.874741
2.573883
Prob.*
0.1709
Coefficient
Std. Error
t-Statistic
Prob.
X2( 1)
D(X2( 1))
D(X2( 2))
D(X2( 3))
C
0.067264
0.239180
0.217876
0.174967
1.347763
0.029165
0.068630
0.068017
0.066968
0.571966
2.306282
3.485076
3.203270
2.612710
2.356368
0.0221
0.0006
0.0016
0.0096
0.0194
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 270
Il ne sagit pas dune marche au hasard (les probabilits critiques de la Q-Stat sont
toutes trs largement infrieures 0,05), le processus est mmoire, il existe donc une
reprsentation dans la classe des processus ARMA.
c) Recherche des ordres p et q de la reprsentation ARMA
Compte tenu de la forme des corrlogrammes simple et partiel nous slectionnons
un modle ARMA(1, 1). Nous constatons que la constante nest pas significativement
diffrente de 0, et des essais dautres reprsentations concurrentes (ARMA(2, 0) ou
ARMA(0, 2)) indiquent des valeurs des critres dinformation (AIC ou SC) suprieures
au modle retenu.
Dependent Variable: D(X2)
Sample (adjusted): 3 220
Included observations: 218 after adjustments
Variable
Coefficient
Std. Error
t-Statistic
Prob.
AR(1)
MA(1)
0.437628
0.743275
0.127029
0.094329
3.445091
7.879625
0.0007
0.0000
d) Validation de la reprsentation
Tests de Student sur les coefficients
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05).
Analyse des rsidus
Corrlogramme du rsidu
270 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 271
e) Prvision
La prvision est donne (E(t ) = 0 pour t > 220) par :
x2t = 1 x2t1 + 1 t1
x2t = 0,437 x2t1 0,743t1
x2t = x2t1 + x2t
x2,221 = 0,437 x2,220 0,743 220
x2,221 = 0,437 1,318 0,743 0,889 = 0,084
x2,221 = x2,220 + x2,221 = 19,61 + 0,084 = 19,69
x2,222 = 0,437 x2,221 0,743 221
x2,222 = 0,437 0,084 0,743 0 = 0,037
x2,222 = x2,221 + x2,222 = 19,69 + 0,037 = 19,73
x2,223 = 0,437 x2,222 0,743 222
x2,223 = 0,437 0,037 0,743 0 = 0,016
x2,223 = x2,222 + x2,223 = 19,73 + 0,016 = 19,75
Les rsultats sont prsents au tableau 4.
Tableau 4 Calcul des prvisions du processus ARIMA(1, 1, 1)
t
x2t
x2t
t = rsidus
218
219
220
221
222
223
20,438
20,930
19,611
19,695
19,732
19,748
3,328
0,492
1,318
0,084
0,037
0,016
2,464
0,867
0,889
0
0
0
3) Analyse du processus x3
Le graphique 4 prsente lvolution du processus x3 et son corrlogramme, leur
lecture le processus est clairement non stationnaire.
700
600
500
400
300
200
100
0
25
50
75
100
125
150
175
200
X3
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 272
Adj. t-Stat
15.03107
4.000511
3.430477
3.138828
Prob.*
0.0000
Variable
Coefficient
Std. Error
t-Statistic
Prob.
X3(- 1)
C
@TREND(1)
1.023098
10.33495
3.065841
0.068065
0.639662
0.203980
15.03108
16.15689
15.03013
0.0000
0.0000
0.0000
Coefficient
Std. Error
t-Statistic
Prob.
C
TENDANCE
7.171985
2.996632
0.409466
0.003213
17.51547
932.7294
0.0000
0.0000
c) Validation de la reprsentation
Tests de Student sur les coefficients
Les coefficients sont tous significativement diffrents de 0 (probabilits critiques
infrieures 0,05).
272 CONOMTRIE
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 273
Le corrlogramme du rsidu indique quil sagit dune marche au hasard, le corrlogramme du rsidu au carr nindique aucun terme de significativement diffrent de 0 ;
les rsidus sont donc homoscdastiques. Les rsidus sont donc un bruit blanc.
Les rsidus sont-ils gaussiens ? La statistique de Jarque-Bera (JB = 1,249) indique
une probabilit critique de 0,54, nous acceptons lhypothse de normalit des rsidus.
La reprsentation est valide x3t est un processus TS.
d) Prvision
La prvision est donne par :
x3t = a0 + a1 t + t avec (E(t ) = 0) t
x3t = 7,17 + 2,996 t
x3,221 = 7,17 + 2,996 221 = 669,428
x3,222 = 7,17 + 2,996 222 = 672,424
x3,223 = 7,17 + 2,996 223 = 675,421
9782100721511-Bourbo-C09.qxd
22/10/14
9:34
Page 274
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 275
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 276
4
b1i y1ti +
i=1
y2t = a2 +
4
4
i=1
b2i y1ti +
i=1
4
i=1
Les variables y1t et y2t sont considres comme tant stationnaires (cf. chapitre 9), les perturbations 1t et 2t (les innovations ou les chocs) sont des bruits
blancs de variances constantes 12 et 22 et non autocorrles. Nous pouvons
immdiatement constater labondance de paramtres estimer (ici 20 coefficients) et les problmes de perte de degrs de libert qui en rsultent. la lecture de ce modle, il apparat quil nest pas sous forme rduite : en effet, y1t a
un effet immdiat sur y2t et rciproquement y2t a un effet immdiat sur y1t . Ce
systme initial est appel forme structurelle de la reprsentation VAR. Sous
forme matricielle, ce modle devient :
BYt = A0 +
4
Ai Yti + t
[1]
i=1
avec :
1
B=
d2
d1
1
Yt =
y1t
y2t
a
A0 = 1
a2
b
Ai = 1i
b2i
c1i
c2i
1t
=
.
2t
4
a1i1 y1ti +
4
i=1
i=1
4
4
i=1
a2i1 y1ti +
a1i2 y2ti + 1t
a2i2 y2ti + 2t
i=1
276 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 277
On dmontre que :
E(1t ) = 0; E(2t ) = 0; E(1t 1ti ) = 0; E(2t 2ti ) = 0
B. La reprsentation gnrale
La gnralisation de la reprsentation VAR k variables et p dcalages (note
VAR( p) ) scrit sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t
y
1,t
2,t
avec Yt =
.. ; Ai =/0
.
a1i1
a2i1
=
..
.
yk,t
aki1
a1i2
a2i2
aki2
a0
. . . a1ik
1t
1
k
0
a2i
a2
2t
; A0 = . ; t = .
.
..
.
k
0
kt
ak
aki
On note : = E(t t ) , la matrice de dimension (k, k) des variances covariances des erreurs. Cette matrice est bien sr inconnue.
Cette reprsentation peut scrire laide de loprateur retard :
(I A1 D A2 D 2 . . . A P D P )Yt = A0 + t ou encore A(D)Yt = A0 + t
Condition de stationnarit
Un modle VAR est stationnaire, sil satisfait les trois conditions classiques :
E(Yt ) = t ;
Var(Yt ) < ;
Cov(Yt ,Yt+k ) = E[(Yt )(Yt+k )] = k t .
On dmontre1 quun processus VAR( p) est stationnaire si le polynme dfini partir du dterminant : det(I A1 z A2 z 2 . . . A p z p ) = 0 a ses racines
lextrieur du cercle unit du plan complexe.
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 278
Exercice n 1
Recherche des conditions de stationnarit dun modle VAR
Soit le processus :
y1t
y2t
3
0,2
=
+
1
0,3
0,7
0,4
y1t1
e1t
+
y2t1
e2t
z = 1 0,6 z 0,13 z
0 1
0,3 0,4
z 2 = 5,91
Les deux racines sont en valeur absolue suprieures 1, le processus est donc stationnaire.
C. La reprsentation ARMAX
La reprsentation prcdente peut tre gnralise1, par analogie avec les processus ARMA( p, q) , un modle dont les erreurs sont autocorrles dordre q.
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p + t + B1 t1 + B2 t2 + . . . + Bq tq
278 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 279
A. Mthode destimation
Dans le cas dun processus VAR, chacune des quations peut tre estime par
les MCO, indpendamment les unes des autres (ou par une mthode de maximum de vraisemblance).
Soit le modle VAR( p) estim :
0 + A
1 Yt1 + A
2 Yt2 + . . . + A
p Yt p + e
Yt = A
e tant le vecteur de dimension (k,1) des rsidus destimation e1t , e2t , . . . , ekt .
Et on note :
modle.
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 280
avec : k = nombre de
variables du systme ; n = nombre dobservations ;
p = nombre de retards ; e = matrice des variances covariances des rsidus du
modle.
Le retard p qui minimise les critres AIC ou SC est retenu.
C. Prvision
Les coefficients du modle tant estims, la prvision peut tre calcule en n
lhorizon dune priode, par exemple pour un VAR(1), de la manire suivante :
n (1) = A
0 + A
1 Yn
Y
etc.
Lorsque h tend vers linfini, nous constatons que la prvision tend vers une
i1 0 si i .
valeur constante (tat stationnaire) puisque A
Lesprance de la matrice de lerreur de prvision est nulle, sa variance est
donne par :
(h) = M0
M0 + M1
M1 + . . . + Mh1
Mh1
o Mi est calcul par la
min( p,i)
Mi =
j Mi j
A
i = 1, 2,. . . et M0 = I
j=1
Ainsi, il vient :
1 ; M2 = A
1 M1 + A
2 M0 = A
21 + A
2 ;
M1 = A
3
1 M2 + A
2 M1 + A
3 M0 = A
1 + A
1 A
2 + A
2 A
1 + A
3
M3 = A
etc.
La variance de lerreur de prvision pour chacune des prvisionsdes k
n2 (h)) se lit sur la premire diagonale de la matrice
variables (
e (h) .
Lintervalle de prvision au seuil de (1 /2) est donn par :
n (h) t /2
Y
n (h) avec t /2 valeur de la loi normale.
280 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 281
Exercice n 2
fichier C10EX2
0018Q3
0018Q4
y1t
y2t
146,4
19,2
19,2
50,4
75,6
1,8
16,2
3,6
On demande :
1) de rechercher lordre du modle VAR,
2) destimer les paramtres du modle,
3) de calculer une prvision pour lanne 19 avec son intervalle de confiance 95 %.
Solution
1) Rechercher lordre du modle VAR
Nous allons utiliser les critres de Akaike et de Schwarz pour des dcalages h allant
de 0 4. Nous devons donc estimer quatre modles diffrents et retenir celui dont les critres AIC et SC sont les plus faibles.
Estimation du modle pour h = 1
0 1
a
a
y1t
= 10 + 11
1
y2t
a2
a21
2
a11
2
a21
y1t1
1t
+
y2t1
2t
Ou encore :
1
2
y1t1 + a11
y2t1 + 1t
y1t = a10 + a11
1
2
y2t = a20 + a21
y1t1 + a21
y2t1 + 2t
Pour estimer les paramtres de ce modle, nous pouvons utiliser les MCO quation
par quation.
y1t = 0,00676 y1t1 0,6125 y2t1 + 17,129
y2t = 0,1752 y1t1 + 0,2992 y2t1 12,862
Les deux rsidus destimation sont alors calculs : e1,t et e2,t ainsi la matrice des
variances covariances des rsidus est donne par :
n
n
e12
e1 e2
1 1
1
n
n
e =
n
e1 e2
e22
1
=
71
106500,16
47878,12
47878,12
1500,002
=
85205,25
674,339
674,3398
1200,074
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 282
y19:1 = 0,1752 y18:4 + 0,2992 y18:4 12,862
y19:1 = 0,0067 50,4 0,6125 3,6 + 17,129 = 15,3
y19:1 = 0,1752 50,4 + 0,2992 3,6 12,862 = 20,6
y19:2 = 0,0067 15,3 0,6125 20,6 + 17,129 = 29,9
y19:2 = 0,1752 15,3 + 0,2992 20,6 12,862 = 21,7
282 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 283
y19:3 = 0,0067 29,9 0,6125 21,7 + 17,129 = 30,6
y19:3 = 0,1752 29,9 + 0,2992 21,7 12,862 = 24,6
y19:4 = 0,0067 30,6 0,6125 24,6 + 17,129 = 32,4
y19:4 = 0,1752 30,6 + 0,2992 24,6 12,862 = 25,6
La variance de lerreur de prvision est donne par la formule :
o Mi est calcul par la formule
M1 + . . . + Mh1 e Mh1
min(
p,i)
j Mi j i = 1,2,. . . et M0 = I . Les variances se
de rcurrence suivante : Mi =
A
e (h)
+M1
j=1
e (h) .
1 ; M2 = A
1 M1 = A
21 ; M3 = A
1 M2 = A
31 ; etc., car le
Ainsi, il vient : M1 = A
modle est un VAR(1) et donc seul A1 est estim.
1 500,02 674,34
. La variance de
Soit lhorizon h = 1, nous avons e (1) =
674,34 1 200,1
y19:1 est gale 1 500,02 et la variance de lerreur de prvilerreur de prvision pour
sion pour y19:1 est gale 1 200,1. Lintervalle de confiance pour y19:1 est donn
par : 15,3 1,96 38,73 = [60,64 ; 91,17] et pour y19:1 est donn par :
20,6 1,96 34,64 = [88,52 ; 47,27] .
Soit lhorizon h = 2, nous avons :
e (2)
1
+A
1 , soit :
A
674,34
0,00676 0,6126
1 500,02
+
1 200,1
0,1753 0,2992
674,34
0,00676 0,1753
1 955,99 969,88
=
0,6126 0,2992
969,88 1 424,37
2
1
21
1 + A
1
(3) =
+A
A
A
Pour h = 3 :
e (2) =
674,34
1 200,1
1 500,02 674,34
0,00676 0,6126
1 500,02 674,34
+
e (3) =
674,34 1 200,1
0,1753 0,2992
674,34 1 200,1
2
0,00676 0,1753
0,00676 0,6126
1 500,02 674,34
+
0,6126 0,2992
0,1753 0,2992
674,34 1 200,1
2
0,00676 0,1753
2 042,63 1 043,88
=
0,6126 0,2992
1 043,88 1 489,48
2
3
1
2
3
Pour h = 4 : e (4) = e + A
e A1 + A1
e A1 + A1
e A1
1 500,02 674,34
0,00676 0,6126
1 500,02 674,34
+
e (4) =
674,34 1 200,1
0,1753 0,2992
674,34 1 200,1
2
0,00676 0,1753
0,00676 0,6126
1 500,02 674,34
+
0,6126 0,2992
0,1753 0,2992
674,34 1 200,1
1 500,02
674,34
9782100721511-Bourbo-C10.qxd
22/10/14
0,00676
0,6126
0,1753
0,2992
0,00676
0,6126
0,1753
0,2992
10:25
2
+
3
=
Page 284
0,00676
0,1753
2 067,67
1 064,00
0,6126
0,2992
3
1 064,00
1 505,73
1 500,02
674,34
674,34
1 200,1
i=0
avec : = (I A1 A2 . . . A p )1 A0
min( p,i )
et Mi =
A j Mi j i = 1,2,. . . et M0 = I
j =1
284 CONOMTRIE
Mi ti
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 285
Sous cette forme, la matrice M apparat comme un multiplicateur dimpact , cest--dire que cest au travers de cette matrice quun choc se rpercute
tout le long du processus. Une variation un instant donn t de t affecte toutes
les valeurs suivantes de Yt , leffet dun choc (ou dune innovation) est donc permanent et va en samortissant.
Une variation un instant donn de e1t a une consquence immdiate sur y1t
puis sur y2t+1 et y2t+1 , par exemple sil se produit en t un choc sur e1t gal 1,
nous avons limpact suivant :
1
0
y1t+1
0,00676 0,6126
1
0,0067
=
=
la priode t + 1 :
0,1753 0,2992
0
0,175
y2t+1
y1t+2
0,00676 0,6126
0,0067
0,107
=
=
la priode t + 2 :
y2t+2
0,1753 0,2992
0,175
0,054
En t :
y1t
y2t
etc.
Les diffrentes valeurs ainsi calcules constituent la fonction de rponse
impulsionnelle . Dans ce schma, nous faisons lhypothse que les rsidus e1t et
e2t sont indpendants entre eux. Or, cette hypothse est rarement vrifie ; en
effet, nous avons montr en section I., quil peut exister une corrlation entre les
erreurs 1t et de 2t , cette corrlation pouvant tre mesure laide des rsidus
destimation : e1 e2 =
Cov(e1 ,e2 )
.
e1 e2
e1 e2 =
9782100721511-Bourbo-C10.qxd
04/11/14
8:22
Page 286
y1t
1
2
y2t
y1t
y2t
1,000
0,000
0,530
1,000
0,007
0,175
0,616
0,387
0,107
0,054
0,241
0,224
0,034
0,035
0,139
0,109
0,022
0,016
0,068
0,057
0,010
0,009
0,035
0,029
0,005
0,004
0,018
0,015
0,003
0,002
0,009
0,008
0,001
0,001
0,005
0,004
10
0,001
0,001
10
0,002
0,002
11
0,000
0,000
11
0,001
0,001
12
0,000
0,000
12
0,001
0,001
286 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 287
Nous remarquons que, sous cette forme, nous avons fait apparatre dans la
deuxime quation la causalit instantane entre y2,t et y1,t telle quelle existait
dans le VAR structurel (cf. I. A.). Cependant, la causalit instantane entre y1,t et
y2,t napparat pas dans la premire quation. Dans cette procdure dorthogonalisation, les rsidus sont indpendants, nous pouvons faire apparatre soit une
causalit instantane entre y2,t et y1,t soit une causalit instantane entre y1,t et
y2,t mais pas les deux la fois : il sagit de lordre de dcomposition.
La gnralisation un modle VAR k variables ncessite le recours des
procdures dorthogonalisation1 de matrice et savre donc complexe. Il
convient de noter que les rsultats sont influencs par le choix de lquation servant de base la transformation. Les rsultats sont diffrents si la transformation
affecte y1t la place de y2t , cest pourquoi le choix2 de lordre des variables
modifie les rsultats obtenus.
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 288
C. Dcomposition de la variance
La dcomposition de la variance de lerreur de prvision a pour objectif de calculer pour chacune des innovations sa contribution la variance de lerreur. Par
un technique mathmatique1, on peut crire la variance de lerreur de prvision
un horizon h en fonction de la variance de lerreur attribue chacune des
variables ; il suffit ensuite de rapporter chacune de ces variances la variance
totale pour obtenir son poids relatif en pourcentage.
Reprenons notre modle VAR(1) deux variables y1t et y2t , la variance de
lerreur de prvision pour y1t+h peut scrire :
y21 (h) = 21 m 211 (0) + m 211 (1) + . . . + m 211 (h 1)
+22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)
22 m 222 (0) + m 222 (1) + . . . + m 222 (h 1)
y21 (h)
1. La matrice
tant toujours dfinie positive, la dcomposition de Cholesky permet de diagonaliser la matrice des variances covariances de lerreur de prvision, et ainsi didentifier les
variances propres chacune des variables. Nous ne pouvons pas aborder dans le cadre de ce
manuel cette technique, le lecteur peut se rfrer Hamilton J. D. (1994) pour tous les complments mathmatiques.
288 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 289
tion qui fournit des rsultats dissymtriques en fonction de lordre des variables.
Le problme est plus complexe si le nombre de variables est important.
Prenons lexemple dun VAR 4 variables Y1, Y2, Y3 et Y4.
Si nous choisissons lordre de dcomposition de Cholesky suivant : Y3 Y2
Y1 Y4, cela entrane :
un choc en priode 1 sur Y3 (la variable la plus exogne) a un impact sur
lensemble des quatre variables ;
un choc en priode 1 sur Y2 a un impact sur Y2, Y3 et Y4, absence de corrlation contemporaine avec Y3 ;
un choc en priode 1 sur Y1 a un impact sur Y1 et Y4, absence de corrlation contemporaine avec Y3 et Y2 ;
et, enfin, un choc en priode 1 sur Y4 (la moins exogne) na un impact que
sur elle-mme, absence de corrlation contemporaine avec Y3, Y2 et Y1.
Le tableau 3 illustre cet exemple de dcomposition et danalyse des chocs.
Nous ne prsentons que les deux premires priodes.
Tableau 3 Exemple de dcomposition Y3, Y2, Y1, Y4
Cholesky Ordering : Y3 Y2 Y1 Y4
Response of Y1 :
Period
Y1
Y2
Y3
Y4
1.603662
1.022459
1.402923
0.000000
0.395786
0.151091
0.488095
0.275476
Response of Y2 :
Period
Y1
Y2
Y3
Y4
0.000000
5.434671
4.125310
0.000000
0.875767
1.251545
0.115017
0.105811
Response of Y3 :
Period
Y1
Y2
Y3
Y4
0.000000
0.000000
4.544690
0.000000
0.241257
0.954324
1.584595
0.476602
Response of Y4 :
Period
Y1
Y2
Y3
Y4
0.768803
1.686351
2.315711
2.091513
0.129818
1.104756
0.927459
0.186928
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 290
Exercice n 3
fichier C10EX2
2Cov(e1t ,e2t )
[Cov(e1t ,e2t )]2
Var(e2t )
Cov(e1t ,e2t ) +
Var(e2t )
[Var(e2t )]2
Var(v1,t ) = Var(e1t )
290 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 291
Rponse de Y2 :
Priode
1
2
3
4
5
6
7
8
9
10
33,48254
0,226363
3,596584
1,124479
0,723007
0,339717
0,180128
0,090912
0,046797
0,023898
19,46591
21,35271
8,585080
4,876681
2,396789
1,247217
0,634172
0,325462
0,166407
0,085211
1
2
3
4
5
6
7
8
9
10
0,000000
5,868694
1,795947
1,167853
0,546587
0,290298
0,146419
0,075390
0,038496
0,019723
34,64208
13,77894
7,866119
3,858783
2,009549
1,021480
0,524297
0,268057
0,137265
0,070245
30
30
20
10
20
10
10
0
20
30
1
5
Y1
10
1
10
Y2
5
Y1
10
Y2
44,22659
45,19547
45,47172
45,54058
45,55892
45,56369
45,56494
45,56527
45,56536
Dcomposition de la variance de Y2 :
Priode
SE
Y1
Y2
1
34,64208 0,000000 100,0000
57,31782 42,68218
2
37,74089
55,51993 44,48007
3
38,59373
54,90856 45,09144
4
38,80374
54,76783 45,23217
5
38,85958
54,72930 45,27070
6
38,87409
54,71940 45,28060
7
38,87790
54,71679 45,28321
8
38,87889
54,71611 45,28389
9
38,87916
54,71593 45,28407
10
38,87922
Ordre : Y2 Y1 (Y2 est la cause de Y1)
2,418013
2,528876
2,592156
2,604496
2,608129
2,609036
2,609278
2,609341
2,609358
97,58199
97,47112
97,40784
97,39550
97,39187
97,39096
97,39072
97,39066
97,39064
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 292
IV. La causalit
Au niveau thorique, la mise en vidence de relations causales entre les
variables conomiques fournit des lments de rflexion propices une meilleure comprhension des phnomnes conomiques. De manire pratique, the
causal knowledge est ncessaire une formulation correcte de la politique
conomique. En effet, connatre le sens de la causalit est aussi important que
de mettre en vidence une liaison entre des variable conomiques.
y1t
y2t
1
a0
a
=
+ 12
b0
a1
b11
b12
1
y1t1
a
+ 22
y2t1
a2
b21
b22
y1t2
+ ...
y2t2
1
a b1p
y1t p
+ p2
+ 1t
a p b2p
y2t p
2t
Le bloc de variables (y2t1 ,y2t2 ,. . . ,y2t p ) est considr comme exogne par
rapport au bloc de variables (y1t1 ,y1t2 ,. . . ,y1t p ) si le fait de rajouter le bloc y2t
namliore pas significativement la dtermination des variables y1t . Ceci consiste effectuer un test de restrictions sur les coefficients des variables y2t de la
reprsentation VAR (not RVAR = Restricted VAR). La dtermination du retard
p est effectue par les critres AIC ou SC (cf. II.B). Soit :
y2t ne cause pas y1t si lhypothse suivante est accepte H0 :
b11 = b21 = . . . = b1p = 0 .
y1t ne cause pas y2t si lhypothse suivante est accepte H0 :
a12 = a22 = . . . = a p2 = 0 .
Si nous somme amens accepter les deux hypothses que y1t cause y2t et
que y2t cause y1t , on parle de boucle rtroactive feedback effect .
1. Le terme de prdictibilit semble prfrable au terme de causalit ; en effet, dire que yt cause
xt , signifie seulement quil est prfrable de prdire xt en connaissant yt que sans le connatre.
292 CONOMTRIE
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 293
Ces tests peuvent tre conduits laide dun test de Fisher classique (cf. chapitre 3, test de Wald) de nullit des coefficients, quation par quation ou bien
directement par comparaison entre un modle VAR non contraint (UVAR) et le
modle VAR contraint (RVAR). On calcule le ratio de vraisemblance suivant :
L = (n c) Ln| RVAR | Ln| UVAR | qui suit un 2 2 p degrs de
libert avec :
RVAR = matrice des variances covariances des rsidus du modle contraint,
UVAR = matrice des variances covariances des rsidus du modle non contraint,
n = nombre dobservations,
c = nombre de paramtres estims dans chaque quation du modle non
contraint.
Si L > 2 lu dans la table, alors on rejette lhypothse de validit de la
contrainte.
p
a1i1 y1ti +
i=1
y2t = a20 +
p
p
a1i2 y2ti +
i=1
a2i1 y1ti +
i=1
p
p
bi2 y2t+i + 1t
i=1
a2i2 y2ti +
i=1
p
bi1 y1t+i + 2t
i=1
Exercice n 4
fichier C10EX2
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 294
Solution
Nous procdons au test de Fisher quation par quation.
Test de Granger
H0 : y2t ne cause pas y1t
Nous estimons les modles suivants :
y1t = 0,006760 y1t1 0,6125 y2t1 + 17,129632 + e1t
R 2 = 0,28 ; n = 71 ; SC RU = 106500,2 (non contraint)
y1t = 0,2359 y1t1 + 26,9448 + e1t
R 2 = 0,067 ; n = 71 ; SC R R = 13792,6 (contraint)
F =
(SC R R SC RU )/c
137924,6 106500,2)/1
=
= 20,064
SC RU/(n k 1)
106500,2/(71 2 1)
Ou bien :
L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,44 14,11) = 23,29
> 2 (2) = 5,99 , on rejette lhypothse de validit de la contrainte.
H0 : y1t ne cause pas y2t
(SC R R SC RU )/c
(89452,77 85205,25)/1
=
= 3,389
SC RU/(n k 1)
85205,22/(71 2 1)
0.05
4 , on accepte lhypothse H0, y1t nexplique pas significativement la
F < F1;68
variable y2t , il ny a donc pas causalit au sens de Granger de y1t vers y2t .
Ou bien :
L = (n c)(Ln| RV AR | Ln| U V AR |) = (71 1)(14,17 14,11) = 4,52
< 2 (2) = 5,99 , on accepte lhypothse de validit de la contrainte.
Ce rsultat ne doit pas nous surprendre puisque y1t est la variable reprsentative de la
demande et y2t du prix.
Test de Sims
H0 : y1t ne cause pas y2t
Nous estimons les modles suivants (sur la mme priode de 78:2 95:3) :
y1t = 0,01435 y1t1 0,579 y2t1 0,357 y2t+1 + 8,713 + e1t
R 2 = 0,37 ; n = 70 ; SC RU = 92676,66 (non contraint)
y1t = 0,007654 y1t1 0,6145 y2t1 + 16,714 + e1t
R 2 = 0,28 ; n = 70 ; SC R R = 105952,6 (contraint)
294 CONOMTRIE
9782100721511-Bourbo-C10.qxd
F =
22/10/14
10:25
Page 295
(105952,6 92676,66)/1
= 9,45
92676,66/(70 3 1)
0.05
F > F1;66
4 , on rejette lhypothse H0, y2t+1 explique significativement la
variable y1t , il y a donc causalit au sens de Sims de y1t vers y2t .
(84586,73 63742,31)/1
= 21,58
84586,73/(70 3 1)
0.05
F > F1;66
4 , on refuse lhypothse H0, y1t+1 explique significativement la
variable y2t , il y a donc causalit au sens de Sims de y2t vers y1t .
Nous observons une divergence dans ces tests, en ce qui concerne la causalit de y1t
sur y2t ; le test de Granger nous fait rejeter lhypothse de causalit et celui de Sims laisse prsager dun lien de causalit de type feedback : les prix de la priode suivante
influencent la demande de la priode actuelle, sagit-il dune anticipation des agents ?
9782100721511-Bourbo-C10.qxd
22/10/14
10:25
Page 296
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 297
11. La cointgration
et le modle
correction derreur
I. Exemples introductifs
Premier exemple
Soit les variables yt et xt dfinies de la manire suivante :
y1 = 1 avec comme variable explicative : x1 = 1
y2 = 2 avec comme variable explicative : x2 = 22
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 298
Deuxime exemple
On gnre deux processus alatoires :
yt = yt1 + 1t avec t N 0; 21
xt = xt1 + 2t avec t N 0; 22
Sur 1 000 rgressions, nous obtenons les rsultats suivants : 670 sont significatives daprs la statistique du t de Student, cependant la statistique de DW
est toujours faible (la moyenne sur les 1 000 rgressions est : DW = 0,33 ).
Donc apparemment, ces rgressions donnent de bons rsultats (hormis la statistique DW ). Mais ces rsultats sont purement fortuits : ils dcoulent de la corrlation entre les sries qui sont affectes dune tendance stochastique. En effet, si
on passe en diffrences premires (yt = f (xt ) ), plus aucune rgression nest
significative.
yt = yt yt1 = 1t
xt = xt xt1 = 2t
1. Cela souligne limportance ne pas oublier dinterprter la statistique de Durbin et Watson.
298 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 299
En rgressant une srie non stationnaire (de type DS) sur une autre srie du
mme type, on obtient des coefficients significatifs mais avec une statistique
DW proche de 0 . Ce deuxime exemple illustre le risque de rgresser entre elles
deux sries affectes dune tendance stochastique. Il faut donc toujours, au pralable, stationnariser des sries non stationnaires ; dans le cas contraire, il existe
un risque de rgression fallacieuse ( spurious regression ).
La srie yt = x1t + x2t est non stationnaire puisque lon somme une srie
affecte dune tendance et une srie stationnaire.
Soit deux sries x1t et x2t intgres dordre d :
x1t I (d)
x1t + x2t I (?)
x2t I (d)
Il savre impossible de conclure car on somme deux sries dordre dintgration diffrent.
1. Cf. le test de Dickey-Fuller du chapitre 9 afin de dterminer lexistence dune tendance stochastique ou dterministe et de rechercher les ordres dintgration dune srie.
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 300
300 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 301
B. Conditions de cointgration
Deux sries xt et yt sont dites cointgres si les deux conditions sont vrifies :
elles sont affectes dune tendance stochastique de mme ordre dintgration d ,
une combinaison linaire de ces sries permet de se ramener une srie
dordre dintgration infrieur.
Soit :
xt I (d)
yt I (d)
1
soit xt yt I (0) ) est le vecteur de cointgration.
2
Dans ce type de spcification, le fait que les sries soient cointgres et non stationnaires soulve un problme destimation. La bonne qualit statistique du
modle ( R 2 lev et coefficients significatifs) est due au fait que les sries sont
non stationnaires (puisque cointgres). En rgression directe de yt sur xt
lorsque yt , xt C I (1, 1) lutilisation de ce modle des fins prvisionnelles
savre dsastreuse ; en effet, la relation mise en vidence par cette rgression
nest pas relle, elle dcoule simplement dune relation entre deux tendances1.
Le problme est donc, dune part de retirer la relation commune de cointgration (la tendance commune), dautre part, de rechercher la liaison relle entre
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 302
302 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 303
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 304
Soit les sries yt et xt I (1) , lestimation par les MCO de la relation de long
terme indique une stationnarit du rsidu. Les sries yt et xt sont donc notes :
CI(1, 1).
Nous pouvons, ds lors, estimer le modle correction derreur.
(ECM)
[1]
Exercice n 1
fichier C11EX1
304 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 305
xt
1
2
29
30
0,000
2,851
6,744
7,270
yt
10,890
12,188
12,347
15,194
Solution
La premire tape consiste tudier les proprits des deux sries en termes de stationnarit. Le tableau 2 prsente les rsultats des tests :
de Dickey-Fuller (aucun retard nest significatif dans lventualit dun test de
Dickey-Fuller Augment),
de Phillips-Perron (troncature = 2),
et de KPSS (troncature = 2).
Ces tests sont prsents au chapitre 9.
Tableau 2 Rsultats des tests de Dickey-Fuller, Phillips-Perron et KPSS
Test
Type de Modle
xt en niveau t statistique
yt en niveau t statistique
Test DF
Test DF
Test DF
[1]
[2]
[3]
0,81
0,05
0,82
0,17
2,67
3,05
Test PP
Test PP
Test PP
[1]
[2]
[3]
0,88
0,11
0,80
0,62
2,60
2,96
xt en niveau
LM statistique
yt en niveau
LM statistique
0,53
0,22
0,39
0,20
Test KPSS
Test KPSS
[2]
[3]
La comparaison des t1 calculs aux t lus (Tables de MacKinnon) ou des LM statistiques aux valeurs critiques indique que les deux sries xt et yt sont non stationnaires en
niveau1. Des tests similaires sur les diffrentes premires de xt et yt indiquent quelles
sont stationnaires, les deux sries tudies sont I (1), il existe donc un risque de cointgration.
Le test de cointgration est effectu partir du rsidu destimation du modle :
yt = a1 xt + a0 + t
Soit : yt = 0,55xt + 10,38 + et
(6,3)
n = 30 ;
(41,46)
R 2 = 0,58 ;
(.) = t de Student.
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 306
Nous pouvons vrifier que le rsidu est bien stationnaire, il existe donc un risque de
cointgration entre les deux variables.
Test PP (l = 2)
Test DF
et
Modle [1]
Modle [2]
Modle [1]
Modle [2]
t1
5,39
5,30
5,42
5,31
R 2 = 0,60 ;
(.) = t de Student.
Le coefficient (terme de rappel) de et1 est bien significativement ngatif, la reprsentation correction derreur est valide.
si les variables ( yt et xkt ) sont non stationnaires, I (1) par exemple, il existe alors
un risque de cointgration. En effet, lexistence dune ventuelle cointgration
implique que les variables doivent tre non stationnaires1. Comme dans le cas
1. Gnralement, en conomie, les variables sont I (1) ; cependant certaines sries financires
peuvent tre de type I (2) .
306 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 307
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 308
avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables ( y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).
[3]
[4]
308 CONOMTRIE
[5]
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 309
[6]
[7]
Ou encore :
avec : A2 = B1 et = (A1 + A2 I ).
Ce rsultat peut tre gnralis une reprsentation VAR(p) k variables
sous forme matricielle :
Yt = A0 + A1 Yt1 + A2 Yt2 + . . . + A p Yt p +
avec :
Yt : vecteur de dimension (k 1 ) constitu des k variables (y1t ,y2t . . . ,ykt ) ,
A0 : vecteur de dimension (k 1 ),
Ai : matrice de dimension (k k ).
avec et = Yt.
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 310
Deuxime rgression :
+ A
Yt1 + A
Yt2 + . . . + A
Yt p + vt
Yt1 = A
0
1
2
p
y1,t
y2,t
Avec Yt = . . .
...
yk,t
1. Johansen, 1988.
310 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 311
n
u t u t
t=1
vv = (1/n)
n
vt vt
t=1
uv = (1/n)
n
u t vt
t=1
vu = (1/n)
n
vt u t
t=1
1) Test de la trace
A partir de ces valeurs propres, on calcule une statistique :
k
trace = n
Ln (1 i ) avec n = nombre dobservations, i = i me valeur
i =r +1
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 312
Pour mener ce test, Johansen propose cinq spcifications concernant soit les
vecteurs cointgrants soit les sries (le VAR proprement dit) :
Absence de tendance linaire dans les donnes (les sries sont toutes DS sans
drive) :
a) Absence dune tendance linaire dans les sries et dune constante dans les
relations de cointgration (la constante dans la relation de long terme est non
significative).
Exemple : y1,t1 = b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 ) + t1
b) Absence dune tendance linaire dans les sries mais prsence dune constante dans les relations de cointgration (la constante dans la relation de long
terme est significative).
Exemple : y1,t = b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
Prsence dune tendance linaire dans les donnes (au moins une srie est un
DS avec drive) :
c) Prsence dune tendance linaire dans les sries et dune constante dans les
relations de cointgration.
Ex. : y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 ) + t1
d) Prsence dune tendance linaire dans les sries et dans les relations de cointgration (au moins une srie est un TS).
Ex : y1,t = a01 + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 + ct) + t1
Prsence dune tendance quadratique dans les donnes :
e) Prsence dune tendance quadratique dans les sries et dune tendance linaire dans les relations de cointgration.
Ex : y1,t = a01 + bt + b11 y1,t1 + b21 y2,t1 + b31 y3,t1
+ 1 (y1,t1 2 y2,t1 3 y3,t1 0 + ct) + t1
Le choix dune de ces spcifications seffectue en fonction des donnes et de la
forme suppose de la tendance (une analyse des proprits stochastiques des
sries ou un simple examen visuel des graphiques permettent de se dterminer).
Le tableau 3 synthtise le choix de la spcification du VECM en fonction de
la typologie des processus.
312 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 313
Spcification
r = 0,1,2
Le test seffectue comme prcdemment de manire squentielle par exclusion dhypothses alternatives.
En cas de divergence des deux tests (valeur propre maximum et trace), nous
privilgions le test de la trace dont la puissance est la plus leve.
y1t
y1t1
11
y2t = A y2t1 + 21
y3t
y3t1
31
12
11
22
12
32
21
22
31
32
y1t1
y2t1
y3t1
Pour tester lexognit de la variable y2t , il convient deffectuer le test dhypothse H0 : 21 = 22 = 0 , si lhypothse H0 est accepte cela signifie que la
force de rappel nintervient dans aucune relation de cointgration et donc que
la variable y2t est faiblement exogne. Dans ce cas nous estimons un VECM partiel en imposant la contrainte 21 = 22 = 0 .
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 314
Exercice n 2
fichier C11EX2
314 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 315
20,00
20,00
30,00
21,39
17,05
31,40
29
26,04
24,61
31,84
30
26,70
23,25
32,22
Le calcul des critres dinformation AIC et SC pour des retards allant de 1 3 nous
nallons pas plus loin compte tenu du faible nombre dobservations ne pose pas de difficult.
AIC(1) = 2,45 ;
SC(1) = 2,88
AIC(2) = 1,93 ;
SC(2) = 2,78
AIC(3) = 2,04 ;
SC(3) = 3,34
Le retard retenu est donc de 2 (minimum des critres AIC et SC), nous allons donc
procder au test de Johansen sur un VECM(1 ).
Deuxime tape : Test de Johansen
Nous procdons au test de Johansen sous deux hypothses :
a) Existence dune constante dans la relation de long terme et non dans les donnes
(pas de tendance dterministe), spcification b.
Dtaillons ce premier cas.
Premier test : Rang de la matrice gal 0 (r = 0), soit H0 : r = 0 contre H1 : r > 0.
Les trois valeurs propres de la matrice , estime par le maximum de vraisemblance, sont gales 1 = 0,605 ; 2 = 0,257 ; 3 = 0.139.
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 316
k
Ln (1 i ) pour r = 0 :
i=r+1
trace
Seuil critique 5%
Seuil critique 5%
0,603749
37,38888
29,68
35,65
0,229311
11,46904
15,41
20,04
0,138550
4,175870
3,76
6,65
L encore, on constate que le rang de la matrice nest pas 0 (ligne 1), mais quen
revanche, on ne peut pas rejeter lhypothse H0 ni 5 % ni 1 % (ligne 2) dans lhypothse dun rang de la matrice gal 1.
Le test de la valeur propre maximale corrobore les rsultats prcdents :
Hypothesized
No. of CE(s)
Eigenvalue
None *
0.603749
Max-Eigen
0.05
Statistic
Critical Value
25.91984
Prob.**
21.13162
0.0098
At most 1
0.229311
7.293174
14.26460
0.4550
At most 2 *
0.138550
4.175870
3.841466
0.0410
316 CONOMTRIE
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 317
A(2,1) = 0
A(3,1) = 0
Chi-square(1) : 1,275770
Chi-square(1) : 0,001005
Probability : 0,258687
Probability : 0,974714
9782100721511-Bourbo-C11.qxd
22/10/14
10:27
Page 318
1.558967
Probability
0.458643
Cointegrating Eq :
CointEq1
Y1( 1)
0.997283
Y2( 1)
0.797187
Y3( 1)
0.555922
11.94414
Error Correction :
CointEq1
D(Y1( 1))
D(Y2( 1))
D(Y3( 1))
D(Y1)
D(Y2)
D(Y3)
1.187476
0.000000
0.000000
(0.20103)
(0.00000)
(0.00000)
[ 5.90704]
[ NA]
[NA]
0.813973
0.139232
0.527616
(0.26543)
(0.23701)
(0.24591)
[3.06663]
[ 0.58745]
[2.14553]
0.715308
0.372227
0.456821
(0.26279)
(0.23465)
(0.24346)
[ 2.72203]
[ 1.58631]
[ 1.87634]
0.299747
0.097043
0.244642
(0.23644)
(0.21113)
(0.21906)
[ 1.26773]
[ 0.45964]
[ 1.11679]
318 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:28
Page 319
12. Introduction
lconomtrie
des variables
qualitatives
ous avons, lors des chapitres prcdents (chapitre 3, partie 5), utilis des variables explicatives particulires appeles variables
dichotomiques1, dont la caractristique est de prendre deux
valeurs 0 ou 1. Leurs utilisations ne posent aucun problme en tant que
variable explicative, en revanche lorsquelles sont utilises en tant que
variable expliquer la mthode des moindres carrs ordinaires est
dfaillante.
Dans ce chapitre, qui constitue une simple introduction2 lconomtrie
des variables qualitatives, nous allons donc aborder, dans une premire
partie, la problmatique particulire de lconomtrie des variables qualitatives et les problmes rencontrs dans ce type de modlisation. Puis
nous prsentons les modles spcifiques lorsque la variable expliquer
est binaire tels que : dcision dacheter ou de ne pas acheter un produit,
risque de dfaillance de paiement, obtenir un diplme, .... Il sagit des
modles choix binaires (Probit et Logit).
Puis, dans une troisime partie, nous abordons les modles choix multiples (pour quel candidat voter, quel moyen de transport adopter, ..).
Enfin, la quatrime partie est consacre aux variables tronques et censures.
1. Les termes de variables indicatrices, binaires, muettes, ou dummy sont aussi utiliss.
2. Pour des dveloppements, nous recommandons au lecteur de se rfrer au livre de Thomas A.
conomtrie des variables qualitatives , Dunod, 2002.
9782100721511-Bourbo-C12.qxd
22/10/14
10:28
Page 320
i = 1,...,n
[1]
avec :
yi = une variable endogne (variable expliquer) qui prend les valeurs 1 si lindividu i est propritaire de son logement et 0 dans le cas contraire,
xi = une variable exogne (variable explicative) qui reprsente le revenu en
euros de lindividu i ,
i = lerreur de spcification du modle,
a0 et a1 = les paramtres estimer.
Ce modle, appel aussi modle probabilit linaire, prsente les proprits suivantes.
a) En faisant lhypothse classique de lesprance de lerreur nulle :
E(i ) = 0 , alors E(yi ) = a0 + a1 xi .
Soit : Pi = a0 + a1 xi
i , do le nom du modle.
320 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 321
Soit :
[2]
Var(i ) = E(i2 ) = Pi (1 Pi )
[3]
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
y
y ajuste
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 322
b) Puisque lerreur ne peut prendre que deux valeurs, elle suit donc une loi
discrte, lhypothse de normalit des erreurs nest donc pas vrifie.
c) Daprs la relation [3] : E(i2 ) = Pi (1 Pi ) , il existe de fait une htroscdasticit. Cependant nous ne pouvons pas appliquer la mthode des
moindres carrs gnraliss car Pi dpend des paramtres a0 et a1 du modle.
d) Enfin, nous devons imposer une contrainte au modle : 0 Pi =
Tous ces lments indiquent clairement que nous sommes dans limpossibilit dutiliser la mthode des moindres carrs ordinaires.
322 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 323
yi = 1 si yi > 0
yi = 0 si yi 0
Intuitivement, cette rgle de dcision consiste simplement supposer que la proportion des (yi = 1) est leve pour a0 + a1 xi + i > 0 .
Soit Pi la probabilit que yi > 0 .
Pi = Prob(yi = 1) = Prob(yi > 0) = Prob(a0 + a1 xi + i > 0)
= Prob(i > (a0 + a1 xi ))
Si la distribution de i est centre par rapport la moyenne, nous avons
lquivalence :
Prob(i > (a0 + a1 xi )) = Prob(i < a0 + a1 xi )
Soit :
Lensemble de ces rsultats peut tre gnralis dans le cas dun modle
plusieurs variables.
La probabilit Pi dpend ainsi de la distribution du terme de lerreur i du
modle de dcision, nous pouvons alors distinguer deux cas :
le modle Probit si la fonction de rpartition de lerreur suit une loi normale,
le modle Logit si la fonction de rpartition de lerreur suit une loi de type
logistique.
a0 +a1 xi
1
2
et /2 dt
2
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 324
exp(a0 + a1 xi )
1
=
1 + exp(a0 + a1 xi )
1 + exp((a0 + a1 xi ))
xi
xi
1,00
Pi
0,50
0,00
xi
Nous pouvons observer, aprs une transformation analogue celle de lexercice 2 du chapitre 6, que la fonction Logit scrit :
Pi
Ln
1 Pi
choix yi = 1 .
= y = a0 + a1 xi + i avec
Pi
1 Pi
la probabilit relative du
324 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 325
Lestimation des paramtres des modles Probit ou Logit est effectue laide des algorithmes de maximisation dune fonction log-vraisemblance1. Quels
que soient les modles retenus (Probit ou Logit) les rsultats destimation sont
relativement proches, cependant les coefficients estims ne sont pas directement
comparables.
Log(Lu)
.
Log(L R )
1. Cf. Thomas A. conomtrie des variables qualitatives , Dunod, 2002, pages 56-57.
2. Cf. Thomas A. (2002), pages 60-61.
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 326
Exercice n 1
fichier C12EX1
Estimation des modles Probit et Logit binaires explicatifs des facteurs de la russite en Licence
Nous avons relev sur un chantillon de 60 tudiants inscrits en dernire anne de
Licence dconomie, les variables suivantes susceptibles dexpliquer la russite ou
lchec lexamen de Licence (variable REUSSITE = 0 si chec, 1 sinon) :
NENFANTS = variable discrte reprsentant le nombre de frres et soeurs de ltudiant,
NECONO = la note dconomtrie sur 20 obtenue en Licence,
NMICRO = la note de micro-conomie sur 20 obtenue en Licence,
GENRE = variable muette, (1 = masculin, 0 = fminin).
Un extrait des donnes est prsent dans le tableau 1.
REUSSITE
NENFANTS
NECONO
NMICRO
GENRE
3,6
3,8
59
16,2
12
60
17
On demande :
1) destimer un modle de type Logit permettant de prvoir la probabilit de russite
dun tudiant en Licence,
2) de comparer les rsultats avec un modle de type Probit et le modle linaire gnral,
3) de donner la probabilit de russite, laide du modle Logit estim, pour un tudiant dont les caractristiques sont les suivantes : NENFANTS = 1 ; NECONO = 12 ;
NMICRO = 13,5 ; GENRE = masculin.
Solution
1) Une premire estimation dun modle Logit, conduit aux rsultats suivants :
326 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 327
Coefficient
0.682523
0.632062
3.761718
0.155322
3.265634
Std. Error
0.378870
0.239564
1.437068
0.188916
2.020060
z-Statistic
1.801470
2.638382
2.617633
0.822173
1.616602
Prob.
0.0716
0.0083
0.0089
0.4110
0.1060
Coefficient
Std. Error
z-Statistic
NENFANTS
NECONO
GENRE
C
0.746742
0.695857
3.634605
2.859277
0.378942
0.231789
1.410945
1.910377
1.970596
3.002112
2.576008
1.496708
0.516667
0.287086
4.615432
15.37669
41.55549
52.35761
2.51E 11
29
31
Total obs
Prob.
0.0488
0.0027
0.0100
0.1345
0.503939
0.645890
0.785512
0.700504
0.25627
0.629972
60
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 328
a) Interprtation statistique
Les coefficients sont tous significativement diffrents de 0, hormis le terme constant.
La statistique de la Log vraisemblance est gale L R = 52,35 que lon compare
0,95
26
3
29
26
89.66
10.34
89.66
89.66
4
27
31
27
87.10
12.90
12.90
NA
30
30
60
53
88.33
11.67
36.67
75.86
Constant Probability
Dep = 0 Dep = 1
Total
0
29
29
0
0.00
100.00
0
31
31
31
100.00
0.00
0
60
60
31
51.67
48.33
Ici, pour les individus (29) pour lesquels yi = 0, le modle indique que 26 individus
ont une probabilit estime de russite infrieure 50 %. Dans 89,66 % des cas, les
checs sont donc correctement prvus.
Pour les individus (31) pour lesquels yi = 1, le modle indique que 27 individus ont
une probabilit estime suprieure 50 %. Dans 87,10 % des cas, les russites sont correctement prvues.
Le taux derreur est donc faible.
b) Interprtation conomique
Le modle scrit :
Pi
Ln
= 0,75 NENFANTS + 0,70 NECONO 3,63 GENRE 2,86 + ei
1 Pi
(1,97)
(3,00)
(2,57)
(.) = z-Statistique
ei = Rsidu destimation
Le nombre de frres et soeurs du foyer agit ngativement, les tudiants issus de
familles nombreuses ont un taux de russite plus faible.
La note dconomtrie est un facteur positif de russite.
328 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 329
Enfin, les tudiants de genre masculin russissent en gnral moins bien (signe
ngatif) que les tudiants de genre fminin.
2) Estimation dun modle Probit et du modle linaire gnral
a) Lestimation dun modle Probit conduit aux rsultats suivants :
Coefficient
Std. Error
z-Statistic
NENFANTS
NECONO
GENRE
C
0.428197
0.363148
1.824203
1.491466
0.219223
0.110230
0.650426
1.108767
1.953247
3.294454
2.804629
1.345157
Prob.
0.0508
0.0010
0.0050
0.1786
Les valeurs des coefficients sont de mme signe mais diffrentes par rapport au
modle Logit car la spcification nest pas la mme. Cependant, nous pouvons retrouver,
approximativement, les valeurs estimes du modle Logit
en multipliant chacun des
coefficients des variables explicatives par la constante1 3 1,81.
b) Sans tenir compte des spcificits du modle variable expliquer binaire et en
utilisant une mthode (non approprie) des moindres carrs avec correction pour htroscdasticit, nous obtenons les rsultats suivants :
Coefficient
Std. Error
t-Statistic
NENFANTS
NECONO
GENRE
C
0.078499
0.066672
0.295568
0.217243
0.037854
0.016580
0.092934
0.235111
2.073727
4.021299
3.180407
0.924003
R-squared
Durbin-Watson stat
0.611335
1.741795
F-statistic
Prob(F-statistic)
Prob.
0.0427
0.0002
0.0024
0.3594
29.36094
0.000000
Les coefficients sont affects du mme signe que dans les modles Probit et Logit,
cependant le graphique des valeurs ajustes (cf. graphique 3) indique que les valeurs sont
parfois ngatives ou suprieures 1 ce qui est videmment incompatible avec la valeur
dune probabilit.
1. Une littrature abondante concerne la comparaison entre les modles Probit et Logit, cf.
Amemiya T., 1981.
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 330
1,4
1,2
1
0,8
0,6
0,4
0,2
0
1
3 5 7
9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
0,2
0,4
Srie brute
Srie ajuste
Borne1
Pi
= 0,75 1 + 0,70 12 3,63 1 2,86 = 1,109
Ln
1 Pi
i
P
= e1,109 = 3,033 Pi = 3,033/(1 + 3,033) = 0,75
1 Pi
La probabilit de russite de cet tudiant de licence est donc de 75 %.
330 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 331
yi = 0 si yi c1
yi = 1 si c1 < yi c2
yi = 2 si c2 < yi c3
.. ..
. = .
yi = M si c M < yi
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 332
tique (t) =
et
1 + et
et
M
Pi = 1
i=0
Comme pour le modle de choix binaire, le recours une fonction de rpartition normale, permet de dfinir un modle de type Probit et une fonction de
rpartition de type logistique permet de dfinir un modle Logit. Lestimation de
tous les paramtres, les coefficients de rgression ( ai ) et les valeurs des seuils
(ci ) des modles ordonns (Probit ou Logit) est effectue laide des algorithmes de maximisation dune fonction de Log-vraisemblance dfinie par les
Pi j .
Les valeurs des coefficients des modles ne sont pas directement interprtables en termes de propension marginale, seuls les signes des coefficients indiquent si la variable agit positivement ou ngativement sur la variable latente.
Les rsultats destimation sapprcient de la mme manire que pour les
modles de choix binaires :
la significativit des coefficients laide des ratios z -Statistique,
la significativit globale de lajustement (lhypothse : H0 : a1 = a2 = a3
= . . . = ak = 0) par la statistique L R = 2(Ln(L R ) Ln(L U )) qui suit,
sous lhypothse nulle H0, une distribution dun 2 k degrs de libert.
Le pseudo- R 2 est donn par : R 2 = 1
Log(Lu)
.
Log(L R )
Exercice n 2
fichier C12EX2
Estimation dun modle choix multiples de prvision des ventes
La socit Tl-Ventes (ventes par tlphone lors dune mission la tlvision)
dsire estimer le niveau des ventes par article pour chaque mission afin de dimensionner la charge de lentrept et prvoir ainsi le nombre dquipes.
Lmission est diffuse tous les jours sauf le dimanche. Les ventes sont rparties en
trois classes : faible, moyenne, forte.
Lobjectif est destimer un modle permettant de prvoir quelle classe de vente
(faible, moyenne, forte) appartient un article prsent lors dune mission. Pour ce faire,
on dispose des informations suivantes sur 82 missions passes :
VENTES : classe de larticle (faible = 0, moyenne = 1, forte = 2 ),
WE : variable indicatrice du type de jour de diffusion de lmission (1 les jours de
semaine, 0 le samedi),
EXPO : temps dexposition du produit en minutes,
REDUC : % de rduction propos sur le prix,
DIRECT = variable indicatrice dmission enregistre (0 pas direct, 1 direct).
Un extrait des donnes est prsent dans le tableau 2.
332 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 333
VENTES
WE
EXPO
REDUC
DIRECT
3,5
0,20
3,5
0,20
81
82
3,5
DIRECT
EXPO
REDUC
WE
Coefficient
Std. Error
z-Statistic
0.226809
0.644804
8.922215
1.395159
1.325269
0.150121
2.759073
0.512093
0.171142
4.295228
3.233772
2.724426
Prob.
0.8641
0.0000
0.0012
0.0064
Nous constatons que la variable DIRECT dont le coefficient est affect dune probabilit critique de 0,86 nest pas significative (les tlspectateurs ne sont pas sensibles aux
missions diffuses en direct), elle est donc retire du modle. La nouvelle estimation est
alors la suivante.
Dependent Variable : VENTES
Method: ML Ordered Logit (Quadratic hill climbing)
Included observations: 82 after adjusting endpoints
Coefficient
EXPO
REDUC
WE
0.641023
8.982926
1.377785
Std. Error
z-Statistic
0.148189
4.325700
2.735164
3.284237
0.500824
2.751038
Limit Points
LIMIT_1:C(4)
3.679581
0.994565
3.699689
LIMIT_2:C(5)
6.170926
1.174856
5.252497
Akaike info criterion
1.605306
Schwarz criterion
Log likelihood
60.81754
Hannan-Quinn criter.
Restr. log likelihood 79.48219
Avg. log likelihood
LR statistic (3 df)
37.32930
LR index (Pseudo-R2)
Probability(LR stat)
3.92E-08
Prob.
0.0000
0.0010
0.0059
0.0002
0.0000
1.752057
1.664224
0.74167
0.234828
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 334
a) Interprtation statistique
Les coefficients sont maintenant tous significativement diffrents de 0 (probabilits
critiques infrieures 0,05).
que lon compare un
La statistique de la Log vraisemblance est gale L R = 37,33 0,95
2 lu dans la table un seuil de 0,95 % et 3 degrs de libert, 32 < 37,33 rejet
de H0.
Le modle est donc valid sur le plan statistique.
b) Interprtation conomique
La dure dexposition et le pourcentage de rduction agissent positivement sur les
ventes.
Une mission diffuse un jour de semaine engendre moins de ventes quune mission diffuse le samedi.
Les seuils c1 et c2 sont respectivement de 3,679 et 6,170.
Les signes des coefficients sont conformes lintuition conomique.
Le logiciel Eviews propose une table permettant dapprhender les qualits prvisionnelles du modle sur lchantillon :
Dependent Variable : VENTES
Method: ML Ordered Logit (Quadratic hill climbing)
Included observations: 82 after adjusting endpoints
Prediction table for ordored dependent variable
Value
Count
Count of obs
with Max Prob
Error
Sum of all
Probabilities
Error
0
1
2
44
27
11
47
31
4
3
4
7
44.381
26.834
10.785
0.381
0.166
0.215
334 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 335
obs
VENTES
VENTES_0_0
0.7342647
0.2366418
0.0290935
2.663212
0.4106169
0.4831615
0.1062216
4.040996
0.4106169
0.4831615
0.1062216
4.040996
0.4106169
0.4831615
0.1062216
4.040996
0.7342647
0.2366418
0.0290935
2.663212
e0,57
= 0,639
1 + e0,57
(c1 xi a)
= (6,17 3,109) 0,639
P2 = Prob(yi = 1) = (c2 xi a)
P2 = (3,06) 0,639 =
e3,06
0,639 = 0,955 0,639 = 0,31
1 + e3,06
VENTES = 1
VENTES = 2
0,639
0,316
0,045
Pi
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 336
exp(xi
a j )
1
=
M
M
exp(xi
ak )
1+
exp(xi
(ak a j )
k=0
k=
/j
k=0
1
1 + exp(x (a1 a0 )) + exp(xi
(a2 a0 ))
Prob(yi = 1) =
1
1 + exp(xi
(a0 a1 )) + exp(xi
(a2 a1 ))
Prob(yi = 2) =
1
1 + exp(xi
(a0 a2 )) + exp(xi
(a1 a2 ))
2
i=0
336 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 337
Irrelevant Alternative . Cette proprit est vrifie1 si le fait de changer lensemble des choix (par exemple ajouter une possibilit) ne modifie pas les ratios
de chances.
Lestimation des paramtres du modle est effectue laide des algorithmes
de maximisation de la fonction log-vraisemblance. Les valeurs des coefficients
ne sont pas directement interprtables en termes de propension marginale, seuls
les signes des coefficients indiquent si la variable agit positivement ou ngativement sur la probabilit relative de choisir j plutt que 0.
Les rsultats destimation sapprcient de la mme manire que pour les
autres modles :
la significativit des coefficients laide des ratios z -Statistique,
la significativit globale de lajustement (lhypothse : H0 : a1 = a2 = a3
= . . . = ak = 0) par la statistique L R = 2(Ln(L R ) Ln(L U )) qui suit,
sous lhypothse nulle H0, une distribution dun 2 k degrs de libert.
Le pseudo- R 2 est donn par : R 2 = 1
Log(Lu)
.
Log(L R )
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 338
yi = yi si yi > 0
yi = 0 si yi 0
Lorsque les valeurs de yi sont nulles ou ngatives, yi est gale 0 mais lon
connat nanmoins les valeurs des variables explicatives. Les donnes dans ce
type de modle sont dites censures gauche, yi suit alors une loi normale censure.
Comme pour les moindres carrs ordinaires :
E(yi ) = xi a mais E(yi /yi > 0) =
/ xi a et E(yi ) =
/ xi a .
yi = yi si yi > c1
yi = c1 si yi c1
y = xi a + i avec i N (0,2 ) .
338 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 339
Soit la fonction de rpartition de la loi de probabilit des erreurs (normale ou logistique) et la fonction de densit associe. Nous avons :
c1 xi a
yi xi a
c1 xi a
=
1
ci xi a
c1 xi a
Prob(yi > c1 ) = Prob(yi = y1 ) =
=1
E(yi /yi = c1 ) = c1
[(c1 xi a)/ ]
Soit :
E(yi ) =
c1 xi a
c1 xi a
c1 + 1
[(c1 xi a)/ ]
xi a +
=
/ xi a
1 [(c1 xi a)/ ]
[4]
[5]
yi = c1
yi = yi
yi = c2
si yi c1
si c1 < yi c2
si c2 < yi
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 340
Le modle de Tobit deux seuils scrit laide dune dmonstration analogue la prcdente :
yi = x a
yi = c1 ((c1 yi )/ ) + c2 (1 ((c2 yi )/ ))
+ (((c2 yi )/ ) ((c1 yi )/ ) > 0)
( yi (((c2 yi )/ ) ((c1 yi )/ )) +
(((c2 yi )/ ) + ((c1 yi )/ )))
[6]
Exercice n 3
fichier C12EX3
340 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 341
Soit les donnes quotidiennes sur 60 jours (cf. un extrait dans le tableau 3) dont cet
oprateur dispose.
Tableau 3 Extrait de donnes
Jour
1
2
59
60
61
62
y
2717
2126
2683
3000
x1
0
0
0,1
0
1
0
x2
61
32
61
79
98
60
x3
0
0
0
0
1
0
On demande :
1) destimer un modle Logit permettant de prvoir la demande quotidienne partir des
facteurs explicatifs proposs et de commenter les rsultats ;
2) de comparer les rsultats avec lestimation par la mthode, non adapte, des moindres
carrs ordinaires ;
3) deffectuer une prvision pour les jours 61 et 62 sachant que :
x1,61 = 1 ; x2,61 = 98 ; x3,61 = 1 et x1,62 = 0 ; x2,62 = 60 ; x3,62 = 0.
Solution
1) La consommation est censure car les valeurs de la variable expliquer (la demande)
ne sont pas connues lorsquelles sortent de lintervalle [0 ; 3 000] puisque au-del de
3 000, la demande ne peut tre satisfaite.
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 342
Pour estimer le modle Tobit, le logiciel Eviews (cf. figure 1) permet de paramtrer
les seuils de censure gauche (c1 = 0) et droite (c2 = 3 000) et de choisir la distribution de lerreur (ici normale). Nous ne slectionnons donc pas loption distribution tronque puisque la distribution est censure.
Les rsultats destimation sont les suivants :
Dependent Variable : Y
Method: ML Censored Normal (TOBIT) (Quadratic hill climbing)
Included observations: 60 after adjustments
Left censoring (value) series: 0
Right censoring (value) series: 3000
Coefficient
Std. Error
z-Statistic
Prob.
X1
X2
X3
C
27.69316
20.50361
186.2357
1473.642
7.582649
3.652175
0.480937
42.63261
34.88046
5.339256
23.60984
62.41642
Error Distribution
0.0003
0.0000
0.0000
0.0000
SCALE: SIG
R-squared
S.E. of regression
Sum squared resid
Log likelihood
Avg. log likelihood
Left censored obs
Uncensored obs
47.41983
0.981952
46.09561
116864.3
275.6572
4.594286
0
52
4.617038
10.27062
Mean dependant var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter
0.0000
2542.667
9.355239
9.529768
9.423507
8
60
a) Interprtation statistique
Les coefficients sont tous significativement diffrents de 0 (les probabilits critiques
des coefficients sont toutes infrieures 0,05), le modle est valid sur le plan statistique.
Eviews indique, sur lavant dernire ligne, le nombre de donnes censures : 0
gauche et 8 droite.
b) Interprtation conomique
Lindicateur dcart de prix agit ngativement sur la demande : en cas de rduction
tarifaire de la concurrence, la demande diminue.
Le nombre de clients connects au rseau et la variable muette type de jour ont
un effet positif sur la demande.
La variable dchelle (estimateur de ) est gale 47,41.
Les coefficients ont bien le signe attendu, le modle est valid sur le plan conomique.
Le modle Tobit scrit daprs [6] :
yt = 27,69 x1t + 20,50 x2t + 186,23 x3t + 1473,64
342 CONOMTRIE
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 343
3000
2700
2400
2100
1800
1500
10
13
16
19
22
25
28
Demande
31
34
37
40
43
46
49
52
55
58
Demande ajuste
Coefficient
Std. Error
t-Statistic
X1
X2
X3
C
31.95356
17.83772
156.0019
1594.516
11.44578
0.659615
60.45055
34.80522
2.791732
27.04260
2.580653
45.81254
R-squared
Sum squared resid
0.941213
380662.1
F-statistic
Prob(F-statistic)
Prob.
0.0072
0.0000
0.0125
0.0000
298.8649
0.000000
9782100721511-Bourbo-C12.qxd
22/10/14
10:29
Page 344
Les graphiques (cf. graphique 5) de la srie brute et de la srie ajuste indiquent que
lutilisation de la mthode des MCO peut fournir des valeurs estimes parfois suprieures
3 000 mgawatts ce qui est techniquement impossible.
3300
3000
2700
2400
2100
1800
1500
10
13
16
19
22
25
28
31
Demande
34
37
40
43
46
49
52
55
58
Demande ajuste
y62
= 27,69 0 + 20,50 60 + 186,23 0 + 1473,64 = 2703,85
c1 < y62
< c2 y62 = y62
= 2703,85
Le calcul de la prvision laide du modle estim par la mthode des MCO conduit
des rsultats lgrement diffrents comme lillustre le tableau 4.
Tableau 4 Comparaison des prvisions par le modle Tobit
et par la mthode des MCO
344 CONOMTRIE
Jour
Modle Tobit
MCO
61
3000
3544,63
62
2703,86
2687,26
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 345
13. Introduction
lconomtrie
des donnes
de panel
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 346
2) Exemple introductif
Prenons un exemple introductif trs simple, un panel compos de 2 individus
( N = 2) et connu sur 3 priodes (T = 3 ), soit un total de N T = 6 observations k = 2 variables explicatives.
Le modle gnral scrit :
yit = a0i + a1i x1it + a2i x2it + it ,
yit = variable endogne observe pour lindividu i la priode t ,
x1it, x2it = variables explicatives observes pour lindividu i linstant t ,
a0i = terme constant pour lindividu i ,
a1i ,a2i = coefficients des 2 variables exognes pour lindividu i ,
it = terme derreur pour lindividu i la priode t.
Individu n 1
Individu n 2
1. Nous constatons que nous avons 6 observations et 6 paramtres estimer, lobjectif de cet
exemple est simplement dillustrer lcriture dun modle en panel
346 CONOMTRIE
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 347
y11
1
y 1
12
y13 1
=
y 0
21
y22 0
y23
0
0
0
0
1
1
1
0
0
0
x111
x112
x113
0
0
0
a01
11
a
02 12
a11 13
+
x221
a12 21
x222 a21 22
x211
x212
x213
0
0
0
x121
x122
x123
0
0
0
x223
a22
23
B. La mthode SUR
La mthode SUR, Seemingly Unrelated Regressions, de Zellner (1962) est utilise
lorsque les erreurs des quations individuelles sont corrles : la covariance indivi/ 0 pour i =
/ j . Les individus sont alors interdpendants.
duelle Cov(it , jt) = i2j =
a SU R = (X 1 X)1 (X 1 Y )
Cette mthode consiste appliquer les MCG :
Avec
12 I
I
21
=
(N T,N T )
...
N 1 I
12 I
22 I
...
N 2 I
. . . 1N I
. . . 2N I
N2 I
dimension (T,T ) .
Pratiquement, la procdure est la suivante :
Estimation par les MCO des N quations individuelles.
Calcul des N rsidus eit .
T
i2 =
Calcul des
t=1
eit2
T
i j =
et
eit ejt
t=1
1 X)1 (X
1 Y ) .
a SU R = (X
Application des MCG :
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 348
348 CONOMTRIE
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 349
Comme au cas n 2, le modle doit tre estim sur les N quations (une quation par individu) par les MCO (ou les MCG selon la structure de la matrice des
variances et covariances des erreurs).
Cas n 4 : htrognit des termes constants et homognit des coefficients
des variables explicatives le modle effets individuels.
Les constantes a0i sont diffrentes pour les individus, mais les coefficients ai des
variables explicatives sont constants pour les individus ( ai = a ). Ce modle est
appel modle effets individuels et nous le prsenterons la section III.
H1O
Test
rejete
H O2 : a' = a'i i
a0 et a' = a'i i
H10
vraie
H 02
H 02
rejete
vraie
Test
H 30
rejete
H 3O : a0i = a0 i
H 30
vraie
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 350
SC Rc1 = somme des carrs des rsidus du modle contraint sous lhypothse
H10 , soit estimer par les MCO le modle en empilant toutes les observations. Le
degr de libert est gal : ( N T = nombre total dobservations)
(k + 1 = nombre de coefficients estimer).
SC R = somme des carrs des rsidus du modle non contraint, elle est gale
la somme des N sommes des carrs des rsidus des modles estims sur les T
N
SCRi . Le degr de
i=1
libert est donc la somme des N degrs de libert de chaque quation estime,
soit ddl =
N
(T (k + 1)) = N T N (k + 1) .
i=1
SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse
H20 , soit estimer le modle effets fixes individuels. Le degr de libert est gal
350 CONOMTRIE
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 351
( N T = nombre dobservations) (k + N = nombre de coefficients estimer), nous estimons k coefficients et N termes constants.
SC R = somme des carrs des rsidus du modle non contraint. Le degr de
libert du numrateur est donc gal :
ddln = [(N T )(k + N )][(N T )N (k + 1)] = (N 1) k
SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse H20 .
SC Rc1 = somme des carrs des rsidus du modle contraint sous lhypothse
H10 . Le degr de libert du numrateur est donc gal :
ddln = [(N T )(k + 1)][(N T )(k + N )] = N 1
La statistique F3 est comparer la valeur lue dans la table de Fisher aux degrs
, nous rejetons
de libert du numrateur et du dnominateur. Si F3 > Fddln;ddld
3
lhypothse H0 au seuil .
Exercice n 1
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 352
Anne
yit
x1it
x2it
512
3,15
25,92
687
5,32
22,51
24
2 166
6,29
19,76
25
1 214
11,62
19,76
74
8,47
35,99
67
11,37
17,8
24
2,66
12,43
25
4,11
11,13
419
5,81
13,61
10238
7,02
3,27
24
1 939
12,83
14,27
25
2 254
16,7
14,14
23
6,05
8,77
24
28
4,84
12,96
25
170
3,87
12,83
352 CONOMTRIE
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 353
Solution
Nous commenons par tester lhypothse H10 : a0i = a0 et a = ai
i.
Soit calculer : SC Rc1 = somme des carrs des rsidus du modle contraint sous
lhypothse H10 , nous estimons par les MCO le modle en empilant toutes les observations (fichier de donnes C13EX1-E).
Les rsultats sont les suivants :
Dependent Variable: Y
Method: Least Squares
Included observations: 225
Variable
Coefficient
Std. Error
t-Statistic
Prob.
146.2167
29.32698
21.51258
138.0735
13.82629
11.47806
1.058977
2.121103
1.874234
0.2908
0.0350
0.0622
C
X1
X2
2 757 341
211 063,8
84 306 563
82 876 299
150 121,7
7 419 022
2 771 928
2 793 154
297 885,1
Total SCR
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 354
Dependent Variable: Y
Sample: 26 50
Included observations: 25
Variable
Coefficient
Std. Error
t-Statistic
C
X1
X2
58.36178
0.180573
0.506402
47.94892
6.411318
2.722052
1.217166
0.028165
0.186037
211 063,8
Prob.
0.2364
0.9778
0.8541
Degr de libert = 25 3 = 22
2 091 632,372
0,05
= 2,25 , F1 > F24;198
= 1,52 , nous rejetons lhypothse H10 .
927 188,778 6
Nous nous dirigeons vers la branche de gauche du graphique 1, soit tester : H20 :
a = ai
i.
Nous calculons SC Rc2 = somme des carrs des rsidus du modle contraint sous
lhypothse H20 , soit estimer le modle effets fixes individuels (la mthode destimation sera tudie la section III, fichier de donnes C13EX1).
Dependent Variable: Y?
Method: Pooled Least Squares
Sample: 1 25
Included observations: 25
Cross-sections included: 9
Total pool (balanced) observations: 225
Variable
C
X1?
X2?
Fixed Effects (Cross)
_1-C
_2-C
_3-C
_4-C
_5-C
_6-C
_7-C
_8-C
_9-C
354 CONOMTRIE
Coefficient
654.9109
49.50377
22.17142
49.20967
438.3058
1 157.176
102.6206
409.4617
794.9591
273.2759
501.3735
481.5489
Std. Error
181.7605
23.64297
11.02105
t-Statistic
3.603153
2.093805
2.011733
Prob.
0.0004
0.0375
0.0455
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 355
i
(SC Rc1 SC Rc2 )/(N 1)
Soit calculer la statistique : F3 =
dont nous connaisSC RC2 /(N (T 1) k)
sons tous les lments.
F3 =
0,05
F3 > F8;213
1,90 nous rejetons lhypothse H03 .
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 356
1) Estimateur LSDV
Lestimateur LSDV consiste appliquer la mthode des MCO sur le modle
avec variables indicatrices spcifiques pour chacun des N individus. Nous
construisons donc N variables indicatrices tel que : Di = 1 pour lindividu i et
0 pour les autres.
Le modle scrit : yit + a0 + a01 D1 + a02 D2 + . . . + a0N D N + a xit + it
Pratiquement, nous estimons le modle sans la constante1 a0 :
yit = a1 D1 + a2 D2 + . . . + a N D N + a xit + it par les MCO ou les MCG si les
erreurs sont htroscdastiques ou/et autocorrles.
Nous pouvons ensuite calculer les coefficients a0i = a0 + ai du modle initial, la valeur de la constante a0 tant gale la moyenne des coefficients ai estims.
2) Estimateur Within
Lestimateur Within (estimateur intra-individuel) consiste centrer pralablement toutes les variables expliquer et explicatives sur leurs moyennes individuelles et appliquer la mthode des MCO (ou MCG si les erreurs sont htroscdastiques ou autocorrles) sur le modle ainsi transform :
(yit y i ) = a (xit x i ) + it pour i = 1,. . . ,N et t = 1,. . . ,T .
Aprs lestimation des coefficients a les coefficients fixes individuels a0i sobtiennent par les relations : a 01 = y 1 a x 1 ; a 02 = y 2 a x 2 ; ; a 0N = y N a x N
Nous calculons ensuite les coefficients a0i = a0 + ai du modle initial
comme prcdemment.
Cette mthode destimation conduit exactement aux mmes rsultats que la
mthode LSDV.
1. Sinon, il y aurait alors colinarit entre le vecteur du terme constant (a0 ) et la somme des N
variables indicatrices, la matrice (X X) serait alors singulire (non inversible).
356 CONOMTRIE
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 357
a MC G =
a Bet + (1 )
a L S DV
Lestimateur des MCG1 est donn par :
La valeur des poids , une matrice de dimension (k,k), est inversement proa Bet .
portionnelle la matrice des covariances de
Lintroduction deffets individuels alatoires permet donc de combiner une
spcification intermdiaire entre le modle sans effet individuel et le modle
avec effets fixes. La structure du panel nest ni totalement homogne, ni totalement htrogne.
1. On dmontre aussi que lestimateur des MCO sur les donnes empiles se ramne aussi une
moyenne pondre des estimateurs Within et Between.
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 358
Exercice n 2
358 CONOMTRIE
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 359
Coefficient
Std. Error
t-Statistic
Prob.
X1
49.50377
23.64297
2.093805
0.0375
X2
22.17142
11.02105
2.011733
0.0455
DUM1
704.1205
240.8149
2.923907
0.0038
DUM2
216.6050
250.8295
0.863555
0.3888
DUM3
1 812.087
340.8004
5.317151
0.0000
DUM4
757.5315
227.2174
3.333951
0.0010
DUM5
245.4491
232.6545
1.054994
0.2926
DUM6
1 449.870
429.0331
3.379390
0.0009
DUM7
381.6349
224.4928
1.699987
0.0906
DUM8
153.5374
215.6064
0.712119
0.4772
DUM9
173.3620
234.4385
0.739477
0.4604
a0i
704,12
49,21
216,61
438,31
1 812,09
1 157,18
757,53
102,62
245,45
409,46
1 449,87
794,96
381,63
273,28
ai
153,54
501,37
173,36
481,55
Moyenne = a0
654,91
Nous retrouvons bien exactement les mmes rsultats que lors du calcul de la
SC Rc2 = somme des carrs des rsidus du modle contraint sous lhypothse H20 de lexercice n 1 (fichier de donnes C13EX1, instruction Eviews : panel.ls(cx =f) y? x1? x2?).
2) Lestimation du modle effets alatoires individuels est effectue par linstruction
Eviews : panel.ls(cx =R) y? x1? x2?
Les rsultats sont les suivants :
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 360
Dependent Variable: Y?
Method: Pooled EGLS (Cross-section random effects)
Sample: 1 25
Included observations: 25
Cross-sections included: 9
Total pool (balanced) observations: 225
Cross-section SUR (PCSE) standard errors & covariance (d.f. corrected)
Variable
Coefficient
C
400.3119
X1?
9.907703
X2?
21.70457
Random Effect (Cross)
_1-C
_2-C
_3-C
_4-C
_5-C
_6-C
_7-C
_8-C
_9C
Std. Error
208.0501
22.74786
11.17599
t-Statistic
1.924112
0.435544
1.942071
Prob.
0.0556
0.6636
0.0534
76.20577
326.3516
729.8104
171.7304
279.7010
327.8098
109.6655
269.7585
320.0798
Nous observons que le modle effets alatoires conduit des estimations des coeficients trs diffrents du modle effets fixes, cela peut provenir dune corrlation entre
les effets individuels et les variables explicatives qui introduit un biais destimation lors
de lapplication de la mthode des MCG.
3) Lestimateur Between consiste estimer par les MCO le modle suivant :
y i = a0 + a0i + a x i + v i
Les moyennes calcules sur les 25 annes pour les 9 individus sont prsentes au
tableau 2.
Tableau 2 Moyennes sur les 25 ans par pays
360 CONOMTRIE
Pays
yi
x 1i
x 2i
602,00
5,26
7,13
60,64
6,15
6,69
1 330,56
11,76
4,54
769,68
3,49
8,33
70,20
5,31
3,96
842,72
15,85
7,99
403,88
3,22
8,20
175,00
2,70
7,00
81,44
4,85
6,68
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 361
Les rsultats de lestimation Between (application des MCO sur les donnes du
tableau 2) sont les suivants avec pour variable expliquer y i :
Coefficients
cart-type
t-Statistique
Probabilit
Constante
125,65
694,52
0,183
0,86
x 1i
62,93
32,29
1,94
0,09
x 2i
29,41
92,22
0,318
0,76
49,503
9,907
558,99 2,30
a L S DV =
; a MC G =
; Var( a L S DV ) =
;
22,171
21,704
2,30 121,46
361,49 0,566
Var( a MC G ) =
0,566 119,71
39,59
197,50 2,869
( a L S DV a MC G ) =
; [Var( a L S DV )Var( a MC G )] =
0,466
2,869 1,751
0,00518 0,8499
39,59
H = [ 39,59 0,466 ]
= 7,94 > 2 (2) pour un
0,8499
0,585
0,466
seuil de 5 % = 5,99.
Nous rejetons lhypothse H0, le modle est donc effets individuels fixes.
Le programme Eviews en tlchargement (C13EX2) permet de calculer directement
la statistique dHausman.
9782100721511-Bourbo-C13.qxd
22/10/14
10:30
Page 362
9782100721511-Bourbo-C14.qxd
04/11/14
7:42
Page 363
10
15
20
29
36
41
43
44
45
Chapitre 3
55
64
69
76
78
79
83
87
90
93
95
9782100721511-Bourbo-C14.qxd
22/10/14
10:31
Page 364
96
97
101
Chapitre 4
109
113
114
117
121
Chapitre 5
131
139
144
147
158
160
162
Chapitre 6
165
172
174
364 CONOMTRIE
9782100721511-Bourbo-C14.qxd
04/11/14
7:43
Page 365
Chapitre 7
Exercice 1 Estimation des paramtres dun modle autorgressif
erreurs lies
181
186
191
Exercice 4 Estimation des coefficients dun modle selon une spcification des retards de Koyck et une distribution de Pascal
195
200
201
203
208
Chapitre 8
Exercice 1 Comparaison des rsultats par moindres carrs ordinaires,
moindres carrs indirects et doubles moindres carrs
225
229
230
Chapitre 9
Exercice 1 Exemple dapplication des tests de racine unitaire au CAC40
252
260
264
Chapitre 10
Exercice 1 Recherche des conditions de stationnarit dun modle VAR
278
281
290
293
9782100721511-Bourbo-C14.qxd
22/10/14
10:31
Page 366
Chapitre 11
Exercice 1 Test de cointgration et estimation dun modle
correction derreur
304
314
Chapitre 12
Exercice 1 Estimation des modles Probit et Logit binaires explicatifs
des facteurs de la russite en Licence
326
332
340
Chapitre 13
Exercice 1 Procdure squentielle des tests dhomognit
351
358
366 CONOMTRIE
9782100721511-Bourbo-C15.qxd
22/10/14
10:32
Page 367
Tables statistiques
1. Table de la loi de Laplace-Gauss
2. Table de la loi de Student
3. Table de la loi du Chi-Deux
4. Table de la loi de Fisher-Snedecor
5. Table de la loi de Fisher-Snedecor (suite)
6. Table de Durbin-Watson
7. Tables de Dickey-Fuller
9782100721511-Bourbo-C15.qxd
22/10/14
10:32
Page 368
1
(t) =
2
et
2 /2
dt .
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,0
0,l
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,5000
0,5398
0,5793
0,6179
0,6554
0,6915
0,7257
0,7580
0,7881
0,8159
0,5040
0,5438
0,5832
0,6217
0,6591
0,6950
0,7290
0,7611
0,7910
0,8186
0,5080
0,5478
0,5871
0,6255
0,6628
0,6985
0,7324
0,7642
0,7939
0,8212
0,5l20
0,5517
0,5910
0,6293
0,6664
0,7019
0,7357
0,7673
0,7967
0,8238
0,5160
0,5557
0,5948
0,6331
0,6700
0,7054
0,7389
0,7704
0,7995
0,8264
0,5199
0,5596
0,5987
0,6368
0,6736
0,7088
0,7422
0,7734
0,8023
0,8289
0,5239
0,5636
0,6026
0,6406
0,6772
0,7123
0,7454
0,7764
0,8051
0,8315
0,5279
0,5675
0,6064
0,6443
0,6808
0,7157
0,7486
0,7794
0,8078
0,8340
0,5319
0,5714
0,6103
0,6480
0,6844
0,7190
0,7517
0,7823
0,8106
0,8365
0,5359
0,5753
0,6141
0,6517
0,6879
0,7224
0,7549
0,7852
0,8133
0,8389
1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9
0,8413
0,8643
0,8849
0,9032
0,9192
0,9332
0,9452
0,9554
0,9641
0,9713
0,8438
0,8665
0,8869
0,9049
0,9207
0,9345
0,9463
0,9564
0,9649
0,9719
0,8461
0,8686
0,8888
0,9066
0,9222
0,9357
0,9474
0,9573
0,9656
0,9726
0,8485
0,8708
0,8907
0,9082
0,9236
0,9370
0,9484
0,9582
0,9664
0,9732
0,8508
0,8729
0,8925
0,9099
0,9251
0,9382
0,9495
0,9591
0,9671
0,9738
0,8531
0,8749
0,8944
0,9115
0,9265
0,9394
0,9505
0,9599
0,9678
0,9744
0,8554
0,8770
0,8962
0,9131
0,9279
0,9406
0,9515
0,9608
0,9686
0,9750
0,8577
0,8790
0,8980
0,9147
0,9292
0,9418
0,9525
0,9616
0,9693
0,9756
0,8599
0,8810
0,8997
0,9162
0,9306
0,9429
0,9535
0,9625
0,9699
0,9761
0,8621
0,8830
0,9015
0,9177
0,9319
0,9441
0,9545
0,9633
0,9706
0,9767
2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
0,9772
0,9821
0,9861
0,9893
0,9918
0,9938
0,9953
0,9965
0,9974
0,9981
0,9779
0,9826
0,9864
0,9896
0,9920
0,9940
0,9955
0,9966
0,9975
0,9982
0,9783
0,9830
0,9868
0,9898
0,9922
0,9941
0,9956
0,9967
0,9976
0,9982
0,9788
0,9834
0,9871
0,9901
0,9925
0,9943
0,9957
0,9968
0,9977
0,9983
0,9793
0,9838
0,9875
0,9904
0,9927
0,9945
0,9959
0,9969
0,9977
0,9984
0,9798
0,9842
0,9878
0,9906
0,9929
0,9946
0,9960
0,9970
0,9978
0,9984
0,9803
0,9846
0,9881
0,9909
0,9931
0,9948
0,9961
0,9971
0,9979
0,9985
0,9808
0,9850
0,9884
0,9911
0,9932
0,9949
0,9962
0,9972
0,9979
0,9985
0,9812
0,9854
0,9887
0,9913
0,9934
0,9951
0,9963
0,9973
0,9980
0,9986
0,9817
0,9857
0,9890
0,9916
0,9936
0,9952
0,9964
0,9974
0,9981
0,9986
4,0
4,5
3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,8
F(x) 0,998 65 0,999 04 0,999 31 0,999 52 0,999 66 0,999 76 0,999 841 0,999 928 0,999 968 0,999 997
Nota. La table donne les valeurs de F(x) pour x positif. Lorsque x est ngatif, il faut prendre le complment l'unit de la valeur lue dans la table.
Exemples : pour x = 1,37 F(x) = 0,9147
pour x = 1,37 F(x) = 0,0853
368 CONOMTRIE
9782100721511-Bourbo-C15.qxd
22/10/14
10:32
Page 369
P = 0,90
1
2
3
4
5
6
7
8
9
10
0,158
0,142
0,137
0,134
0,132
0,131
0,130
0,130
0,129
0,129
0,325
0,289
0,277
0,271
0,267
0,265
0,263
0,262
0,261
0,260
0,510
0,445
0,424
0,414
0,408
0,404
0,402
0,399
0,398
0,397
0,727
0,617
0,584
0,569
0,559
0,553
0,549
0,546
0,543
0,542
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0,706
0,703
0,700
1,376
1,06l
0,978
0,941
0,920
0,906
0,896
0,889
0,883
0,879
1,963
1,386
1,250
1,190
1,156
1,134
1,119
1,108
1,100
1,093
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
6,314
2,920
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
12,706
4,303
3,182
2,776
2,571
2,447
2,365
2,306
2,262
2,228
11
12
13
14
15
16
17
18
19
20
0,129
0,128
0,128
0,128
0,128
0,128
0,128
0,127
0,127
0,127
0,260
0,259
0,259
0,258
0,258
0,258
0,257
0,257
0,257
0,257
0,396
0,395
0,394
0,393
0,393
0,392
0,392
0,392
0,391
0,391
0,540
0,539
0,538
0,537
0,536
0,535
0,534
0,534
0,533
0,533
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,876
0,873
0,870
0,868
0,866
0,865
0,863
0,862
0,861
0,860
1,088
1,083
1,079
1,076
1,074
1,071
1,069
1,067
1,066
1,064
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
2,201
2,179
2,160
2,145
2,131
2,120
2,110
2,101
2,093
2,086
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
3,106
3,055
3,012
2,977
2,947
2,921
2,898
2,878
2,861
2,845
21
22
23
24
25
26
27
28
29
30
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,127
0,257
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,256
0,391
0,390
0,390
0,390
0,390
0,390
0,389
0,389
0,389
0,389
0,532
0,532
0,532
0,531
0,531
0,531
0,531
0,530
0,530
0,530
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,859
0,858
0,858
0,857
0,856
0,856
0,855
0,855
0,854
0,854
1,063
1,061
1,060
1,059
1,058
1,058
1,057
1,056
1,055
1,055
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
2,080
2,074
2,069
2,064
2,060
2,056
2,052
2,048
2,045
2,042
2,518
2,508
2,500
2,492
2,485
2,479
2,473
2,467
2,462
2,457
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,05
0,02
0,01
31,82l 63,657
6,965 9,925
4,541 5,841
3,747 4,604
3,365 4,032
3,143 3,707
2,998 3,499
2,896 3,355
2,821 3,250
2,764 3,169
0,12566 0,25335 0,38532 0,52440 0,67449 0,84162 1,03643 1,28155 1,64485 1,95996 2,32634 2,57582
9782100721511-Bourbo-C15.qxd
22/10/14
10:32
Page 370
P = 0,90
1
2
3
4
5
6
7
8
9
10
0,0158
0,211
0,584
1,064
1,610
2,204
2,833
3,490
4,168
4,865
0,80
0,70
0,50
0,30
0,20
0,0642
0,446
1,005
1,649
2,343
3,070
3,822
4,594
5,380
6,179
0,148
0,713
1,424
2,195
3,000
3,828
4,671
5,527
6,393
7,267
0,10
0,05
0,02
0,01
2,706
4,605
6,251
7,779
9,236
10,645
12,017
13,362
14,684
15,987
3,841
5,991
7,815
9,488
11,070
12,592
14,067
15,507
16,919
18,307
5,412
7,824
9,837
11,668
13,388
15,033
16,662
18,168
19,679
21,161
6,635
9,210
11,345
13,277
15,086
16,812
18,475
20,090
21,666
23,209
11
12
13
14
15
16
17
18
19
20
5,578
6,304
7,042
7,790
8,547
9,312
10,085
10,865
11,651
12,443
6,989
7,807
8,634
9,467
10,307
11,152
12,002
12,857
13,716
14,578
8,148
9,034
9,926
10,821
11,721
12,624
13,531
14,440
15,352
16,266
10,341
11,340
12,340
13,339
14,339
15,338
16,338
17,338
18,338
19,337
12,899
14,011
15,119
16,222
17,322
18,418
19,511
20,601
21,689
22,775
14,631
15,812
16,985
18,151
19,311
20,465
21,615
22,760
23,900
25,038
17,275
18,549
19,812
21,064
22,307
23,542
24,769
25,989
27,204
28,412
19,675
21,026
22,362
23,685
24,996
26,296
27,587
28,869
30,144
31,410
22,618
24,054
25,472
26,873
28,259
29,633
30,995
32,346
33,687
35,020
24,725
26,217
27,688
29,141
30,578
32,000
33,409
34,805
36,191
37,566
21
22
23
24
25
26
27
28
29
30
13,240
14,041
14,848
15,659
16,473
17,292
18,114
18,939
19,768
20,599
15,445
16,314
17,187
18,062
18,940
19,820
20,703
21,588
22,475
23,364
17,182
18,101
19,021
19,943
20,867
21,792
22,719
23,647
24,577
25,508
20,337
21,337
22,337
23,337
24,337
25,336
26,336
27,336
28,336
29,336
23,858
24,939
26,018
27,096
28,172
29,246
30,319
31,391
32,461
33,530
26,171
27,301
28,429
29,553
30,675
31,795
32,912
34,027
35,139
36,250
29,615
30,813
32,007
33,196
34,382
35,563
36,741
37,916
39,087
40,256
32,671
33,924
35,172
36,415
37,652
38,885
40,113
41,337
42,557
43,773
36,343
37,659
38,968
40,270
41,566
42,856
44,140
45,419
46,693
47,962
38,932
40,289
41,638
42,980
44,314
45,642
46,963
48,278
49,588
50,892
2
2 2 1 suit la loi normale
Exemple :
Calculez la valeur de 2 correspondant une probabilit P = 0,10 de dpassement
lorsque = 41 . laide de la table 1, on calcule, pour P = 0,10 , x = 1,2816 .
Do : =
2
[x +
2 1]2
1
1
= [1,2816 + 82 1]2 = (10,2816)2 = 52,85.
2
2
2
370 CONOMTRIE
9782100721511-Bourbo-C15.qxd
22/10/14
10:32
Page 371
1 = 1
1 = 2
1 = 3
1 = 4
1 = 5
P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01
l 161,4 4 052
199,5 4 999
215,7 5 403
224,6 5 625
230,2 5764
2 18,51
98,49 19,00
99,00 19,16
99,17 19,25
99,25 19,30
99,30
3 10,13
34,12
9,55
30,81
9,28
29,46
9,12
28,71
9,01
28,24
4
7,71
21,20
6,94
18,00
6,59
16,69
6,39
15,98
6,26
15,52
5
6,61
16,26
5,79
13,27
5,41
12,06
5,19
11,39
5,05
10,97
6
5,99
13,74
5,14
10,91
4,76
9,78
4,53
9,15
4,39
8,75
7
5,59
12,25
4,74
9,55
4,35
8,45
4,12
7,85
3,97
7,45
8
5,32
11,26
4,46
8,65
4,07
7,59
3,84
7,01
3,69
6,63
9
5,12
10,56
4,26
8,02
3,86
6,99
3,63
6,42
3,48
6,06
10
4,96
10,04
4,10
7,56
3,71
6,55
3,48
5,99
3,33
5,64
11
4,84
9,65
3,98
7,20
3,59
6,22
3,36
5,67
3,20
5,32
12
4,75
9,33
3,88
6,93
3,49
5,95
3,26
5,41
3,11
5,06
13
4,67
9,07
3,80
6,70
3,41
5,74
3,18
5,20
3,02
4,86
14
4,60
8,86
3,74
6,51
3,34
5,56
3,11
5,03
2,96
4,69
15
4,54
8,68
3,68
6,36
3,29
5,42
3,06
4,89
2,90
4,56
16
4,49
8,53
3,63
6,23
3,24
5,29
3,01
4,77
2,85
4,44
17
4,45
8,40
3,59
6,11
3,20
5,18
2,96
4,67
2,81
4,34
18
4,41
8,28
3,55
6,01
3,16
5,09
2,93
4,58
2,77
4,25
19
4,38
8,18
3,52
5,93
3,13
5,01
2,90
4,50
2,74
4,17
20
4,35
8,10
3,49
5,85
3,10
4,94
2,87
4,43
2,71
4,10
21
4,32
8,02
3,47
5,78
3,07
4,87
2,84
4,37
2,68
4,04
22
4,30
7,94
3,44
5,72
3,05
4,82
2,82
4,31
2,66
3,99
23
4,28
7,88
3,42
5,66
3,03
4,76
2,80
4,26
2,64
3,94
24
4,26
7,82
3,40
5,61
3,01
4,72
2,78
4,22
2,62
3,90
25
4,24
7,77
3,38
5,57
2,99
4,68
2,76
4,18
2,60
3,86
26
4,22
7,72
3,37
5,53
2,98
4,64
2,74
4,14
2,59
3,82
27
4,21
7,68
3,35
5,49
2,96
4,60
2,73
4,11
2,57
3,78
28
4,20
7,64
3,34
5,45
2,95
4,57
2,71
4,07
2,56
3,75
29
4,18
7,60
3,33
5,42
2,93
4,54
2,70
4,04
2,54
3,73
30
4,17
7,56
3,32
5,39
2,92
4,51
2,69
4,02
2,53
3,70
40
4,08
7,31
3,23
5,18
2,84
4,31
2,61
3,83
2,45
3,51
60
4,00
7,08
3,15
4,98
2,76
4,13
2,52
3,65
2,37
3,34
120
3,92
6,85
3,07
4,79
2,68
3,95
2,45
3,48
2,29
3,17
3,84
6,64
2,99
4,60
2,60
3,78
2,37
3,32
2,21
3,02
Nota. s12 est la plus grande des deux variances estimes, avec 1 degrs de libert.
9782100721511-Bourbo-C15.qxd
22/10/14
10:32
Page 372
1 = 6
1 = 8
1 = 12
1 = 24
1 =
P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01 P = 0,05 P = 0,01
1 234,0 5 859
238,9 5 981
243,9 6 106
249,0 6 234
254,3 6366
2 19,33
99,33 19,37
99,36 19,41
99,42 19,45
99,46 19,50
99,50
3
8,94
27,91
8,84
27,49
8,74
27,05
8,64
26,60
8,53
26,12
4
6,16
15,21
6,04
14,80
5,91
14,37
5,77
13,93
5,63
13,46
5
4,95
10,67
4,82
10,27
4,68
9,89
4,53
9,47
4,36
9,02
6
4,28
8,47
4,15
8,10
4,00
7,72
3,84
7,31
3,67
6,88
7
3,87
7,19
3,73
6,84
3,57
6,47
3,41
6,07
3,23
5,65
8
3,58
6,37
3,44
6,03
3,28
5,67
3,12
5,28
2,93
4,86
9
3,37
5,80
3,23
5,47
3,07
5,11
2,90
4,73
2,71
4,31
10
3,22
5,39
3,07
5,06
2,91
4,71
2,74
4,33
2,54
3,91
11
3,09
5,07
2,95
4,74
2,79
4,40
2,61
4,02
2,40
3,60
12
3,00
4,82
2,85
4,50
2,69
4,16
2,50
3,78
2,30
3,36
13
2,92
4,62
2,77
4,30
2,60
3,96
2,42
3,59
2,21
3,16
14
2,85
4,46
2,70
4,14
2,53
3,80
2,35
3,43
2,13
3,00
15
2,79
4,32
2,64
4,00
2,48
3,67
2,29
3,29
2,07
2,87
16
2,74
4,20
2,59
3,89
2,42
3,55
2,24
3,18
2,01
2,75
17
2,70
4,10
2,55
3,79
2,38
3,45
2,19
3,08
1,96
2,65
18
2,66
4,01
2,51
3,71
2,34
3,37
2,15
3,00
1,92
2,57
19
2,63
3,94
2,48
3,63
2,31
3,30
2,11
2,92
1,88
2,49
20
2,60
3,87
2,45
3,56
2,28
3,23
2,08
2,86
1,84
2,42
21
2,57
3,81
2,42
3,51
2,25
3,17
2,05
2,80
1,81
2,36
22
2,55
3,76
2,40
3,45
2,23
3,12
2,03
2,75
1,78
2,31
23
2,53
3,71
2,38
3,41
2,20
3,07
2,00
2,70
1,76
2,26
24
2,51
3,67
2,36
3,36
2,18
3,03
1,98
2,66
1,73
2,21
25
2,49
3,63
2,34
3,32
2,16
2,99
1,96
2,62
1,71
2,17
26
2,47
3,59
2,32
3,29
2,15
2,96
1,95
2,58
1,69
2,13
27
2,46
3,56
2,30
3,26
2,13
2,93
1,93
2,55
1,67
2,10
28
2,44
3,53
2,29
3,23
2,12
2,90
1,91
2,52
1,65
2,06
29
2,43
3,50
2,28
3,20
2,10
2,87
1,90
2,49
1,64
2,03
30
2,42
3,47
2,27
3,17
2,09
2,84
1,89
2,47
1,62
2,01
40
2,34
3,29
2,18
2,99
2,00
2,66
1,79
2,29
1,51
1,80
60
2,25
3,12
2,10
2,82
1,92
2,50
1,70
2,12
1,39
1,60
120
2,17
2,96
2,01
2,66
1,83
2,34
1,61
1,95
1,25
1,38
2,09
2,80
1,94
2,51
1,75
2,18
1,52
1,79
1,00
1,00
Nota. s12 est la plus grande des deux variances estimes, avec 1 degrs de libert.
372 CONOMTRIE
9782100721511-Bourbo-C15.qxd
22/10/14
10:32
Page 373
6. TABLE DE DURBIN-WATSON
Risque = 5 %
k=1
n
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
45
50
55
60
65
70
75
80
85
90
95
100
k=2
k=3
k=4
k=5
d1
d2
d1
d2
d1
d2
d1
d2
d1
d2
1,08
1,10
1,13
1,16
1,18
1,20
1,22
1,24
1,26
1,27
1,29
1,30
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,43
1,44
1,48
1,50
1,53
1,55
1,57
1,58
1,60
1,61
1,62
1,63
1,64
1,65
1,36
1,37
1,38
1,39
1,40
1,41
1,42
1,43
1,44
1,45
1,45
1,46
1,47
1,48
1,48
1,49
1,50
1,50
1,51
1,51
1,52
1,52
1,53
1,54
1,54
1,54
1,57
1,59
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,69
0,95
0,98
1,02
1,05
1,08
1,10
1,13
1,15
1,17
1,19
1,21
1,22
1,24
1,26
1,27
1,28
1,30
1,31
1,32
1,33
1,34
1,35
1,36
1,37
1,38
1,39
1,43
1,46
1,49
1,51
1,54
1,55
1,57
1,59
1,60
1,61
1,62
1,63
1,54
1,54
1,54
1,53
1,53
1,54
1,54
1,54
1,54
1,55
1,55
1,55
1,56
1,56
1,56
1,57
1,57
1,57
1,58
1,58
1,58
1,59
1,59
1,59
1,60
1,60
1,62
1,63
1,64
1,65
1,66
1,67
1,68
1,69
1,70
1,70
1,71
1,72
0,82
0,86
0,90
0,93
0,97
1,00
1,03
1,05
1,08
1,10
1,12
1,14
1,16
1,18
1,20
1,21
1,23
1,24
1,26
1,27
1,28
1,29
1,31
1,32
1,33
1,34
1,38
1,42
1,45
1,48
1,50
1,52
1,54
1,56
1,57
1,59
1,60
1,61
1,75
1,73
1,71
1,69
1,68
1,68
1,67
1,66
1,66
1,66
1,66
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,65
1,66
1,66
1,66
1,66
1,67
1,67
1,68
1,69
1,70
1,70
1,71
1,72
1,72
1,73
1,73
1,74
0,69
0,74
0,78
0,82
0,86
0,90
0,93
0,96
0,99
1,01
1,04
1,06
1,08
1,10
1,12
1,14
1,16
1,18
1,19
1,21
1,22
1,24
1,25
1,26
1,27
1,29
1,34
1,38
1,41
1,44
1,47
1,49
1,51
1,53
1,55
1,57
1,58
1,59
1,97
1,93
1,90
1,87
1,85
1,83
1,81
1,80
1,79
1,78
1,77
1,76
1,76
1,75
1,74
1,74
1,74
1,73
1,73
1,73
1,73
1,73
1,72
1,72
1,72
1,72
1,72
1,72
1,72
1,73
1,73
1,74
1,74
1,74
1,75
1,75
1,75
1,76
0,56
0,62
0,67
0,71
0,75
0,79
0,83
0,86
0,90
0,93
0,95
0,98
1,01
1,03
1,05
1,07
1,09
1,11
1,13
1,15
1,16
1,18
1,19
1,21
1,22
1,23
1,29
1,34
1,38
1,41
1,44
1,46
1,74
1,51
1,52
1,54
1,56
1,57
2,21
2,15
2,10
2,06
2,02
1,99
1,96
1,94
1,92
1,90
1,89
1,88
1,86
1,85
1,84
1,83
1,83
1,82
1,81
1,81
1,80
1,80
1,80
1,79
1,79
1,79
1,78
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,77
1,78
1,78
1,78
9782100721511-Bourbo-C15.qxd
04/11/14
7:45
Page 374
7. TABLES DE DICKEY-FULLER1
Modle [1] sans tendance et sans terme constant
Modle [2] sans tendance et avec terme constant
Modle [3] avec tendance et avec terme constant
Tables de la distribution du t1
Nombre
observations
n
25
50
100
250
500
25
50
100
250
500
25
50
100
250
500
Probabilits
0,01
2,66
2,62
2,60
2,58
2,58
2,58
3,75
3,58
3,51
3,46
3,44
3,43
4,38
4,15
4,04
3,99
3,98
3,96
0,025
2,26
2,25
2,4
2,23
2,23
2,23
3,33
3,22
3,17
3,14
3,13
3,12
3,95
3,80
3,73
3,69
3,68
3,66
0,05
1,95
1,95
1,95
1,95
1,95
1,95
3,00
2,93
2,89
2,88
2,87
2,86
3,60
3,50
3,45
3,43
3,42
3,41
0,l0
1,60
1,61
1,61
1,62
1,62
1,62
2,63
2,60
2,58
2,57
2,57
2,57
3,24
3,18
3,15
3,13
3,13
3,12
0,90
0,92
0,91
0,91
0,89
0,89
0,89
0,37
0,40
0,42
0,42
0,43
0,44
1,14
1,19
1,22
1,23
1,24
1,25
0,95
1,33
1,31
1,29
1,29
1,28
1,28
0,00
0,03
0,05
0,06
0,07
0,07
0,80
0,87
0,90
0,92
0,93
0,94
0,975
1,70
1,66
1,64
1,63
1,62
1,62
0,34
0,29
0,26
0,24
0,24
0,23
0,50
0,58
0,62
0,64
0,65
0,66
0,99
2,16
2,08
2,03
2,01
2,00
2,00
0,72
0,66
0,63
0,62
0,61
0,60
0,15
0,24
0,28
0,31
0,32
0,33
Modle [3]
Constante c
Constante c
Tendance b
2%
5 % 10 %
2%
5%
10 %
2%
5%
10 %
25
3,41
2,97
2,61
4,05
3,59
3,20
3,74
3,25
2,85
50
3,28
2,89
2,56
3,87
3,47
3,14
3,60
3,18
2,81
100
3,22
2,86
2,54
3,78
3,42
3,11
3,53
3,14
2,79
250
3,19
2,84
2,53
3,74
3,39
3,09
3,49
3,12
2,79
500
3,18
2,83
2,52
3,72
3,38
3,08
3,48
3,11
2,78
3,18
2,83
2,52
3,71
3,38
3,08
3,46
3,11
2,78
1. Source : Fuller W.A., Introduction to Statistical Times Series, John Wiley, 1976.
374 CONOMTRIE
Modle [1]
Modle [2]
Modle [3]
9782100721511-Bourbo-C16.qxd
22/10/14
10:33
Page 375
Bibliographie
AKAIKE H., Information theory and an extension of the maximum likelihood principle , in B.N. Petrov and F. Cski, eds, 2nd International Symposium on
Information Theory, Akadmia Kiad, Budapest, 1973.
AKAIKE H., A new look at the statistical model identification , IEEE Transactions
on automatic Control, Vol. 19, 1974.
AKAIKE H., A bayesian extension of the minimum AIC procedure , Biometrika,
Vol. 66, 1979.
ALMON S., The distributed lag between capital appropriation and expenditures ,
Econometrica, Vol. 33, nl, janvier 1965.
AMEMIYA T., Qualitative response models: a survey , Journal of Economic
Literature, n19, 1981.
ARROW K.J., CHENERY H.B., MINHAS B.S., SOLOW R.M., Capital-labor substitution
and economic efficiency , Review of Economics and Statistics, Vol. 43, 1961.
BEVERIDGE S., NELSON C. R., A new approach to decomposition of economic time
series into permanent and transitory components with particular attention to measurement of the business cycle , Journal of the Monetary Economics, 7, 2, 1981.
BOURBONNAIS R., TERRAZA M., Analyse des sries temporelles, Dunod, Paris, 3e d.,
2010.
BOURBONNAIS R., USUNIER J.-C., Prvision des ventes, 5e d., Economica, Paris,
2013.
BOX G.E.P., JENKINS G.M., Time series analysis : forecasting and control,
Holdenday, 1976.
BOX G.E.P., PIERCE D.A., Distribution of residual autocorrelations in autoregressiveintegrated moving average time series models , Journal of the American
Statistical Association, Vol. 65, 1970.
BREUSCH T., Testing for autocorrelation in dynamic linear models , Australian
Economic Papers, Vol. 17, 1978.
DICKEY D., FULLER W., Distribution of the estimators for autoregressive time series
with unit root , Journal of the American Statistical Association, Vol. 74, n366,
1979.
DICKEY D., FULLER W., Likelihood ratio statistics for autoregressive time series
with unit root , Econometrica, Vol. 49, n4, 1981.
DURBIN J., Testing for serial correlation in least-squares regression when some of
the regressors are lagged dependant variables , Biometrika, Vol. 38, 1970.
ENGLE R.E., GRANGER C.W.J., Cointegration and Error-correction : representation,
estimation and testing , Econometrica, Vol. 55, mars 1987.
ENGLE R.F., Autoregressive conditional heteroscedasticity with estimate of the
variance of U.K. inflation , Econometrica, Vol. 50, 1982.
Bibliographie 375
9782100721511-Bourbo-C16.qxd
22/10/14
10:33
Page 376
9782100721511-Bourbo-C16.qxd
22/10/14
10:33
Page 377
KWIATKOWSKI D., PHILLIPS P., SCHMIDT P., et SHIN Y., Testing the null hypothesis of
stationarity against the alternative of a unit root. How sure are we that economic
time series have a unit root ? Journal of econometric, Vol. 54, 1992.
LJUNG G.M., BOX G.E.P., On a mesure of lack of fit in time series models ,
Biometrika, Vol. 65, 1978.
MACKINNON, J.G., Critical Values for Cointegration Tests, Chapitre 13 in Long-run
Economic Relationships : Readings in Cointegration, R.F. Engle et C.W.J.
Granger diteurs, Oxford University Press, 1991.
MADDALA G.S., RAO A.S., Maximum likelihood estimation of Solows and
Jorgensons distributed lag models , The Review of Economics and Statistics,
fvrier 1971.
NELSON C.R., PLOSSER C., Trends and Random Walks in Macroeconomics Time
Series : some Evidence and Applications , Journal of Monatery Economics,
10, 1982.
PHILLIPS P., PERRON P., Testing for unit root in time series regression , Biometrika,
Vol. 75, 1988.
QUENOUILLE M.H., The joint distribution of serial correlation coefficients ,
Annuals of mathematical statistics, Vol. 20, 1949.
SCHWARZ G., Estimating the dimension of a model , The annals of Statistics, Vol. 6,
1978.
SEVESTRE P., conomtrie des donnes de Panel, Dunod, 2002.
SIMS C.A., Macroeconomics and reality , Econometrica, Vol. 48, 1980.
SOLOW R.M., On a family of lag distributions , Econometrica, avril 1960.
THOMAS A., conomtrie des variables qualitatives, Dunod, 2000.
TOBIN J., Estimation of relationships for limited dependent variables ,
Econometrica, n26, 1958.
WHITE H., A heteroskedasticity-consistent covariance estimator and a direct test for
heteroskedasticity , Econometrica, Vol. 48, 1980.
WOLD H., A study in the analysis of stationary time series, Almquist-Wiksell, 1954.
WONNACOTT T.H., WONNACOTT R.J., Statistique, Economica, 4e d., Paris, 1998.
ZELLNER A., An efficient Method of Estimating Seemingly Unrelated Regression
Equations and Tests for Aggregation Bias , Journal of the American Statistical
Association, 57, pp. 348-368, 1962.
Bibliographie 377
9782100721511-Bourbo-C16.qxd
22/10/14
10:33
Page 378
9782100721511-Bourbo-idx.qxd
22/10/14
10:33
Page 379
Index
A
Algorithme de Gauss-Newton 171
Analyse de la variance 33, 34, 38, 54,
67, 68, 69, 70, 73
Autocorrlation des erreurs 127, 179
Estimateur
Between 357, 358, 360
de Aitken 127
LSDV 356, 358
Within 356
B, C
Fonction
dautocorrlation 240
dautocorrlation partielle 241
de rponse impulsionnelle 285, 290
de vraisemblance 74
Forward Regression 120
D
Dcomposition
de Cholesky 288
de la variance 290
Degr
de libert 27, 34, 54, 70
Donnes centres 54
DoublesMoindresCarrs 223
E
Effet de levier 62, 63
quations
de Yule-Walker 261
rduites 219
structurelles 219
H
Htroscdasticit 18, 142, 144
Homoscdasticit 18
I
Intervalle
de confiance 29, 39, 62, 66
de prdiction 40
de prvision 82
L
Leptokurtique 244
Loi
de Fisher 35, 60, 61
de Student 9, 27, 30, 36, 59, 60
M
Matrice HAT 62
Maximum de vraisemblance 224
Mthode
de Box et Jenkins 260
de Cochrane-Orcutt 138, 140
des Moments Gnraliss 156, 157
INDEX 379
9782100721511-Bourbo-idx.qxd
22/10/14
10:33
380 CONOMTRIE
Page 380
Processus
DS 246, 248
TS 245, 248
Pseudo-R2 325
Racine unitaire 245
Rgression
augmente 157
fallacieuse 299
pondre 144
rcursive 84
Rsidus
standardiss 63
studentiss 63
Retards dAlmon 188
Risque de premire espce 30
S
Saisonnalit 79, 261
Schwarz 279
Stagewise Regression 121
Stationnarit 239, 277
Stepwise Regression 120
T
Test 244
ARCH 153
bilatral 32, 60, 64
Box-Pierce 131, 243
bruit blanc 241
dautocorrlation 178
dgalit des variances 148
dexognit dHausman 156, 158
dexognit faible 313
dHausman 158, 159, 358
de Breusch-Godfrey 130, 132
de CHOW 68, 69, 71, 85, 97, 100, 144
de cointgration 303
de Dickey-Fuller 249, 299
de Dickey et Fuller Augments 249
de diffrence 156
de Durbin et Watson 129, 130, 133,
178
de Farrar et Glauber 116, 118
de Fisher 36, 44, 67, 74, 93, 184, 350
de h de Durbin 178, 182
de Gleisjer 148, 150
de Goldfeld-Quandt 148, 149
9782100721511-Bourbo-idx.qxd
22/10/14
10:33
de Granger 294
de Jarque et Bera 244
de Johansen 315
de Klein 115, 117
de la trace 311
de la valeur propre maximale 313
de Ljung-Box 131, 243, 314
de normalit 244
de Phillips et Perron 250
de racines unitaires 249
de Ramsey 86, 89
de relation de cointgration 310
de RESET 86
de Sims 294
de Wald 94, 350
de White 148, 151
du CUSUM 85
du Kurtosis 244
du multiplicateur de Lagrange 74, 153
du Skewness 244
Page 381
KPSS 251
de stationnarit 241
unilatral 32
Thorme
de Frisch, Waugh et Lovell 53
de Gauss-Markov 53
Triples moindres carrs 224
V
Valeur anormale 62
Variable
auxiliaire 75
centre 20
endogne 4, 14, 47, 177, 219, 320
exogne 4, 14, 47, 177, 219, 320
indicatrice 75, 76, 80
latente 322, 338
muette 75, 96
qualitative 77
INDEX 381
9782100721511-Bourbo-idx.qxd
14/11/14
9:43
Page 382
TD co Sup
S. Brana et M.-C. Bergouignan, TD Comptabilit nationale, 3e d., 2011.
S. Brana, M. Cazals et P. Kauffmann, TD conomie montaire et financire,
4e d., 2012.
S. Brana et M.-C. Bergouignan, TD Macroconomie, 5e d., 2015.
J. Hricourt et J. Reynaud, TD conomtrie, 2007.
K. Jouaber Snoussi et M.-J. Rigobert, TD Finance dentreprise, 2e d., 2010.
J.-P. Lecoutre et Ph. Pilibossian, TD Algbre, 4e d., 2014.
J.-P. Lecoutre et Ph. Pilibossian, TD Analyse, 5e d., 2013.
J.-P. Lecoutre, TD Statistique et probabilits, 6e d., 2015.
P. Mdan, TD Microconomie, 5e d., 2015.
J.-L. Monino, J.-M. Kosianski et F. Le Cornu, TD Statistique descriptive,
4e d., 2010.
G. Neuberg, TD Mathmatiques financires et actuarielles, 2012.
F. Poulon, TD conomie gnrale, 2011.
72151 - (I) - (2) - OSB 80 - LAS - JME
Imprimerie CHIRAT - 42540 Saint-Just-la-Pendue
Dpt lgal : Janvier 2015
Imprim en France