Sei sulla pagina 1di 16

Academia de Studii Economice din București

Facultatea de Cibernetică, Statistică și Informatică Economică

Profesor coordonator: Realizat de Apostu Cristina,

Conf. univ. dr. Silvia Spătaru CSIE, anul III, seria A,


grupa 1066
1) Prezentarea problemei economice

Scopul acestui proiect este de a prezenta influența exportului și a cheltuielilor


cu educația, asupra ratei șomajului, prin intermediul modelului de regresie liniară
multiplă. Toți cei trei indicatori sunt exprimați în procente. În cadrul proiectului voi
folosi 30 de observații, reprezentând date pentru 30 de țări ale lumii, în anul 2016.
Indicatorii au fost preluați din baza de date a Băncii Mondiale. (www.worldbank.org)

y x1
Tara Rata șomajului Export (%PIB)
Albania 15,20 22,97
Austria 6 51,61
Belgium 7,8 82,86
Bangladesh 4,09 16,65
Bulgaria 7,6 63,98
Brasil 11,5 12,49
Cyprus 13 35,3
Germany 4,1 46,12
Denmark 6,2 53,58
Algeria 11,5 21
Spain 19,6 32,95
Estonia 6,8 78,98
Finland 8,8 35,23
France 10,1 29,26
Georgia 11,69 19,6
Croatia 13,1 32,66
Hungary 5,09 69,54
Indonesia 5,6 61,08
Ireland 7,9 80,58
Italy 11,7 29,82
Japan 3,1 107,14
Luxembourg 3,3 99,27
Moldova 4,1 43,63
Mongolia 6,8 50,22
Malaysia 3,5 67,66
Nigeria 5 40,28
Netherlands 6 82,45
Norway 4,7 53,14
Nepal 3,4 89,49
New Zealand 5,1 26,39
T1. Valorile celor 30 de observații, în cazul modelului unifactorial
120

Rata șomajului 100

80

60 Export (%PIB)

40 Linear (Export
(%PIB))
20

0
0.00 5.00 10.00 15.00 20.00 25.00
Export

Din diagrama de mai sus se observă că între variabilele rata șomajului și export
există o legătură inversă. Faptul că punctele nu sunt foarte concentrate în jurul graficului
arată că între cele două variabile nu există o legătură foarte puternică.

2) Definirea modelului unifactorial de regresie;

Y = rata șomajului; variabila endogenă (variabila determinată in interiorul sistemului);


X1 = exportul = variabila exogenă (variabila determinată în afara sistemului);
et = variabila aleatoare: reprezintă eroarea modelului;
Variabila y este dependentă de x1.

b0 – reprezintă valoarea lui y (rata șomajului), atunci când x1(exportul) are valoarea 0.
b1 – reprezintă modificarea lui Y (rata șomajului), atunci când valoarea variabilei
independente X1(exportul) crește cu o unitate.

Vom determina influența variației lui X1 asupra variației lui Y.


Unitățile de observare : 30 unități de observare
120.00

100.00

80.00

60.00

40.00

20.00

0.00
1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627282930

Rata șomajului Export (%PIB)

Fig.1 Aproximarea grafică a modelului legăturii dintre variabile

Observând diagrama de mai sus, putem constata că exportul are o influență destul de
mică asupra ratei șomajului, întrucât graficele celor doua variabile sunt destul de diferite.
(nu se modifică întotdeauna în aceeași direcție).

Estimarea parametrilor modelului unifactorial

30*a +b*1535,93 = 232,37



1535,93*a + b*98375,4883 = 10153,2951

În urma calculelor proprii realizate în Excel, au rezultat următoarele matrice, pe baza


cărora am estimat parametrii modelului.

XtX XtX^-1 XtY


30 1535,93 0,166123 -0,0025937 232,37
1535,93 98375,4883 -0,00259 5,066E-05 10153,2951

 b̂1 
 
 b̂ 2 
B̂  X X
  X Y    
1


 
 b̂ 
 k
Am înmulțit cele două matrice de mai sus, conform formulei, și am obținut matricea B.

matricea B
12,26775048
-0,088325975

Așadar, b0= 12,26775048


b1= -0,088325975

Output Excel

SUMMARY
OUTPUT

Regression
Statistics
Multiple R 0,565004099
R Square 0,319229632
Adjusted R Square 0,294916405
Standard Error 3,424725264
Observations 30

ANOVA
df SS MS F Significance F
Regression 1 153,996929 153,996929 13,12987481 0,001141649
Residual 28 328,4048077 11,72874313
Total 29 482,4017367

Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Intercept 12,26775048 1,39585713 8,78868633 1,53521E-09 9,408466763 15,12703419
Export (%PIB) -0,088325975 0,024375759 -3,623516911 0,001141649 -0,138257453 -0,038394496

a) Interpretați valoarea obținută pentru parametrul pantă.

b1 = - 0,088325975 reprezintă panta dreptei de regresie și arată că, atunci când exportul
crește cu un procent, rata șomajului va scădea, în medie, cu 0,088325975 procente.
b) Testați semnificația statistică a parametrului pantă.

Ipoteze: H0: β1= 0 ( parametrul β1 nu este semnificativ statistic)


H1: β1≠ 0 ( parametrul β1 este semnificativ statistic)

Statistica t = (b1-0) / Sb1 urmează o distribuție Student cu (n-2) grade de libertate, dacă
H0 este adevărată.

Regiunea critică: | t calc | ˃ tα/2; n-2

t calc = (b1-0) / Sb1 = - 0,088325975 / 0,024375759 = - 3,6235


t tab = t0,025; 28 = 2,0484
| T calc | ˃ T tab => Se respinge H0 și se acceptă H1 => exportul este un factor de
influență semnificativ pentru rata șomajului, la pragul de semnificație de 5%.

c) Testarea validității modelului de regresie

Ipoteze :

H0 : MSR = MSE (modelul nu este valid statistic)


H1: MSR > MSE (modelul este valid statistic)

Calculăm statistica F = (SSR/1) / [SSE/(n-2)], care urmează o distribuție Fα;1;n-2

F calc = (153,996929 / 1) / (328,4048077 / 28) = 153,996929 / 11,72874313 = 13,1298


Regiunea critică: Dacă F calculat > F critic, se respinge ipoteza H0 și se acceptă ipoteza
H1.
F critic = F0,05;1;28 = 4,2
F calculat = 13,1298 > F critic = 4,2 => Se respinge ipoteza H0 și se acceptă ipoteza H1,
conform căreia modelul este valid statistic, la pragul de semnificație de 5%.
Obs: Validitatea modelului este susținută și de valoarea lui Significance F din tabelul
Anova. Significance F = 0,001141649. Această valoare reprezintă cel mai mic nivel de
semnificație la care ipoteza nulă poate fi respinsă, pe baza datelor observate. Deoarece
0,001141649 < 0,05 , respingem H0 și acceptăm H1. => Modelul este valid statistic.

d) Verificați îndeplinirea celor mai importante ipoteze ale modelului de


regresie, pe baza analizei reziduurilor.

1. Testarea homoscedasticității/heteroscedasticității erorilor aleatoare (Testul White);


Ei Ei^2 xi xi^2
4,961097 24,61249 22,97 527,6209
-1,70925 2,921525 51,61 2663,592
2,85094 8,127858 82,86 6865,78
-6,70712 44,9855 16,65 277,2225
0,983345 0,966968 63,98 4093,44
0,335441 0,112521 12,49 156,0001
3,850156 14,8237 35,3 1246,09
-4,09416 16,76212 46,12 2127,054
-1,33524 1,782879 53,58 2870,816
1,087095 1,181776 21 441
10,24259 104,9107 32,95 1085,703
1,508235 2,274773 78,98 6237,84
-0,35603 0,126755 35,23 1241,153
0,416668 0,173612 29,26 856,1476
1,153439 1,330421 19,6 384,16
3,716976 13,81591 32,66 1066,676
-1,03556 1,072389 69,54 4835,812
-1,2728 1,62002 61,08 3730,766
2,749557 7,560061 80,58 6493,136
2,06613 4,268894 29,82 889,2324
0,295494 0,087317 107,14 11478,98
-0,19963 0,039853 99,27 9854,533
-4,31409 18,61136 43,63 1903,577
-1,03202 1,065065 50,22 2522,048
-2,79162 7,793114 67,66 4577,876
-3,70998 13,76395 40,28 1622,478
1,014726 1,029669 82,45 6798,003
-2,87411 8,260498 53,14 2823,86
-0,96346 0,928253 89,49 8008,46
-4,83683 23,39491 26,39 696,4321

Output din Excel

SUMMARY
OUTPUT

Regression Statistics
Multiple R 0,32188
R Square 0,103607
Adjusted R Square 0,037207
Standard Error 20,05427
Observations 30

ANOVA
df SS MS F Significance F
Regression 2 1255,068 627,534 1,560355 0,228418154
Residual 27 10858,7 402,1739
Total 29 12113,76

Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%
Intercept 24,2357 16,58808 1,461031 0,155548 -9,800235968 58,27162736
xi -0,26912 0,660088 -0,4077 0,686707 -1,623508886 1,085270304
xi^2 0,000149 0,00566 0,026368 0,979158 -0,011464584 0,01176308

Se reține coeficientul de determinație, corespunzător regresiei auxiliare: Ra^2 =


0,103607

Ipoteze: H0: a1=a2 =0 (Erorile aleatoare sunt homoscedastice)


H1: Există ai diferit de 0, i =1,2 (Erorile aleatoare sunt heteroscedastice)
Statistica W =n*Ra^2 urmează o distribuție Hi^2, cu gradele de libertate date de
numărul de regresori din ecuația auxiliară( în cazul de față, 2).

Decizia
Dacă Wcalc = n*Ra^2 > Hi^2tab;α, Respingem H0 și acceptăm H1( Erorile aleatoare
sunt heteroscedastice).

Hi^2tab;α = Hi^2tab 0,05;2 = 5,99


W = 30*0,103607 = 3,1082
W < Hi^2tab 0,05;2 => Acceptăm H0 => Erorile aleatoare sunt homoscedastice.

2. Testarea autocorelării erorilor aleatoare;

Testul Durbin-Watson

((Ei - E(i-
Ei E(i -1) Ei- E(i-1) 1))^2 Ei ^2
4,961097
-1,70925 4,961097 -6,67034 44,49349021 2,921525
2,85094 -1,70925 4,560187 20,79530282 8,127858
-6,70712 2,85094 -9,55806 91,3565642 44,9855
0,983345 -6,70712 7,690468 59,14330394 0,966968
0,335441 0,983345 -0,6479 0,41978016 0,112521
3,850156 0,335441 3,514715 12,35322493 14,8237
-4,09416 3,850156 -7,94431 63,11210831 16,76212
-1,33524 -4,09416 2,758912 7,611594162 1,782879
1,087095 -1,33524 2,42234 5,867729837 1,181776
10,24259 1,087095 9,155495 83,82309598 104,9107
1,508235 10,24259 -8,73436 76,28896398 2,274773
-0,35603 1,508235 -1,86426 3,475470542 0,126755
0,416668 -0,35603 0,772694 0,597055911 0,173612
1,153439 0,416668 0,736771 0,542831631 1,330421
3,716976 1,153439 2,563537 6,571723128 13,81591
-1,03556 3,716976 -4,75254 22,58661795 1,072389
-1,2728 -1,03556 -0,23724 0,056281748 1,62002
2,749557 -1,2728 4,022357 16,17935187 7,560061
2,06613 2,749557 -0,68343 0,467071748 4,268894
0,295494 2,06613 -1,77064 3,135150556 0,087317
-0,19963 0,295494 -0,49513 0,245149182 0,039853
-4,31409 -0,19963 -4,11446 16,92875832 18,61136
-1,03202 -4,31409 3,282068 10,77197149 1,065065
-2,79162 -1,03202 -1,7596 3,096174568 7,793114
-3,70998 -2,79162 -0,91837 0,843394617 13,76395
1,014726 -3,70998 4,724706 22,32285012 1,029669
-2,87411 1,014726 -3,88883 15,12303236 8,260498
-0,96346 -2,87411 1,910649 3,65058029 0,928253
-4,83683 -0,96346 -3,87337 15,00298744 23,39491
606,861612 303,7923

DW = suma [Ei - E(i-1)] ^2 / suma Ei^2 = 606,861612 / 303,7923 = 1,99


Valorile d1 si d2 din tabel pentru alfa =0,05; n=30; k=1 sunt:

d1=1,3520 Regiunile de decizie pentru DW:


d2= 1,4894 autocorelare pozitiva a
0 - d1 erorilor
d1 - d2 indecizie (?)
d2 - (4-d2) neautocorelare a erorilor
(4-d2) - (4-d1) indecizie (?)
autocorelare negativa a
(4-d1) - 4 erorilor

0 1,35 1,49 1,99 2,51 2,65 4


d2 4-d2
4-d2= 4 - 1,4894 = 2,5106
4-d1= 4 - 1,3520 = 2,648
DW = 1,99 - se afla in intervalul [d2 - (4-d2)] => neautocorelare a erorilor

3. Testarea distribuției normale a erorilor aleatoare (Testul Jarque-Bera).

Testul Jarque-Bera

RESIDUAL
OUTPUT

Observation Predicted Rata șomajului Residuals


1 10,23890284 4,961097161
2 7,709246923 -1,709246923
3 4,949060214 2,850939786
4 10,797123 -6,707122999
5 6,616654616 0,983345384
6 11,16455905 0,335440947
7 9,14984357 3,85015643
8 8,194156524 -4,094156524
9 7,535244753 -1,335244753
10 10,41290501 1,087094991
11 9,357409611 10,24259039
12 5,291764996 1,508235004
13 9,156026389 -0,356026389
14 9,683332458 0,416667542
15 10,53656137 1,153438627
16 9,383024144 3,716975856
17 6,125562197 -1,035562197
18 6,872799943 -1,272799943
19 5,150443436 2,749556564
20 9,633869912 2,066130088
21 2,804505548 0,295494452
22 3,499630969 -0,199630969
23 8,414088201 -4,314088201
24 7,832020028 -1,032020028
25 6,291615029 -2,791615029
26 8,709980216 -3,709980216
27 4,985273863 1,014726137
28 7,574108182 -2,874108182
29 4,363459001 -0,963459001
30 9,936828005 -4,836828005

T2. Reziduurile aferente modelului unifactorial de regresie

Tabelul de mai sus a fost obținut în Excel, în următorul mod. Data> Data
Analysis>Regression> bifarea atributului Residuals.

Acestor reziduuri le-am aplicat funcțiile KURT și SKEW din Excel, pentru a determina
următorii coeficienți de mai jos. (Kurtosis-coeficientul de boltire, respectiv Skewness –
coeficientul de asimetrie)

C=Kurtosis S = Skewness
1,858850752 0,67215178

Ipoteze: H0: ipoteza de normalitate


H1: distribuția erorilor nu urmează o lege normală

Statistica JB urmează o distribuție Hi^2 α;2

Decizia Dacă JB >Hi^2 α;2 =>Respingem H0 și acceptăm H1.


Formula de calcul a statisticii Jarque-Bera:

 JB = [(30 – 1 + 1) / 6 ] * [0,67^2 + ¼ (1,86 - 3)^2]


 JB = 5 * ( 0,45 + 0,32)
 JB = 3,87

Hi pătrat 0,05; 2 = 5,99


JB = 3,87 < Hi pătrat 0,05; 2 = 5,99 => Acceptăm H0. => distribuția erorilor urmează o
lege normală.
Metoda grafică

Residuals
15

10

5
Ei
0
0 5 10 15 20 25 30 35
-5

-10

T tabelat (0,025; 28) = 2,0484


Intervalul de normalitate: ( -t tab*Se; +t tab * Se) = (-2,0484*3,42; 2,0484*3,42) =
( -7; +7)
Standard Error = 3,42

Putem observa din acest grafic că o singură eroare nu se încadrează în intervalul


determinat.
e) Determinați o prognoză pe interval de încredere pentru variabila dependentă
Y, dacă variabila X crește cu 20% față de ultima valoare înregistrată.

Se dorește predicția unei valori individuale y0, știind că x0 crește cu 20% față de ultima
valoare înregistrată.

x0 = 20/100*26,39 + 26,39= 31,66

Estimare punctuală

= 12,2677504 – 0,088325975* 31,66 = 9,47

Determinare interval de încredere, pentru valoarea previzionată a lui y0.


Pentru nivelul de semnificație fixat, (α = 0,05), se poate construi un interval de încredere
100(1- α)%, pentru predicția individuală y0, de forma:
În urma calculelor, a rezultat următorul interval de încredere:
y0 aparține intervalului (2,28; 16,66)

3) Modelul multifactorial de regresie. Se va îmbunătăți modelul unifactorial de


regresie, prin adăugarea unor noi variabile independente (explicative).

y x1 x2
Rata Export
Tara șomajului (%PIB) Cheltuieli cu educatia(% din Cg)
Albania 15,20 22,97 12,12
Austria 6 51,61 10,95
Belgium 7,8 82,86 11,93
Bangladesh 4,09 16,65 13,82
Bulgaria 7,6 63,98 11,44
Brasil 11,5 12,49 15,97
Cyprus 13 35,3 15,37
Germany 4,1 46,12 11,03
Denmark 6,2 53,58 15,23
Algeria 11,5 21 14,12
Spain 19,6 32,95 9,54
Estonia 6,8 78,98 12,59
Finland 8,8 35,23 12,45
France 10,1 29,26 9,66
Georgia 11,69 19,6 14,28
Croatia 13,1 32,66 9,6
Hungary 5,09 69,54 8,54
Indonesia 5,6 61,08 17,6
Ireland 7,9 80,58 13,45
Italy 11,7 29,82 8,16
Japan 3,1 107,14 9,58
Luxembourg 3,3 99,27 14,28
Moldova 4,1 43,63 8,05
Mongolia 6,8 50,22 14,2
Malaysia 3,5 67,66 19,45
Nigeria 5 40,28 18,08
Netherlands 6 82,45 12,08
Norway 4,7 53,14 17,03
Nepal 3,4 89,49 18,19
New
Zealand 5,1 26,39 18,36

T3. Valorile celor 30 de observații, în cazul modelului multifactorial

Estimarea parametrilor modelului

nbˆ0  bˆ1  x1t  bˆ2  x2t   yt < = > 30*b0 + b1*1535,93+b2*397,15=232,37



bˆ0  x1t  bˆ1  x1t  bˆ2  x1t x2t   x1t yt
2
b0*1535,93+b1*98375,48+b2*20342,64=10153,29
ˆ
b0  x2t  b1  x1t x2t  b2  x2t   x2t yt
ˆ ˆ 2 b0*397,15+b1*20342,64+b2*570,59=2960,97

 b̂1  Matricea XtX


 
 b̂ 2  30 1535,93 397,15
B̂  X X
  X Y    
1
1535,93 98375,48 20342,64

  397,15 20342,64 5570,59
 b̂ 
 k

Matricea XtX^-1
0,723992356 -0,002573382 -0,042218898
-0,002573382 5,06607E-05 -1,53554E-06
-0,042218898 -1,53554E-06 0,003195078

Matricea XtY
232,37
10153,29
2960,97

Am înmulțit cele două matrice de mai sus, conform formulei și am obținut matricea B.

B
17,09691486
-0,08815063
-0,365464558

Așadar, b0= 17,09691486


b1= - 0,08815063
b2= - 0,365464558
Output Excel
SUMMARY
OUTPUT

Regression
Statistics
Multiple R 0,637085286
R Square 0,405877662
Adjusted R Square 0,3618686
Standard Error 3,258070593
Observations 30

ANOVA
df SS MS F Significance F
Regression 2 195,796089 97,89804 9,222593 0,000885777
Residual 27 286,6056476 10,61502
Total 29 482,4017367

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 17,09667713 2,772222004 6,167139 1,36E-06 11,40854743 22,78480684
Export (%PIB) -0,088150329 0,02318975 -3,80126 0,000747 -0,135731766 -0,040568893
Cheltuieli cu
educatia(% din Cg) -0,365447762 0,184162846 -1,98437 0,057464 -0,74331871 0,012423186

a) Interpretați valorile obținute pentru parametrii pantă

b1 = - 0,088150329 reprezintă panta dreptei de regresie și arată că, atunci când exportul
crește cu un procent, rata șomajului va scădea, în medie, cu 0,088150329 procente.

b2 = - 0,365447762 reprezintă panta dreptei de regresie și arată că, atunci când cheltuielile
cu educația cresc cu un procent, rata șomajului va scădea, în medie, cu 0,365447762
procente.

b) Verificați existența multicoliniarității variabilelor explicative. (Veți atașa


rezultatele oținute pentru “Correlation Matrix”. )
Correlation Matrix – Output-ul din Excel

Correlation Matrix
Export
Rata șomajului (%PIB) Cheltuieli cu educatia(% din Cg)
Rata șomajului 1
Export (%PIB) -0,565004099 1
Cheltuieli cu educatia(% din Cg) -0,296514826 0,003816957 1

Putem observa din această matrice că există o corelație destul de puternică între
export și rata șomajului și o corelație slabă între cheltuielile cu educația și rata șomajului.
Observăm, de asemenea, că între cele două variabile independente există o corelație
aproape inexistentă.

Potrebbero piacerti anche