Sei sulla pagina 1di 25

Academia de Studii Economice Bucureşti – Facultatea de Relaţii Economice Internaţionale

Analiza legăturii dintre valorile înregistrate


ale produsului intern brut şi ale cheltuielilor
guvernamentale în cele 27 de state membre
ale Uniunii Europene pentru anul 2009
– Raport –

Decembrie 2010
Cuprins

1. Prezentarea problemei ................................................................................................................................................ 3


2. Modelul de regresie - definire ................................................................................................................................... 5
3. Modelul de regresie – parametrii ............................................................................................................................ 7
3.1. Estimarea punctuală a parametrilor ............................................................................................................. 7
3.2. Estimarea parametrilor prin interval de încredere .................................................................................. 8
4. Testarea semnificaţiei corelaţiei şi a parametrilor modelului de regresie ............................................ 8
4.1. Testarea semnificaţiei corelaţiei...................................................................................................................... 8
4.2. Testarea semnificaţiei parametrilor modelului de regresie ............................................................... 10
Testarea parametrului α ................................................................................................................................. 10
Testarea parametrului β ................................................................................................................................. 11
5. Aplicarea analizei de tip ANOVA şi interpretarea rezultatelor ................................................................ 12
6. Testarea ipotezelor statistice clasice asupra modelului de regresie simplă ...................................... 13
6.1. Evaluarea vailidtăţii modelului de regresie clasic ................................................................................. 13
6.2. Testarea liniarităţii modelului de regresie propus ................................................................................ 14
6.3. Testarea normalităţii erorilor ....................................................................................................................... 14
6.4. Testarea ipotezei de homoscedasticitate ................................................................................................... 15
6.5. Testarea ipotezei de autocorelare a erorilor ........................................................................................... 18
7. Previziune....................................................................................................................................................................... 18
Intervalul de încredere pentru valoarea previzionată ........................................................................................ 19
ANEXE ........................................................................................................................................................................................ 20
Anexa nr. 1: Rezultate obţinute în urma folosirii metodei de calcul clasice ................................................ 20
Anexa nr. 2: Prelucrarea observaţiilor în Excel: valorile înregsitrate pentru cheltuielile
guvernamentale şi produsul intern brut în anul 2009 în Uniunea Europeană .......................................... 21
Anexa nr. 3: Output-ul de regresie pentru observaţiile iniţiale ........................................................................ 22
Anexa nr. 4: Seria de date ordonată în mod crescător după valorile înregistrate pentru cheltuielile
guvernamentale................................................................................................................................................................. 23
Anexa nr. 5: Output-ul de regresie pentru observaţiile sortate crescător necesare pentru testarea
homoscedasticităţii .......................................................................................................................................................... 24
Anexa nr. 6: Valorile necesare pentru aflarea testului Durbin-Watson ........................................................ 25

2
1. Prezentarea problemei

Produsul intern brut (PIB) reprezintă valoarea de piaţă a tuturor bunurilor şi serviciilor
destinate consumului final, realizate cu factorii de producţie din interiorul unei ţări, într-o
perioadă de timp determinată. Teoria economică ne învaţă că acest indicator macroeconomic
poate fi calculat prin mai multe metode, însă cea mai des folosită este următoarea:

PIB = Consum + Investiţii + Export Net,


unde:
Consum = Consum privat + Cheltuieli guvernamentale

Consumul (în general, cum este prezentat în prima formulă de mai sus) cuprinde atât
consumul privat, cât şi cel public. Iar prin consumul sectorului public înţelegem totalitatea
cheltuielilor statului pentru bunuri şi servicii folosite în scop guvernamental, de unde şi
denumirea folosită pe parcursul acestei lucrări: cheltuieli guvernamentale.
Astfel, în continuare, vom vedea dacă există într-adevăr suficientă evidenţă statistică
pentru a putea afirma că există legătură directă între cheltuielile guvernamentale şi volumul PIB.
Pentru această analiză am luat în considerare date din anul 2009 pentru cele 27 de state membre
ale Uniunii Europene.
Vom considera variabila independentă ca fiind reprezentată de cheltuielile
guvernamentale, notată cu X, care va influenţa (sau nu) în mod direct valorile variabilei
dependente, notată cu Y şi reprezentând produsul intern brut.
Observaţiile înregistrate sunt prezentate în Tabelul nr. 1: Valorile înregistrate pentru
cheltuielile guvernamentale şi produsul intern brut în anul 2009 în Uniunea Europeană, de pe
pagina următoare.

3
Tabel nr. 1: Valorile înregistrate pentru cheltuielile guvernamentale şi
produsul intern brut în anul 2009 în Uniunea Europeană

i xi yi
Nr. Crt. Cheltuieli guvernamentale PIB (milioane
(milioane Euro) Euro)
Belgia 1 83681.00 339162.00
Bulgaria 2 5695.00 35043.10
Cehia 3 30223.50 137161.50
Danemarca 4 66651.70 222409.80
Germania 5 472140.00 2397100.00
Estonia 6 3048.70 13860.80
Irlanda 7 31090.90 159645.70
Grecia 8 45442.70 233046.00
Spania 9 222782.00 1053914.00
Franta 10 469755.50 1907145.00
Italia 11 327814.00 1520870.00
Cipru 12 3364.40 16946.50
Letonia 13 3637.20 18538.70
Lituania 14 5816.70 26507.70
Luxemburg 15 6349.10 38044.70
Ungaria 16 20663.80 92941.60
Malta 17 1246.70 5749.70
Olanda 18 162654.00 571979.00
Austria 19 54714.20 274320.50
Polonia 20 57249.50 310485.50
Portugalia 21 35825.60 168075.60
Romania 22 20985.60 115869.20
Slovacia 23 7168.30 35384.40
Slovenia 24 12601.70 63050.70
Finlanda 25 43002.00 171315.00
Suedia 26 81333.70 292680.40
Marea Britanie 27 367468.10 1563106.40
TOTAL 27 2642405.60 11784353.50
Sursa: Eurostat: [tec00001], [tec00010]1

http://epp.eurostat.ec.europa.eu/tgm/refreshTableAction.do;jsessionid=9ea7974b30dc2115845cfee3490e96c1da309
663cc3b.e34SbxiPb3uSb40Lb34LaxqRb3eSe0?tab=table&plugin=1&pcode=tec00001&language=en
Gross domestic product at market prices - [tec00001]; Millions of euro (from 1.1.1999)/Millions of ECU (up to
31.12.1998)
http://epp.eurostat.ec.europa.eu/tgm/table.do?tab=table&init=1&language=en&pcode=tec00010&plugin=1
Final consumption expenditure of general government - [tec00010]; Millions of euro (from 1.1.1999)/Millions of
ECU (up to 31.12.1998)

4
2. Modelul de regresie - definire

Pentru a putea analiza legătura dintre valorile cheltuielilor guvernamentale şi cele ale
produsului intern brut vom folosi modelul de regresie simplă liniară.

Se consideră:
- Variabila independentă – X – cheltuielile guvernamentale
- Variabila dependentă – Y – produsul intern brut

Forma ecuaţiei de regresie ce va fi folosită este următoarea:

Y = f(X) + ε
Cu modelul de regresie simplă liniară:

yi = α + βxi + εi, unde:


i = 1,n;
y = variabila dependentă;
x = variabila independentă;
ε = componenta reziduală (eroarea aleatoare).
Iar, în eşantion:

yi = a + bxi + ei, unde:


a şi b sunt estimatorii parametrilor α şi β;
e = valoarea reziduală în eşantion.
Cu componenta predictibilă: ŷi = a + bxi
Şi componenta reziduală: ei = yi – (a + bxi)

Reprezentarea grafică a modelului prezentat mai sus poate fi observată în Figura nr. 1:
Interdependenţa între produsul intern brut şi cheltuielile guvernamentale în anul 2009 în statele
membre UE, de pe pagina următoare.

5
Figura nr. 1: Interdependenţa între produsul intern brut şi cheltuielile guvernamentale în
anul 2009 în statele membre UE (corelogramă)

3,000,000

2,500,000
Produsul intern brut (mil. €)

y = 4.503x - 4255.552
2,000,000 R² = 0.984

1,500,000

1,000,000

500,000

0
0 50,000 100,000 150,000 200,000 250,000 300,000 350,000 400,000 450,000 500,000
Cheltuielile guvernamentale (mil. €)

Sursa: Eurostat: [tec00001], [tec00010]

Observând reprezentarea grafică a legăturii dintre PIB şi cheltuielile guvernamentale, se


poate avansa ipoteza conform căreia între cele două variabile există o legătură directă: în timp ce
variabila independentă creşte (cheltuielile guvernamentale) şi cea dependentă (produsul intern
brut) creşte. Punctele sunt distribuite relativ uniform de-a lungul dreptei de regresie.

6
3. Modelul de regresie – parametrii

3.1. Estimarea punctuală a parametrilor


Pentru a putea estima parametrii ecuaţiei modelului de regresie se va utiliza metoda celor
mai mici pătrate, urmărind minimizarea erorilor observate.

min∑𝒏𝒊=𝟏 𝒆𝟐𝒊 =min∑𝒏𝒊=𝟏(𝒚𝒊 − 𝒂 − 𝒃𝒙𝒊 )𝟐


Astfel, funcţia îşi va atinge minimul atunci când derivata de ordinul I va fi zero.
𝐧 𝐧

∑ 𝐲𝐢 = 𝐧𝐚 + 𝐛 ∑ 𝐱 𝐢
𝐢=𝟏 𝐢=𝟏
𝐧 𝐧 𝐧

∑ 𝐱 𝐢 𝐲𝐢 = 𝐚 ∑ 𝐱 𝐢 + 𝐛 ∑ 𝐱 𝐢𝟐
{ 𝐢=𝟏 𝐢=𝟏 𝐢=𝟏

Pentru situaţia analizată, acest sistem devine:


2642405.60 = 27a + 11782581.10b
3567348047520.25= 11782581.10a + 794797993657.10b

Rezultatul2 acestui sistem de ecuaţii este:


a = - 4255.55
b = 4.50
Unde:
Parametrul a este estimatorul ordonatei la origine. Nu există interpretare economică
pentru acest parametru, el reprezintă valoarea pe care ar avea-o PIB (variabila dependentă) atunci
când cheltuielile guvernamentale (variabila independentă) sunt nule, situaţie imposibilă în
realitatea economică, PIB neputând avea valoare negativă, fiind influenţat şi de alţi factori (nu
doar de cheltuielile guvernamentale).
Parametrul b este un coeficient de regresie şi estimatorul pentru panta dreptei de regresie.
Acesta ne arată că la o creştere cu o unitate (1.000.000 €) a cheltuielilor guvernamentale,
produsul intern brut va creşte în medie cu 4.50 (milioane €). Având valoare pozitivă, ne indică şi
faptul că legătura dintre cele două variabile considerate este directă.
Astfel, funcţia de regresie obţinută este:

yi = - 4255.55 + 4.50xi

2
Metoda de calcul clasică pentru acest sistem va fi prezentată în Anexa nr. 1.

7
3.2. Estimarea parametrilor prin interval de încredere
Urmărind SUMMARY OUTPUT-ul din Excel (în analiza de tip ANOVA: Lower 95% şi
Upper 95%), se observă următoarele intervale de încredere pentru estimatorii parametrilor α şi β:
α ∈ ( - 44529.71; 36018.61 ),
β ∈ ( 4.27; 4.74 )

Folosind metoda de calcul clasică obţinem:

 Interval de încredere pentru α:


α ∈ ( a ± t(α/2; n-2)*Sa)
t(α/2; n-2) = t(0.05; 25) = TINV(0.05, 25) = 2.06
Sa = 19554.943
a - t(α/2; n-2)*Sa < α < a + t(α/2; n-2)*Sa
-4255.55 - 2.06*19554.94 < α < -4255.55 + 2.06*19554.94
-44529.71 < α < 36018.61
α ∈ ( - 44529.71; 36018.61 )

 Interval de încredere pentru β:


β ∈ ( b ± t(α/2; n-2)*Sb)
t(α/2; n-2) = t(0.05; 25) = TINV(0.05, 25) = 2.06
Sb = 0.114
b - t(α/2; n-2)*Sb < β < b + t(α/2; n-2)*Sb
4.50 - 2.06*0.11 < α < 4.50 + 2.06*0.11
4.27 < α < 4.74
β ∈ ( 4.27; 4.74 )

4. Testarea semnificaţiei corelaţiei şi a parametrilor modelului de regresie

4.1. Testarea semnificaţiei corelaţiei


Se testează semnificaţia coeficientului de corelaţie, r.
Din Excel, se observă valoarea coeficientului de corelaţie (Multiple R): r = 0.9921

3 Metoda de calcul clasică pentru acest indicator va fi prezentată în Anexa nr. 1.


4 Ibidem.
8
Etapa 1: Formularea ipotezelor
H0: ρ = 0
H1: ρ ≠ 0
Etapa 2: Selectarea nivelului de semnificaţie: α = 0,05.
Etapa 3: Alegerea testului statistic
Ţinând cont de faptul că avem mai puţin de 30 de observaţii (n<30), se va folosi testul
Student (statistica t).
ttab = t(α/2;n-k-1) = t(0.05/2;25)= TINV(0.05, 25) = 2.06
Etapa 4: Stabilirea regunilor de acceptare şi respingere

zonă de acceptare

Z.R. Z.R.
-2.06 0 +2.06 tcalc = 39.50

Etapa 5: Calcularea valorii numerice a statisticii t

𝒏−𝟐
𝒕𝒄𝒂𝒍𝒄 = 𝒓√ = 39.50
𝟏−𝒓𝟐

Etapa 6: Decizia şi formularea concluziei


Cum tcalc > ttab (tcalc aparţine zonei de respingere) putem afirma că avem suficientă
evidenţă statistică pentru a respinge ipoteza nulă (H0) în favoarea celei alternative (H1).
Legătura dintre produsul intern brut şi cheltuielile guervnamentale este o legătură liniară.
Acest model econometric descrie legătura dintre produsul intern brut şi cheltuielile
guvernamentale în proporţie de 99,21% (r = 0.9921), aceasta fiind puternică (r aproape de 1) şi
directă (r pozitiv).

9
4.2. Testarea semnificaţiei parametrilor modelului de regresie

 Testarea parametrului α
Etapa 1: Formularea ipotezelor
H0: α = 0
H1: α ≠ 0
Etapa 2: Selectarea nivelului de semnificaţie: α = 0,05.
Etapa 3: Alegerea testului statistic
Ţinând cont de faptul că avem mai puţin de 30 de observaţii (n<30), se va folosi testul
Student (statistica t).
ttab = t(α/2;n-k-1) = t(0.05/2;25)= TINV(0.05, 25) = 2.06
Etapa 4: Stabilirea regunilor de acceptare şi respingere

zonă de acceptare

Z.R. Z.R.
-2.06 - 0.22 0 +2.06

Etapa 5: Calcularea valorii numerice a statisticii t


𝒂 −𝟒𝟐𝟓𝟓.𝟓𝟓
𝒕𝒄𝒂𝒍𝒄 = = 𝟏𝟗𝟓𝟓𝟒.𝟗𝟒 = −𝟎. 𝟐𝟐
𝒔𝒂

𝟏 ̅𝟐
𝒙
𝒔𝒂 = 𝒔𝒆 √ + 𝒏 = 𝟏𝟗𝟓𝟓𝟒. 𝟗𝟒
̅) 𝟐
𝒏 ∑𝒊=𝟏(𝒙𝒊 − 𝒙

Etapa 6: Decizia şi formularea concluziei


Cum tcalc ∈ (-ttab; +ttab) putem afirma că avem suficientă evidenţă statistică pentru a
accepta ipoteza nulă (H0) şi a o respinge pe cea alternativă (H1).
Astfel, este probabil ca estimatorul a să provină dintr-o populaţie cu α = 0, ceea ce indică
faptul că α nu este semnificativ statistic.

10
 Testarea parametrului β
Etapa 1: Formularea ipotezelor
H0: β = 0
H1: β ≠ 0
Etapa 2: Selectarea nivelului de semnificaţie: α = 0,05.
Etapa 3: Alegerea testului statistic
Ţinând cont de faptul că avem mai puţin de 30 de observaţii (n<30), se va folosi testul
Student (statistica t).
ttab = t(α/2;n-k-1) = t(0.05/2;25)= TINV(0.05, 25) = 2.06
Etapa 4: Stabilirea regunilor de acceptare şi respingere

zonă de acceptare

Z.R. Z.R.
-2.06 0 +2.06 39.50

Etapa 5: Calcularea valorii numerice a statisticii t


𝒃 𝟒.𝟓𝟎
𝒕𝒄𝒂𝒍𝒄 = = 𝟎.𝟏𝟏 = 𝟑𝟗. 𝟓𝟎
𝒔𝒃

Etapa 6: Decizia şi formularea concluziei


Observăm că tcalc > ttab (tcalc aparţine zonei de respingere) şi putem afirma că avem
suficientă evidenţă statistică pentru a respinge ipoteza nulă (H0) în favoarea celei alternative
(H1), lucru ce ne demonstrează existenţa legăturii dintre produsul intern brut şi cheltuielile
guevrnamentale. β este semnificativ statistic, fiind improbabil ca parametrul b să provină dintr-o
populaţie cu β = 0.

11
5. Aplicarea analizei de tip ANOVA şi interpretarea rezultatelor

Conform datelor din Excel:

Tabel nr. 2: Analiza ANOVA pentru descrierea legăturii dintre produsul intern brut şi
cheltuielile guvernamentale

ANOVA
Significance
df SS MS F F
Regression 1 10870087547194.70 10870087547194.70 1560.60 0.00
Residual 25 174133431329.91 6965337253.20
Total 26 11044220978524.60

Coefficients Standard Error t Stat P-value


Intercept -4255.55 19554.94 -0.22 0.83
Cheltuieli guvernamentale (mil Euro) 4.50 0.11 39.50 0.00
Sursa: Eurostat: [tec00001], [tec00010]

Unde:
df = degrees of freedom = grade de libertate
dfR = df Regression; dfE = df Residual
SS = sum of squares = suma pătratelor = varianţe
SSR = SS Regression; SSE = SS Residual
MS = mean of squares = media pătratelor (dispersia corectată)
MSR = MS Regression; MSE = MS Residual
F = testul Fisher de verificare a validităţii

În coloana gradelor de libertate (df) observăm pe primul rând numărul corespondent


variabilelor independente considerate, k = 1. Pe cel de-al doilea rând avem numărul gradelor de
libertate, n–k–1 = 27–1–1 = 25, iar pe ultimul totalul celor două.

În coloana sumei pătratelor (SS) avem valori obţinute cu ajutorul formulelor:


𝒏

̅)𝟐 = 𝟏𝟎𝟖𝟕𝟎𝟎𝟖𝟕𝟓𝟒𝟕𝟏𝟗𝟒. 𝟕𝟎
𝑺𝑺𝑹 = ∑(ŷ𝒊 − 𝒚
𝒊=𝟏
𝒏

𝑺𝑺𝑬 = ∑(𝒚𝒊 − ŷ𝒊 )𝟐 = 𝟏𝟕𝟒𝟏𝟑𝟑𝟒𝟑𝟏𝟑𝟐𝟗. 𝟗𝟏


𝒊=𝟏

12
𝒏

̅)𝟐 = 𝑺𝑺𝑹 + 𝑺𝑺𝑬 = 𝟏𝟏𝟎𝟒𝟒𝟐𝟐𝟎𝟗𝟕𝟖𝟓𝟐𝟒. 𝟔𝟎


𝑺𝑺𝑻 = ∑(𝒚𝒊 − 𝒚
𝒊=𝟏

Iar coloana mediilor pătratelor s-a obţinut astfel:


𝑺𝑺𝑹
𝑴𝑺𝑹 = = 𝟏𝟎𝟖𝟕𝟎𝟎𝟖𝟕𝟓𝟒𝟕𝟏𝟗𝟒. 𝟕𝟎
𝒅𝒇𝑹
𝑺𝑺𝑬
𝑴𝑺𝑬 = = 𝟔𝟗𝟔𝟓𝟑𝟑𝟕𝟐𝟓𝟑. 𝟐𝟎
𝒅𝒇𝑬
Valoarea lui Fcalc (testul de verificare a validităţii a modelului de regresie) se obţine
𝑴𝑺𝑹
astfel: 𝑭𝒄𝒂𝒍𝒄 = 𝑴𝑺𝑬 = 𝟏𝟓𝟔𝟎. 𝟔𝟎.

Pentru ca regresia să fie liniară este obligatoriu ca valorile Significance F şi P-value să fie
egale între ele şi mai mici de 0.05 (nivel de semnificaţie utilizat: α = 5%). În cazul analizat,
această condiţie este îndeplinită, lucru evidenţiat de înregistrările marcate cu roşu în tabelele de
mai sus, ambele fiind egale cu 0.
Prin împărţirea sumelor pătratelor obţinem coeficientul de determinaţie:
𝑺𝑺𝑹
𝑹𝟐 = = 𝟎. 𝟗𝟖
𝑺𝑺𝑬
Rezultatul este acelaşi cu valoarea lui R Square din SUMMARY OUTPUT.

6. Testarea ipotezelor statistice clasice asupra modelului de regresie


simplă
Ipoteze statistice clasice:
- evaluarea validităţii modelului de regresie clasic
- testarea liniarităţii modelului propus
- testarea normalităţii erorilor
- testarea ipotezei de homoscedasticitate
- testarea ipotezei de autocorelare a erorilor

6.1. Evaluarea vailidtăţii modelului de regresie clasic


Din analiza ANOVA prezentată anterior extragem valoarea testului F de verificare a
validităţii modelului.

Astfel: Fcalculat = 1560.60


Din Excel se poate afla şi valoarea tabelară a testului F:

Ftabelar = FINV(0.05, 1, 25) = 4.24


13
Prin compararea celor două valori observăm că Fcalculat > Ftabelar, ceea ce ne indică
faptul că modelul de regresie liniară este reprezentativ pentru descrierea legăturii dintre
produsul intern brut şi cheltuielile guvernamentale.

6.2. Testarea liniarităţii modelului de regresie propus


Formularea ipotezelor
H0: legătura dintre variabile este liniară
H1: legătura dintre variabile nu este liniară

Tabel nr. 3: Output-ul de regresie pentru testarea legăturii dintre


produsul intern brut şi cheltuielile guvernamentale
Regression Statistics
Multiple R 0.9921
R Square 0.9842
Adjusted R Square 0.9836
Standard Error 83458.60
Observations 27.00
Sursa: Eurostat: [tec00001], [tec00010]
În tabelul regresiilor, prezentat mai sus, observăm valorile aproximativ egale ale
coeficientului de corelaţie (Multiple R) şi ale coeficientului de determinaţie (R Square):
0.9921 ≈ 0.9842
Astfel, avem suficientă evidenţă statistică pentru a putea accepta ipoteza nulă în favoarea
celei alternative, existând o legătură liniară de intensitate ridicată între produsul intern brut şi
cheltuielile guvernamentale.

6.3. Testarea normalităţii erorilor


Formularea ipotezelor
H0: distribuţia erorilor este normală
H1: distribuţia erorilor nu este normală
În vederea testării ipotezei de normalitate a erorilor se va porni de la valoarea tabelară a
testului Student pentru gradele de libertate considerate şi a erorii standard a estimaţiei:
ttab = t(α/2;n-k-1) = t(0.05/2;25)= TINV(0.05, 25) = 2.06
Se = 83458.60
Condiţia de normalitate este ca toate valorile reziduale să fie cuprinse în intervalul:
( - ttab*Se; + ttab*Se)
( - 171886.19; + 171886.19 )
14
Se va crea apoi graficul următor, cu valorile previzionate pentru produsul intern brut pe
axa Ox şi valorile reziduale pe axa Oy. Liniile roşii semnifică reprezentarea grafică a intervalului
menţionat mai sus, între limitele căruia trebuie să fie cuprinse valorile reziduale, pentru a putea
accepta ipoteza de normalitate.

Figura nr. 2: Reprezentarea grafică a intervalului construit pe pragul de semnificaţie 5%

Residuals
300,000

200,000

100,000
Residuals

0
0.00 500,000.00 1,000,000.00 1,500,000.00 2,000,000.00 2,500,000.00
-100,000

-200,000

-300,000
Predicted PIB(milioane Euro)

Sursa: Eurostat: [tec00001], [tec00010]

Se observă faptul că există valori în afara intervalului de acceptare a ipotezei de


normalitate, ceea ce ne demonstrează existenţa a suficientă evidenţă statistică pentru a respinge
ipoteza nulă în favoarea celei alternative: distribuţia erorilor nu este normală în situaţia
analizată.

6.4. Testarea ipotezei de homoscedasticitate


Etapa 0: Formularea ipotezelor
H0: dispersia erorilor este constantă (homoscedasticitate)
H1: dispersia erorilor nu este constantă (heteroscedaticitate)
Etapa 1: Ordonarea seriei de date după valorile variabilei independente (X)
Etapa 2: Împărţirea seriei de date în 3 părţi, după cum urmează:
Prima parte: 40%. A doua parte: 20%. A treia parte: 40%.
Împărţirea este evidenţiată în tabel prin colorarea diferită a celulelor.

15
Tabel nr. 4: Seria de date ordonată în mod crescător după
valorile înregistrate pentru cheltuielile guvernamentale
xi yi
Cheltuieli guvernamentale PIB
(mil Euro) (mil Euro)
Malta 1246.70 5749.70
Estonia 3048.70 13860.80
Cipru 3364.40 16946.50
Letonia 3637.20 18538.70
Bulgaria 5695.00 35043.10
Lituania 5816.70 26507.70
Luxemburg 6349.10 38044.70
Slovacia 7168.30 35384.40
Slovenia 12601.70 63050.70
Ungaria 20663.80 92941.60
Romania 20985.60 115869.20
Cehia 30223.50 137161.50
Irlanda 31090.90 159645.70
Portugalia 35825.60 168075.60
Finlanda 43002.00 171315.00
Grecia 45442.70 233046.00
Austria 54714.20 274320.50
Polonia 57249.50 310485.50
Danemarca 66651.70 222409.80
Suedia 81333.70 290908.00
Belgia 83681.00 339162.00
Olanda 162654.00 571979.00
Spania 222782.00 1053914.00
Italia 327814.00 1520870.00
Marea Britanie 367468.10 1563106.40
Franta 469755.50 1907145.00
Germania 472140.00 2397100.00
TOTAL 2642405.60 11782581.10
Sursa: Eurostat: [tec00001], [tec00010]

Etapa 3: Efectuarea a două analize de tip ANOVA pentru primul şi ultimul set de date
ANOVA - primul set de date
Significance
df SS MS F F
Regression 1.00 10371996891.44 10371996891.44 267.98 0.00
Residual 8.00 309633021.30 38704127.66
Total 9.00 10681629912.74

16
ANOVA - al doilea set de date
Significance
df SS MS F F
Regression 1.00 5405664256982.75 5405664256982.75 270.12 0.00
Residual 8.00 160098644039.30 20012330504.91
Total 9.00 5565762901022.04

Etapa 4: Extragerea din ANOVA pentru fiecare set a SSE-urilor:


SSE1 = 309633021.30
SSE2 = 160098644039.30
Etapa 5: Alegerea testului statistic
Pentru verificarea dispersiei erorilor se va folosi testul F.
Ftabelar = F(α; df; df) = F(α; (n-d-k)/2; (n-d-k)/2) = F(0.05; 10;10) = FINV(0.05, 10, 10) = 2.98
Unde: n = numărul total de observaţii
d = numărul de observaţii omise
k = numărul de variabile independente
Etapa 6: Compararea valorii tabelare cu cea calculată
Fcalculat = SSE2/SSE1 = 517.06
Se observă că: Fcalculat > Ftabelar
Acest lucru ne indică faptul că nu se verifică ipoteza conform căreia dispersia erorilor
este constantă, deoarece coeficienţii obţinuţi sunt afectaţi de eroare. Astfel, există suficientă
evidenţă statistică pentru a respinge ipoteza nulă (H0), în favoarea celei alternative (H1), dispersia
erorilor fiind afectată de heteroscedasticitate. Această concluzie se poate observa şi în graficul
următor:
Figura nr. 3: Dispersia erorilor în modelul de regresie propus

Residual Plot
300,000.00

200,000.00

100,000.00
Residuals

0.00
0 100,000 200,000 300,000 400,000 500,000
-100,000.00

-200,000.00

-300,000.00
Cheltuieli guvernamentale (mil Euro)

Sursa: Eurostat: [tec00001], [tec00010]

17
6.5. Testarea ipotezei de autocorelare a erorilor
Formularea ipotezelor
H0: nu există autocorelare a erorilor
H1: există autocorelare a erorilor
Pentru testarea acestei ipoteze se va utiliza testul Durbin-Watson.
∑𝒏𝒊=𝟏(𝒆𝒊 − 𝒆𝒊−𝟏 )𝟐 𝟒𝟎𝟕𝟏𝟕𝟖𝟖𝟕𝟎𝟗𝟖𝟎. 𝟐𝟔
𝑫= = = 𝟐. 𝟑𝟒
∑𝒏𝒊=𝟏 𝒆𝟐𝒊 𝟏𝟕𝟒𝟏𝟑𝟑𝟒𝟑𝟏𝟑𝟐𝟗. 𝟗𝟏

Luăm din tabele valorile pentru dL şi dU, pentru cazul de faţă: n = 27 şi k = 1:


dL = 1.09 şi dU = 1.23

zonă zonă
respingere respingere
indecizie indecizie

zonă acceptare

0 1.09 1.23 2 2.34 2.77 2.91 4


Se observă că Dcalculat aparţine zonei de acceptare: 2.34 ∈ (1.23; 2.77).
Există suficientă evidenţă statistică pentru a accepta ipoteza nulă (şi a o respinge pe cea
alternativă), conform căreia nu există autocorelare a erorilor.

7. Previziunea valorii variabilei Y dacă variabila X creşte cu 10% faţă de


ultima valoare înregistrată

Se va avea în vedere ultima valoare înregistrată a cheltuielilor guvernamentale:


Marea Britanie, cu nivelul cheltuielilor guvernamentale x = 367468.10 mil. Euro
x’ = x + 10%*x = 1.1*x = 1.1*367468.10 mil. Euro
x’ = 404214.91 mil. Euro
Pornind de la această valoare, se va încerca previzionarea nivelului produsului intern brut
pentru o ţară cu nivelul cheltuielilor guvernamentale de 404214.91 mil. Euro.
ŷ’ = f(x’) = - 4255.55 + 4.50*x’ = 1815729.70 mil. Euro
ŷ’ = 1815729.70 mil. Euro

18
Dacă ar exista o ţară cu nivelul cheltuielilor guvernamentale de 404214.91 mil. Euro, este
probabil ca nivelul produsului intern brut să fie de 1815729.70 mil. Euro.

Intervalul de încredere pentru valoarea previzionată

Ŷ′ ∈ (ŷ′ ± 𝐸), unde:

𝟏 (𝒙𝒊 ′ − 𝒙
̅) 𝟐
𝑬 = 𝒕(𝜶 ;𝒏−𝟐) ∗ 𝑺𝒆 √𝟏 + + 𝒏 = 𝟏𝟖𝟗𝟐𝟑𝟔. 𝟏𝟏
𝒏 ∑𝒊=𝟏(𝒙𝒊 − 𝒙 ̅) 𝟐

t(α; n-2) = t(0.05; 25) = TINV(0.05, 25) = 2.06


Se = 83458.60
E = 189236.11

ŷ’ – E < Ŷ’ < ŷ’ + E
1815729.70 – 189236.11 < Ŷ’ < 1815729.70 + 189236.11
1626493.59 mil. Euro < Ŷ’ < 2004965.81 mil. Euro
Ŷ’ ∈ ( 1626493.59; 2004965.81 )

Pentru o ţară cu nivelul cheltuielilor guvernamentale de 404214.91 mil. Euro, ar trebui să


ne aşteptăm ca produsul intern brut să aibă o valoare cuprinsă între 1626493.59 mil. Euro şi
2004965.81 mil. Euro.

19
ANEXE

Anexa nr. 1: Rezultate obţinute în urma folosirii metodei de calcul clasice

3.1. Estimarea punctuală a parametrilor

∑𝒏 𝒏 𝟐 𝒏 𝒏
𝒊=𝟏 𝒚𝒊 ∑𝒊=𝟏 𝒙𝒊 −∑𝒊=𝟏 𝒙𝒊 ∑𝒊=𝟏 𝒙𝒊 𝒚𝒊
∑𝐧𝐢=𝟏 𝐲𝐢 = 𝐧𝐚 + 𝐛 ∑𝐧𝐢=𝟏 𝐱𝐢 𝒂= 𝟐 ̅ − 𝒃𝒙
=𝒚 ̅
𝒏 ∑𝒏 𝟐 𝒏
𝒊=𝟏 𝒙𝒊 −(∑𝒊=𝟏 𝒙𝒊 )
 { 𝐧 => { =>
∑𝐢=𝟏 𝐱𝐢 𝐲𝐢 = 𝐚 ∑𝐧𝐢=𝟏 𝐱𝐢 + 𝐛 ∑𝐧𝐢=𝟏 𝐱𝐢𝟐 ∑𝒏 ̅𝒚
𝒊=𝟏 𝒙𝒊 𝒚𝒊 −𝒏𝒙 ̅
𝒃= ∑𝒏 𝒙 𝟐 −𝒏𝒙
̅ 𝟐
𝒊=𝟏 𝒊

̅ − 𝒃𝒙
𝒂=𝒚 ̅
 { 𝟑𝟓𝟔𝟕𝟑𝟒𝟖𝟎𝟒𝟕𝟓𝟐𝟎.𝟐𝟓−𝟐𝟕∗𝟗𝟕𝟖𝟔𝟔.𝟖𝟕∗𝟒𝟑𝟔𝟑𝟗𝟏.𝟖𝟗 𝟐𝟒𝟏𝟒𝟐𝟐𝟑𝟔𝟔𝟔𝟕𝟑𝟖.𝟗𝟖 =>
𝒃= 𝟕𝟗𝟒𝟕𝟗𝟕𝟗𝟗𝟑𝟔𝟓𝟕.𝟏𝟎−𝟐𝟕∗ 𝟗𝟕𝟖𝟔𝟔.𝟖𝟕𝟐
= 𝟓𝟑𝟔𝟏𝟗𝟒𝟎𝟏𝟕𝟓𝟒𝟗.𝟐𝟕
= 𝟒. 𝟓𝟎𝟑

𝒂 = 𝟒𝟑𝟔𝟑𝟗𝟏. 𝟖𝟗 − 𝟒. 𝟓𝟎𝟑 ∗ 𝟗𝟕𝟖𝟔𝟔. 𝟖𝟕 𝒂 = −𝟒𝟐𝟓𝟓. 𝟓𝟓𝟐


 { => {
𝒃 = 𝟒. 𝟓𝟎𝟑 𝒃 = 𝟒. 𝟓𝟎𝟑

3.2. Estimarea parametrilor prin interval de încredere


4.2. Testarea coeficienţilor şi a parametrilor
Eroarea standard a estimaţiei:
2
∑𝑛𝑖=1(𝑦𝑖 − ŷ𝑖 ) 174133431329.91
𝑺𝒆 = √ =√ = 𝟖𝟑𝟒𝟓𝟖. 𝟔𝟎
𝑛−𝑘−1 27 − 1 − 1

Eroarea standard a termenului liber:

∑𝑛 𝑥 2 794797993657.10
𝑺𝒂 = 𝑆𝑒 √ 𝑛 𝑖=1 𝑖 2
= 83458.60 ∗ √ = 𝟏𝟗𝟓𝟓𝟒. 𝟗𝟒
𝑛 ∑𝑖=1(𝑥𝑖 − 𝑥̅ ) 27 ∗ 536194017549.27

Eroarea standard a coeficientului de regresie:

𝑆𝑒 83458.60
𝑺𝒃 = 𝑛
= = 𝟎. 𝟏𝟏
√∑𝑖=1(𝑥𝑖 − 𝑥̅ )2 √536194017549.27

7. Interval de încredere pentru valoarea previzionată

𝟏 (𝒙𝒊 ′ − 𝒙
̅) 𝟐
𝑬 = 𝒕(𝜶 ;𝒏−𝟐) ∗ 𝑺𝒆 √𝟏 + +
𝒏 ∑𝒏𝒊=𝟏(𝒙𝒊 − 𝒙 ̅) 𝟐

1 (404214.91−97866.87)2
𝑬 = 2.06 ∗ 83458.60√1 + + = 𝟏𝟖𝟗𝟐𝟑𝟔. 𝟏𝟏
27 536194017549.27

20
Anexa nr. 2: Prelucrarea observaţiilor în Excel: valorile înregsitrate pentru cheltuielile guvernamentale şi produsul intern brut în anul 2009 în
Uniunea Europeană5

i xi yi
Nr. Ch. Guv. (mil xi2 xi*yi yi - ŷi (yi - ŷi)2 xi-xmed (xi-xmed)2
PIB (mil €)
Crt. €)
Belgia 1 83681.00 339162.00 7002509761.00 28381415322.00 -33357.73 1112737969.97 -14185.87 201239023.25
Bulgaria 2 5695.00 35043.10 32433025.00 199570454.50 13656.81 186508379.79 -92171.87 8495654370.33
Cehia 3 30223.50 137161.50 913459952.25 4145500595.25 5335.17 28464078.21 -67643.37 4575626056.13
Danemarca 4 66651.70 222409.80 4442449112.89 14823991266.66 -73435.18 5392726128.97 -31215.17 974387092.47
Germania 5 472140.00 2397100.00 222916179600.00 1131766794000.00 275536.31 75920255947.38 374273.13 140080372790.36
Estonia 6 3048.70 13860.80 9294571.69 42257420.96 4389.52 19267909.51 -94818.17 8990486134.74
Irlanda 7 31090.90 159645.70 966644062.81 4963528494.13 23913.89 571874079.38 -66775.97 4459030713.54
Grecia 8 45442.70 233046.00 2065038983.29 10590239464.20 32694.94 1068959031.53 -52424.17 2748294027.35
Spania 9 222782.00 1053914.00 49631819524.00 234793068748.00 55089.40 3034841918.76 124915.13 15603788685.09
Franta 10 469755.50 1907145.00 220670229780.25 895891853047.50 -203682.44 41486535460.06 371888.63 138301150093.07
Italia 11 327814.00 1520870.00 107462018596.00 498562478180.00 49136.84 2414429081.25 229947.13 52875680721.59
Cipru 12 3364.40 16946.50 11319187.36 57014804.60 6053.78 36648222.00 -94502.47 8930717606.12
Letonia 13 3637.20 18538.70 13229223.84 67428959.64 6417.69 41186749.54 -94229.67 8879231476.11
Lituania 14 5816.70 26507.70 33833998.89 154187338.59 4573.45 20916449.87 -92050.17 8473234547.07
Luxemburg 15 6349.10 38044.70 40311070.81 241549604.77 13713.31 188054857.78 -91517.77 8375502971.47
Ungaria 16 20663.80 92941.60 426992630.44 1920526634.08 4158.00 17288989.37 -77203.07 5960314646.49
Malta 17 1246.70 5749.70 1554260.89 7168150.99 4391.96 19289327.13 -96620.17 9335458038.10
Olanda 18 162654.00 571979.00 26456323716.00 93034672266.00 -156118.15 24372876061.13 64787.13 4197371685.74
Austria 19 54714.20 274320.50 2993643681.64 15009226701.10 32224.34 1038407797.70 -43152.67 1862153279.74
Polonia 20 57249.50 310485.50 3277505250.25 17775139632.25 56974.10 3246048010.42 -40617.37 1649771076.67
Portugalia 21 35825.60 168075.60 1283473615.36 6021409215.36 11025.71 121566344.50 -62041.27 3849119688.73
Romania 22 20985.60 115869.20 440395407.36 2431584683.52 25636.69 657240001.72 -76881.27 5910730303.25
Slovacia 23 7168.30 35384.40 51384524.89 253645994.52 7364.55 54236538.92 -90698.57 8226231339.07
Slovenia 24 12601.70 63050.70 158802842.89 794546006.19 10566.86 111658534.56 -85265.17 7270149909.88
Finlanda 25 43002.00 171315.00 1849172004.00 7366887630.00 -18046.76 325685666.87 -54864.87 3010154407.16
Suedia 26 81333.70 290908.00 6615170755.69 23660623999.60 -71042.96 5047102849.50 -16533.17 273345844.96
M. Britanie 27 367468.10 1563106.40 135032804517.61 574391738905.84 -87170.09 7598624944.09 269601.23 72684821020.76
TOTAL 27 2642405.60 11782581.10 794797993657.10 3567348047520.25 0.00 174133431329.91 0.00 536194017549.27

5
Sursa: Eurostat: [tec00001], [tec00010]
Anexa nr. 3: Output-ul de regresie pentru observaţiile iniţiale
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.9921
R Square 0.98
Adjusted R Square 0.98
Standard Error 83458.60
Observations 27.00

ANOVA
Significance
df SS MS F F
Regression 1.00 10870087547194.70 10870087547194.70 1560.60 0.00
Residual 25.00 174133431329.91 6965337253.20
Total 26.00 11044220978524.60

Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95.0% Upper 95.0%
Intercept -4255.55 19554.94 -0.22 0.83 -44529.71 36018.61 -44529.71 36018.61
Cheltuieli guvernamentale (mil Euro) 4.50 0.11 39.50 0.00 4.27 4.74 4.27 4.74

22
Anexa nr. 4: Seria de date ordonată în mod crescător după valorile înregistrate pentru
cheltuielile guvernamentale6

xi yi

Cheltuieli guvernamentale PIB


(mil Euro) (mil Euro)

Malta 1246.70 5749.70


Estonia 3048.70 13860.80
Cipru 3364.40 16946.50
Letonia 3637.20 18538.70
Bulgaria 5695.00 35043.10
Lituania 5816.70 26507.70
Luxemburg 6349.10 38044.70
Slovacia 7168.30 35384.40
Slovenia 12601.70 63050.70
Ungaria 20663.80 92941.60
Romania 20985.60 115869.20
Cehia 30223.50 137161.50
Irlanda 31090.90 159645.70
Portugalia 35825.60 168075.60
Finlanda 43002.00 171315.00
Grecia 45442.70 233046.00
Austria 54714.20 274320.50
Polonia 57249.50 310485.50
Danemarca 66651.70 222409.80
Suedia 81333.70 290908.00
Belgia 83681.00 339162.00
Olanda 162654.00 571979.00
Spania 222782.00 1053914.00
Italia 327814.00 1520870.00
Marea
Britanie 367468.10 1563106.40
Franta 469755.50 1907145.00
Germania 472140.00 2397100.00
TOTAL 2642405.60 11782581.10

6
Sursa: Eurostat: [tec00001], [tec00010]
Anexa nr. 5: Output-ul de regresie pentru observaţiile sortate crescător necesare pentru testarea homoscedasticităţii

SUMMARY OUTPUT
Regression Statistics
Multiple R 0.99
R Square 0.97
Adjusted R Square 0.97
Standard Error 6221.26
Observations 10.00
ANOVA - primul set de date
Significance
df SS MS F F
Regression 1.00 10371996891.44 10371996891.44 267.98 0.00
Residual 8.00 309633021.30 38704127.66
Total 9.00 10681629912.74

P- Upper Lower Upper


Coefficients Standard Error t Stat value Lower 95% 95% 95.0% 95.0%
Intercept 1226.72 3350.24 0.37 0.72 -6498.94 8952.38 -6498.94 8952.38
X Variable 1 4.97 0.30 16.37 0.00 4.27 5.67 4.27 5.67
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.99
R Square 0.97
Adjusted R Square 0.97
Standard Error 141464.94
Observations 10.00
ANOVA - al doilea set de date
Significance
df SS MS F F
Regression 1.00 5405664256982.75 5405664256982.75 270.12 0.00
Residual 8.00 160098644039.30 20012330504.91
Total 9.00 5565762901022.04

P- Upper Lower Upper


Coefficients Standard Error t Stat value Lower 95% 95% 95.0% 95.0%
-
Intercept -58902.36 79324.04 -0.74 0.48 -241823.93 124019.22 241823.93 124019.22
X Variable 1 4.66 0.28 16.44 0.00 4.00 5.31 4.00 5.31
Anexa nr. 6: Valorile necesare pentru calcularea testului Durbin-Watson7

i yi - ŷi
Nr. Crt. ei ei - 1 ei - ei-1 (ei - ei-1)2 ei2
1 -33357.73 -33357.73 1112737969.97 1112737969.97
2 13656.81 -33357.73 47014.53 2210366442.66 186508379.79
3 5335.17 13656.81 -8321.63 69249582.52 28464078.21
4 -73435.18 5335.17 -78770.36 6204769120.41 5392726128.97
5 275536.31 -73435.18 348971.49 121781100291.35 75920255947.38
6 4389.52 275536.31 -271146.78 73520578118.58 19267909.51
7 23913.89 4389.52 19524.37 381200873.23 571874079.38
8 32694.94 23913.89 8781.05 77106840.68 1068959031.53
9 55089.40 32694.94 22394.46 501511856.77 3034841918.76
10 -203682.44 55089.40 -258771.84 66962863682.41 41486535460.06
11 49136.84 -203682.44 252819.28 63917587402.81 2414429081.25
12 6053.78 49136.84 -43083.06 1856150306.13 36648222.00
13 6417.69 6053.78 363.91 132432.57 41186749.54
14 4573.45 6417.69 -1844.24 3401220.50 20916449.87
15 13713.31 4573.45 9139.86 83537021.97 188054857.78
16 4158.00 13713.31 -9555.31 91303881.56 17288989.37
17 4391.96 4158.00 233.96 54736.63 19289327.13
18 -156118.15 4391.96 -160510.11 25763495223.71 24372876061.13
19 32224.34 -156118.15 188342.48 35472890997.73 1038407797.70
20 56974.10 32224.34 24749.76 612550817.12 3246048010.42
21 11025.71 56974.10 -45948.39 2111254230.28 121566344.50
22 25636.69 11025.71 14610.98 213480725.12 657240001.72
23 7364.55 25636.69 -18272.15 333871334.46 54236538.92
24 10566.86 7364.55 3202.31 10254815.76 111658534.56
25 -18046.76 10566.86 -28613.62 818739452.01 325685666.87
26 -71042.96 -18046.76 -52996.20 2808597371.14 5047102849.50
27 -87170.09 -71042.96 -16127.13 260084232.18 7598624944.09

TOTAL 0.00 87170.09 -87170.09 407178870980.26 174133431329.91

7
Sursa: Eurostat: [tec00001], [tec00010]

Potrebbero piacerti anche