Sei sulla pagina 1di 10

1

4.5 Primjer: Nelinearni model viestruke regresije



Pod nelinearnim regresijskim modelom podrazumijeva se regresijski model nelinearan u
parametrima. Postoji li transformacija kojom se polazni nelinearni model linearizira, model e
se analizirati kao model viestruke linearne regresije. Meutim, ako model nije mogue
linearizirati, takav je model pravi nelinearni model.
Primjer 4.2
Analizirana je proizvodnja Q (u tonama), u ovisnosti o radu L (u satima) i kapitalu K u
satima rada strojeva u 14 industrijskih poduzea. Pretpostavljena je Cobb-Douglasova
proizvodna funkcija. Empirijske vrijednosti varijabli navedene su u Tabeli 4.16

Tabela 4.16 Proizvodnja u tonama, rad u satima i kapital (u radima sata strojeva u 14
industrijskih poduzea
Q L K
340 1272 463
376 1427 508
307 989 429
369 1539 485
404 1616 542
383 1599 508
415 1668 553
321 1066 446
342 1066 485
391 1591 519
360 1350 491
391 1462 531
412 1720 542
376 1591 497



Pretpostavljena je Cobb-Douglasova proizvodna funkcija:
c |
| |
=
2 1
0
K L Q
(4.69)

Logaritamskom transformacijom se nelinearni regresijski model (4.69) svodi na oblik
viestruke linearne regresije:
c | | | log log log log log
2 1 0
+ + + = K L Q
(4.70)

U tom je modelu Q log regresand (egzogena) varijabla, a L log i K log su regresorske
(endogene) varijable.

2

Na osnovi rezultata regresijske analize provedene uz programsku potporu EViews dobiveni su
izmeu ostalih slijedei rezultati
1
predoeni u Tabeli 4.17:

Tabela 4.17 Rezultati regresijske analize za podatke iz Tabele 4.16 (ispis EViews 5.1)
Dependent Variable: L_Q
Method: Least Squares

Sample: 1 14
Included observations: 14


Variable Coefficient Std. Error t-Statistic Prob.


C -0.418912 0.096816 -4.326889 0.0012
L_L 0.193073 0.009993 19.32019 0.0000
L_K 0.793744 0.024356 32.58900 0.0000


R-squared 0.998833 Mean dependent var 5.911021
Adjusted R-squared 0.998621 S.D. dependent var 0.091695
S.E. of regression 0.003405 Akaike info criterion -8.339637
Sum squared resid 0.000128 Schwarz criterion -8.202696
Log likelihood 61.37746 F-statistic 4707.829
Durbin-Watson stat 2.123003 Prob(F-statistic) 0.000000





Procijenjeni regresijski model u logaritamskom obliku glasi:

K L Q log 12 0.79374375 log 62 0.19307296 51 0.41891223 - =

log + + =

Interpretacije procijenjenih parametara: Procijenjeni parametri u nelinearnom modelu (4.69)
su procjene koeficijenata parcijalnih elastinosti pa se interpretiraju na slijedei nain:
Procijenjeni parametar uz prvu regresorsku varijablu je 0.193

1
= | , to znai da ako se rad
povea za 1%, a kapital ostane konstantan, tada e se proizvodnja u prosjeku poveati za
0.193%. Slino, povea li se kapital za 1%, s tim da je rad konstantan, proizvodnja e se u
prosjeku poveati za 0.794%


1
U ispisu su uvedene slijedee oznake:
(K) K L (L) L L Q Q L log _ log _ ) log( _ = = = . Pri transformaciji su koriteni su prirodni logaritmi.

3

Dio ispisa rezultata za podatke iz Tabele 4.11 dobiven programskom potporom SAS dan je u
Tabeli 4.18


Tabela 4.18: Procjene parametara jednim brojem i 95% intervalne procjene
parametara za podatke iz Tabele 4.12 (ispis SAS 9.1)

Parameter Estimates

Parameter Standard
Variable DF Estimate Error t Value Pr > |t|

Intercept 1 -0.41891 0.09682 -4.33 0.0012
L_L 1 0.19307 0.00999 19.32 <.0001
L_K 1 0.79374 0.02436 32.59 <.0001

Parameter Estimates

Variable DF 95% Confidence Limits

Intercept 1 -0.63200 -0.20582
L_L 1 0.17108 0.21507
L_K 1 0.74014 0.84735


Intervalne procjene parametara uz nezavisne varijable za pouzdanost 95% glase:

{ }
{ } 95 . 0 84735 . 0 74014 . 0
95 . 0 21507 . 0 17108 . 0
2
1
= < <
= < <
|
|
P
P


a tumae se na slijedei nain:
Povea li se rad za 1%, a kapital ostane konstantan, proizvodnja e se u prosjeku, uz
vjerojatnost 0.95 poveati izmeu 0.17108% i 0.21507%.
Analogno, povea li se kapital za 1%, a rad ostane konstantan, proizvodnja e se u prosjeku,
uz vjerojatnost 0.95 poveati izmeu 0.74014% i 0.84735%.

Pojedinani testovi, kojima se testira znaajnost regresorskih varijabli, predoeni su u Tabeli
4.19
Tabela 4.19: Test o znaajnosti pojedine regresorske varijable. Razina signifikantnosti
05 . 0 = o

4


df=11, 05 . 0 = o
0 :
0 :
1 1
1 0
>
=
|
|
H
H

1 05 . 0 1
05 . 0
1
1
1
) 11 (
796 . 1 ) 11 (
32 . 19
)

H t t
t
SE
t
>
=
= =
|
|


Alternativno: 0000 . 0 = vrij p
1
H vrij p < o
df=11, 05 . 0 = o
0 :
0 :
2 1
2 0
>
=
|
|
H
H

1 05 . 0 2
05 . 0
2
2
2
) 11 (
796 . 1 ) 11 (
59 . 32
)

H t t
t
SE
t
>
=
= =
|
|

Alternativno: 0000 . 0 = vrij p
1
H vrij p < o

Zakljuuje se da je uz zadanu razinu signifikantnosti ( 05 . 0 = o ) svaka pojedina regresorska
varijabla statistiki signifikantna.

Rezultati skupnog testa, za podatke primjera 4.2 predoeni su u Tabeli 4.20

Tabela 4.20: Skupni test o znaajnosti regresorskih varijabli


2 , 1 , 0 :
0 :
1
2 1 0
= = -
= =
j H
H
j
|
| |

829 . 707 4
)) 1 ( /(
/
=
+
=
k n SR
k SP
F
1
1
05 . 0
) 7 , 2 (
05 . 0
) 7 , 2 (
000000 . 0
:
98 . 3
H vrij p vrij p
no Alternativ
H F F F
> =
> =
o


Na osnovi rezultata skupnog testa za primjer 4.2 zakljuuje se da barem jedna regresorska
varijabla ima signifikantnog utjecaja na varijacije proizvodnje.

5

Iz dijela ispisa rezultata regresijske analize za podatke iz primjera 4.2 pomou programske
potpore SAS navedenog u Tabeli 4.20 mogu se izvesti slijedei zakljuci o reprezentativnosti
modela:
Tabela 4.21: Tabela ANOVA i pokatzatelji reprezentativnosti modela (ispis SAS 9.1)

Analysis of Variance

Sum of Mean
Source DF Squares Square F Value Pr > F

Model 2 0.10918 0.05459 4707.83 <.0001
Error 11 0.00012755 0.00001160
Corrected Total 13 0.10930

Root MSE 0.00341 R-Square 0.9988
Dependent Mean 5.91102 Adj R-Sq 0.9986
Coeff Var 0.05761



Sredina kvadrata neprotumaenih odstupanja, odnosno procijenjena varijanca regresije iznosi
0000116 . 0
2
= o , procijenjena standardna devijacija regresije je 00341 . 0 = o , odnosno
procijenjeni koeficijent varijacije je = V

0.05761 S obzirom da je model procijenjen na


osnovi logaritamskih vrijednosti varijabli, procijenjena standardna devijacija regresije tumai
se kao prosjeno odstupanje logaritama empirijskih od logaritama procijenjenih vrijednosti
proizvodnje. To odstupanje izraeno relativno iznosi 0.058%.

Koeficijent determinacije je 9988 . 0
2
= R , to znai da je 99.88% svih odstupanja
protumaeno procijenjenim regresijskim modelom. Korigirani je koeficijent determinacije
9986 . 0
2
= R .

Koeficijent multiple korelacije iznosi 0.9994 9988 . 0 = = R , to znai da u lineariziranom
modelu izmeu zavisne varijable i odabranog skupa nezavisnih varijabli postoji vrlo jaka
linearna veza.

Testira li se u primjeru 4.2 s procijenjenim modelom:
K L Q log 045391 . 3 log 430253 . 1 83955 . 22

log + + =

6

hipoteza
2
1 :
2 1 0
= + | | H , tj. pretpostavka o konstantnom prinosu dolazi se (ispis EViews) do
slijedeeg rezultata:


Tabela 4.22 Rezultat Waldovog testa za hipotezu 1 :
2 1 0
= + | | H u primjeru 4.2 (ispis
EViews 5.1)

Wald Test:
Equation: Untitled


Test Statistic Value df Probability


F-statistic 0.629022 (1, 11) 0.4445
Chi-square 0.629022 1 0.4277



Null Hypothesis Summary:


Normalized Restriction (= 0) Value Std. Err.


-1 + C(2) + C(3) -0.013183 0.016622


Restrictions are linear in coefficients.



Empirijska razina signifikantnosti za F-test je 0.4445, a empirijska razina signifikantnosti za
Hi-kvadrat test je 0.4277, te se nulta hipoteza o konstantnom prinosu prihvaa kao mogua.

Napomena 4.1
Test o konstantnom prinosu moe se provesti alternativno kao t-test, pri emu se hipoteze
formuliraju:
0 1 :
2 1 0
= + | | H
0 1 :
2 1 0
= + | | H
A testovna veliina:
)

(
1

2 1
2 1
| |
| |
+
+
=
SE
t
Pripada t-distribuciji s n-(k+1) stupnjeva slobode.

2
U programu EViews parametri su oznaeni: ),... 3 ( ), 2 ( ), 1 (
2 1 0
C C C = = = | | |

7

Nazivnik od t moe se izraunati polazei od matrice varijanci i kovarijanci procijenjenih
parametara prema formuli:
)

( 2 )

var( )

var( )

( )

(
2 1 2 1 2 1 2 1
| | | | | | | | + + = + = + Cov Cov SE
Matrica varijanci i kovarijanci procijenjenih parametara u ovom je primjeru (ispis SAS 9.1):
Covariance of Estimates

Variable Intercept L_L L_K

Intercept 0.009373346 0.0005707463 -0.0021747
L_L 0.0005707463 0.0000998665 -0.000208395
L_K -0.0021747 -0.000208395 0.0005932239

Stoga je:
016622 . 0 000208395 . 0 2 0005932439 . 0 0000998665 . 0 )

(
2 1
= + = + | | SE
7935 . 0
016622 , 0
01319 , 0
)

(
1

2 1
2 1
=

=
+
+
=
| |
| |
SE
t
Teorijska vrijednost t-distribucije s 14-3=11 stupnjeva slobode za razinu signifikantnosti
= o 0.05 iznosi = ) 11 (
025 . 0
t 2.201. S obzirom da je ) 11 (
2 / o
t t < nulta se hipoteza ne
moe odbaciti. Nulta hipoteza, test veliina 1 )

(
2 1
+ | | , te standardna pogreka
)

(
2 1
| | + SE nalaze se u ispisu rezultata Waldovog testa (ispis EViews 5.1) u
posljednjem dijelu tabele 4.22.

Null Hypothesis Summary:


Normalized Restriction (= 0) Value Std. Err.


-1 + C(2) + C(3) -0.013183 0.016622


Restrictions are linear in coefficients.


8


4.6 Predvianje pomou modela viestruke linearne regresije

Kao to je ve opisano u poglavlju 3.7, predvianje budue vrijednosti zavisne varijable
pomou regresijskog modela jedan je od osnovnih ciljeva regresijske analize.

Zadatak predvianja je da se doe do prognostikih vrijednosti, te prognostikih intervala.

Postupak predvianja modelom viestruke linearne regresije samo je poopenje bivarijatnog
sluaja opisanog u poglavlju 3.7 uz napomenu da formule za izraunavanje prognostikih
pogreaka ukljuuju prethodno izvedene formule kao posebni sluaj.

Ako se pretpostavi da se veza meu varijablama odabranim u model u budunosti (odnosno u
okolini promotrenih prostornih toaka) nee mijenjati, tada se oekuje da za nove vrijednosti
regresorskih varijabli, odnosno za vektor opaenih (ili pretpostavljenih) vrijednosti
) (
2 1 fk f f f
x x x x = ' prognostika vrijednost zadovoljava jednadbu:

f f f
x y c | + ' = ,
(4.71)

a uz ispunjenje polaznih pretpostavki o modelu najbolji linearni procjenitelj vrijednosti
f
y je:

|

f f
x y ' =
(4.72)

pri emu je |

najbolji linearni nepristrani procjenitelj vektora parametara.


Matrica varijanci i kovarijanci od
f
y je:
f f f f
x X X x xf fVar x x Var y Var
1 2
) ( )

( )

( ) (

' ' = ' = ' = o | |
(4.73)
S obzirom da je vektor procijenjenih parametara normalno distribuiran i sluajna varijabla
f
y
ima normalnu distribuciju. Kako je zbog (4.72):
|
f f
x y E ' = ) ( ,
(4.74)
to je prema (4.74) i (4.73) distribucija od
f
y :

9

) ) ( , ( ~
1 2
f f f f
x X X x x N y


' ' ' o |
(4.75)

Prognostika pogreka, definirana kao odstupanje procjenitelja
f
y od varijable
f
y :
f f f f
x y y u c | | + ' = = )

(


(4.76)

ima centriranu normalnu distribuciju (vidjeti (3.182) (3.185)):


)) ) ( 1 ( , 0 ( ~
1 2
f f f
x X X x N u


' ' + o
(4.77)

Njena varijanca proporcionalna je varijanci varijable y, koja je openito nepoznata i
procjenjuje se s (4.39). Standardizirana prognostika pogreka izraunata kao omjer greke u
i procijenjene standardne devijacije od u (koja se dobije uvrtavanjem procjene o ) ima t-
distribuciju s [n-(k+1)] stupnjeva slobode:

| | ) 1 ( ~
) (

k n t
y y SE
y y
f f
f f

(4.78)

Odatle je prognostiki interval:

{ }

= + < < 1 ) ( ) (
2 / 2 / f f f f f f f
y y SE t y y y y SE t y P
(4.79)

Pored prognostikog intervala (4.79) rauna se i intervalna procjena vrijednosti
f
y u
populaciji. Ta je procjena prema (4.78) jednaka:

{ }

= + < < 1 ) ( ) (
2 / 2 / f f f f f
y SE t y y y SE t y P
(4.80)

pri emu je ) (
f
y SE procijenjena standardna devijacija od
f
y dobivena uvrtavanjem
procjene o u drugi korijen izraza za njegovu varijancu (4.73).


10

Za primjer 4.1 moe se izraunati prognostika vrijednost prometa za pretpostavljen broj
poslovnih jedinica 14000 i pretpostavljenu vrijednost indeksa nominalnih plaa 112.
Programskom potporom SAS dobivena je prognostika vrijednost i intervalna procjena
zavisne varijable u populaciji:

Obs JEDINICE PROMET IND_NP

1 12919 2816.63 79.2
2 12139 2649.86 83.9
3 11406 2434.78 92.4
4 11529 2781.05 95.5
5 11190 2839.45 97.0
6 13082 3242.06 100.0
7 12725 3428.84 103.8
8 13364 3736.54 108.0
9 12772 3826.39 109.6
10 12183 3980.57 111.7
11 14000 . 112.0

Lower Upper
prediction prediction Residual
Predicted limit of limit of of
Obs PROMET PROMET PROMET PROMET

1 2617.52 2238.72 2996.33 199.101
2 2571.06 2307.56 2834.56 78.796
3 2684.47 2430.39 2938.56 -249.695
4 2839.56 2608.98 3070.15 -58.515
5 2798.49 2506.92 3090.07 40.959
6 3465.17 3242.36 3687.97 -223.108
7 3507.33 3319.09 3695.57 -78.495
8 3855.08 3567.72 4142.44 -118.547
9 3744.14 3506.10 3982.18 82.245
10 3653.31 3384.81 3921.81 327.258
11 4194.27 3784.47 4604.07 .

Uvrsti li se u jednadbu
2 1
46876 . 38 291367 . 0 368 . 4193 x x y + + =
112 , 14000
2 1
= = x x ,

Dobiva se
27 . 4194 46876112 . 38 14000 291367 . 0 368 . 4193 = + + =
f
y ,
odnosno prema modelu se za pretpostavljene vrijednosti nezavisnih varijabli oekuje promet
od 4194.27 miliona HRK.

Uz vjerojatnost 0.95 se procjenjuje da e se za pretpostavljene vrijednosti nezavisnih varijabli
promet u populaciji kretati izmeu 3784.47 i 4604.07 mili