Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
=
+ + =
+ + =
Q Y
qU iP d Q
cY bX a y
( 14 )
Quanto associao das variveis com o tempo:
a) Estticos quando o ajustamento da varivel dependente em funo
do efeito da varivel explicativa ocorre simultaneamente no mesmo
perodo de tempo;
b) Dinmico quando as variveis dependentes se referem a perodos de
tempo diferentes.
93
Quanto finalidade:
a) Modelos de deciso so aqueles orientados para o processo de tomada
de decises;
b) Modelos de previso, que visam prever valores de uma varivel.
Tais classificaes no so excludentes. Portanto, um modelo pode ser, por
exemplo, linear, uniequacional, dinmico e de deciso ao mesmo tempo.
5.1.3. Pressupostos do Modelo
Para tornar completo o modelo economtrico, necessrio algumas suposies
sobre a distribuio de probabilidade dos erros aleatrios e
i
(HILL at al, op. cit, p172):
1. A relao entre as variveis explicativas X
1
, X
2
, ... , X
k
e a varivel explicada
(dependente) Y linear (hiptese da linearidade);
2. cov(e
i
, e
j
) = 0. A covarincia entre dois erros correspondentes a duas
observaes diferentes quaisquer zero. O tamanho do erro de uma
observao no tem qualquer influncia sobre o tamanho provvel do erro de
outra observao. Assim, qualquer par de erros no-correlacionado. Pode-
se afirmar, tambm, que no h correlao perfeita entre as variveis
explicativas, que devem ser linearmente independentes, ou seja, no
possvel a presena de uma varivel X que seja funo linear exata de outra;
3. E[e
I
] = 0. Cada erro aleatrio tem distribuio de probabilidade com mdia
zero. Alguns erros sero positivos, outros sero negativos; em um grande
nmero de observaes, eles tero mdia zero;
4. var(e
i
) = .
2
o Cada erro aleatrio tem distribuio de probabilidade com
varincia .
2
o A varincia
2
o um parmetro desconhecido e mede a
incerteza presente no modelo estatstico. a mesma para cada observao
e, assim, para nenhuma observao a incerteza do modelo ser maior ou
menor, nem estar diretamente vinculada a qualquer varivel econmica. Os
erros com essas propriedades chamam-se homocedsticos;
5. Os erros aleatrios e
i
tm distribuio normal; isto , e
i
~ N(0,
2
o ).
94
5.1.4. Qualidades Desejveis do Modelo
A qualidade de um modelo economtrico normalmente avaliada em funo das
seguintes propriedades desejveis (MATTOS apud KOUTSOYANNIS, 1977):
1. Plausibilidade terica segundo tal propriedade, o modelo deve ser
compatvel com os postulados da teoria econmica, isto , deve descrever e
explicar adequadamente o fenmeno sob anlise;
2. Capacidade explanatria nesse caso, o modelo deve ser capaz de explicar
os dados observados, cuja relao ela determina;
3. Exatido das estimativas dos parmetros os parmetros estimados devero
ser exatos no sentido de aproximar-se tanto quanto possvel dos verdadeiros
parmetros estruturais;
4. Capacidade de previso o modelo deve ser capaz de gerar previses
satisfatrias de valores futuros da varivel dependente;
5. Simplicidade o modelo deve representar as relaes econmicas com o
mximo de simplicidade em termos de nmeros de equaes e da forma
matemtica, ceteris paribus.
5.1.5. Hipteses do Modelo
Uma equao de regresso mltipla expressa um relacionamento linear entre
uma varivel dependente y e duas ou mais variveis. Para testar a hiptese que os
coeficientes |
i i i
X y H c | + = =
0
95
5.1.6. As propriedade dos Estimadores de Mnimos Quadrados, Supondo-se que os
Erros Sejam Distribudos Normalmente
Para se estimar os parmetros do modelo h muitas regras possveis. Entretanto,
a que ser empregada baseia-se no princpio dos mnimos quadrados. Com o princpio
dos mnimos quadrados, minimizamos a soma dos quadrados das diferenas entre os
valores observados
i
y e o seu valor esperado | |
k k i
X X y E | | | + + + = ...
2 2 1
.
Matematicamente, minimizamos a soma dos quadrados da funo dos parmetros
desconhecidos, com base nos dados (HILL at al, 2003, p.174).
| | ( )
2
=
i i i
y E y e ( 15 )
5.1.7. O Teste F para conjuntos de hipteses lineares
Forma-se uma varivel aleatria F pela razo de duas variveis qui-quadrado
independentes divididas pelos respectivos graus de liberdade (HILL at al, 2003, p. 200)
) , ( ~
2 1
2
2
1
1
m m F
m
V
m
V
F = ( 16 )
Diz-se que a distribuio F tem
1
m graus de liberdade no numerador e
2
m graus
de liberdade no denominador. Os valores de
1
m e
2
m definem a forma da distribuio. O
intervalo da varivel aleatria ( ) , 0 e tem uma longa cauda direita.
O teste F para um conjunto de hipteses baseia-se em uma comparao da soma
dos quadrados dos erros de um modelo de regresso mltipla no restrito, original, com
a soma dos quadrados dos erros de um modelo de regresso em que se supe
verdadeira a hiptese nula. A idia do teste F que, se essas somas de quadrados de
erros so substancialmente diferentes, ento a suposio de que a hiptese nula
96
verdadeira reduz significativamente a capacidade do modelo para ajustar os dados e,
assim, os dados no do suporte para a hiptese nula. Se a hiptese nula verdadeira,
espera-se que os dados sejam compatveis com as condies impostas aos parmetros.
Assim, esperamos pequena variao na soma de quadrados de erros quando supomos
verdadeira a hiptese nula.
Uma aplicao importante do teste F no que se chama teste de significncia
global de um modelo. Consideremos o modelo geral de regresso mltipla com (k 1)
variveis explanatrias e k coeficientes desconhecidos:
i k k t
e x x x x y + + + + + + = | | | | | ...
3 3 2 2 1 1 0
( 17 )
Para ver se temos um modelo explanatrio vivel, formulamos as seguintes
hipteses nula e alternativa:
zero de diferente dos um menos ao H
H
k
k
|
| | |
:
0 ,..., 0 , 0 :
1
2 1 0
= = =
( 18 )
A hiptese nula tem n 1 partes e chama-se hiptese conjunta. Ela afirma, como
uma conjectura, que qualquer um dos parmetros
k
| , que no o intercepto
0
| , zero.
Se a hiptese nula verdadeira, nenhuma das vaiveis explanatrias tem influncia
sobre y e, assim, nosso modelo tem pouco ou nenhum valor. Se a hiptese alternativa
1
H verdadeira, ento ao menos um dos parmetros diferente de zero e, assim, uma
ou mais das variveis aleatrias devem ser includas no modelo. A hiptese alternativa
no indica, entretanto, quais seriam essas variveis.
5.1.8. O Teste t para cada parmetro
k
|
Forma-se uma varivel aleatria t dividindo-se uma varivel aleatria normal
padronizada, ( ) 1 , 0 ~ N Z , pela raiz quadrada de uma varivel aleatria qui-quadrado
97
independente, ) (
2
~ m V _ , que foi dividida pelo seu nmero de graus de liberdade, m.
Ento:
m
t
m
V
Z
t ~ = ( 19 )
Quando estabelecemos um modelo de regresso mltipla, supomos que todas as
(k 1) variveis aleatrias influenciem a varivel independente . y Para confirmar essa
suposio, devemos examinar se ela , ou no, apoiada pelos dados. Ou seja, devemos
procurar saber se os dados proporcionam evidncia de que y esteja relacionado com
cada uma das variveis explanatrias. Se determinada varivel aleatria, digamos
k
x ,
no tem qualquer influncia sobre , y ento
k
| = 0. O teste de hiptese nula
geralmente chamado de teste de significncia para a varivel explanatria
k
x . Assim,
para verificar se os dados apresentam alguma evidncia de que y esteja relacionado
com
k
x , testamos
0 :
0 :
1
0
=
=
k
k
H
H
|
|
( 20 )
5.1.9. Exemplo economtrico - Um modelo Simples de Renda Nacional
Migon (1999) d alguns exemplos de modelos economtricos. Veremos apenas
um. Este modelo d origem a um sistema de duas equaes para determinao da
renda nacional no sentido Keynesiano. Uma das equaes, chamada de funo
consumo, descreve a relao entre consumo (C) e renda (Y).
) (Y f C = ( 21 )
98
O consumo cresce com a renda mas no de forma linear. A proporo da renda
destinada ao consumo decresce com o nvel da renda. Formalmente, essas condies
estabelecem que:
i. Propenso marginal ao consumo:
1 0 < <
dY
dC
( 22 )
ii. Propenso marginal ao consumo
0 <
Y
C
dY
d
( 23 )
Isso equivale a dizer que a elasticidade renda do consumo menor que 1, ou
seja,
1 <
dY
dC
C
Y
( 24 )
A especificao mais simples, satisfazendo essas propriedades a forma linear:
Y C | o + = ( 25 )
com 0 > o e 1 0 < < | .
O sistema se completa com uma segunda equao. Na verdade, uma identidade
contbil:
I C Y + = ( 26 )
onde I representa o investimento. Assim, teremos:
99
t t
Y C | o + = ( 27 )
t t t
I C Y + = ( 28 )
onde
t t
Y C e so variveis endgenas e
t
I exgena.
Podemos expressar esse sistema em forma reduzida, isto , as variveis
endgenas em termos das exgenas. Assim
t t
I C
|
|
|
o
=
1 1
( 29 )
t t
I Y
| |
o
=
1
1
1
( 30 )
ou simplesmente
I C
t 1 0
+ = ( 31 )
t t
I Y
1 0
o o + = ( 32 )
onde
0 0
o = e 1
1 0
= o o .
5.1.10. O Preditor de Mnimos Quadrados
A capacidade de prever valores da varivel dependente y um dos objetivos da
anlise de regresso linear (HILL at al, 2003, p. 126, 220). Determinado o modelo e os
pressupostos tericos do modelo vistos em 5.2.3, desejamos predizer, para
determinados valores das variveis explanatrias
i
x , o valor da varivel dependente
0
y
que dado por
0 2 2 1 1 0 0
... e x x x y
k k
+ + + + + = | | | | ( 33 )
100
em que
0
e um erro aleatrio. O erro aleatrio tem mdia ( ) 0
0
= e E e a varincia
( ) . var
2
0
o = e Admitimos tambm que
0
e no seja correlacionado com qualquer das
observaes amostrais; assim ( ) . 0 , cov =
j i
e e
Em (34), podemos substituir os parmetros desconhecidos por seus estimadores
b
k
. Como
o
y no conhecido, no podemos estimar o erro aleatrio
0
e ; substitumo-lo,
pois, por sua esperana zero. Isso produz o preditor de mnimos quadrados de
0
y ,
0 2 2 1 1 0 0
... e x b x b x b b y
k k
+ + + + + = ( 34 )
Esse previsor no tendencioso uma vez que o valor mdio do erro de previso
zero. Isto , se ) (
0 0
y y f = o erro de previso, ento 0 ) ( = f E . O preditor o
melhor, pois, para qualquer outro preditor linear no tendencioso de
0
y , a varincia do
erro de previso maior do que ) var( ) var(
0 0
y y f = .
Para obter ) var( f , levamos em conta que os parmetros desconhecidos e os
valores das variveis explanatrias so constantes, e que
0
e no est correlacionado
com os dados amostrais, no estando, assim, correlacionados com os estimadores b
k
de mnimos quadrados. Ento,
2
0
) var( o = e e as restantes varincias e covarincias dos
estimadores de mnimos quadrados se obtm com a aplicao da regra para o clculo
da varincia de uma soma ponderada. Cada um dos termos envolve ,
2
o que
substitumos por seu estimador o
2
para obter a varincia estimada do erro de previso
) r( a v f . A raiz quadrada dessa grandeza o erro padro da previso, ) r( a v ) ( f f ep = .
Se os erros aleatrios so distribudos normalmente, ou se a amostra grande,
ento
) (
0 0
0 0
~
) ( r a v
) (
k n
t
y y
y y
f ep
f
= ( 35 )
onde o intervalo de previso de 100(1 - o)% de
0
y , ) (
0
f ep t y
c
.
101
5.2. Inferncia Bayesiana
5.2.1. O Teorema de Bayes
Gamermar e Migon (1993) afirmam que o problema da inferncia estatstica pode
ser colocado como tendo uma quantidade de interesse desconhecida (no observveis)
u com valores possveis em um conjunto . O u pode ser um escalar, um vetor e H
(histria) a informao inicial de que dispomos. Essa informao pode ser sumarizada
probabilisticamente em ) | ( H p u e, se H for informativo o bastante para nossos
propsitos, isso tudo o que necessitamos. A descrio de nossa incerteza a respeito
de u est completa.
Se o problema no qual estamos interessados muito importante ou pouco
conhecido, H talvez no seja suficiente e, nesse caso, deve ser aumentado. Isso pode
ser resolvido atravs da observao de uma quantidade aleatria de X que esteja
relacionado com u . Antes de observar , X temos uma distribuio amostral de X dada
por ) , | ( H X p u onde a dependncia em , u fundamental aos nossos propsitos,
formulada explicitamente. Aps observar o valor de X a nossa quantidade de
informao sobre u aumentou: conhecamos H e passamos a conhecer
{ } x X H H = = * . Na realidade, H * um subconjunto de H (fizemos um refinamento
em H ). Agora a informao sobre , u est sumarizada em ) , | ( H x p u e a questo
passar de ) | ( H p u para ) , | ( H x p u .
Denotando por ) , | ( H x p u e por ) | ( H p u as densidades de ) , | ( H X u e ), | ( H u
tem-se:
) | (
) | , (
) , | (
H x p
H x p
H x p
u
u = =
) | (
) | ( ) , | (
H x p
H p H x p u u
( 36 )
onde
}
O
= u u d H x p H x p ) | , ( ) | ( ( 37 )
102
O resultado acima conhecido como teorema de Bayes. Podemos ver que a
funo no denominador no depende de u conforme (32) e portanto para a
determinao da quantidade de interesse, ) , | ( H x p u , apenas uma constante. Assim, a
forma usual do teorema de Bayes
) ( ) | ( ) | ( u u u p x p x p ( 38 )
onde o smbolo denota proporcional a, e a dependncia em , H por ser comum a
todos os termos removida por facilidade notacional mas no deve ser esquecida. Os
clculos acima so vlidos para quantidades discretas e contnuas, escalares, vetores
ou matrizes. O teorema fornece a regra de atualizao de probabilidade sobre u
partindo de ) (u p e chegando a ) | ( x p u . Por esse motivo, essas distribuies so
chamadas respectivamente de distribuio priori e posteriori.
Para recuperar a constante removida da frmula acima, basta reescrev-la como
) ( ) | ( ) | ( u u u p x kp x p = ( 39 )
onde
}
O
= = u u u d p x p k x p ) ( ) | ( ) (
1
( 40 )
)] | ( [ ) ( u
u
x p E x p = ( 41 )
) (x p recebe o nome de distribuio preditiva (ou marginal) de X pois a distribuio
que se espera que X tenha, sendo de certa forma uma predio. Assim, antes de
observar , X til para checar a adequao da priori atravs das predies que ela
fornece para . X Aps observar , X serve para testar o modelo como um todo, pois se o
valor de X que vem a ser observado recebia pouca probabilidade preditiva, ento as
previses que o modelo faz no so boas e ele deve ser questionado.
103
5.2.2. Funo de Verossimilhana
A funo de verossimilhana de u a funo que associa a cada u o valor
) | ( u x p . Denotaremos esta funo por ) ; ( x l u do ingls likelihood. Outras notaes
possveis so ) (u
x
l , ) | ( x l
x
u e ) (u l . Assim
+
O R x l : ) (.; ( 42 )
) | ( ) ; ( u u u x p x l = ( 43 )
A funo de verossimilhana associa (para um valor fixo x ) a probabilidade de
ser observado x a cada valor de u . Assim, quanto maior o valor de l maiores as
chances atribudas pelo particular valor de u considerado no evento fixado. Portanto, ao
fixar um valor de x e variar os valores de u observamos a plausibilidade
(verossimilhana) de cada um dos valores de u . Nota-se que:
i. 1 ) | ( =
}
dx x p
R
u , mas
}
O
= = O 1 ) ; ( k d x l u , em geral;
ii. A funo de verossimilhana conecta a priori posteriori usando para
isso os dados do experimento;
Por exemplo: ) , 2 ( ~ u Binomial X
) 1 , 0 ( ; 2 , 1 , 0 , ) 1 (
2
) ; ( ) | (
2
= O e =
|
|
.
|
\
|
= =
u u u u u x
x
x l x p
x x
mas
3
1
) 1 3 , 1 (
2
) 1 (
2
) ; (
2
1
0
= +
|
|
.
|
\
|
=
|
|
.
|
\
|
=
} }
O
x B
x
d
x
d x l
x
u u u u u
onde ) , ( b a B a funo Beta com parmetros a e b.
Note que:
104
a) se x=1 ento ) 1 ; ( = x l u = ) 1 ( 2 u u e o valor mais provvel (ou
verossmil) de u
2
1
;
b) se x = 2 ento ) 2 ; ( = x l u =
2
u , o valor mais provvel 1;
c) se x = 0 ento ) 0 ; ( = x l u =
2
) 1 ( u , o valor mais provvel 0.
Essas verossimilhanas esto plotadas na Figura 14.
Figura 14 - Funo de Verossimilhana para diferentes valores de x
A funo de verossimilhana d origem ao Princpio da Verossimilhana que
postula que todas as informaes contidas no experimento X est representada na
funo de verossimilhana. Esse princpio um divisor de guas na inferncia
colocando de um lado, as abordagens Bayesiana e da verossimilhana que o respeitam
e de outro a abordagem frequentista que no o respeita, pois esta leva em conta todos
os possveis valores de X (GAMERMAN e MIGON, 1993).
5.2.3. Modelo Linear Bayesiano - Previso Bayesiana
Previso estatstica tem um sentido bem definido, fazendo integrante do processo
de inferncia. Trata-se de se fazer afirmaes probabilsticas sobre quantidades a
serem observadas no futuro. No momento em que a inferncia feita, o problema
similar ao problema de estimao paramtrica. A grande diferena na previso
) 2 , (u L
) 1 , (u L
) 0 , (u L
0,5 1
0
0,5
) , ( x L u
) , ( x L u
1
u
105
Bayesiana que todas as informaes sero confrontadas com a realidade e passveis
de aprovao ou reprovao sem possibilidade de contestao.
O contexto tpico de um problema de previso aquele no qual observamos uma
quantidade X relacionada a outra quantidade no observvel u atravs de ) | (
1
u X P e
estamos interessados em fazer afirmaes sobre uma quantidade aleatria Y a ser
observada e que est ligada a X e u atravs de ) , | (
2
x Y P | (GAMERMAN e MIGON,
op. cit., 1993, p.164). Ento, aps observar x X = temos informao atualizada para
fazer inferncia sobre Y e esta informao mais atualizada sobre Y est na distribuio
de . | X Y Se queremos prever Y cuja descrio probabilstica ) | ( u Y P , que pode
independer de , X faremos a previso de Y atravs de ) | ( x Y P , onde
}
O
= u u d x y p x y p ) | , ( ) | (
u u u d x p x y p ) | ( ) , | (
}
O
=
u u u d x p y p ) | ( ) | (
}
O
=
)] | ( [
|
u
u
y p E
x
= ( 44 )
sempre til concentrar-se em previses ao invs de estimao, pois as
previses so verificveis. Isso porque o valor de Y observvel mas o de u no.
5.2.4. Distribuio piori
O nico elemento novo na anlise Bayesiana com relao frequentista so as
diferentes maneiras de se especificar a distribuio priori. Sua determinao , em
geral, subjetiva, nada impedindo, no entanto, que dados de experimentos passados
sejam utilizados. O nico compromisso que esta distribuio represente o
conhecimento sobre , u a quantidade desconhecida, antes de se realizar um
experimento. Outros mtodos alternativos para determinao direta da priori, so os
seguintes (GAMERMAN e MIGON, 1993, p 40):
106
5.2.5. Determinao subjetiva da priori
Seja u uma quantidade desconhecida e considere os seus possveis valores. Se
ela for discreta, a probabilidade priori de cada valor de u pode ser avaliada
diferentemente usando-se instrumentos auxiliares, tais como loterias ou roletas. Com
isso, associam-se a probabilidade a cada valor possvel de u .
No caso contnuo a situao um pouco mais complicada. Seguem as seguintes
sugestes:
a) Abordagem do histograma: inicialmente divide-se o espao de variao
de u em intervalos e especificam-se as probabilidades priori de u
pertencer a cada um dos intervalos. Com isso, constri-se um
histograma para u e procura-se, a partir da, ajustar uma curva
contnua ao histograma que ser que ser tomada como densidade
priori de , u sendo o nmero de intervalos escolhidos arbitrariamente.
Um aspecto importante e delicado a escolha da cauda onde se
concentra pouca probabilidade mas que pode ter uma influncia
considervel na inferncia subseqente.
2,00
1,50
1,00
,50
0,00
-,50
-1,00
-1,50
-2,00
Histograma
F
r
e
q
u
n
c
i
a
10
8
6
4
2
0
Std. Dev = ,93
Mean = -,05
N = 25,00
Figura 15 - Exemplo de um Histograma.
107
b) Abordagem da funo de distribuio: os percentis (quantis) de uma
quantidade aleatria X so definidas por
o
z o percentil 100o % de
X se ]. 1 , 0 [ , ) ( e = s o o
o
z P A mediana de , X denotada por , m o
percentil 50%, tal que . 5 , 0 ) ( = s m X P A coleo de percentis de
X define a funo de distribuio de . X Nesta abordagem, alguns
percentis sero determinados subjetivamente como no caso discreto e,
a seguir, uma curva contnua ser ajustada para representar a funo
de distribuio de u . Essa abordagem menos elucidativa, pois
mais difcil identificar uma distribuio pela sua funo de distribuio
de que pela sua identidade.
2,00 1,50 1,00 ,50 0,00 -,50 -1,00 -1,50 -2,00
Histograma
F
r
e
q
u
n
c
i
a
10
8
6
4
2
0
Figura 16 Ajuste de uma distribuio Normal
c) Abordagem de verossimilhana relativa: faz-se como na abordagem do
histograma, mas considerando-se as chances relativas de pontos ao
invs de intervalos. Isso possvel pois, apesar de
O e = =
0 0
, 0 ) ( u u u P .
) ( ) (
) (
) | (
1 0
0
1 0 0
u u
u
u u u u u u
p p
p
P
+
= = = = ( 45 )
108
onde p a densidade a priori de a priori de u . Assim, podemos obter um conjunto de
valores que representam a densidade priori de , u a menos de uma constante
normalizadora.
5.2.6. Determinao da priori por formas funcionais
A partir do conhecimento sobre u pode-se descrever sua densidade por uma
particular forma funcional. Eventualmente, define-se uma famlia paramtrica de
densidades. Em geral, isso facilita a anlise, mas devemos tomar cuidado de verificar se
a densidade escolhida est representando a informao que se dispe. A esse respeito,
valem as seguintes consideraes sobre u :
a) u se distribui simetricamente em relao moda;
b) sua densidade decai rapidamente quando se afasta da moda,
implicando numa varincia pequena;
c) intervalos muitos afastados da moda tm probabilidade desprezvel.
Essas consideraes poderiam caracterizar, pelo menos, aproximadamente, a
famlia de distribuio normal, cujos parmetros, aqui so chamados de
hiperparmetros. Essas idias podem conduzir a uma abordagem sistemtica para a
determinao de distribuies priori. O caso mais importante o das distribuies
conjugadas.
Se a distribuio observacional ) , ( ~ ) | (
2
o u u N X e se a distribuio a priori
) , ( ~
2
t u N ento a distribuio a posteriori de u tambm ser normal, com mdia
1
e
varincia
2
1
t . Logo, se comeamos com a Normal, tambm acabamos com uma Normal.
A vantagem desse tipo de priori a tratabilidade da anlise resultante e, portanto, a
possibilidade de explorar o aspecto seqencial do mtodo Bayesiano.
Definio 5-1: Seja { } O e u u), | (x p F uma famlia de distribuies amostrais ou
observacionais. Uma classe de distribuies + conjugada a F se:
109
F pe c + e ) (u p ento + e ) | ( x p u ( 46 )
Assim, vemos que a famlia de distribuies Normais conjugada famlia de
distribuies Normais. Alguns cuidados, entretanto, devem ser tomados:
i. a classe pode ser muito ampla. Por exemplo += {todas as distribuies}
e F qualquer. Neste caso no se hesita em afirmar que + conjugada a
F pois qualquer posterior estar contida em + e a distribuio deixa de
ter qualquer valor prtico;
ii. a classe +pode ser muito restrita. Suponha, por exemplo, que:
} 1 ) ( : {
0
= = = + u u P P ( 47 )
Isto implica que nenhuma amostra dar informao alguma pois tem-se certeza, a
priori, de que
0
u u = , ento, a posteriori, essa incerteza ser mantida. Isso porque:
=
=
=
0
0
0 x ) (
, 1 x ) (
) ( ) ( ) | (
u u u
u u u
u u u
se l
se l
p l x p
Assim, tem-se que:
=
=
=
0
0
0
), ( x
) | (
u u
u u u
u
l k
x p
Como
}
=1 ) | ( u u d x p , temos que 1 ) | ( = x p u , se
0
u u = . Logo + conjugada a
qualquer famlia de distribuies e novamente a definio deixa de ter qualquer valor
prtico.
O exemplo anterior ilustra, no caso extremo, um aspecto importante da
especificao (subjetiva) de probabilidade. Quando se atribui probabilidade 0 a um
particular conjunto de valores (possveis) de u , no existe informao nenhuma que
110
consiga mudar essa especificao, por mais bvia que possa vir a ser a impropriedade
dessa especificao. Para evitar que isso acontea, importante que o estatstico seja
aberto o suficiente de forma a atribuir probabilidade positiva a todo e qualquer valor
possvel de u , por mais improvvel que ele seja.
Portanto, a classe + deve ser ampla o suficiente para proporcionar a escolha de
uma distribuio a priori conveniente e, ao mesmo tempo, deve ser restrita para que a
definio seja til.
A classe exponencial de um parmetro adequada para muitos problemas. Uma
caracterstica essencial desta famlia que existe estatstica suficiente de dimenso fixa.
Para a famlia exponencial a um parmetro, a classe conjugada + facilmente
caracterizada e seus membros tm a forma:
)} ( ) ( exp{ ) ( u | u o| u b p +
e assim
)} ( ] 1 [ ) ( )] ( exp{[ ) | ( u | u | o u b x u x p + + +
A distribuio preditiva ou marginal ser
+ +
= H
=
) ), ( (
)] , ( ] ), ( [
) (
n x u k
k n x a
x p
i
i
| o
| o |
( 48 )
5.2.7. Principais famlias conjugadas
A seguir, esto os principais membros da famlia exponencial particularizando os
resultados obtidos na seo anterior.
111
5.2.7.1. Binomial
A famlia de distribuies Beta conjugada Binomial (ou Bernoulli);
5.2.7.2. Normal com varincia conhecida
A famlia de distribuies normais conjugada Normal.
)
`
2
2
) (
2
exp ) ; ( u
o
u x
n
x l ( 49 )
No caso de uma amostra de tamanho , n temos visto que os termos dependentes
em
2
o podem ser incorporados constante de proporcionalidade. Logo, a
verossimilhana a mesma que a obtida com uma observao com as substituies de
x por x e de
2
o por
n
2
o
. Outra forma de se dizer isso, observar que X suficiente
para u e, portanto, a verossimilhana obtida com a observao de X , que tem
distribuio ) , (
2
n
N
o
u proporcional obtida com a observao de X . Logo, a
distribuio a posteriori de u dado x ) , (
2
1 1
t N , com
2 2
2 2
1
+
+
=
t o
t o
n
x n
( 50 )
e
2 2 2
1
+ = t o t n
( 51 )
112
5.2.7.3. Poisson
Suponha uma amostra ) ..., {
1 n
X X X = da Poisson ). (u Sua densidade conjunta
ser:
[ [
= =
=
n
i
n
i
xi
i
xi
e
x p x p
1 1
!
) | ( ) | (
u
u u
u
( 52 )
e a funo de verossimilhana da forma:
xi n
e x l
E
u u
u
) | ( ( 53 )
Seu ncleo tem a forma
u
u
b n
e
o . A densidade a
posteriori ser
xi n
e x p
E
u
u u ) | (
( 54 )
Novamente, a forma da verossimilhana sugere que a distribuio a priori para u
tenha distribuio Gama com densidade
{ } u | u u
o
) ( exp ) | (
1
+ =
+
xi x p
n
que
a densidade da ) , (
+ + xi n G | o . O coeficiente de variao da posteriori ser dado por
2
1
) (
+ n o . Vale observar que para se reduzir o coeficiente de variao deve-se aumentar
n .
5.2.7.4. Exponencial
Seja ) ,..., (
1 n
X X uma amostra da distribuio exponencial com parmetro , u
ento
113
xi n
e x p
E
=
u
u u) | (
( 55 )
Novamente, a forma da verossimilhana sugere que a distribuio a priori para u
tenha distribuio Gama com densidade
|u o
u u
+
e p
n 1
) ( . A posteriori ser , ento da
forma:
{ }
+ =
+
u | u u
o
) ( exp ) | (
1
i
n
x x p
( 56 )
5.2.7.5. Multinomial
Denote por ) ,..., (
1 p
X X X = e ) ,..., (
1 p
u u u = , respectivamente, o nmero de
ocorrncias em cada uma das p categorias em n ensaios e as probabilidades
associadas a cada categoria. As seguintes restries, obviamente, se aplicam:
=
=
p
i
i
n X
1
e
=
=
p
i
i
1
1 u .
A densidade conjunta desses n ensaios independentes, ser:
[
[
=
=
=
p
i
xi
i p
i
i
x
n
x p
1
1
!
!
) | ( u u
( 57 )
Nota-se que, no caso em que p=2, tem-se uma distribuio binomial. Pode-se
mostrar que essa distribuio pertence tambm famlia exponencial. A funo de
verossimilhana da forma
[
xi
i
l u u) ( que tem o ncleo da famlia de distribuio de
Dirichlet. Um membro desta famlia ser denotado por ) ,..., ( ~
1 p
a a D u . A densidade
associada a distribuio a priori conjugada de u da forma
114
[
[
=
I
I
=
p
i
i
i
i
a
a
p
1
1
) (
) (
) (
o
u u ( 58 )
com 1 0 < <
i
u ,
=
=
p
i
i
1
1 u e
=
=
p
i
i
a a
1
No caso de 2 = p a distribuio de Dirichlet a distribuio Beta. Suas mdias,
varincias e covarincias so:
p j i
a a
a a
Cov
a a
a a a
V
a
a
E
j i
i i
i
i
i
s = s
+
=
+
= = 1
) 1 (
) , ( ,
) 1 (
) (
) ( , ) (
2
2 1
2
u u u u
Nessas condies a posteriori ser:
[ [ [
=
+
=
=
=
(
p
i
i
a
i
x
i
p
i
a
i
p
i
xi
i
x p
1
1
1
1
1
1
) | ( u u u u
( 59 )
que tambm Dirichlet, ou seja:
) ,..., ( ~ ) | (
1 1 p p
x a x a D x + + u ( 60 )
com constante de proporcionalidade
) (
) (
i i
x a
n a
k
+ I
+ I
=
[
( 61 )
115
5.2.7.6. Normal com mdia conhecida e varincia desconhecida
Seja }, ,..., {
1 n
X X X = uma amostra da ) , (
2
o u N e .
2
o | = Desta forma a
densidade conjunta da amostra ser
)
`
=
2
0
2 /
2
exp ) , | ( ) ; ( o
|
| | u | n x p x l
n
onde
= . ) (
1
2 2
0
u o
i
x
n
A priori conjugada deve ter o ncleo ) ; ( x l | que tem a forma da Gama. Como a
Gama fechada por amostragem, tomamos priori com parmetros 2 /
0
n e 2 /
2
0 0
o n ou,
equivalente, | o
2
0 0
n tem distribuio
2
_ com
0
n graus de liberdade. A mdia de | fornece
a preciso esperada da priori dada por
2
0
) (
= o u E . fcil verificar que o coeficiente de
variao de | dado por
0
/ 2 n CV = , de forma que quanto maior
0
n , maior a certeza a
priori sobre | . A distribuio a posteriori de | obtida usando mais uma vez o teorema
de Bayes, obtendo-se
) ( ) , ( ) | ( | | | p x l x p
{ } { } 2 / exp 2 / exp
2
0 0
1 ) 2 /
0
( 2
0
2 /
|o | | | n s n
n n
{ } 2 / ) ( exp
2
0
2
0 0
1 ] 2 / )
0
[(
| o | ns n
n n
+ =
+
( 62 )
Portanto a Gama ou
2
_ conjugada normal (com | conhecido e
2
o
desconhecido).
5.2.7.7. Normal com mdia e varincia desconhecidas
A distribuio priori de ) , ( | u ser construda em dois estgios. Primeiramente
considera-se a distribuio condicional de u dado |
116
] ) ( , [ ~ ) | (
1
0 0
| | u c N
( 63 )
e a distribuio marginal a priori de | tomada anteriormente, isto ,
2 2
0
~
no o
n _ | o
ou
|
.
|
\
|
2
,
2
~
2
0 0 0
o
|
n n
G
onde ) , (
2
0
o
o
n e ) , (
0 0
c so dados pela informao inicial H . Essa distribuio a
normalmente chamada de Normal-Gama (ou Normal-
2
_ ) com parmetros ) , , , (
2
0 0 0 0
o n c
e sua densidade conjunta :
) ( ) | ( ) , ( | | u | u p p p =
2 /
2
0
0
1 2 /
0
2
0
0 2 / 1
) (
2
exp
| o
| u
|
|
n
e n
c
)
`
| |
)
`
+ =
+ 2
0 0
2
0 0
1 2 / ) 1
0
(
) (
2
exp | o
|
| c n
n
( 64 )
A priori e a posteriori tm a mesma distribuio e, portanto, a Normal-Gama
conjugada Normal, quando
2
e o u so desconhecidos. Abaixo, apresenta-se um
quadro resumo das distribuies envolvidas no modelo normal com a mdia e varincia
desconhecias.
Tabela 26 Resumo das distribuies envolvidas no modelo Normal com
mdia e varincia desconhecidas
Priori Posteriori
| u |
) ) ( , (
1
0 0
| c N ) ) ( , (
1
1 1
| c N
|
2
0
2
0 0
~
n
n _ | o
2
1
2
1 1
~
n
n _ | o
u
) / , (
0
2
0 0
c t
no
o )) /( , (
1
2
1 1 1
c t
n
o
u | |
| | 1 0
2 2
0
2
0 0
~ ) ( + + n c n _ | u o | | 1
1
2 2
1
2
1 1
~ ) ( + + n c n _ | u o
117
5.3. O Modelo de Regresso Mltipla
Migon (1999) define o seguinte com relao regresso mltipla: Seja Y uma
quantidade aleatria cuja variabilidade ser explicada por um conjunto de quantidades
conhecidas ou observadas. Como uma primeira aproximao, suporemos que relaes
lineares descrevem como estas quantidades influenciam Y. Seja
p
X X ,...,
1
um conjunto
de p variveis explicativas, covariveis ou regressores. Assim:
p p
X X Y E | | + + = ... ) (
1 1
( 65 )
A esperana de Y calculada condicionalmente aos valores das variveis
p
X X ,...,
1
. Se, adicionalmente, uma
2
) ( o = Y V assumida para todos os i , o erro, aps
observar-se uma amostra
p
y y ,...,
1
pode ser especificado por
n i y x y e
pi p i i
,..., 1 , ...
11 1
= + + = | | ( 66 )
os parmetros ) ,..., (
1 p
| | | = podem ser estimados por mnimos quadrados. Os
estimadores, neste caso, so dados pelos vetores de | que minimiza
=
n
i i
i
e
2
. Nenhuma
hiptese feita com respeito a distribuio de Y ou dos erros. Se a normalidade e
independncia das distribuies dos s Y
i
for assumida, ento, fcil obter a funo de
verossimilhana
)
`
n
i
i
n
n
e y y l
1
2
2
1
2
2
1
exp ) ,..., ; , (
o
o o | ( 67 )
Assim, os valores de | que maximizam a verossimilhana so equivalentes aos
que minimizam
=
n
i i
i
e
2
, isto , os estimadores de mxima verossimilhana e de mnimos
quadrados coincidem.
118
til adotar-se notao matricial. Definindo-se
|
|
|
|
|
|
.
|
\
|
=
n
Y
Y
.
.
.
1
Y ( 68 ) e
|
|
.
|
\
|
=
|
|
|
|
|
|
.
|
\
|
=
pn n
p
n
x x
x x
X
X
...
...
.
.
.
1
1 11
1
X ( 69 )
segue que ) , ( ~ , |
2 2
p
I X N Y o | o | onde
p
I a matriz identidade p p x . A equao de
verossimilhana pode ser reescrita como { }
2 2
2 / ) ( exp o | o S , onde
=
=
1
2
) ( ) (
i
i i
y S | | x
) ( )' ( X y X y | = ( 70 )
5.3.1. Modelo Linear Generalizado
O modelo de regresso mltipla, apresentado, pode ser escrito como
n i N Y
i i
, ,..., 1 ), , ( ~
2
= o independente
n i
i i
,..., 1 , = =
|
i
x =
i
onde a segunda equao estabelece a relao entre a mdia das observaes e a
estrutura de explicao do modelo. No h nenhuma razo forte para nos restringirmos
a distribuio normal e a classe de relaes normais. Uma das mais relevantes
extenses deste modelo constitui a classe dos modelos leneares generalizados, a qual
permite modelar observaes descritas por qualquer membro da famlia exponencial,
relacionando sua mdia com o preditor linear atravs de diferentes funes. Assim, as
s Y
i
tem densidade
119
{ } ) ( ) ( ) ( exp ) ( ) | ( u u | u b y u y a y p
i i i
+ = , , ,..., 1 n i = independente
i i
g = ) ( ,
onde g diferencivel e
) | ( u
i i
Y E =
|
i
x =
i
Esta classe inclui muito dos modelos mais usados na estatstica (MCCULLAGH e
NELDER apud MIGON, 1999, p. 29).
6. DISCUSSO DOS RESULTADOS E ESCOLHA DA FORMA FUNCIONAL
Nesta etapa do trabalho, utilizou-se o software SPSS 10.0 for Windows. Para
completa anlise, veremos a variao em
i
y explicada pelo modelo e o relato da anlise
de regresso.
6.1. Modelo Inicial
Temos, a seguir, o modelo inicial que iremos testar. Nele esto todas as variveis
independentes ) (
'
s X
i
, o erro aleatrio ( )
i
c e a varivel dependente .
i
Y Chamaremos
este modelo de Modelo 0:
i i
X X X X X X X X X y c | | | | | | | | | | + + + + + + + + + + =
9 9 8 8 7 7 6 6 5 5 4 4 3 3 2 2 1 1 0
( 71 )
onde
Dependente Varivel VIAGEM DE TOTAL CUSTO =
i
y
. 9 1 a as, explicativ Variveis = = i X
i
(Conforme Figura 13)
modelo do Parmetros = s
i
'
|
aleatrio Erro =
i
c
Antes da determinao do Modelo de Regresso, importante o Estudo das
Correlaes Lineares, inclusive para corroborar a primeira hiptese do modelo. HILL et
al (2003, p.31) diz que a correlao entre duas variveis aleatrias mede o grau de
associao linear entre elas. Assim, a correlao entre X e Y 1 ou 1, se X uma
funo linear perfeita positiva ou negativa de Y. Se no h qualquer associao linear
entre X e Y, ento . 0 = Para outros valores da correlao, a magnitude do valor
absoluto indica a fora da associao entre os valores das variveis aleatrias.
121
Quanto maior o valor absoluto , melhor a associao linear entre os valores. Ento,
se X e Y so duas variveis aleatrias, sua correlao
) var( ) var(
) , cov(
Y X
Y X
= (72 )
Variveis aleatrias independentes X e Y tm covarincia zero, o que indica que
no h associao linear entre elas. Todavia, o simples fato da covarincia ou a
correlao entre duas variveis aleatrias ser zero no significa que elas sejam
necessariamente independentes. A covarincia zero significa que no h associao
linear entre as variveis aleatrias.
Definio 6-1: Dada uma amostra de pares de dados ( ) , ,..., 1 , , n i y x
i i
= obtm-se o
coeficiente de correlao amostral substituindo-se as covarincias e as varincias por
seus correspondentes amostrais:
) ( r a v ) ( r a v
) , ( v o c
Y X
Y X
r = ( 73 )
em que
( ) 1
cov
1
|
.
|
\
|
|
.
|
\
|
=
=
n
y y x x
n
i
i i
( 74 )
( )
( ) 1
r a v
1
2
|
.
|
\
|
=
=
n
x x
X
n
i
i
( 75 )
122
Definio 6-2: A varincia amostral de Y da mesma forma que ( ) X r a v . Podemos, pois,
escrever o coeficiente de correlao amostral r como
= =
=
|
.
|
\
|
|
.
|
\
|
|
.
|
\
|
|
.
|
\
|
=
n
i
n
i
i i
n
i
i i
y y x x
y y x x
r
1 1
2 2
1
( 76 )
O coeficiente de correlao amostral r, que pode tomar valores entre 1 e 1,
mede a fora da associao linear entre os valores de X e Y. O coeficiente de
correlao pode ser testado com base na seguinte expresso, conforme descrito por
Milone e Angeline (1995, p. 226):
2
1 r
m n
r tc
= ( 77 )
A Tabela 27 mostra o grau de correlao entre a varivel Y = CUSTOS TOTAL
DE VIAGEM e todas as variveis explicativas do modelo.
Tabela 27 Coeficiente de Correlao de Pearson (r)
Variveis r
i
Y
CUSTO TOTAL DE VIAGEM 1,00
1
X
ESCALAS 0,683**
2
X
COMPRIMENTO 0,718**
3
X
TEMPO DE VIAGENS 0,471*
4
X
POTNCIA 0,399*
5
X
TRIPULAO 0,517**
6
X
NMERO DE VIAGEM -0,800**
7
X
TEMPO OCIOSO 0,385
8
X
FATURAMENTO COM PASSAGEM 0,745**
9
X
FATURAMENTO COM FRETE 0,507**
** Correlao significativa ao nvel 0.01 * Correlao significativa ao nvel 0.05
123
Podemos admitir, ao nvel de significncia de 1%, que as variveis ESCALAS,
COMPRIMENTO, TRIPULAO, NMERO DE VIAGENS, FATURAMENTO COM
PASSAGENS, FATURAMENTO COM FRETE, so correlacionadas com a varivel Y =
CUSTO TOTAL DE VIAGEM. J as variveis TEMPO DE VIAGENS, POTNCIA,
apresentam coeficiente de correlao linear significativos ao nvel de 5%. Somente a
varivel TEMPO OCIOSO no significativamente correlacionada ao custo de viagem,
em nenhum dos nveis testados. Ou seja, h evidncias suficientes para concluir pela
existncia de uma correlao linear entre a varivel dependente Y = CUSTO TOTAL DE
VIAGEM e as variveis independentes variveis ESCALAS, COMPRIMENTO,
TRIPULAO, NMERO DE VIAGENS, TEMPO DE VIAGENS, PONTNCIA,
FATURAMENTO COM PASSAGENS, FATURAMENTO COM FRETE. Diante da
evidncia de uma relao linear entre as variveis citadas, identificar-se-, com
parcimnia, um modelo de regresso linear simples para o custo que as embarcaes
possuem por ocasio de suas viagens.
Antes, entretanto, de passarmos especificao do modelo, analisaremos a
colinearidade entre as variveis explicativas e a Anlise de Varincia (ANOVA).
Hill (2003, p. 218) resume as conseqncias da colinearidade entre variveis
explanatrias em um modelo estatstico, como segue:
1. Sempre que h uma ou mais relaes lineares exatas entre as variveis
explanatrias, existe a condio de colinearidade exata, ou multicolinearidade
exata. Neste caso, o estimador de mnimos quadrados no definido. No
podemos obter estimativas s
k
'
| aplicando o princpio dos mnimos quadrados;
2. Quando existem dependncias lineares quase exatas entre as variveis
explanatrias, algumas varincias, erros-padro e covarincias dos
estimadores de mnimos quadrados podem ser grandes;
3. Quando os erros-padro do estimador so grandes, possvel que o teste t
usuais levem concluso de que as estimativas dos parmetros no so
significativamente diferentes de zero. Esse resultado pode ocorrer a despeito
de valores possivelmente elevados de R
2
ou F, indicando poder explanatrio
significativo do modelo como um todo. O problema que as variveis
colineares no proporcionam informao suficiente para estimar seus efeitos
separados, ainda que a teoria econmica indique sua importncia na relao;
124
4. Os estimadores podem ser muito sensveis ao acrscimo ou supresso de
uma poucas observaes, ou supresso de uma varivel aparentemente
insignificante;
5. A despeito das dificuldades em isolar os efeitos de variveis individuais em tal
amostra, ainda possvel fazer previses precisas se a natureza da relao
de colinearidade permanece a mesma dentro das novas (futuras) observaes
amostrais.
Definio 6-3: A anlise de varincia (ANOVA) um mtodo para testar a igualdade de
trs ou mais mdias populacionais, baseado na anlise de varincia amostral (TRIOLA,
op. cit., p. 284).
O mtodo da anlise de varincia se baseia neste conceito fundamental: Com a
suposio de que as populaes tenham todas a mesma varincia ,
2
o estimamos seu
valor comum usando duas abordagens diferentes. A estatstica de teste F a razo
dessas duas estimativas, de modo que o valor de F significativamente grande
(localizado muito direita do grfico da distribuio F ) constitui evidncia contra a
igualdade das mdias populacionais. As duas abordagens para estimar o valor comum
de
2
o so:
1. A varincia entre amostras (tambm chamada de variao devida ao
tratamento) uma estimativa da varincia populacional comum
2
o que se
baseia na variabilidade entre as mdias amostrais.
2. A varincia dentro das amostras (tambm chamada variao devida ao erro)
uma estimativa da varincia populacional comum
2
o baseada nas varincias
amostrais.
Estatstica de teste para ANOVA de um critrio
amostra da dentro variancia
amostras entre varincia
= F ( 78 )
O numerado mede a variao entre as mdias amostrais. A estimativa da
varincia no denominador depende somente das varincia amostrais e no afetada
125
pelas diferenas entre as mdias amostrais. Conseqentemente, as mdias amostrais
que apresentam valores prximos uns dos outros resultam em uma estatstica de teste
F prxima de 1, e conclui-se que no h diferena significativa entre as mdias
amostrais. Mas se o valor excessivamente grande, rejeita-se a afirmao de igualdade
de mdias. (As expresses vagas prximo de 1 e excessivamente grande tornam-se
objetivas com a adoo de um valor crtico especfico, que estabelece claramente a
diferena entre uma estatstica de teste F que est na regio crtica e uma que no
est.) Como valores excessivamente grandes de F refletem mdias desiguais, o teste
unilateral direita. TRIOLA nesta mesma seo diz que as pesquisas baseadas em
amostras relativamente pequenas podem ser precisas, desde que a amostra seja
aleatria ou representativa da populao.
Definio 6-4: Os mtodos de ANOVA utilizam a distribuio . F A distribuio F
apresenta as seguintes caractersticas:
1. A distribuio F no simtrica; assimtrica direita.
2. Os valores de F podem ser 0 ou positivos, mas nunca negativos.
3. H uma distribuio F diferente para cada par de graus de liberdade (do
numerador e do denominador)
Definio 6-5: SQ(Total) ou soma total de quadrados: uma medida da variao total
(em torno de x ) em todos os dados amostrais combinados.
2
) ( x x SQTotal
= ( 79 )
onde . combinados amostrais valores os todos de mdia x =
SQ(Total) pode decompor-se em SQT (soma de quadrado do tratamento) e SQE
(Soma de quadrado do erro), como se segue:
Definio 6-6: SQT uma medida de variao entre as mdias amostrais. E como
uma medida de variabilidade entre as mdias amostrais, tambm conhecida como
SQ(entre grupos) ou SQ(entre amostras).
126
( )
2
2 2
2 2
2
1 1
) ( ... ) ( ) (
= + + + = x x n x x n x x n x x n SQT
i i k k
( 80 )
As mdia populacionais
k
,..., 2 ,
1
so iguais, ento as mdias amostrais
k
x x x ,..., ,
2 1
tendero a concentrar-se em torno de . x O resultado ser um valor
relativamente pequeno de SQT. Entretanto, se as mdias populacionais no so todas
iguais, ento pelo menos um dos valores
k
x x x ,..., ,
2 1
tender a distanciar-se dos outros e
tambm de . x O resultado ser um valor relativamente grande de SQT.
Definio 6-7: SQE uma soma de quadrados que representa a variabilidade que
supomos seja comum a todas as populaes em considerao.
( ) ( ) ( ) ( )
= + + + =
2 2 2
2 2
2
1 1
1 1 ... 1 1
i i k k
s n s n s n s n SQE ( 81 )
Como SQE uma medida da varincia dentro dos grupos, designada s vezes
por SQ(dentro dos grupos) ou SQ(dentro das amostras). Consideradas as expresses
precedentes para SQTotal, SQT e SQE, a relao seguinte sempre vlida:
SQE SQT SQTotal + = ( 82 )
SQE e SQT so ambas somas de quadrados, e se dividirmos cada uma delas
pelo correspondente nmero de graus de liberdade, obteremos quadrados mdios,
definidos como se segue:
Definio 6-8: QMT o quadrado mdio para tratamento, obtido como se segue:
1 / = k SQT QMT ( 83 )
Definio 6-9: QME o quadrado mdio para erro, obtido como se segue:
127
k N SQE QME = / ( 84 )
Definio 6-10: QMT o quadrado mdio para a variao total:
1 / = N SQTotal T QM ( 85 )
Com os valores SQ e QM determinamos a estatstica de teste F que se aplica
quando as amostras no tm todas o mesmo tamanho.
Definio 6-11: Estatstica de Teste para a ANOVA com Tamanhos Diferentes de
Amostras: Ao testar a hiptese numa
k
H = = = = ...
2 1 0
contra a hiptese alternativa
(essas mdias no so todas iguais), a estatstica de teste
SQE SQT F / = ( 86 )
tem distribuio F (quando a hiptese nula verdadeira) com graus de liberdade dados
por:
graus de liberdade do numerador = k 1;
graus de liberdade do denominador = N k
Definio 6-12: Na escolha do melhor modelo de regresso mltipla utiliza-se a medida
2
R . Ela chamada coeficiente de determinao. Quanto mais prximo de 1 estiver
2
R
melhor ter sido nosso trabalho para explicar a variao de
i
y e maior ser a
capacidade de previso de nosso modelo sobre todas a observaes amostrais.
No modelo de regresso mltipla, o coeficiente de determinao
|
.
|
\
|
|
.
|
\
|
= =
2
2
^
2
y y
y y
SQT
SQR
R
i
i
128
|
.
|
\
|
= =
2
2
^
1 1
y y
e
SQT
SQE
i
i
( 87 )
em que SQR a variao em y explicada pelo modelo, SQT a variao total em
y em torno de sua mdia, e SQE a soma dos quadrados dos resduos de mnimos
quadrados e tambm a parcela da variao em y no explicada pelo modelo.
Segundo Hill at al (2003, p. 188), uma dificuldade com
2
R que seu valor pode
ser aumentado adicionado-se cada vez mais variveis, mesmo que essas no tenham
qualquer justificativa econmica. Algebricamente, medida que se acrescentam
variveis, a soma dos quadrados de erros SQE diminui (pode permanecer inalterada,
mas isso raro) e assim
2
R aumenta. Se o modelo contm N 1 variveis,
2
R =1. No
aconselhvel manipular um modelo apenas para obter um valor elevado de
2
R .
melhor usar o coeficiente de determinao ajustado ao comparar diferentes equaes
de regresso mltipla, porque ele ajusta o valor de
2
R com base no nmero de variveis
e no tamanho da amostra.
J Triola (1999, p. 256) define o coeficiente de correlao ajustado como o
coeficiente mltiplo de determinao
2
R modificado de modo a levar em conta o nmero
de variveis e o tamanho da amostra. Calcula-se pela frmula:
( ) | |
( )
2
R
k n
n
R
+
= 1
1
) 1 (
1
2
( 88 )
Para Triola a determinao da melhor equao de regresso mltipla , em geral,
bastante difcil. As seguintes diretrizes podem ajudar:
1. Use o bom senso e consideraes de ordem prtica para incluir ou excluir
variveis;
2. Em vez de incluir quase todas as variveis disponveis, inclua um nmero
relativamente pequeno de variveis independente. No processo de eliminao
de variveis independentes que no tenha influncia na varivel dependente,
129
poderia ser aconselhvel achar o coeficiente de correlao linear r para cada
par de variveis consideradas;
3. Escolha uma equao que tenha um valor ajustado de
2
R com esta
propriedade: Se se inclui uma varivel independente adicional, o valor de
ajustado de
2
R no aumentado substancialmente;
4. Para um dado nmero de variveis independentes, escolha a equao com o
maior valor ajustado de
2
R . Ou seja, escolha as variveis com a propriedade
de que nenhuma outra combinao do mesmo nmero de variveis
independentes d um valor maior para
2
R ajustado;
5. Escolha uma equao que tenha uma significncia, tal como determinado pelo
p-valor.
6.2. Colinearidade
Uma forma simples de detectar relaes colineares utilizar o coeficiente de
correlao amostral entre pares de variveis explanatrias.
Tabela 28 Matriz de correo das variveis explicativas
ESCALAS COMP TEMPVIAG POTENCIA TRIPULA NVIAGEM FATPASSA FATFRETE
ESCALAS 1,000 0,370 0,728** 0,035 0,160 -0,513** 0,540** 0,412*
COMP 0,370 1,000 0,155 0,637** 0,358 -0,675** 0,731** 0,195
TEMPVIAG 0,728** 0,155 1,000 0,062 0,126 -0,552** 0,330 0,596**
POT ENCIA 0,035 0,637** 0,062 1,000 0,154 -0,455* 0,488* 0,358
TRIPULA 0,160 0,358 0,126 0,154 1,000 -0,485* 0,384 0,101
NVIAGEM -0,513** -0,675** -0,552** -0,455* -0,485* 1,000 -0,733** -0,487*
FATPASSA 0,540** 0,731** 0,330 0,488* 0,384 -0,733** 1,000 0,115
FATFRETE 0,412* 0,195 0,596** 0,358 0,101 -0,487* 0,115 1,000
** Correlao significativa ao nvel 0.01.
* Correlao significativa ao nvel 0.05.
130
6.3. Erros Aleatrios
Os testes de hiptese e as estimativas de intervalos para os coeficientes para os
coeficientes se apiam no pressuposto de que os erros, e portanto a varivel
dependente y, so normalmente distribudos.
Resduo Padronizado
2,50 2,00 1,50 1,00 ,50 0,00 -,50 -1,00 -1,50 -2,00
Histograma
Varivel dependente: CUSTOTOT
F
r
e
q
u
n
c
i
a
8
6
4
2
0
Figura 17 - Histograma dos resduos para o Custo Total de Viagem
fcil perceber que a mdia dos resduos de mnimos quadrados centrado em
torno de zero. No geral, o grfico parece representar bem uma distribuio normal
aproximada.
A Figura 18 confirma a hiptese de normalidade dos erros, visto que os pontos
esto muito prximos reta.
131
Resduo Padronizado
Varivel dependente: CUSTOTOT
1,00 ,75 ,50 ,25 0,00
1,00
,75
,50
,25
0,00
Figura 18 - Resduos padronizados
Conforme possvel observar na Tabela 29, o intervalo de predio sugere que
uma embarcao regional, dependendo do seu faturamento na venda de passagens e
com a cobrana de frete, gastar entre R$ 146,10 e R$ 7.533,35, com uma mdia de R$
3.862,46 e desvio padro de R$ 2.323,36. O erro padro da estimativa est entre R$
12,69 e R$ 807,49, sendo o erro mdio estimado em R$ 331,03 com um desvio padro
de R$ 217,18.
Tabela 29 Predio no Modelo de Custo Total de Viagem
Mnimo Mximo Mdia Desvio Padro
Valor Predito 146,10 7.533,35 3.862,46 2.323,36
Valor Predito Padronizado -1,60 1,58 0,00 1,00
Resduo Padronizado -2,110 2,28 0,023 0,979
Stud. Residual -2,231 2,39 0,021 1,041
Varivel dependente: CUSTO TOTAL
132
6.4. Determinao do Modelo Clssico
A anlise da Tabela 28 nos d vrios nveis de associao linear entre as
variveis. Entretanto, podemos destacar a multicolinearidade entre a varivel ESCALAS
e as variveis TEMPO DE VIAGEM, NMERO DE VIAGEM, FATURAMENTO COM
PASSAGENS, estas ao nvel de 1% de significncia, e, TEMPO OCIOSO e
FATURAMENTO COM FRETE, ao nvel de 5%. A varivel COMPRIMENTO apresenta
multicolinearidade, ao nvel de 5% de significncia, com as variveis POTNCIA,
NMERO DE VIAGEM e FATURAMENTO COM PASSAGEM. J a varivel NMERO
DE VIAGEM apresenta correlao linear, ao nvel de 1%, com as variveis TEMPO DE
VIAGEM, FATURAMENTO COM PASSAGEM e, nvel de 5% de significncia com as
variveis POTNCIA, TEMPO OCIOSO, FATURAMENTO COM FRETE.
Para determinao do modelo de regresso mltipla, foram retiradas,
inicialmente, as variveis TEMPO OCIOSO e ESCALAS, aquela por no apresentar
significativa correlao linear com a varivel dependente, e esta, por sua
multicolinearidade. Chamaremos este modelo de Modelo 1.
Modelo 1:
i i
X X X X X X X Y c | | | | | | | | + + + + + + + + =
9 9 8 8 6 6 5 5 4 4 3 3 2 2 0
( 89 )
Tabela 30 Modelo 1 - ANOVA
Modelo SQ Gl QM F Sig.
1 Regresso 143.019.987,70 7 20.431.426,81 14,001 0,000
Resduo 24.807.543,73 17 1.459.267,27
Total 167.827.531,44 24
Preditores: (Constante), FATFRETE, TRIPULA, POTENCIA, FATPASSA, TEMPVIA, COMP, NVIAGEM
Varivel dependente: CUSTO TOTAL
133
Tabela 31 Resumo do Modelo 1
Modelo R R
2
R
2
Ajustado
Erro-padro
da Estimativa
Durbin-
Watson
F Sig.
1 0,923 0,852 0,791 1.208,00 2,244 14,001 0,000
Preditores: (Constant), FATFRETE, TRIPULA, POTENCIA, FATPASSA, TEMPVIA, COMP, VIAGEM
Varivel dependente: CUSTO TOTAL
O valor crtico de 5% para a estatstica F com (7, 17) graus de liberdade do
Modelo 1 F
c
=14,001 (Tabela 31). Logo, podemos admitir que no Modelo 1, pelo
menos um dos parmetros diferente de zero, ou seja, a relao estimada
significativa. O valor do coeficiente de determinao apresentado foi 852 , 0
2
= R e
coeficiente ajustado . 791 , 0
2
= R
Tabela 32 Modelo 1 Regresso Linear Mltipla
Parmetros
Coeficientes
T Sig.
Intervalo com 95%
de para |
B Erro-Padro
Limite
Inferior
Limite
Superior
0
| (Constant) -3.545,75 3.429,52 -1,03 0,32 -1.781,42 3.89,91
2
| COMP 219,17 95,57 2,29 0,04 17,52 420,82
3
| TEMPVIA -5,50 14,52 -0,37 0,71 -36,14 25,14
4
| POTENCIA -8,06 3,86 -2,08 0,05 -16,22 0,10
5
| TRIPULA 220,38 130,33 1,69 0,11 -54,59 495,37
6
| NVAGEM -31,63 216,69 -0,14 0,88 -488,81 425,54
8
| FATPASSA 0,37 0,13 2,70 0,02 0,08 0,67
9
| FATFRETE 0,57 0,17 3,24 0,01 0,20 0,95
Varivel dependente: CUSTO TOTAL
Na Tabela 32 temos as estimativas dos parmetros do Modelo 1. Apenas as
variveis COMPRIMENTO, FATURAMENTO COM PASSAGEM e FATURAMENTO
134
COM FRETE apresentaram parmetros significativamente diferentes de zero. Diante
disso, o Modelo 1 estimado :
2,00
1,75
1,50
1,25
1,00
,75
,50
,25
0,00
-,25
-,50
-,75
-1,00
-1,25
5
4
3
2
1
0
Std. Dev = ,84
Mean = 0,00
N = 25,00
Figura 19 - Histograma dos Resduos - Modelo 1
1,00 ,75 ,50 ,25 0,00
E
x
p
e
c
t
e
d
C
u
m
P
r
o
b
1,00
,75
,50
,25
0,00
Figura 20 Normal Plot - Resduos do Modelo 1.
Modelo 1 (Estimado):
9 8 1
57 , 0 37 , 0 17 , 219 x x x y + + = ( 90 )
135
Apesar de vrias variveis no apresentarem parmetros significativos no modelo
anterior, para estimarmos o Modelo 2 foram mantidas todas as variveis, exceo da
varivel COMPRIMENTO. Nele possvel verificar que o valor crtico, ao nvel de 5%
de significncia da estatstica F F
(6,18)
= 17,270. Logo, a hiptese H
o
deve ser rejeitada
e conclui-se que a relao estimada significativa.
Modelo 2:
i i
X X X X X X X Y c | | | | | | | | + + + + + + + + =
9 9 8 8 6 6 5 5 4 4 3 3 2 2 0
( 91 )
Tabela 33 Modelo 2 - ANOVA
Modelo SQ gl QM F Sig.
2 Regresso 142.988.885,125 6 23.831.480,854 17,270 0,000
Resduo 24.838.646,315 18 1.379.924,795
Total 167.827.531,440 24
Preditores: (Constant), COMP, TEMPVIA, TRIPULA, FATFRETE, POTENCIA, FATPASSA
Varivel dependente: CUSTO TOTAL
Temos para este modelo, coeficiente de determinao R
2
= 0,852 e o coeficiente
ajustado 803 , 0
2
= R . Apesar do Modelo 2 ter menos variveis explicativas, ele apresenta
um melhor coeficiente ajustado.
Tabela 34 Resumo do Modelo 2
Modelo R R
2
R
2
Ajustado
Erro-padro
Da Estimativa
Durbin-
Watson
F Sig.
2 0,923 0,852 0,803 1,1174,70 2,218 17,270 0,000
Preditores: (Constant), FATFRETE, TRIPULA, POTENCIA, FATPASSA, TEMPVIA, COMP
Varivel dependente: CUSTO TOTAL
136
Tabela 35 Modelo 2 Regresso Linear Mltipla
Parmetros
Coeficientes
t Sig.
Intervalo com 95%
de para |
B Erro-Padro
Limite
Inferior
Limite Superior
0
|
(Constant) -3.952,90 1941,00 -2,03 0,057 -8.030,804 124,997
2
|
COMP 223,58 88,18 2,53 0,021 38,317 408,842
3
|
TEMPVIA -4,90 13,55 -0,36 0,722 -33,371 23,564
4
|
POTENCIA -8,09 3,75 -2,15 0,045 -15,987 -0,205
5
|
TRIPULA 227,10 118,58 1,91 0,072 -22,043 476,242
8
|
FATPASSA 0,38 0,12 3,16 0,005 0,129 0,639
9
|
FATFRETE 0,58 0,16 3,62 0,002 0,245 0,921
Varivel dependente: CUSTO TOTAL
A Tabela 35 apresenta os valores dos coeficientes do Modelo 2. Ao nvel de
significncia de 5%, podemos concluir que as variveis COMP, POTENCIA, FATPASS e
FATFRETE so significativamente diferentes de zero, as demais sero retiradas do
modelo. Como o intercepto
0
| no apresentou valor significativamente diferente de
zero, o modelo proposto no o conter.
Modelo 2 (Estimado):
9 8 4 2
58 , 0 38 , 0 09 , 8 58 , 223 x x x x y + + = ( 92 )
O Modelo 2 apresenta um intervalo de confiana dos parmetros das variveis
COMPRIMENTO (38,317; 408,842) e POTNCIA (-15,987; -0,205) muito grande. Isto
pode comprometer a predio pontual, tornando-a no confivel.
137
2,00
1,75
1,50
1,25
1,00
,75
,50
,25
0,00
-,25
-,50
-,75
-1,00
-1,25
5
4
3
2
1
0
Std. Dev = ,84
Mean = 0,00
N = 25,00
Figura 21 - Histograma dos Resduos do Modelo 2
1,00 ,75 ,50 ,25 0,00
1,00
,75
,50
,25
0,00
Figura 22 Normal Plot - Resduos do Modelo 2
No Modelo 3 constar apenas as variveis que foram significativas no Modelo 2,
ou seja, COMPRIMENTO, POTNCIA, FATURAMENTO COM PASSAGEIROS e
FATURAMENTO COM FRETE. Como o intercepto
o
| tambm no significativamente
138
diferente de zero, ele tambm ser retirado do Modelo 3. O valor estimado dos
parmetros encontram-se na Tabela 38.
Modelo 3:
i i
X X X X Y c | | | | + + + + =
9 9 8 8 4 4 2 2
( 93 )
Tabela 36 Modelo 3 ANOVA
Modelo SQ gl QM F Sig.
3 Regresso 511.353.994,93 4 127.838.498,73 75,22 0,000
Resduo 35.686.844,06 21 1.699.373,52
Total 547.040.839,00 25
Preditores: (Constant), COMP, POTENCIA, FATFRETE, FATPASSA
Varivel dependente: CUSTO TOTAL
Tabela 37 Resumo do Modelo 3
Modelo r R
2
R
2
Ajustado
Erro-padro
Da Estimativa
Durbin-
Watson
F Sig.
3 0,967 0,935 0,922 1.303,60 1,781 75,227 0,000
Tabela 38 Modelo Regresso Mltipla para o Custo Total de Viagem
Coeficientes
t Sig.
Intervalo com 95%
de para |
B Erro-Padro
Limite
Inferior
Limite Superior
COMP 103,95 46,30 2,245 0,036 7,67 200,23
POTENCIA -8,34 3,85 -2,167 0,042 -16,34 -0,33
FATPASSA 0,53 0,09 5,642 0,000 0,33 0,72
FATFRETE 0,57 0,13 4,387 0,000 0,29 0,83
Varivel dependente: CUSTO TOTAL
Modelo 3 (Estimado):
9 8 4 2
57 , 0 53 , 0 34 , 8 95 , 103 x x x x y
i
+ + = ( 94 )
139
O Modelo 3 apresenta o mesmo problema quanto ao intervalo de confiana dos
parmetros estimados das variveis COMPRIMENTO e POTNCIA, ou seja, a
confiabilidade da previso fica comprometida em virtude da grande amplitude desses
intervalos.
Diante disso, um quarto modelo proposto. Com bastante parcimnia, o Modelo
4 contar apenas com as variveis FATURAMENTO COM PASSAGEIROS e
FATURAMENTO COM FRETE e sem o intercepto.
2,00 1,50 1,00 ,50 0,00 -,50 -1,00 -1,50 -2,00
10
8
6
4
2
0
Std. Dev = ,93
Mean = -,05
N = 25,00
Figura 23 Histograma dos Resduos do Modelo 3
1,00 ,75 ,50 ,25 0,00
1,00
,75
,50
,25
0,00
Figura 24 - Normal Plot - Resduos Do Modelo 3
Modelo 4:
i i
X X Y c | | + + =
9 9 8 8
( 95 )
140
Tabela 39 Modelo - ANOVA
Modelo SQ Gl QM F Sig.
4 Regresso 502.517.310,84 2 251.258.655,42 129,795 0,000
Resduo 44.523.528,15 23 1.935.805,57
Total 547.040.839,00 25
Preditores: (Constant), COMP, TEMPVIA, TRIPULA, FATFRETE, POTENCIA, FATPASSA
Varivel dependente: CUSTO TOTAL
Tabela 40 Resumo do Modelo 4
Modelo R R
2
R
2
Ajustado
Erro-padro
Da Estimativa
Durbin-
Watson
F Sig.
4 0,958 0,919 0,912 1.391,3323 1,579 129,95 0,000
Varivel dependente: CUSTO TOTAL
Tabela 41 Modelo 4 Regresso Linear Mltipla
Coeficientes
t Sig.
Intervalo com 95%
de para |
B Erro-Padro
Limite
Inferior
Limite Superior
FATPASSA 0,560 0,067 8,389 0,000 0,422 0,699
FATFRETE 0,526 0,110 4,788 0,000 0,299 0,753
Varivel dependente: CUSTO TOTAL
Modelo 4 (Estimado):
9 8
53 , 0 56 , 0 x x y
i
+ = ( 96 )
141
2,50
2,00
1,50
1,00
,50
0,00
-,50
-1,00
-1,50
-2,00
8
6
4
2
0
Std. Dev = ,98
Mean = ,02
N = 25,00
Figura 25 - Histograma Dos Resduos do Modelo 4
1,00 ,75 ,50 ,25 0,00
1,00
,75
,50
,25
0,00
Figura 26 - Normal Plot - Resduos do Modelo 4
142
Tabela 42 Resumo dos Modelos Estimados
MODELOS R
2
R
2
Ajustado
Erro-padro
Da Estimativa
F Sig.
MODELO 1:
9 8 1
57 , 0 37 , 0 17 , 219 x x x y + + =
0,852 0,791 1.208,00 14,001 0,000
MODELO 2:
9 8 4 2
58 , 0 38 , 0 09 , 8 58 , 223 x x x x y + + =
0,852 0,0,803 1,1174,70 17,270 0,000
MODELO 3:
9 8 4 2
57 , 0 53 , 0 34 , 8 95 , 103 x x x x y
i
+ + =
0,935 0,922 1.303,60 75,227 0,000
MODELO 4:
9 8
53 , 0 56 , 0 x x y
i
+ =
0,919 0,912 1.391,33 129,95 0,000
6.5. O Modelo Bayesiano
Para determinarmos a distribuio a priori da varivel dependente Y que ser
usada no Modelo Bayesiano, utilizamos o histograma, conforme descrito em 5.2.5. O
software utilizado foi o STATISTICA 6.0.
Com o p-valor = 0,1220, ao nvel de significncia de 5%, podemos admitir que os
dados referentes varivel Y = Custo Total de Viagem so provenientes de uma
Distribuio Normal,
CUSTOTOT
9000,0
8000,0
7000,0
6000,0
5000,0
4000,0
3000,0
2000,0
1000,0
0,0
7
6
5
4
3
2
1
0
Std. Dev = 2644,39
Mean = 3894,7
N = 25,00
Figura 27 - Histograma da varivel Custo Total
143
Conforme descrito em 5.2.7.2, se a distribuio observacional ) , ( ~ ) | (
2
o u u N X e
se a distribuio a priori ) , ( ~
2
t u N ento a distribuio a posteriori de u tambm
ser Normal, com mdia
1
e varincia
2
1
t . Podemos admitir, ento que, a distribuio
posteriori da varivel Y = CUSTO TOTAL DE VIAGEM tem distribuio Normal. A
vantagem desse tipo de priori a tratabilidade da anlise resultante e, portanto, a
possibilidade de explorar o aspecto seqencial do mtodo Bayesiano.
Encontrada a distribuio priori da varivel Y = CUSTO TOTAL DE VIAGEM, ou
seja, a Distribuio Normal e dos coeficientes das variveis independentes
significativamente diferentes de zero, passou-se determinao do Modelo Bayesiano.
Para a obteno do modelo, desenvolveu-se, inicialmente, um programa para o
software WinBUGS 1.4.
Na determinao do Modelo Bayesiano, utilizaram-se, inicialmente, todas as
variveis explicativas (exceto a varivel TEMPO OCIOSO por no ser significativamente
correlacionada com a varivel dependente). Nesta primeira simulao, apenas as
variveis FATURAMENTO COM PASSAGEM e FATURAMENTO COM FRETE
apresentaram coeficientes significativamente diferentes de zero.
Tabela 43 Modelo Bayesiano 1. Simulao
Variveis Mdia
Desvio
Padro
Limite
Inferior
Medina
Limite
Superior
(CONSTATE) 5.827 101.4 -189.2 5.499 201.6
COMPRIMENTO 31.47 28.66 -25.14 31.88 86.78
ESCALAS 6.113 32.21 -56.04 5.725 67.51
NMERO DE VIAGEM -8.322 75.43 -156.5 -8.273 139.8
POTNCIA -3.099 3.342 -9.591 -3.101 3.438
TEMPO DE VIAGEM -5.368 13.83 -32.34 -5.413 22.41
TRIPULACO 16.15 31.24 -45.2 15.84 77.2
FATURAMENTO COM PASSA 0.5742 0.122 0.3344 0.5731 0.8201
FATURAMENTO COM FRETE 0.5911 0.1875 0.2267 0.5881 0.9635
144
A segunda simulao considerou as variveis COMPRIMENTO, POTNCIA,
FATURAMENTO COM PASSAGEM e FATURAMENTO COM FRETE, por terem
apresentado coeficientes significativamente diferentes de zero. Somente as variveis
FATURAMENTO COM PASSAGEM e FATURAMENTO COM FRETE apresentaram
coeficientes significativos, conforme Tabela 44.
Tabela 44 Modelo Bayesiano - 2. Simulao
Variveis Mdia Desvio Padro Limite Inferior Medina Limite Superior
(CONSTANTE) 3.606 106.2 -192.0 3.147 203.4
COMPRIMENTO 30.59 27.5 -23.06 30.72 84.06
POTNCIA -2.966 2.774 -8.414 -3.006 2.562
FATURAMENTO COM PASSAGEM 0.5695 0.09942 0.3776 0.5681 0.7703
FATURAMENTO COM FRETE 0.5587 0.1376 0.2851 0.5583 0.83
A ltima simulao considerou apenas as variveis FATURAMENTO COM
PASSAGEM e FATURAMENTO COM FRETE. A mostra os resultados. A constante
Tabela 45 do modelo no apresentou intervalo significativamente diferente de zero.
Tabela 45 Modelo Bayesiano - 3. Simulao
Variveis Mdia Desvio Padro Limite Inferior Medina Limite Superior
(CONSTANTE) 4.756 98.54 -187.1 3.433 196.9
FATURAMENTO COM FRETE 0.5258 0.1143 0.3011 0.5253 0.756
FATURAMENTO COM
PASSAGEM
0.5588 0.07092 0.4209 0.5581 0.6997
Diante disso, o melhor modelo para determinao do custo de uma viagem, o
descrito na Tabela 46.
145
Tabela 46 Modelo Bayesiano para o Custo Total De Viagem
Variveis Mdia Desvio Padro Limite Inferior Medina Limite Superior
FATURAMENTO COM FRETE 0.5258 0.1143 0.3011 0.5253 0.756
FATURAMENTO COM PASSAGEM 0.5588 0.07092 0.4209 0.5581 0.6997
Temos, a seguir, os grficos gerados pelo WinBUGS na determinao do Modelo
Bayesiano.
alf a sample: 10000
-400.0 -200.0 0.0 200.0
0.0
0.002
0.004
0.006
Grfico 6 - Distribuio da Constante do Modelo (INTERCEPTO)
O Grfico 6 apresenta uma curva simtrica centrada em zero, o que confirma a
hiptese de nulidade da constante do modelo.
alf a.FATPASSA sample: 10000
0.0 0.2 0.4 0.6 0.8
0.0
2.0
4.0
6.0
Grfico 7 - Distribuio da Varivel Faturamento com Passagem
A varivel FATURAMENTO COM PASSAGEM comporta-se normalmente,
conforme Grfico 7. Sua mdia est no intervalo (0,421; 0,699).
146
alf a.FATFRETE sample: 10000
-0.5 0.0 0.5
0.0
1.0
2.0
3.0
4.0
Grfico 8 - Distribuio da Varivel Faturamento com Frete
O Grfico 8 da varivel FATFRETE possui comportamento simtrico. Sua mdia
est entre (0,301; 0,756).
tauc sample: 10000
0.0 5.00E-7 1.00E-6
0.0
1.00E+6
2.00E+6
3.00E+6
Grfico 9 - Preciso do Modelo
O Grfico 9 apresenta comportamento assimtrico, o que era de se esperar, visto
que a distribuio da preciso uma _
2
(Qui-Quadrado).
147
6.6. O Modelo Clssico e o Bayesiano
Os resultados obtidos utilizando a Estatstica Clssica e a Bayesiana so
bastante similares, conforme possvel observar na Tabela 47 .
Tabela 47 Modelo Clssico e o Bayesiano
Bayesiano Mdia Limite Inferior Limite Superior
FATURAMENTO COM FRETE 0.5258 0.3011 0.756
FATURAMENTO COM PASSAGEM 0.5588 0.4209 0.6997
Clssico Mdia Limite Inferior Limite Superior
FATURAMENTO COM FRETE 0,560 0,422 0,699
FATURAMENTO COM PASSAGEM 0,526 0,299 0,753
CONCLUSO
O Brasil apresenta uma matriz de transporte completamente desbalanceada,
privilegiando o modal rodovirio em detrimento de outros economicamente mais viveis.
O transporte hidrovirio um dos mais eficientes em termos de consumo de energia,
entretanto, ainda no devidamente explorado por falta de investimentos
governamentais e privados
Os modos de transporte devem ser encarados como um problema de polticas
pblicas. O processo lento de integrao entre as vrias regies do pas fez com que o
Brasil ingressasse na era moderna de seu desenvolvimento sem contar com um sistema
nacional de transporte multimodais e dependente da rodovia para movimentao de
cargas e passageiros
Os vrios planos de transporte elaborados por engenheiros brasileiros desde os
governos do Imprio, aps a proclamao da Repblica e ao longo do sculo XIX,
poca da introduo das ferrovias no Brasil, descartavam as rodovias como principal
instrumento de integrao, colocando nfase nas vias frreas e na navegao fluvial e
martima como soluo para os problemas de isolamento das regies brasileiras.
Dentre os vrios motivos para que o modelo ferrovirio no se concretizasse no
pas, podem ser destacados, dentre outros, a pobreza do mercado interno, o
subdesenvolvimento do pas e a forte resistncia ao pagamento de tributos pela elite
agrria.
No foram diferentes os motivos que impossibilitaram a utilizao da Navegao
Interior como modelo de integrao e desenvolvimento. A economia brasileira durante
muito tempo esteve baseada na escravido e no latifndio, dependendo da explorao
de uns poucos produtos exportveis.
Do fracasso das ferrovias e hidrovias em propiciarem uma rede nacional de
transporte para o Brasil, nasceu a preocupao com as rodovias, sendo seu
reconhecimento oficial como modalidade prioritria de transporte no Brasil, no incio dos
anos 50, quando da aprovao de um plano nacional de viao, em 1951.
149
A opo pelas rodovias agravou sobremaneira tanto as ferrovias quanto
cabotagem que declinaram ao longo das dcadas de 30 e 40. Como essas modalidades
eram consideradas ineficientes, suas condies operacionais se deterioraram, at
atingirem estado de calamidade. Este quadro impossibilitou a reabilitao das ferrovias
e da cabotagem, tornando-os inviveis na opinio de muitos tcnicos e polticos.
Em 2001, 60,5% de toda a carga transportada no Brasil utilizou o modal
rodovirio como meio de transporte. A simples transferncia de 10% deste total para a
navegao de cabotagem, representaria uma economia da ordem de R$ 1,0 bilho/ano.
No Brasil , aproximadamente, seis vezes mais caro transportar por rodovias ao
transporte hidrovirio. Este custo chega, em alguns pases desenvolvidos, a oito vezes o
hidrovirio.
Apesar disso, no se percebe, por parte do governo, medidas efetivas para que
este quadro se modifique. Isto fica claro quando analisamos os gastos do governo com
transporte entre 1996 e 2000. Em termos relativos, o montante gasto pelo governo em
investimentos pblicos em transporte foi, em 1996, de 39,8%, ou seja, R$
1.008.788.000,00. Este valor subiu em 2000 para R$ 1.840.281.000,00, o que
representou 50,2% dos investimentos, com um crescimento 10,4% neste modal. J os
investimentos no transporte aquavirio cresceu de 7,5% em 1996 para 11,9% em 2000,
passando de R$ 189.990.000,00 para R$ 435.894.000,00.
Todo esses investimentos nas rodovias brasileiras no conseguiram reverter o
estado crtico deste modal. O pssimo estado de conservao das rodovias, o alto frete
cobrado, alm do perigo crescente do roubo de cargas, obrigou aos empresrios a
busca por meios alternativos de transporte.
Este fenmeno percebido na evoluo da matriz de transporte entre 1993 e
2000. Neste perodo, o modal que apresentou maior crescimento foi o aquavirio, com
um crescimento de 2,71%. Por outro lado, o modal rodovirio reduziu sua participao
em 1,56%. importante salientar, entretanto, que a perda de espao pelo modal
rodovirio no se d pela diminuio na utilizao deste modal, mas pela maior
utilizao dos demais modais, visto que o setor de transporte est em plena expanso.
Para o estado do Amazonas a importncia do transporte aquavirio assume outra
proporo. Infelizmente as estatsticas oficiais ou esto desatualizadas, ou
simplesmente inexistem, sendo este um dos principais obstculos para o seu
planejamento. A consulta a alguns rgos pblicos, como o Sindicato dos Armadores do
150
Estado do Amazonas (SINDARMA) e a Capitania dos Portos da Amaznia Ocidental
mostrou a carncia na coleta de dados e, no caso da Capitania dos Portos, na
manuteno do banco de dados. O trabalho mais completo sobre o transporte fluvial no
estado do Amazonas data de 1982 e foi elaborado pelo CODEAMA (Centro de
Desenvolvimento, Pesquisa e Tecnologia do Estado do Amazonas). Infelizmente
nenhum trabalho de igual proporo foi elaborado a partir da. Recentemente o
Ministrio da Transporte atravs da Secretaria de Transporte Aquavirio (ANTAQ)
iniciou pesquisa para levantamento de dados preliminares sobre este setor. At o final
deste trabalho nenhum resultado havia sido publicado.
A coleta de dados feito junto Capitania dos Portos de Manaus tornou possvel
traar o perfil das embarcaes que navegam nos rios da Amaznia a partir de Manaus.
As embarcaes so em sua grande maioria de madeira, com um tamanho mdio
estimado em 22,5m e intervalo de confiana entre (21,3; 23,8). Esta alta variabilidade se
reflete nas demais dimenses dos barcos. Quanto lotao, os barcos esto
autorizados a navegarem com 124 passageiros com um intervalo entre (115;133).
Entretanto, sua lotao efetiva apresenta uma mdia de 70 passageiros no ms de
novembro de 2003 e de 101 em dezembro do mesmo ano. Isto representa uma taxa de
ocupao de 59,2% em novembro e de 77% em dezembro de 2003.
A alta heterogeneidade das embarcaes em sua dimenses, rotas e custos,
impossibilitou a formulao de um modelo economtrico linear que utilizasse essas
variveis para se prever os custos de viagem. Foram utilizadas a estatstica clssica e a
bayesiana na estimao desse modelo. Os modelos encontrados pelos dois mtodos
apresentaram resultados similares conforme Tabela 47, sendo que estes modelos
propem a estimao dos custos atravs do faturamento com a venda de passagens e o
faturamento com a cobrana do frete das mercadorias transportadas.
No se pode preterir do setor de transporte para o desenvolvimento de uma
nao. Nosso pas carece de grandes investimentos em infra-estrutura de transporte.
Como os recursos so escassos, fundamental o profundo conhecimento desta
atividade para uma melhor aplicao dos investimentos pblicos.
151
REFERNCIAS BIBLIOGRFICAS
AHIMOC. Administrao das Hidrovias da Amaznia Ocidental. Hidrovia do
Madeira. Disponvel em <http://www.ahimoc.com.brhidmadei.htm> Acesso em: 05
nov. 2001.
AMAZONAS. CODEAMA Centro de Desenvolvimento, Pesquisa e Tecnologia.
Amazonas: Diagnstico do Transporte Fluvial. Manaus, 1982.
AMAZONAS Estrada de Rios. Produzido com exclusividade por profissionais da
FUNTEC. Manaus: Cultura Vdeo, VHS, son., color.
ALVES, Marco Antonio Sandoval Vasconcelos Denisard. et al. Manual de
Econometria. So Paulo: Editora Atlas, 2000.
BARCOS DA Amaznia. Produzido com exclusividade por profissionais da FUNTEC.
Manaus: Cultura Vdeo, VHS, son., color.
BASTOS, A. C. Tavares. O Vale do Amazonas. 3. ed. So Paulo: Ed. Nacional,
1975.
BRASIL. Ministrio dos Transportes. Movimentao nas Hidrovias. Disponvel em:
<http://www.transportes.gov.br/STA/DHI/ESTATISTICA/MovimentaoGeral.htm>Ac
esso em: 7 mar. 2003.
______ . ______ . Conceito de Hidrovias. Disponvel em
<http://www.transportes.gov.br/STA/DHI/Conceito.htm> Acesso em: 21 dez. 2001.
152
______ . ______ . Corredores Estratgicos de Desenvolvimento. Disponvel em:
<http://www.transportes.gov.br/bit/estudos/corredores.htm>Acesso em: 5 nov. 2001.
BRASIL. Ministrio do Planejamento, Oramento e Gesto. Potencial de transporte
por rio permanece inexplorado. Disponvel em:
<http://www.infraestruturabrasil.gov.br/noticias/not_detalhe.asp?not=971055559>
Acesso em: 28 dez. 2001.
BUARQUE, Cristovam. Avaliao Econmica de Projetos. Rio de Janeiro:
Campus, 1984.
BUGS 1.3, Software estatstico, copyright MRC Bioestatistics Unit, Cambridge
(UK): 1995. www.mrc-bsu.cam.ac.uk/bugs.
CEBDS. Conselho Empresarial Brasileiro para o Desenvolvimento Sustentvel.
Mobilidade Sustentvel O Transporte do Futuro. Disponvel em:
<http://www.cebds.com/jornal/mobilidade.htm> Acesso em: 22 nov. 2001.
______ . ______ . Transporte fluvial cresceu 5,5% no ltimo trinio.
<http://www.infraestruturabrasil.gov.br/noticias/not_detalhe.asp?not=367844623>
Acesso em: 28 dez. 2001.
CUNHA E SILVA, Jos Leopoldo; SOUZA, Wanda F.; NETO, Elizirio C.
Cabotagem e Navegao Interior: Instrumentos de Minimizao do Custo
Brasil Gerado nos Transportes. Disponvel em:
<http://www.tansportes.gov.br/bit/estudos/custoshidrovirios/cabotagem.htm>
Acesso em:17 fev. 2003.
DNIT. Principais Hidrovias. Disponvel em:
<http://www.dnit.gov.br/hidrovias/principais.htm>Acesso em: 7 mar. 2003.
______ . Hidrovias. Disponvel em: <http://www.dnit.gov.br/hidrovias/principais.htm>
Acesso em: 7 mar. 2003.
ECO, Umberto. Como se faz uma tese. So Paulo: Editora Perspectiva, 2002.
153
FREUND E. John, SIMON Gary A. Estatstica Aplicada: Economia, Administrao
e Contabilidade. Porto Alegre: Brookman, 2000.
FONSECA, Jairo Simaon da; MARTINS, Gilberto de Andrade. Curso de Estatstica.
6. ed. So Paulo: Editora Atlas S.A.,1996.
GALVO, Olimpio J. de Arroxelas. Desenvolvimento dos Transportes e
Integrao Regional no Brasil Uma Perspectiva Histrica. Planejamento e
Polticas Pblicas No. 13 Jun de 1996.
GEIPOT. Transportes no Amazonas Maio 2000. Disponvel em:
<http://www.geipot.gov.br/cadernos/2000/am-2000.htm> Acesso em: 21 dez. 2001.
GAMERMAN, Dani. Simulao Estocstica Via Cadeias de Markov. 12
o
. SINAPE
Caxaumbu 29/07 a 02/08/96. ABE Associao Brasileira de Estatstica.
GAMERMAN, Dani, MIGON, Hlio dos Santos. Inferncia Estatstica Uma
Abordagem Integrada. Instituto de Matemtica da UFRJ. Rio de Janeiro, 1993.
GELMAN, A. CARLING, Jonh B.; STERN, Hal S.; RUBIN, Donald B. Bayesian Data
Analysis. New York: Chapman & Hall, 1995.
GRECO, Alvsio Lahorgue, AREND, Lauro Roberto. Contabilidade: teoria e prtica
bsicas 9. Edio Porto Alegre: Editora Sagra Lazzatto, 2001..
GOUVEIA, Nelson. Contabilidade Bsica - 2. Edio So Paulo: Editora
HARBRA ltda, 2001.
KARATZIOVALIS, I. K. A Recuperao do Setor da Navegao de Cabotagem de
Carga Geral e sua Integrao na Multimodalidade: Uma Alternativa para a
Reduo do Custo Brasil. Disponvel em:
<http://www.dpc.mar.mil.br/InformativoMaritmo/Out_Dez00/Comunida de
cabotagem...> Acesso em: 17 fev. 2003.
154
MEYER, Paul L. Probabilidade: Aplicaes Estatstica. 2. ed. Rio de Janeiro:
LTC, 1983 Reimpresso 20000.
MIGON, Hlio dos Santos. Introduo Econometria. 30
a
. Reunio Regional da
Associao Brasileira de Estatstica /19
a
. Semana de Estatstica - UFAM. Manaus, 04
a 07 de Agosto de 1999.
MOBILIDADE Sustentvel, ou como Viajaremos para o Futuro. Revista Brasil
Sempre. Disponvel em:
<http://www.insghtnet.com.br/brasilsempre/numero7/m0507.htm>
Acesso em: 22 nov. 2001.
NETO, Leonardo Trisciuzzi. Rios da Amaznia: Coletnea de Dados: Pequeno
roteiro. 3
a
. ed. Niteri RJ: DHN, 2001.
NOGUEIRA, Ricardo Jos B. Amazonas: um Estado Ribeirinho. Manaus: Editora
da Universidade do Amazonas, 1999.
OLIVEIRA, Nildo Carlos. As Hidrovias e a Economia. Disponvel em:
http://www.construbid.com.br/.../F0204B0F6A602CBB83256AF100431B87?OpenDoc
ument&Editora> Acesso em: 28 dez. 2001.
PADOVEZE, Clvis Lus. Curso Bsico Gerencial de Custos. So Paulo: Pioneira
Thomson Leanring, 2003.
PORTO, Marcos Maia; SILVA, Cludio Ferreira da. Transportes, Seguros e a
Distribuio Fsica Internacional de Mercadorias. So Paulo: Aduaneira, 2000.
SPIEGEL, Murray R. Probabilidade e Estatstica. So Paulo: Pearson Education do
Brasil, 1978.
TRANSPORTE aquavirio foi o meio que mais ganhou terreno nos ltimos cinco
anos. NTCNet Publicao eletrnica da Associao Nacional de Transportes
155
de Cargas. Disponvel em: <http://www,ntc.org.br/trans_aqua.htm> Acesso em: 25
mar. 2002.
TRIOLA, Mrio F. Introduo Estatstica. Rio de Janeiro: LTC, 1999.
TV LIBERAL. Estradas e Hidrovias no Caminho do Desenvolvimento. Disponvel
em: <http://www.tvliberal.com.br/verpara/ediao1/hidrovias.htm> Acesso em: 28 dez.
2001.
VALENTE, Amir Mattar et al. Gerenciamento de Transporte e Frotas. So Paulo:
Pioneira Thomson Lenarning, 2003.
156
ANEXOS
157
ANEXO 1
158
ANEXO 2
# MODELO PARA PREVISO DO CUSTO TOTAL DAS EMBARCAES - PROGRAMA BUGS
#OBS: Dados livres de outilier
model
{
for(p in 1 : N) {
CTT[p] ~ dnorm(muc[p], tauc) # p=1,...,25.
muc[p] <-beta + beta.esc*ESC[p] +
beta.tpl*TPL[p] + beta.ftf*FTF[p] +
beta.ftp*FTP[p]
}
sigmac2 <- 1/tauc # preciso
# Priores dos coeficientes para efeitos fixos
beta ~ dnorm(0.0, 0.0001);
beta.ftp ~ dnorm(0.0, 0.0001);
beta.esc ~ dnorm(0.0, 0.0001);
#beta.tpo ~ dnorm(0.0, 0.0001);
#beta.tpv ~ dnorm(0.0, 0.0001);
beta.tpl ~ dnorm(0.0, 0.0001);
beta.ftf ~ dnorm(0.0, 0.0001);
tauc ~ dgamma(1.0E-3, 1.0E-3)
}
list( N=25, CTT = c( 67, 3740, 4500, 2000, 750, 665, 750, 7000, 8000, 2250, 8700, 6450, 2600, 800,
3000, 1000, 5500, 750, 5000, 4000, 5000, 5000, 5845, 7500, 6500),
ESC = c(0, 3, 3, 3, 0, 1, 0, 6, 2, 1, 3, 4, 0, 1, 2, 0, 3, 0, 1, 1, 1, 1, 3, 2, 3),
#TPO = c( 25, 48, 24, 24, 37, 60, 48, 168, 72, 24, 20, 51, 73, 12, 48, 13, 45, 24, 57, 72, 72, 72, 42, 48,
36),
#TPV = c( 5, 14, 33, 16, 9, 18, 12, 144, 12, 24, 32, 35, 16, 16, 30, 12, 32, 10, 26, 36, 30, 22, 32, 30, 34),
TPL = c(4, 3, 3, 4, 5, 4, 4, 3, 4, 5, 4, 5, 12, 5, 9, 3, 5, 5, 7, 3, 6, 3, 10, 6, 6, 5, 7),
FTP = c(120, 3500, 11060, 3000, 850, 600, 600, 5000, 4000, 3000, 8000, 9000, 3000, 1000, 1200, 1770,
8000, 800, 8000, 9000, 5000, 4200, 4000, 7500, 9500) ,
FTF = c( 150, 1700, 860, 1200, 500, 800, 350, 9000, 8000, 325, 2000, 650, 3550, 700, 3500, 2850, 3200,
3500, 3000, 3600, 3000, 1800, 5250, 2000, 2620) )
list(beta =0, beta.esc =0, beta.tpl =0, beta.ftf = 0, beta.ftp = 0, tauc =1)
159
ANEXO 3
# MODELO PARA PREVISO DO CUSTO TOTAL DAS EMBARCAES PROGRAMA BUGS
#OBS: Dados livres de outilier
model
{
for(p in 1 : N) {
CUSTOTAL[p] ~ dnorm(muc[p], tauc) # p=1,...,25.
muc[p] <- alfa +
alfa.FATPASSA*FATPASSA[p] +
alfa.FATFRETE*FATFRETE[p]
}
sigmac2 <- 1/tauc # preciso
# Priores dos coeficientes para efeitos fixos
alfa ~ dnorm(0.0, 0.0001);
# alfa.ESCALAS ~dnorm(0.0, 0.001);
# alfa.COMP ~dnorm(0.0, 0.001);
# alfa.TEMPVIAG ~dnorm(0.0, 0.001);
# alfa.POTENCIA ~dnorm(0.0, 0.001);
# alfa.TRIPULAC ~dnorm(0.0, 0.001);
# alfa.NVIAGEM ~ dnorm(0.0, 0.0001);
alfa.FATPASSA ~ dnorm(0.0, 0.0001);
alfa.FATFRETE ~ dnorm(0.0, 0.0001);
tauc ~ dgamma(1.0E-3, 1.0E-3)
}
list( N=25, CUSTOTAL = c(3740, 4500, 2000, 750, 665, 750, 7000, 8000, 2250, 8700, 6450, 2600, 800,
3000, 1000, 5500, 750, 67, 5000, 4000, 5000, 5000, 5845, 7500, 6500),
# ESCALAS = c(3, 3, 3, 0, 1, 0, 6, 2, 1, 3, 4, 0, 1, 2, 0, 3, 0, 0, 1, 1, 1, 1, 3, 2, 3),
#COMP = c(26, 30, 26, 27.70, 21.05, 23, 26, 34, 28.5, 31, 37.75, 26, 22, 25.5, 26, 24, 21, 21, 31.35, 33,
32.10, #29, 30, 29, 35.5),
# TEMPVIAG = c(14, 33, 16, 9, 18, 12, 144, 12, 24, 32, 35, 16, 16, 30, 12, 32, 10, 5, 26, 36, 30, 22, 32, 30,
34),
#POTENCIA = c(180, 315, 315, 360, 114, 315, 315, 480, 270, 315, 480, 420, 180, 250, 360, 370, 315,
315, 450, 520, 300, 315, 367, 315, 367),
# TRIPULAC = c(4, 5, 4 ,4, 3, 4, 5, 4, 5, 12, 5, 9, 3, 5, 5, 7, 3, 4, 6, 3, 10, 6, 6, 5, 7),
# NVIAGEM = c(8, 4, 8, 8, 8, 8, 2, 4, 4, 4, 4, 4, 8, 8, 8, 4, 8, 12, 4, 4, 4, 4, 4, 4, 4),
FATPASSA = c(3500, 11060, 3000, 850, 600, 600, 5000, 4000, 3000, 8000, 9000, 3000, 1000, 1200,
1770, 8000, 800, 120, 8000, 9000, 5000, 4200, 4000, 7500, 9500),
FATFRETE = c(1700, 860, 1200, 500, 800, 850, 9000, 8000, 325, 2000, 650, 3550, 700, 3500, 2850,
3200, 3500, 150, 3000, 3600, 3000, 1800, 5250, 2000, 2620) )
list(alfa =0, alfa.FATPASSA = 0, alfa.FATFRETE = 0, tauc =1)
160
ANEXO 4
# MODELO PARA PREVISO DO CUSTO TOTAL DAS EMBARCAES - PROGRAMA BUGS
#OBS: Dados livres de outilier
model
{
for(p in 1 : N) {
CUSTOTAL[p] ~ dnorm(muc[p], tauc) # p=1,...,25.
muc[p] <- alfa +
alfa.COMP*COMP[p] +
alfa.POTENCIA*POTENCIA[p] +
alfa.FATPASSA*FATPASSA[p] +
alfa.FATFRETE*FATFRETE[p]
}
sigmac2 <- 1/tauc # preciso
# Priores dos coeficientes para efeitos fixos
alfa ~ dnorm(0.0, 0.0001);
# alfa.ESCALAS ~dnorm(0.0, 0.001);
alfa.COMP ~dnorm(0.0, 0.001);
# alfa.TEMPVIAG ~dnorm(0.0, 0.001);
alfa.POTENCIA ~dnorm(0.0, 0.001);
# alfa.TRIPULAC ~dnorm(0.0, 0.001);
# alfa.NVIAGEM ~ dnorm(0.0, 0.0001);
alfa.FATPASSA ~ dnorm(0.0, 0.0001);
alfa.FATFRETE ~ dnorm(0.0, 0.0001);
tauc ~ dgamma(1.0E-3, 1.0E-3)
}
list( N=25, CUSTOTAL = c(3740, 4500, 2000, 750, 665, 750, 7000, 8000, 2250, 8700, 6450, 2600, 800,
3000, 1000, 5500, 750, 67, 5000, 4000, 5000, 5000, 5845, 7500, 6500),
# ESCALAS = c(3, 3, 3, 0, 1, 0, 6, 2, 1, 3, 4, 0, 1, 2, 0, 3, 0, 0, 1, 1, 1, 1, 3, 2, 3),
COMP = c(26, 30, 26, 27.70, 21.05, 23, 26, 34, 28.5, 31, 37.75, 26, 22, 25.5, 26, 24, 21, 21, 31.35, 33,
32.10, 29, 30, 29, 35.5),
# TEMPVIAG = c(14, 33, 16, 9, 18, 12, 144, 12, 24, 32, 35, 16, 16, 30, 12, 32, 10, 5, 26, 36, 30, 22, 32, 30,
34),
POTENCIA = c(180, 315, 315, 360, 114, 315, 315, 480, 270, 315, 480, 420, 180, 250, 360, 370, 315, 315,
450, 520, 300, 315, 367, 315, 367),
# TRIPULAC = c(4, 5, 4 ,4, 3, 4, 5, 4, 5, 12, 5, 9, 3, 5, 5, 7, 3, 4, 6, 3, 10, 6, 6, 5, 7),
# NVIAGEM = c(8, 4, 8, 8, 8, 8, 2, 4, 4, 4, 4, 4, 8, 8, 8, 4, 8, 12, 4, 4, 4, 4, 4, 4, 4),
FATPASSA = c(3500, 11060, 3000, 850, 600, 600, 5000, 4000, 3000, 8000, 9000, 3000, 1000, 1200,
1770, 8000, 800, 120, 8000, 9000, 5000, 4200, 4000, 7500, 9500),
FATFRETE = c(1700, 860, 1200, 500, 800, 850, 9000, 8000, 325, 2000, 650, 3550, 700, 3500, 2850,
3200, 3500, 150, 3000, 3600, 3000, 1800, 5250, 2000, 2620) )
list(alfa =0, alfa.COMP =0, alfa.POTENCIA = 0, alfa.FATPASSA = 0, alfa.FATFRETE = 0, tauc =1)
161
ANEXO 5
# MODELO PARA PREVISO DO CUSTO TOTAL DAS EMBARCAES - PROGRAMA BUGS
#OBS: Dados livres de outilier
model
{
for(p in 1 : N) {
CUSTOTAL[p] ~ dnorm(muc[p], tauc) # p=1,...,25.
muc[p] <- alfa +
alfa.ESCALAS*ESCALAS[p]
+
alfa.TEMPVIAG*TEMPVIAG[p] +
alfa.TRIPULAC*TRIPULAC[p] +
alfa.NVIAGEM*NVIAGEM[p]
+
alfa.COMP*COMP[p] +
alfa.POTENCIA*POTENCIA[p] +
alfa.FATPASSA*FATPASSA[p] +
alfa.FATFRETE*FATFRETE[p]
}
sigmac2 <- 1/tauc # preciso
# Priores dos coeficientes para efeitos fixos
alfa ~ dnorm(0.0, 0.0001);
alfa.ESCALAS ~dnorm(0.0, 0.001);
alfa.COMP ~dnorm(0.0, 0.001);
alfa.TEMPVIAG ~dnorm(0.0, 0.001);
alfa.POTENCIA ~dnorm(0.0, 0.001);
alfa.TRIPULAC ~dnorm(0.0, 0.001);
alfa.NVIAGEM ~ dnorm(0.0, 0.0001);
alfa.FATPASSA ~ dnorm(0.0, 0.0001);
alfa.FATFRETE ~ dnorm(0.0, 0.0001);
tauc ~ dgamma(1.0E-3, 1.0E-3)
}
list( N=25, CUSTOTAL = c(3740, 4500, 2000, 750, 665, 750, 7000, 8000, 2250, 8700, 6450, 2600, 800,
3000, 1000, 5500, 750, 67, 5000, 4000, 5000, 5000, 5845, 7500, 6500),
ESCALAS = c(3, 3, 3, 0, 1, 0, 6, 2, 1, 3, 4, 0, 1, 2, 0, 3, 0, 0, 1, 1, 1, 1, 3, 2, 3),
COMP = c(26, 30, 26, 27.70, 21.05, 23, 26, 34, 28.5, 31, 37.75, 26, 22, 25.5, 26, 24, 21, 21, 31.35, 33,
32.10, 29, 30, 29, 35.5),
TEMPVIAG = c(14, 33, 16, 9, 18, 12, 144, 12, 24, 32, 35, 16, 16, 30, 12, 32, 10, 5, 26, 36, 30, 22, 32, 30,
34),
162
POTENCIA = c(180, 315, 315, 360, 114, 315, 315, 480, 270, 315, 480, 420, 180, 250, 360, 370, 315, 315,
450, 520, 300, 315, 367, 315, 367),
TRIPULAC = c(4, 5, 4 ,4, 3, 4, 5, 4, 5, 12, 5, 9, 3, 5, 5, 7, 3, 4, 6, 3, 10, 6, 6, 5, 7),
NVIAGEM = c(8, 4, 8, 8, 8, 8, 2, 4, 4, 4, 4, 4, 8, 8, 8, 4, 8, 12, 4, 4, 4, 4, 4, 4, 4),
FATPASSA = c(3500, 11060, 3000, 850, 600, 600, 5000, 4000, 3000, 8000, 9000, 3000, 1000, 1200,
1770, 8000, 800, 120, 8000, 9000, 5000, 4200, 4000, 7500, 9500),
FATFRETE = c(1700, 860, 1200, 500, 800, 850, 9000, 8000, 325, 2000, 650, 3550, 700, 3500, 2850,
3200, 3500, 150, 3000, 3600, 3000, 1800, 5250, 2000, 2620) )
list(alfa =0, alfa.ESCALAS =0, alfa.TEMPVIAG =0, alfa.POTENCIA =0, alfa.TRIPULAC =0, alfa.NVIAGEM
=0, alfa.COMP =0, alfa.FATPASSA = 0, alfa.FATFRETE = 0, tauc =1)