Sei sulla pagina 1di 15

Modelos de regresso linear mltipla

1.1.1 Definio

Os MODELOS DE REGRESSO LINEAR MLTIPLA (MRLM) sero utilizados para
determinar o significado das variveis exgenas propostas, como determinantes das
condies do financiamento obtido: prmio de risco e limite de crdito.

Analiticamente apresentam-se na seguinte forma:

Y
i
= |
0
+ |
1
X
1i
+|
2
X
2i
+ ...

+ |
k
X
ki
+ u
i
.

Em que,

i - 1, 2, , n observaes;
Y
i
- varivel dependente ou exgena seleccionada;
X
ji
- com j = 1, ... k, os vectores das variveis independentes (regressores)
associadas a cada operao de financiamento i;
|
0
- termo constante;
|
j
- com j = 1, ... k, os coeficientes (parmetros a estimar), associados a cada uma
das k variveis independentes;
u
i
- termo de erro ou resduo.

Portanto, de acordo com este modelo, a varivel dependente (Y) interpretada como uma
combinao linear de um conjunto de k variveis independentes (X
k
), cada uma das quais
vem acompanhada de um coeficiente (|
k
) que indica o peso relativo dessa varivel na
equao. A equao inclui ainda uma constante (|
0
), um distrbio aleatrio (u
i
) que
recolhe tudo o que as variveis independentes no so capazes de explicar, correspondendo
diferena entre o valor observado da varivel dependente e o correspondente valor
assumido pela estimativa na parte principal do modelo.

A seguir procede-se especificao dos modelos utilizados:

1- Modelo de avaliao do impacto no PRMIO DE RISCO:

CLSPR
i
= |
0
+ |
1
X
1i
+|
2
X
2i
+ + |
8
X
8i
+ |
9
X
9i
+ |
10
X
10i
+ |
11
X
11i
+ |
12
X
12i
+ |
13
X
13i
+ |
14
X
14i
+ |
15
X
15i
+ u
i
.

2 - Modelo de avaliao do impacto no LIMITE DE CRDITO:

LNMONT
i
= |
0
+ |
1
X
1i
+|
2
X
2i
+ + |
8
X
8i
+ |
9
X
9i
+ |
10
X
10i
+ |
11
X
11i
+ |
12
X
12i
+ |
14
X
14i
+ |
15
X
15i
+ u
i
;

em que:

CLSPR
i
varivel dependente que representa o prmio de risco do crdito atribudo (em
classes), medido atravs da margem (%) que acresce ao indexante de mercado (taxa
euribor);
LNMONT
i
varivel dependente que representa o limite de crdito atribudo, medido
atravs do logaritmo natural do montante da operao de crdito de curto prazo (em
milhares de euros).

X - Varivel independente;
X
1
- Durao da relao bancria = Nmero de anos de relacionamento com o banco
financiador (em classes);
X
2
- Concentrao = Concentrao (em %) das responsabilidades bancrias junto do
banco financiador (em classes);

X
3
- Reputao = Nmero de anos de actividade (em classes);
X
4
- Dimenso = Logaritmo natural do valor do Activo lquido da empresa;
X
5
- Endividamento = (Passivo/Activo lquido)*100;
X
6
- Vendas = Logaritmo natural do valor do Volume de Negcios da empresa;
X
7
- Liquidez geral = [(Activo circulante + Acrscimos de proveitos) / (Dvidas a terceiros
c.p. + Acrscimos de custos)]*100;
X
8
- Resultados Operacionais = Proveitos Operacionais - Custos Operacionais (em
milhares de euros);
X
9
- Desvio da rendibilidade da empresa em relao ao sector em que se insere =
(RBV
i
/RBV
CAE
)*100.
Sendo RBV, a Rendibilidade Bruta das Vendas (em %); i, a empresa i e CAE, o
Cdigo de Actividade Econmica (a 5 dgitos) da actividade a que pertence a
empresa i.
X
10
- Poder de mercado bancrio local = Quota de mercado (em %) em termos de nmero
de balces do banco financiador no mercado local;
X
11
- Indstria = Varivel dicotmica, que toma o valor 1, se a empresa pertence ao
sector da indstria e 0 nos outros casos;
X
12
- Construo = Varivel dicotmica, que toma o valor 1, se a empresa pertence ao
sector da construo e 0 nos outros casos;
X
13
- Direco Crdito = Varivel dicotmica, que toma o valor 1, se a localidade onde o
crdito est domiciliado a sede de uma direco de crdito e 0 nos outros casos;
X
14
Deciso = Nmero de rgos de deciso da operao de crdito;
X
15
Scios = Nmero de scios/accionistas da empresa, com participao igual ou
superior a 5%.


Adopta-se o mtodo dos mnimos quadrados ordinrios (OLS) para estimar os parmetros
seleccionados. O mtodo OLS estabelece que os estimadores dos |s (|
1
, |
2
|
k
) devero
ser escolhidos de forma a minimizar a soma do quadrado dos resduos observados (Eu
i
2
),
obtidos pela diferena entre os valores observados e os valores estimados da varivel
dependente.

Este estimador goza de propriedades tericas definidas no teorema de Gauss-Markov,
segundo o qual, dados os pressupostos de um modelo de regresso linear clssico, os
estimadores OLS, na classe dos estimadores lineares no enviesados, tm varincia
mnima, isto , so BLUE (Best Linear Unbiased Estimators). Por outros termos, os
estimadores OLS so lineares, ou seja so funes lineares da varivel aleatria Y, so no
enviesados, isto o seu valor esperado corresponde ao verdadeiro valor do parmetro da
populao e so eficientes, o que significa que possuem varincia mnima no conjunto dos
estimadores lineares no enviesados.

1.1.2 Pressupostos

Segundo Pestana e Gageiro (2003) e Passos (2003) os pressupostos bsicos de um MRLM
com dados seccionais so os seguintes:

1. Linearidade do fenmeno em estudo. A equao de regresso adopta uma forma
particular. A relao entre cada varivel independente e a dependente linear e
aditiva e so excludas as variveis independentes no relevantes. Em concreto, a
varivel dependente a soma de um conjunto de elementos: a origem da recta, uma
combinao de variveis independentes e os resduos.

2. No colinearidade. No existe uma relao linear exacta entre nenhuma das
variveis independentes. Portanto, a correlao entre as variveis independentes e
os termos de erros nula:
cov (u
i
, X
i
) =0, com i = 1,2,3 , n.

3. Independncia (no correlao dos termos de erro). Os termos de erro referentes a
duas observaes distintas no esto correlacionados, sendo portanto independentes
entre si, isto , no existe uma relao sistemtica entre os erros:
cov (u
i
, u
j
) =0, com ij = 1,2,3 , n.

4. Homocedasticidade. Para cada valor de uma varivel independente (ou
combinao de valores de variveis independentes), a varincia dos termos de erro
constante. Todos os u
i
tm varincia idntica, seja qual for o valor de i:
var (u
i
)= E[u
i
E(u
i
)]
2
= E(u
i
2
)=o
2
, com i = 1,2,3 , n.

5. Normalidade. Os termos de erro no dependem dos regressores. Para cada valor de
uma varivel independente (ou combinao de valores de variveis independentes),
os termos de erro distribuem-se normalmente com uma mdia zero, seja qual for o
valor de i:
E(u
i
) = 0, com i = 1,2,3 , n.


1.1.3 Qualidade do ajustamento

A qualidade do ajustamento geralmente medida pelo coeficiente de Coeficiente de
determinao mltipla (R
2
):

;

sendo:

SSR = soma dos quadrados dos resduos, correspondendo variao em y explicada pelo modelo;
SST = soma dos quadrados totais, representando a variao total em y, em torno de sua mdia;

O coeficiente de determinao uma medida do grau de ajustamento da equao de
regresso mltipla aos dados amostrais, isto , mede a qualidade do ajustamento e
representa a percentagem da variao total da varivel dependente que explicada pela
equao de regresso estimada. Assim, o coeficiente de determinao mltipla indica a
percentagem da variao total da varivel dependente que pode ser atribuda variao das
variveis independentes.

O coeficiente de determinao tambm visto como uma medida da capacidade preditiva
do modelo sobre o mesmo perodo amostral, ou como uma medida de quo bem a
regresso estimada se ajusta aos dados. O coeficiente de determinao est compreendido
entre 0 e 1, sendo que o valor 0 indica o pior ajustamento e o valor 1 indica o
melhor ajuste que pode ser conseguido.

O coeficiente de determinao considerado uma boa medida da aderncia da equao de
regresso aos dados amostrais (Wooldridge, 2003), contudo apresenta um problema, na
medida em que se se incluem mais variveis ao modelo, o seu valor aumenta. Da que se
pode obter um maior valor de R
2
, com a incluso de todas as variveis disponveis, o que
no significa que seja essa a melhor equao de regresso mltipla.

2
2
2
) (
) (
y y
y y
SST
SSR
R
E
E
= =
Por isso, utilizado o coeficiente de determinao ajustado,
2
R , que ajusta o valor de
em funo do nmero de variveis e no tamanho da amostra:

.

1.1.4 Testes de hipteses

Testes de Significncia Global do Modelo.
No bastando apenas testar os coeficientes, necessrio reconhecer se o modelo no seu
conjunto significativo. As hipteses so:
;
.
A estatstica do teste :

;

onde,

SSR = soma dos quadrados dos resduos, correspondendo variao em y explicada pelo modelo;
SSE = soma dos quadrados dos resduos de mnimos quadrados e tambm a parcela da variao em y no
explicada pelo modelo.

Se o valor absoluto de F crtico for menor que o valor de F amostral, rejeita-se a hiptese
nula, concluindo-se que o modelo no seu conjunto estatisticamente significativo para a
populao em estudo.

Testes de Significncia aos Coeficientes da Regresso.
Para haver relao entre as duas variveis (dependente e independente), os coeficientes que
as relacionam devem ser diferentes de zero. por este motivo que na anlise de regresso
simples, se costuma testar a nulidade dos coeficientes, para se aferir da relao entre as
variveis.

1
) 1 )( 1 (
1
2
2


=
k n
n R
R
0 ... :
0 ... :
1 0 1
1 0 0
= . .
= . .
k
k
H
H
| | |
| | |
) 1 , ( 1 ;
~
1
1
+

=
k n q k n
F
N
SSE
SSR
F
o
As hipteses so:
;
.

O teste de hiptese aos coeficientes de regresso bilateral. Para se testar a hiptese dos
coeficientes serem nulos, necessrio conhecer a distribuio amostral do coeficiente j
estimado,
j
|

, que segue uma distribuio T de Student. A estatstica de Teste :



;

sendo:
^
j
S
|
= desvio padro do coeficiente |
j
estimado.
Se o valor absoluto do t crtico for menor que o valor de t amostral, rejeita-se a hiptese
nula e por isso o coeficiente em questo considerado estatisticamente significativo e
consequentemente a respectiva varivel importante para a populao em estudo.


1.1.5 Avaliao de diagnstico

Multicolinearidade

Um dos pressupostos do MRLM o de que no existam relaes lineares exactas entre as
variveis explicativas, ou seja, no se verifique perfeita multicolinearidade. Apesar das
estimativas obtidas pelo mtodo OLS continuarem a ser no enviesadas, de acordo com
Manso (1998), no sabemos nada acerca das suas propriedades, quando calculadas a partir
de uma nica amostra.

Em termos prticos, a forte multicolinearidade provoca elevadas varincias e erros padro
dos estimadores OLS, o que reflecte impreciso na estimao dos parmetros.
Consequentemente, os intervalos de confiana para os |s so grandes. Na presena deste
fenmeno, tambm se torna frequente encontrar coeficientes de determinao elevados,
dado que impossvel separar os efeitos das variveis, embora existam poucos t-ratios
significativos.
0 :
0 :
1
0
=
=
j
j
H
H
|
|
) 1 (
~

^

=
k n
j
a
t
S
t
j
|
|

A intensidade da multicolinearidade pode ser estudada e acordo com Pestana e Gajeiro
(2003) atravs da correlao entre as variveis independentes, da tolerncia, do factor de
inflao da varincia (VIF - variance inflation factor), do ndice condio (condition
index) e da proporo de varincia (variance proportion).

Recorre-se matriz das correlaes como uma das formas preliminares de verificao da
multicolinearidade, sendo que elevados coeficientes de correlao de Pearson indiciam a
existncia de problemas de multicolinearidade
1
. Contudo, a anlise da matriz de
correlaes bivariadas insuficiente para estudar este fenmeno; por exemplo, uma
varivel independente pode ser uma combinao linear de diversas variveis
independentes, situao que no identificada no coeficiente de correlao bivariada.

O impacto da multicolinearidade na preciso da estimao dos parmetros tambm pode
ser captado atravs da medida de tolerncia. A tolerncia de uma determinada varivel
independente (X
j
) igual ao complemento do coeficiente de determinao mltiplo (R
2
j
)
obtido entre essa varivel e as restantes variveis independentes, ou seja, mede a proporo
da sua variao, que no explicada pelas restantes variveis independentes.

A tolerncia dada por:
Tol X
j
= 1 R
2
j
;

onde:
X
j
uma varivel independente
R
2
j
o coeficiente de determinao da regresso de x
j
sobre todos as outras variveis independentes.

Varia entre zero e um e pretende-se que seja prxima de um. Segundo Pestana e Gageiro
(2003), o valor habitualmente considerado como o limite abaixo do qual existe
multicolinearidade intensa 0,1.

O inverso da tolerncia designa-se por factor de inflao da varincia (VIF - Variance
Inflation Factor) e dado por:

1
De acordo com Berry e Feldman (1985) difcil indicar um valor de correlao, aplicvel a todas as situaes, abaixo do
qual se possa afirmar que no existe multicolinearidade. No entanto, os autores apontaram 0,8 como o valor de referncia
a partir do qual se coloca o problema da multicolinearidade.


VIF
j
= 1/Tol
j
.

Quanto mais prximo da unidade estiver o coeficiente VIF, menor ser a
multicolinearidade. Na sequncia do que foi referido a respeito da tolerncia, 10 ser o
valor acima do qual existe multicolinearidade intensa.

O ndice condio (condition index) tambm permite a anlise da intensidade da
multicolinearidade. Este corresponde raz quadrada do quociente resultante do maior
valor prprio das dimenses existentes entre as variveis X's por cada valor prprio. De
acordo com Pestana e Gageiro (2003, p. 627), um valor no ndice condio superior a 15,
revela um possvel problema de multicolinearidade, que se torna srio se exceder 30.

Por ltimo, a proporo da varincia (variance proportion) a proporo da varincia
explicada por cada componente principal, ou seja a proporo da varincia para cada um
dos parmetros estimados que atribuda a cada valor prprio (Pestana e Gajeiro, 2003),
sendo que um valor superior a 0,9 considerado problemtico.

Apesar de no existir um consenso generalizado em torno do valor mximo a partir do qual
se considera existir multicolinearidade (SPSS, 2003), de acordo com Pestana e Gageiro
(2003, p. 627), a intensidade da multicolinearidade considerada elevada quando
simultaneamente o condition ndex maior que 30, quando uma componente contribui
substancialmente (em 90% ou mais) para a varincia de duas ou mais variveis e ainda
quando a tolerncia dessas variveis inferior a 0,1.


- Autocorrelao

A existncia de autocorrelao dos resduos, isto , o problema das perturbaes aleatrias
dos erros no serem independentes duas a duas, afecta as estimativas obtidas para os
parmetros do modelo, porque o facto do erro padro da regresso ser inferior quando
existe autocorrelao, reduz a amplitude dos intervalos de confiana de |
i
. Apesar do
fenmeno da autocorrelao dos resduos estar mais associado a sries cronolgicas
possvel surgir entre dados cross-section designando-se por autocorrelao espacial.

Para analisar o fenmeno da autocorrelao recorre-se ao teste de Durbin-Watson, aps
verificar a existncia dos pressupostos que lhe esto subjacentes. A estatstica d definida
da seguinte forma (Gujarati, 1995):

( )

=
=

=
n
t
t
n
t
t t
e
e e
d
1
2
2
2
1


onde e
t
so os resduos apurados na anlise OLS aplicada aos dados.

As hipteses nula e alternativa a testar so as seguintes:

Ho: p=0 ;
Ha: p0 ;

onde, p a autocorrelao dos resduos. Na hiptese nula afirma-se portanto que no existe
autocorrelao dos resduos.

O valor de d est relacionado com o valor tomado pelo parmetro p, que pode tomar
valores compreendidos entre -1 e +1, atravs da relao (Maroco, 2003):

d ~ 2(1-p) .

Aqueles valores substitudos nesta relao delimitam o campo de variao de d ao
intervalo 0 a 4, com d=0 quando p=-1, ou seja, quando a correlao total e negativa e
d=4, quando p= 1, que est associado a correlao total positiva. O valor intermdio d=2
ocorre quando p=0, isto , quando no h correlao.

;
Uma forma mais exacta para este teste consiste em comparar o valor de d com um limite
inferior (d
L
) e um limite superior (d
U
) para testar H
0
de no existir autocorrelao entre os
resduos, em oposio a H
1
de que existe autocorrelao positiva entre os resduos. Durbin
e Watson criaram ento uma tabela onde se pode encontrar os valores crticos d
L
e d
U

correspondentes aos respectivos nveis de significncia.

Quadro Error! No text of specified style in document..1. Regras de deciso de Durbin Watson
Hiptese nula Se d pertence ao intervalo ento a deciso ...
H
o
: No h autocorrelao positiva 0 at d
L
Rejeitar H
o
<=> Autocorrelao positiva
H
0
: No h autocorrelao positiva d
L
at d
U
Inconclusiva
H
0
: No h autocorrelao
(positiva ou negativa)
d
U
at 4- d
L
Aceitar H
0
<=>No h autocorrelao
H
0
: No h autocorrelao negaiva 4- d
U
at 4- d
L
lnconclusiva
H
0
: No h autocorrelao negativa 4- d
L
at 4 Rejeitar H
o
<=> Autocorrelao negativa

Fonte: Manso (1998, p. 6.18)

- Homocedasticidade

Outro dos pressupostos bsicos do MRLM o da homocedasticidade, ou seja, espera-se
que os termos de erro possuam idntica varincia, E(
i
2
) = o
2
, i=1, 2, 3, ..., n. Quando esta
condio no respeitada, ou seja quando um dos termos de erro no respeita esta
condio, ocorre o fenmeno da heterocedasticidade. Este fenmeno frequente em dados
cross-section, evidenciando um efeito escala, em funo da dimenso do fenmeno em
anlise.

No caso em que a variabilidade da resposta difere de observao para observao, no h
uma medida comum dessa variabilidade. Os estimadores OLS mantm-se lineares e no
enviesados, mas no so eficientes, ou seja, perdem a caracterstica BLUE, pelo que os
intervalos de confiana e os testes de hipteses baseados nas distribuies t e F podero
conduzir a concluses erradas.


A anlise do fenmeno da homocedasticidade requer o teste das seguintes hipteses:

H
0
: o
1
2
=o
2
2
=o
3
2
==o
k
2
=o
2
(existncia de homocedasticidade dos termos de erro);
H
1
: Pelo menos uma das varincias diferente (inexistncia de homocedasticidade dos
termos de erro).

A homocedasticidade diagnosticada geralmente atravs da observao e anlise grfica
dos resduos e de alguns testes.

Na anlise grfica seguem-se as indicaes de Neves e Gajeiro (2003), que propem dois
processos alternativos, consistindo em observar as relaes, por um lado, entre os resduos
estudantizados
2
e os resduos estandardizados
3
e, por outro lado, entre os resduos
estandardizados e os valores estimados de Y. No exame grfico, a disposio dos termos
de erro de forma aleatria, no se vislumbrando qualquer comportamento ou tendncia
homognea na sua disposio, uma primeira indicao da existncia de
homocedasticidade.

Visando formalizar e clarificar a observao grfica preliminar do fenmeno, recorre-se a
vrios testes
4
, sendo um dos mais usuais o teste geral de White (Manso, 1998) e aquele que
permite maior facilidade e liberdade na sua aplicao.

Para se realizar o teste geral de White, so gerados inicialmente os estimadores OLS, com
a regresso que foi definida inicialmente e calculam-se os resduos, e em seguida elevam-
se os resduos, bem como os valores das variveis explicativas ao quadrado. Multiplicam-
se os valores das variveis explicativas de forma a encontrar todos os produtos cruzados
entre estas. Calcula-se a regresso do quadrado dos resduos sobre as variveis
explicativas, os quadrados destas e os respectivos produtos cruzados (regresso auxiliar)
5
.


2 O resduo estudentizado o resduo que varia de ponto para ponto, de acordo com a distncia de cada observao X mdia, ou seja, o resduo estandardizado
ajustado ao valor mdio de X. Distribuem-se de acordo com a t de Student com n-p-1 graus de liberdade. Com amostras grandes, aproximadamente 95% dos resduos
devem encontrar-se no intervalo (-2; 2).
3 O resduo estandardizado define-se como
i
/s, sendo
i
o resduo e s o desvio-padro do resduo. Indica o nmero de desvios-padro que se afastam da mdia, de
forma a que se encontrem normalmente distribudos, sendo que 95% destes resduos se encontraro no intervalo (-1,96; 1,96).
4 Um resumo dos principais testes utilizados no diagnstico do fenmeno da heterocedasticidade pode ser encontrado em Manso (1998, pp 5.5. 5.21).

5 Por uma questo de simplificao, quando o nmero de variveis dependentes muito elevado geralmente omitido da
regresso auxiliar o produto cruzado (Wooldridge, 2003).
A estatstica do teste a seguinte:

nR
2
~ ;
2
(p-1)
;

onde:
n - nmero de observaes
R
2
- coeficiente de determinao da nova regresso
p - nmero de regressores da ltima regresso efectuada (regresso auxiliar), incluindo o termo constante.

Pela comparao do valor observado do Qui-Quadrado, com o valor crtico para um nvel
de significncia o, conclui-se pela:
- rejeio de H
0
, se o valor observado for superior ao valor crtico, dizendo-se nestas
condies que h heterocedasticidade;
- admisso de H
0
, no caso oposto, pelo que se diz que os termos de erro so
homocedsticos.

Para resolver o problema da heterocedasticidade, quando a varincia dos termos de erro
no conhecida priori, entre vrias solues possveis, opta-se pela estimao atravs do
mtodo dos mnimos quadrados ponderados (Wheigted Least Squares WLS) s variveis
transformadas no mbito da realizao do teste de White (Cottrell, 2003).


- Normalidade

A varivel aleatria residual deve ser normalmente distribuda. Apesar da sua violao no
afectar a estimao dos parmetros do modelo, o pressuposto da normalidade necessrio
somente para testes de significncia estatstica, sendo crtico no caso de pequenas
amostras.

Perante amostras maiores, o teorema do limite central permite assegurar que a distribuio
amostral da mdia ser uma distribuio aproximadamente normal, independentemente da
forma da distribuio da populao. Na prtica, este teorema atenua a necessidade do
pressuposto de que as observaes provm de uma distribuio normal. Tendo como
referncia o teorema do Limite Central e, atendendo a que os
i
incorporam o efeito de um
conjunto de variveis independentes sobre a varivel dependente que no foram
especificamente includas no modelo, e que esse efeito marginal e aleatrio, o modelo de
regresso linear assume que os
i
~N(0, o
2
). Haveria, pois, que averiguar se os
i
possuam
distribuio normal.

Para o estudo da normalidade dos modelos pode recorrer-se inicialmente observao de
dois tipos de representaes grficas (Pestana e Gajeiro, 2003). Por um lado, atravs de um
histograma dos resduos estandardizados com uma curva normal sobreposta, pode-se
retirar uma primeira concluso preliminar sobre o grau em que os resduos estandardizados
se aproximam da distribuio normal, ao verificar a aproximao da distribuio dos erros
definio da curva normal a apresentada e dos respectivos nveis de assimetria e curtose.

Por outro lado, atravs das representaes grficas, do confronto entre a distribuio de
probabilidades dos valores observados e esperados numa distribuio normal e da
diferena entre os valores estandardizados para cada observao contra os valores
observados no eixo horizontal, conclui-se pela no violao da normalidade, se os pontos
se sobrepem de forma aleatria na diagonal e horizontal dos grficos referidos,
respectivamente, afastando-se as curvas apresentadas da forma sinuside.

Pode-se complementar a anlise anterior, recorrendo a um teste de aderncia da
distribuio dos resduos normalidade, sendo o teste de Kolmogorov-Smirnov (K-S), o
mais conhecido e eficaz (Reis et al., 1999).

Este teste permite analisar a aderncia ou ajustamento de uma varivel de nvel ordinal ou
superior normalidade da distribuio, atravs da comparao das frequncias relativas
acumuladas com as frequncias relativas esperadas (Pestana e Gajeiro, 2003), testando a
hiptese nula da varivel ter distribuio normal, contra a hiptese alternativa de isso no
suceder.

As hipteses so ento as seguintes:

H
0
: os resduos apresentam uma distribuio normal;
H
a
: os resduos no apresentam uma distribuio normal.

O valor do teste obtm-se pela maior diferena existente entre ambas. Isto :

Teste K-S = Max [|Cum f
oi
Cum f
ei
|; |Cum f
oi-1
Cum f
ei
|] ;

onde:
Cum f
oi
frequncia relativa acumulada observada na categoria i;
Cum f
ei
frequncia relativa acumulada esperada na categoria i;
Cum f
oi-1
frequncia relativa acumulada observada antecedente categoria i.

A hiptese nula rejeitada quando as frequncias observadas so significativamente
diferentes das frequncias esperadas (Pestana e Gajeiro, 2003), o que corresponde a valores
do teste sempre positivos (visto se operar em mdulos).

De notar que neste caso, ao no ser conhecida a mdia e o desvio padro da distribuio
especificada na hiptese nula, aplica-se a correco de Lilliefors
6
.



6 Lilliefors, para resolver este problema, apresentou em 1967 tabelas modificadas para o caso do ajustamento Normal, sem parmetros especificados, tendo por base a
mesma estatstica do teste (Reis, et al., 1999).

Potrebbero piacerti anche