Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Weber Campos
ANLISE DE VARINCIA DA REGRESSO Temos que o modelo de regresso linear dado por y i = + xi + ei , e a reta de
regresso estimada dada por y i = a + bxi , em que a e b so estimativas de e . O erro (ei) a diferena entre o valor verdadeiro de y e seu valor estimado ( yi ), ou seja: ei = y i y i
Isolando y i , teremos:
y i = y i + ei
Subtraindo os dois membros da equao acima pela mdia de y ( y ), teremos:
( y i y ) = ( y i y ) + ei
Aplicando o somatrio e elevando os dois membros ao quadrado, e aps algumas simplificaes, obteremos:
(y
Onde:
y ) = ( y i y ) + ei2
2 2
(y
(y
mede a variabilidade dos y i em torno de y , ou seja, representa a parte da SQTot que explicada
pela regresso Y contra X. O termo
2 i
da SQTot que no explicada pela regresso de Y contra X. A relao entre as trs somas definidas acima , portanto, igual a: Soma de Quad. Total = Soma de Quad. da Regresso + Soma de Quad. dos Resduos
(y
y)
100 http://www.euvoupassar.com.br
ou SQRegresso =
b 2 ( xi x ) 2
A proporo da soma de quadrados total que explicada pela regresso linear denominada Coeficiente de Determinao (ou Explicao) e dada por:
r2 =
SQ Re g SQTot
O valor do Coeficiente de Determinao est entre 0 e 1, ou seja: 0 r2 1. Importante: O ajustamento da reta aos pontos observados tanto melhor quanto mais perto de 1 estiver o valor do coeficiente de determinao!!! Se r2 prximo de 1, isso significa que a variao explicada responde por uma grande percentagem da variao total. Se r2=0,81, por exemplo, indica que aproximadamente 81% da variao em y est relacionada com a variao de x e que 19% no explicado por x. Vejamos o que ocorre com a Soma dos Quadrados em duas situaes particulares: 1) Correlao Perfeita (r=1 ou r= -1): Nesta situao a reta ajustada passa exatamente sobre os pontos observados, assim todos os erros so iguais a zero: SQRes = 0 Da: SQTot = SQReg Coef. de Determinao (r2) = 1 2) Correlao Nula (r=0): Nesse caso a reta de regresso paralela ao eixo x (coeficiente angular (b) igual a zero) e coeficiente linear igual a y , logo: SQReg = 0 Da: SQTot = SQRes Coef. de Determinao (r2) = 0 Por definio, um Quadrado Mdio dado pelo quociente da diviso de uma soma de quadrados pelo respectivo nmero de graus de liberdade. O quadrado mdio do resduo QMRes
( ) =
2 e
SQRes n-2
101 http://www.euvoupassar.com.br
Este valor pode ser usado para testar, ao nvel de significncia dado, a hiptese H0 : = 0. Na regresso linear simples, pode-se tambm calcular a estatstica F por meio do coeficiente de determinao (R2). Veja a demonstrao: F= F= QMReg__ = SQReg / 1__ = QMRes SQRes / n-2 SQReg x (n-2)__ = (n-2)_______ SQRes SQRes / SQReg
(n-2)_______ = (n-2) = (n-2) = (SQTot SQReg) / SQReg SQTot / SQReg SQReg / SQReg SQTot / SQReg 1 (n-2) 1 / R2 1 .
F=
Voc pode acrescentar ao seu formulrio esta ltima expresso. comum apresentar a decomposio da soma dos quadrados total, os valores dos quadrados mdios e o valor de F em uma tabela, conforme o seguinte esquema: Tabela de Anlise de Varincia da Regresso (ANOVA) Fonte Graus de Liberdade Soma de Quadrados Quadrado Mdio (ou Varincia)
b 2 ( xi x ) 2
Regresso 1 ou
( xi ) 2 b 2 xi n
SQ Re g 1
(varincia da regresso)
QM Re g QM Re s
com 1 e n-2 graus de liberdade
e = ( y
2 i
y) 2 =
e2 =
= SQTotal SQRegressao.
SQ Re s (varinci n2
i
a do resduo)
Total
n-1
(y
y)
(y
y)
n 1
(varincia de y)
102 http://www.euvoupassar.com.br
EXEMPLO: Construir a tabela de anlise da Varincia para uma amostra de 13 pares das variveis x e y, e sabendose que:
(x (x
Soluo:
(y
O valor de b (coeficiente angular da reta de regresso) pode ser calculado pela frmula:
b=
( x x )( y y ) (x x)
i i 2 i
b=
(x
(y
(y
y ) = 1728
2
Passemos a Soma de Quadrados dos Resduos: SQRes = SQTot SQReg = 1728 1452 = 276
276
e2 =
(varincia do resduo)
Total
n1= 13 - 1 = 12
1728
(varincia de y)
103 http://www.euvoupassar.com.br
A estatstica teste para testar a hiptese H0 : = 0 o valor do F, o qual igual a 57,9. O coeficiente de determinao da regresso
r2 =
# Varincias das Estimativas dos Parmentros Admitindo que os valores de xi so fixos e considerando que os ei so erros aleatrios, no correlacionados, com mdia nula e varincia constante 2. Ento, temos:
V (b) =
1 V (a) = + n
X xi2
V (b) =
104 http://www.euvoupassar.com.br
EXERCCIOS 01. (IBGE 99 ESAF) Suponha que, numa regresso linear simples, observemos a seguinte tabela de anlise da varincia:
graus de lib. 18 1
SS 62,83 42,43
MS
O valor calculado da estatstica F que completa a tabela ento, aproximadamente, igual a: (A) 21,08 (B) 28,17 (C) 35,36 (D) 42,43 (E) 57,18 02. (Gestor Fazendrio MG 2005 ESAF) Suponha que no exista associao linear entre duas variveis X e Y e que um nmero de observaes suficientemente grande de pares (X,Y) esteja disponvel para o estudo da regresso linear de Y em X. Assinale a opo que corresponde, nesse caso, aproximadamente, ao quadrado mdio do erro. a) 0. b) Quadrado do coeficiente de correlao amostral entre X e Y. c) Quadrado mdio da regresso. d) 1. e) Varincia das observaes do atributo Y. 03. (Estatistico CEASA MG 2004) Uma medida da proporo da varincia em Y explicada por X conhecida como: a) coeficiente de no-determinao b) coeficiente de determinao c) regresso mltipla d) inclinao
105 http://www.euvoupassar.com.br