Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
i
= Y
i
E(Y/X
i
) ou Y
i
= E(Y/X
i
) +
i
(3)
i
o desvio de Y
i
em torno de seu valor esperado condicional E(Y/X
i
) .
i
uma
varivel aleatria que pode assumir valores positivos ou negativos. Ele tambm
conhecido como perturbao estocstica ou erro estocstico. Ento, o consumo semanal
de uma famlia composta de uma parte sistemtica ou determinstica [E(Y/X
i
)] e uma
parte aleatria ou assistemtica ou aleatria.
Y
i
= E(Y/X
i
) +
i
como E(Y/X
i
) =
0
+
1
X
i
ento,
Y
i
=
0
+
1
X
i
+
i
(4)
A hiptese de que a reta de regresso passa pelos valores mdios condicionais de Y
implica que os valores mdios condicionais de
i
so zero, ou seja,
E(
i
/X
i
) = 0 (ver o exemplo para a classe de renda 80 da tabela 1).
Qual o significado de
i
?
O significado de
i
pode ser interpretado como um substituto de todas as variveis
que afetam Y mas que no esto em (4). Por que isto acontece?
1) impreciso da teoria;
2) indisponibilidade dos dados;
3) variveis perifricas;
4) aleatoriedade implcita no comportamento humano;
5) variveis Proxy fracas;
6) princpio da parcimnia regra da navalha de occam. Que as descries sejam
mantidas to simples at que se mostrem inadequadas. Entidades no devem ser
multiplicadas sem necessidade.
E quando no tivermos dados populacionais e, sim, amostras dos dados da
populao? Ou seja, pode-se prever o comportamento mdio de Y dado os valores de X a
partir de uma amostra da populao?
A resposta sim, mas no de forma acurada. Ou seja, o termo
i
ir crescer. Neste
caso teremos uma reta amostral ou funo de regresso amostral. Nos supomos que esta
reta seja uma boa representao, ou aproximao, da reta de regresso populacional. Ento,
Y
i
=
0
+
1
X
i
+
i
Ter como aproximao
Y
*
i
=
0
*
+
1
*
Xi
+
i
*
Prof. Dr. Sinzio Fernandes Maia
4
4
UFPBDepartamento de Economia Disciplina: 1201110 Econometria 2004.2
A questo : existe algum mtodo para que Y
*
i
=
0
*
+ 1
*
Xi
+
i
*
seja a melhor
aproximao de Y
i
=
0
+
1
Xi
+
i
. A resposta que existe e denominado de mtodo dos
mnimos quadrados e ser analisado prximamente.
Coeficiente de Correlao Linear (r)
Correlao e Causalidade
Pai: pra que aquela figura de rato na janela do seu quarto?
Filho: pra espantar os drages.
Pai: mas no h drages por aqui.
Filho: ento a coisa funciona mesmo!...
Quando duas variveis so correlacionadas, possvel predizer valores de uma delas
com base no conhecimento da outra. Isso leva freqentemente concluso errnea de que
uma varivel causa da outra. E isso particularmente verdadeiro quando a varivel
causal precede a outra varivel no tempo. Entretanto, o fato de haver um relacionamento
matemtico entre duas variveis nada nos diz quanto causa e efeito. Logo, h trs
explicaes possveis para a obteno de uma correlao:
i)existe uma relao de causa e efeito;
ii) ambas as variveis se acham relacionadas com uma terceira; ou
iii)a correlao devida ao acaso.
O caso da segunda possibilidade, exemplificado pelas folhas que caem das
rvores pouco antes de comear o inverno. Pode-se concluir que a queda das folhas tenha
causado a queda da temperatura, ou ambas as ocorrncias esto relacionadas com a
mudana de estaes?
Estatsticas tm demonstrado acentuada correlao entre o consumo de lcool e a
elevao dos salrios dos professores. de concluir que os professores estejam consumindo
seus aumentos de salrios para afogar as magoas, ou ser mais lgico admitir que,
medida que aumenta o nvel geral dos salrios (inclusive dos professores), haja tambm um
aumento do consumo de bens em geral, inclusive bebidas?
H muitos exemplos interessantes de relacionamentos esprios, ou sem sentido. Por
exemplo, um estudo recente revelou alta correlao entre o movimento de preos na bolsa
de Nova Iorque e a variao no comprimento de saias das mulheres. Outro estudo revelou
correlao entre os nascimentos na Inglaterra e a produo de ferro gusa nos Estados
Unidos.
que, para estabelecer relaes vlidas, preciso mais que simplesmente
emparelhar qualquer tipo de dados at achar alguma correlao. Em vez disso, usam-se
estudos correlacionais como pesquisas exploratrias iniciais a fim de identificar futuras
reas de pesquisa. Resultados que parecem promissores com base na lgica ou na teoria
devem ser submetidos a maior anlise para determinar se existe uma relao de causa e
efeito.
O verdadeiro perigo na utilizao de relaes para fins preditivos que no tenham
sido validadas em termos de causa e efeito que as relaes podem se modificar, ou que
modificaes deliberadas na varivel causal possam no conduzir s modificaes
esperadas na varivel efeito.
Prof. Dr. Sinzio Fernandes Maia
5
5
UFPBDepartamento de Economia Disciplina: 1201110 Econometria 2004.2
Dessa forma, a regresso e a correlao so tcnicas destinadas a estimar o
relacionamento entre duas ou mais variveis. A correlao sintetiza o grau de
relacionamento, enquanto a regresso equaciona matematicamente o relacionamento. A
equao pode ser usada para predizer valores de uma varivel, dados os valores da outra.
Correlao: o grau de relao entre as variveis e, determina o quanto uma
equao linear descreve, ou explica a relao entre as variveis.
O Coeficiente de Correlao de Pearson (r) ou r(X,Y), estudado por Karl
Pearson (1903), uma medida da relao entre duas variveis. Expressa tanto o sentido
quanto fora da correlao entre as variveis.
Ex: Peso de uma pessoa com sua altura
Quantidade Vendida e Preos
Quantidade Consumida e Renda (salrios)
Ex:
'
+ +
) ( ) (
) ( ) (
) , (
r f I l f y
Y f C k f y
G I C Y L K f Y
Na populao, o coeficiente de correlao ( ) mede a aderncia ou qualidade do
ajustamento verdadeira reta da relao entre X e Y, ou ainda o grau de relao entre elas.
Na amostra, o coeficiente de correlao (r) mede a quantidade de disperso em
torno da equao linear ajustada atravs do mtodo dos mnimos quadrados.O (r) uma
estimativa do parmetro ( ), medindo os desvios em relao reta ajustada.O coeficiente
de correlao (r) ser definido como a razo entre a covarincia e a raiz quadrada do
produto das varincias de X e Y.
[ ] [ ]
r
X X Y Y
X X Y Y
( )( )
( ) ( )
2 2
Levando-se em considerao o tamanho da amostra, pode-se dividir o numerador e o
denominador por (n).
Critrio 1
[ ] [ ]
r
n
X X Y Y
n
X X Y Y
1
1
2 2
( )( )
( ) ( )
ou
Prof. Dr. Sinzio Fernandes Maia
6
6
UFPBDepartamento de Economia Disciplina: 1201110 Econometria 2004.2
Critrio 2
y x
S S
Y X Cov
r
) , (
1
1
]
1
1
1
]
1
n
Y
Y
n
X
X
n
Y X
XY
r
2
2
2
2
) ( ) (
MEMRIA:
Mdia:
n
X
n
X
X
i i
Desvio-Padro:
n
X
n
X X
S
x x
2 2
) (
1
) (
O intervalo de variao de (r) que expressa tanto o sentido quanto a fora da correlao -
se situa entre -1 < r <1.
Prof. Dr. Sinzio Fernandes Maia
7
7
UFPBDepartamento de Economia Disciplina: 1201110 Econometria 2004.2
Observaes: quanto maior a qualidade de ajuste, mais prximo de 1 ou +1 estar o valor
de (r). Quando no h relao ento r=0.
Como se obtm as equaes de r?
A tcnica mais usada para determinar a equao da reta a tcnica dos mnimos
quadrados; a denominao provm do fato de a reta resultante minimizar a soma dos
quadrados dos desvios dos pontos em relao reta. Assim, pode-se dizer que a anlise de
regresso envolve inferncias quanto ao verdadeiro relacionamento existente na populao.
A inferncia envolve tanto testes de significncia como a construo de intervalos de
confiana. Alm disso, pode-se calcular um valor de coeficiente de correlao (r) que sirva
de medida de quo bem a reta se ajusta ao conjunto dos pontos.
Baseado em mdias e desvios-padro possvel calcular o coeficiente angular de
uma reta ajustada sobre a relao linear de duas variveis.
) )( (
2 2
y x
xy
r
S Y Y
2
) (
Minimizar S em torno de uma mdia significa derivar S em relao
Y
,
Prof. Dr. Sinzio Fernandes Maia
8
8
UFPBDepartamento de Economia Disciplina: 1201110 Econometria 2004.2
n
Y
Y
Y n Y
Y Y
Y Y
Y
S
0 ) ( 2
0 ) 1 )( ( 2
+
+
Os pontos das coordenadas X e Y esto definidas pelas seguintes equaes
) ( ) ( ) ( X b a bX a Y Y + +
) ( ) ( X X b Y Y - queremos saber a magnitude de (b)
(Multiplica-se ambos os lados por (X -
X
)
) )( ( ) )( ( X X X X b X X Y Y - Aplicando a propriedade do Somatrio
2
) ( ) )( ( X X b X X Y Y
- Se dividirmos ambos os lados por
2 2
) ( ) ( Y Y X X
[ ] [ ] [ ] [ ]
2 2
2
2 2
) ( ) (
) (
) ( ) (
) )( (
Y Y X X
X X b
Y Y X X
Y Y X X
r
Chamando S
xx
de Varincia de X e S
yy
Varincia de Y
Prof. Dr. Sinzio Fernandes Maia
9
9
UFPBDepartamento de Economia Disciplina: 1201110 Econometria 2004.2
2
2
) (
) (
Y Y S
X X S
yy
xx
yy xx
xx
S S
bS
r
.
1
1
]
1
n
Y
Y
n
X
X
n
Y X
XY
r
2
2
2
2
) ( ) (
9103 , 0
8074 , 64
59
70 . 60
59
10
) 60 (
430
10
) 60 (
420
10
60 . 60
419
2 2
1
1
]
1
1
1
]
1
r r
Critrio 2:
) )( (
2 2
y x
xy
r
9103 , 0
8074 , 64
59
) 70 )( 60 (
59
r r
Teste de significncia:
t
cal
=
2
1
2
r
n
r t
cal
=
2199 , 6
17135 , 0
8
9103 , 0
) 9103 , 0 ( 1
2 10
9103 , 0
2
Interpretao: Observar o valor tabelado na tabela t-student, com n-2 (g.l.) ao nvel
de 5%, obtendo um t
tab
=2,306. Observa-se que o valor t
cal
>t
tab
, rejeita-se H
0
: =0, ou seja,
existe uma correlao entre as variveis avaliadas.
Prof. Dr. Sinzio Fernandes Maia
11
11