Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1
Aula de hoje
} Tópicos
} Correlação e Regressão
} Referência
} Barrow, M. Estatística para economia, contabilidade e
administração. São Paulo: Ática, 2007, Cap. 7
2
Aula de hoje
Objetivos:
} Analisar os movimentos simultâneos de variáveis:
} Entender o grau de relação linear entre elas
através do cálculo do coeficiente de correlação
} Entender a causalidade entre elas através da
análise de regressão
3
Correlação
Exemplo: Renda familiar e gastos com
alimentação (em % da renda)
} Como esperado, à medida em que aumenta a renda familiar, diminui o
percentual da renda destinado à alimentação
Família Renda Total Gasto em 70
Alimentação
A 12 7,2 60
B 16 7,4
C 18 7,0 50
Renda Total
D 20 6,5
40
E 28 6,6
F 30 6,7
30
G 40 6,0
H 48 5,6
20
I 50 6,0
L 60 5,0 10
4,5 5,5 6,5 7,5
Gasto com Alimentação
Exemplo livro (Bussab-Morettin), p.81
} Consideremos as duas variáveis abaixo
Número de anos de serviço (X) por número de clientes de
agentes de uma cia de seguros
Dados hipotéticos
Exemplo livro (Bussab-Morettin), p.81
} Gráfico de Dispersão
80
70
Número de Clientes
60
50
40
30
20
10
0
0 2 4 6 8 10 12
Anos de Serviço
Dados hipotéticos
Covariância
} Dados n pares de valores (x1, y1)..., (xn, yn), chamaremos de
covariância entre as variáveis X e Y, na população:
cov( X , Y ) =
∑ (
n
x − x )(y − y )
i =1 i i
n
} Para calcular a covariância na amostra, devemos dividir por n-1
e não por n
} É a média dos produtos dos valores centrados das variáveis
} Tendo esta definição, podemos escrever o coeficiente de
correlação como:
cov( X , Y )
corr ( X , Y ) =
dp ( X ).dp (Y )
8
Características da covariância
9
Características da covariância
} A covariância é:
} No caso de população, a soma dos produtos dos desvios de
duas variáveis dividida pela quantidade de dados das
variáveis.
} No caso de amostra, a soma dos produtos dos desvios de
duas variáveis dividida pela quantidade de dados das
variáveis menos um.
} Os numeradores das expressões da covariância para
população e para amostra são iguais, o resultado da soma dos
produtos dos desvios.
10
• A covariância pode ser nula, negativa ou positiva.
• A covariância é a medida do afastamento simultâneo das
respectivas médias.
• Se as ambas variáveis aleatórias tendem a estar
simultaneamente acima, ou abaixo, de suas respectivas
médias, então a covariância tenderá a ser positiva e nos
outros casos poderá ser negativa, como mostram os gráficos
abaixo.
700 14%
27 10,3%
600 13%
500 12%
Vendas
Ação B
400 380
11% 10,8%
300
200 10%
100 9%
Ação A
0 8%
0 10 20 30 40 50 60 8% 9% 10% 11% 12% 13%
Propaganda
A maioria dos pares de valores tem os A maioria dos pares de valores tem
dois valores acima de sua média um valor acima de sua média e outro
correspondente, provocando abaixo da média correspondente,
covariância positiva. provocando covariância negativa.
11
Coeficiente de correlação = 0,81 Coeficiente de correlação = -0,81
3 4
2 3
2
1
1
0
Y
Y
0
-1
-1
-2 -2
-3 -3
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
X X
N N
∑(Xi − µ X ) × (Xi − µ X ) ∑ i X
(X − µ ) 2
σ XX = i=1
= i=1
= σ X2
N N
} A permutação das variáveis não altera o resultado da covariância, se os
pares de valores não forem alterados
σ XY = σYX
13
Características da covariância
14
Coeficiente de correlação
} Para facilitar o entendimento da relação entre duas
variáveis e evitar a influência da unidade de medida,
foi definido o coeficiente de correlação rXY.
} Os valores de rXY estão limitados entre os valores -1
e +1, e sem nenhuma unidade de medida
15
Coeficiente de correlação
} O coeficiente de correlação busca auferir a direção da
relação entre as variáveis, dentro de um intervalo
determinado entre -1 e 1
} O objetivo do intervalo é discriminar a direção e a
intensidade da relação:
} valores próximos de zero indicam ausência de relação entre as
variáveis
} valores próximos de 1 indicam forte relação positiva
} valores próximos de -1 indicam forte relação negativa
Coeficiente de correlação
} O coeficiente de correlação é a medida do grau de
associação linear entre duas variáveis
} Fórmula do coeficiente de correlação:
1 " xi − x %" yi − y %
corr(X,Y ) = ∑$ '$ '
n # dp(X) &# dp(Y ) &
Cálculo do coeficiente de correlação
Anos de Número x − x
x−x y − y y − y
Agente serviço de = zx = zy zx.zy
dp ( X ) dp ( Y )
(X) clientes
A 2 48 -3,7 -8,5 -1,54 -1,05 1,608
B 3 50 -2,7 -6,5 -1,12 -0,80 0,897
C 4 56 -1,7 -0,5 -0,71 -0,06 0,043
D 5 52 -0,7 -4,5 -0,29 -0,55 0,161
E 4 43 -1,7 -13,5 -0,71 -1,66 1,173
F 6 60 0,3 3,5 0,12 0,43 0,054
G 7 62 1,3 5,5 0,54 0,68 0,366
H 8 58 2,3 1,5 0,95 0,18 0,176
I 8 64 2,3 7,5 0,95 0,92 0,882
J 10 72 4,3 15,5 1,78 1,91 3,407
Total 57 565 0 0 8,768
Média 5,7 56,5
Desvio padrão 2,41 8,11
corr(X,Y ) =
∑ x y − nxy
i i Sendo que -1≤ corr(X,Y) ≤1
( xi2 − nx
2
)( yi2 − ny
2
)
} Lembremos da variância, que usamos para observar a
dispersão de uma só variável
2
var( X ) =
∑ (x − x)
n
i =1 i
n
19
Voltando ao coeficiente de correlação
} Da fórmula do coeficiente de correlação pode-se obter também a
covariância das mesmas variáveis quando conhecidos os desvios
padrões correspondentes:
σ XY = rXY × σ X × σY
20
Características de r
σ XX σ2X
rXX = = 2 =1
σX × σX σX
rXY = rYX
21
r = +1
22
r = -1
23
r=0
24
25
26
Os resultados são significantes?
Ø H0: r =0
H1: r ≠ 0
Ø A estatística do teste é:
r n−2
t=
2
1− r
Ø A qual tem distribuição t com n-2 graus de liberdade
27
Teste de Hipótese
29
de 7.16
The regression
Regressão Linear Simples line
60
Birth rate
50
ˆ = a + bX
Y
40
32.6
30
20
10
0
-1.0 0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0 8.0
Growth rate
30
btain the regression line
Regressão Linear Simples
um of squared errors, e 2
40
e
ce 35
Birth rate
error, e
nd 30
line
25
3 3.5 4
Growth rate
31
Regressão Linear Simples
ˆ
Y =Y+e
Y = a + bX + e
32
Slide 7.18
Regressão
Slide 7.18 Linear Simples
Regression formulae
Regression formulae
Ø Os •valores
Slope de a e b são dados pela minimização
da soma do quadrado dos erros. Tem-se:
• Slope n XY X Y
nbXY 2X Y
n X ( X ) 2
b
n X ( X )
2 2
• Intercept
• eIntercept
a Y bX
a Y bX
33
Slide 7.21
35 TSS component
Yi
Yˆi
RSS component
Y
30
2 X 2.8 3
Growth rate
34
Barrow, Statistics for Economics, Accounting and Business Studies, 5th edition © Pearson Education Limited 2009
Slide 7.20