Sei sulla pagina 1di 43

PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.

Estatstica Aplicada s Cincias Sociais


Estatstica Aplicada s Cincias Sociais
Sexta Edio Sexta Edio
Pedro Alberto Barbetta
Florianpolis: Editora da UFSC, 2006
Cap. 13
Cap. 13

Correlao e
Correlao e
Regresso
Regresso
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Correlao
Correlao
X e Y variveis quantitativas
X Y
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Correlao
Correlao
X e Y esto positivamente correlacionadas
quando elas caminham num mesmo
sentido;
Esto negativamente correlacionadas
quando elas caminham em sentidos
opostos.
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Correlao
Correlao
Correlao no implica relao de causa-e-
efeito
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplo
Exemplo
Amostra de municpios. Variveis:
DistCap: distncia capital da respectiva Unidade da
Federao.
EspVida: esperana de vida ao nascer
MortInf: mortalidade (nmero mdio de mortes em
1.000) at um ano de idade.
Alfab: taxa de alfabetizao (percentagem da
populao adulta alfabetizada).
Renda: renda per capita do municpio (R$).
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1
Tabela 13.1
125,75 81,82 37,04 67,42 167 Ipaba (MG)
196,51 90,43 32,81 68,68 14 Vespasiano (MG)
58,68 59,72 51,57 62,45 175 J andara (BA)
80,69 69,95 44,18 64,46 65 Malhada dos Bois (SE)
264,55 89,28 15,69 71,36 83 Paraba do Sul (RJ )
150,67 77,54 16,62 71,01 486 So J os das Palmeiras (PR)
60,00 65,81 47,08 63,65 40 Lagoa do Piau (PI)
173,38 83,38 31,71 68,10 468 Campo Er (SC)
65,34 79,33 66,05 58,96 78 Porto Rico do Maranho (MA)
66,96 63,64 63,32 59,58 150 Mono (MA)
74,79 63,00 56,56 61,19 278 Nova Redeno (BA)
188,29 86,23 23,19 67,99 365 Araruna (PR)
Renda Alfab MortInf EspVida DistCap Municpio
Fonte: Atlas de Desenvolvimento Humano (www.pnud.org.br/atlas)
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Diagrama de disperso:
Diagrama de disperso:
y
x
59
61
63
65
67
69
100 150 200 250 300 350 400
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1
Tabela 13.1

Diagramas de disperso:
Diagramas de disperso:
Interpretar a correlao entre as duas variveis.
50 150 250
60
70
80
90
Renda per capita (R$)
T
a
x
a

d
e

a
l
f
a
b
e
t
i
z
a

o

(
%
)
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1
Tabela 13.1

Diagramas de disperso:
Diagramas de disperso:
Interpretar a correlao entre as duas variveis.
60 65 70
15
25
35
45
55
65
Esperana de vida ao nascer
T
a
x
a

d
e

m
o
r
t
a
l
i
d
a
d
e

i
n
f
a
n
t
i
l
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1
Tabela 13.1

Diagramas de disperso:
Diagramas de disperso:
Interpretar a correlao entre as duas variveis.
15 25 35 45 55 65
60
70
80
90
Taxa de mortalidade infantil
T
a
x
a

d
e

a
l
f
a
b
e
t
i
z
a

o

(
%
)
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Tabela 13.1
Tabela 13.1

Diagramas de disperso:
Diagramas de disperso:
Interpretar a correlao entre as duas variveis.
500 400 300 200 100 0
90
80
70
60
Distncia capital (km)
T
a
x
a

d
e

a
l
f
a
b
e
t
i
z
a

o

(
%
)
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Correlao no linear
Correlao no linear
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Coeficiente de Correlao
Coeficiente de Correlao
No deve depender da unidade de medida das variveis
Padronizao (x, y) (x, y) para cada par de valores:
S
X x
= x
x

S
Y y
= y
y

Mdia dos valores de X


Desvio padro dos valores de X
Mdia dos valores de X Mdia dos valores de Y
Desvio padro dos valores de Y
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Efeito da padronizao
Efeito da padronizao
0
2
4
6
8
10
12
14
0 2 4 6 8
y
x
( ) y x,
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Padronizao
Padronizao
-2
-1
0
1
2
-2 -1 0 1 2
y'
x'
(0, 0)
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Padronizao
Padronizao
-
-
Exemplo 13.1
Exemplo 13.1
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Idia de construo do
Idia de construo do
Coef
Coef
. de Correlao de
. de Correlao de
Pearson
Pearson
Considere os produtos dos valores padronizados:
xy
S
X x
= x
x

S
Y y
= y
y

PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
Sinais dos produtos dos valores padronizados:
Quadrante com
xy negativos
Quadrante com
xy positivos
Quadrante com
xy negativos
Quadrante com
xy positivos
x
y
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
Sinais dos produtos dos valores padronizados:
x
y
Quadrante com
xy positivos
Quadrante com
xy positivos
0 ' ' >

y x
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
Sinais dos produtos dos valores padronizados:
x
y
0 ' ' <

y x
Quadrante com
xy negativos
Quadrante com
xy negativos
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Sinais dos produtos dos valores padronizados:
Sinais dos produtos dos valores padronizados:
x
y
Quadrante com
xy negativos
Quadrante com
xy negativos
Quadrante com
xy positivos
Quadrante com
xy positivos
0 ' '

y x
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Idia de construo do Idia de construo do Coef Coef. de Correlao de . de Correlao de Pearson Pearson
Padronizao (x, y) (x, y) :
( )
1
' '

n
y x
r =
Coef. de Correlao de Pearson: :
S
X x
= x
x

S
Y y
= y
y

Mede a correlao linear entre X e Y.


PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplo 13.1
Exemplo 13.1
( )
981 , 0
7
87 , 6
= =

1 n
y x
= r
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Valores possveis de
Valores possveis de
r
r
e interpretao da correlao
e interpretao da correlao
+1
0
-1
Sentido
Fora
Negativa
Ausncia
Forte
Moderada
Fraca
Positiva
Fraca
Moderada Moderada
Forte
Valor
de r
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Matriz de correlaes. Dados da
Matriz de correlaes. Dados da
Tab
Tab
. 13.1
. 13.1
Interpretar.
1 0,863 -0,860 0,865 0,205
RENDA
0,863 1 -0,684 0,718 0,087
ALF
-0,860 -0,684 1 -0,983 -0,400
MORTINF
0,865 0,718 -0,983 1 0,337
ESPVIDA
0,205 0,087 -0,400 0,337 1
DISTCAP
RENDA ALF MORTINF ESPVIDA DISTCAP
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Frmula direta de calcular
Frmula direta de calcular
r
r
( ) ( ) ( )
( ) ( )
2
2
2
2
Y
Y
n X
X
n
Y X Y X n
r =


Ver exemplo desses clculos no livro (Tabela 13.3)
Ver, tambm, no livro:
- Teste de hipteses sobre a correlao
- Correlao com variveis indicadoras
- Correlao por postos
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Regresso linear simples
Regresso linear simples
A anlise de regresso geralmente feita sob um
referencial terico que justifique a adoo de alguma
relao matemtica de causalidade.
X Y
Varivel independente ou
Varivel explicativa
Varivel dependente ou
Varivel resposta
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Predizer valores de uma varivel dependente (Y) em
funo de uma varivel independente (X).
Conhecer o quanto variaes de X podem afetar Y.
Regresso linear simples
Regresso linear simples
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Exemplos de regresso:
Exemplos de regresso:
Preo do imvel (R$)
rea construda do imvel (m
2
)
Tempo de resposta do sistema
(segundos)
Memria RAM do computador
(Gb)
Nmero de defeitos nos produtos Gasto com o controle da
qualidade (R$)
Consumo (R$) Renda
Varivel dependente
(Y)
Varivel
independente (X)
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Regresso
Regresso
Amostra de observaes
de (X, Y)
Conhecer o relacionamento
entre X e Y
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Regresso
Regresso
-
-
Modelo
Modelo
Y =
Predito por X, se-
gundo uma funo
Efeito aleatrio +
Parmetros
Regresso
Linear
Simples
e .x y + + =
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Pressupostos do modelo de regresso
Pressupostos do modelo de regresso
Os erros (es) so independentes e variam
aleatoriamente segundo uma distribuio (normal) com
mdia zero e varincia constante.
e .x y + + =
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parmetros
Estimativas dos parmetros

e
e

Construo da equao de regresso com base nos dados:


160
164
168
172
176
180
160 164 168 172 176 180
Altura mdia dos pais ( X )
A
l
t
u
r
a

d
o

f
i
l
h
o

(

Y

)

bx a y + =
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parmetros
Estimativas dos parmetros

e
e

Construo da equao de regresso com base nos dados:


bx a y + =
( ) ( ) ( )
( )
2
2
X
X
n
Y X Y X n
b =


n
X b Y
a =

(estimativa do beta)
(estimativa do alfa)
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parmetros
Estimativas dos parmetros

e
e

Construo da equao de
regresso com base nos dados.
Exemplo 13.5:
X Y
X
2
X

Y
164 166 26.896 27.224
166 166 27.556 27.556
169 171 28.561 28.899
169 166 28.561 28.054
171 171 29.241 29.241
173 171 29.929 29.583
173 178 29.929 30.794
176 173 30.976 30.448
178 178 31.684 31.684
1.539 1.540 263.333 263.483
Dados Clculos
( ) ( ) ( )
( )
2
2
X
X
n
Y X Y X n
b =


n
X b Y
a =

0,872 =
1.476
1.287
=
) (1.539 (263.333) 9
(1.540) (1.539) (263.483) 9
=
2


b
22,00 =
9
.539) (0,872).(1 1.540
=

a
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Estimativas dos parmetros
Estimativas dos parmetros

e
e

Construo da equao de regresso com base nos dados.


Exemplo:
164
166
168
170
172
174
176
178
180
160 165 170 175 180
Altura mdia dos pais (X)
A
l
t
u
r
a

d
o

f
i
l
h
o

(
Y
)
x y 872 , 0 22

+ =
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Valores preditos e resduos
Valores preditos e resduos
x y Predito Resduo
164 166 165,01 0,992
166 166 166,75 -0,752
169 171 169,37 1,632
169 166 169,37 -3,368
171 171 171,11 -0,112
173 171 172,86 -1,856
173 178 172,86 5,144
176 173 175,47 -2,472
178 178 177,22 0,784
x y 872 , 0 22

+ =
y y e

=
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Valores preditos e resduos
Valores preditos e resduos
164 168 172 176
164
168
172
176
y
x
Resduo associado ao oitavo
elemento da amostra.
47 , 175

8
= y
173
8
= y
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Variao explicada e no
Variao explicada e no
-
-
explicada
explicada
164 168 172 176
164
168
172
176
y
x
x y ) 872 , 0 ( 22 + =
164 168 172 176
164
168
172
176
y
x
11 , 171 = y
Variao explicada
pelo modelo de regresso
Variao em relao mdia
aritmtica (variao total)
Soma de quadrados devida ao
erro aleatrio:
Soma de quadrado total:
( )
2

= y y SQT
( )
2

= y y SQE
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Variao explicada e no
Variao explicada e no
-
-
explicada
explicada
Soma de quadrado total:
( )
2

= y y SQT
Soma de quadrados do erro:
( )
2

= y y SQE
Soma de quadrados da regresso: SQE SQT SQR =
Coeficiente de determinao:
total variao
explicada variao
SQT
SQR
R = =
2
1 0
2
R
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Variao explicada e no
Variao explicada e no
-
-
explicada.
explicada.
Exemplo 13.5
Exemplo 13.5
x y
164 166 -5,11 26,11
166 166 -5,11 26,11
169 171 -0,11 0,01
169 166 -5,11 26,11
171 171 -0,11 0,01
173 171 -0,11 0,01
173 178 6,89 47,47
176 173 1,89 3,57
178 178 6,89 47,47
0 177
171,11
Mdia
y
y y ( )
2
y y
( )
2

= y y SQT
X = altura mdia dos pais
Y = altura do filho
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Variao explicada e no
Variao explicada e no
-
-
explicada.
explicada.
Exemplo 13.5
Exemplo 13.5
x y
164 166 165,01 0,992 0,98
166 166 166,75 -0,752 0,56
169 171 169,37 1,632 2,66
169 166 169,37 -3,368 11,36
171 171 171,11 -0,112 0,01
173 171 172,86 -1,856 3,46
173 178 172,86 5,144 26,42
176 173 175,47 -2,472 6,1
178 178 177,22 0,784 0,61
0 52
Preditos
y
y y
( )
2
y y
( )
2

= y y SQE
PEDRO A. BARBETTA Estatstica Aplicada s Cincias Sociais 6ed. Editora da UFSC, 2006.
Variao explicada e no Variao explicada e no- -explicada. explicada. Exemplo 13.5 Exemplo 13.5
Fonte de variao Somas de quadrados
SQR =125
SQE = 52
Variao total SQT = 177
Explicada por X pelo modelo de regresso
(variao explicada )
Devida ao erro aleatrio (variao no-
explicada)
70,6% ou 706 , 0
177
125
2
= = =
SQT
SQR
R
Interpretar.

Potrebbero piacerti anche