Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Anlise de Regresso
Correlao
Procedimentos Gerais Y=f(X)
Regresso linear
Ajuste da Regresso
Regresso linear Mltipla
Best Subsets
nA
6- Regresso
Coeficiente de
Correlao
Agente
48
Diagrama de
Disperso
70
Clientes
60
50
56
64
60
72
Anos de
Experincia
6- Regresso
r=Correlao de Pearson
y y
= zy
sy
yy
y
x
Srie de dados
originais (x e y)
so valores
quantitativos.
xx
O conjunto de pontos
deslocado, tendo
agora como centro, os
valores mdios.
1 n
r = Corr ( X , Y ) = z xi z yi
n i =1
xx
= zx
sx
A escala de x e y
agora padronizada.
Isso torna os valores
independente da sua
unidade.
6- Regresso
Coeficiente de Correlao
xx yy
Agente
zx
zy
zx . zy
A
B
2
4
48
56
-3
-1
-12
-4
-1.5
-0.5
-1.5
-0.5
2,25
0,25
64
0.5
60
0.5
72
12
1.5
1.5
2,25
Total
25
300
4,75
x = 5 y = 60
4,75
S x = 2 S y = 8 r = Correlao ( X , Y ) = 5 = 0,95 = 95%
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
6- Regresso
P_value p/ Correlao
1 n
1 n xi x yi
r = Corr ( X , Y ) = z xi z yi =
n i =1
n i =1 s x s y
1 ( xi x )( y i y) Covarincia ( X , Y )
r=
=
n
sx s y
sx s y
1 r 1
48
56
64
60
72
6- Regresso
Correlao no Minitab
6- Regresso
Recursos Adicionais:
<Estatis> <Correlat>
Desenvolvido por John Hattie
(Alguns recursos grficos mas roda
no modo DOS)
<Statgame>
<Statistical Inference>
<Correlation>
(Interessante para verificar o
conhecimento bsico)
6- Regresso
A)
B)
b ) 0 . 0 3 c)-0 . 7 7 d ) 0 . 1 0
C)
D)
-1.0
b)
0.0
c)
0.5
d)
E) Qual a correlao do
grfico abaixo?
1.0
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
6- Regresso
F)
b)
O Relacionamento positivo
c)
d)
Um erro
6- Regresso
Dia
1
2
3
4
Varivel Comum
Fator 1
gua
gua
gua
gua
Fator 2
Whisky
Vodka
Rum
Bourbon
Resultado
Ficou Bbado
Ficou Bbado
Ficou Bbado
Ficou Bbado
10
6- Regresso
Yankees
Republicanos
GANHARAM PERDERAM
GANHARAM PERDERAM
1976
1964
1960
1956
1952
11
6- Regresso
Um fator X tem influncia sobre um Y quando, na verdade, o que ele est vendo
a conseqncia do Y .
Um exemplo deste caso o do Departamento de Vendas que insatisfeito com as
Vendas resolve dar uma srie de descontos e faz promoes para atrair os clientes .
S que a verdadeira causa do problema o Servio de Atendimento ao Cliente .
Com os novos descontos e a nova promoo fica mais difcil
ainda administrar o Servio de Atendimento ao Cliente,
ocasionando num aumento da insatisfao do cliente e
diminuindo mais ainda as vendas (o tiro saiu pela culatra) .
12
6- Regresso
13
6- Regresso
O Fazendeiro Radiofbico
Em
Em1950,
1950,um
umfazendeiro
fazendeiroafirmou
afirmouque
quesuas
suasrvores
rvoresfrutferas
frutferasestavam
estavamsendo
sendoprejudicadas
prejudicadas
pelas
ondas
de
rdio
de
uma
estao
local
prxima.
Ele
colocou
uma
tela
de
pelas ondas de rdio de uma estao local prxima. Ele colocou uma tela dearame
arameao
ao
redor
redorde
dealgumas
algumasdas
dasrvores
rvorespara
paraproteg-las
proteg-lasdestas
destasondas
ondasde
derdio
rdioe,e,realmente,
realmente,as
as
rvores
rvoresprotegidas
protegidasse
serecuperaram
recuperaramrapidamente,
rapidamente,enquanto
enquantoque
queas
asdesprotegidas
desprotegidasainda
ainda
sofriam.
sofriam.
Na
Namesma
mesmapoca,
poca,muitas
muitasrvores
rvoresctricas
ctricasem
emtodo
todopas
pasforam
foramameaadas
ameaadaspor
poruma
umadoena
doena
chamada
de
folha
pequena.
Alguns
fazendeiros
Texanos
descobriram
que
uma
soluo
chamada de folha pequena. Alguns fazendeiros Texanos descobriram que uma soluo
de
desulfato
sulfatode
deferro
ferrocurava
curavaaadoena.
doena.No
Noentanto,
entanto,nem
nemsempre
semprefuncionava
funcionavano
noTexas,
Texas,ee
praticamente
praticamentenunca
nuncafuncionava
funcionavana
naFlrida
Flridaou
ouna
naCalifrnia.
Califrnia.
OOmistrio
mistriofoi
foidesvendado
desvendadoquando
quandoooproblema
problemaverdadeiro
verdadeirofoi
foirevelado
revelado----deficincia
deficinciade
dezinco
zinco
no
solo.
A
cerca
do
fazendeiro
Radiofbico
era
de
tela
galvanizada,
sendo
que
traos
do
no solo. A cerca do fazendeiro Radiofbico era de tela galvanizada, sendo que traos do
zinco
zincoda
dagalvanizao
galvanizaoeram
eramlevados
levadosda
datela
telapara
paraoosolo.
solo.
OOsulfato
sulfatode
deferro
ferronada
nadatinham
tinhamaaver
vercom
comaacura,
cura,mas
massim
simos
osbaldes
baldesde
deferro
ferrogalvanizados
galvanizados
usados
para
espalhar
a
substncia!
Em
outras
regies,
onde
outros
tipos
de
baldes
usados para espalhar a substncia! Em outras regies, onde outros tipos de baldeseram
eram
usados,
as
rvores
continuaram
doentes.
usados, as rvores continuaram doentes.
14
6- Regresso
As armadilhas: multicolinearidade
15
6- Regresso
Y=f(x)
y
Linha de Regresso
Y=f(x) Simples
Y=f(x,y,z...) Mltipla
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
16
6- Regresso
Regresso
Linear Simples (Um X)
Curvilnea (Um X)
Y
Y
X
X
Variveis I n d i c a t i v a s
(para Xs Discretos)
Y
x
x
x
x
x
x x
x
x
Xb
x
x
Xc
% yes
Xa
2
0
Xi
17
6- Regresso
Resduos
y = + x
y = a + bx,
Curva de
Resduos (e)
x1
x2
x3
Uma
importante
condio para
o uso de
regresso
simples que
os resduos (e)
sejam
independentes
de x. Porque?
18
6- Regresso
Regresso Linear
Simples
2
n
i=1 i
yi
y = a + bx
y$i
min d = min
n
i=1
2
i
n
i=1
( yi y i )2 = minin=1( yi a bxi )2
xi
19
6- Regresso
d
n
i=1
2
i
y = a + bx
2
2
n
n
i =1
n
2
2
d = 0 e i =1 d i = 0.
i =1 i
a
b
2i =1 ( yi a bxi ) = 0,
n
2i =1 xi ( yi a bxi ) = 0,
n
20
6- Regresso
Ufa!
n yi = na + bn xi ,
i =1
i =1
n
n
n
2
i =1 xi yi = a i =1 xi + bi =1 x i
n
(
x
x
)
y
S xy
i
i
i =1
b =
=
,
n
2
S
(
x
x
)
xx
i
i =1
a = y bx ,
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
21
6- Regresso
Exemplo
1
0,5
2
0,6
3
0,9
4
0,8
5
1,2
6
1,5
7
1,7
8
2,0
22
6- Regresso
Regresso: By Hand
36 9, 2
S xy = 50,5
= 50,5 41,4 = 9,1,
8
(36) 2
S xx = 204
= 204 162 = 42.
8
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
23
6- Regresso
Regresso: Clculos
36 9, 2
S xy = 50,5
= 50,5 41,4 = 9,1,
8
(36) 2
S xx = 204
= 204 162 = 42.
8
S xy
9,1
b=
=
0,217,
S xx 42
9,2
36
a = y bx
0,217
= 1,150 0,976 = 0,174.
8
8
y = 0,174 + 0,217 x
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
24
6- Regresso
y
2
Regresso: Grfico
y = 0,174 + 0,217 x
x
25
6- Regresso
Regresso: Correlao
(9,2) 2
S yy = 12,64
= 12,64 10,58 = 2,06,
8
S xy
9,1
r=
=
0,98
S xx S yy
42 2,06
Relembre Correlao!
26
6- Regresso
Regresso. MTW
Portanto rejeita-se Ho
Previso
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
27
6- Regresso
Linear
Ajuste da Regress o
n R-quadrado
a
porcentagem da variao
explicada pelo seu modelo.
n R-quadrado
(ajustado) a
porcentagem da variao
explicada pelo seu modelo,
ajustada para o nmero de
termos em seu modelo e o
nmero de pontos de dados.
nO
valor-p para a
regresso para ver se o
modelo de regresso inteiro
significativo.
Ha: O modelo permite
significativamente
prever a resposta.
28
6- Regresso
Ajuste Quadrtico
Quadrtico
29
6- Regresso
Ajuste Cbico
Cbico
30
6- Regresso
Ajuste da Regress o
n Uma
31
6- Regresso
CTQ
32
6- Regresso
CTQ
33
6- Regresso
34
6- Regresso
Regresso
Mltipla
Regresso.mtw
35
6- Regresso
Menores
que 0,05
Maior melhor
36
6- Regresso
92 estudantes americanos
participam de um simples
experimento. Cada estudante
registra o seu peso, altura,
gnero, pulso e se fumante
ou no. Todos eles jogam uma
moeda e sorteiam se vo dar
uma corrida (cara) ou no por
um minuto. Aps a corrida,
todos os alunos registram o
seu pulso novamente. Um
aluno sugere que seja inserida
a seguinte importante
considerao: Se a pessoa
pinta o cabelo ou no.
Best Subsets
Regresso.mtw
37
6- Regresso
38
6- Regresso
Melhor
ajuste
39
6- Regresso
Anlise de Resduos
Ruim
Bom
Residuals vs
Each X
Residual
3
Residual
3
-1
-1
-2
-2
-3
-3
3
9 10
11
12
10
20
Time Plot of
Residuals
Residual
3
Residual
3
-1
-1
-2
-2
-3
-3
0
50
100
Time Order
Residuals vs
Predicted Y
(Fits)
50
100
Time Order
Residual
3
Residual
3
-1
-1
-2
-2
-3
-3
30
40
50
50
Pred. Y
Normal
Probability Plot
of Residuals
30
100
Pred. Y
Nscore
3
Nscore
3
-1
-1
-2
-2
-3
-3
-3
-2
-1
Pedro Paulo
Balestrassi
Residual
Considere a
possibilidade da
existncia de
variveis ocultas que
no foram
consideradas no
modelo (Lurking)
Entenda que X e Y no
precisam ser normalmente
distribudos. Os resduos,
www.iem.efei.br/pedro
Residual35-3629-1161 contudo, deveriam ser.
40
2
-1
6- Regresso
Regresso Curvilnea
Um laboratrio est fazendo testesSeal Strength
(g/cm2)
em adesivos em funo da
2100
temperatura. Quando a
2050
temperatura aumenta a fora do
2000
contato entre duas superfcies
aumenta Em um determinado
1950
ponto, contudo a fora desse
1900
contato comea a diminuir em
funo de propriedades trmicas
200
250
300
do adesivo. Qual o modelo
Temperature
emprico da fora (Seal Strength)
em funo da temperatura?
Curve.mtw
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
350
400
41
6- Regresso
Termo quadrtico
Funo
quadrtica
Observe resduos
VIF
Armazena
resduos
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
42
6- Regresso
Regresso Curvilnea
X
X2
Predictor
Constant
Temperat
TempSqrd
Coef
922.98
7.4469
-0.0124596
S = 25.18
StDev
72.33
0.5033
0.0008499
R-Sq = 69.4%
T
12.76
14.80
-14.66
P
0.000
0.000
0.000
X e X 2 so
fortemente
correlacionados.
Nenhuma
surpresa
VIF
132.9
132.9
R-Sq(adj) = 68.7%
Analysis of Variance
Source
Regression
Residual Error
Total
Source
Temperat
TempSqrd
DF
1
1
DF
2
97
99
SS
139321
61498
200819
MS
69661
634
F
109.87
P
0.000
Seq SS
3051
136270
Unusual Observations
Obs
Temperat
SealStre
Fit
StDev Fit
32
250
2060.00
2005.99
3.38
42
260
2070.00
2016.91
3.44
78
210
1880.00
1937.37
5.58
89
260
1960.00
2016.91
3.44
Pedro Paulo
Balestrassi www.iem.efei.br/pedro
35-3629-1161
Residual
54.01
53.09
-57.37
-56.91
St Resid
2.16R
2.13R
-2.34R
-2.28R
43
6- Regresso
Captulo 11:
Exemplo 11.1 (obter tabela 11.4)
11.5, 11.7, 11.9, 11.11, 11.17, 11.41, 11.47,
11.55
Pedro Paulo Balestrassi www.iem.efei.br/pedro 35-3629-1161
44