Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Júlio Osório
1
Regressão: Generalidades
1 Variá
Variável Modelos de 2 ou Mais Variá
Variáveis
Preditora Regressão Preditoras
Simples Múltipla
Não- Não-
Linear Linear
Linear Linear
2
Regressão Linear Simples: Qual é o desafio?
Como é que se pode traçar uma linha através desta “nuvem”
de pontos?
Como é que se pode achar a linha que melhor se “ajusta aos
dados?
3
Regressão Linear Simples: Equações Lineares
Y
Y
Y == amX
+ b+ X
b
Variação
Change
m
b ==Declive
Slope em
in YY
Change in
Variação emXX
b
a ==Intersecção
Y-interceptno eixo Y’s
X
Linha de Regressão
Intersecção
a O declive b é positivo
4
Regressão Linear Simples: Equações Lineares
O declive b é negativo
Linha de Regressão
Intersecção
a
O declive é igual a 0
5
Regressão Linear Simples: O Modelo
Variável Erro
Dependente Aleatório
(resposta)
Equação de Regressão
a and b Estimada
^
são estimativas de y i = a + b. x
i
6
Regressão Linear Simples: Critério dos Mínimos Quadrados
n
CMQ minimiza ∑ e = e + e + e + ... + e i
2
1
2
2
2
3
2
n
2
Y y = a + b. x + e
2 2 2
e 4
e 2
e1 e 3 ^
yi = a + b x i
7
Regressão Linear Simples: Cálculo dos Coeficientes
Equação de Predição
^^
yi = a + b x nn
y −
(∑ x )(∑ y )
nn
ii
nn
ii
ii
∑x ii ii
ii==11 ii==11
b=
ii==11
n
22
∑n x
i
nn
∑x − i=1 22
__ ii
n
a = y − bx
__ ii==11
n Declive (b)
Valor médio da variação ocorrente
na variável de resposta (Y) por cada
variação unitária (=1) em X.
n Intercepção em Y (a)
Valor médio de Y quando X = 0.
8
Regressão Linear Simples: Premissas do Modelo
f(e)
Y
X1
X2
X
9
Regressão Linear Simples: Teste da Significância
n A significância de uma regressão (adequação do
modelo de predição) é estabelecida mediante a
realização de um teste de hipóteses para determinar
se o valor de β é zero:
H :β =0
0
H :β ≠0
1
Variação Explicada
pela Regressão de Y
SQDRegressão
sobre X
Variação Residual,
devida a outros
factores, não explicada SQDErro
pela Regressão
10
Regressão Linear Simples: Decomposição da Variação Total
^
Y Yi SQDErro= Σ (Yi - Yi)2
^
^
y = a + bx i
SQDTotal= Σ (Yi - Y)2 Yi
^
SQDRegressão= Σ (Yi -
Y)2
Y Y
(Xi – X)
X
X Xi
SQDTotal
n
( )
∑ y −y i
_ 2
SQD = ∑ y −
n(∑ y )
2
n
i=1
i
2
i=1 y
i=1 n
∑ (y − y )
n ^ _ 2
(SPD )2
SQDRegressão i=1
i
XY
SQD X
SQDErro
n
(
∑ yi − y
i=1
^
i
)
2
SQD Total
− SQD Re gressão
11
Regressão Linear Simples: Teste F (ANOVA)
s
b SQD X
12
Regressão Linear Simples: Coeficiente de Determinação
SQD Y
SQD SQD SQD
Y X Y
n Notar que 0 ≤ r2 ≤ 1.
Pretende-se:
estabelecer a equação de predição do Ca absorvido
(Y) a partir do tempo de permanência na solução (X);
testar a significância do modelo (α = 0,05);
averiguar a fracção de variação em Y que é
explicada por X.
13
Regressão Linear Simples: Exemplo Ilustrativo
tempo de suspensão Cálcio
da célula na solução absorvido
(min.) (nmoles/mg).
1 .45 .34170
2 .45 .00438
3 .45 .82531
4 1.30 1.77967
5 1.30 .95384
6 1.30 .64080
7 2.40 1.75136
8 2.40 1.27497
9 2.40 1.17332
10 4.00 3.12273
11 4.00 2.60958
12 4.00 2.57429
13 6.10 3.17881
14 6.10 3.00782
15 6.10 2.67061
16 8.05 3.05959
17 8.05 3.94321
18 8.05 3.43726
19 11.15 4.80735
20 11.15 3.35583
21 11.15 2.78309
22 13.15 5.13825
23 13.15 4.70274
24 13.15 4.25702
25 15.00 3.60407
26 15.00 4.15029
27 15.00 3.42484
n n
Coeficientes:
∑ x . ∑ y
1 1 = 661,41868 − (184 ,80 ).(72 ,57273 ) = 164 ,69866
n
SPD XY
= ∑
1
x .y −
n 27
b = SPD XY =
164 ,69866
= 0 ,243
2
SQD X
678 ,87667
n
∑ x
n
(184 ,80 )2
SQD = ∑ x − 1 = 1943,73000 − = 678 ,87667
2
X
1 n 27 − −
a = y − b x = 2 ,688 − (0 ,243 ).(6 ,844 ) = 1,027
n n
− ∑x i
184 ,80
− ∑y i 72 , 57273
x= i =1
n
=
27
= 6 ,844 y= i =1
n
=
27
= 2 ,688
Equação de predição:
^
yi = 1,027 + 0 ,243. x i
14
Regressão Linear Simples: Exemplo Ilustrativo
n n
SQD’s:
∑ x . ∑ y
n
(184 ,80).(72 ,57273)
SPD XY = ∑1 x.y − 1 n 1 = 661,41868 − 27
= 164 ,69866 (SPD ) 2
(164 ,69866 )2
SQD = XY
= = 39 ,95667
Re gressão
SQD X
678 ,87667
2
n
∑ x
n
(184 ,80 )2
SQD = ∑ x − 1 = 1943,73000 − = 678 ,87667
2
X
1 n 27
SQD Erro
= SQDY − SQDRe gressão = 53 ,18655 − 39 ,95667 = 13 ,22988
2
n
∑ y
n
(72 ,57273)2
SQDY = ∑ y − 1 n = 248,25326 − 27 = 53,18655
2
Quadro ANOVA:
15
Regressão Linear Simples: Exemplo Ilustrativo
n Coeficiente de Determinação:
SQD 39 ,95667
= = = 0 ,751
2 Re gressão
r SQD 53 ,18655
Y
yi = 1,027 + 0 ,243. x i
⇒ y i = 1,027 + (0 ,243 )(9 ) ≈ 3 ,21 nmoles / mg
16
Regressão Linear Simples: Exemplo Ilustrativo
Correlação: generalidades
Responde à questão “Quão forte é a relação
entre as duas variáveis X e Y?”
Calcula-se o chamado “Coeficiente de
Correlação”, inicialmente proposto por Karl
Pearson:
Anota-se por r a nível da amostra e por ρ a
nível da população.
Toma valores do intervalo entre -1 e +1.
Mede o grau (força) da associação.
17
Correlação: generalidades
Se representarmos as duas
variáveis num referencial
cartesiano, a “nuvem de pontos”
(diagrama de dispersão) reflecte a
maior ou menor tendência para os
pontos se disporem
sistemáticamente ao longo de uma
linha recta (descendente ou
ascendente).
Correlação: generalidades
Correlação Correlação
Negativa Ausência de Positiva
Perfeita Correlação Perfeita
18
Correlação: Cálculo
Para uma amostra de n pares (xi, yi) de observações realizadas
para as variáveis X e Y, o coeficiente de correlação (do momento-
produto, de Pearson) vem dado por:
SPD
Cov ( X , Y ) (n − 1)
XY
r= = = SPD XY
r=
( )( )
i=n
∑ X − X .Y − Y
i
_
i
_
∑ (X − X ) .(Y − Y )
i =1
i=n _ 2 _ 2
i i
i =1
Correlação: Propriedades
19
Correlação: Teste da Significância
n−2
t = r.
1− r
amostra 2
A H0 é rejeitada quando:
t amostra ≥ t α (n − 2)
20
Correlação: Exemplo Ilustrativo
n n
∑ x . ∑ y
n
(46 ,1).(410)
SPD XY
= ∑ x.y − 1 1 = 1684 , 5 − = −205,6
1 n 10
n
2
SPD − 205 ,6
∑ x r= XY
= = −0 ,959
n
(46 ,1)2 SQD . SQD (8,289 ).(5540)
SQD =∑x − 1 = 220 ,81 − = 8,289
2 X Y
X
1 n 10
2
n
∑ y
n
(410 )2
− 1 = 22350 −
2
SQD = ∑ y Y n 10
= 5540
1
t amostra
= r.
n−2
1−r
2 = −0 ,959.
10 − 2
(
1 − − 0 ,959 )
2 = −9 ,626
versus t 0 , 05 (8) = 1,860
21