Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Nas unidades anteriores (1 a 7), estudamos técnicas para a descrição e a análise dos
valores de uma única variável da população, como base para interpretação do
comportamento de um conjunto de indivíduos, expostos a diferentes condições naturais
ou experimentais.
Muitas vezes é necessário determinar relações existentes entre duas ou mais variáveis
através das quais se possa estabelecer um grau de dependência para fazer previsões
sobre seus comportamentos numéricos.
Há casos em que uma variável dependente está relacionada com mais de uma variável
independente. Nesse caso, estamos lidando com regressão múltipla.
Entretanto, as relações existentes entre uma variável dependente e uma variável
independente são descritas como regressões simples.
CORRELAÇÃO
• Determina até que ponto os valores de uma variável estão correlacionados com os
valores de outra variável.
• Coeficiente de correlação de Pearson (r de Pearson) mede o grau de aderência.
• Assume-se que as duas variáveis apresentam distribuição aproximadamente normal.
CARACTERÍSTICAS DE r
• –1,0 ≤ r ≤ +1,0.
• r mede apenas a relação linear entre x e y.
• Quanto mais próximo de –1 ou de +1, mais perfeita é a correlação (r = ± 1 Æ ocorrem
apenas quando todos os pontos plotados caem exatamente sobre a reta).
• r = 0 Æ ausência total de correlação.
• Valores positivos Æ a variável independente (x) apresenta uma relação direta
(positiva) com a variável dependente (y).
• Valores negativos Æ a variável independente (x) apresenta uma relação inversa
(negativa) com a variável dependente (y).
• Valor de r independe das unidades de medida.
Sxy
r=
Sxx ⋅ Syy
(∑ x )⋅ (∑ y ) (∑ x ) 2
(∑ y )2
Sxy = ∑ xy − Sxx = ∑ x 2
− Syy = ∑ y 2
−
n n n
1. Enunciar hipóteses:
H0: r = 0 Æ inexistência de correlação Ha: r ≠ 0 Æ existência de correlação
estatisticamente significativa estatisticamente significativa
3. Calcular r
Sxy
r=
Sxx ⋅ Syy
4
5. Regra de decisão
rcalculado < rcrítico rcalculado > rcrítico
Aceita-se H0 Æ não existe correlação Rejeita-se H0 Æ existe correlação
estatisticamente significativa entre as estatisticamente significativa entre as
variáveis x e y. variáveis x e y.
1. Enunciar hipóteses:
H0: r = 0 Ha: r ≠ 0
3. Calcular t
r ⋅ n−2
t=
1−r2
5. Regra de decisão
-tcrítico< tcalculado < tcrítico tcalculado > tcrítico ou < -tcrítico
Aceita-se H0 Æ não existe correlação entre Rejeita-se H0 Æ existe correlação entre as
as variáveis. variáveis.
Exemplo
400
y = -353,053 + 26,801x
(n = 22 r = 0,9757)
fecundidade média (n ovos x 10 )
3
350
300
250
o
200
150
100
50
0
14 16 18 20 22 24 26
comprimento (cm)
Interpretação
O coeficiente de correlação de Pearson (r) é mais indicado para medir a força da relação
linear entre as variáveis, e o coeficiente de determinação (R2) é mais apropriado para
medir a explicação da reta de regressão. Dessa maneira, para apreciar o ajuste de uma
reta é melhor utilizar o coeficiente de determinação (R2) que mede o sucesso da
regressão em explicar y.
O coeficiente de correlação de Pearson (r) também pode ser calculado a partir do
coeficiente de determinação (R2). Entretanto, como o coeficiente de determinação (R2) é
sempre positivo, o sinal de r será o mesmo que o sinal do coeficiente b da reta de
regressão.
6
REGRESSÃO
MODELO LINEAR
Se todos os pontos no diagrama caíssem sobre uma linha reta, teríamos uma relação
perfeita (r = ±1). Porém, o que ocorre de fato é uma dispersão variável dos pontos em
torno da linha de melhor ajuste, determinada através da técnica dos mínimos quadrados,
quando o somatório dos desvios (Σd2) entre um valor observado da variável dependente
(y) e seu valor calculado (y’), elevado ao quadrado, for mínimo:
∑d 2
(
= ∑ y − y' )
2
⇒ mínimo
ESTIMAÇÃO DE b
n
O valor de b indica a posição da reta e, conseqüentemente, o tipo de relação existente
entre as variáveis x e y de modo que para b > 0 tem-se uma relação direta; para b < 0
tem-se uma relação inversa e para b = 0 tem-se uma reta paralela ao eixo horizontal.
Coeficiente angular indicativo de: (a) correlação direta ou positiva; (b) correlação
inversa ou indireta ou negativa (c) ausência de correlação.
Tendo em vista que um número infinito de retas paralelas pode apresentar o mesmo
coeficiente angular, somente com a determinação de vários pontos com coordenadas
8
(x,y) poder-se-á definir uma única reta com coeficiente angular b que definirá a reta que
melhor representa a regressão.
ESTIMAÇÃO DE a
Deve-se ressaltar que para um determinado valor de a, existe um número infinito de retas
com diferentes valores de b.
Note que b, sendo uma taxa y/x, tem como unidade, por exemplo, número de ovos/cm, e
que a tem a mesma unidade dos demais valores de y, ou seja, números de ovos (gráfico
página 5).
O gráfico representativo de uma regressão entre duas variáveis deve conter os pontos
correspondentes aos valores observados de x e y aos quais se ajusta a reta de regressão
calculada entre dois pares de valores extremos das variáveis: (x1;y1) e (xn;yn).
Além disso, o gráfico permite visualizar o grau de aderência que é definido como a
qualidade do ajuste aos pontos observados.
9
MODELOS CURVILÍNEOS
Solução:
Traçar um diagrama de dispersão.
Verificar o tipo de relação existente entre as variáveis.
Definir, a partir daí, a equação mais adequada para a situação sob análise.
y = A.x b y = A.e bx
x Æ base x Æ expoente
Solução para linearizar uma curva Æ é realizar uma transformação logarítmica, com a
conversão das variáveis para lognormais, que passarão a ter a mesma escala,
permitindo o uso de uma equação linear, premissa básica para o uso da regressão.
Para que a regressão linear simples possa ser ajustada aos dados, muitas vezes basta
transformar uma das variáveis. Outras vezes, é preciso transformar ambas as variáveis.
É preciso lembrar que nem sempre é possível ajustar uma regressão linear simples.
Existem situações que exigem o uso de modelos matemáticos mais complexos, como é o
caso dos dados de crescimento, que apresentados em gráfico, dão origem às curvas de
crescimento.
11
sendo Æ ln y = y’ ln A = a’ ln x = x’.
ln y = ln A + bx y' = a ' + bx
ln y = ln A − bx y' = a' − bx
sendo Æ ln y = y’ ln A = a’.
12
Conjunto 1 Conjunto 2
Macho Fêmea
Área 1 Área 2
Verão Inverno
y = a1 + b1.x y = a2 + b2.x
1. Enunciar as hipóteses
H0: b1 = b2 Ha: b1 ≠ b2
3. Calcular a variável
b − b2 (s )
2
yx p (s )
2
yx p
t= 1 s (b1−b 2 ) = +
s (b1 − b2 ) (Sxx )1 (Sxx )2
(∑ x )2
(∑ y ) 2
(∑ x )⋅ (∑ y )
Sxx = ∑ x 2
− Syy = ∑ y 2
− Sxy = ∑ xy −
n n n
5. Regra de decisão
Aceita-se H0 ⇒ b1 = b2 Rejeita-se H0 ⇒ b1 ≠ b2
13
1. Enunciar as hipóteses
H0: a1 = a2 Ha: a1 ≠ a2
3. Calcular a variável
t=
(y 1 ) (
− y 2 − bp ⋅ x 1 − x 2 )
(s )2
⎛ 1
⋅ ⎜⎜ +
1
+
x1 − x 2 ( ) ⎞
⎟
⎟
⎝ n1 n2 (Sxx )1 + (Sxx )2
yx c
⎠
(Sxy )1 + (Sxy )2
bp =
(Sxx )1 + (Sxx )2 (s )
2
yx c =
SQc
GLc
(∑ Sxy ) 2
GLc = (n1 + n2 ) − 4
SQc = ∑ Syy −
∑ Sxx
a1 = y1 – bp.x1 a2 = y2 – bp.x2
5. Regra de decisão
Aceita-se H0 ⇒ a1 = a2 Rejeita-se H0 ⇒ a1 ≠ a2
Retas coincidentes Retas paralelas
14
1. Enunciar as hipóteses
H0: b1 = b2 = b3 Ha: pelo menos um dos b difere dos demais
2. Estabelecer α e GL GLentre = k – 1
GLdentro = GLp = ΣGLres = Σ(ni – 2)
3. Calcular a variável
SQc − SQ p
k −1 k = no de equações sob teste
F=
SQ p
GLp
(∑ Sxy ) 2
5. Regra de decisão
Fcal < Ftab ⇒ aceita-se H0 ⇒ b1 = b2 = b3 Fcal ≥ Ftab ⇒ rejeita-se H0 ⇒ pelo menos
um b difere dos demais.
15
Aceitando-se H0 Rejeitando-se H0
b1 = b2 = b3 Pelo menos um b é diferente
H0: b1 = b2 / b1 = b3 / b2 = b3
Teste F
Ha: b1 ≠ b2 / b1 ≠ b3 / b2 ≠ b3
H0: a1 = a2 = a3
• Se aceitar H0
Ha: pelo menos um a difere dos demais
• Se rejeitar H0
Regressões diferentes
1. Enunciar as hipóteses:
H0: a1 = a2 = a3 Ha: pelo menos um dos a difere dos demais.
2. Estabelecer α e GL GLentre = k –1
GLdentro = GLp = ΣGLres = Σ(ni – 2)
16
3. Calcular a variável
SQc − SQ p
k = no de equações sob teste.
F= k −1
SQc
GLc
(∑ Sxy ) 2
SQp = ∑ SQresidual GLc = ∑ ni − k − 1
SQc = ∑ Syy −
∑ Sxx
SQresidual = Syy −
(Sxy )
2
Sxx
5. Regra de decisão
Fcal < Fcrítico ⇒ aceita-se H0 ⇒ a1 = a2 = a3. Fcal ≥ Ftab ⇒ rejeita-se H0 ⇒ pelo menos
um a difere dos demais.
Teste de Newman-Keuls
1. Enunciar as hipóteses
H0: b1 = b2 b1 = b3 b2 = b3
Ha: b1 ≠ b2 b1 ≠ b3 b2 ≠ b3
p=2 p=3 p=2
2. Estabelecer α GL e p
GLp = ΣGLres = Σ(ni – 2)
p = no de médias na amplitude de medidas sob teste
17
3. Calcular a variável
b − b2 (s )
2
⎛ 1 1 ⎞ (s )
2
=
(SQres )1 + (SQres )2
q= 1
yx p
SE = ⋅ ⎜⎜ + ⎟⎟
SE 2 ⎝ (Sxx )1 (Sxx )2 ⎠
yx p
(GLres )1 + (GLres )2
q=
b1 − b3 (s )
2
yx p ⎛ 1 1 ⎞ (s ) = ((SQ
2
yx p
) + (SQ )
res 1
GL ) + (GL )
res 3
SE = ⋅ ⎜⎜ + ⎟⎟
⎝ (Sxx )1 (Sxx )3 ⎠
SE res 1 res 3
2
b − b3 (s )
2 (s ) = ((SQ
2
yx p
) + (SQ )
res 2
GL ) + (GL )
res 3
q= 2 yx p ⎛ 1 1 ⎞
SE = ⋅ ⎜⎜ + ⎟⎟ res 2 res 3
⎝ (Sxx )2 (Sxx )3 ⎠
SE 2
5. Regra de decisão
Rejeita-se H0 ⇒ b ≠ ⇒ regressões ≠ Aceita-se H0 ⇒ b = ⇒ testar os coeficientes
lineares (a), usando o teste t para os a (pág
15).
RR H0 RR H0
RA H0
-q +q