Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Na aula 5 estudamos a correlao linear entre dois conjuntos de dados. Muito bem,
podemos estender este conceito para duas variveis aleatrias.
Para melhor entendimento, vamos lembrar do Exemplo trabalhado naquela aula.
Um grupo de quatro alunos estudou junto para as provas finais. Feitas as provas, eles
obtiveram se seguintes notas:
Aluno Nota de matemtica Nota de fsica
() ()
1 2 6
2 6 7
3 8 7
4 10 8
Mdia 6,5 7
Calcule o coeficiente de correlao linear entre as notas de fsica e matemtica.
[Observao: isto no questo de concurso. Serve s para nos familiarizarmos com a
frmula. Ento, podem usar calculadora]
Resoluo:
As notas em fsica e matemtica guardam certa relao linear. Vamos calcular o coeficiente
de correlao para vermos a intensidade da relao linear existente entre elas.
Aplicando a frmula:
(
) (
)
=
(
)
(
)
8
= 0,956
35 2
Veja que o coeficiente de correlao bem prximo de 1. Ou seja, existe intensa relao
linear entre as notas de fsica e matemtica.
Naquele exerccio tnhamos os valores das notas de cada aluno, em duas provas as notas
de matemtica e de fsica (valores de X e Y). Dava para calcular as mdias em cada prova (
X e Y ). E, a partir destes valores, conseguimos calcular o coeficiente de correlao.
S que s vezes estamos interessados em ver se duas variveis aleatrias esto linearmente
relacionadas. Quando temos variveis aleatrias, que podem assumir diversos valores, onde
h o fator chance (probabilidade), o coeficiente de correlao muda um pouquinho.
Quando trabalhamos com variveis aleatrias falamos em esperanas. E a frmula do
coeficiente de correlao fica:
(, )
=
! "
Relembrando:
(, ) a covarincia entre X e Y.
o desvio padro da varivel aleatria.
Na verdade a frmula acima bem parecida com aquela estudada no incio do tpico de
correlao (aula 5)
A frmula que vimos podia ser escrita da seguinte maneira:
[(X ) ( )]
n
i X Yi Y
1
i =1
(X ) (Y )
n n
2
n
2
i X i Y
i =1
i =1
n n
Na primeira parte da frmula, temos uma mdia. a mdia dos produtos X X Y Y . ( ) ( )
Quando temos variveis aleatrias, esta mdia substituda pela esperana. a esperana
de ( X X ) (Y Y ) . E esta esperana, como vimos na aula 7, justamente a covarincia
entre X e Y.
Na segunda parte da frmula temos a diviso pelos desvios padro de X e Y, o que
mantido na frmula para a correlao entre variveis aleatrias.
Com estas alteraes, a frmula fica:
cov( X , Y )
r=
X Y
Onde:
$: coeficiente de correlao linear entre X e Y:
cov(X,Y) = covarincia entre X e Y.
torna-se no estocstica
Resoluo:
Antes de resolvermos a questo, precisamos estudar uma propriedade da covarincia.
Sejam X e Y duas variveis. Sejam a e b duas constantes.
Quando queremos calcular a covarincia
(', )
temos o seguinte.
Sempre que multiplicamos uma das variveis por uma constante, esta constante pode sair
da covarincia, multiplicando. Logo:
(', ) = ' (, )
Analogamente:
(, () = ( (, )
E, por fim:
(', () = ' (, () = ' ( (, )
1
- , . = (, )
' ( '(
Item I.
Foi dada a seguinte expresso:
1
)*' (' + () ' *' () + ( *' (),
2'(
Aplicando a frmula da varincia da soma:
1
= )*' (') + *' (() + 2(', () ' *' () + ( *' (),
2'(
Quando multiplicamos uma varivel por uma constante, a varincia multiplicada pela
constante ao quadrado.
1
= )' *' () + ( *' () + 2(', () ' *' () + ( *' (),
2'(
Simplificando os termos de sinal contrrio:
1
= )' *' () + ( *' () + 2(', () ' *' () + ( *' (),
2'(
Ficamos com:
1
)2(', (),
2'(
Quando multiplicamos uma varivel por uma constante, a covarincia fica multiplicada por
esta constante:
1
)2 ' (, (),
=
2'(
Quando multiplicamos uma varivel por uma constante, a covarincia fica multiplicada por
esta constante:
1
)2 ' ( (, ),
=
2'(
Simplificando 2ab do numerador e do denominador:
1
= )2 ' ( (, ),
2'(
= (, )
Item correto.
Item II.
Estocstico sinnimo de aleatrio. O item est nos dizendo que a soma
- + .
! "
no aleatria.
Para simplificar os comentrios, seja Z tal que:
/=- + .
! "
Neste caso, tomamos a varivel X e dividimos por uma constante ( ! ). Tomamos a varivel Y
e dividimos por outra constante ( " ).
Desde que temos uma combinao de duas variveis aleatrias, em princpio, o resultado
(=Z) tambm ser aleatrio.
Vamos calcular a varincia de Z
Se a varincia for nula, porque Z no varia. Ou seja, sempre constante. Neste caso, de
fato no ser aleatrio.
Se a varincia for diferente de 0, porque Z varia. E como depende de duas variveis
aleatrias, Z tambm ser uma varivel aleatria.
*(/) = * - + .
! "
Quando dividimos uma varivel por uma constante, a varincia dividida pela constante ao
quadrado:
*() *()
*(/) =
+
+ 2 - , .
! " ! "
Quando dividimos uma varivel por uma constante, a covarincia fica dividida pela mesma
constante.
*() *() 2
*(/) =
+
+ -, .
! " ! "
Quando dividimos uma varivel por uma constante, a covarincia fica dividida pela mesma
constante.
*() *() 2
*(/) = + + (, )
!
! " "
2
*(/) = 1 + 1 + (, ) (equao I)
! "
Substituindo II em I:
2
*(/) = 1 + 1 + ( ! ")
! "
*(/) = 1 + 1 2
*(/) = 0
Ou seja, Z no tem disperso, Z no varia. Logo, Z uma constante. Realmente no algo
aleatrio.
Item correto.
Item III.
O item afirma duas coisas:
- se a covarincia nula, o coeficiente de correlao nulo
- o resultado final que X e Y so independentes.
De fato, sempre que a covarincia for nula, a correlao tambm ser nula.
Basta ver que:
7(, )
$=
! "
Se o numerador for nulo (covarincia nula), o resultado da frao (=$) tambm ser nulo.
A primeira parte da frase est correta.
Quanto segunda parte, ela est errada.
Vimos na aula 7 que o fato de a covarincia ser nula no garante variveis independentes.
Item errado.
Gabarito: C
2. REGRESSO LINEAR
Os valores de Y variam em torno deste valor mdio graas varivel , aleatria. Podemos
pensar que Y e X guardam uma relao quase linear. A relao s no perfeitamente linear
devido presena dessa varivel , que representa todas as demais interferncias no valor
de Y que no so explicadas pela varivel X.
A varivel pode ser vista como o erro que se comete quando se aproxima a relao entre
X e Y por uma reta. Muitas vezes acaba sendo chamada, realmente, de erro.
Assim, se o modelo de regresso Yi = 5 + 2 X i + i representar adequadamente o conjunto
formado por todas as populaes de valores de Y, sabemos que, para cada valor de X, temos
como calcular a mdia da correspondente populao de valores de Y.
Repetindo: a relao entre X e Y praticamente uma reta. Os pares ordenados (X,Y) s no
se comportam exatamente como uma reta por causa da varivel aleatria .
Deste modo, os pares ordenados (X,Y) vo se situar em torno da reta Yi = 5 + 2 X i
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
a = Y bX
Ou seja, a partir dos valores de X e Y pertencentes amostra, obtemos os valores de a e b
descritos acima. A partir deles, construmos a reta Yi = a + bX i .
Executando este procedimento no excel para a amostra do Quadro 3, obtemos:
a = 3,71
b = 2,33
O grfico abaixo representa os resultados obtidos:
Contudo, tendo disponvel apenas uma amostra de 42 pares (X,Y), a reta de regresso que
calculamos, de tal forma que os desvios de estimativa cometidos se comportem segundo a
condio de mnimos quadrados, foi a reta azul.
V ( i ) = 2
cov( i , j ) = 0 , para i j
Na primeira considerao, temos que o erro (varivel aleatria ) tem mdia zero. Esta
condio um pouco mais fcil de entender.
Basta imaginar a situao em que a varivel erro no tem mdia zero. Significa que j se
espera que, em mdia, se cometa um erro diferente de zero. J se sabe que a regresso tem
um vis (que pode ser positivo ou negativo). Ou seja, o modelo no est muito adequado.
melhor reformular o modelo.
A segunda considerao nos diz que a varincia do erro constante. Este fato denominado
homocedasticia. Isto foi utilizado quando dissemos que havia cinco populaes de valores
de Y (com mdias 7, 9, 11, 13 e 15). Em todas elas, o desvio padro era o mesmo (portanto,
a varincia tambm). Isto s possvel se a varivel tiver varincia constante. Ou seja, se
ela tiver sempre a mesma varincia, independente de qual o valor de X.
A terceira condio nos diz que os erros cometidos no so correlacionados.
Suponha que a reta laranja da figura abaixo seja a reta de regresso (ou seja, a reta que
representa a relao linear existente na populao de valores (X,Y)).
Para a nossa amostra (pontos azuis da figura acima), observe que h diversos valores de
peso para a altura igual a 1,86.
Assim, no nosso grupo de pessoas pesquisadas, h cinco com altura de 1,86m. Uma delas
tem peso 70,67 kg. A outra tem 71,01 kg (estes dois primeiros valores esto sobrepostos na
figura acima). Uma terceira tem 79,91 kg. A quarta tem 76,79 kg. E a quinta tem 83,69.
Com nosso modelo de regresso linear, queremos dizer que, para cada valor de X (altura),
os valores de Y correspondentes (peso) giram em torno da reta de regresso. Deste modo,
considerando todas as pessoas com altura 1,86 m, elas tm, em mdia, um peso de 80 kg.
Para uma dada amostra, obteremos pontos que no necessariamente ficam sobre a reta de
regresso. Eles podem perfeitamente cair fora da reta de regresso por causa de um erro
aleatrio ( ). De fato, para o exemplo acima, nenhuma das cinco pessoas com altura de
1,86 tinha peso exatamente igual a 80 kg. A reta de regresso s nos informa valores
mdios, em torno dos quais giram os valores da populao.
Dizendo de outro modo: o que a reta de regresso indica, no caso de X = 1,86 que, se
tivssemos acesso a toda a populao de pessoas com 1,86 m de altura, o peso de tais
pessoas teria mdia 80 kg e varincia igual a 2 .
Assim, quando a altura (= X) vale 1,86, os valores de peso giram em torno de 80. No caso
desta amostra, eles foram iguais a 70,67; 71,01; 79,91 76,79; 83,69. Os valores de peso
esto dispersos em torno de 80 kg.
Quando afirmamos que a varivel tem varincia constante, queremos dizer que, se
pudssemos analisar toda a populao de pessoas com altura de 1,86 m, os pesos destas
pessoas teria mdia 80 kg e varincia 2 .
Mudemos de ponto. A reta de regresso passa pelo ponto (1,90; 84). Ou seja, Y = 84 kg
quando X = 1,90 m.
Assim, quando X = 1,90 m, temos que os valores de Y vo girar em torno de 84 kg. Eles
estaro dispersos em torno de 84 kg, tambm com varincia 2 (pois a varincia
considerada constante). Tendo acesso toda a populao de pessoas com altura 1,90 m,
verificaramos que o peso destas pessoas tem mdia 84 kg e varincia 2 .
E assim por diante. Ou seja, para qualquer valor de X que adotarmos, os valores de Y
correspondentes tero varincia 2 e mdia dada pela reta de regresso.
O problema que, em geral, temos acesso apenas a uma amostra. No conhecemos a real
reta de regresso. No conhecemos a reta laranja da Figura 3. Neste caso, tentaremos
encontrar uma reta que, considerando apenas a amostra que temos disposio, seja a
melhor estimativa para a reta real de regresso. Para tanto, voltemos ao nosso diagrama de
disperso.
Desenhei duas retas (uma verde e uma vermelha) que poderiam representar a relao linear
entre peso e altura. Qual delas escolher? A verde? A vermelha? Nenhuma? Ser que existe
outra reta que representa melhor a relao linear entre peso e altura?
Lembrem-se de que estamos procurando, a partir da amostra conhecida (valores dos pontos
azuis da figura acima), encontrar uma estimativa para a reta de regresso.
O mtodo que estamos estudando para encontrar a melhor reta de regresso chamado de
mtodos de mnimos quadrados. A funo de primeiro grau que pretendemos encontrar
da forma:
Yi = a + bX i
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
a = Y bX
Para a altura 1,98 m (X=1,98), o peso obtido de 97,41 kg. Este o valor de Y.
X = 1,98 Y = 97,41
Para este valor de X (1,98) nossa reta de regresso calculada (reta vermelha) indica que a
estimativa do valor de Y 92,90 kg.
Ou seja, a estimativa de Y :
Y = 92,90
diferena entre Y e sua estimativa, chamamos desvio. O desvio, neste caso, fica:
e = Y Y = 97,41 92,90 = 4,51
Pelo mtodo de mnimos quadrados, tentamos obter uma reta de tal modo que a soma dos
quadrados dos valores dos desvios seja mnima.
Repetindo: possvel demonstrar que os valores de a e b (estimadores de e ), obtidos
a partir da considerao de que a soma dos quadrados dos desvios seja mnima, so:
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
a = Y bX
Ou seja, a partir dos valores de X e Y da amostra, obtemos os valores de a e b descritos
acima. A partir deles, construmos a reta Yi = a + bX i , que a reta vermelha da Figura 6.
Para resolver alguns problemas de regresso linear, pode ser til conhecer algumas
igualdades envolvendo somatrios, resumidas no quadro abaixo:
Transformaes importantes:
[(X ) ( )]
n n
i X Yi Y = ( X i Yi ) n X Y
i =1 i =1
(X ) = (X ) n X
n n
2 2
X
2
i i
i =1 i =1
(Y Y ) = (Y ) nY
n n
2 2 2
i i
i =1 i =1
Alguns livros tentam simplificar um pouco a escrita. Para tanto, eles representam por letra
minscula a diferena entre uma varivel e sua mdia.
Exemplo:
8
=
9
=
: 8
9
= :
;
: 8
= :
;
: 9
= :
;
At aqui dei resultados prontos, s para que pudssemos entrar em contato com os
conceitos envolvidos na regresso. Agora vamos, de fato, fazer contas.
Para praticar, vamos calcular a reta de regresso para o caso dos quatro alunos que fizeram
as provas de fsica e matemtica (exemplo utilizado no tpico de correlao). Vamos
considerar que estes 4 alunos so uma amostra de um conjunto maior de estudantes que se
submeteram tal prova.
As notas desses alunos so:
Aluno Nota de matemtica Nota de fsica
(X ) (Y )
1 2 6
2 6 7
3 8 7
4 10 8
Mdia 6,5 7
Estamos supondo que a populao de notas de fsica da qual foram tiradas as notas acima
pode ser descrita segundo o seguinte modelo:
Yi = + X i + i
Ou seja, estamos supondo que existe uma relao entre as notas de matemtica e fsica. A
parcela um erro aleatrio. Engloba todas outras variveis (distintas da nota em
matemtica) que influenciam na nota de fsica.
A partir destes valores de notas, construmos o quadro abaixo:
Aluno X Y XX Y Y (X X ) (Y Y ) (X X ) (Y Y )
2 2
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
8
b= 0,23
35
a = Y bX
8
a =7 6,5 5,51
35
E a reta de regresso estimada (calculada) fica:
Y = 5,51 + 0,23 X
Repare que no sabemos se esta a real reta de regresso. Mas, a partir dos valores de
nossa amostra, esta a nossa estimativa para a reta de regresso. uma reta tal que a
soma dos quadrados dos desvios mnima. Lembrando que o desvio corresponde
diferena entre valor observado ( Y ) e sua estimativa ( Y ).
A tabela abaixo mostra os valores estimados da nota de fsica, dados os valores da nota de
matemtica.
Aluno Nota de matemtica Nota de fsica Nota de fsica estimada
(X ) observada (Y ) ()
Y
1 2 6 5,97
2 6 7 6,89
3 8 7 7,34
4 10 8 7,80
Plotando estes valores num grfico, ficamos com:
A reta em vermelho tal que a soma dos quadrados dos desvios em relao s notas de
fsica realmente obtidas mnima. a nossa reta estimada (calculada).
O modelo de regresso :
Yi = + X i + i
Como no temos acesso populao inteira, no sabemos quais os valores de e .
Temos condies apenas de estim-los (obtendo a e b )
Com isso, a reta de regresso estimada :
Yi = a + bX i
Ou seja, a e b so estimadores para e . So estimadores no viciados. Isto porque,
obedecidas algumas condies (aquelas que indicamos anteriormente: E ( i ) = 0 ;
V ( i ) = 2 e cov( i , j ) = 0 , para i j ), possvel demonstrar que:
E (b) = e
E (a) =
Resoluo.
Vimos que uma das hipteses do modelo que a varincia dos erros seja constante
(homocedasticia). Se a varincia dos erros no constante, temos a heterocedasticidade.
Gabarito: D
Yi = 100 ;
i =1
X i = 60 ;
i =1
X i Yi = 650 ; ( X i )2 = 400 ; (Yi )2
i =1 i =1
= 1080
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que, caso
haja um gasto anual com propaganda de 80 mil reais, a previso do lucro bruto anual, em
mil reais, ser de:
a) 84
b) 102,5
c) 121
d) 128,4
e) 158
Resoluo.
As hipteses que o enunciado disse que foram obedecidas so aquelas que indicamos
anteriormente - E ( i ) = 0 ; V ( i ) = 2 e cov( i , j ) = 0 , para i j .
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
b=
(X Y ) n X Y
i i
(X ) n X
2 2
i
650 10 6 10
b=
400 10 6 2
650 600 50
b= = = 1,25
400 360 40
E o valor de a fica:
a = Y bX
100 60
a= 1,25 = 10 7,5 = 2,5
10 10
Portanto, o modelo de regresso :
Yi = a + bX i
Yi = 2,5 + 1,25 X i
Y
i =1
i = 160 ; X
i =1
i = 100 ; X i Yi = 1900 ; (X )
i =1
i
2
= 1200 ; (Y )
i =1
i
2
= 3060
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, obteve-se, para
um determinado gasto em pesquisa e desenvolvimento, uma previso de acrscimo nas
vendas no valor de 19 mil reais. O valor que se considerou para o gasto com pesquisa e
desenvolvimento, em mil reais, foi:
a) 14
b) 13,75
c) 13,0
d) 12,4
e) 12,0
Resoluo.
Para calcular a previso, precisamos encontrar os valores de a e b do modelo de
regresso.
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
b=
(X Y ) n X Y
i i
(X ) n X
2 2
i
1.900 10 16 10 300
b= = = 1,5
1.200 10 10 2 200
E o valor de a fica:
a = Y bX
160 100
a= 1,5 = 16 15 = 1
10 10
Portanto, o modelo de regresso :
Yi = a + bX i
Yi = 1 + 1,5 X i
Quando Yi = 19 , o valor de X i :
19 = 1 + 1,5 X i
18
Xi = = 12
1,5
Gabarito: E.
atravs do mtodo dos mnimos quadrados. Para obteno desta relao considerou-se
ainda as seguintes informaes colhidas atravs da observao nos ltimos 10 anos:
10 10 10 10 10
C i = 90 ,
i =1
Yi = 100 ,
i =1
Yi Ci = 1.100 ,
i =1
Yi = 1.250 ,
i =1
2
C
i =1
i
2
= 1.010
Resoluo.
Vamos encontrar os valores de a e b.
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
b=
(X Y ) n X Yi i
(X ) n X
2 2
i
b=
(Y C ) nCY
i i
(Y ) nY
2 2
i
1.100 10 9 10 200
b= = = 0,8
1.250 10 10 2 250
Assim, a estimativa para o parmetro igual a 0,8. A letra B est errada.
a = Y bX
S que aqui, em vez de X temos Y e em vez de Y temos C.
a = C bY
a = 9 0,8 10 = 1
A estimativa do parmetro igual a 1. A letra C est errada.
Y=
(10 1) = 11,25
0,8
A letra A tambm est errada.
Yi = 2.500
i =1
X
i =1
i = 400
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, caso a empresa
almeje obter em um determinado ano um lucro bruto de 450 mil reais, deve apresentar um
total de gastos com propaganda, em mil reais, de:
a) 60
b) 80
c) 120
d) 160
e) 200
Resoluo.
Podemos calcular as mdias de X e Y.
10
Y i
2.500
Y= i =1
= = 250
10 10
10
X i
400
X = i =1
= = 40
10 10
Sabemos que a estimativa de dada por:
a = Y bX
150 = Y b X
150 = 250 b 40 b = 2,5
A reta de regresso fica:
Yi = a + bX i
Yi = 150 + 2,5 X i
Para obter um lucro de 450 mil reais, temos:
450 = 150 + 2,5 X i X i = 120
Gabarito: C.
A equao da reta ajustada pelo mtodo dos mnimos quadrados encontrada foi:
a) C i = 20 + 0,60 Yi
b) C i = 10 + 0,70 Yi
c) C i = 8 + 0,72 Yi
d) C i = 6 + 0,74 Yi
e) C i = 4 + 0,76 Yi
Resoluo.
Ns temos representado os parmetros do modelo por e . E representamos suas
estimativas por a e b .
Pois bem, neste exerccio os parmetros esto sendo chamados de a e b . Vamos chamar
suas estimativas de a e b .
Outra mudana nos nomes a que segue. Geralmente chamamos a varivel independente
de X e a dependente de Y. Aqui elas foram trocadas, respectivamente, por Y e C.
b =
[(Y Y ) (C C )]
i i
(Y Y )
2
i
b =
(Y C ) n Y C
i i
(Y ) nY
2 2
i
83.600 10 100 80
b = = 0,72
105.000 10 100 2
E com isso j d para marcar a letra C.
10 10 10 10 10
= 180 ; = 100 ; = 1.912 ; = 1.080 ; = 3.440
2 2
Y
i =1
i X
i =1
i X Y
i =1
i i X
i =1
i Y
i =1
i
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que se a
empresa almejar um acrscimo no faturamento, em um determinado ano, de R$ 25.000,00
dever apresentar, neste perodo, um total em gastos com publicidade de
(A) R$ 20.000,00.
(B) R$ 18.000,00.
(C) R$ 17.000,00.
(D) R$ 16.000,00.
(E) R$ 15.000,00.
Resoluo:
Vamos mais rapidamente?
1912 1800
b= = 1,4
1080 1000
a = 18 1,4 10 = 4
Modelo:
Y = 4 + 1,4 X
25 = 4 + 1,4 X X = 15
Gabarito: E
(E) 20.
Resoluo:
' = (
' = 100 2,5 30
' = 100 75 = 25
Gabarito: D
Resoluo:
No exerccio anterior vimos que a estimativa de = 25.
Assim, a reta obtida pelo mtodo dos mnimos quadrados fica:
> = ' + (
Para Y estimado em 115, temos:
115 = 25 + 2,5
115 25 = 2,5
90
= = 36
2,5
Gabarito: B
Y t = 39,0
t =1
Resoluo:
A mdia de Y pode ser calculada a partir do somatrio fornecido:
39
= = 3,9
10
A mdia de t igual a 5,5 (mdia dos nmeros naturais de 1 at 10).
? = 5,5
Logo:
' = ( ?
' = 3,9 0,12 5,5
' = 3,24
Portanto:
> = ' + (?
> = 3,24 + 0,12 11 = 4,56
Sabemos que:
= ln(DE )
Logo:
DE = F "GG
Portanto, a estimativa da receita tributria ser:
F H,IJ
Gabarito: B
Com base nessas informaes, a reta de mnimos quadrados que melhor explica a relao
entre o nmero de anos de estudo e a nota do teste de ingls igual a:
Resoluo.
Nas questes anteriores, o enunciado sempre fornecia diversos somatrios, para facilitar o
trabalho braal. Isto no aconteceu nesta questo. Ou seja, para calcular a reta de
regresso, precisaramos fazer todas as contas na mo, o que toma muito tempo.
Talvez por este motivo a questo apresente alternativas muito diferentes entre si.
Observem que, para qualquer valor de x entre 2 e 5, y no supera 10. J podemos descartar
as alternativas C, D, E, que prevem valores altos para y (muito superiores a 10), mesmo
quando x baixo.
Para se ter uma idia, considere a letra E. Se fizermos x igual a 1, y ser aproximadamente
igual a 270, algo totalmente incompatvel com a tabela fornecida.
Ficamos entre as alternativas A e B. Para escolher entre ambas, vamos trabalhar com os
valores extremos de x. Quando x igual a 2, as retas das letras A e B prevem os seguintes
valores para y:
Letra A: 8,45
Letra B: 4,89
Observem que o valor da Letra B muito mais prximo dos valores que y realmente
assume, quando x igual a 2. J d para marcar letra B.
Se voc ainda ficar em dvida, pode fazer o mesmo teste para x igual a 5. Neste caso, as
estimativas seriam:
Letra A: 19,13
Letra B: 8,85
Novamente, a estimativa da letra B foi bem melhor.
Gabarito: B
Com base nos conceitos de Regresso Linear Simples, quantas unidades compem a
demanda para julho?
(A) 4.000
(B) 5.000
(C) 6.000
(D) 7.000
(E) 8.000
Resoluo.
Outra questo que no forneceu somatrios. A vantagem agora que os nmeros
envolvidos so pequenos (isto no evita o trabalho braal, mas pelo menos deixa as contas
um pouquinho mais tranqilas).
Vamos dar nmeros para os meses do ano (1 para janeiro, 2 para fevereiro, e assim por
diante).
Para facilitar ainda mais nossos clculos, vamos indicar a demanda em mil unidades.
X Y XY
1 11 11
2 21 42
3 17 51
4 14 56
5 7 35
6 5 30
total 21 75 225
Temos:
X i = 21
= 1 + 4 + 9 + 16 + 25 + 36 = 91
2
X i
XY = 225
21
X = = 3,5
6
75
Y= = 12,5
6
Logo:
b=
[(X X ) (Y Y )]
i i
(X X )
2
i
b=
XY n X Y =
225 6 3,5 12,5
= 2,14
X nX
2 2
91 6 3,5 2
a = Y bX
a = 12,5 + 2,14 3,5 = 20
Deste modo, quando X = 7 , a estimativa da demanda fica:
Y = 20 2,14 7 = 5,02
Gabarito: B
X (X )
0,40 0,655
0,50 0,691
1,00 0,841
1,50 0,933
a) 0,650
b) 0,950
c) 0,933
d) 0,382
e) 0,975
Resoluo.
Para um dado valor X i , Yi dado por:
Yi = + X i +
A esperana de Yi fica:
E (Yi ) = E ( + X i + ) = E ( ) + E ( X i ) + E ( )
Como a esperana de igual a zero e os demais termos so constantes, ficamos com:
E (Yi ) = + X i
Isto equivale a dizer que a mdia de Y est justamente sobre a reta de regresso.
Yi = + X i +
V (Yi ) = V ( ) + V ( X i ) + V ( )
A varincia de igual a 9 (dada no exerccio). Os demais termos so constantes (varincia
zero).
V (Yi ) = V ( ) = 9
Isto equivale a dizer que a varincia de Y, para um valor de X dado, igual varincia da
varivel .
Assim, a varivel Yi gira em torno de sua mdia com varincia 9. Como o exerccio disse que
tem distribuio normal, os valores de Yi giram em torno de sua mdia segundo uma
distribuio normal de varincia 9.
Gostaramos de saber o percentual de valores de Y que est a uma distncia de, no mximo,
1,5 da mdia. Precisaramos consultar a tabela de reas da varivel normal para o valor
+ X i + 1,5.
Contudo, a tabela fornecida no exerccio s para a varivel reduzida (= padro).
Precisamos utilizar a varivel reduzida:
Yi E (Yi )
Z=
Sabemos que a varincia 9.
2 =9 =3
+ X i + 1,5 + X i 1,5
Z= = = 0,5
3 3
Portanto, consultamos a tabela para o valor 0,5.
Da tabela, temos que 69,10% dos valores de Z so menores ou iguais a 0,5.
Portanto, 30,90% dos valores so superiores a 0,5. Como a varivel normal tem funo
densidade de probabilidade simtrica, 30,90% dos valores so inferiores a -0,5.
Desse modo,
a) Y = 2 2X
b) Y = 2 2X
c) Y = 2X
d) Y = 2 + 2X
e) Y = 2 + 2X
Resoluo:
=
(X Y ) n X Y
i i
=
140 5 3 8 140 120 20
= = =2
(X ) n X 55 5 3 2 55 45
2
2 10
i
= Y bX = 8 23 = 2
Assim, Y = + X=2+2x
Gabarito: D
H outro modelo de regresso ligeiramente diferente do que vimos at aqui, em que se faz
com que a reta passe pela origem. Este segundo modelo usado em casos excepcionais,
quando h alguma razo terica que nos indique ser esse o modelo mais adequado.
Vamos ver como ficaria este segundo modelo, por meio do exerccio a seguir.
Resoluo.
Seja a a estimativa de . Seja Y a estimativa de Y . Dados os valores de X , as estimativas
de Y ficam:
Y = aX
O desvio fica:
e = Y Y
e = Y aX
Somando os quadrados de todos os desvios, num conjunto de n observaes:
2
e 2
= (Y aX )
E queremos achar o valor de a que minimiza esta soma. possvel demonstrar que a
estimativa de a que minimiza a soma dos quadrados dos desvios dada por:
a=
( XY )
(X ) 2
a=
( XY )
(X ) 2
a=
( XY )
(X ) 2
2.250.000
a= 0,242
9.312.500
Item correto.
Gabarito: certo
Resoluo.
Aqui, o coeficiente de angular da reta de regresso est sendo chamado de (quando, no
exerccio anterior, foi chamado de ).
Trata-se de aplicao direta da frmula estudada.
Gabarito: C
Um teste de hipteses muito comum aquele que testa a hiptese nula de que o
coeficiente da reta de regresso nulo. Caso a hiptese nula seja verdadeira, temos que
a reta de regresso horizontal.
Relembrando o significado da reta de regresso. Para cada valor de X ns temos uma sub-
populao de valores de Y, com mdia dada pela reta de regresso e varincia 2 .
Se a reta horizontal, ento todas as sub-populaes tero a mesma mdia.
Aula passada ns vimos uma ferramenta para testar se a mdia de diferentes populaes
so iguais entre si. Esta ferramenta era a anlise de varincia.
Como testar a hiptese de ser igual a zero equivale a testar a hiptese de as varais
populaes tm a mesma mdia, ento podemos usar a anlise de varincia para isso.
Vamos ver como fica.
(Y Y ) = (e + Y Y )
i
2
i i
2
(Y Y ) = e + (Y Y ) + 2 e (Y Y )
i
2
i
2
i
2
i i
) = e + (Y Y )
(Yi Y
2
i
2
i
2
[ (
+ 2 ei Yi Y )]
possvel demonstrar que [e (Y Y )] = 0 .
i i
Portanto:
(Y i Y ) = e + (Y Y )
2
i
2
i
2
(Y )
2
i Y soma de quadrados total (S.Q.Total)
2
e i soma de quadrados dos resduos (S.Q.Resduos)
(Y Y )
2
i soma de quadrados do modelo de regresso (S.Q.Regresso)
corresponde Soma de quadrado de tratamentos, vista na aula passada.
Portanto:
SQTotal = SQ Re gressao + SQ Re siduos
possvel demonstrar que:
SQ Re gressao = b X X Y Y [( )( )]
Onde b a estimativa do coeficiente angular da reta de regresso.
SQ Re gressao = b X X Y Y [( )( )]
Vamos calcular cada um destes valores para aqueles 4 alunos que fizeram as provas de fsica
e matemtica.
Aluno Nota de matemtica Nota de fsica
(X ) (Y )
1 2 6
2 6 7
3 8 7
4 10 8
Mdia 6,5 7
Nesta aula fizemos o modelo de regresso linear para, a partir das notas de matemtica,
estimar as notas de fsica. O resultado foi:
(Y ) Y ()
6 5,97 0,0009 1,0609 1
7 6,89 0,0121 0,0121 0
7 7,34 0,1156 0,1156 0
8 7,80 0,04 0,64 1
TOTAL 0,1686 1,8286 2
(Yi Y ) = e + (Y Y )
2
i
2
i
2
Ou ainda:
SQTotal = SQ Re gressao + SQ Re siduos
A anlise de varincia, aplicada reta de regresso, serve para testar a hiptese de que
igual a zero.
Vimos que, para cada valor de X, ns temos uma populao de valores de Y que gira em
torno da reta de regresso. Caso a reta seja horizontal, todas as populaes de valores de Y
giraro em torno do mesmo valor. Todas elas tero a mesma mdia.
Logo, as somas de quadrados de desvios, acima definidas, podem ser usadas para testar a
hiptese de que o coeficiente igual a zero.
A hiptese nula ( = 0 ) nada mais que supor que a reta de regresso horizontal. Ou
seja, a hiptese de que todas as sub-populaes de Y provm, na verdade, de uma nica
populao (ou seja, apresentam mesma mdia e mesma varincia). E vimos na aula passada
que a anlise de varincia pode ser utilizada justamente para isso. Basta calcular a
estatstica F, com base nos quadrados mdios.
No caso da regresso linear, temos:
(Y )
2
i Y SQTotal n 1 graus de liberdade
(Y Y )
2
i SQ Re gressao 1 grau de liberdade
Para o caso dos alunos que fizeram as provas de fsica e matemtica, temos:
2 2
QMTotal = =
4 1 3
0,1686
QM Re siduos = = 0,0843
42
1,8286
QM Re gressao = = 1,8286
1
E a estatstica F fica:
QM Re gressao 1,8286
F _ teste = = = 21,71
QM Re siduos 0,0842
As somas de quadrados servem para definir uma grandeza conhecida como coeficiente de
determinao da regresso linear.
Ele dado por:
SQ Re gressao
r2 =
SQTotal
Esta grandeza, no caso do modelo Yi = + X i + i , igual ao quadrado do coeficiente de
correlao linear, estudado na aula passada.
Se a soma dos quadrados dos resduos for pequena, de tal forma que r 2 se aproxime de 1,
isto significa que as diferenas entre os valores observados ( Yi ) e a mdia ( Y ) so quase
totalmente explicados pela reta de regresso.
Se a soma dos quadrados dos resduos for grande, de tal forma que r 2 se aproxime de zero,
isto significa que a reta de regresso pouco explica sobre as diferenas entre os valores
observados e a mdia. Ou seja, perca de tempo ficar calculando reta de regresso se ela
um estimador ruim.
Como o coeficiente de correlao (r) assume valores entre -1 e 1, ento o coeficiente de
determinao (r2) assume valores entre 0 e 1.
Yi = 100 ;
i =1
X i = 60 ;
i =1
X i Yi = 650 ; ( X i )2 = 400 ; (Yi )2 = 1080
i =1 i =1
Resoluo.
Em vez de utilizar o termo soma de quadrados, a questo est utilizando variao.
Assim, fazendo a correspondncia dos termos da questo com aqueles que ns vimos:
- Soma de quadrados total: variao total
- Soma de quadrados dos resduos: variao residual
- Soma de quadrados da regresso: variao explicada (ou seja, a parte da variao total
que explicada pelo modelo de regresso).
A variao total fica:
(
SQTotal = Yi Y )2
(
SQTotal = Yi Y ) = Y
2
i
2
nY
2
SQTotal = 1.080 10 10 2 = 80
Portanto a letra E est errada.
[(
SQ Re gressao = b X X Y Y )( )]
Utilizando as transformaes vistas:
S Re gressao = b ( ( XY ) n X Y )
S Re gressao = b ( ( XY ) n X Y )
Ci = 800
i =1
Yi = 1.000
i =1
Yi Ci = 83.600
i =1
Yi = 105.000
i =1
2
C
i =1
i
2
= 67.240
Resoluo:
Ns temos representado os parmetros do modelo por e . E representamos suas
estimativas por a e b .
Pois bem, neste exerccio os parmetros esto sendo chamados de a e b . Vamos chamar
suas estimativas de a e b .
SQTotal = Ci C ( )
2
(C ) nC
n
2 2
= i
i =1
Portanto:
(C ) nC
n
2
SQTotal = = 67.240 10 80 2 = 3.240
2
i
i =1
SQ Re gressao = b ( (YC ) n Y C )
SQ Re gressao = b (83.600 10 100 80)
Resoluo.
O quadrado mdio dos resduos igual a 36 (dado no enunciado).
SQ Re siduos
QM Re siduos = = 36
18
SQ Re siduos = 18 36 = 648
Logo:
X = 648
Com isso j podemos marcar a letra D.
O quadrado mdio dos resduos 36 (dado no enunciado). Portanto, Y = 36.
Resoluo.
O coeficiente de determinao o quadrado do coeficiente de correlao.
r 2 = 0,844 2 = 0,712
Gabarito: C
Resoluo.
SQ Re gressao
r2 =
SQTotal
SQ Re gressao
0,25 =
SQTotal
SQ Re gressao = SQtotal 0,25
Lembrando que:
SQTotal = SQ Re gressao + SQ Re siduos
Logo:
SQ Re siduos = 0,75 SQTotal
A estatstica F fica:
Resoluo.
Primeiro item.
SQ Re gressao = QM Re gressao / 1
SQ Re gressao = 56.000
O coeficiente de determinao fica:
SQ Re gressao 56.000
r2 = = = 0,63
SQTotal 88.480
Portanto, 63% da variao explicada pela reta de regresso. Ou seja, o modelo de
regresso explica 63% da variabilidade total. O primeiro item est certo.
Segundo item.
SQ Re siduos = SQTotal SQ Re gressao
SQ Re siduos = 88.480 56.000 = 32.480
A estatstica F fica:
QM Re gressao SQ Re gressao / 1 56.000
F _ teste = = = = 100
QM Re siduos SQ Re siduos /(60 2) 32.480 / 58
O segundo item tambm est certo.
Gabarito: Certo, certo
Embora esta informao no tenha sido necessria para resolver a questo, vamos falar
sobre o Fsig, que aparece na tabela.
O valor de Fsig nada mais que o valor descritivo do teste de hipteses para = 0 . Ou seja,
a probabilidade de uma varivel com distribuio F, com 1 grau de liberdade no
numerador e 58 no denominador, assumir valores maiores que 100 (que a estatstica
teste).
(X )
n
2
i X = 414
i =1
(Y )
n
2
i Y = 359
i =1
(X )
n
i X Yi = 345
i =1
Resoluo:
No caso do modelo usual de regresso linear, o coeficiente de determinao igual ao
quadrado do coeficiente de correlao.
Aqui a questo explora outra igualdade envolvendo somatrios.
O numerador da frmula do coeficiente de correlao :
[(X ) ( )]
n
i X Yi Y
i =1
[(X ) ( ) ]
n
i X Yi X i X Y
i =1
[( ) ] [( ) ]
n n
= X i X Yi X i X Y
i =1 i =1
[( ) ] [( )]
n n
= X i X Yi Y X i X
i =1 i =1
[( ) ]
n
= X i X Yi Y 0
i =1
[( ) ]
n
= X i X Yi
i =1
[(X ) ]
n
i X (Yi )
r= i =1
(X ) (Y Y )
n n
2 2
i X i
i =1 i =1
Resoluo.
QM Re gressao A
F _ calculado = = A = 67 36 = 2412
QM Re siduos 67
SQTotal SQ Re gressao = SQ Re siduos
5363 2412 = B
B = 2951
Obs: para esta questo, aberta, no consta o gabarito oficial no site da banca. Se vocs
acharem algum erro na minha resoluo, s falar.
Assinale a opo que d o valor da estatstica F necessria para testar a hiptese de que os
efeitos das firmas sejam iguais.
a) 2,25
b) 3,00
c) 0,37
d) 0,73
e) 1,28
Resoluo:
Resoluo:
O coeficiente b da reta de regresso :
( )( ) 1.105
(= = = 1,3
( ) 850
O coeficiente a dado por:
' = (
286 440
'= 1,3
22 22
' = 13 1,3 20
' = 13
O que resulta em:
RQ = 13 + 1,3
Gabarito: E
Resoluo:
Primeiro calculamos a soma de quadrados total (SQT):
VWE = : (
) = 1.690
Resoluo:
Sabemos que o coeficiente de correlao linear entre as variveis nulo, pois no existe
relao linear. Assim:
=0
O coeficiente de determinao o quadrado do coeficiente de correlao linear. Logo,
tambm vale zero:
D = 0
Mas tal coeficiente igual diviso entre a soma de quadrados do modelo de regresso
(SQM) e a soma de quadrados total (SQT):
VWX
0= VWX = 0
VWE
Sabemos ainda que a soma de quadrados total (SQT) igual soma dos quadrados dos
desvios (SQD) mais a soma dos quadrados do modelo de regresso (SQM):
VWE = VWX + VWZ
VWE = 0 + VWZ
VWZ = VWE
Queremos calcular o quadrado mdio dos desvios, ou dos resduos. Vamos chamar de QMD.
Ele dado pela soma dos quadrados dos desvios (SQD), dividido por n 2, que o
respectivo nmero de graus de liberdade.
VWZ
WXZ =
;2
VWE
WXZ =
;2
([ )
WXZ =
;2
Observe que a expresso acima quase igual varincia amostral de Y. A varincia amostral
de Y igual a:
([ )
\" =
;1
(X )
n
2
i X = 414
i =1
(Y )
n
2
i Y = 359
i =1
(X )
n
i X Yi = 345
i =1
Resoluo:
No caso do modelo usual de regresso linear, o coeficiente de determinao igual ao
quadrado do coeficiente de correlao.
Aqui a questo explora outra igualdade envolvendo somatrios.
O numerador da frmula do coeficiente de correlao :
[(X ) ( )]
n
i X Yi Y
i =1
[(X ) ( ) ]
n
i X Yi X i X Y
i =1
[(X ) ] [( ) ]
n n
= i X Yi X i X Y
i =1 i =1
[(X ) ] [( )]
n n
= i X Yi Y X i X
i =1 i =1
[(X ) ]
n
= i X Yi Y 0
i =1
[(X ) ]
n
= i X Yi
i =1
[(X ) ]
n
i X (Yi )
r= i =1
(X ) (Y Y )
n n
2 2
i X i
i =1 i =1
: = 51
: = 18
: = 76
' = 0,5
(=1
As constantes a e b so as estimativas de mnimos quadrados de e , respectivamente.
Assinale a opo correspondente estimativa no-viezada da varincia residual.
a) 3,6
b) 4,7
c) 1,0
d) 0,7
e) 1,2
Resoluo:
Primeiro calculamos a mdia de Y e a mdia de X:
18
= = =1
18 18
' = (
0,5 = 1 1
= 0,5
1 : ;
= 1 51 18 0,5 1
= 51 9 = 42
VZW 16
WXZ = = =1
; 2 18 2
Gabarito: C
(*)Esse tpico tem relao custo/benefcio muito ruim, e raramente cobrado. mais a
cara de provas mais avanadas. Ento, para concursos comuns de rea fiscal, sugiro pular o
tpico.
Ou seja, a varincia de Y igual a . Lembrando que trata-se da disperso em torno da reta
de regresso.
Alm disso:
+ + +
=
;
Aplicando a varincia dos dois lados:
+
+ +
;
*() = = =
; ; ;
Que o primeiro resultado apresentado.
A frmula de b :
8
(=
8
Detalhando isso:
8 8 8b b
(= + + +
8
8
8
8 8 8
*(() = * ] + + + ^
8
8
8
8 *( ) 8 *( ) 8 *( )
*(() = + +
( 8
) ( 8
) ( 8
)
8 8 8
*(() = + +
( 8
) ( 8
) ( 8
)
8
*(() =
( 8
)
*(() =
8
Este foi o segundo resultado apresentado.
Sabemos tambm que:
' = (
*(') = *() + *(() 2 (, ()
Agora precisaramos j saber que a covarincia acima indicada nula. Vamos supor que j
temos esse resultado. Continuando:
*(') = *() + *(() 0
*(') = +
; 8
1
*(') = ] + ^
; 8
Que o terceiro resultado apresentado.
Bom, vamos parar por aqui, j tivemos uma noo de onde vm os resultados mais
importantes.
Muito bem. Quando fazemos uma amostragem e obtemos um conjunto de n pares
ordenados (X,Y), no sabemos o valor de . Ento substitumos por seu estimador, que a
soma dos quadrados dos resduos.
\ = WX. DF\
E a podemos estimar as varincias de ' e de (, assim:
\
\ (() =
8
(')
1
\ =] + ^ \
; 8
Podemos usar as varincias acima para testar hipteses e determinar intervalos de
confiana sobre = e `
Assim:
' ?c \(') < = < ' + ?c \(')
( ?c \(() < ` < ( + ?c \(()
Onde ?c o valor da distribuio T correspondente ao nvel de confiana estabelecido.
Como o quadrado mdio dos resduos tem ; 2 graus de liberdade, usamos a distribuio
T com dois graus de liberdade.
Graus de X F(X)
liberdade
15 1,341 0,900
15 1,753 0,950
15 2,131 0,975
16 1,337 0,900
16 1,746 0,950
16 2,120 0,975
17 1,333 0,900
17 1,740 0,950
17 2,110 0,975
18 1,330 0,900
18 1,734 0,950
18 2,101 0,975
a) 0.533
b) 0.440
c) 0.630
d) 0.438
e) 0.300
Resoluo.
O teste mais comum sobre o valor de consiste na hiptese de que =0. Caso rejeitemos
esta hiptese nula, conclumos que h regresso de X sobre Y. Este procedimento serve para
verificarmos a qualidade do modelo de regresso.
J vimos um modo de fazer isso. Foi por meio da anlise de varincia da regresso,
utilizando a relao entre o quadrado mdio da regresso e o quadrado mdio dos resduos.
Pois bem, existe outra forma de faz-lo, que acabamos de estudar. Para o teste de ,
tambm podemos utilizar a distribuio T, com n 2 graus de liberdade.
A questo no pediu para fazermos o teste completo. Precisamos apenas calcular o p-valor.
J vimos, na aula de teste de hipteses, que o p-valor a probabilidade de obtermos valores
to extremos quanto a estatstica teste. A estatstica teste que estudamos naquela aula,
quando no se conhece a varincia do parmetro, foi:
X
t _ teste =
sX
Resoluo.
Utilizando-se a distribuio T com n 2 graus de liberdade tambm possvel determinar
intervalos de confiana para .
A questo j forneceu o intervalo de confiana pronto. J sabemos que, com confiana de
95%, est entre 0,24 e 1,68. Observem que um intervalo que contempla valores
prximos de zero (tanto negativos quanto positivos). Valores positivos para indicam
relao direta. Valores negativos para indicam relao inversa. Ora, se a amostra no
capaz nem de nos dar uma maior segurana quanto ao sinal de (se positivo ou negativo),
isso um forte sinal de que no existe relao linear entre as variveis estudadas. Por isso, a
alternativa E est correta.
Em outras palavras: aqui estamos trabalhando com o preditor do valor esperado (>e )
Uma vez calculado o valor >e , correspondente estimativa de Y quando X vale e , podemos
querer estudar o erro cometido nesta previso que estamos fazendo.
O erro corresponde diferena entre o verdadeiro valor e (uma observao individual) e
sua previso >e .
F = e >e
Desde que as duas variveis acima so independentes, a varincia do erro de previso ser a
soma das varincias. O resultado final ser:
1 (e )
*(F) =
]1 + + ^
; 8
Claro, se no soubermos o valor de
, substitumos por \ , seu estimador:
1 (e )
\(F) = \ ]1 + + ^
; 8
A podemos estabelecer intervalos de confiana para a nossa previso, assim:
>e ?c \(F)
Onde ?c o valor da distribuio T, com ; 2 graus de liberdade, para o nvel de confiana
estabelecido.
Vejam que agora no estamos mais considerando o valor esperado. Estamos considerando
uma determinada observao individual (e ), que tambm tem uma disperso em torno da
reta.
Disso surge um resultado interessante.
A varincia do erro do preditor (observao individual) muito similar varincia do valor
esperado. S o que muda de um caso para o outro que somamos o valor . No fundo,
quando consideramos uma observao individual, estamos adicionando a varincia da
prpria observao individual, que se dispersa em torno da reta real de regresso.
Vejamos uma questo a respeito.
Resoluo:
Reparem que o enunciado no estabeleceu diferena entre os smbolos para as realizaes
de Y e seus preditores.
Mantendo a simbologia do enunciado, vamos usar "Y", de agora em diante, como o preditor
da varivel dependente, dado pela reta de regresso.
Quando X = 3, o valor esperado para "Y" dado pela reta de regresso calculada.
= ?(
)
2 = 0,5 (3 1)
2 = 0,5 2
= 3
O preditor do valor esperado 3.
Como no conhecemos , substitumos por seu estimador, que o erro mdio quadrtico,
e que vale 1.
1 (e )
1] + ^
; 8
S que no sabemos quanto vale a soma dos quadrados dos desvios para X.
Gabarito: B
Vejam que a alternativa "d" erra ao trazer varincia 1 (em vez de 1,05).
Nesse caso, a nica mudana ocorre na varincia. Isso porque, alm de considerarmos que a
reta de regresso poderia mudar de amostra para amostra, temos que considerar tambm a
prpria disperso de Y em torno da reta. Y varia em torno da reta com varincia .
Deste modo, quando nos referirmos varincia do preditor de uma observao individual, a
frmula da varincia fica:
1 (e )
\ ]1 + + ^
; 8
1 (3 1)
]1 + + ^1
20 4
= 2,05
A varincia passa para 2,05. Da o erro das alternativas "a" e "e".
a) 41,4
b) 05,4
c) 30,5
d) 30,2
e) 20,2
Resoluo:
Seja
a varincia constante dos termos M
O estimador de igual ao quadrado mdio dos resduos (s2 = QMRes), que por sua vez
igual diviso entre a soma de quadrados dos resduos e o respectivo nmero de graus de
liberdade:
648
\ = = 36
18
O nmero de graus de liberdade total igual a: 1 + 18 = 19. Esse nmero, por sua vez,
corresponde a , onde "n" o tamanho da amostra.
; 1 = 19 ; = 20
Agora substitumos esse resultado no clculo da varincia do preditor:
1 (m )
]1 + + ^
20 1.000
Onde:
$: coeficiente de correlao linear entre X e Y:
torna-se no estocstica
Yi = 100 ;
i =1
X i = 60 ;
i =1
X i Yi = 650 ; ( X i )2 = 400 ; (Yi )2
i =1 i =1
= 1080
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que, caso
haja um gasto anual com propaganda de 80 mil reais, a previso do lucro bruto anual, em
mil reais, ser de:
a) 84
b) 102,5
c) 121
d) 128,4
e) 158
Questo 4 BACEN 2006 [FCC]
Uma empresa, com finalidade de determinar a relao entre gastos anuais em pesquisa e
desenvolvimento (X), em milhares de reais, e o acrscimo anual nas vendas (Y), tambm em
milhares de reais, optou por utilizar o modelo linear simples Yi = + X i + i , em que Yi
o acrscimo nas vendas no ano i e i o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples ( e so parmetros desconhecidos).
Considerou, para o estudo, as seguintes informaes referentes s observaes nos ltimos
10 anos da empresa:
10 10 10 10
Yi = 160 ;
i =1
X i = 100 ;
i =1
X i Yi = 1900 ; ( X i )2
i =1
= 1200 ; (Y )
i =1
i
2
= 3060
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, obteve-se, para
um determinado gasto em pesquisa e desenvolvimento, uma previso de acrscimo nas
vendas no valor de 19 mil reais. O valor que se considerou para o gasto com pesquisa e
desenvolvimento, em mil reais, foi:
a) 14
b) 13,75
c) 13,0
d) 12,4
e) 12,0
Questo 5 SEFAZ SP 2006 [FCC]
Em um determinado pas, deseja-se determinar a relao entre a renda disponvel (Y), em
bilhes de dlares, e o consumo (C), tambm em bilhes de dlares. Foi utilizado o modelo
linear simples Ci = + Yi + i , em que Ci o consumo no ano i, Yi o valor da renda
disponvel no ano i e i o erro aleatrio com as respectivas hipteses para a regresso
linear simples, e so parmetros desconhecidos, cujas estimativas foram obtidas
atravs do mtodo dos mnimos quadrados. Para obteno desta relao considerou-se
ainda as seguintes informaes colhidas atravs da observao nos ltimos 10 anos:
10 10 10 10 10
C i = 90 ,
i =1
Yi = 100 ,
i =1
Yi Ci = 1.100 ,
i =1
Yi = 1.250 ,
i =1
2
C
i =1
i
2
= 1.010
Yi = 2.500
i =1
X
i =1
i = 400
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, caso a empresa
almeje obter em um determinado ano um lucro bruto de 450 mil reais, deve apresentar um
total de gastos com propaganda, em mil reais, de:
a) 60
b) 80
c) 120
d) 160
e) 200
Questo 7 SEAD/PM Santos/2005 [FCC]
Para resolver questo seguinte, considere que foi realizado um estudo em um pas com a
finalidade de se determinar a relao entre a Renda Disponvel (Y), em milhes de dlares, e
o consumo (C), tambm em milhes de dlares.
Sabe-se que foi utilizado o modelo linear simples Ci = a + bYi + ei , em que Ci o consumo
no ano i, Yi a renda disponvel no ano i e ei o erro aleatrio com as respectivas hipteses
consideradas para a regresso linear simples.
Este estudo apresentou as seguintes informaes colhidas atravs da observao nos
ltimos 10 anos:
10 10 10 10 10
Ci = 800
i =1
Yi = 1.000
i =1
Yi C i = 83.600
i =1
Yi = 105.000
i =1
2
C
i =1
i
2
= 67.240
A equao da reta ajustada pelo mtodo dos mnimos quadrados encontrada foi:
a) C i = 20 + 0,60 Yi
b) C i = 10 + 0,70 Yi
c) C i = 8 + 0,72 Yi
d) C i = 6 + 0,74 Yi
e) C i = 4 + 0,76 Yi
Questo 8 TJ PAR 2009 [FCC]
Em uma determinada empresa realizado um estudo sobre a relao entre os gastos com
publicidade, em R$ 1.000,00, e o acrscimo no faturamento anual, em R$ 1.000,00. Foi
escolhido para anlise o modelo linear simples Yi = + Xi + i, sendo que Yi o acrscimo
no faturamento do ano i, Xi representa os gastos com publicidade no ano i e i o erro
aleatrio com as respectivas hipteses consideradas para a regresso linear simples ( e
so parmetros desconhecidos ). Para obteno das estimativas de e utilizou-se o
mtodo dos mnimos quadrados com base nas informaes dos ltimos 10 anos da
empresa, ou seja:
10 10 10 10 10
Yi = 180 ;
i =1
X i = 100 ;
i =1
X iYi = 1.912 ;
i =1
X i = 1.080 ;
i =1
2
Y
i =1
i
2
= 3.440
Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-se que se a
empresa almejar um acrscimo no faturamento, em um determinado ano, de R$ 25.000,00
dever apresentar, neste perodo, um total em gastos com publicidade de
(A) R$ 20.000,00.
(B) R$ 18.000,00.
(C) R$ 17.000,00.
(D) R$ 16.000,00.
(E) R$ 15.000,00.
Y t = 39,0
t =1
Com base nessas informaes, a reta de mnimos quadrados que melhor explica a relao
entre o nmero de anos de estudo e a nota do teste de ingls igual a:
(A) y = 1,33 + 3,56x
(B) y = 2,25 + 1,32x
(C) y = 6,97 + 3,56x
(D) y = 35,32 + 10,9x
(E) y = 254,56 + 13,3x
Questo 13 PETROBRAS 2008 [CESGRANRIO]
A tabela abaixo mostra as demandas que ocorreram numa determinada produo.
Com base nos conceitos de Regresso Linear Simples, quantas unidades compem a
demanda para julho?
(A) 4.000
(B) 5.000
(C) 6.000
(D) 7.000
(E) 8.000
X (X )
0,40 0,655
0,50 0,691
1,00 0,841
1,50 0,933
a) 0,650
b) 0,950
c) 0,933
d) 0,382
e) 0,975
Questo 15 MPOG 2006 [ESAF]
Com o objetivo de estimar-se o modelo Y = + X, foi retirada uma amostra com cinco
pares de observaes (X,Y), obtendo-se os seguintes resultados:
Desse modo,
a) Y = 2 2X
b) Y = 2 2X
c) Y = 2X
d) Y = 2 + 2X
e) Y = 2 + 2X
Questo 16 TCU/2008 [CESPE]
Uma agncia de desenvolvimento urbano divulgou os dados apresentados na tabela
a seguir, acerca dos nmeros de imveis ofertados (X) e vendidos (Y) em determinado
municpio, nos anos de 2005 a 2007.
Y
i =1
i = 100 ; X
i =1
i = 60 ; X i Yi = 650 ; (X )
i =1
i
2
= 400 ; (Y )
i =1
i
2
= 1080
Ci = 800
i =1
Yi = 1.000
i =1
Yi Ci = 83.600
i =1
Yi = 105.000
i =1
2
C
i =1
i
2
= 67.240
(C) 71,2%
(D) 84,4%
(E) 91,8%
Questo 22 PETROBRAS 2008 [CESGRANRIO]
Um modelo de regresso linear simples de Y em X, com uma varivel explicativa e o termo
constante, foi estimado com 32 observaes, gerando um r2 de 0,25. No teste de validade
do modelo, o F-calculado ou F-observado igual a
(A) 10
(B) 11
(C) 12
(D) 13
(E) 14
Questo 23 BNDES 2008/2 [CESGRANRIO questo adaptada]
Um experimento foi realizado com o objetivo de estimar o preo de uma ao, dado o seu
valor patrimonial, ambos em reais.
Uma amostra de aes negociadas recentemente forneceu dados sobre o preo e o valor
patrimonial por ao. Aplicou-se o modelo de regresso linear simples Y = + X + .
Alguns resultados da tabela da anlise da varincia, obtida a partir dos dados dessa amostra,
esto apresentados a seguir.
(X )
n
2
i X = 414
i =1
(Y )
n
2
i Y = 359
i =1
(X )
n
i X Yi = 345
i =1
Assinale a opo que d o valor da estatstica F necessria para testar a hiptese de que os
efeitos das firmas sejam iguais.
a) 2,25
b) 3,00
c) 0,37
d) 0,73
e) 1,28
Questo 27 PREFEITURA RJ 2010 [ESAF]
A partir de uma amostra aleatria simples formada por 22 observaes das variveis X e Y
calculou-se
:
= 440
:
= 286
: (
) = 850
: (
) = 1.690
: (
)(
) = 1.105
RQ = 20 + 2
d)
RQ = 13 + 1,3
e)
Questo 28 PREFEITURA RJ 2010 [ESAF]
Com os dados da questo anterior, calcule o valor mais prximo do coeficiente de
determinao R2 da regresso linear de X em Y.
a) 0,65
b) 0,81
c) 0,85
d) 0,91
e) 0,88
Questo 29 SEFAZ MG 2005 [ESAF]
Suponha que no exista associao linear entre duas variveis X e Y e que um nmero de
observaes suficientemente grande de pares (X,Y) esteja disponvel para o estudo da
regresso linear de Y em X. Assinale a opo que corresponde, nesse caso,
aproximadamente, ao quadrado mdio do erro.
a) 0.
b) Quadrado do coeficiente de correlao amostral entre X e Y.
c) Quadrado mdio da regresso.
d) 1.
e) Varincia das observaes do atributo Y.
Questo 30 SEFAZ SP 2009 [ESAF]
Uma amostra aleatria simples (X1, Y1), (X2, Y2), ..., (Xn, Yn) de duas variveis aleatrias X e Y
forneceu as seguintes quantidades:
(X )
n
2
i X = 414
i =1
(Y )
n
2
i Y = 359
i =1
(X )
n
i X Yi = 345
i =1
: = 51
: = 18
: = 76
' = 0,5
(=1
As constantes a e b so as estimativas de mnimos quadrados de e , respectivamente.
Assinale a opo correspondente estimativa no-viezada da varincia residual.
a) 3,6
b) 4,7
c) 1,0
d) 0,7
e) 1,2
Graus de X F(X)
liberdade
15 1,341 0,900
15 1,753 0,950
15 2,131 0,975
16 1,337 0,900
16 1,746 0,950
16 2,120 0,975
17 1,333 0,900
17 1,740 0,950
17 2,110 0,975
18 1,330 0,900
18 1,734 0,950
18 2,101 0,975
a) 0.533
b) 0.440
c) 0.630
d) 0.438
e) 0.300
Questo 33 INEP 2008 [CESGRANRIO]
Em um modelo de regresso linear simples, um intervalo de confiana de 95,0% obtido para
o coeficiente angular foi (0,24 ; 1,68). Com esse resultado s se pode concluir que
(A) o intercepto igual a zero.
(B) o coeficiente angular negativo.
(C) a relao entre as variveis no linear.
(D) a varivel dependente assume valores negativos.
(E) no existe relao linear entre as duas variveis.
Questo 34 APS 2002 [ESAF]
A varincia do coeficiente ? foi estimada em 0,25. O erro mdio quadrtico da regresso
vale 1.
a) 41,4
b) 05,4
c) 30,5
d) 30,2
e) 20,2
6. GABARITO
1 c
2 d
3 b
4 e
5 e
6 c
7 c
8 e
9 d
10 b
11 b
12 b
13 b
14 d
15 d
16 certo
17 c
18 d
19 d
20 d
21 c
22 a
23 certo certo
24 d
25 -
26 a
27 e
28 c
29 e
30 d
31 c
32 c
33 e
34 b
35 a