Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
AGOSTO 2017
x
i
i 1
média:
n
AMOSTRA E POPULAÇÃO
Problema: inferir o valor dos parâmetros da população, a
partir de estatísticas da amostra
Há possibilidade de cometer erro
AMOSTRA E POPULAÇÃO
Pr[( 0 ) x ( 0 )] (1 a )
( 0 ) x ( x 0 )
x ( 0 ) ( x 0 )
Pr[( x 0 ) ( x 0 )] (1 a )
AMOSTRA E POPULAÇÃO
• Intervalo de confiança para a média amostral com
probabilidade de 1-a
• Transformação dos limites do intervalo para a utilização da
curva normal padronizada
( x e0 ) x zsup s
zsup e0
s/ n n
( x e0 ) x zinf s
zinf e0
s/ n n
zs
lim inf,sup x e0 x
n
AMOSTRA E POPULAÇÃO
• Semelhantes ao avaliando
• Contemporâneos
Exemplo 1
Apartamentos de 1 quarto na
Vila Pan-Americana
VILA PANAMERICANA
Efeito Tschebotarioff
AMOSTRA E POPULAÇÃO
Plausibilidade
• Sentido e magnitude da variação são
coerentes com a teoria ou com o que é
observado no mundo real
Poder de explicação
• Modelo deve explicar grande parte das
variações [na regressão linear: R²]
MODELO
QUALIDADES DESEJÁVEIS
• Capacidade de previsão
• Simplicidade
MODELO DE REGRESSÃO LINEAR
Regressão simples Y b 0 b 1 X 1
A regressão da população: a verdadeira reta de
regressão Pr (yi / xi)
Linearidade!
Normalidade!
Homocedasticidade!
s2
y1 = 1 s2
y2 = 2
y=a+bx
MODELO DE REGRESSÃO LINEAR
População: Y b 0 b 1 X 1 b 2 X 2 ... b k X k
k variáveis
independentes
2 variáveis
independentes
Amostra:
Y b0 b1 X 1 b2 X 2 ... bk X k e
ESTIMADOR DE MÍNIMOS QUADRADOS
ORDINÁRIOS (MQO)
n n n
e (
i Yi Yi
ˆ ) ( 2
(
Y i b0 b1 X 1i b2 X 2i bk X ki )) 2
i 1 i 1 i 1
• Modelo minimiza a soma dos resíduos quadráticos
Exemplo 2
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
PRESSUPOSTO DA
LINEARIDADE
Exemplo 2
PRESSUPOSTO DO
NÚMERO DE DADOS EM RELAÇÃO AO
NÚMERO DE PARÂMETROS
Exemplo 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
Novas variáveis: andar, nº de quartos e estado
da infraestrutura
PRESSUPOSTO DO
NÚMERO DE DADOS EM RELAÇÃO AO
NÚMERO DE PARÂMETROS
1 ( x x )²
n
k
yˆ k tn 2 ; a / 2 sR n ( x x )²i
i 1
PRESSUPOSTOS PARA O ERRO
HOMOCEDASTICIDADE
NBR 14.653-2
PRESSUPOSTOS PARA O ERRO
HOMOCEDASTICIDADE
Homocedasticidade
Apartamentos no Centro do Rio de Janeiro
PRESSUPOSTOS PARA O ERRO
HOMOCEDASTICIDADE
s1 s2
Heterocedasticidade
Casas em Irajá
HOMOCEDASTICIDADE
Exemplos 2 e 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
PRESSUPOSTOS PARA O ERRO
NORMALIDADE
• Quando todas as variáveis independentes importantes
foram incluídas no modelo, é mais provável que ocorram
erros pequenos do que erros grandes, sugerindo uma
distribuição normal
1 ( x x )²
n
k
yˆ k tn 2 ; a / 2 sR n ( x x )²i
i 1
PRESSUPOSTOS PARA O ERRO
NORMALIDADE
NBR 14.653-2
PRESSUPOSTOS PARA O ERRO
NORMALIDADE
Exemplos 2 e 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
PRESSUPOSTOS PARA O ERRO
AUTOCORRELAÇÃO
Exemplos 2 e 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
PRESSUPOSTO DA
NÃO MULTICOLINEARIDADE
Coeficiente de
determinação
R
2 Yˆi Y
2
Yi Y
2
Yˆi Y
2
R
Yi Y
2
Coeficiente de
correlação
PRESSUPOSTO DA
NÃO MULTICOLINEARIDADE
x1
x1 x2
x2
Exemplo 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
OUTLIER
• Ponto atípico, identificado como estranho à massa
de dados, que, ao ser retirado, melhora a
qualidade de ajustamento do modelo analisado
OUTLIER
• 255 dados de mercado
• Além de 2σ na Curva Normal: 4,56% 5%
• Cerca de 12 casos estariam normalmente nessa situação
(x 13 casos, efetivamente)
n
n ( yˆ i yˆ i ( k ) ) 2
Di i 1
n
p ( yˆ i yi ) 2
i 1
Di 1 ponto influenciante
PONTO INFLUENCIANTE
• Distância de Cook
ponto influenciante
PONTOS INFLUENCIANTES E OUTLIERS
Exemplos 2 e 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
TESTE DE HIPÓTESE DO MODELO
• Hipótese Nula – nenhuma variável escolhida é
importante para explicar a variabilidade dos preços
H : b b b 0
0
1 2 k
H : b j 1k 0
1
j
TESTE DE HIPÓTESE DO MODELO
Variação explicada x variação total
Decomposição da variação
TESTE DE HIPÓTESE DO MODELO
Análise de variância
• Tabela ANOVA
Fonte Soma dos Graus de Quadrado
Variação Quadrados Liberdade Médio
Regressão
(Explicada)
SQR
Yˆi Y
2 k MQR =
SQR/k
MQR Yˆi Y n k 1
2
Fc 2. Ftab
EMQ Yi Yˆi k
TESTE DE HIPÓTESE DO MODELO
Graus de liberdade do
Teste F denominador
Yˆ Y n k 1
2
F Fa
Y Yˆ
c
i
. 2 ; k; n k 1
i i
k
Graus de liberdade do
numerador
TESTE DE HIPÓTESE DO MODELO
Graus de liberdade do
Teste F numerador
Yˆ Y n k 1
2
F Fa
Y Yˆ
c
i
. 2 ; k; n k 1
i i
k Graus de liberdade do
numerador
Rejeita-se a hipótese nula (H0) e aceita-se a hipótese
alternativa (H1) de que existe pelo menos uma variável
importante para explicar a variabilidade dos preços
TESTE DE HIPÓTESE DO MODELO
NBR 14.653-2
Grau
Item Descrição
III II I
Nível de
significância
máximo
admitido para a
6 rejeição da 1% 2% 5%
hipótese nula do
modelo através
do teste F de
Snedecor
COEFICIENTE DE DETERMINAÇÃO
MÚLTIPLO
R2
• Poder de explicação do modelo
SQR Yˆ Y
2
R
2
i
SQT Y Y
2
i
COEFICIENTE DE DETERMINAÇÃO
MÚLTIPLO AJUSTADO
R2a
• Compensa a entrada de uma nova variável no
modelo pela perda de um grau de liberdade no
denominador
n 1
R 1
2
a (1 R ) 2
nk
COEFICIENTE DE DETERMINAÇÃO
MÚLTIPLO AJUSTADO
14.653-2
A.4 Poder de explicação
Exemplo 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
TESTE DE HIPÓTESE DO REGRESSOR
• Inferir o valor dos parâmetros da reta de regressão da
população (a, b1, ..., bn), a partir de estatísticas (a, b1, ...,
bn) da reta de regressão amostral
y = a 1 b1 x y=abx
y = a 2 b2 x
y = a 3 b3 x
y = a 4 b4 x
y = a 5 b5 x
TESTE DE HIPÓTESE DO REGRESSOR
Reta de regressão da população x
Retas de regressão amostrais (regressão simples)
y
y = a 1 b1 x
b1 y = a 2 b2 x
b2 y=abx
b
y = a i bi x
bi
ai
a
a2
a1 x
TESTE DE HIPÓTESE DO REGRESSOR
bj 0
bj 0
TESTE DE HIPÓTESE DO REGRESSOR
A hipótese nula: b = 0 (regressão simples)
y
y = a 1 b1 x
b1 y = a 2 b2 x
b2
y = a i bi x
bi
b0 y=abx
ai
a
a2
a1 x
TESTE DE HIPÓTESE DO REGRESSOR
• Significância individual do regressor
• Nível de significância a (bilateral) = valor de prova
• Distribuição t de Student
bj 0 tj
TESTE DE HIPÓTESE DO REGRESSOR
b b b
t
j
j
j j
s(b ) s (b )
j j
bj é o estimador de b j
bb b
t
j
s (b) s (b)
1
s( b ) s e .
xi x 2
y i yˆ i
2
se
n k 1
TESTE DE HIPÓTESE DE CADA
REGRESSOR
s(b j ) se .aii
2
Nível de significância a
(somatório do valor das duas
5 caudas) máximo para a
rejeição da hipótese nula de 10 % 20 % 30 %
cada regressor (teste
bicaudal)
TESTES DE HIPÓTESE DOS
REGRESSORES
Exemplo 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana
INTERVALO DE CONFIANÇA
PARA A MÉDIA
Yˆ b b b ... b
0 1 1 2 2 k k
Yˆ b b b ... b
h 0 1 h1 2 h2 k hk
INTERVALOS
10%
80% 10%
ˆ 1
s(Y ) s . ( X X )( X X ) ( X X )
h e h
1
h
n
i i
(Y Yˆ ) 2
se
n k 1
INTERVALO DE CONFIANÇA
PARA A MÉDIA
• Intervalo de confiança para a regressão simples
1 ( xh x )
2
I yˆ h t (1a / 2;n 2 ) . se .
n ( x )2
xi
( yi yˆ i )
2
se
n k 1
INTERVALO DE CONFIANÇA
PARA A MÉDIA
• Quando as características do imóvel a avaliar estão
próximas às médias das características dos dados de
mercado, a amplitude do intervalo é menor
INTERVALO DE CONFIANÇA
PARA A MÉDIA
• Grau de precisão da estimativa
NBR 14.653-2
Grau
Descrição
III II I
1 ( xh x )
2
I yˆ h t1a / 2;( n 2 ) . se . 1
n ( x )2
xi
( yi yˆ i )
2
se
n k 1
CAMPO DE ARBÍTRIO
NBR 14.653-2
Exemplo 3
Apartamentos de 1, 2, 3 e 4 quartos na
Vila Pan-Americana