Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Curitiba
2008
Carlos Aurélio Nadal
Engenheiro Civil
Mestre em Ciências Geodésicas
Doutor em Ciências Geodésicas
Professor Titular do Departamento de Geomática da UFPR.
Catalogação na Fonte
Tania Barros Bággio
CRB - 9/760
Nadal, Carlos A.
Avaliação de imóveis pelo método dos mínimos
quadrados/Carlos A. Nadal. 1 a Ed. Curitiba, Departamento de
Geomática- UFPr: 2008.
49p,:il.
Inclui bibliografia
CDD 20 - 526.6
SUMÁRIO
TÓPICO PÁGINA
1. INTRODUÇÃO 04
2
2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS 06
3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES 12
4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR EM
AVALIAÇÕES DE BENS 16
4.1 Regressão Linear Simples 16
4.2 Validação de uma regressão linear simples 23
4.2.1 Coeficiente de correlação (r) 23
4.2.2 Coeficiente de Determinação 24
4.2.3 Erro padrão da estimativa 24
4.2.4 Análise de variância 24
4.2.5 Teste de hipótese para o regressor b 25
4.2.6 Intervalo de confiança para b 26
4.3 Regressões simples não lineares 26
4.3.1 Função logaritmica 26
4.3.2 Função exponencial 26
4.3.1 Função potencial 26
5. EXERCICIO DE REGRESSÃO SIMPLES 27
6. REGRESSÕESLINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE
BENS 35
6.1. Testes estatísticos como diretrizes em análise de
ajustamento de regressões múltiplas 37
7. EXERCICIO DE REGRESSÃO LINEAR MULTIPLA 42
REFERÊNCIAS 51
1. INTRODUÇÃO
3
Avaliação de bens, em sua parte 1 (ABNT,2001), que dita os procedimentos gerais
para avaliações prescreve como metodologia os métodos: método comparativo de
dados do mercado, método involutivo, método evolutivo e método da capitalização
da renda.
No Método Comparativo de Dados de Mercado, que será o principal objetivo
deste trabalho, o valor de mercado dos imóveis é estimado com base nos preços de
um grupo de propriedades semelhantes ao bem avaliando transacionadas no
mercado imobiliário em um período próximo a data da avaliação. Este método é,
indiscutivelmente, o mais empregado em avaliações de imóveis, sendo que para a
sua aplicação existem alguns requisitos básicos, entre os quais o fato de que é
imprescindível a existência de bens semelhantes ao avaliando que tenham sido
comercializados próximos à data da avaliação. Além disso, o avaliador necessita ter
acesso às informações sobre as condições das transações e as características dos
bens transacionados. Quanto menos comparáveis os elementos tomados como
referência, menor será a confiabilidade da avaliação (MILLINGTON, 1994).
Devido principalmente à heterogeneidade dos imóveis oferecidos pelo
mercado imobiliário, torna- se impossível a comparação direta de preços, mesmo no
caso de imóveis semelhantes ao do imóvel a ser avaliado, pois ainda assim,
existirão fatores que diferenciam os imóveis entre si, ou as condições de cada
transação. Assim, por exemplo suponha que são ofertadas casas iguais em um
condomínio fechado, seus valores podem ser diferentes por exemplo em razão da
inflação.
Pelos motivos acima expostos, é necessário aplicar uma técnica que permita
ajustar estas diferenças. A análise de regressão múltipla, que é uma técnica de
inferência estatística, vem sendo amplamente empregada para identificar os
principais fatores que influenciam a determinação dos preços de imóveis e estimar o
valor de mercado das propriedades, tanto nos casos de avaliações individuais
quanto nas avaliações em massa.
A avaliação de imóveis é utilizada na grande maioria dos negócios,
discussões e pendências interpessoais e sociais em nossas comunidades, tais como
na compra ou na venda de casas, lojas comerciais, instalações industriais, aluguéis,
na reavaliação de ativos de empresas, em atendimento à legislação vigente, na
partilha oriunda de heranças, meações ou divórcios, no lançamento de impostos,
nas hipotecas imobiliárias, nas divergências que originam ações demarcatórias,
possessórias, nas indenizações, nas desapropriações e servidões, enfim, em um
número expressivo de ações oriundas de problemas inerentes aos relacionamentos
humanos, onde o valor de um bem assume importância fundamental.
Nas funções públicas, o Engenheiro encontra grande aplicabilidade na
avaliação de bens, principalmente na definição do valor dos aluguéis a ser recebido
pelos bens públicos, na definição de valores a serem pagos como aluguéis,
compras, desapropriações, entre outras.
Apesar do conceito de valor ser de difícil definição, sujeito e suscetível às
mudanças filosóficas, torna- se importante no relacionamento humano e social
adotar- se alguns critérios para que se exerça um caráter de justiça em sua
aplicação prática. Assim, um trabalho de avaliação imobiliária constitui - se de uma
seqüência de operações que resultam no que poderia ser chamado de uma
“formação de juízo” sobre o valor de um imóvel ou um direito sobre ele.
O conceito de que o valor é aquele fornecido para um dado instante, único,
não importando qual a finalidade da avaliação. Esse valor corresponde ao preço que
se definiria, para um determinado imóvel, em um mercado de concorrência perfeito,
sujeito às seguintes premissas:
a) homogeneidade dos bens levados a mercado;
4
b) números elevados de compradores e vendedores (o mercado não pode por
eles ser alterado);
c) sem influência externa;
d) conhecimento pleno e absolutos sobre o mercado, sobre os bens e das
tendências de avaliação por parte dos compradores e vendedores;
e) vendedores e compradores oferecendo liquidez com liberdade plena de
entrada e saída do mercado.
A determinação do valor é de grande interesse para os agentes do mercado
mobiliário, servindo para apoiar a tomada de decisão em diferentes áreas, tais
como: operações de garantia no sistema financeiro, transações de compra e venda,
transações de locação, decisões judiciais, tributação de imóveis urbanos e decisões
de investimento (DANTAS, 1998).
Os trabalhos de avaliações foram ampliados com a aprovação do Estatuto da
Cidade, lei federal na qual diferentes instrumentos de política urbana são
regulamentados, entre os quais o solo criado, a transferência de potencial
construtivo e a aplicação do Imposto sobre a Propriedade Predial e Territorial
Urbana (IPTU) com alíquotas progressivas no tempo, visando ao cumprimento da
função social da propriedade. Para garantir a eficácia na aplicação de qualquer
destes instrumentos é necessário que sejam obtidas estimativas precisas sobre o
valor de mercado dos imóveis.
Como discutido por De Cesare (2000a), as falhas no processo avaliatório
podem ser geradas pelo uso de métodos inadequados para o estudo em questão,
pelas limitações das técnicas empregadas, pela omissão de atributos importantes
no processo de valoração, ou ainda pela falta de compreensão do avaliador do
fenômeno em análise. Como conseqüência destas falhas, podem ser citados os
seguintes exemplos:
a) venda de um bem por preço abaixo do seu valor ou a sua exposição
no mercado por um período maior do que o necessário trazendo
prejuízos financeiros ao vendedor.
b) Avaliações em desapropriações podem ser estabelecidas por preços
acima ou abaixo do valor de mercado, causando a dilapidação do
patrimônio privado, partilhas podem ser realizadas de forma a
beneficiar involuntariamente uma ou mais das partes envolvidas, ou
o enriquecimento indevido de proprietários privados com recursos
públicos.
c) Injustiças na distribuição da carga tributária.
Para minimizar os erros e as distorções no processo avaliatório, é
imprescindível saber quais são os principais atributos que influenciam a formação
do valor dos imóveis e a forma de interação entre os mesmos.
Enfim, a impossibilidade de considerar e mesmo de identificar todos os
atributos que influenciam o valor de um bem e a inexatidão contida na mensuração
dos atributos determinantes para a formação do valor estão entre as principais
razões pelas quais o valor revela- se como uma função aleatória.
Variações na intensidade de motivações, preferências, aspirações e
expectativas, resultam em variações de caráter aleatório nos preços praticados no
mercado.
Existem, inclusive, diferenças no nível de informação entre compradores e
vendedores que participam do mercado de forma não freqüente, como
conseqüência os preços de transações resultam de negociações individuais entre
compradores e vendedores.
2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS
5
Neste trabalho, não se pretende discorrer teoricamente sobre estatística, mas
somente utilizar- se de conceitos desta ciência com a finalidade de aplicá- los a
casos de avaliações de imóveis.
Durante um processo de medição, entendendo- se com tal a obtenção de uma
medida sem correções, que pode ser denominada de observação, incorre- se aos
inevitáveis erros de observação.
Denomina- se dado ao resultado do tratamento de uma observação (por
aplicação de uma técnica ou de um modelo matemático) para retirada de erros
sistemáticos.
A informação é o resultado do tratamento de dados (via modelo
matemático/estatístico).
Por exemplo, na avaliação de bens, quando obtemos o valor do aluguel de
um imóvel, temos uma observação, ao efetuarmos uma vistoria no imóvel, para
confirmação da existência, das condições e da validação do valor obtido, esta
observação transforma- se em dado, e após a aplicação de inferência estatística
pode ser denominada de informação que é o resultado da avaliação. Ao consumidor
final, ao gestor público, ao interessado em um processo, interessa
fundamentalmente a informação e sua validação.
A NBR- 14653 - 1 (ABNT,2001) traz algumas definições importantes do ponto
de vista estatístico:
amostra: Conjunto de dados de mercado representativos de uma população.
amostragem: Procedimento utilizado para constituir uma amostra.
dado de mercado: Conjunto de informações coletadas no mercado relacionadas a
um determinado bem.
tratamento de dados: Aplicação de operações que expressem, em termos relativos,
as diferenças de atributos entre os dados de mercado e os do bem avaliando.
Também, interessa- nos de perto o conceito de resolução, que pode ser
adaptado da metrologia industrial onde é definido como o menor valor de uma
medida que um instrumento fornece, já para a avaliação de imóveis, entendendo-
se como tal a capacidade de separação de observações. É fácil observar que uma
régua de desenho, graduada no milímetro tem resolução de 1mm, ou seja a melhor
medida que pode ser efetivada com esta é da ordem do milímetro. Ao aumentar- se
a resolução instrumental, melhora- se a separação das observações. Assim por
exemplo, a medida que aumentam - se as variáveis observadas num imóvel, por
exemplo, número de vagas de garagens, existência ou não de suíte, distância ao
centro comercial, etc., a observação vai sendo diferenciada de outra.
Na teoria das medidas o conceito de Exatidão, pode ser entendida como o
verdadeiro valor de uma grandeza, é, no entanto, uma utopia, pois todas as
medidas são eivadas de erros. Assim um resultado pode ter precisão, termo que
tem como significado o indicativo de repetibilidade dos resultados, sendo
geralmente mostrado como o desvio padrão de uma medida. A acurácia ou
acuracidade demonstra o quanto uma medida tendeu à exatidão. Na figura 1
demonstram - se estes conceitos através de tiros efetivados em um alvo.
Comparando- se as duas imagens situadas a esquerda da figura, denominadas de
baixa resolução e alta resolução, nota- se que as quatro marcas deixadas nos alvos
seriam pontuadas diferentemente nestes desenho, demonstrando que ao aumentar-
se a resolução (maior número de círculos concêntricos) separa- se as marcas. Na
imagem situada no canto superior direito mostram - se marcas concentradas, porem
distantes da “mosca”, trata- se portanto de precisão, resultando em informações
com desvio padrão de pequena magnitude, já a imagem no canto inferior direito
6
traz as marcas concentradas e localizadas no centro do alvo, trata- se de
observações com precisão e acuracia (quase exatas).
Como já havíamos afirmado, todas as observações são eivadas de erros. Os
erros podem ser classificados como: grosseiros ou faltas, sistemáticos e acidentais.
Os erros grosseiros são aqueles oriundos de falhas, falta de atenção do
observador e do mau funcionamento de um instrumento, deve ser evitado, pois é de
difícil detecção após as medidas, um exemplo deste erro é um erro de anotação
onde há a inversão de dígitos; deveria ser anotado 25 e anotou - se 52. Em
avaliações, por exemplo, utiliza- se na amostra um imóvel que está sendo alugado
por um preço muito superior ao do mercado. O avaliador não prestou atenção no
intervalo de tempo que esta ofertado no mercado (está para alugar a mais de um
ano), este fato pode configurar um erro grosseiro.
Os erros sistemáticos são produzidos por causas conhecidas, podem ser
evitados por técnicas especiais de observações ou podem ser modelados
matematicamente e eliminados das observações, um exemplo deste tipo de erro é o
devido à dilatação térmica de uma trena, o erro de calibração de um distânciometro,
etc. No caso de avaliações, por exemplo, utilizaram - se muitos dados na amostra de
uma mesma origem (apartamentos para alugar de uma mesma imobiliária que
tende a ter os preços superiores ao do mercado).
Os erros acidentais ocorrem de maneira aleatória e devem ser tratados
estatisticamente.
O ajustamento de observações diz respeito a minimização dos erros
acidentais das medidas, com a utilização do método dos mínimos quadrados o qual
tem como fundamento: a soma dos quadrados dos resíduos é mínima [Gemael,
1994].
7
Figura 1 – Resolução, precisão acurácia [Andrade, 1998].
Outra definição muito utilizada nas normas é a de tolerância que pode ser
definida como o erro máximo acidental admissível, geralmente adotado com ±3σ.
Utilizando- se o método dos mínimos quadrados, pode- se proceder a
propagação de erros acidentais, denominada de propagação de variâncias. Seja F
uma função de várias medidas independentes m 1 , m 2 , m 3 , ..., m k e assumindo - se
que os erros médios quadráticos (desvios padrões) são conhecidos, e que as
medidas estão livres de erros grosseiros e erros sistemáticos, o erro médio
quadrático de F (σF) segue a seguinte lei de propagação [Chrzanowski, 1977]:
∂F 2 ∂F 2 ∂F 2
(σ F ) 2 = ( ) (σm1 ) 2 + ( ) (σm2 ) 2 +...+ ( ) (σmk ) 2
∂m1 ∂m2 ∂mk
Analisando- se esta lei conclui- se que os erros não de propagam linearmente.
Utiliza- se em avaliações de imóveis a teoria da estimação, que é o processo
que usa resultados extraídos da amostra para produzir inferências sobre a
população da qual foi extraída aleatoriamente a amostra.
A inferência estatística é o método que parte do particular para o geral, ou
seja, o processo pelo qual são feitas generalizações para a população a partir da
amostra.
A estimação pode ser subdividida em dois tipos: a estimação por ponto que é
aquela que a partir da amostra, procura obter um valor único para um certo
parâmetro populacional e a estimação por intervalo que é aquela em que a
estimativa de um parâmetro populacional é dada por dois números, entre os quais
pode- se considerar que ele esteja situado. Um exemplo de estimativa pontual é a
média amostral quando utilizada para representar a média populacional. A
estimativa por intervalo pode ser representada pela média associada ao desvio
padrão, por exemplo a distância medida de 20,153m ± 0,150m, significando qua a
distância esta compreendida entre os valores 20,003m e 20,303m.
Tem importância fundamental neste estudo as principais qualidades de um
estimador, quais sejam: não tendenciosidade, consistência e eficiência.
Interessa- nos de perto a denominada estatística descritiva.
Os principais medidores de tendência central de uma amostra são: a média, a
mediana e a moda. Denomina- se média a uma medida de tendência central
resultante da divisão do somatório das observações dividido pelo número destas:
Σ xi
ū = (2.1)
n
geralmente, a média aritmética é utilizada para dados não agrupados ou para dados
de mesma confiabilidade.
No caso de utilizar- se dados agrupados ou de diferentes confiabilidades
pode ser utilizada a média ponderada:
8
Σ pi x i
ū = (2.2)
Σ pi
Onde p é o peso de uma observação.
A Mediana (Md) é o valor que divide uma série ordenada de observações de
modo que o número de itens acima desse valor é igual ao número de itens abaixo.
Se a amostra contiver um número ímpar de dados, a mediana corresponde ao valor
do ponto médio; se contiver número par de dados a mediana é igual a média dos
dois valores dos pontos médios.
A Moda (Mo) é o valor com freqüência máxima (pode não existir ou haver
mais de um valor).
As medidas de dispersão, são baseadas nas medidas da amplitude, variância,
desvio padrão, quartil, percentil, assimetria e curtose.
A amplitude é obtida pela diferença entre os valores correspondentes ao valor
máximo (x máx ) e mínimo (x min ) de uma observação:
Σ v. v
σ2 = (2.4)
n –1
v = xi – ū
e = σ. n –1/2
(2.5)
O quartil pode ser definido como qualquer um dos três valores que divide o
conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa
1/4 da amostra ou população. Assim, no caso duma amostra ordenada tem- se:
a) primeiro quartil (Q1/4 ) , ou quartil inferior que corresponde ao valor aos 25% da
amostra ordenada, também denominado de 25º percentil .
b) segundo quartil (Q2/4 ) , corresponde a mediana e corresponde ao valor até ao
qual se encontra 50% da amostra ordenada também denominado de 50º percentil .
c) terceiro quartil (Q3/4 ) , ou quartil superior é o valor a partir do qual se encontram
25% dos valores mais elevados ou corresponde ao valor de 75% da amostra
ordenada, denominado de 75º percentil .
A diferença entre os quartis superior e inferior chama- se amplitude inter-
quartil .
Um percentil é uma medida da posição relativa de uma unidade
obsservacional em relação a todas as outras. O p- ésimo porcentil tem no mínimo
p% dos valores abaixo daquele ponto e no mínimo (100 - p)% dos valores acima.
Entende- se por Assimetria , as medidas que possibilitam analisar uma
distribuição de acordo com as relações entre suas medidas de moda, média e
9
mediana, quando observadas graficamente. Uma distribuição é dita simétrica
quando apresenta o mesmo valor para a moda, a média e a mediana. Ou seja
assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de
simetria. Este afastamento pode acontecer do lado esquerdo ou do lado direito da
distribuição, chamado de assimetria negativa ou positiva respectivamente.
fi
Eixo d e
Cau d a d es viad a
p ar a
es q u er d a
Mo Md ū xi
Figura 2 – Distribuição com curva assimétrica negativa
ū - Mo
AS = (2.6)
σ
(Q3/4 – Q1/4 )
K = (2.7)
2 . (P90 – P10 )
onde: Q3/4 e Q1/4 são o terceiro e primeiro quartil e P90 e P10 são o décimo e
nonagésimo.
Quanto a curtose a distribuição pode ser: mesocúrtica ou normal, ou seja,
nem achatada, nem alongada com K = 0,263,p ou achatada com k > 0,263 e
leptocúrtica ou alongada, com k < 0,263.
Outra forma de se medir a dispersão de forma relativa é obtida com o
coeficiente de variação (CV). A principal característica do CV é que este elimina o
efeito da magnitude dos dados e exprime a variabilidade em relação a média, é
dado pela expressão:
σ
CV = 100% (2.8)
10
ū
11
3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES
observaçõe desvio
s valor desvio ao
quadrad
R$/m2 v o
6,47 0,66912
1 - 0,818 4
7,22 0,00462
2 - 0,068 4
6,55 0,54464
3 - 0,738 4
6,88 0,16646
4 - 0,408 4
6,94 0,12110
5 - 0,348 4
6,59 0,48720
6 - 0,698 4
7,09 0,03920
7 - 0,198 4
7,19 0,00960
8 - 0,098 4
7,25 0,00144
9 - 0,038 4
6,88 0,16646
10 - 0,408 4
8,96 2,79558
11 1,672 4
6,88 0,16646
12 - 0,408 4
6,78 0,25806
13 - 0,508 4
6,88 0,16646
14 - 0,408 4
7,22 0,00462
15 - 0,068 4
12
7,65 0,13104
16 0,362 4
8,06 0,59598
17 0,772 4
8,16 0,76038
18 0,872 4
8 0,50694
19 0,712 4
8,11 0,67568
20 0,822 4
1,33227E-
soma 145,76 14 8,27112
1.2) Mediana
Para o cálculo da mediana os valores devem ser ordenados.
7,09 + 7,19
Md = = 7,14 R$/m 2
2
1.3) Moda
A = x máx - x min
A = 8,96 – 6,55
A = 2,41 R$/m 2
n –1 19
13
σ2 = 0,4353 (R$/m 2 )2
σ = 0,66 R$/m 2
e = σ. n –1/2
= 0,66 x 20 –1/2
e = 0,15 R$/m 2
ū – Mo 7,29 - 6,88
AS = =
σ 0,66
AS = 0,62
Para aplicar essa expressão é necessário a obtenção dos valores dos percentis
P90 = 8,11
P10 = 6,55
K = 0,25
σ 0,66
CV = 100% = 100
ū 7,29
CV = 9%
14
2.9) Estimativa por intervalo de confiança da média
σ σ
P[ū - —— t α ≤ x i ≤ ū + —— t α ] = 1- α
√n √n
σ 0,66
ū - —— t α = 7,29 - ———— 2,093 = R$ 6,98
√n √ 20
σ 0,66
ū + —— t α= 7,29 + ———— 2,093 = R$ 7,60
√n √ 20
Neste ponto pode- se analisar os dados e verificar aqueles que encontram - se
no intervalo calculado. No caso desta amostra em particular teríamos muitos dados
fora do intervalo calculado a este nível de probabilidade, o que poderia desqualificar
a amostra.
Os valores acima podem ser calculados diretamente na planilha excel,
acionando- se na barra principal “Ferramentas”, nesta escolhe- se “Analise de dados”
e nesta escolhe- se “estatística descritiva”. Preenche- se o quadro de estatística
descritiva, obtendo- se o resultado.
15
Na Planilha Excel o erro padrão é igual ao erro médio quadrático de uma
observação isolada expressão (2.5).
A curtose pode ser avaliada da seguinte forma: se k= 0, distribuição normal,
K > 0, mais pico que a normal (alongada) e k< 0, menos pico que a normal
(achatada).
Se a assimetria AS= 0, dados simétricos, AS> 0, assimetria para direita ou
positiva, e AS< 0, assimetria para esquerda ou negativa. Os resultados são
semelhantes aos calculados anteriormente, apesar de usar parametrização
diferente.
A partir da analise dos resultados pode- se tirar algumas conclusões sobre a
amostra, como por exemplo, a representatividade da média, a qualidade das
observações, etc.
Propõe- se ao leitor a confecção de histograma de freqüência absoluta e
relativa.
16
Se o problema envolver somente duas variáveis tem- se a aplicação de correlação e
regressão simples, se no problema for envolvido mais de duas variáveis tem- se a
correlação e regressão múltipla.
yi = a + bx i , (4.1)
17
Y
14
0
Y= a + b
X
10
0 i
15 18 X
a
0 b = tg 0
i
140 = a + b x 180
100 = a + b x 150
a = - 100 (intercepto)
b = 1,333 (declividade)
i = arc tg 1,33 (função arco tangente)
i = 53,06º
Por exemplo, neste mercado um imóvel cuja área seja 200 m2 será avaliado
por R$ 166,60 / m 2 .
No caso mais geral, o problema básico consiste em estimar os parâmetros a e
b para que se conheça a equação da reta. Se a e b são estimados estatisticamente,
a equação é estimada da reta poderá ser escrita como:
yˆ i = a + bxi (4.2)
18
1000,00
950,00
900,00
850,00
800,00
aluguel
750,00
700,00
650,00
600,00
550,00
500,00
130 132 134 136 138 140
área dos imóveis
Não se pode precisar qual das retas é a melhor para representar como
modelo de regressão o problema. Na inferência estatística, procura- se o melhor
ajuste da reta aos pontos com um critério estatístico que permita a determinação da
confiabilidade do modelo adotado.
A descrição matemática é dada por:
Yi = a + bX i + vi (4.3)
Assim, por exemplo tem- se na tabela abaixo o valor do aluguel em reais (Y) e
a área de apartamentos em m 2 (X):
Y 487 510 480 625 490 555 612 498 530 490
X 95 84 102 135 92 89 122 95 100 88
487= a + 95b + v1
510= a + 84b + v2
480= a + 102b + v3
625= a + 135b + v4
490= a + 92b + v5
555= a + 89b + v6
612= a + 122b + v7
498= a + 95b + v8
530= a + 100b + v9
490= a + 88b + v10
19
487 1 95 v1
510 1 84 v
2
480 1 102 v3
625 1 135 v4
490 1 92 a v5
= +
555 1 89 b v6
612 1 122 v
7
498 1 95 v8
530 1 100 v
9
490 1 88 v10
ou
Y =AX + V
Portanto,
- vi = a + bx i –yi
e,
v2 i = (a + bx i –yi )2
20
Para tornar mínima esta soma, quando variam a e b, devemos igualar a zero
as derivadas parciais:
∂SQR ∂SQR
=0 e =0
∂a ∂b
Obtemos
∂SQR
= 2∑ ( a + bx i − y i )
∂a
∂SQR
= 2∑ ( a + bx i − y i ) x i
∂b
Σ ( a + bx i –yi ) = 0
Σ ( a + bx i –yi ) x i = 0
na + bΣx i = Σyi
aΣx i + bΣx 2 i = Σx i yi
que produzem
a=
( ∑ y i ) ( ∑ x i2 ) − ( ∑ x i )( ∑ x i y i )
(4.5)
n∑ x i 2 − ( ∑ x i ) 2
n ∑ x i y i − ( ∑ x i )( ∑ y i )
b= (4.6)
n∑ x i 2 − ( ∑ x i ) 2
a = y − bx (4.7)
Assim,
y − y = b( x − x )
y = y + b( x − x )
21
Partindo da equação:
y − y = b( x − x )
∑ ( x − x ) ( y − y) soma de produtos
b= =
∑ (x − x)
2
soma de quadrados
[ ∑ ( x − x ) ( y − y )]
b=
Cov ( X , Y )
= n −1
2
sX ∑ ( x − x ) 2
n −1
b=
∑ xy − nxy
(∑ x ) 2
∑x − n2
22
Se dividirmos tanto o denominador como o numerador por n a fórmula de b
não ficará alterada.
Porém o denominador passará a indicar a variância de X pois:
σ 2
=
∑(X − X ) 2
X
N
Cov X ,Y = σ XY =
∑ ( X − X )(Y − Y )
N
Cov X ,Y
b ==
σ X2
n −1
E a covariância de x e y é estimada por Cov X ,Y = ∑ ( x − x )( y − y )
n −1
b ==
Cov X ,Y
=
∑ xy − nxy
s X2 ( n − 1) s x2
x = 121,875 y = 887 ,5
b=
∑ xy − nxy = 869580 − 8 x(121,875 )(887 ,5) = 2,4346
(∑ x ) 2 (975 ) 2
∑x − n
2
120581 −
8
Portanto:
y = 590,7866 + 2,4346 x
23
4.2 Validação de uma regressão linear simples
- 1 ≤ r ≤ +1
r= 0 correlação nula
0≤r≤ 0,30 correlação fraca
0,30 ≤ r ≤ 0,60 correlação média
0,60 ≤ r ≤ 0,90 correlação forte
0,90 ≤ r ≤ 0,99 correlação fortissima
r =1 correlação perfeita
Cov xy
r= (4.8)
σ x2σ y2
n n
n ∑ xi ∑ y i
cov xy = ∑ xi yi − i =1 i =1 (4.9)
i =1 n
n
( ∑ xi ) 2
σ x2 = ∑ xi2 − i =1 (4.10)
i =1 n
e σ y é a variância de y.
2
n
(∑ y i ) 2
σ y2 = ∑ y i2 − i =1 (4.11)
i =1 n
24
conclusões definitivas sobre o modelo utilizado. Outras analises serão necessárias,
para validar os modelos adotados.
r2 =
∑ ( yˆ − y ) (4.12)
∑ ( y − y)
Onde: ŷ é a variável estimada
y é a média aritmética de y a variável explicada
∑(y i − yˆ i )
(4.13)
Se = i =1
n−2
25
Fcal =
∑ ( yˆ − y ) 2
×
n − k −1 (4.14)
∑ ( y − yˆ ) 2
k
Onde k é o número de variáveis independentes, na regressão linear simples
k=1
n é o número de dados da amostra
A hipótese nula neste caso é a de que existe regressão de y em x. Na tabela
de Fischer- Snedecor o valor de Ftab para um determinado nível de significância é
obtido.
Se Fcal > Ftab aceita- se a hipótese nula, de que há regressão pois b≠0, com a
significância correspondente ao valor tabelado.
Se Fcal < Ftab rejeita- se a hipótese de que há correlação.
A partir deste teste pode- se exprimir a confiabilidade do modelo, que será
fornecida pela expressão:
c = 100% - α
(4.15)
∑ ( y − yˆ ) 2
σ= i =1
n−2
e,
n
n
(∑ xi ) 2
σx = ∑x
i =1
2
i − i =1
n
O Tcalc deverá ser comparado com o T tab a um determinado nível de
significância; se o Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de
incerteza do valor tabelado. Por outro lado se T cal < Ttab não se pode afirmar que b≠
0.
4.2.6 Intervalo de confiança para b
26
O intervalo de confiança é construído em torno da estimativa por ponto, de
modo que esse intervalo tenha uma probabilidade conhecida de conter o verdadeiro
valor do parâmetro. Em engenharia de avaliações este intervalo muitas vezes é
denominado de campo de arbítrio do Engenheiro de Avaliações. É dentro deste
intervalo que o valor do bem avaliando deve ser arbitrado. Os limites inferior (Li ) e
superior (Ls)do intervalo são dados pelas expressões:
Li = b − Tα / 2 ( n − k −1)σ b
e, (4.17)
Ls = b + Tα / 2 ( n − k −1)σ b
e yˆ = e a x b
yˆ = a + bLn ( x)
yˆ = a + b x
yˆ = ax b
27
Um apartamento com área de 120 m 2 deve ser avaliado. A amostra coletada
obteve informações sobre 20 apartamentos localizados no mesmo bairro, com o
mesmo padrão de acabamento, com mesmo número de suites 01, enfim todos
semelhantes e localizados em locais com mesmo tipo de infra- estrutura urbana.
A área é uma variavel importante formadora de valor, deve- se entretanto,
verificar que as demais variaveis poderiam exercer influência no valor de mercado.
Neste caso, simplificadamente usar- se- á a variavel área como única.
yˆ i = a + bxi
a.1) Cálculo de b
28
∑ x∑ y
∑ xy − n
b=
(∑ x ) 2
∑x 2
−
n
b = 1227,35
a.2) cálculo de a
a = y − bx
a = - 15821,56
29
Y = - 15821,56 +1227,35X
Cov xy
r=
σ x2σ y2
r = 0,87
r 2 = 0,76
Fcal =
∑ ( yˆ − y ) 2
×
n − k −1
∑ ( y − yˆ ) 2
k
30
119.187, 28.842, 831.870.061, 851.890.175,
20 110,00 90.000,00 16 16 46 28
Som 133.527.348.160, 41.775.181.339,
a 1.730,01 1.806.900,00 68 32
Fcal = 57,534
yˆ = a + bLn ( x)
Para efetuar os cálculos na coluna área deverá ser colocado o logaritmo neperiano
da área.
31
36 00 80 00 00
4, 75.000, 314.224, 17, 5.625.000.000,
12 19 00 11 55 00
4, 55.000, 233.667, 18, 3.025.000.000,
13 25 00 24 05 00
4, 117.500, 516.594, 19, 13.806.250.000,
14 40 00 12 33 00
4, 117.500, 516.594, 19, 13.806.250.000,
15 40 00 12 33 00
4, 70.000, 294.651, 17, 4.900.000.000,
16 21 00 62 72 00
5, 235.000, 1.263.798, 28, 55.225.000.000,
17 38 00 90 92 00
3, 13.000, 44.215, 11, 169.000.000,
18 40 00 57 57 00
5, 420.000, 2.282.163, 29, 176.400.000.000,
19 43 00 24 53 00
4, 90.000, 423.043, 22, 8.100.000.000,
20 70 00 23 09 00
84, 1.806.900, 8.644.269, 367, 338.546.910.000,
Soma 84 00 16 56 00
4, 90.345,
Média 24 00
b.1) Cálculo de b
b = 127.728,93
b.2) Cálculo de a
a = - 451.485,68
r = 0,84
r 2 = 0,71
Fcal = 44,481
32
Para efetuar os cálculos na coluna valor deverá ser colocado o logaritmo
neperiano do valor.
c.1) Cálculo de ln b
ln b = 0,01
c.2) Cálculo de a
ln a = 10,13
33
r = 0,87
c.5) Cálculo do coeficiente de determinação
r 2 = 0,75
Fcal = 54,830
Ln ( yˆ ) = Ln ( a) + bLn ( x)
Para efetuar os cálculos na coluna área deverá ser colocado o valor do logaritmo
neperiano da área e na coluna do valor deverá ser colocado o logaritmo neperiano
do valor.
d.1) Cálculo de b
b = 1,22
d.2) Cálculo de a
ln a = 5,86
r = 0,93
r 2 = 0,87
34
Nº Área (m²) Valor (R$) X.Y X² Y²
ln(X) ln(Y)
5, 12, 67, 31, 148,
1 58 18 92 09 37
3, 10, 42, 15, 114,
2 99 71 74 91 80
4, 10, 46, 17, 119,
3 23 92 22 93 14
3, 10, 39, 15, 104,
4 89 20 71 15 11
4, 11, 48, 18, 124,
5 36 16 60 98 46
3, 10, 35, 12, 106,
6 48 31 93 14 27
3, 10, 38, 13, 108,
7 69 43 49 61 87
3, 10, 37, 12, 111,
8 56 54 48 64 15
3, 10, 38, 13, 108,
9 71 40 64 79 25
3, 10, 37, 13, 105,
10 64 28 38 23 58
4, 10, 47, 19, 120,
11 36 97 81 00 30
4, 11, 47, 17, 126,
12 19 23 03 55 01
4, 10, 46, 18, 119,
13 25 92 37 05 14
4, 11, 51, 19, 136,
14 40 67 33 33 29
4, 11, 51, 19, 136,
15 40 67 33 33 29
4, 11, 46, 17, 124,
16 21 16 96 72 46
5, 12, 66, 28, 152,
17 38 37 51 92 95
3, 9, 32, 11, 89,
18 40 47 22 57 73
5, 12, 70, 29, 167,
19 43 95 36 53 65
4, 11, 53, 22, 130,
20 70 41 62 09 13
84, 220, 946, 367, 2.453,
Soma 84 94 63 56 95
4, 11,
Média 24 05
Fcal = 124,239
35
Utilizando- se a expressão (4.15), com nível de confiança de 95%,
obtém- se
Tcal = 6,15
Ttab = 2,093
Como Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de incerteza de
5%.
Li = b − Tα / 2 ( n − k −1)σ b
e,
Ls = b + Tα / 2 ( n − k −1)σ b
d.9) Intervalo de y
36
6. REGRESSÕES LINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE BENS
Y = f(X) + ε (6.1)
onde:
X é a variável independente ou variável explicativa;
Y é a variável dependente ou variável resposta;
ε é a componente aleatória da variação de Y;
f é a função de regressão.
yi = a + b 1 x 1 + b 2 x 2 +... + b u x u + vi (6.2)
37
determinação. O problema geralmente será resolvido para um número de
observações maior que o número de incógnitas. De forma matricial, o sistema de
equações de observação pode ser expresso como [Gemael, 1994]:
n Au u X1 - n L1 = n V1 (6.3)
............................................................
1 x1 x2 xu
1 Xu T = a b1 b 2 ... b u
1 n L T
= y1 y2 ... yn
n V1 = n Au u X1 - n L1
1 Xu = (u An T n Pn n Au )- 1 u An T n Pn n L1 ,
1 Xu = u Nn - 1 u U1 (6.4)
sendo P a matriz dos pesos, que na maioria dos casos de avaliações coincide com a
matriz identidade (I), pois considera- se que as observações são provenientes de
uma mesma população. No entanto, de forma generalizada tem- se:
n Pn = σo 2 n ΣLb n
-1
38
1Vn T n Pn n V1
σ∗o 2 = (6.5)
n –u
n ΣXa n = σ∗o 2 u Nu –1
σ∗o 2 (n- u)
χ2 c = (6.7)
σo 2
χ2 n- u, 0,5 α e χ2 n- u, 1- 0,5 α
39
A hipótese H 0 é aceitável se:
Xu T u An T n Pn n Z1
1
R = 2
(6.9)
1 Zn n Z1
T
com
n Z1 = n L1 - n L* 1
todos os elementos do vetor n L* 1 são iguais e obtidos pela média aritmética dos n
valores de y.
O valor de R encontra- se no intervalo:
-1 ≤ R≤ 1
0≤R ≤1
(1 Xu T u An T n Pn n Z1 )(n- k- 1)
Fcal = (6.10)
( 1 Zn T n Z1 - 1 Xu T u An T n Pn n Z1 ) k
com
k=u - 1
40
e) Teste da significância dos regressores
bi
Tbi =
Tipo Nome do erro Magnitude
1 “blunders” m > 170 σ
2 “blunders” m ≤ 170 σ
3 “outliers” 3σ<m < 100 σ
σbi
com base nos valores obtidos da distribuição de Student (T) com entradas 2α e
graus de liberdade n- k- 1, aceita- se a hipótese básica que cada um dos coeficientes
b i seja diferente de zero se:
Tbi >T
Para que se possa aplicar o teste de Barda devem ser observadas as seguintes
condições:
- deve ser aplicado após o ajustamento, portanto, os cálculos devem estar
rigorosamente corretos;
- os pesos devem ser escolhidos apropriadamente para evitar- se a distribuição dos
erros grosseiros nos resíduos;
- o nível de confiança adotado deve ser o mesmo adotado no teste de qui- quadrado
para verificação da bondade do ajustamento.
Calcula- se a matriz de redundância ou dos coeficientes de peso dos
resíduos dada pela expressão [Moraes, 1997]:
n Qvn = n In - n Au u Nn - 1 u An T n Pn
(6.11)
41
r i = [ n Qvn n Pn ] ii (6.12)
vi √p i
w i =
σ0 √r i
1- α K 1- β
99,9% 3,29 76%
99,7% 3,00 84%
99,0% 2,56 93%
95,0% 1,96 98%
dw = —————— (6.13)
1 Vn T n Pn n V1
42
A condição de normalidade dos resíduos não é necessária para a obtenção
dos estimadores pelo método dos mínimos quadrados, mas sim para a definição de
intervalos de confiança e testes de significância. A falta de normalidade é uma
indicação de que os estimadores são não tendenciosos.
Antes de se aplicar um teste, compara- se a distribuição dos resíduos obtidos
com a distribuição normal. Para se efetuar esta comparação deve- se homogeneizar
os resíduos calculados dividindo - os pelo desvio padrão obtido a posteriori
(resultado positivo da raiz quadrada da variância a posteriori ). A comparação das
distribuições nos permite analisar se os resíduos obtidos apresentam ou não uma
distribuição aproximada da curva normal, atestando ou não a hipótese de
normalidade dos resíduos, que pode ser considerada como uma verificação ou
inspeção visual subjetiva da normalidade.
O teste de Kolmogorov- Smirnov avalia se duas amostras tem distribuições
semelhantes, ou melhor dizendo, se foram extraídas de uma mesma população. Se
apresentarem grandes diferenças provavelmente estas não se devem ao acaso. É um
teste que detecta diferenças em relação à tendência central, dispersão e simetria.
Para se aplicar o teste deve- se ordenar as amostras, construir as
distribuições de freqüências acumuladas nos intervalos de classe definidos, calcular
as diferenças entre estas freqüências (da primeira menos a da segunda amostra),
escolhendo - se a maior diferença em valor absoluto (d máx ) que será comparada com
um valor tabelado (d crítico ). A hipótese básica do teste é que se d máx ≥ d crítico rejeita- se
a igualdade das amostras.
Para maiores detalhes sobre o teste de Kolmogorov- Smirnov sugere- se
Bunchaft (1997).
40
20
Resíduos
0
-20100 120 140 160 180 200
-40
Variável X 1
0,6
0,4
0,2
0
-0,2
-0,4
94 96 98 100 102 104 106 108 43
Os resíduos mostrados no eixo y e valor estimado no eixo dos x, não
demonstra alinhamento, tratando- se portanto de hetereocedasticidade.
44
As amostras podem ser visualizadas no quadro a seguir [Lima, 2001]:
45
No Valor Área Padrão Idade Vagas de
Amostra unitário equivalente construtivo aparente garagens
1 857,46 590,00 Alto 0 a 1 ano 2 vagas
cobertas
2 733,00 400,00 Médio 4 a 6 anos 2 vagas
cobertas
3 734,66 322,00 Médio 4 a 6 anos 2 vagas
cobertas
4 737,22 223,00 Médio 8 a 10 2 vagas
anos cobertas
5 805,74 235,00 Alto > 12 anos 2 vagas
cobertas
6 762,47 152,03 Médio 6 a 8 anos 2 vagas
cobertas
7 770,73 149,23 Médio 4 a 6 anos 2 vagas
cobertas
8 735,71 140,00 Médio 10 a 12 1 vaga coberta
anos
9 634,45 163,00 Médio > 12 anos 1 vaga coberta
10 630,85 155,00 Médio > 12 anos 1 vaga coberta
11 472,17 180,02 Baixo > 12 anos 2 vagas
cobertas
12 464,57 132,15 Baixo > 12 anos 1 vaga coberta
13 629,76 123,00 Médio > 12 anos 1 vaga coberta
14 462,81 134,35 Baixo > 12 anos 1 vaga coberta
15 648,04 89,50 Médio > 12 anos 1 vaga coberta
16 513,11 107,19 Baixo 4 a 6 anos 1 vaga coberta
17 899,28 139,00 Alto 4 a 6 anos 1 vaga coberta
18 727,78 126,00 Médio 8 a 10 1 vaga coberta
anos
19 639,65 107,74 Médio > 12 anos 1 vaga coberta
20 586,32 85,50 Baixo 0 a 1 ano 1 vaga coberta
Y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4 + vi
857,46
733,00
734,66
737,22
805,74
762,47
770,73
735,71
634,45
L= 630,85
472,17
464,57
629,76
462,81
648,04
573,11
899,28
727,78
639,65
586,32
1824,29715989785
- 0,214930982557917
X= - 454764,932555851
- 136,132168924983
- 168,353398806299
σ∗o 2 = 27,1307176459636
χ2 c = 406,960764689454
Verifica- se neste caso que a hipótese básica deve ser rejeitada, deve- se
proceder a uma análise aprofundada do ajustamento (pode- se considerar os
resíduos excessivamente grandes em decorrência de erros grosseiros ou
sistemáticos). Deve- se também analisar se o modelo matemático utilizado é
consistente com as observações. O ideal seria parar o ajustamento neste ponto e
efetuar um estudo sobre diferentes modelos. Por se tratar de um estudo de caso
prossegue- se com o tratamento dos erros.
R2 = 0,998601862578729
cujo significado é que 99,86% do valor de mercado está sendo explicitado pelo
modelo e, o coeficiente de correlação linear múltiplo resulta em:
R = 0,999300686769868
Fc=2678,3897832203
F = 3,056
Tb1 = - 12,8797699083259
Tb2 = - 80,3743056845373
Tb3 = - 41,6568706036683
Tb4 = - 8,39453405047628
r = 15,00
dw = 1,70266906699683
di = 0,90
du = 1,83