Avaliacao de Imoveis

UNIVERSIDADE FEDERAL DO PARANÁ
SETOR DE CIÊNCIAS DA TERRA

DEPARTAMENTO DE GEOMÁTICA
AVALIAÇÃO DE IMÓVEIS PELO MÉTODO DOS MÍNIMOS

QUADRADOS
Carlos Aurélio Nadal
Curitiba
2008
Carlos Aurélio Nadal
Engenheiro Civil
Mestre em Ciências Geodésicas
Doutor em Ciências Geodésicas
Professor Titular do Departamento de Geomática da UFPR.
Catalogação na Fonte
Tania Barros Bággio
CRB - 9/760
Nadal, Carlos A.
Avaliação de imóveis pelo método dos mínimos
quadrados/Carlos A. Nadal. 1 a Ed. Curitiba, Departamento de
Geomática- UFPr: 2008.
49p,:il.
Inclui bibliografia
1. Avaliações. 2.Método dos mínimos quadrados. 3. Inferência

Estatística. 4. Terrenos urbanos. I. Título
CDD 20 - 526.6
SUMÁRIO
TÓPICO PÁGINA
1. INTRODUÇÃO 04
2
2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS 06
3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES 12
4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR EM
AVALIAÇÕES DE BENS 16
4.1 Regressão Linear Simples 16
4.2 Validação de uma regressão linear simples 23
4.2.1 Coeficiente de correlação (r) 23
4.2.2 Coeficiente de Determinação 24
4.2.3 Erro padrão da estimativa 24
4.2.4 Análise de variância 24
4.2.5 Teste de hipótese para o regressor b 25
4.2.6 Intervalo de confiança para b 26
4.3 Regressões simples não lineares 26
4.3.1 Função logaritmica 26
4.3.2 Função exponencial 26
4.3.1 Função potencial 26
5. EXERCICIO DE REGRESSÃO SIMPLES 27
6. REGRESSÕESLINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE
BENS 35
6.1. Testes estatísticos como diretrizes em análise de
ajustamento de regressões múltiplas 37
7. EXERCICIO DE REGRESSÃO LINEAR MULTIPLA 42
REFERÊNCIAS 51
1. INTRODUÇÃO
O conceito de avaliação imobiliária pode ser entendido como a estimativa do

valor de um bem, ou seja, o valor mais provável pelo qual o mesmo possa ser objeto
de transação no mercado em que está inserido. A norma brasileira NBR 14653- 1
3
Avaliação de bens, em sua parte 1 (ABNT,2001), que dita os procedimentos gerais
para avaliações prescreve como metodologia os métodos: método comparativo de
dados do mercado, método involutivo, método evolutivo e método da capitalização
da renda.
No Método Comparativo de Dados de Mercado, que será o principal objetivo
deste trabalho, o valor de mercado dos imóveis é estimado com base nos preços de
um grupo de propriedades semelhantes ao bem avaliando transacionadas no
mercado imobiliário em um período próximo a data da avaliação. Este método é,
indiscutivelmente, o mais empregado em avaliações de imóveis, sendo que para a
sua aplicação existem alguns requisitos básicos, entre os quais o fato de que é
imprescindível a existência de bens semelhantes ao avaliando que tenham sido
comercializados próximos à data da avaliação. Além disso, o avaliador necessita ter
acesso às informações sobre as condições das transações e as características dos
bens transacionados. Quanto menos comparáveis os elementos tomados como
referência, menor será a confiabilidade da avaliação (MILLINGTON, 1994).
Devido principalmente à heterogeneidade dos imóveis oferecidos pelo
mercado imobiliário, torna- se impossível a comparação direta de preços, mesmo no
caso de imóveis semelhantes ao do imóvel a ser avaliado, pois ainda assim,
existirão fatores que diferenciam os imóveis entre si, ou as condições de cada
transação. Assim, por exemplo suponha que são ofertadas casas iguais em um
condomínio fechado, seus valores podem ser diferentes por exemplo em razão da
inflação.
Pelos motivos acima expostos, é necessário aplicar uma técnica que permita
ajustar estas diferenças. A análise de regressão múltipla, que é uma técnica de
inferência estatística, vem sendo amplamente empregada para identificar os
principais fatores que influenciam a determinação dos preços de imóveis e estimar o
valor de mercado das propriedades, tanto nos casos de avaliações individuais
quanto nas avaliações em massa.
A avaliação de imóveis é utilizada na grande maioria dos negócios,
discussões e pendências interpessoais e sociais em nossas comunidades, tais como
na compra ou na venda de casas, lojas comerciais, instalações industriais, aluguéis,
na reavaliação de ativos de empresas, em atendimento à legislação vigente, na
partilha oriunda de heranças, meações ou divórcios, no lançamento de impostos,
nas hipotecas imobiliárias, nas divergências que originam ações demarcatórias,
possessórias, nas indenizações, nas desapropriações e servidões, enfim, em um
número expressivo de ações oriundas de problemas inerentes aos relacionamentos
humanos, onde o valor de um bem assume importância fundamental.
Nas funções públicas, o Engenheiro encontra grande aplicabilidade na
avaliação de bens, principalmente na definição do valor dos aluguéis a ser recebido
pelos bens públicos, na definição de valores a serem pagos como aluguéis,
compras, desapropriações, entre outras.
Apesar do conceito de valor ser de difícil definição, sujeito e suscetível às
mudanças filosóficas, torna- se importante no relacionamento humano e social
adotar- se alguns critérios para que se exerça um caráter de justiça em sua
aplicação prática. Assim, um trabalho de avaliação imobiliária constitui - se de uma
seqüência de operações que resultam no que poderia ser chamado de uma
“formação de juízo” sobre o valor de um imóvel ou um direito sobre ele.
O conceito de que o valor é aquele fornecido para um dado instante, único,
não importando qual a finalidade da avaliação. Esse valor corresponde ao preço que
se definiria, para um determinado imóvel, em um mercado de concorrência perfeito,
sujeito às seguintes premissas:
a) homogeneidade dos bens levados a mercado;
4
b) números elevados de compradores e vendedores (o mercado não pode por
eles ser alterado);
c) sem influência externa;
d) conhecimento pleno e absolutos sobre o mercado, sobre os bens e das
tendências de avaliação por parte dos compradores e vendedores;
e) vendedores e compradores oferecendo liquidez com liberdade plena de
entrada e saída do mercado.
A determinação do valor é de grande interesse para os agentes do mercado
mobiliário, servindo para apoiar a tomada de decisão em diferentes áreas, tais
como: operações de garantia no sistema financeiro, transações de compra e venda,
transações de locação, decisões judiciais, tributação de imóveis urbanos e decisões
de investimento (DANTAS, 1998).
Os trabalhos de avaliações foram ampliados com a aprovação do Estatuto da
Cidade, lei federal na qual diferentes instrumentos de política urbana são
regulamentados, entre os quais o solo criado, a transferência de potencial
construtivo e a aplicação do Imposto sobre a Propriedade Predial e Territorial
Urbana (IPTU) com alíquotas progressivas no tempo, visando ao cumprimento da
função social da propriedade. Para garantir a eficácia na aplicação de qualquer
destes instrumentos é necessário que sejam obtidas estimativas precisas sobre o
valor de mercado dos imóveis.
Como discutido por De Cesare (2000a), as falhas no processo avaliatório
podem ser geradas pelo uso de métodos inadequados para o estudo em questão,
pelas limitações das técnicas empregadas, pela omissão de atributos importantes
no processo de valoração, ou ainda pela falta de compreensão do avaliador do
fenômeno em análise. Como conseqüência destas falhas, podem ser citados os
seguintes exemplos:
a) venda de um bem por preço abaixo do seu valor ou a sua exposição
no mercado por um período maior do que o necessário trazendo
prejuízos financeiros ao vendedor.
b) Avaliações em desapropriações podem ser estabelecidas por preços
acima ou abaixo do valor de mercado, causando a dilapidação do
patrimônio privado, partilhas podem ser realizadas de forma a
beneficiar involuntariamente uma ou mais das partes envolvidas, ou
o enriquecimento indevido de proprietários privados com recursos
públicos.
c) Injustiças na distribuição da carga tributária.
Para minimizar os erros e as distorções no processo avaliatório, é
imprescindível saber quais são os principais atributos que influenciam a formação
do valor dos imóveis e a forma de interação entre os mesmos.
Enfim, a impossibilidade de considerar e mesmo de identificar todos os
atributos que influenciam o valor de um bem e a inexatidão contida na mensuração
dos atributos determinantes para a formação do valor estão entre as principais
razões pelas quais o valor revela- se como uma função aleatória.
Variações na intensidade de motivações, preferências, aspirações e
expectativas, resultam em variações de caráter aleatório nos preços praticados no
mercado.
Existem, inclusive, diferenças no nível de informação entre compradores e
vendedores que participam do mercado de forma não freqüente, como
conseqüência os preços de transações resultam de negociações individuais entre
compradores e vendedores.
2. REVISÃO DE ESTATÍSTICA APLICADA A AVALIAÇÕES DE IMÓVEIS
5
Neste trabalho, não se pretende discorrer teoricamente sobre estatística, mas
somente utilizar- se de conceitos desta ciência com a finalidade de aplicá- los a
casos de avaliações de imóveis.
Durante um processo de medição, entendendo- se com tal a obtenção de uma
medida sem correções, que pode ser denominada de observação, incorre- se aos
inevitáveis erros de observação.
Denomina- se dado ao resultado do tratamento de uma observação (por
aplicação de uma técnica ou de um modelo matemático) para retirada de erros
sistemáticos.
A informação é o resultado do tratamento de dados (via modelo
matemático/estatístico).
Por exemplo, na avaliação de bens, quando obtemos o valor do aluguel de
um imóvel, temos uma observação, ao efetuarmos uma vistoria no imóvel, para
confirmação da existência, das condições e da validação do valor obtido, esta
observação transforma- se em dado, e após a aplicação de inferência estatística
pode ser denominada de informação que é o resultado da avaliação. Ao consumidor
final, ao gestor público, ao interessado em um processo, interessa
fundamentalmente a informação e sua validação.
A NBR- 14653 - 1 (ABNT,2001) traz algumas definições importantes do ponto
de vista estatístico:
amostra: Conjunto de dados de mercado representativos de uma população.
amostragem: Procedimento utilizado para constituir uma amostra.
dado de mercado: Conjunto de informações coletadas no mercado relacionadas a
um determinado bem.
tratamento de dados: Aplicação de operações que expressem, em termos relativos,
as diferenças de atributos entre os dados de mercado e os do bem avaliando.
Também, interessa- nos de perto o conceito de resolução, que pode ser
adaptado da metrologia industrial onde é definido como o menor valor de uma
medida que um instrumento fornece, já para a avaliação de imóveis, entendendo-
se como tal a capacidade de separação de observações. É fácil observar que uma
régua de desenho, graduada no milímetro tem resolução de 1mm, ou seja a melhor
medida que pode ser efetivada com esta é da ordem do milímetro. Ao aumentar- se
a resolução instrumental, melhora- se a separação das observações. Assim por
exemplo, a medida que aumentam - se as variáveis observadas num imóvel, por
exemplo, número de vagas de garagens, existência ou não de suíte, distância ao
centro comercial, etc., a observação vai sendo diferenciada de outra.
Na teoria das medidas o conceito de Exatidão, pode ser entendida como o
verdadeiro valor de uma grandeza, é, no entanto, uma utopia, pois todas as
medidas são eivadas de erros. Assim um resultado pode ter precisão, termo que
tem como significado o indicativo de repetibilidade dos resultados, sendo
geralmente mostrado como o desvio padrão de uma medida. A acurácia ou
acuracidade demonstra o quanto uma medida tendeu à exatidão. Na figura 1
demonstram - se estes conceitos através de tiros efetivados em um alvo.
Comparando- se as duas imagens situadas a esquerda da figura, denominadas de
baixa resolução e alta resolução, nota- se que as quatro marcas deixadas nos alvos
seriam pontuadas diferentemente nestes desenho, demonstrando que ao aumentar-
se a resolução (maior número de círculos concêntricos) separa- se as marcas. Na
imagem situada no canto superior direito mostram - se marcas concentradas, porem
distantes da “mosca”, trata- se portanto de precisão, resultando em informações
com desvio padrão de pequena magnitude, já a imagem no canto inferior direito
6
traz as marcas concentradas e localizadas no centro do alvo, trata- se de
observações com precisão e acuracia (quase exatas).
Como já havíamos afirmado, todas as observações são eivadas de erros. Os
erros podem ser classificados como: grosseiros ou faltas, sistemáticos e acidentais.
Os erros grosseiros são aqueles oriundos de falhas, falta de atenção do
observador e do mau funcionamento de um instrumento, deve ser evitado, pois é de
difícil detecção após as medidas, um exemplo deste erro é um erro de anotação
onde há a inversão de dígitos; deveria ser anotado 25 e anotou - se 52. Em
avaliações, por exemplo, utiliza- se na amostra um imóvel que está sendo alugado
por um preço muito superior ao do mercado. O avaliador não prestou atenção no
intervalo de tempo que esta ofertado no mercado (está para alugar a mais de um
ano), este fato pode configurar um erro grosseiro.
Os erros sistemáticos são produzidos por causas conhecidas, podem ser
evitados por técnicas especiais de observações ou podem ser modelados
matematicamente e eliminados das observações, um exemplo deste tipo de erro é o
devido à dilatação térmica de uma trena, o erro de calibração de um distânciometro,
etc. No caso de avaliações, por exemplo, utilizaram - se muitos dados na amostra de
uma mesma origem (apartamentos para alugar de uma mesma imobiliária que
tende a ter os preços superiores ao do mercado).
Os erros acidentais ocorrem de maneira aleatória e devem ser tratados
estatisticamente.
O ajustamento de observações diz respeito a minimização dos erros
acidentais das medidas, com a utilização do método dos mínimos quadrados o qual
tem como fundamento: a soma dos quadrados dos resíduos é mínima [Gemael,
1994].
Baixa resolução Precisão
Alta resolução Acurácia
7
Figura 1 – Resolução, precisão acurácia [Andrade, 1998].
Outra definição muito utilizada nas normas é a de tolerância que pode ser
definida como o erro máximo acidental admissível, geralmente adotado com ±3σ.
Utilizando- se o método dos mínimos quadrados, pode- se proceder a
propagação de erros acidentais, denominada de propagação de variâncias. Seja F
uma função de várias medidas independentes m 1 , m 2 , m 3 , ..., m k e assumindo - se
que os erros médios quadráticos (desvios padrões) são conhecidos, e que as
medidas estão livres de erros grosseiros e erros sistemáticos, o erro médio
quadrático de F (σF) segue a seguinte lei de propagação [Chrzanowski, 1977]:
∂F 2 ∂F 2 ∂F 2
(σ F ) 2 = ( ) (σm1 ) 2 + ( ) (σm2 ) 2 +...+ ( ) (σmk ) 2
∂m1 ∂m2 ∂mk
Analisando- se esta lei conclui- se que os erros não de propagam linearmente.
Utiliza- se em avaliações de imóveis a teoria da estimação, que é o processo
que usa resultados extraídos da amostra para produzir inferências sobre a
população da qual foi extraída aleatoriamente a amostra.
A inferência estatística é o método que parte do particular para o geral, ou
seja, o processo pelo qual são feitas generalizações para a população a partir da
amostra.
A estimação pode ser subdividida em dois tipos: a estimação por ponto que é
aquela que a partir da amostra, procura obter um valor único para um certo
parâmetro populacional e a estimação por intervalo que é aquela em que a
estimativa de um parâmetro populacional é dada por dois números, entre os quais
pode- se considerar que ele esteja situado. Um exemplo de estimativa pontual é a
média amostral quando utilizada para representar a média populacional. A
estimativa por intervalo pode ser representada pela média associada ao desvio
padrão, por exemplo a distância medida de 20,153m ± 0,150m, significando qua a
distância esta compreendida entre os valores 20,003m e 20,303m.
Tem importância fundamental neste estudo as principais qualidades de um
estimador, quais sejam: não tendenciosidade, consistência e eficiência.
Interessa- nos de perto a denominada estatística descritiva.
Os principais medidores de tendência central de uma amostra são: a média, a
mediana e a moda. Denomina- se média a uma medida de tendência central
resultante da divisão do somatório das observações dividido pelo número destas:
Σ xi
ū =  (2.1)
n
Onde: ū = média aritmética

x 1 , x 2 ,.... x n = observações
n = número de observações
geralmente, a média aritmética é utilizada para dados não agrupados ou para dados
de mesma confiabilidade.
No caso de utilizar- se dados agrupados ou de diferentes confiabilidades
pode ser utilizada a média ponderada:
8
Σ pi x i
ū =  (2.2)
Σ pi
Onde p é o peso de uma observação.
A Mediana (Md) é o valor que divide uma série ordenada de observações de
modo que o número de itens acima desse valor é igual ao número de itens abaixo.
Se a amostra contiver um número ímpar de dados, a mediana corresponde ao valor
do ponto médio; se contiver número par de dados a mediana é igual a média dos
dois valores dos pontos médios.
A Moda (Mo) é o valor com freqüência máxima (pode não existir ou haver
mais de um valor).
As medidas de dispersão, são baseadas nas medidas da amplitude, variância,
desvio padrão, quartil, percentil, assimetria e curtose.
A amplitude é obtida pela diferença entre os valores correspondentes ao valor
máximo (x máx ) e mínimo (x min ) de uma observação:
A = x máx - x min (2.3)
A variância é dada pela expressão:
Σ v. v
σ2 =  (2.4)
n –1
onde v é denominado de resíduo e, é definido como:
v = xi – ū
O desvio padrão ou o erro médio quadrático da média é obtido pela raiz

quadrada da variância.
O erro médio quadrático de uma observação isolada é dado pela expressão:
e = σ. n –1/2
(2.5)
O quartil pode ser definido como qualquer um dos três valores que divide o
conjunto ordenado de dados em quatro partes iguais, e assim cada parte representa
1/4 da amostra ou população. Assim, no caso duma amostra ordenada tem- se:
a) primeiro quartil (Q1/4 ) , ou quartil inferior que corresponde ao valor aos 25% da
amostra ordenada, também denominado de 25º percentil .
b) segundo quartil (Q2/4 ) , corresponde a mediana e corresponde ao valor até ao
qual se encontra 50% da amostra ordenada também denominado de 50º percentil .
c) terceiro quartil (Q3/4 ) , ou quartil superior é o valor a partir do qual se encontram
25% dos valores mais elevados ou corresponde ao valor de 75% da amostra
ordenada, denominado de 75º percentil .
A diferença entre os quartis superior e inferior chama- se amplitude inter-
quartil .
Um percentil é uma medida da posição relativa de uma unidade
obsservacional em relação a todas as outras. O p- ésimo porcentil tem no mínimo
p% dos valores abaixo daquele ponto e no mínimo (100 - p)% dos valores acima.
Entende- se por Assimetria , as medidas que possibilitam analisar uma
distribuição de acordo com as relações entre suas medidas de moda, média e
9
mediana, quando observadas graficamente. Uma distribuição é dita simétrica
quando apresenta o mesmo valor para a moda, a média e a mediana. Ou seja
assimetria é o grau de afastamento que uma distribuição apresenta do seu eixo de
simetria. Este afastamento pode acontecer do lado esquerdo ou do lado direito da
distribuição, chamado de assimetria negativa ou positiva respectivamente.
fi
Eixo d e
Cau d a d es viad a
p ar a
es q u er d a
Mo Md ū xi
Figura 2 – Distribuição com curva assimétrica negativa
A assimetria pode ser calculada pela expressão:
ū - Mo
AS =  (2.6)
σ
Quando: AS = 0 distribuição simétrica;

AS > 0 distribuição assimétrica positiva;
AS < 0 distribuição assimétrica negativa.
Curtose é o grau de achatamento da distribuição. Ou o quanto uma curva de

freqüência será achatada em relação a uma curva normal de referência.
Para o cálculo do grau de curtose de uma distribuição utiliza- se o coeficiente
de curtose (ou coeficiente percentílico de curtose)
(Q3/4 – Q1/4 )
K =  (2.7)
2 . (P90 – P10 )
onde: Q3/4 e Q1/4 são o terceiro e primeiro quartil e P90 e P10 são o décimo e
nonagésimo.
Quanto a curtose a distribuição pode ser: mesocúrtica ou normal, ou seja,
nem achatada, nem alongada com K = 0,263,p ou achatada com k > 0,263 e
leptocúrtica ou alongada, com k < 0,263.
Outra forma de se medir a dispersão de forma relativa é obtida com o
coeficiente de variação (CV). A principal característica do CV é que este elimina o
efeito da magnitude dos dados e exprime a variabilidade em relação a média, é
dado pela expressão:
σ
CV =  100% (2.8)
10
ū
É importante, em avaliações a estimação por intervalos, na qual constrói - se

um intervalo em torno da estimativa por ponto, de modo que esse intervalo tenha
uma probabilidade conhecida de conter o verdadeiro valor do parâmetro (Marques,
2000), assim:
P (Φ1 ≤ u ≤ Φ2) = 1 - α (2.9)

Onde:
Intervalo de confiança: Φ1 ≤ u ≤ Φ2
Limites de confiança: Φ1 e Φ2
Nível de confiança: 1 - α
A escolha do nível de confiança depende da precisão com que desejamos

estimar o parâmetro, sendo muito comum a utilização dos níveis 95% e 99%. O
aumento de confiança no intervalo, implica no aumento de sua amplitude.
Convém também discutir as hipóteses estatísticas, que são suposições que
fazemos a cerca dos parâmetros de uma população, ao tentar a fixação de decisões.
Essas suposições poderão ser verdadeiras ou não. A hipótese pode ser simples se
corresponder a um único valor do parâmetro ou composta.
A denominada hipótese nula (Ho ) ou básica é a hipótese a ser validade pelo
teste, sendo que o teste de hipótese estatística é um procedimento estatístico que
mediante observações amostrais, permite decidir o aceite ou a rejeição da hipótese
nula. A denominada hipótese alternativa (H1 ) é aquela contrária a hipótese nula.
Deve- se observar que indica- se claramente qual é a Ho , e qual é a H1 , pois aceitar a
primeira, significa rejeitar a segunda e vice- versa.
Para compreender cientificamente o assunto sugere- se os livros
especializados de estatística, por exemplo, Marques (2000).
O teste de hipóteses é utilizado na avaliação para validar os resultados
obtidos.
11
3. EXERCICIO DE ESTATÍSTICA APLICADA A AVALIAÇÕES
Verificar estatisticamente a amostra a seguir, supondo- se que foram

recolhidas observações de 20 apartamentos com dois quartos, colocados para
alugar no centro de Curitiba, todos semelhantes, com 1 vaga na garagem.
Na tabela abaixo mostram - se os valores unitários obtidos em R$/m 2 não
tabulados
6,47 6,59 8,96 7,65

7,22 7,09 6,88 8,06
6,55 7,19 6,78 8,16
6,88 7,25 6,88 8,00
6,94 6,88 7,22 8,11
1) Calculo dos indicadores de tendência central

Utilizando a tabela a seguir, retirada de planilha eletrônica
observaçõe desvio
s valor desvio ao
quadrad
R$/m2 v o
6,47 0,66912
1 - 0,818 4
7,22 0,00462
2 - 0,068 4
6,55 0,54464
3 - 0,738 4
6,88 0,16646
4 - 0,408 4
6,94 0,12110
5 - 0,348 4
6,59 0,48720
6 - 0,698 4
7,09 0,03920
7 - 0,198 4
7,19 0,00960
8 - 0,098 4
7,25 0,00144
9 - 0,038 4
6,88 0,16646
10 - 0,408 4
8,96 2,79558
11 1,672 4
6,88 0,16646
12 - 0,408 4
6,78 0,25806
13 - 0,508 4
6,88 0,16646
14 - 0,408 4
7,22 0,00462
15 - 0,068 4
12
7,65 0,13104
16 0,362 4
8,06 0,59598
17 0,772 4
8,16 0,76038
18 0,872 4
8 0,50694
19 0,712 4
8,11 0,67568
20 0,822 4
1,33227E-
soma 145,76 14 8,27112
1.1) Média aritmética (utilizando a expressão 2.1).

Σ xi 145,76
ū =  =  ∴ ū = 7,29 R$/m 2
n 20
1.2) Mediana
Para o cálculo da mediana os valores devem ser ordenados.
6,47 6,55 6,59 6,78

6,88 6,88 6,88 6,88
6,94 7,09 7,19 7,22
7,22 7,25 7,65 8,00
8,06 8,11 8,16 8,96
Como tem- se um número par de dados
7,09 + 7,19
Md =  = 7,14 R$/m 2
2
1.3) Moda
Mo = 6,88 R$/m 2 (repete- se quatro vezes)
2) Cálculo das medidas de dispersão

2.1) Amplitude (calculada pela expressão 2.3)
A = x máx - x min
A = 8,96 – 6,55
A = 2,41 R$/m 2
2.2) Variância (calculada pela expressão 2.4)

Σ v. v 8,27112
σ =  = 
2
n –1 19
13
σ2 = 0,4353 (R$/m 2 )2
2.3) Desvio padrão
σ = 0,66 R$/m 2
2.4) Erro médio quadrático de uma observação isolada (expressão 2.5)
e = σ. n –1/2
= 0,66 x 20 –1/2
e = 0,15 R$/m 2
2.5) Primeiro, segundo e terceiro quartil

Q1/4 = 6,88 R$/m 2
Q2/4 = 7,09 R$/m 2
Q3/4 = 7,65 R$/m 2
2.6) Assimetria (expressão 2.6)
ū – Mo 7,29 - 6,88
AS =  = 
σ 0,66
AS = 0,62
Se AS > 0 a distribuição assimétrica positiva, isto é, a moda e a mediana são

menores que a média.
2.7) Curtose (expressão 2.7)
Para aplicar essa expressão é necessário a obtenção dos valores dos percentis
P90 = 8,11
P10 = 6,55
(Q3/4 – Q1/4 ) 7,65 - 6,88

K =  = 
2 . (P90 – P10 ) 2 x (8,11 – 6,55)
K = 0,25
Conclui- se que a distribuição será leptocúrtica ou alongada, pois k < 0,263.
2.8) Coeficiente de variação (expressão 2.8)
σ 0,66
CV =  100% = 100
ū 7,29
CV = 9%
14
2.9) Estimativa por intervalo de confiança da média
σ σ
P[ū - —— t α ≤ x i ≤ ū + —— t α ] = 1- α
√n √n
Sendo 1- α denominado de nível de significância, usualmente igual a 95%. α =

0,05
Na tabela de Student para n- 1 =19 (graus de liberdade) t 0,05 = 2,093
σ 0,66
ū - —— t α = 7,29 - ———— 2,093 = R$ 6,98
√n √ 20
σ 0,66
ū + —— t α= 7,29 + ———— 2,093 = R$ 7,60
√n √ 20
Neste ponto pode- se analisar os dados e verificar aqueles que encontram - se
no intervalo calculado. No caso desta amostra em particular teríamos muitos dados
fora do intervalo calculado a este nível de probabilidade, o que poderia desqualificar
a amostra.
Os valores acima podem ser calculados diretamente na planilha excel,
acionando- se na barra principal “Ferramentas”, nesta escolhe- se “Analise de dados”
e nesta escolhe- se “estatística descritiva”. Preenche- se o quadro de estatística
descritiva, obtendo- se o resultado.
15
Na Planilha Excel o erro padrão é igual ao erro médio quadrático de uma
observação isolada expressão (2.5).
A curtose pode ser avaliada da seguinte forma: se k= 0, distribuição normal,
K > 0, mais pico que a normal (alongada) e k< 0, menos pico que a normal
(achatada).
Se a assimetria AS= 0, dados simétricos, AS> 0, assimetria para direita ou
positiva, e AS< 0, assimetria para esquerda ou negativa. Os resultados são
semelhantes aos calculados anteriormente, apesar de usar parametrização
diferente.
A partir da analise dos resultados pode- se tirar algumas conclusões sobre a
amostra, como por exemplo, a representatividade da média, a qualidade das
observações, etc.
Propõe- se ao leitor a confecção de histograma de freqüência absoluta e
relativa.
4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR SIMPLES EM

AVALIAÇÕES DE BENS
A regressão linear é utilizada em experimentos que procuram determinar a

relação existente entre duas ou mais variáveis. Neste caso, podem ocorrer dois tipos
de situação:
(a) uma variável (X) pode ser medida acuradamente e seu valor escolhido pelo
experimentador. Por exemplo, a dose de uma droga a ser administrada no
animal. Esta variável e chamada de variável independente. A outra variável
(Y), chamada variável dependente ou resposta, está sujeita a erro
experimental, e seu valor depende do valor escolhido para a variável
independente. Assim, a resposta (Y) é uma variável dependente da variável
independente (X). Este é o caso da regressão. Este mesmo caso ocorre
quando a avaliações de bens.
(b) As duas variáveis estão sujeitas a erros experimentais, isto é, erros de
natureza aleatória, inerentes ao experimento. Por exemplo, produção de
leite e produção de gordura medidas em vacas em lactação. Este tipo de
associação entre duas variáveis constitui o caso da correlação.
16
Se o problema envolver somente duas variáveis tem- se a aplicação de correlação e
regressão simples, se no problema for envolvido mais de duas variáveis tem- se a
correlação e regressão múltipla.
4.1 Regressão Linear Simples
O termo regressão é usado para designar a expressão que relaciona uma

variável dependente (Y) em função de outra (X), considerada independente. Diz- se
regressão de Y sobre X. Se a relação funcional entre elas é expressa por uma
equação de 1º grau, cuja a representação geométrica é uma linha reta, a regressão é
dita linear.
Postulada a existência de uma relação linear entre duas variáveis, pode- se
representar aquele conjunto de pontos pela equação da reta:
yi = a + bx i , (4.1)
que expressa o valor de Y em função de X.

Y é a variável dependente ou regredida, ou resposta
X é a variável independente, ou regressora ou explanatória
a e b são constantes, a é o intercepto e expressa o valor de y quando x é
zero e b é o coeficiente de regressão, coeficiente angular ou inclinação da reta.
Um caso específico é obtido para o caso da coordenadas x=0 fazendo com
que y=a. Ja no caso de a=0 a reta corta a origem.
Da Geometria analítica o problema pode ser resolvido com uma única
solução, a partir do conhecimento das coordenadas cartesianas de dois pontos. É o
caso, por exemplo, da determinação da equação do valor de um imóvel, se não
houvesse erros na amostragem, ou em um mercado perfeito. Neste caso os dois
imóveis amostrados abaixo, representariam o mercado. Na figura 3 mostra- se
esquematicamente o problema.
imóvel Área R$/m2
1 15 100
0
2 18 140
0
17
Y
14
0
Y= a + b
X
10
0 i
15 18 X
a
0 b = tg 0
i
Figura 3 – Determinação da equação de uma reta
A partir dos dados, tem- se o seguinte sistema de equações:
140 = a + b x 180
100 = a + b x 150
Resolvendo obtém - se:
a = - 100 (intercepto)
b = 1,333 (declividade)
i = arc tg 1,33 (função arco tangente)
i = 53,06º
Desta forma o modelo matemático adotado para este mercado seria:
VALOR = - 100 + 1,333 X ÁREA DO IMÓVEL
Por exemplo, neste mercado um imóvel cuja área seja 200 m2 será avaliado
por R$ 166,60 / m 2 .
No caso mais geral, o problema básico consiste em estimar os parâmetros a e
b para que se conheça a equação da reta. Se a e b são estimados estatisticamente,
a equação é estimada da reta poderá ser escrita como:
yˆ i = a + bxi (4.2)
O problema fundamental consiste em ajustar uma regressão linear simples,

isto é, a equação de uma reta ajustada aos dados.
18
1000,00
950,00
900,00
850,00
800,00
aluguel
750,00
700,00
650,00
600,00
550,00
500,00
130 132 134 136 138 140
área dos imóveis
Figura 4 – Ajuste de uma reta
Não se pode precisar qual das retas é a melhor para representar como
modelo de regressão o problema. Na inferência estatística, procura- se o melhor
ajuste da reta aos pontos com um critério estatístico que permita a determinação da
confiabilidade do modelo adotado.
A descrição matemática é dada por:
Yi = a + bX i + vi (4.3)
Assim, por exemplo tem- se na tabela abaixo o valor do aluguel em reais (Y) e
a área de apartamentos em m 2 (X):
Y 487 510 480 625 490 555 612 498 530 490
X 95 84 102 135 92 89 122 95 100 88
487= a + 95b + v1
510= a + 84b + v2
480= a + 102b + v3
625= a + 135b + v4
490= a + 92b + v5
555= a + 89b + v6
612= a + 122b + v7
498= a + 95b + v8
530= a + 100b + v9
490= a + 88b + v10
Escrevendo estas equações na forma matricial:
19
487  1 95   v1 
510  1 84  v 
    2
480  1 102   v3 
     
625  1 135   v4 
490  1 92  a   v5 
  =    +  
555  1 89  b   v6 
612  1 122  v 
     7
 498  1 95   v8 
530  1 100  v 
     9
490  1 88  v10 
ou
Y =AX + V
Sendo que a, b e os 10 v´s são desconhecidos e não é possível conhece- los,

apenas podemos obter suas estimativas.
O sistema matematicamente tem incompatibilidades pois apresenta infinitas
soluções, não podendo ser calculado com uma única solução algebricamente,
podendo- se obter de cada duas equações separadas uma solução.
Pode- se estimar a e b é por meio do Método dos Quadrados Mínimos , o
qual consiste em minimizar a soma de quadrados dos desvios vi .
Como
vi = yi − yˆ i .
Sendo yi − yˆ i a diferença entre o valor observado e o estimado pela equação
de regressão para cada observação, procura- se, então, estimar a e b, de tal modo
que
∑(y i − yˆ i ) 2 = min (4.4)
Portanto,
- vi = a + bx i –yi
e,
v2 i = (a + bx i –yi )2
Os desvios de Y´s observados para a linha ajustada Yi − Yˆ , ou resíduos,

podem ser considerados como estimativas dos erros verdadeiros.
Para os erros verdadeiros assume- se importantes suposições:
1) Todos têm média igual a zero;
2) Todos têm a mesma variância σ2 e; (homogeneidade de variâncias)
3) Todos são não correlacionados;
A soma dos quadrados dos desvios será:

SQR = Σ( a + bx i –yi )2
20
Para tornar mínima esta soma, quando variam a e b, devemos igualar a zero
as derivadas parciais:
∂SQR ∂SQR
=0 e =0
∂a ∂b
Obtemos
∂SQR
= 2∑ ( a + bx i − y i )
∂a
∂SQR
= 2∑ ( a + bx i − y i ) x i
∂b
Σ ( a + bx i –yi ) = 0
Σ ( a + bx i –yi ) x i = 0
a e b são obtidos pelas das equações normais:
na + bΣx i = Σyi
aΣx i + bΣx 2 i = Σx i yi
que produzem
a=
( ∑ y i ) ( ∑ x i2 ) − ( ∑ x i )( ∑ x i y i )
(4.5)
n∑ x i 2 − ( ∑ x i ) 2
n ∑ x i y i − ( ∑ x i )( ∑ y i )
b= (4.6)
n∑ x i 2 − ( ∑ x i ) 2
A obtenção de a se dá mediante a divisão da equação

na + bΣx i = Σyi
por n
b∑ x i ∑ y i
a+ =
n n
∑ y i b∑ x i
a= −
n n
a = y − bx (4.7)
Da equação 4.7, pode- se tirar duas conclusões:

a) O ponto determinado pelas médias das variáveis ( x , y ) está contido na reta de
regressão;
b) As diferenças y − y , ou seja, os desvios acima e abaixo de Y podem ser
determinados por b( x − x )
Assim,
y − y = b( x − x )
y = y + b( x − x )
21
Partindo da equação:
y − y = b( x − x )
e sem alterar a igualdade, multiplicamos por ( x − x ) , seus dois membros:

( x − x ) ( y − y ) = b( x − x ) 2
esta equação se refere ao desvio de um determinado valor de Y em relação a média

Y , assim:
∑ ( x − x ) ( y − y) = b ∑ ( x − x )
2
∑ ( x − x ) ( y − y) soma de produtos
b= =
∑ (x − x)
2
soma de quadrados
dividindo - se o numerador e o denominador de b por n- 1, vê- se que
[ ∑ ( x − x ) ( y − y )]
b=
Cov ( X , Y )
= n −1
2
sX ∑ ( x − x ) 2
 
n −1
b é denominado coeficiente de regressão de Y em X;

podemos escrever a soma de quadrados de X da seguinte forma:
2
(∑ x)
∑ ( xi − x ) = ∑ x −
2 2
n
e a soma de produtos (numerador) pode ser desenvolvida:

∑ ( x − x ) ( y − y) = ∑ ( xy − xy − xy + xy)
= ∑ xy − y∑ x − x ∑ y + nxy
∑ x∑ y ∑ x∑ y n∑ x∑ y
= ∑ xy − − +
n n n2
∑ x∑ y
= ∑ xy −
n
= ∑ xy − nxy
então
∑ x∑ y
∑ xy − n
b=
(∑ x) 2
∑x 2
−
n
ou
b=
∑ xy − nxy
(∑ x ) 2
∑x − n2
22
Se dividirmos tanto o denominador como o numerador por n a fórmula de b
não ficará alterada.
Porém o denominador passará a indicar a variância de X pois:
σ 2
=
∑(X − X ) 2
X
N
e o numerador se constituirá o que se denomina de covariância, isto é, a

variabilidade média das variáveis X e Y analisadas simultaneamente:
Cov X ,Y = σ XY =
∑ ( X − X )(Y − Y )
N
Cov X ,Y
b ==
σ X2
A variância de X é estimada por s 2X = ∑(x − x) 2
n −1
E a covariância de x e y é estimada por Cov X ,Y = ∑ ( x − x )( y − y )
n −1
b ==
Cov X ,Y
=
∑ xy − nxy
s X2 ( n − 1) s x2
Quando se constata que o coeficiente de regressão de uma variável sobre outra

não difere significativamente de zero, significa que os dois caracteres em estudo
não estão relacionados.
Quando b difere significativamente de zero, seja b<0 ou b>0, existe
associação entre os dois caracteres quantitativos.
Quando b>0 as variáveis em estudo estão correlacionadas positivamente; o
valor de uma variável aumentará com o aumento da outra e diminuirá com a
diminuição da outra.
Quando b<0, as variáveis estão correlacionadas negativamente, portanto
variam em sentidos opostos.
Estes últimos conceitos podem ser visualizados no exemplo abaixo:
Y 900 850 850 860 870 880 890 1000

X 132 122 112 125 98 114 120 152
x = 121,875 y = 887 ,5
b=
∑ xy − nxy = 869580 − 8 x(121,875 )(887 ,5) = 2,4346
(∑ x ) 2 (975 ) 2
∑x − n
2
120581 −
8
a = y − bx = 887,5 - 2,4346 (121,875) = 590,7866
Portanto:
y = 590,7866 + 2,4346 x
23
4.2 Validação de uma regressão linear simples
4.2.1 Coeficiente de correlação (r)
O coeficiente de correlação traduz numericamente o quanto as variaveis estão

relacionadas entre si. O coeficiente de correlação está compreendido no intervalo:
- 1 ≤ r ≤ +1
Quando o sinal de r é positivo as variaveis variam no mesmo sentido, ou seja

um incremento positivo da variavel explicativa implica num incremento positivo na
variavel explicada, já o sinal negativo implica numa variação oposta. Se r = 0,
conclui - se que não existe correlação entre as variaveis.
De forma pratica pode- se interpretar o coeficiente de correlação conforme a
tabela a seguir (IMAPE,1998):
r= 0 correlação nula
0≤r≤ 0,30 correlação fraca
0,30 ≤ r ≤ 0,60 correlação média
0,60 ≤ r ≤ 0,90 correlação forte
0,90 ≤ r ≤ 0,99 correlação fortissima
r =1 correlação perfeita
O valor de r poderá ser calculado pela expressão:
Cov xy
r= (4.8)
σ x2σ y2
A Covxy é a covariância de X e Y pode ser obtida pela expressão:
n n
n ∑ xi ∑ y i
cov xy = ∑ xi yi − i =1 i =1 (4.9)
i =1 n
Já, σ x é a variância de X , pode ser obtida da expressão:

2
n
( ∑ xi ) 2
σ x2 = ∑ xi2 − i =1 (4.10)
i =1 n
e σ y é a variância de y.
2
n
(∑ y i ) 2
σ y2 = ∑ y i2 − i =1 (4.11)
i =1 n
O coeficiente de correlação é um parâmetro que possibilita a escolha do

melhor modelo de ajuste, mas não é determinante no estudo, pois não permite
24
conclusões definitivas sobre o modelo utilizado. Outras analises serão necessárias,
para validar os modelos adotados.
4.2.2 Coeficiente de Determinação
O coeficiente de determinação traduz numericamente o percentual do valor

de avaliação que está sendo explicado pelo modelo de regressão ajustado. Este
coeficiente varia no intervalo [0,1]. Pode ser obtido pelo coeficiente de regressão
elevado ao quadrado.
0 ≤ r 2 ≤ +1
Outra expressão que fornece o valor do coeficiente de determinação é:
r2 =
∑ ( yˆ − y ) (4.12)
∑ ( y − y)
Onde: ŷ é a variável estimada
y é a média aritmética de y a variável explicada
4.2.3 Erro padrão da estimativa
Ao ajustar uma reta, espera- se que ela explique o grupo de valores

amostrados.
Embora a reta de regressão tenha sido obtida minimizando a soma dos
quadrados dos desvios, sempre haverá uma variabilidade dos dados ao redor da
reta, exceto se os dados fizerem parte da própria reta de regressão.
O desvio padrão dos dados ao redor da reta de regressão é denominado erro
padrão da estimativa (Se) cuja medida é obtida da variância com (n- 2) graus de
liberdade definida com a fórmula:
n
∑(y i − yˆ i )
(4.13)
Se = i =1
n−2
O conceito do erro padrão da estimativa é equivalente ao do desvio padrão

que mede a variabilidade dos valores da amostra ao redor da média aritmética
desses valores.
4.2.4 Análise de variância
O processo de avaliação por análise de regressão não se encerra com o

cálculo do valor estimado de Y, obtido do modelo de melhor ajuste, além dos
coeficientes de correlação e determinação. Outras analises deverão ser efetivadas
para aferir o modelo, tendo em vista o objetivo final das avaliações que é a definição
do valor de mercado.
A análise de variância objetiva a verificação da existência da equação de
regressão, estudando a probabilidade do coeficiente de regressão b ser
estatisticamente nulo, quando não haveria regressão.
Utiliza- se neste caso o teste estatístico com a distribuição de Fischer-
Snedecor (tabelada nos manuais de estatística). Calcula- se o coeficiente F da
regressão pela expressão:
25
Fcal =
∑ ( yˆ − y ) 2
×
n − k −1 (4.14)
∑ ( y − yˆ ) 2
k
Onde k é o número de variáveis independentes, na regressão linear simples
k=1
n é o número de dados da amostra
A hipótese nula neste caso é a de que existe regressão de y em x. Na tabela
de Fischer- Snedecor o valor de Ftab para um determinado nível de significância é
obtido.
Se Fcal > Ftab aceita- se a hipótese nula, de que há regressão pois b≠0, com a
significância correspondente ao valor tabelado.
Se Fcal < Ftab rejeita- se a hipótese de que há correlação.
A partir deste teste pode- se exprimir a confiabilidade do modelo, que será
fornecida pela expressão:
c = 100% - α
(4.15)
onde α é o nível de significância adotado.
4.2.5 Teste de hipótese para o regressor b
O regressor b é determinante para a equação de regressão, pois se b for igual

a zero implica que o valor de Y está sendo determinado por uma constante “a”, que
é o intercepto da reta de regressão. Na prática significa que a variável X não é
importante na formação do valor de Y e portanto, não há regressão de Y em X.
A hipótese básica neste caso é que b≠0 (o coeficiente b é diferente de zero),
para isso utiliza- se a distribuição de Student (tabelada nos livros de estatística).
Calcula- se o valor de T para o modelo de melhor ajuste, pela expressão:
b
Tcalc = (4.16)
σb
Onde σ b é o desvio padrão de b, dado pela expressão:
σ
σb =
σx
Onde:
n
∑ ( y − yˆ ) 2
σ= i =1
n−2
e,
n
n
(∑ xi ) 2
σx = ∑x
i =1
2
i − i =1
n
O Tcalc deverá ser comparado com o T tab a um determinado nível de
significância; se o Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de
incerteza do valor tabelado. Por outro lado se T cal < Ttab não se pode afirmar que b≠
0.
4.2.6 Intervalo de confiança para b
26
O intervalo de confiança é construído em torno da estimativa por ponto, de
modo que esse intervalo tenha uma probabilidade conhecida de conter o verdadeiro
valor do parâmetro. Em engenharia de avaliações este intervalo muitas vezes é
denominado de campo de arbítrio do Engenheiro de Avaliações. É dentro deste
intervalo que o valor do bem avaliando deve ser arbitrado. Os limites inferior (Li ) e
superior (Ls)do intervalo são dados pelas expressões:
Li = b − Tα / 2 ( n − k −1)σ b
e, (4.17)
Ls = b + Tα / 2 ( n − k −1)σ b
4.3 Regressões simples não lineares
Em muitos casos a relação entre a variável explicativa e a explicada da- se na

forma não linear. Algumas destas relações podem, por transformação de variaveis
passar a ter o formato linear.
4.3.1 Função logaritmica

A função logartimica pode ser observada na equação:
e yˆ = e a x b
Sendo e a base dos logaritmos neperianos.

A transformada linear da função logarítmica resulta em:
yˆ = a + bLn ( x)
4.3.2 Função exponencial

A função exponencial é dada pela equação:
yˆ = a + b x
A transformada linear da função exponencial resulta em:

Ln ( yˆ ) = Ln ( a) + xLn (b)
4.3.3 Função potencial

A função potencial é dada pela equação:
yˆ = ax b
A transformada linear da função exponencial resulta em:

Ln ( yˆ ) = Ln ( a) + bLn ( x)
5. EXERCICIO DE REGRESSÃO SIMPLES
27
Um apartamento com área de 120 m 2 deve ser avaliado. A amostra coletada
obteve informações sobre 20 apartamentos localizados no mesmo bairro, com o
mesmo padrão de acabamento, com mesmo número de suites 01, enfim todos
semelhantes e localizados em locais com mesmo tipo de infra- estrutura urbana.
A área é uma variavel importante formadora de valor, deve- se entretanto,
verificar que as demais variaveis poderiam exercer influência no valor de mercado.
Neste caso, simplificadamente usar- se- á a variavel área como única.
Área (m²) Valor (R$)

Nº
X Y
264, 195.000,
1 00 00
54, 45.000,
2 00 00
69, 55.000,
3 00 00
49, 27.000,
4 00 00
78, 70.000,
5 00 00
32, 30.000,
6 62 00
40, 34.000,
7 00 00
35, 37.900,
8 00 00
41, 33.000,
9 00 00
38, 29.000,
10 00 00
78, 58.000,
11 18 00
66, 75.000,
12 00 00
70, 55.000,
13 00 00
81, 117.500,
14 17 00
81, 117.500,
15 17 00
67, 70.000,
16 31 00
216, 235.000,
17 56 00
30, 13.000,
18 00 00
229, 420.000,
19 00 00
110, 90.000,
20 00 00
Som 1.730, 1.806.900,
a 01 00
Para efetuar a regressão nessecitam- se alguns calculos preliminares, constantes na

tabela a seguir:
a) Avaliação utilizando Regressão linear
yˆ i = a + bxi
a.1) Cálculo de b
28
∑ x∑ y
∑ xy − n
b=
(∑ x ) 2
∑x 2
−
n
b = 1227,35

Nº
X Y X.Y X² Y²
264, 195.000, 51.480.000, 69.696,
1 00 00 00 00 38.025.000.000,00
54, 45.000, 2.430.000, 2.916,
2 00 00 00 00 2.025.000.000,00
69, 55.000, 3.795.000, 4.761,
3 00 00 00 00 3.025.000.000,00
49, 27.000, 1.323.000, 2.401,
4 00 00 00 00 729.000.000,00
78, 70.000, 5.460.000, 6.084,
5 00 00 00 00 4.900.000.000,00
32, 30.000, 978.600, 1.064,
6 62 00 00 06 900.000.000,00
40, 34.000, 1.360.000, 1.600,
7 00 00 00 00 1.156.000.000,00
35, 37.900, 1.326.500, 1.225,
8 00 00 00 00 1.436.410.000,00
41, 33.000, 1.353.000, 1.681,
9 00 00 00 00 1.089.000.000,00
38, 29.000, 1.102.000, 1.444,
10 00 00 00 00 841.000.000,00
78, 58.000, 4.534.440, 6.112,
11 18 00 00 11 3.364.000.000,00
66, 75.000, 4.950.000, 4.356,
12 00 00 00 00 5.625.000.000,00
70, 55.000, 3.850.000, 4.900,
13 00 00 00 00 3.025.000.000,00
81, 117.500, 9.537.475, 6.588,
14 17 00 00 57 13.806.250.000,00
81, 117.500, 9.537.475, 6.588,
15 17 00 00 57 13.806.250.000,00
67, 70.000, 4.711.700, 4.530,
16 31 00 00 64 4.900.000.000,00
216, 235.000, 50.891.600, 46.898,
17 56 00 00 23 55.225.000.000,00
30, 13.000, 390.000, 900,
18 00 00 00 00 169.000.000,00
229, 420.000, 96.180.000, 52.441,
19 00 00 00 00 176.400.000.000,00
110, 90.000, 9.900.000, 12.100,
20 00 00 00 00 8.100.000.000,00
1.730, 1.806.900, 265.090.790, 238.287,
Soma 01 00 00 18 338.546.910.000,00
Médi 86, 90.345,

a 50 00
a.2) cálculo de a
a = y − bx
a = - 15821,56
a.3) Modelo linear (linha reta)
29
Y = - 15821,56 +1227,35X
a.4) Cálculo do coeficiente de correlação
Cov xy
r=
σ x2σ y2
r = 0,87
a.5) Cálculo do coeficiente de determinação
r 2 = 0,76
a.6) Análise de variância
Fcal =
∑ ( yˆ − y ) 2
×
n − k −1
∑ ( y − yˆ ) 2
k
Mais alguns cálculos auxiliares são necessários:

Nº
X Y Y^ Y^- Ymed (Y^- Ymed)² (Y- Y^)^2
308.199, 217.854, 47.460.522.911,0 12.814.095.488,
1 264,00 195.000,00 36 36 8 96
50.455, - 39.889, 1.591.176.424,9 29.761.903,
2 54,00 45.000,00 45 55 0 83
68.865, - 21.479, 461.359.178,0 192.258.379,
3 69,00 55.000,00 73 27 6 14
44.318, - 46.026, 299.936.929,
4 49,00 27.000,00 69 31 2.118.421.460,65 84
79.911, - 10.433, 98.245.653,
5 78,00 70.000,00 89 11 108.849.689,42 48
24.214, - 66.130, 33.470.136,
6 32,62 30.000,00 66 34 4.373.221.608,22 14
33.272, - 57.072, 529.227,
7 40,00 34.000,00 52 48 3.257.268.026,34 83
27.135, - 63.209, 115.868.869,
8 35,00 37.900,00 76 24 3.995.408.063,60 97
34.499, - 55.845, 2.249.614,
9 41,00 33.000,00 87 13 3.118.678.376,10 55
30.817, - 59.527, 3.543.485.684,0 3.304.453,
10 38,00 29.000,00 82 18 4 51
80.132, - 10.212, 104.288.663,2 489.861.628,
11 78,18 58.000,00 82 18 3 23
65.183, - 25.161, 633.092.484,1 96.360.317,
12 66,00 75.000,00 67 33 8 82
70.093, - 20.251, 410.140.314,1 227.801.026,
13 70,00 55.000,00 08 92 5 27
83.802, - 6.542, 42.802.993,8 1.135.514.746,
14 81,17 117.500,00 60 40 0 35
83.802, - 6.542, 42.802.993,8 1.135.514.746,
15 81,17 117.500,00 60 40 0 35
66.791, - 23.553, 554.767.270,6 10.294.459,
16 67,31 70.000,00 50 50 7 77
249.973, 159.628, 25.481.348.698,8 224.214.208,
17 216,56 235.000,00 78 78 1 92
20.999, - 69.346, 4.808.867.744,2 63.983.997,
18 30,00 13.000,00 00 00 5 74
265.242, 174.897, 30.588.975.513, 23.950.025.375,
19 229,00 420.000,00 04 04 94 34
30
119.187, 28.842, 831.870.061, 851.890.175,
20 110,00 90.000,00 16 16 46 28
Som 133.527.348.160, 41.775.181.339,
a 1.730,01 1.806.900,00 68 32
Fcal = 57,534
Da tabela de Fischer- Snedecor retira- se Ftab 5,32 aceita- se que há regressão de y

em x.
b) Avaliação utilizando regressão logaritmica linearizada
Neste caso, a expressão utilizada já linearizada será:
yˆ = a + bLn ( x)
Para efetuar os cálculos na coluna área deverá ser colocado o logaritmo neperiano
da área.
Nº Área (m²) Valor (R$) X.Y X² Y²

Ln(X) Y
5, 195.000, 1.087.310, 31, 38.025.000.000,
1 58 00 08 09 00
3, 45.000, 179.504, 15, 2.025.000.000,
2 99 00 28 91 00
4, 55.000, 232.875, 17, 3.025.000.000,
3 23 00 86 93 00
3, 27.000, 105.079, 15, 729.000.000,
4 89 00 15 15 00
4, 70.000, 304.969, 18, 4.900.000.000,
5 36 00 62 98 00
3, 30.000, 104.547, 12, 900.000.000,
6 48 00 77 14 00
3, 34.000, 125.421, 13, 1.156.000.000,
7 69 00 90 61 00
3, 37.900, 134.747, 12, 1.436.410.000,
8 56 00 69 64 00
3, 33.000, 122.547, 13, 1.089.000.000,
9 71 00 88 79 00
3, 29.000, 105.490, 13, 841.000.000,
10 64 00 00 23 00
11 4, 58.000, 252.822, 19, 3.364.000.000,
31
36 00 80 00 00
4, 75.000, 314.224, 17, 5.625.000.000,
12 19 00 11 55 00
4, 55.000, 233.667, 18, 3.025.000.000,
13 25 00 24 05 00
4, 117.500, 516.594, 19, 13.806.250.000,
14 40 00 12 33 00
4, 117.500, 516.594, 19, 13.806.250.000,
15 40 00 12 33 00
4, 70.000, 294.651, 17, 4.900.000.000,
16 21 00 62 72 00
5, 235.000, 1.263.798, 28, 55.225.000.000,
17 38 00 90 92 00
3, 13.000, 44.215, 11, 169.000.000,
18 40 00 57 57 00
5, 420.000, 2.282.163, 29, 176.400.000.000,
19 43 00 24 53 00
4, 90.000, 423.043, 22, 8.100.000.000,
20 70 00 23 09 00
84, 1.806.900, 8.644.269, 367, 338.546.910.000,
Soma 84 00 16 56 00
4, 90.345,
Média 24 00
b.1) Cálculo de b
b = 127.728,93
b.2) Cálculo de a
a = - 451.485,68
b.3) Modelo linear da função logarítmica
Y = - 451.485,68 +127.728,93 ln(X)
b.4) Cálculo do coeficiente de correlação
r = 0,84
b.5) Cálculo do coeficiente de determinação
r 2 = 0,71
b.6) Análise de variância
Fcal = 44,481

em x.
c) Avaliação utilizando regressão da função exponencial linearizada
ln( yˆ ) = ln( a) + ln( b)( x)
32
Para efetuar os cálculos na coluna valor deverá ser colocado o logaritmo
neperiano do valor.

X Y
264, 12, 3.215, 69.696, 148,
1 00 18 72 00 37
54, 10, 578, 2.916, 114,
2 00 71 58 00 80
69, 10, 753, 4.761, 119,
3 00 92 14 00 14
49, 10, 499, 2.401, 104,
4 00 20 98 00 11
78, 11, 870, 6.084, 124,
5 00 16 19 00 46
32, 10, 336, 1.064, 106,
6 62 31 28 06 27
40, 10, 417, 1.600, 108,
7 00 43 36 00 87
35, 10, 368, 1.225, 111,
8 00 54 99 00 15
41, 10, 426, 1.681, 108,
9 00 40 57 00 25
38, 10, 390, 1.444, 105,
10 00 28 45 00 58
78, 10, 857, 6.112, 120,
11 18 97 49 11 30
66, 11, 740, 4.356, 126,
12 00 23 87 00 01
70, 10, 764, 4.900, 119,
13 00 92 06 00 14
81, 11, 947, 6.588, 136,
14 17 67 59 57 29
81, 11, 947, 6.588, 136,
15 17 67 59 57 29
67, 11, 750, 4.530, 124,
16 31 16 93 64 46
216, 12, 2.678, 46.898, 152,
17 56 37 27 23 95
30, 9, 284, 900, 89,
18 00 47 18 00 73
229, 12, 2.965, 52.441, 167,
19 00 95 09 00 65
110, 11, 1.254, 12.100, 130,
20 00 41 83 00 13
1.730, 220, 20.048, 238.287, 2.453,
Soma 01 94 18 18 95
86, 11,
Média 50 05
c.1) Cálculo de ln b
ln b = 0,01
c.2) Cálculo de a
ln a = 10,13
c.3) Modelo linear da função logaritmica

ln Y = 10,13 +0,01 (X)
c.4) Cálculo do coeficiente de correlação
33
r = 0,87
c.5) Cálculo do coeficiente de determinação
r 2 = 0,75
c.6) Análise de variância
Fcal = 54,830

em x.
d) Avaliação utilizando regressão da função potencial linearizada
Ln ( yˆ ) = Ln ( a) + bLn ( x)
Para efetuar os cálculos na coluna área deverá ser colocado o valor do logaritmo
neperiano da área e na coluna do valor deverá ser colocado o logaritmo neperiano
do valor.
d.1) Cálculo de b
b = 1,22
d.2) Cálculo de a
ln a = 5,86
d.3) Modelo linear da função logaritmica

ln Y = 5,86 +1,22 ln(X)
d.4) Cálculo do coeficiente de correlação
r = 0,93
d.5) Cálculo do coeficiente de determinação
r 2 = 0,87
34
ln(X) ln(Y)
5, 12, 67, 31, 148,
1 58 18 92 09 37
3, 10, 42, 15, 114,
2 99 71 74 91 80
4, 10, 46, 17, 119,
3 23 92 22 93 14
3, 10, 39, 15, 104,
4 89 20 71 15 11
4, 11, 48, 18, 124,
5 36 16 60 98 46
3, 10, 35, 12, 106,
6 48 31 93 14 27
3, 10, 38, 13, 108,
7 69 43 49 61 87
3, 10, 37, 12, 111,
8 56 54 48 64 15
3, 10, 38, 13, 108,
9 71 40 64 79 25
3, 10, 37, 13, 105,
10 64 28 38 23 58
4, 10, 47, 19, 120,
11 36 97 81 00 30
4, 11, 47, 17, 126,
12 19 23 03 55 01
4, 10, 46, 18, 119,
13 25 92 37 05 14
4, 11, 51, 19, 136,
14 40 67 33 33 29
4, 11, 51, 19, 136,
15 40 67 33 33 29
4, 11, 46, 17, 124,
16 21 16 96 72 46
5, 12, 66, 28, 152,
17 38 37 51 92 95
3, 9, 32, 11, 89,
18 40 47 22 57 73
5, 12, 70, 29, 167,
19 43 95 36 53 65
4, 11, 53, 22, 130,
20 70 41 62 09 13
84, 220, 946, 367, 2.453,
Soma 84 94 63 56 95
4, 11,
Média 24 05
d.6) Análise de variância
Fcal = 124,239

em x.
Após os cálculos adota- se o modelo potencial, porque apresenta o maior

valor do coeficiente de correlação, e de análise de variância (Fcal )
Deve- se efetuar na seqüência os outros testes estatísticos para validação do

modelo.
d.7) Teste de hipótese para o regressor b
35
Utilizando- se a expressão (4.15), com nível de confiança de 95%,
obtém- se
Tcal = 6,15
Da tabela da distribuição t de Student obtém - se:
Ttab = 2,093
Como Tcal > Ttab aceita- se a hipótese básica de que b≠0 a um nível de incerteza de
5%.
d.8) Intervalo de confiança para o regressor b.
Li = b − Tα / 2 ( n − k −1)σ b
e,
Ls = b + Tα / 2 ( n − k −1)σ b
Li = 1,22 – 2,101*0,20 = 0,7998
Ls = 1,22 + 2,101*0,20 = 1,6402
d.9) Intervalo de y
Com o modelo linear adotado, calcula- se o valor do apartamento de 120 m 2 .

ln Y = 5,86 +1,22 ln(X)
lnY = 5,86 + 1,22 ln (x)
Li = 122.339,12 + 0,7998* 120

Li = 122.435,09
Ls = 122.339,12 + 1,6402* 120
Ls = 122.535,94
Portanto, com 95% de probabilidade o preço do apartamento estaria contido no

intervalo delimitado pelo limite superior e o inferior acima.
36
6. REGRESSÕES LINEARES MULTIPLAS APLICADAS A AVALIAÇÕES DE BENS
A regressão pode ser definida como sendo o estabelecimento de uma relação

funcional entre duas ou mais variáveis envolvidas para a descrição de um fenômeno.
A variável Y é aleatória e pode ser descrita matematicamente pela expressão
[Marques, 2000]:
Y = f(X) + ε (6.1)
onde:
X é a variável independente ou variável explicativa;
Y é a variável dependente ou variável resposta;
ε é a componente aleatória da variação de Y;
f é a função de regressão.
Normalmente, X é uma variável que pode ser controlada pelo pesquisador,

enquanto Y não é passível de controle. A análise de um gráfico de dispersão pode
sugerir uma relação funcional entre as variáveis, como por exemplo, uma reta, uma
exponencial, etc. Surge neste caso o modelo estatístico denominado de regressão
linear simples. Uma generalização dessa regressão é conhecida como regressão
múltipla. O modelo estatístico utilizado neste caso será dado por:
yi = a + b 1 x 1 + b 2 x 2 +... + b u x u + vi (6.2)
onde, a, b 1 , b 2 ... b u são denominados de parâmetros da regressão múltipla, v

substitui ε, e será denominado neste trabalho de resíduo. Cabe aqui alguma
consideração estatística sobre este modelo, o qual pressupõe que a variável yi é
aleatória, que a esperança matemática dos resíduos é nula, ou seja, que a média
dos resíduos é nula, que a variância de v i é constante e igual a σ2 (condição de
homocedasticidade dos resíduos), que os erros são independentes entre si e que os
mesmos tenham distribuição normal. Estatisticamente também se supõe que v i é a
componente aleatória da variação de Y, no entanto, devido a problemas práticos,
alguns resíduos de erros sistemáticos e erros grosseiros, que interferem no
processo, fazem com que vi contenha também parte destes. Por este motivo, pode-
se afirmar que o resíduo (v) compõe- se de três componentes: uma aleatória, uma
sistemática e uma grosseira.
No problema proposto neste trabalho, y representa as observações (medidas)
dos valores de imóveis em moeda corrente, x i representa as variáveis, tais como:
frente do lote, área, etc, formando um sistema de n equações denominado de
equações de observações, cujas u incógnitas a, b 1 , b 2 , ... b u , são objeto de
37
determinação. O problema geralmente será resolvido para um número de
observações maior que o número de incógnitas. De forma matricial, o sistema de
equações de observação pode ser expresso como [Gemael, 1994]:
n Au u X1 - n L1 = n V1 (6.3)
onde, n Au é a matriz dos coeficientes das incógnitas, definida utilizando- se as

derivadas parciais da função em relação às incógnitas e que pode ser escrita como:
∂f/ ∂a ∂f/ ∂b 1 ∂f/ ∂b 2 ... ∂f/ ∂b u

1 x1 x2 xu
n Au = 1 x1 x2 xu
............................................................
1 x1 x2 xu
u X1 o vetor das incógnitas é dado por:
1 Xu T = a b1 b 2 ... b u
o vetor u L1 das variáveis respostas (observações) é dado por:
1 n L T
= y1 y2 ... yn
o vetor n V1 é o vetor dos resíduos estimados obtido pela expressão:
n V1 = n Au u X1 - n L1
O estimador dos parâmetros, por mínimos quadrados, será dado pela

expressão:
1 Xu = (u An T n Pn n Au )- 1 u An T n Pn n L1 ,
ou, reduzindo a simbologia,
1 Xu = u Nn - 1 u U1 (6.4)
sendo P a matriz dos pesos, que na maioria dos casos de avaliações coincide com a
matriz identidade (I), pois considera- se que as observações são provenientes de
uma mesma população. No entanto, de forma generalizada tem- se:
n Pn = σo 2 n ΣLb n
-1
sendo, σo 2 a variância da unidad e de peso a priori para a qual arbitra - se o

valor da unidade. O valor da variância da unidade de peso a posteriori , pode
ser calculado pela expressão:
38
1Vn T n Pn n V1
σ∗o 2 =  (6.5)
n –u
A matriz variância - covariância dos parâmet r os ajustad os será dada

por:
n ΣXa n = σ∗o 2 u Nu –1
6.1. Testes estatísticos como diretrizes em análise de ajustamento de

regressões múltiplas
Ao se analisar o ajustamento onde aplicam- se regressões múltiplas às

avaliações, utilizam - se uma série de testes estatísticos com os mais variados
objetivos, principalmente no que concerne à validação do modelo adotado. Esta
questão é estudada através de testes de hipóteses, sendo que a NBR 14653- 2 –
Avaliação de bens - Parte 2 – Imóveis Urbanos, (ABNT,2004) estabelece três níveis
de significância (α): grau I (10%), grau II (5%) e grau III (1%); os quais são utilizados
em todos os trabalhos de avaliação. Os principais testes efetivados são os
seguintes:
a) Teste de qui - quadrado na verificação da bondade do ajustamento
É usado na verificação do ajustamento, utilizando como parâmetro para este

tipo de aplicação um nível de significância (α) que tem como hipótese básica:
(H0 ) σo 2 = σ∗o 2 , ou seja, a variância de unidade de peso, a priori , é igual
estatisticamente à variância da unidade de peso a posteriori , no nível de
significância que foi pré- definido, adotando- se ainda, como hipótese alternativa
(H1 ) σo 2 ≠ σ∗o 2 . O valor de qui- quadrado calculado (χ2 c ) é dado pela expressão:
σ∗o 2 (n- u)
χ2 c =  (6.7)
σo 2
A distribuição qui- quadrado χ2 , em função dos graus de liberdade (n- u) e do

nível de significância (α) fornece os valores referentes a:
χ2 n- u, 0,5 α e χ2 n- u, 1- 0,5 α
39
A hipótese H 0 é aceitável se:
χ2 n- u, 0,5 α < χ2 c < χ2 n- u, 1- 0,5 α (6.8)
b) Coeficiente de correlação linear múltiplo (R) e coeficiente de determinação

(R2 )
O coeficiente de correlação traduz numericamente o quanto as variáveis estão

linearmente relacionadas entre si. É fornecido matricialmente pela raiz quadrada da
expressão:
Xu T u An T n Pn n Z1
1
R = 2
 (6.9)
1 Zn n Z1
T
com
n Z1 = n L1 - n L* 1
todos os elementos do vetor n L* 1 são iguais e obtidos pela média aritmética dos n
valores de y.
O valor de R encontra- se no intervalo:
-1 ≤ R≤ 1
já o coeficiente de determinação indica numericamente o percentual do valor de

avaliações que esta sendo explicitado pelo modelo, encontra- se no intervalo:
0≤R ≤1
c) Teste de existência da regressão
Consiste em se estudar a probabilidade dos parâmetros de regressão a, b 1 ,

b 2 ... b u serem iguais a zero ao mesmo tempo, neste caso não existe regressão. O
teste é efetivado através da distribuição Fischer- Snedecor. O coeficiente Fcal
calculado é obtido pela expressão matricial:
(1 Xu T u An T n Pn n Z1 )(n- k- 1)
Fcal =  (6.10)
( 1 Zn T n Z1 - 1 Xu T u An T n Pn n Z1 ) k
com
k=u - 1
A hipótese básica é aceita, ou seja, de que haja regressão de y em x 1 , x 2 , etc.

com nível de significância (α) se:
Fcal >F tab
40
e) Teste da significância dos regressores
Utiliza- se neste caso a distribuição T de Student (unicaudal), tendo como

hipótese básica que os regressores são diferente de zero a um nível de significância
α. Os valores calculados para o modelo de melhor ajuste são dados pela expressão:
bi
Tbi = 
Tipo Nome do erro Magnitude
1 “blunders” m > 170 σ
2 “blunders” m ≤ 170 σ
3 “outliers” 3σ<m < 100 σ
σbi
com base nos valores obtidos da distribuição de Student (T) com entradas 2α e
graus de liberdade n- k- 1, aceita- se a hipótese básica que cada um dos coeficientes
b i seja diferente de zero se:
Tbi >T
e) Teste “data snooping ” – Barda
O teste de Barda pode ser definido como a investigação em relação à

observação na qual um erro grosseiro foi cometido [Barda, 1968], está baseado no
teste estatístico de resíduos padronizados após o ajustamento por mínimos
quadrados [Moraes, 1997]. A detecção de erros grosseiros foi utilizada na
Fotogrametria por Mitishita [1980], que classificou os tipos de erros grosseiros:
Para que se possa aplicar o teste de Barda devem ser observadas as seguintes
condições:
- deve ser aplicado após o ajustamento, portanto, os cálculos devem estar
rigorosamente corretos;
- os pesos devem ser escolhidos apropriadamente para evitar- se a distribuição dos
erros grosseiros nos resíduos;
- o nível de confiança adotado deve ser o mesmo adotado no teste de qui- quadrado
para verificação da bondade do ajustamento.
Calcula- se a matriz de redundância ou dos coeficientes de peso dos
resíduos dada pela expressão [Moraes, 1997]:
n Qvn = n In - n Au u Nn - 1 u An T n Pn
(6.11)
O número de redundância é obtido da diagonal principal da matriz fornecida

pelo resultado do produto [Moraes, 1997];
41
r i = [ n Qvn n Pn ] ii (6.12)
Os resíduos padronizados serão dados pela expressão:
vi √p i
w i = 
σ0 √r i
A hipótese básica é que não há nenhum erro grosseiro na observação e é

rejeitada se:
wi > K
onde, K é o valor crítico de acordo com um nível de confiança específico conforme

a tabela [Moraes, 1997], onde a probabilidade α de erro tipo I (rejeição de Ho
quando verdadeira) e a probabilidade β de erro tipo II (aceitação de Ho quando falsa)
sejam tão pequenas quanto possível:
1- α K 1- β
99,9% 3,29 76%
99,7% 3,00 84%
99,0% 2,56 93%
95,0% 1,96 98%
f) Teste de Durbin - Watson
Existe autocorrelação ou correlação serial quando os termos de resíduos são

correlacionados com os valores anteriores ou posteriores da mesma série. A má
especificação do modelo de regressão, em função de resíduos na forma do modelo
ou por exclusão de variáveis independentes importantes para a análise é uma das
causas da autocorrelação. Isto ocorre principalmente em aplicações envolvendo
séries temporais [ Johnston, 1977].
A autocorrelação pode ser verificada pela denominada estatística de Durbin-
Watson [IMAPE, 1998], onde a hipótese básica é a existência de autocorrelação entre
resíduos, que pode ser calculada pela expressão:
Σ[v(i)- v(i- 1)] 2
dw = —————— (6.13)
1 Vn T n Pn n V1
Da estatística de Durbin- Watson para o nível de confiança α com v =n - k- 1,

obtém- se du que é o limite superior de variação e di, o limite inferior, assim: se
dw> du a hipótese básica é aceita, se dw<di é rejeitada e se ocorrer que di<dw <du
o teste é inconclusivo.
g) Teste de Kolmogorov - Smirnov (normalidade dos resíduos)
42
A condição de normalidade dos resíduos não é necessária para a obtenção
dos estimadores pelo método dos mínimos quadrados, mas sim para a definição de
intervalos de confiança e testes de significância. A falta de normalidade é uma
indicação de que os estimadores são não tendenciosos.
Antes de se aplicar um teste, compara- se a distribuição dos resíduos obtidos
com a distribuição normal. Para se efetuar esta comparação deve- se homogeneizar
os resíduos calculados dividindo - os pelo desvio padrão obtido a posteriori
(resultado positivo da raiz quadrada da variância a posteriori ). A comparação das
distribuições nos permite analisar se os resíduos obtidos apresentam ou não uma
distribuição aproximada da curva normal, atestando ou não a hipótese de
normalidade dos resíduos, que pode ser considerada como uma verificação ou
inspeção visual subjetiva da normalidade.
O teste de Kolmogorov- Smirnov avalia se duas amostras tem distribuições
semelhantes, ou melhor dizendo, se foram extraídas de uma mesma população. Se
apresentarem grandes diferenças provavelmente estas não se devem ao acaso. É um
teste que detecta diferenças em relação à tendência central, dispersão e simetria.
Para se aplicar o teste deve- se ordenar as amostras, construir as
distribuições de freqüências acumuladas nos intervalos de classe definidos, calcular
as diferenças entre estas freqüências (da primeira menos a da segunda amostra),
escolhendo - se a maior diferença em valor absoluto (d máx ) que será comparada com
um valor tabelado (d crítico ). A hipótese básica do teste é que se d máx ≥ d crítico rejeita- se
a igualdade das amostras.
Para maiores detalhes sobre o teste de Kolmogorov- Smirnov sugere- se
Bunchaft (1997).
g) Análise gráfica dos resíduos
Ao se colocar em um gráfico os resíduos e as variáveis explicativas é possível

a verificação da existência de uma multi - colinearidade, ou seja, uma relação exata
entre as variáveis, se o coeficiente de correlação apresenta- se muito próximo de
um. Se o gráfico demonstrar que os resíduos não estão alinhados então a correlação
é meramente casual e os resíduos não mostram nenhuma tendência.
40
20
Resíduos
0
-20100 120 140 160 180 200
-40
Variável X 1
Ao se analisar graficamente as distribuições (resíduos versus valor estimado)

verifica- se a existência de homocedasticidade, ou seja, a hipótese de variância
constante, que é aceita quando não há nenhuma tendência dos resíduos em relação
ao valor estimado, neste caso denominado de hetereocedasticidade.
0,6
0,4
0,2
0
-0,2
-0,4
94 96 98 100 102 104 106 108 43
Os resíduos mostrados no eixo y e valor estimado no eixo dos x, não
demonstra alinhamento, tratando- se portanto de hetereocedasticidade.
7. EXERCICIO DE REGRESSÃO LINEAR MULTIPLA
No ano de 1995, uma construtora de Curitiba, utilizando- se de legislação

municipal referente a aquisição de potencial construtivo, aprovou um projeto para
construção de um edifício residencial no centro da cidade, com cinco pavimentos,
em uma área de zoneamento ZR- 3, a qual permite a construção de, no máximo,
dois pavimentos.
Com o desenvolvimento da obra, percebeu- se que a mesma influenciaria
negativamente na paisagem urbana, principalmente porque inviabilizaria a visitação
pública de turistas a um mirante de observação da Cidade.
O imóvel foi então desapropriado com base no Código de Posturas de
Curitiba e seu valor, para fins de desapropriação, utilizando- se o método
comparativo com dados de mercado [Lima, 2001].
O imóvel desapropriado possuía as seguintes características:
- terreno urbano com área total de 418,00 m 2 , com forma irregular, de esquina,
com testadas de 16,30m e 20,00m, lateral esquerda de 22,00m e fundos de
25,50m, com topografia regular e nível abaixo da rua;
- área construída total de 1032,32 m 2 , de alvenaria, para fins residenciais com cinco
pavimentos e um subsolo. Cada apartamento seria composto por 2 quartos e 1
suíte, sala com dois ambientes, banheiro social, banheiro de empregada e área de
serviço. O apartamento possuiria duas garagens. O prédio teria dois elevadores.
Foram executados cerca de 48% da obra quando desapropriada.
Utilizou - se a pesquisa amostral efetivada por Lima [2001] em diversas fontes
tais como: instituições de classe, imobiliárias e jornais, considerando - se as
características semelhantes ao imóvel estudado, tanto em termos de proximidade
de localização, quanto de características próprias, entre elas: o zoneamento, a
infra- estrutura urbana, o coeficiente de aproveitamento, o padrão construtivo, o
número de quartos, etc.
Para os imóveis considerados como amostra, cada dado foi verificado até o
grau de detalhamento que possibilita as condições de cotejá- lo com o bem imóvel
avaliando, fixando - se o nível de rigor do trabalho com base na NBR- 5676.
44
As amostras podem ser visualizadas no quadro a seguir [Lima, 2001]:
45
No Valor Área Padrão Idade Vagas de
Amostra unitário equivalente construtivo aparente garagens
1 857,46 590,00 Alto 0 a 1 ano 2 vagas
cobertas
2 733,00 400,00 Médio 4 a 6 anos 2 vagas
cobertas
cobertas
4 737,22 223,00 Médio 8 a 10 2 vagas
anos cobertas
5 805,74 235,00 Alto > 12 anos 2 vagas
cobertas
cobertas
cobertas
8 735,71 140,00 Médio 10 a 12 1 vaga coberta
anos
9 634,45 163,00 Médio > 12 anos 1 vaga coberta
11 472,17 180,02 Baixo > 12 anos 2 vagas
cobertas
12 464,57 132,15 Baixo > 12 anos 1 vaga coberta
14 462,81 134,35 Baixo > 12 anos 1 vaga coberta
16 513,11 107,19 Baixo 4 a 6 anos 1 vaga coberta
17 899,28 139,00 Alto 4 a 6 anos 1 vaga coberta
18 727,78 126,00 Médio 8 a 10 1 vaga coberta
anos
20 586,32 85,50 Baixo 0 a 1 ano 1 vaga coberta
I) Modelo de regressão adotado

Foi adotado o seguinte modelo de regressão linear múltipla
Y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + b 4 x 4 + vi
Onde as variáveis envolvidas são:

a) Variável Dependente:
Valor do Imóvel [Y]: valor unitário do imóvel, calculado por metro quadrado de
área.
b) Variáveis Independentes:
Área equivalente[x 1 ]: = definida como a área equivalente de construção, que é
calculada multiplicando- se a área dos componentes do imóvel pelos fatores
mostrados no quadro abaixo
Descrição da área Fator de área

equivalente
Pavimento tipo 1,00
Térreo coberto fechado 1,00
Térreo coberto aberto (pilotis) 0,50 a 0,70
Subsolo 0,50
Atico 0,75
Mezanino 0,90
Sobre Loja 0,80
Áreas complementares 0,15
Terraço coberto 0,50
Piscinas 1,00
Vagas de Garagem 1,00
Cobertas no Térreo 0,50
Descobertas sobre a Laje 0,30
Descobertas sobre a Terra 0,15
Inverso do Fator de Padrão Construtivo [x 2 ]: O fator de padrão construtivo foi
obtido pela linearização da variação do valor da construção e acabamento entre o
imóvel avaliando e os elementos que compõe a amostra, resultando para padrão
baixo=408,23; padrão médio=483,93; alto padrão=585,51. Utilizou- se o inverso
destes valores por experiência prática usual na avaliação de imóveis urbanos.
Inverso da Idade Aparente do imóvel [x 3 ]: classificaram- se as amostras com
fatores de idade aparente: mais que (>) 12 anos = 1; de 10 a 12 anos = 3; de 8 a
10anos = 3; de 6 a 8 anos = 4; de 4 a 6 anos = 5; de 2 a 4 anos = 6; de 1 a 2 anos
= 7; de 0 a 1 ano = 8
Inverso do fator de vagas de garagem [x 4 ]: efetuou- se a seguinte classificação:
garagem descoberta = 1; vaga coberta = 2; duas vagas cobertas = 3; mais que (>)
duas vagas cobertas = 4.)
II) Ajustamento pelo método dos mínimos quadrados

Para a solução pelo método dos mínimos quadrados é necessário a
montagem numérica das matriz dos coeficientes das incógnitas (A). A matriz dos
pesos (P) no problema em pauta foi igualada a matriz identidade, não será
representada de forma explícita. O vetor das variáveis explicitadas (L) foi montado
com os valores observados. A matriz A e o vetor L são mostrados a seguir.
1 590,00 0,00170791275981623 0,125 0,25

1 400,00 0,00206641456408985 0,2 0,25
1 322,00 0,00206641456408985 0,2
0,33333333
1 223,00 0,00206641456408985 0.3333333
0,33333333
1 235,00 0,00170791275981623 1 0,33333333
1 152,03 0,00206641456408985 0,25
0,33333333
1 149,23 0,00206641456408985 0,2
0,33333333
1 140,00 0,00206641456408985 0,3333333 0,5
1 163,00 0,00206641456408985 1 0,5
A= 1 155,00 0,00206641456408985 1 0,5
1 180,02 0,00244959949048331 1 0,33333333
1 132,15 0,00244959949048331 1 0,5
1 123,00 0,00206641456408985 1 0,5
1 134,35 0,00244959949048331 1 0,5
1 89,50 0,00206641456408985 1 0,5
1 107,19 0,00244959949048331 0,2 0,5
1 139,00 0,00170791275981623 0,2 0,5
1 126,00 0,00206641456408985 0,3333333 0,5
1 107,74 0,00206641456408985 1 0,5
AVALIAÇÃO DE IMÓVEIS PELO MÉTODO DOS MÍNIMOS QUADRADOS 47

Prof. Dr. Carlos Aurélio Nadal
1 85,50 0,00244959949048331 0,125 0,5
857,46
733,00
734,66
737,22
805,74
762,47
770,73
735,71
634,45
L= 630,85
472,17
464,57
629,76
462,81
648,04
573,11
899,28
727,78
639,65
586,32
Pela solução matricial obtém - se o vetor (X) de estimativa dos parâmetros

solicitados no modelo de regressão, que resultará em:
1824,29715989785
- 0,214930982557917
X= - 454764,932555851
- 136,132168924983
- 168,353398806299
ou seja, o modelo de regressão resultante para o problema será dado pela

expressão:
y =1824,29715989785 – 0,214930982557917x 1 - 454764,932555851x 2 -

136,132168924983 x 3 - 168,353398806299 x 4
O vetor dos resíduos (V), resultará em:

4,22417834238195
- 3,72289648263074
- 2,64772974363814
- 2,08051832706883
- 0,90042055944263
- 0,73251908451823
- 1,58410388710683
- 10,7901465758116
- 5,22833845796572
V= 0,09110940249763
7,1933688122088
- 2,97678485379362
8,058900844351
- 1,68963301542095
- 3,02091123995865
2,75362761083841
7,03978910505396
0,148887179999292
1,44874763818473
4,4153932918933
A matriz variância- covariância resultará em:
297,684711 - 0,224692 - 75736,110107 - 0,997704

- 220,937116
- 0,224692 0,000278 32,166531 150,004464
0,2400921
ΣX= - 75736,110107 32,166531 32013965,173475 - 371,031620
5677,3653844
- 0,997704 0,0044645 - 371,031620 10,6794342
- 12,231989
- 220,937116 0,240092 5677,365384 - 12,231989
402,207891
II) Testes estatísticos
Uma análise do ajustamento é efetivada através de testes estatísticos,

conforme proposto no trabalho:
a) Teste de qui- quadrado para verificação da bondade do ajustamento.

O valor da variância da unidade de peso a posteriori resultou em:
σ∗o 2 = 27,1307176459636
O valor de qui- quadrado calculado resulta em:
χ2 c = 406,960764689454
Na distribuição qui- quadrado para um nível de significância de 95% tem- se:
χ2 15, 0,025 = 6,26

χ2 15, 9,725 = 27,49
Verifica- se neste caso que a hipótese básica deve ser rejeitada, deve- se
proceder a uma análise aprofundada do ajustamento (pode- se considerar os
resíduos excessivamente grandes em decorrência de erros grosseiros ou
sistemáticos). Deve- se também analisar se o modelo matemático utilizado é
consistente com as observações. O ideal seria parar o ajustamento neste ponto e
efetuar um estudo sobre diferentes modelos. Por se tratar de um estudo de caso
prossegue- se com o tratamento dos erros.
b) coeficiente de correlação linear múltiplo (R) e coeficiente de determinação (R2 )
Calculou- se também o coeficiente de determinação que resultou em:
R2 = 0,998601862578729
cujo significado é que 99,86% do valor de mercado está sendo explicitado pelo
modelo e, o coeficiente de correlação linear múltiplo resulta em:
R = 0,999300686769868
que mostra uma correlação fortíssima entre as variáveis explicativas e a explicada.
c) Teste de existência da regressão
O coeficiente F calculado é obtido pela expressão matricial (10) resultando

em:
Fc=2678,3897832203
O valor tabelado para o nível de significância de 5% resultou em:
F = 3,056
como Fc >F aceita- se a hipótese de existência de regressão.
c) Teste da significância dos regressores

Nesse caso deve- se dividir cada um dos regressores pela raiz quadrada do
elemento da diagonal principal da matriz variância covariância, que representa o
erro médio quadrático deste, assim obtém- se:
Tb1 = - 12,8797699083259
Tb2 = - 80,3743056845373
Tb3 = - 41,6568706036683
Tb4 = - 8,39453405047628
O valor do coeficiente T de Student retirado da tabela da distribuição com

um nível de significância de 5% resultou em:
T = 2,1314
Como os valores calculados em módulo são superiores ao valor critico aceita-

se a hipótese básica de significância dos regressores.
d) Teste “data snooping ” – Barda

e)
Calcula- se a matriz de redundância ou dos coeficientes de peso dos resíduos
utilizando - se a expressão matricial (11), que resulta em:
0,3000 - 0,3026 - 0,2345 - 0,0298 - 0,0458 0,1122 0,1165 –0,0420 - 0,0710

- 0,0548 0,0852 0,0017 0,0102 - 0,0028 0,0783 0,0311 - 0,0529 - 0,0136
0,0412 0,0732
- 0,3026 0,7374 - 0,1759 - 0,1201 - 0,0430 - 0,0860 - 0,0862 0,0155 0,0257
0,0299
- 0,1410 - 0,0236 0,0465 - 0,0248 0,0639 - 0,0372 0.,728 0,0228 0,0544
- 0,0285
- 0,2345 - 0,1759 0,8605 - 0,0832 0,0013 - 0,0578 - 0,0607 –0,0437 0,0016
0,0052
- 0,0445 - 0,0210 0,0198 - 0,0220 0,0351 - 0,0765 - 0,0201 - 0,0373 0,0268
- 0,0729
- 0,0298 - 0,1201 - 0,0832 0,8698 - 0,1006 - 0,1723 - 0,1762 - 0,0171 0,0268
0,0225
- 0,1127 0,0193 0,0053 0,0205 –0,0127 - 0,0321 - 0,0325 - 0,0247 - 0,0029
- 0,0473
- 0,0458 - 0,0430 0,0013 - 0,1006 0,6020 - 0,1339 - 0,1249 0,0414 - 0,0897
- 0,0956
- 0,1107 0,0569 - 0,1189 0,0585 –0,1434 0,2162 - 0,0880 0,0312 - 0,1301
0,2170
0,1122 - 0,0860 - 0,0578 - 0,1723 - 0,1339 0,7291 - 0,2790 –0,0225 0,0682
0,0580
- 0,1253 0,0696 0,0170 0,0724 - 0,0259 - 0,0359 - 0,0742 - 0,0404 - 0,0025
- 0,0706
0,1165 - 0,0862 - 0,0607 - 0,1762 - 0,1249 - 0,2790 0,7117 - 0,0291 0,0759
0,0654
- 0,1163 0,0771 0,0232 0,0800 –0,0209 - 0,0454 - 0,0845 - 0,0475 0,0031
- 0,0824
- 0,0420 0,0155 - 0,0437 - 0,0171 0,0414 - 0,0225 - 0,0291 0,8582 - 0,0529
- 0,0523 0,1107 - 0,0169 - 0,0495 - 0,0171 –0,0467 - 0,1238 - 0,1911 - 0,1406
- 0,0483 - 0,1322
- 0,0710 0,0257 0,0016 0,0268 - 0,0897 0,0682 0,0759 - 0,0529 0,8505
- 0,1460

- 0,0149 - 0,1098 - 0,1323 - 0,1107 - 0,1179 0,0050 - 0,0599 - 0,0469 - 0,1257
0,0240
- 0,0548 0,0299 0,0052 0,0225 - 0,0956 0,0580 0,0654 - 0,0523 - 0,1460
0,8567
- 0,0182 - 0,1052 - 0,1321 - 0,1060 - 0,1204 0,0064 - 0,0629 - 0,0474 - 0,1268
0,0236
0,0852 - 0,1410 - 0,0445 - 0,1127 - 0,1107 - 0,1253 - 0,1163 0,1107 - 0,0149
- 0,0182 0,5931 - 0,1689 - 0,0315 - 0,1680 - 0,0454 - 0,0171 0,2694 0,1049
- 0,0378 - 0,0109
0,0017 - 0,0236 - 0,0210 0,0193 0,0569 0,0696 0,0771 - 0,0169 - 0,1098
- 0,1052
- 0,1689 0,7749 - 0,0871 - 0,2263 - 0,0680 - 0,1152 0,1238 - 0,0090 - 0,0784
- 0,0939
0,0102 0,0465 0,0198 0,0053 - 0,1189 0,0170 0,0232 - 0,0495 - 0,1323
- 0,1321
- 0,0315 - 0,0871 0,8685 - 0,0871 –0,1308 0,0122 - 0,0748 - 0,0493 - 0,1312
0,0218
- 0,0028 - 0,0248 - 0,0220 0,0205 0,0585 0,0724 0,0800 - 0,0171 - 0,1107
- 0,1060
- 0,1680 - 0,2263 - 0,0871 0,7724 - 0,0673 - 0,1156 0,1247 - 0,0089 - 0,0781
- 0,0937
0,0783 0,0639 0,0351 - 0,0127 - 0,1434 - 0,0259 - 0,0209 - 0,0467 - 0,1179
- 0,1204
- 0,0454 - 0,0680 - 0,1308 - 0,0673 0,8583 0,0182 - 0,0873 - 0,0512 - 0,1358
0,0200
0,0311 - 0,0372 - 0,0765 - 0,0321 0,2162 - 0,0359 - 0,0454 –0,1238 0,0050
0,0064
- 0,0171 - 0,1152 0,0122 - 0,1156 0,0182 0,7299 - 0,0326 - 0,1213 0,0149
- 0,2812
- 0,0529 0,0728 - 0,0201 - 0,0325 - 0,0880 - 0,0742 - 0,0845 –0,1911 - 0,0599
- 0,0629 0,2694 0,1238 - 0,0748 0,1247 - 0,0873 - 0,0326 0,6013 - 0,1963
- 0,0805 - 0,0545
- 0,0136 0,0228 - 0,0373 - 0,0247 0,0312 - 0,0404 - 0,0475 - 0,1406 - 0,0469
- 0,0474 0,1049 - 0,0090 - 0,0493 - 0,0089 - 0,0512 - 0,1213 - 0,1963 0,8586
- 0,0502 - 0,1329
0,0412 0,0544 0,0268 - 0,0029 - 0,1301 - 0,0025 0,0031 - 0,0483 - 0,1257
- 0,1268
- 0,0378 - 0,0784 - 0,1312 - 0,0781 - 0,1358 0,0149 - 0,0805 - 0,0502 0,8667
0,0210
0,0732 - 0,0285 - 0,0729 - 0,0473 0,2170 - 0,0706 - 0,0824 - 0,1322 0,0240
0,0236
- 0,0109 - 0,0939 0,0218 - 0,0937 0.0200 - 0,2812 - 0,0545 - 0,1329 0,0210
0,7002
já, o número de redundância obtido é:
r = 15,00
resultando para os resíduos padronizados os seguintes valores:

0,2094
- 0,1845
- 0,1312
- 0,1031

- 0,0446
- 0,0363
- 0,0785
- 0,5349
- 0,2592
W= 0,0045
0,3566
- 0,1476
0,3995
- 0,0838
- 0,1497
0,1365
0,3490
0,0074
0,0718
0,2189
Para um nível de significância de 5% retira- se k=1,96 (distribuição F de

Snedecor). Como não há resíduos padronizados maior que k, aceita- se a hipótese
básica de que não há erros grosseiros nas observações.
f) Teste de Durbin - Watson
Obtém - se pela expressão (13) o seguinte valor para essa estatística:
dw = 1,70266906699683
O limite inferior obtido das tabelas foi
di = 0,90
Já,. o limite superior
du = 1,83
Neste caso o teste mostra- se inconclusivo. Deve- se salientar que a

autocorrelação só pode ser verificada se as amostragens estiverem ordenadas
segundo um critério específico.
g) Teste de normalidade dos resíduos
Uma verificação qualitativa da normalidade pode ser analisada com a
distribuição dos resíduos padronizados em relação ao erro médio quadrático. Neste
caso nota- se que 80% dos resíduos distribuem - se no intervalo definido por mais ou
menos uma vez o erro médio quadrático e 95% no intervalo de ± 1,96 vezes o erro
que corresponde a um intervalo de 95% na distribuição de Gauss.
A aplicação do teste de normalidade de Kolmogorov- Smirnov foi efetivada
utilizando - se um nível de significância de 95%, obtendo- se que a distribuição dos
resíduos é normal.
No presente caso, analisaram- se os gráficos de resíduos das observações.
cujas distribuições apresentam - se aleatórias, mostrando que há homocedasticidade
e não ocorre multi - colinearidade.

REFERÊNCIAS
ABNT. NBR 14653 - 1 – Avaliação de Bens – Procedimentos Gerais. Rio de Janeiro,

2001.
ABNT. NBR 14653 - 2 – Avaliação de Bens – Imóveis Urbanos. Rio de Janeiro,
2004.
ANDRADE, J.B. Fotogrametria. Editora SBEE. Curitiba, 1998. 258p.

BAARDA, W. A. A testing procedure for use in geodetic networks . Netherlands
Geodetic Comission, v. 2, n. 5, 1968.
BUNCHAFT, G. Estatística sem mistérios. 4 a ed. Petrópolis, RJ. Vozes, 1997.
CHRZANOWSKI, A. Design and error analysis of surveying Projects . Select
Papers and lecture notes . University of New Brunswick. 1977.60p.
DANTAS, R. A.; CORDEIRO, G. M. Uma nova metodologia para avaliação de
imóveis utilizando modelos lineares generalizados. Revista Brasileira de
Estatística, v.49, p.24- 46, jan./jun. 1988.
DANTAS, Rubens Alves. Engenharia de avaliações: introdução à metodologia
científica. São Paulo: Pini, 1998.
DE CESARE, Cláudia M. An empirical analysis of equity in property taxation: a
case study from Brazil. 1988. Tese (Doutorado em Property Taxation) - University
of Salford, Salford (UK), 1998a.
GEMAEL, C. Introdução ao ajustamento de observações: aplicações geodésicas.
1. ed. Curitiba: Editora UFPR. 1994.
IMAPE. Fundamentos de Avaliações Patrimoniais e Perícias de Engenharia. 1. ed.
São Paulo. Editora Pini. 1998.
JOHNSTON, J. Métodos econométricos. São Paulo: Atlas, 1977.
LIMA, A. J. M. Determinação do valor de indenização para desapropriação de
edifício residencial em construção, para fins de preservação do patrimônio
paisagístico. Seminário do Curso de Pós- Graduação em Construção Civil da
Universidade Federal do Paraná, 2001.
MARQUES, J. M. Estatística - Curso de Engenharia . UFPR, Curitiba, 2000.
MILLINGTON, A. F. An introduction to property valuation . 4th ed. London: Estates
Gazette, 1994.
MITISHITA, E. A. Detecção de erros grosseiros nas aerotriangulações. Curitiba,
1986. Dissertação (Mestrado em Ciências Geodésicas) Curso de Pós- Graduação em
Ciências Geodésicas, Universidade Federal do Paraná.
MORAES, C. V. Aplicação do ajustamento às poligonais. Curitiba, 1997.
Dissertação (Mestrado em Ciências Geodésicas) Curso de Pós- Graduação em
Ciências Geodésicas, Universidade Federal do Paraná.


Avaliacao de Imoveis

Caricato da

Informazioni sul documento

Descrizione originale:

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Avaliacao de Imoveis

Caricato da

Copyright:

Formati disponibili

UNIVERSIDADE FEDERAL DO PARANÁ

SETOR DE CIÊNCIAS DA TERRA

AVALIAÇÃO DE IMÓVEIS PELO MÉTODO DOS MÍNIMOS

Carlos Aurélio Nadal

1. Avaliações. 2.Método dos mínimos quadrados. 3. Inferência

O conceito de avaliação imobiliária pode ser entendido como a estimativa do

Baixa resolução Precisão

Alta resolução Acurácia

Onde: ū = média aritmética

A = x máx - x min (2.3)

A variância é dada pela expressão:

onde v é denominado de resíduo e, é definido como:

O desvio padrão ou o erro médio quadrático da média é obtido pela raiz

A assimetria pode ser calculada pela expressão:

Quando: AS = 0 distribuição simétrica;

Curtose é o grau de achatamento da distribuição. Ou o quanto uma curva de

É importante, em avaliações a estimação por intervalos, na qual constrói - se

P (Φ1 ≤ u ≤ Φ2) = 1 - α (2.9)

A escolha do nível de confiança depende da precisão com que desejamos

Verificar estatisticamente a amostra a seguir, supondo- se que foram

6,47 6,59 8,96 7,65

1) Calculo dos indicadores de tendência central

1.1) Média aritmética (utilizando a expressão 2.1).

6,47 6,55 6,59 6,78

Como tem- se um número par de dados

Mo = 6,88 R$/m 2 (repete- se quatro vezes)

2) Cálculo das medidas de dispersão

2.2) Variância (calculada pela expressão 2.4)

2.3) Desvio padrão

2.4) Erro médio quadrático de uma observação isolada (expressão 2.5)

2.5) Primeiro, segundo e terceiro quartil

Se AS > 0 a distribuição assimétrica positiva, isto é, a moda e a mediana são

2.7) Curtose (expressão 2.7)

(Q3/4 – Q1/4 ) 7,65 - 6,88

Conclui- se que a distribuição será leptocúrtica ou alongada, pois k < 0,263.

2.8) Coeficiente de variação (expressão 2.8)

Sendo 1- α denominado de nível de significância, usualmente igual a 95%. α =

4. INFERÊNCIA ESTATÍSTICA PELO USO DA REGRESSÃO LINEAR SIMPLES EM

A regressão linear é utilizada em experimentos que procuram determinar a

4.1 Regressão Linear Simples

O termo regressão é usado para designar a expressão que relaciona uma

que expressa o valor de Y em função de X.

Figura 3 – Determinação da equação de uma reta

A partir dos dados, tem- se o seguinte sistema de equações:

Resolvendo obtém - se:

Desta forma o modelo matemático adotado para este mercado seria:

VALOR = - 100 + 1,333 X ÁREA DO IMÓVEL

O problema fundamental consiste em ajustar uma regressão linear simples,

Figura 4 – Ajuste de uma reta

Escrevendo estas equações na forma matricial:

Sendo que a, b e os 10 v´s são desconhecidos e não é possível conhece- los,

∑(y i − yˆ i ) 2 = min (4.4)

Os desvios de Y´s observados para a linha ajustada Yi − Yˆ , ou resíduos,

A soma dos quadrados dos desvios será:

a e b são obtidos pelas das equações normais:

A obtenção de a se dá mediante a divisão da equação

Da equação 4.7, pode- se tirar duas conclusões:

e sem alterar a igualdade, multiplicamos por ( x − x ) , seus dois membros:

esta equação se refere ao desvio de um determinado valor de Y em relação a média

dividindo - se o numerador e o denominador de b por n- 1, vê- se que

b é denominado coeficiente de regressão de Y em X;

e a soma de produtos (numerador) pode ser desenvolvida: