Sei sulla pagina 1di 30

-A HOMOGENEIZACIN UT!

LIZANDO MODELOS DE REGRESIN UNEAL SMPLE

.I

CONCEPTUACIN

urodelo Clsico de Regresin tuvo su origen en los trabajos de astronoma elaboraGauss en e! perodo de 1809 a 1821 . Actuahnente el anlisis de regresin es una
"
: S rsrri&s de la teora estadstica rlrs utilizados
en la investigacin cientfica. Es uua
;-- - r3 adecuada cuaudo se desea estudiar el conrpoalniento de una variable (variable

,r

-r'

-:

;r:..liente)
"

err relacin a otras que son responsables de su foruracin (variables

:t::ndientes).

-:, Ingeniera dc Tasaciones generalurente

se considera coluo variable dependiente,


::ecios de contado de los datos de niercado eu oferta o efectivamente negociados, ,
. - -- r.ariables independientes, las respectivas caractersticas relacionadas con los asr,r-"rs fsicos y de localizacin, as como los aspectos econmicos (dato de oferta o
,:-..,'cin, poca de ocurrencia del evento, etc.). Se observa que las variables
- -=::ndientes pueden ser tauto de uaturaleza cuantitativa (rea, frente, etc"), colllo

*;.

:=tiva (uaturaleza de la infornracin, orientacin solaq etc.)


- -:ndo la variabilidad de los precios puecle ser explicada por apenas una variable
":=-=:diente, a travs de uua funcin Iineal, se utiliza el modelo de regresin lineal
i * . ;. que ser tratado en este captulo. Cuando lns de una variable indepencliente es
,r-:.:,::ie para esta explicaciu, se adopta el moclelo de regresin lineal nrltiple, que ser
uu,,-:- - Je los prximos tres captulos. Aunque en la prctica, lo rns usua! es el lnrdelo de
:,:l lineal rnrltiple, se inicia con el rnodelo de regresin lineal sirnple, debido a las

ts::

::les

de entendimiento de las deducciones e interpretaciones. No obstante, todos


-:eptos de regresin lineal sirnple puedeu ser generalizados para el ntodelo de
, -rlinealmltiple.
- :lelo de regresin lineal sirnple, para explicar Ia variabilidad de todos los rr precios
::do (I/), a travs de las variacioues provocadas por una variable rnica ({), se
-:a por una funcirt lineal del tipo 5.1 y por las cinco hiptesis bsicas clefinidas
.

..:ncin

Lineal
i=

1,..,111

(5.1)
lHcxnir oe Tosocroxrsp

-.ry

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN UNEAL SIMPLE

-.- -

Una estimacin

..1

-.-

','

\-

- es llamada variable dependiente, variable explicada o variable respuesta.

.'.

- es llamada variable independiente, variable explicativa o covariable.

--r

HOMOGI

- se denominan parmetros de la poblacin.


- son los errores aleatorios del modelo.

ac

t,:

d<

bo+b,x,

En ungrfico form
en ejes cartesianos, d
tica que vara en cad

lineal se representa

b) Hiptesis Bsicas

tambin como la rectr

1i) La variable independiente debe ser representada por nmeros reales que no

Y, (dependiente)

r rntengan ninguna perturbacin aleatoria.

El nmero de observaciones, m, debe ser superior al nmero de parmetros estinrados. es decir, que para el caso de la regresin lineal simple debe ser superior a dos.
23)

3)

Los effores de las variables aleatorias tienen valor esperado nulo y varianza constante, esto es, E (e,) = 0 y Var (q) : d.
4e) Los errores son variables aleatorias con

5a)

distribucin normal.

Los errores no estn correlacionados, son independientes bajo la condicin de

normalidad.
Los valores medios de mercado para cada nivel de,{ son calculados por el componente sistemtico del modelo 5.1, que se representa por:
rv-I-- o+ ,X,

i:1,...,nt

(s.2)

Como no es viable el levantamiento de todos los datos del mercado de una poblacir
en laprctica se trabaja con un subconjunto de n elementos de estapoblacin, denominada
muestra, a travs de la cual, utilizando inferencia estadstica se estiman los parmetros de
la poblacin. La ecuacin del modelo inferido est dada por:

:bo+b,X + s

i:1,...,n

figrra

S.

t-

Cabe destacar q
comportamiento del r
laprctica este,comp

Un caso particular,
posee apenas un par

tal. En la prctica, er
formacin de los pre<
general, y el modelo e

Y,: Bo+ t,.

(s.3)

5.2 DIAGRAMA

Donde:

Y.,.....,Y,- son los precios observados en el mercado, forman parte de la muestra.


b0,

ei,...,en

son los parametros estimados correspondientes a Fo, F,.

- son los respectivos estimadores


delmodelo.

pnrrr*r

Arvs

Duus

de,,.......,,, tambin denominados resduos

El primerpaso par
minadavariable influ,

en una tasacin se del

en relacin a la dista
casos distintos, preset

HoMoGENEtzActN unuzANDo MoDELos

DE REGREstN uNEAL slMpLE

Una estimacin del valor medio del mercado est dada por:

Y,

: b,,+b,X

: 1,...,n (5.4)

En un grfico formado por [ares de puntos obsen'ados en el mercado Xl;{), dispuestos


en ejes cartesianos, donde
corresponde a los precios praticados ) ,{ a una caracters-

tica que vara en cada uno de estos datos. la parte explicada del modelo de regresirr
lineal se representa por la recta que pasa ms prxima a todos los puntos. conocida
tambin como la recta de regresin, como se muestra en 1a fieura -i.1.
Yr (dependente)

:
Muestna

recta

e,

Y,: bo+ b.X.*

e,

X, ( ndepenc

Figura 5.1

o+ ,x, +

Recta

(media

de

la poblacin)

e'::

y Reca 2 reCta de Ia muestra)

Cabe destacar que con la recta 1 se obtiene una estimacin del vercladero
comportamiento del mercado, que sera lo obtenido si se ler antara toda la poblacin. En
la prctica este comportamiento se infiere con la recta l.
Un caso particular del modelo de regresin lineal simple es el modelo nulo. Este modelo
posee apenas un parmetro. Su representacin erfica est dada por una recta horizon-

tal. En la prctica, esto significa que no existe ninsuna variable explicativa sobre la
formacin de los precios, pudiendo estimarse el r alor de mercado apenas por la media
general, y el modelo est dado por:

Y,: Po+

e ,,

i:

l,..,nt

(s.5)

5.2 DIAGRAMA DE DISPERSIN


El primer paso para analizar el comportamiento de los precios en relacin a una determinada variable influyente es analizar el grfico de dispersin. Por ejemplo, suponga que
en una tasacin se desea analizar el comportamiento de los precios unitarios de parcelas
en relacin a la distancia a un determinado polo valorizante, pudiendo ocurrir cuatro
casos distintos, presentados en las figuras 5 .2, 5.3 , 5 .4 y 5 .5 .
lxcrxrr o

TrucroxsV

q;;p-

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LNEAL SIMPLE

HOM(

Este analisis ini


el mercado inmobi
regresin.Al plotez

puede encontrar es

frg.5.7.
Vu (R$/m,)

FBura 5.2

Caso

Figura 5.3

Caso 2

' :.: :.: ::.:': :.: :.. . ... . .

lt
- - -- - - l- lt
tt
--J-__L_
tt

Figura 5.6

Obsrvese que
datos, el tasador a
Figura 5.4

Caso 3

Figura 5.5

Caso 4

De acuerdo al comentario en la seccin 2.2.4.2, por la simple observacin grfica se


pueden detectar cuatro informaciones muy importantes de los datos: la tendencia, la
intensidad, la forma funcional de la curva, y la dispersin de los datos.
En los casos presentados en las figuras 5.2, 5.3 y 5.4 se verifica una tendencia de
decrecimiento del valorunitario amedidaque laparcela se aleja del polo valorizante.

Esto que parece bastante trivial, es muy importante para comprobar la creen cia a priori
que el tasador tiene sobre el comportamiento del mercado. En los puntos de la figura 5.5
no se puede extraer la misma conclusin. En este caso el mercado est indicando,
aparentemente, que el polo no ejerce ninguna influencia sobre la formacin de los precios.
La inclinacin de la recta indica la intensidad con que la variable independiente influye
sobre la variable dependiente.
En cuanto a la forma de la curva se verifica que los puntos dispuestos en las figuras
5.2,5.4 y 5.5 presentan caractersticas de linealidad, mientras que los de la figura 5.3
indican un comportamiento exponencial. Esto es fundamentalparael tasador, pues en los
casos 1, 3 y 4 se pueden ajustar los datos a una recta, utilizando regresin lineal, pero en
el caso 2 eso no es posible, sino se procede a la debida transformacin para linealizar los
datos.
Por ltimo, una cuarta informacin de bastante inters en cuanto a la dispersin de los
datos a lo largo de la curva que mejor se ajusta a los datos. Se verifica en los casos 1, 2,
y 4 que la dispersin es aparentemente constante, es decir, aparenta homocedasticidad o

buena aproximaci
para terrenos que e
este intervalo no hr
permitida la extrap,
si se desea estimar

bastara con busca


resultado R$40/m2
Es muy

seccinyotrasalc

Considerando e
muestra en la figur
fenmeno, como e
delmercado para d
es equivalente a ha

varianza constante de los errores; mientras que el caso 3, lavarianza de los datos es
cedasticidad.
En captulos posteriores se demostrar que los modelos ideales son aquellos que presentan condiciones favorables de linealidad, homocedasticidad y con intensidad alta, esto
es, rectas distantes de la recta horizontal, adems de otras cualidades.
Figura 5.8

Ynr"*r

importt

modelo de regresi(
ms potentes del n
Otras situacion

creciente a medida que se aleja del polo valorizante, presentndose condiciones de hetero-

Aws Drxrm

ru}',-

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

Este analisis inicial es fundamental para formular un modelo aceptable para explicar
el mercado inmobiliario. La curva que pasa ms cerca a los puntos es llamada la cuiva de
regresin. Al plotear los puntos en un papel milimetrado, corlo se muestra en la fig. 5.6 se
puede encontrar esta curva con bastante aproximacin, como por ejemplo la recla de la

fig.5.7.
Vu

(R$/m'?)

Vu (RS/m,)

ttttt
- - -- - -|- - - I - - -r- - - I
ltttt
a
ttttl
_ - -J _ _ _l _ _ -l _ r_L _ _
IIII
ttt.t.l
ltttt
"1
- - - - -T - - -'l - - -r- -.- 1
tttlt
ttltt
_.,l

501-

tt

tt
-_J___L__
lt

rrll

---'l---T--{---l---

rtl
ttll
1

Figura 5.6

Figura 5.7

Obsrvese que sin necesidad de usar equipos o sistemas para el tratamiento de los
datos, el tasador al trazar esta recta, est estimando un modelo de regresin con una
buena aproximacin y podra, a partir de ah, usar el modelo para estimar el valor medio
para terrenos que estuviesen a unadistanciaentre I y5 km. del polo valorizante. Fuera de
este intervalo no hay seguridad en cuanto al comportamiento de los precios, no siendo
permitida la extrapolacin. Elmodelo de regresin es intrnsecamente interpolativo. As,
si se desea estimar el valor para un terreno que estuviese a 3 Km. de distancia del polo,
bastara con buscar el precio medio correspondiente en la figura 5.7 y encontrar como
resultado R$40/m2.
Es muy importante que el tasador comprenda lo que est haciendo cuando ajusta un
modelo de regresin, siendo el anlisis grfico una de las herramientas ms sencillas y
ms potentes del modelaje.
Otras situaciones interesantes pueden ocurrir. Algunas sern presentadas en esta
seccin y otras a lo largo del libro.
Considerando el mismo ejemplo, puede ocurrir una distribucin de los datos como se
muestra en la figura 5.8. En este caso se puede considerar una sola recta para explicar el
fenmeno, como en la figura 5.9, pero no habra seguridad en cuanto al comportamiento
del mercado para distancias en el intervalo entre b y c. Utilizar el modelo
.rt" intervalo
"n
es equivalente a hacer una extrapolacin interna, o mejor una..intrapolacin,,

I
I

r'j

ab

X,.

Figura 5.9
lxcxrnl o Tslcoxs

Iw

HoMocENElzActx

ry

unuaxoo

MoDELos

o ncnrslx

IINEAL slMPtE

Otro caso bastante interesante, que puede llevar al tasador a cometer elrores graves
se presenta en la figura 5.10. La recta de regresin (recta 1) pasa por la media del
conj unto y por un punto aislado como se muestra en la figura 5 . 1 I .

HOMO(

figura 5.15. Este cas


lo, asunto que ser

tr

Una disposicin
Figura 5.11

Figura 5.10

Obsrvese que el comportamiento del mercado presentado en la figura 5.10 sera


explicado por larecta} de la figura 5 . 1 1 , pero debido a un punto discrepante, la recta est
diitorsionda, invirtiendo la tendencia del mercado. Los puntos de este tipo o el mismo
conjunto de puntos son denominados puntos influyentes y son bastante peligrosos. Los
mismos pueden ser detectados fcilmente con un anlisis grfico.
En el caso de los puntos de la figura 5. 1 2 se verifica que no hay informacin suficiente
para utilizar el modelo fuera del intervalo [a;b], pues estos tres puntos que no pertenecen
a [a;b] son determinantes en la inclinacin de la recta mucho ms que los que pertenecen
al conjunto formado por el grueso de los datos. Obsrvese que si los tres puntos estuvieran
com6rlos de la figura 5.13, el comportamiento del mercado estara completamente
desvirluado. Este ei un caso tpico de desequilibrio de la muestra. Elpequeo conjunto de
puntos no es suficiente para explicar por s solo su tendencia. Tambin son puntos
influyentes.

interaccin entreuna'

los datos de oferta y


alejan del polo. En e
lelas como las mostr
1o

7.

Figura 5.16

5.3 LINEALIZACI
El proceso de

reE

vados en el mercadc

Figura 5.13

3-.a S 12

verifica que se trata de un


;-o,:ipi;o de un comportamiento de datos provenientes de dos poblaciones distintas,
: -- -- -- : tr e-templo. datos de oferta y datos de transacciones. Si no se obserua el fenmeno,
: :-::=1,: a,iustado seria e[ de la recta I de la figura 5.14, pero en la realidad el
: ,- -: : :=:'. e:lto del mercado debe ser explicado por las rectas paralelas mostradas en la
Er" el caso de los puntos representados en la figura 5.14 se

t*-A.ws

Drrrs

el fenmeno si la t<
observa este tipo de
linealizados por la r
Considrese, por eje
una recoleccin de c
precios unitarios de

tendencia de decreci
las reas. En este ca
5.1

8, sera inadecua,

cia ala linealidad.

ry

HOMOGENEIZAC!N UTIIZANDO MODELOS DE REGRESIN tlNEAI SIMPI.E

figuta 5.15. Este caso sera resuelto con la inclusin de una variable dummy enel mode.u-. SUnto que ser tratado en el captulo 7.
A
Recta

=,:-'a

5.14

Una disposicin de los puntos corno se muestra en la figura 5.1 6 es un caso tpico de
::eraccinentreunavariabledummyy la distancia aun polo valorizante, como por ejemplo,
",ts datos de oferta y las transacciones decrecen de forma diferenciada a medida que se
alejan del polo. En este caso, el mercado sera explicado a travs de dos rectas no pararias como las mostradas en la figura 5.17. Este asunto tambin ser tratado en el captuic r.

oa
a

aaa

Figura 5.16

Figura 5.'17

5.3 LINEALIZACN
El proceso de regresin lineal simple se aplica para ajustar rectas a los puntos obserel mercado. De esta forma, la recta solamente tendr significado para explicar
el fenmeno si la tendencia de los puntos fuese lineal. En la prctica, no siempre se
observa este tipo de tendencia. Sin embargo, algunos modelos no lineales pueden ser
linealizados por la simple transformacin de las escalas de medicin de las variables.
Considrese, por ejemplo, que los datos resumidos en la figura 5.1 8 son el resultado de
una recoleccin de datos de lotes de terreno, donde los puntos ploteados corresponden a
precios unitarios de nercado (P) versus las respectivas reas (A). Observe que hay una
tendencia de decrecimiento en forma hiperblica de los precios unitarios en relacin con
las reas. En este caso, el ajuste de una recta a los puntos, como se muestra en la figura
5.1 8, sera inadecuado, pues slo se pueden ajustar rectas a datos dispuestos con tendenr ados en

cia a la linealidad.
lxcxnh or

Trucronm[p

toMo(

HOMOGENEIZACIN UTILIZANDO MODETOS DE REGRESIN TINEAL SIMPLE

--a
v

z:llP

Elcomportamien

Figura

5.18

Figura 5.19

Por ello, se hace necesario algunatransformacin paralracerposible lautilizacin de la


regresin lineal,esto es,unatransformacinque linealice losdatos. Lasolucinparaelproblemaenunciadoesutilizarunatransformacin inversa,Z: 7lP, en losdatosde la figura 5.18
resulta en puntos con tendencia lineal como los de la figura 5.19. As los datos con tendencia lineal seran modificados para una tendencia hiperblica, cuando se realiza una
inversin de la escala de las ordenadas, la reciproca tambin es verdadera. De esa forma
se hace la regresin de Z sobre A y se obtiene Ia ecuacin:

Z=bo+

(b) Funcin Ex

La ecuacin de ur

y=a'bx

(s.6)

br . A

En seguida se retorna a la escala original, sustituyendo Z por 1 lP en la ecuacin 5.6


se

Figura 5.20

La linealizacin
transformacin invet

obtiene:
1

F=b.+br.A

P:

obtenindose la ecuar

b" +b,.A

(s.7)

queesla ecuacin de una hiprbole, llamada hiperblica I. As que en la escala de P se


tienen puntos con tendencia hiperblica, en tanto, que en la escala deZlatendencia es
lineal.

Lny:Lni

El comportamieff

Como se puede observar, el conocimiento del comportamiento de los grficos de algunas


funciones muchas veces orienta al analista en relacin a la transformacin a adoptar . A
continuacin se presentan tres funciones no lineales, bastante utilizadas, que pueden ser
linealizadas a travs de transformaciones adecuadas, con sus respectivos grficos (Daniel
y Wood-1971), apenas en el primer cuadrante, todavezque tanto la variable explicada
como las explicativas son nmeros reales positivos.

(r) Funcin Hiperblica

II

Figura 5.22

Esta funcin tiene una ecuacin del tipo:

Y=

Una informacin i

ax- b

(s.8)

[-a ]inealizacin de la ecuacin 5.8 se hace con la inversin de las escalas de x y dey,
como se indica en la ecuacin 5.9.

nrr,rr

Arvs Drxus

y en
estimar una tasa medi
utiliza una funcin ex1
)ogartmica poseen dir
de variacin de

listribucin lognormal

x;,-

HOMOGENEIZACIN UTITIZANDO MODETOS DE REGRESIN UNEAL SIMPLE

1b
__a__
yx

(s.9)

El comportamiento grfico de Ia ecuacin (5.8) se muestra en las figura s s.20 y


5.21.

Figura 5.21

(b) Funcin Exponencial


La ecuacin de una funcin exponencial es del tipo:

y=aoebx

(5. r 0)

Lalinealizacin de una curva exponencial se hace utilizando la correspondiente


transformacin inversa, esto es, una transformacin logartmica de la estala de y,
obtenindose la ecuacin

Lny=Lna+bx

(s.r

l)

El comportamiento grfico de (5.Il) se puede observar en las figuras 5.22y s.23.

Figura

5.22

Figura 5.23

Una informacin importante suministrada por la ecuacin 5.10 es respecto a la tasa


de variacin de y en relacin a x, que se indica por (l-eb). As, cuando
se pretende
estimar una tasa media de valorizacin territorial en determinado perodo, por
ejemplo, se
utiliza una funcin exponencial. Otro aspecto a considerr.
qu. si los datos en la escala
", los datos
logartmica poseen distribucin normal, hay indicios de que
originales poseen
dishibucin lognormal.

lxcxrr or

Tunoox:s\ff

'ry

HOMO

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPTE

(c)

5.4 ESTTMACT

Funcin Potencia

La manera msl
los MnimosCuadra

Esta funcin tiene una ecuacin del tipo:

errores calculados

y=a'xb

(s.12)

Lalinealizacinde 5.12 se haceutilizando unatransformadalogartmicaen lasvariables


x e y, resultando en

Lny:Lna*bLnx

los siguientes:

a) se determina u
medios calculados

b) se calculan

(s. 1 3)

correspondientes ajr
El comportamiento grfico de 5.12 se puede visualizar en las figuras 5.24 y 5.25.

vertical, entre cada


t)ttI

c) se define una
para una muestra dr
-1

<b<0

, =fu?

b=-1
.
Figura 5.25

Observe que la

Una infonnacin importante cuando se utiliza la funcin potencia es que b indica la


elasticidad de y en relacin a x. El concepto de elasticidad esta ligado a un aspecto del
comportamiento de las variaciones de y en relacin a las variaciones de x, por la ecuacin:

"

dvlv
dx/x

,=l

(s.

ma a los puntos, pt
tienen dos caminos

sumatoria de los

matemticamente. (
mtodo de estimacir

l4)

Cuando se usa una transformaciu, se debe enteltder que no se trata de un urero


ejercicio de matemtica, es importante saber lo que representa el cambio de escala propuesta y si es coherente para explicar el mercado. No se debe confundir con un simple
proceso de intentos, en el sentido de buscar mejores resultados estadsticos. Esto no
basta. Es importante que el modelo resultante pueda expresar con fidelidad el fenmeno
que se desea explicar. Si este es coherente con las creencias a priori que el tasador tiene
sobre el mercado, as como sus teoras sobre el mismo. Por ejemplo, si una cuestin es
inferir la tasa de valorizacin territorial en una regin y es del conocimiento del tasador
que el crecimiento sigue una tasa aproximadamente constante, tiene sentido utilizar un
modelo exponencial; pero si el tasador espera que la tasa sea decreciente en el periodo

d)

se deriva una

y cadaresultado

se

es igual al de los p
estimados que se br

A continuacin
modelos nulo y de n

5.4.1 MODELO I
La estimacin

st

puede generalizar

pr

observado, el rnodelo ms aproximado sera uno potencial.

nrtt*t

Aws

Duus

..-qFr.

HOMOGENEIZACIN UTILJZANDO MODEIOS


DE REGRESIN LINEAT SIMPLE

5.4 ESTtMAcIx

or los

paruu,tETRos

La manera msfacil deestimar losparmetros


del modelo

es a travs delMtodo de
imizar Ia sumade los cuadrados de los
elrores calculados para una funcin cualquieradelaecuacindeterminada.
Lospasosson

los Mnimos cuadrados. Este mtodo


consi ste en m

los siguientes:

a) se determina una
duncin cualquiera de los parmetros de las variables, con valores
medios calculados por 1,.

b) se calculan Ios errores existentes:lt.renros puntos


observados

({)

y ros
correspondientes ajustados por el modelo definidoi,
esto es, tu. Jrtur.us medidas en Ia
r ertical, entre cada punto observado ({)
y er estimdo por
r

E: Y_?

,roJero (r ) ,

esto es:

(s. I 5)

c) se define una funcin U formada por la sumatoria


de los cuadrados de los errores,
para una muestra de tamao n, dada por:
1

, =jr? u=Irr,_y,
i-t

=1

),

(s.

l6)

observe que la sumatoria de ros errores E es nura para


la curva que pasa ms prxi_
ma a los puntos, puesto que los errores positivos
se anulan con los negativos. As se
tienen dos caminos para cuantificar estas istancias:
la sumatoria de los mdulos o por la

sumatoria de los cuadrados. La segunda solucin


es nrs fcil de ser tratada

matemticatnente. cuando se utiliza la minirnizacin


de los cuadrados de los errores, el
mtodo de estimacin se denomina mtodo de ros
mnimos
cuadrados.

d) se deriva una funcin uen relacin a cada parmetro


desconocido de Ia funcin i
y cada resultado se iguara a cero, obtenindose
un sistema de ecuacilones cuyo numero
es igual al de los parrnetros a ser estimados.
La soruciin del siistema suministra los

estimados que se buscan.


A continuacin se presenta Ia metodologa citada para
estirnar los parmetros de los
modelos nulo y de regresin Iineal simple.

5.4.1 MODELO NULO


La estimacin se inicia por el modelo ms sencillo,
no obstante el razonamiento
puede generalizar para los modelos ms complejos.
El modelo nulo est dado por:

1I re.t,

con

Y:b

(5. I 7)

lxcxlnh o Tmrcros

se

_{tF"

HOMOGENEIZACIN UTITIZANDO MODELOS DE REGRESIN LNEAL SIMPLE

HOMOGEN

Surepresentacingl

Su representacin grfica se muestra en la figura 5.26.

El estimador , se obtiene considerando una recta horizontal cualquiera dada por


8,, donde la sumatoria de los cuadrados de los errores est dada por:

u=fv,-, )' 6 u=frr,-B)2

{:

(s.1 8)

i=l

En este caso la fu
precio observado (I/,)
cualquiera

Y,: B, +

Para imponerle a la funcin la codicin de mnimo, se calcula inicialmente la primera


derivada de la funcin en relacin a la variable Bo, o sea:

.n
dU / dB"

* -2G, - B") = -2(ZY,i=l


i=t

B".n)

las derivadas parciale

.outinuacin:

dU/dB.:

0, entonces n

. bo

=f ', ,

bo =

t',

,n o

aiin b,,: Y

De modo que en una poblacin de datos homogneos, el valor del mercado se estima
por la media aritmtica de los datos muestrales. Se observa que en el momento en que se
impone la condicin de mnimo a la funcin 5. I 8, se encuentra el estimador del parmetro

desconocido representado por bo.


La comprobacin de la condicin de mnimo de la funcin se verifica observando el
resultado de la segundo derivada:

dru/dB,2

-2. (- B") = 2n > 0

Para que en esta ful

(s.1e)

lgualandodU/dB,,acero,seimponelacondicinde mnimo a la funcln (5.19), que coincide con el modelo 5.17. As, 8., que antes era una variable, se transforrna en una
constante b,,, na vez que el sistema nos da la solucin buscada, cro se demuestra a

sr

dJ/B,:

0, esto es

aJ/a,,: 2 z (Y,-

latta,:2(Y,Igualando las deri'

n +b,.8.

zx,+ b,. E,

Nota: se consider

(s.20)

La solucin del sir


Como la segunda derivada es positiva, la condicin de mnimo para la funcin est

correspondientes; de

gr^r-antizada

Y,:

5"{-2 X'DEI.o UNEAL SMPLE


Ei .nlormedio ajustado para una funcin lineal corresponde a una ecuacin del tipo

j.'-;-rv
-

lfnrou

D,s

L'

:l

..t

(s.21)

bo

Los precios ajusta

?,: b"

ru;p*

HOMOGENEIZACN UTIZANDO MODETOS DE REGRESIN [INEAL


SIMPTE

Su

representacin grfi ca

es el de una

recta i nc linada, como se muestra,e n la

?,:

b,,

fi

gura 5 .27 .

+ b, 'X,

Figura 5.27

En este caso la funcin que mide la sumatoria de todas Ias distancias


entre cada
precio observado (f,) y el correspondiente precio ajustado, calculado por
una recta
cualquiera Y,: Bn * 8,.X, est dada por:

=f ,: =f (y,- 8,, - 8,.x,)2

(s.22)

Para que en esta funcin alcance su punto mnimo, se hace necesario


inicialmente que
ls derivadas parciales en relacin a cada parmetro sean iguales
a cero, o
0

y d.l/68,:0, esto

ilr/B,:

es:

Igualando las derivadas a cero se obtiene el sistema siguiente:

n +b,.X:Y
h..
I
t
i
lo
b,.
X2:
X
\b^. X.+
.--y
-
t
t
t

(s.24)

t"

Nota: se considera en los sistemas 5.23 y 5.24 que X

:i

tr-a solucin del sistema 5.24 nos da los estimadores


de los parmetros poblacionales
ccrespondientes; de esta forma el modelo deseado tendr la siguiente
ecuacin:

Y,

: b,,*brX,+e,

(s.2s)

Los precios ajustados por la recta de regresin estn dados por:

Y,:

bo+ bt.X,

(s.26)
lxcxrnr or

rmoones

HOMOG

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN LINEAL SIMPLE

*.{;'o

Tal como se vio en la seccin 5.4.I se pr-rede confirmar la condicin de mnimo de la


: * l-.; Ln si al calcular las derivadas de segundo orden, estas sorl positivas. Una forma ms
*::neral de verificacin se presentar en la seccin 6.3'1.

Los errores son t

El primer aspect<
valor esperado del er
coeficiente , del mc

Los residuos estimados se calculan por:

e:Y

TERCBRA HII

(s.27)

importantes en el ani

Para la verificaci(

5.5 COMPROBACIN DE LAS HIPTESIS BSICAS


Adems de la estimacin de los parmetros, es de fundamental importancia la
verificacin de la hiptesis bsicas citadas en la seccin 5.1. Cada hiptesis se analiza, en
particutar, para un modelo lineal simple ajustado a datos inmobiliarios.

analticos que puede


de los residuos se pu
Un grfico de res
^
[,), que presenta put
pasa por el origen, es
un indicador favoral
erores; en caso con'

figura 5.29, se pued,


ciaso, se dice que el r

PRIMERA
La vuriable independienle correspontle u los nmeros reoles que no confienen
ning una pert urbilcin aleaforia.
De hecho, en el caso de los datos inurobiliarios, las variables independientes estn
relacionadas con Ias caractersticas fijas de cada elemento tomado como referencia, por
1o que se cumple la hiptesis.

Figura 5.28

SEGUNDA

El nmero de observaciones, n,

Cuandoelmodelo

debe ser superior

al nmero

de pordmetros

estinrodos por el modelo.


Para el rnoclelo de regresin lineal sirnple, que considera dos parmetros ( ,,Y

:r sesgados yconsiste
:.i menos asinttican

:armetros son sesga

rectas. En este caso

F,),

el

;.:e de la recta de regresin exige al menos tres datos. Aunque este nntero de datos
"_,
:..:.i.r,.s cumple con las exigencias matenrticas de la estimacin, en la prctica, no es
-:-: r:nre para explicar el comportamento del mercado. La nonna brasilea NB -502/89
parmetro en las tasaciones nonnales,
=." ,:; :n mnimo de cinco datos cuando se estima un
:::: :.:Jelos de regresin con fr parmetros como mnimo k+5 datos en las tasaciones
: --:-s:s r en las tasaciones rigurosas especiales 2k+5 3ft, el que fuere mayor. Se
;-. ;::. que para medir el efecto de una variable sobre la variabilidad de los precios, se
:.:" :.r::,r ar con un mnimo de cinco informaciones sobre estavariable, aderns de las
, -:- -.;::s:rias para estintar Ia rnediageneral. Esto es un mnimo de cinco datos para
- r - r r::;rr 3::.- .stinlado. lo que resulta en una muestra mnima de 5ft datos. Adems de
:i ,; :=:: :bser,,arel eqLrilibriode lamuestra,comose indicen laseccitt3.5.2.

enlino error, hacien<


cuadrados ponderadr
nes adecuadas en la

CUARTA HIPC
Los errores son

Como se puede
estimacin de los par
Pero la rnisma es ner

H0M0GENErzAcrN

urrl'f4tP-q.tfiilifiil?iIcnsx

uNEAL srMpLE

TERCERA UrPrNSrS:
Los errores son vartables aleatorios
con valor esperodo cero y varionza
constanfe.
El prirner aspecto de esta hiptesis

es de difcir verificacin, sin


embargo, as sea el
rr esperado del error aleatorio igual
a rrla constante, este puede
ser
absorbido por el
:;:eficiente ., der modero, sin provJc";;;;;"
en ros dern. .oi.i"r,"s, que
son ros ms
.-lo(antes en el anlisis de regresin.
Para la verificacin del aspeJto
devariat'tzacorstante der e,oq
existen varios mtodos
:'alticos que pueden ser encontrados
en Kmenta ( I g7g). A travs
de un anlisis grfico
:r los residuos se puede verificar.",-, f.";il;;;;
,1,07iJ,;."u"
un grfico de resduos.(e) versLrs ros
"."u.;,,rio, por
varores
er modero de regresirr
t'
i que presenta puntos istribuidos aleatoriame,.,
,orn u ulu recta horizontal que
:':sa porel origen, esto es, si, ningn
patrn definido, ",.,
como ra i*ru de ra figura 5.2g,
es
-: indicador favorabre a Ia acepiacin ae ra hiptesis " ,u.iunru
constante
para
ros
r::ores; en caso cotttrario, si.los puntos
presentan unatendencia, co'r.ro
los datos de la
u1,ii11,u"r
;so. se dice que et modeto es htroced.ri."
"l,,,un,e En er primer
y .,, ",,o,,,o ", i",.,".;Xlljl
-

'

::::i:r?:,:::*:^"::'::',.x1:

J;;;;

Figura S.28

cuando el modelo es heterocedstico,


los estimadores de mnimos
cuadrados son tambin
insesgadosyconsistentes, pero
no son Ios de menorvarianza,
es decq que no son eficientes.

ni menos asinrticamente. Las

estimacione;;;il;;;;;i;"J;'i",

parmetros son sesgadas, y ras


inferencias sobre elras
rrectas' En este caso sedebe tener
precaucin en

estimadores ae ros

y ,obr" ios parametros son inco_


el se,itoo ie
la varianza del
trmino effor' haciendo Ia estimacion
"unliru,
de los parmetros a travs "1,rtodo

de los mnimos
cuadrados ponderados' que se presenta
en la seccin 6.3. I I o haciendo
,
transformaciones adecuadas en ra variabre
d respuesta,

col,o rogartrnica o raz

cuacrrada.

CUARTA HIPTESIS
Los errores son variabres areatorios
con crisfribucin norntor.

como se puede observar ninguna


suposicin en este sentido fue necesar
ia para la
pstimacin de los parmetros
del modelo a travs del mtodo
de los mnimos cuadrados.
Ia
fero misma es necesaria para hacer inr"n.ru. y
int.*aros de conftanza.
"orrt.ui.
lxcxnr or

Trucroxm

HOMOGENEIZAC!N UTTTIZANDO MODETOS DE REGRESIN TINEAT SIMPLE

HOMOGE

En un primer anlisis, se puede verificar esta hiptesis observando el intervalo


comprendido por los residuos estandarizados (" i

),"ttot

seencuentrandividiendocada

residuo(e,) por ladesviacinestndardehnodelo(s),calculado por(5.32), toda vez que en


una distribucin normal ,68Yo de estos residuos estn en el intervalo [-l; + 1],90% entre
l-1,64;+ 1,64)y 95% entre [-1,96 ;+ 1,96].
Un histograma de los residuos presentando simetra y forma parecida a la curva normal es un indicador a favor de la hiptesis de normalidad del error. El grfico de los
residuos es el que arroja los mejores resultados en este sentido.
Para la construccin del grfico normal de los residuos se deben plotear los puntos
correspondientes a cuartiles muestrales de los residuos ordenados versus los cuartiles
tericos de la distribucin normal, que s resulta en una recta se puede verificar la hiptesis de normalidad. El coeficiente angular de esta recta es una estimacin de lavaanzay
es un coeficiente lineal de la media. En el caso de la distribucin N (0,1), los puntos se
deben situar sobre la bisectriz del primer cuadrante.
Se observa que el campo de variacin de la distribucin normal es todo el intervalo de
los nmeros reales, mientras que los precios de los inmuebles son estrictamente positivos.
Esto hace que la distribucin normal no sea la ms apropiada para los datos inmobiliarios.
Una solucin que ha sido bastante satisfactoria es el cambio para una escala logartmica,
puesto que el logaritmo del precio abarca toda la recta real. Cuando el logaritmode los

perfecta y tl= 0. Cuar


El estadstico r/fue
2,5%oy 1o, considera
variables independien
cuentran en el apndir
Para probar la hipr
una hiptesis de que
ecuacin (5.28) y desp

-sid,,<d<4-d,,,
correlacionados a fav
establecido.

-i d < d,

se acept

-Sid>4-drseac
-En los dems casr
La representacin

preciostieneunadistribucinnormal,sedicequelosprecios tiene unadistribucinlog-normal.


Estadistribucinsehamostrado aj ustada a los datos inmobiliarios.

QUINTA HIPTESIS:
no estdn correlacionaclos, es decir, que son inclepndientes baio ta
condicin de normalidad"
Los errores

El concepto de independencia de los res iduos esta li gado

a la

independencia de los datos

Regin uto-regresin
PosidYa

de mercado. Una situacin idealesaquelladondecadatransaccinserealizaindependien-

tementedeotra. Estoes,elconocimientodelprecioylascondicionesdeunatransaccinno
interfieren en la otra.
La existencia de autocorrelacin en los trminos de la perturbacin aleatoria se puede
verifica con el auxilio de la razn de Von Neumann, dada por:

I(", -t,-,)'
d=-"

I'i

(s.28)

indicios de autocorrel

Aplicocin 5.1

es el i-esimo residuo del modelo, ordenado de manera creciente con

relacin a

lo-r r alores aj ustados, considerando una muestra de tamao n.

d:2 ( t - r ),donde r es
r=-1 los residuose, Y -, estn perfectamente
s
,.,
::::el::.:r.a.josnegativamel'fteyd=4;sir=*Isetieneautocorrelacinpositiva
Para n srande se demuestraque
. De manera que

e::i e )
i-:a.,

A-. Drrrs

Un srfico de e v

fuerte idicador de l'a c


la situacin cuando lo

i=l

donde

Se puede demostra
autoregresivas, los es
pero ya no son eficien

el coeficiente de correlacin

En la tasac in de un

unmodeloderegresin

d=2,2.Sepideprobar

HoMoGENElzAoxutlltflg-o-Tp,il

*'fj:_l:,|:9:rr9:
la
In

luv

autocomelacin

r = 0 y tF

2.

,9]:'39,.]:."r/fuerabutar'piri*i;':i;;'"',;;:,,;,[: jf
2,5yoyrz,,.o,*ia",ffi
;ff J.TTZ,;;,:T:1if ffi
::::lTi,if]ll:
rariabres i,a.p",Ji.,;.:;ililIffiil",::'i#:,:;.i[1:T.]i.,"[:;::1,"1:::1'^::'
rs, ssraDtectenoo los limites
crticos d y d Estas tablas se
,en_
.rT:::i:::]:|^"l91:: I,.con las.idenrificaciones ls,
,,.
ro ylir:.ipl"ti,ur"nt".
para p ro b r
'],:]
n
L I il [','fi
T:l'Jff : i:,
lJni;: [:1T: : l";
correlacionados
(Hr) contra
(fir)
"
una
a

l<

nl

EGREsrNuNEALsrMpLE

hiptesis de que los residuos no;rr-,


"'J,'
r ;;;il";:rIrauronaoos
correlacionados
-vrv'v'vrrquur (l1r),
\'I17''fr se calcula r/
con
con la
ecuacirr15
ecuacin
(5.28)ydespus secomparac";i;;

?R\w^ecn,,o

_sid <d<4-. renhnzorr


lrna,.crticosd.ydudelaformasiguiente:
u
i u' u"il il;;' ! i : [ il 3 i ? [' i :5J
::U;
; I 1,1 ;l ul"l'
i
;
"
:,
:^l
I
11u,1'
;
l
"
o, u ; ^
iii, ;ffiH::#:?J
""
:*,il:::"i:
:
[J;
J
:
;;xffi
"
"
x
;
:,Tf,1: ::l
establecido.
-li . d, se acepta la hiptesis de auto-regresin positiva.
-:i I
;

q,

4.- d

,se acepta la hipOtesis d. uriJ_."gr"sin negativa.

-En los dems casos la prueba ro


concluyente.
La representacin grficade ra prueba
",

il;;

ser visuarizada en ra figura 5.30.

Regn no concluyente

Regin de no auto-regresin

R.gn auto,r$esin

L.-..-.}

d,

d,,

(4'du)

Posrva

(4-dr)

Figura 5.30

Regn auro-retresin

Ne8ativa

Se puede demostrar. con facilidad (Kntenta-1978)que


cuando las perturbaciones son
autoregresivas, ros esrimadores .
,,i,ii*, craara, ,n-i,irlrguaos
y consistenres,
pero ya no son eficientes, ni
menos

asintoiicamente.

.i".:,it,it"l:u:ff itr:t

l:ilrft1ai;.1.{lii4n*:.,'f

1?3J:::i.::iffi
i3jfliffL"J#,::i:.!TI[,ffij.fffiiJgl ]ispuestos.";;s;;;;,;;;.i;: p,;1,.hll
Aplicocin 5.1
En la tasacin de un inmueble,
donde fueron considerados

25 datos de mercado, se utliz


unmodeloderegresinlinealsimpley..ouiruo"ororesurtadoelestadstic
odevonNeuman
c=2,2.sepideprobar ra hipes;,

no uuio-regresin

.n ,t ,oa"io para un niver

lxcxrdr o TrsrqoxEs

de 5%.

ry

HOMOGE

HOMOGENEZACIN UTILIZANDO MODETOS DE REGRESIN tNEAt SIMPTE

SoIucin:

1) Se encuentra en la tabla I.5, apndice I, los puntos crticos tabulados por DurbinWatson, que estn en la primera columna y la linea 25, esto es:

d,,:1,29

du

1,45

2") Definir las regiones


du

dL

1,45
1,29
no auto-regreson
auto-reg. no
positiva concluyente

4 -d,

residuos, pues cuandc

4-d,-

estandarizados estn e
mayora de los puntos r

2,71

2,55
no

concluyente

auto-reg.
negativa

1,45y2,55,se
3")Verificarencualreginseencuentraelvalord=2,2.Comodestentre
de
significanciadel5oA.
al
nivel
puedeconcluirquenoexiste auto-regresin en los residuos

5. PUNTOS ATPICOS
Aderns de las cinco hiptesis bsicas es imporlante verificar si hay presencia de
outliers o puntos influyentes, todavezque los estimadores de mnimos cuadrados no son
robustos cuando purrtos de esta naturaleza contribuyen al ajuste. En este caso, el modelo
no se ajusta bien ni al grueso de los datos, ni a los datos cotl un punto atpico.
Un punto atpico debe ser analizado aparte con bastante cuidado, pues puede haber
sido ocasionado por errores de medida, o por algn cambio en el compoftamiento de la
muestra. Es aconsejable que se haga otro ajuste excluyndolos y comparando el nuevo
modelo con el anterioq obtenindose de esta forma informaciones respecto a sus influencias
sobre los parrnetros estimados y tanrbin sobre el poder de explicacin de la ecuacin

Pero puede ocurrir

estandarizados fuera d
ejemplo los indicados
provienen muy probal
aquel de una muestra q

5.33. Observe que tod


discrepante en relacir
datos provengan de un
que es un procedimier

con residuos estandari


disponibles en el merci
de los residuos. El aju

Gama, Binomial, Poiss


dos, asunto que ser tri
gi

+2
+1

de regresin.

5.6,1 OUTLIER
Se denomin a

outlier al dato que tiene un residuo grande en relacin a los dems que

c,rnponen la muestra.
Esros puntos pueden ser detectados con facilidad a travs de un anlisis grfrcode los
residu,-.s estandarizador (.i) versus los valores ajustados correspondientes (i ). no,
e_ e:rp,... para puntos dispuestos como los de la figura 5.3 1 , aquellos destacados pueden

sei ca:fJlerizados coto oufliers.


{lb-erese el hecho de que el punto tenga un residuo estandarizado superior a2,en

..: --::::l::,:,.estonoirnplicanecesariamentequesetratadeunoutlier.Estaindicacin
-=- . '_- - ;) r:r-.p-rr-tante para detectar urra informacin respecto a la nonnalidad de los

V;'1i':

L'::

D$r^j

Figura 5.32

5.6.2 PUNTOS INFLUY

Se entienden por pu

algunas veces hasta nul


pletamente las tendenci

H,M.GENErzAoN

u,l!4q'9

ltlri,,,ri

uNEAr'

P'fi'REGREsTN

sTMPLE

ei

+2

aaaaa
tati'

FIGURA 5.31

-a; iuos' pues cuando


los datos presentan estas caractersticas,
95yo desus residuos
:rr':darizados estn entre -r,g6 y +1,g6,esto
es, aproximadan-lente entre -2 +2.
r;'' ':ra de los putttos estn entre Lstos Irmites
s Ia
existen indicios favorables de
:-:'l puede ocurrir que una
normalidacl.
mLrestra con. dispersion g.nJ.,
con rarios residuos
x--:ndarizados fuera del intervalo
[-2:+2),sin aparenta. pi,-,ri", aircrepantes. como
por
*'=:rplo Ios indicados en ra figura
\.t2. restecaso que se puede inferir que
ros datos
de una distribucin c,rru. u;,
conrrario

il,.i. J#frJ#l"o,.,r.nt"
: : _: o b serv" 0,,.,"0'll

iJ:ffliJ :liix.Jl li, i:Jff :'

puede ser

";."

lf ii*

;T;l,r:?:..,i"ff
s':repante en reracin a ra masa
de datos. En un caso .,ro
es probabre que ros
r::'-s provengan de una pobracin
"r,..rru
con distribucin binomol. o"
:

l-3 es un procedimiento peligroso considerar


:::: residuos estandarizados fuera de los

forma. se

purrtos outriers que apenas


'erifica
se presentan

lilnites

_2

y +2.o,rolru.",

al_qunos sistemas
.-'ponibles en elmercado' De
aqu se ve Lna.vez_ms la mportancia
dei anlisis grfico
ir los residuos. Er ajuste de ros datos .o,, dirrribrciones
ii.r",ri., a ra normar. coro
iJra, Binomiar, poisson y
otras,

--s. asunto que ser tratao

sro es posibre a travs;";;;;;i",


rineares _senerariza-

e, el capitull t.
a
a

aoao
a

aaa

aa
l

ftura

a^

Oaaaaa
aaOaO

5.32

Figura S.S3

[..r rr*ros rNFruyENrES


e entienden por puntos influyentes
aquell(

;;; i,;;ffi ;:ffi i,


l"d;;;il;;; ;;iiil;:]

unas veces hasta nuros nre cF rricro,.^i^,^ ,^1tpietarnente tas rendencias


l::' naturales
: Y : ::

lf H:: [Tl']::T^'t:

;,'r;:.,

p'nto'.que tienes pequeos residuos,


iendo alterar com-

lxoxrrnr or Trucroxrs

\[

HOMOGENEIZACIX

Urru4xoo uoorosrP, lcRslx LINEAL

HOMOGI

SIMPLE

puntos, como el de Cook,


Existen varios criterios estadsticos para detectar estos
del comportamiento grfico de
presentado .n tu r...in S, p..o con un simple anlisis
a cada variable independiente se
la variable dependiente o delos residuos en relacin
punto con oaractersticas
el problema. En la figura 5.34, por ejemplo, un
En este caso el punto tiene
como el sealado indica la presencia de un punto influyente'
parece
estar bien ajustado' pero
y
5'35
residuo cero, como ,e puede observar en la figura
que la tendencia del mercado es la indicadesvirtua completamente el modelo. Mientras
para la
de la figura 5.34, elpunto influyente modifica la tendencia

En Pereira (1970)

Coeficienl

I'l :

;;;;i#

da por la recta I
situacin de la recta

0 <lrl<(
0,30<lrl<0
0,70<lrl<0
0,90<lrl<0

l.l :

2 delamisma figura'

5.8 COEFICIENTE
Y,

El cuadradodelcor

indicaelpoderdeexplr
radas.

R:f
Porejemplo, sien
como lanicavariable

Figura 5.35

Figura 5.34

indica que el 90oA de


rea.

5.7 COEFICIENTE DE CORRELACIN


en el anlisis de un
es unamedida estadstica importante

El coeficiente de correlacin
lineal entre las variables explicada
modelo de regresin, pues informa la dependencia

(f)

y explicativx(X,),se calcula Por:

'=ffi
I

G,

5.9 DESVIACIN

La desviacin estl

a datos

por una,

-ixv,'71
(s.2e)

prximo se encuentre el modelo de la


Este resultado vara de-l a *1. Cuanto ms
variables involucradas y cuanto ms
unidad, mayor ser la dependencia lineal entre las
cercano a cero, menor ser esta dependencia'
a una recta creciente'
cuando r > 0 la correlacin es directa, correspondiendo
recta horizontal'
r = 0 la correlacin es nula, correspondiendo a una

Para el caso de ur

,,:

cuando
a una recta decreciente'
cuando r < 0 la correlacin es inversa, correspondiendo

En el modelo 5.32
a) El denominador
cada parmetro estim

que el mdulo del coeficiente de


En un modelo de regresin lineal simple es deseable
sea cercano a la
conelacin entre la ,uriubl. dependiente y la variable independiente

b) El cuadrado de
media de los cuadradc

unrled.

pi-"-t

A.,ii gsia:

modelo. Entre dos m

HOMOGENEIZACIN UTIT]ZANDO MODETOS


DE REGRESIN UNEAT SIMPTE

En Pereira ( 197}),existe la siguiente clasificacin:

Coeficiente

lrl :o

0 .l.l<0,30
0,30<lrl<0,70
0,70<lrl<0,90
0,90<lrl<0,99

l.l :

Correlacin

--

nula
dbit

media

fuerte
fortsima

perfecta

5.8 COEFICIENTE DE DETERMINACIN


Elcuadradodelcoeficientedecorrelacin resultaen elcoeficiente
de determinacin, que
'ndicaelpoderdeexplicacin delmodeloen funcin de lasvariables independientesconside-

:adas.

R=

12

(5.30)

Porejemplo, si en un modelo para la tasacin de un lote de terreno


se consider el rea
:omo lanicavariableparaexplicar laformacin de los precios y
se encontr R=0,90; esto
::dica que el90oA de la variabilidad de precios observados rL d.b.
a variaciones en el

3rea.

5.9 DESYIACIN ESTNDAR DEL MODELO


La desviacin estndar de un modelo general con p parmetros
estimados.
a , datos Y,por una ecuacin de mediai, est dado por
la expresin:

Para el caso de

s:
e

aj

ustados

(s.3 1)

unarectap:2,

se tiene:

zt,-t,)'

(s.32)

En el modelo 5.32, se puede observar lo siguiente:


a) El denominadot (n-p) representa el nm-ero de grados
de libertad del modelo, pues
cada parmetro estimado provoca ra prdida de un glado

ostiue;ao.

b) El cuadrado de la desviacin estindar indica la vaanzadel


sistema. Esto es, la
media de los cuadrados de los residuos. Esta es una medida
importante de diagnstico dei
modelo. Entre dos modelos satisfactorios, se debe

"r.og.,

uqu"l .

-.ri

lxcurnr or

varianza.,

Truooxtsp

HOMO

ry;K

LTNEAL SIMPLE
HOMOGENEIZACIN UTILIZANDO MODELgIPESEGRESIN

importante es que cada


porque las estimaciones son ms precisas. Otra informacin
en lavarianza residual' si la reduccin
variable includa en el modelo g"nr.u rnu."duccin
es importante para explicar mejor la
es significativa, hay indiciosle que la variable
la variable no debe ser includa'
variabilidad de los precior, .n
"u.o "ontrario,

5.IO PRUEBA DE SIGNFICANCIA DE LOS PARMETROS


La significancia individual de un parmetro F,
La hiptesis a ser Probada es:

se

mide

(H":0,-o,contra
.J " ',''
la' B, *o

travs de una prueba I aislada'

(5.33)

Probarlahiptesis5.33paraunparmetroB,'correspondeaunavariableX"es
semejante a Probar:

Lanormaparatal
prueba unasignifica

rigurosa especial.
importante en el modelo, contra

Para el caso de li

los fenmenos en estudio y debe


: la variable X,, es importante para explicar
participar en el modelo.

s(bj) = s,

nula (I1r), ya que el tasador presume

As, lo que se pretende es rechazar la hiptesis


los precios'
que la variable enprueba influye en la formacin de

los residuos, el estadstico de la


Una vez aceptada la tendencia de normalidad de
prueba es:

j ---

4
'

Donde

s(b)

b,- 0i
s@i)

tr

Aplicacin 5.2
En la tasacin

responsable por las r


de 21 datos de merc

v:

(s.34)

parmetro estimado ,'


esla desviacin estndar correspondiente al

*tienedistribucinf destudentc onn-pgradosdelibertaddonden es


es, para un
elnmerodedatoide la muestraypes elnmerodeparmetrosestimados'Esto
modelo de regresin simple: n - 2 grados de libertad'

900 -

donde el trmino er
parmetro estimado

sedemuestraquef

Asparaprobarlahiptesis5,33,aunniveldesignificanciarcparaunmodelode
regresin lineal simple, se compara

,,

t]

=l#l

Ynrtt*t

Atvs Drus

Solucin:
1o) Encontrar el

estimado entre su

t,:

(s.3s)

essuperior 4tt-nn:n-2),serechazalaH,,,indicandoquelavariable
para explicar el fenmeno' La prueba
ctrrrespondiente al parm.t.o proUub importante
5'36'
es 'llateral puede ser observada en la figura

con/,i-...,,-rl.Si

Sepideprobarlar

de

llo/81: I

2o) Encontrar en

Student para el nive

o,rrr,

,r

:2,09

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN UNEAL SIMPLE

"rf{I;p!-

,
- t.l_t:;(n_2)

Rechaza

Ho

'ta

<-l-+

Acepta

t_;;(n_2)

Ho <-l-+

Rechaza

Ho

Figura 5.36

Lanormaparatasacin deinmueblesurbanosNB-502/sg,delaABN!exigeparaesta
Prueba unasignificanciamximadel5% en lastasacionesdeprecisin rigurosay l}Yoenla
rigurosa especial.
Para el caso de la Regresin Lineal Simple, el s(bj) es calculado por la expresin:

donde s"

s(7) = 5,

(s.36)

Aplicacin 5.2
En la tasacin de un local comercial, se eligi la edad (X) como nica variable
por las variaciones de precio unitarios (Y), en R$/m2, con base en una muestra

=sponsable

:e 21 datos de mercado, obtenindose la siguiente recta de regresin:

Y:

e00 - 10 (B) .

(s.37)

el tnnino entre parntesis corresponde a la desviacin estndar del respectivo


;armetro estimado.
,-rnde

Sepideprobarlasignificanciadelparmetrocorrespondienteala

edad al nivel del5%.

1") Encontrar el I calculado por la ecuacin 5.35, esto es, se divide el parmetro
srimado entre su desviacin estndar, y se obtiene:

t,:

ll0/Bl:1,2s

2o) Encontrar en la tabla 12 del apndice I, el punto crtico de la distribucin r de


\',,dent para el nivel del 5% y 19 grados de libertad, que corresponde a:
I o,orr, ,r : 2,09
lxcxrnil or

Tosocroxmff

SIMPTE
HOMOGENEZACIX UNUZIXOO MODELOS O NCNSIX UNEAT

=qAM"

3") Comparar ,1 calculado con t o,rrr,,r

Se demuestra (

es inferior a t o,rrr; te) , .se concluye que el parmetro poblacional


correspondient" a la edad no es iignifiativo al nivel del5%'

- como lrrl

5.I

HOMOI

PRUEBA DE SIGNIFICANCIA DEL MODELO

parmetro individual'
La hiptesis a ser probada en este caso es la misma que para un
toda vezque el modelo slo tiene un parmetro a ser probado'

Considerndose un I
se encuentran los si1

. (n

(n

-l)

para

-2)

para

(.

coeficientes de la re,

.Uno(l)
:

paruZ(i

= O,contra
Dividindose

(s.38)

ca<

encuentran las corre

{; :Bt+0

-Yarianzatotal
Esto es semejante a Probar:

.1^

: el mercado debe ser explicado por una recta horizontal.


mercado debe ser explicado por una recta inclinada'
t

-Yarianzano

extr

{ A, "f

5.37.
La visulizacin grfica de la prueba es mostrada en la figura

=b"*br'x

-Yarianza explic

Con esto se pued

tablaANOVA, como
la seccin 6.5.1.
Tabla 5.1

Figura 5.37

(I',) con relacin


Observe en la figrrra 5.37 lavariacin total de un punto observado
a lqvariacin
a la recta horizontal )/, puede ser expresada por una parte correspondiente
(f,1, ms la
de este punto (Y,) con relacin a su valor ajustado sobre la recta iclinadu
(f,) y.la rectahorizonr ariacin existenie entre el punto ajustado sobre la recta inclinada
la recta de
explicada.Por
ul ,. As..la variacin toial ({ --D .. igual a una variacin
- f,)' es
(f,
regresin -h rns una variacin no explicada por la recta de regresin
decir. para un punto
A-^
:- D : d,-Y

bArts

se tiene:

Drrrrs

Y,-t

(s.3e)

-Tabla

Explicada (modelo)

No explicada (error)

Observe en la figur
fuese grande y la no e

lo, se analizalarazn

*XlIFf-

HOMOGENEIZACIN UTILIZANDO MODELOS DE REGRESIN


LINEAL SIMPLE

Se demuestra (Kmenta 197g) que


(y, _ V),
Considerndose un modelo de regresin lineal simple ajustado
se encuentran los siguientes grados de libertad para
cada una

&, _T),

* [ t]- _ i- t,

una rnest*- o. i, r,r.


le las sumatorias:

. (n

-l)

paru

y,- F7', pues slo

se conoce un parmetro estimado, que es

'-(n.J) para (Y - i', pu.r invorucra las medias estimadas de b,,y


coeficientes de Ia recta cle regresin definida por i,.

l-

,, queson ros

'uno(1) paraZ(?,-r7',correspondientealresultadodeladiferencia entre(n-t)-Qt-2).


Dividindose cada una de las sumatorias por sus respectivos grados
de libertad,

encuentrall las correspondientes varianzas, esto es:

se

Zs,-1'

-Yaianzatotal
-Yarianzano explicada

-1

-2

(f,-f,)'

-Yarianza expli,cada

Con esto se puede hacer una tabla de anlisis de varianza. tambin


conocida como
tabla ANOVA, como se demuestra en la tabla 5.1 . Un caso ms general
se presentar en

seccin 6.5.1.
Tabla 5. I

Tabla de Anlisis de yarianza


Sumatoria de los cuadrados

Grados de

libertad

t,-tl

Explicada (modelo)

scR

\o

scE: f1',,-i'

explicada (error)

t/

exp:

t,-tftt

vn exp : r,-?ln-21

ltot

- fA'-i)rt(n-)

Observe en la figura 5'3 7, que la situacin ideal sera aqLrella doncle


Ia varianza expiicada
tuese grande y la no explicada pequea. As, para probaria
significancia global deimode-

io, se analiza laraz6n entre las cros varianzas por er estadstico:

,' =lt -rl=,fu-z)


I

Ilr,-tf

(s.40)
lxcrxrrr or Trmcroxrs

HOMOG

LINEAL SIMPLE
HOMOGENEIZACIN UTILIZANDO MODELOS DEXEGRESIN

mayor sea la probabilidad


Este estadstico presentar un resultado un tanto mayor cuanto

modelo a aceptado para explicar el fenmeno en estudio'


de Snedecor con I grado de
Se demuestra que,F., bajo taliiptesis ar), tiene distribucin
libertadenelnumeradoiy i-Zenaenomiiador.EstadistribucinfuetabuladaporFisher'

Ce que el

LospuntoscrticosparaunniveldesignificanciaocessimbolizadoPll!r*,i;i 1,,:Ei-t1:
prnto, estn en las tablas 13 y 14 del apndice I paralos nveles del 5oA y 1%o, donde el
'ni,*".o de grados de liberta del numerador s indica en la columna y 9l nmero.de
en la lnea, donde se localiza el punto crtico
_*uo. . l-erta del denominador se indica
correspondiente.
--

2"pncontrar el pur

un grado de libertad r
en la primera columr
3o) Comparar

I'

concluye que el modt

5.I2

INTERVALO

oc, es necesario que

ripuru rechazar la hiptesis nula de no haber regresin al nivel


no
,F sea superior aF,*. t,,-:,; en caso contrario, hay indicios de que la recta inclinada
.-pii., ,l.lor el feimn qu" la recta horizontal. debiendo ser sta ltima la escogida.
La prueba es unil

ral y puede ser observada a travs de la figura 5'38'

El intervalo de cot
recta de regresin, es

t:f tt.
.t

t_:

(n_

s(t)

donde
es la de
modelo de regresin I

I:Yo ltr_n,r..rr-,

de

rechazo de Ho

Ho

Figura 5.38

que sea
La norma para tasacin de inmuebles urbanos N F-5029 , de la ABNT, exige
del
5% en
significanciamxima
de
p.ouuou tu hiptesis de anlisis devarianzaaun nivel
ias tasacionei de precisin rigurosa

del1oA en la rigurosa especial.

Aplicocin 5.3
Considerando los datos de la aplicacin 5.2,y sabiendo que la varianzaexplicadapor
modelo
el modelo es 16 y la no explicada s igual a 40, s pide probar la significancia del
al nivel del l%.

Solucin:
1") Calcular el F. por la ecuacin (5.40),

Fr=
Sustitul endo los resultados,

Yn.,r.t

Aivs

Drrs

se

r,
_-_

(Yi

- Yi)'

72
^j.

(n-2)
I

tiene:

16 (21-2) -/
f.=zo^_=/.o

La norma para la t
intervalo de confianzi
intervalo se consider
Como se puede ob
cuando el bien tasabl,
los datos muestrales,
campo muestral. En e
ms cercanas a las car
en las extremas.

La variacin del il
5.39.

HOMOGENEIZACIN UTII.IZANDO
M

=_q.HwEcREstN

UNEAr stMprE

2")Encontrarel punto crtico de Iadistribucin


de snedecor; en latabla14, apndicel,con
un grado de libertad en er numerad
ory rgjaaos en er aeromi;;;r, esto
es, se encuentra
en la primera corumna err ra
t9^ tieaal
v
, , ,r,= 8, r 9.

at i,

"JJ';;;,

*i,1f""fi:'Jll,*J,x',g;*+,.,',T:,*;:,i:res,inrerior
5.t2 |NTERVATo

DE CONFTANZA PARA

F00,,,:,e,=B,re

El intervalo de confianza a.un niver


de (r - cc), en torno de un punto
1xo
rccta de regresin, es calculado por

I:Y t) f t t-q:

,,-

.
rr. -(YO)

se

t-q,2:(n-2)

"c

;\),

sobre ra

(s.41)

donde sYn es la desviacin esfndar


carcurada en torno ar
modelo de regresin rinear sirnpre,

I=Y o *t

se

punto(x.; %). para un

tiene ra siguiente expresi:

I (Xo
--z dondes :
'--- - X)2
-+
n (Xi - X)2

(s.42)

La norma pararatasacin de inmuebres


urbanos NB-502/g9, de raABN!
admite un
intervalo de confianza mxima del80%o,o
una significancia *rrima del2%.para
este
intervalo se considera q :20yo.

como se puede observar en la expresin


5.42,lamenor amplitud del intervalo
ocurre
cuando el bien tasable posee caractersticas
iguales u ru *.iu " las caractersticas
de
los datos muestrales, esto es,
=X Las rnuyo.., amplitudes ocurren en la frontera
del
campo muestral' En este caso, ls
estimaciones ms piecisas ocurren para
las tasaciones
caractersricas medias de ros datos a"
,"r"r.n"iu y ru, ms imprecisas,

}"t"::ffiaras
,.rrtu

uur'urin der intervaro de confianza


en torno de

puede ser vista en ra figura

?=bo+b,.x,

Figura 5.39
lxcxrir o

Tnucroxstff
j

HOMC

_.qI;Im

HOMOGENETZACTN UTTUZANDO MODELOS qEBEGRESIN

tlNEAt SIMPLE

Para la tasacir
distancias arl centro
r

La estimacin de un intervalo de confianza en torno de un punto cercano a la frontera


caractersde la muestra o cuando se trata de una muestra extrada de una poblacin con
estimacin
una
decir,
es
amplio,
bastante
puede
ser
intrvalo
del
tica platicrtic4 la amplitud
basiante imprecisa parala media. En estos casos, es preferible reducir la confranzay
que lamuestra
obtener un intervalo de variacin ms estrecho. En una situacin opuesta, en
podra ser
la
confianza
es extrada de una poblacin con caractersticas leptocrticas,
una
preferible
pues
es
ampliada. Esto ser bien informativo para el que toma decisiones,
no
estimacin con 99%o de certezaque otra con apenas 800/o, por ejemplo. Pero el tasador

lL

por cuestiones normativas.


le est permitido de presentar un confianza mayor en su trabaj o,
en torno de la media, a
variacin
de
aceptables
Serams coherente establecer intervalos
contenido en ellos'
mercado
de
O. all, calcular la probabilidad del verdadero valor

furtl.

Con base en los

I - Verificargrfic

Aplicocin 5.4
mercado y el
Considerando los datos de la aplicacin 5.Z,estimar el valor medio de
sabiendo
intervalo de confianz a al 80%o para un local comercial con diez aos de edad,
100'
a
igual
punto
es
que la desviacin estndar en torno a ese

Solucin:

l") Estimar.'l\alor medio de mercado sustituyendo xo= l0 en el modelo

Y:
que coresponde a vn

900

10.

Yo: R$ 800,00/m2

+tro,,r.s(to)

Entrando en la tabla 12, delapndice

I, se encuentra t oo. ,, :

1,33. Sustituyendo los

resultados, se tiene

I:

800

+ 1,33 . 100 I

800

133

lmite inferior de R$ 667,001m2 y un lmite superior de RS 933,00/


rf. E*o es, hay una probabilidad del 80% de que el valor de mercado est entre esos
lmites del intrvalo de confianza.
Asl

ecuacin.

Estimar los p,
cuadrados".
La ecuacin dr
Los coeficiente
Calcular la des
Construir la tal

3456
7 - Probar la signi.
8 Probar la signif
del5%o e inter
9 - Encontrar un il

2') Estimar el intervalo de confianza por la ecuacin 5.41, es decir,

/: t"

tro urbano. In

se encuentra un

l0 - Analizar el gr
I I - Probar la hipt
12
13

- Probar la norm
- Estimarel'oval<

14

urbano.

Estimar el inter
estimado e inte

5.I3.2 Para Ia tasa


tomndose como val
y como variable ind
present los siguient

a) b,,:7yb,

estimador del parn

5.I3

EJERCCIOS PROPUESTOS

5.t3.I Se propone un ejercicio bastante sencillo, que debe ser resuelto sin necesidad de
rilizar ningun sistema de tratamiento de datos. Su resolucin es fundamental para ente*'
& et desarrollo de los dems asuntos abordados en los captulos siguientes'

t*c

tuws Drrrs

estndar correspond

b)
c)
d)

Coeficiente

F":25
Desviacin

HOMOGENEIZACIN uT[]zANPg_MqDELOS DE

X;;?:

Para la tasacin de un lote de terreno, se recolectaron


cinco datos relativos a las
distancias al centro urbano y Ios respectivos precios
r.lnitarios. ,"g, .l cuadro siguiente:

dato

distancia
(km)

precio
unitario
(RS/m'?)

Con base en los datos recolectados, se pide:

I - verificargrfrcamente el compoftamiento del precio unitario


con la disrancia
tro urbano. Interpretar Ia figura, trazar una recta de re.sresin .
2

ecuacin.

Estimar

los

cuadrados".

'

al cen-

encontrar-su

parmetros del modelo de regresin por el "mtodo


de los mnimos

- La ecuacin del modero co, su respectiva interpretaci,.


I - Los coeficientes.de."correlacin"y:'determinacibn", con las debida.-. inrerpreraciones.
5 - Calcular la desviacin estndar dl modelo.
6 - Construir la tabla de ANOVA.
7 - Probar la significancia del modelo al nivel
del 5%e interpretar el resuirado.
8la significancia del parmetro correspondiente a la variable
disrancra. al nivel
!r9b-a-r
3

del 5oA e interpretar el resultado.

- Encontrar un intervalo de confia nza del g0% en torno de b


10 - Analizar el grfico de los residuos estandarirrdos
u..ru, .,llor., ajustados.
l1 - Probar la hiptesis de no auto-regresin al nivel de 5oA.
l2 - Probar Ia nonnalidad de Ios residuos.
l3 - Estimarel"valorunitario" rnediopara un lotedeterrenoque est
a 1.5 km delcentro
9

urDarlo.

l4 - Estimar el intervalo de confianza al nivel del 80% en torno del r


alor unitario medio
estimado e interpretar el resultado.

5'13'2 Para la tasacin de un apartamento se recolectaron 19 datos


de referencia,

tomndose como variable,deperrdiente el precio unitario


en RS/, de area priv;il(Apj
y comovariable independiente ra edad (E). Er modero
escogio fue
present los siguientes resultados:
"r "*pfr"n.;i;;

(0,005), que representan: los trminos independiente y


j^,7
el
!^!l -- -0,02
estlmaoor
^*?)^^!: del parmetro
correspondiente a la covariable edad, estando la desviain

estndarcorrespondiente dentro de los parntesis;


b) Coeficiente de correlacin entrb Ap y E igual a _ 0,95.

c)
d)

F":25

Desviacin estndar del modelo igual

a 0,30.
lxcxrrh or Txrcroxrs

-[p

..ryH

nOUOGXlZlClx UTIUZIXDO

MODELOS O.

nrCntstX tINEAL

e) Estadstico de Durbin-Watson d:1,90

f)

SIMPLE

entre
Residuos estandarizados en los siguientes intervalos: 70oA

-1;+11;90%

entre [ 1,65 ;+ 1,65] y 98Yo entte | -1,9 6; + 1,961'


Grfico de los Resduos vs Valores Ajustados:

g)

LAHOMOGENEz

6.I INTRODUCC
El modelo de regr
una variable indepenr
Con base en los datos indicados se pide:

a)
b)
.i
di
"i
0
g)
)
i

La ecuacin del modelo exponencial con la debida interpretacin'

[nterpretar el coeficiente de correlacin'


El poder de explicacin del modelo con la debida interpretacin.
edad al nivel del5%o;
Prbar la significancia del parmetro correspondiente a la

Probarlasignificanciadelmodeloalnivel dell%'
Probar la no auto-regresin al nivel del2,5Yu
Analizar. lo\residuos y su normalidad'
Analizar el grfico de los residuos en funcin de la homocedasticidad'
apartamento
Estimar el vlor medio de mercado, la moda y la medianapara un

con l0 aos de edad.


en la
Estimar la tasa mnima y mxima de depreciacin anual.de-los apartamentos

mercado.

En la Ingeniera c
mltiple, teniendo en r
un bien.

Como fue expuestr


regresin lineal simpl
observados, colocador
dependiente y otro par
dos variables indepen

ejes cartesianos: uno p

Suponga, por ejemplo


de los precios unitaric
distancias a un polo val
se encuentra un

grfic

de 90% en
,"gin abarcada en la investigacin, considerndose un intervalo de confianza
torno de la tasa media inferida.
laNB-502/
k)Atenderel tratamiento dispensado alos datos segn losniveles de rigorde

89.

-v
Figura 6.1

Observe que los pu


:egresin lineal ser re
:omo lo muestra la figu
:a para los precios de l.
.rpo:

P:bo+b,.
Vi.:.r

L,:: Drr's

Potrebbero piacerti anche