Sei sulla pagina 1di 150

E

onometra
Apuntes de Clases

Jos Miguel Benavente H.

Marzo 2011

1 Es uela de Nego ios. Universidad Adolfo Ibaez. Do umento basado en Benavente,


Otero y Vasquez (2007). Primera versin. Cualquier error es responsabilidad ex lusiva
del autor. jmbenaventeuai. l

ndi e general
1. Introdu in

2. Modelo de Regresin Lineal

2.1.

2.2.

Anlisis de Regresin . . . . . . . . . . . . . . . . . . . . . . . . .

2.1.1.

Qu es una regresin? . . . . . . . . . . . . . . . . . . . .

2.1.2.

Rela iones estadsti as versus rela iones determinsti as . .

10

2.1.3.

Regresin versus Causalidad . . . . . . . . . . . . . . . . .

11

2.1.4.

Regresin versus Correla in . . . . . . . . . . . . . . . . .

11

Anlisis de regresin on dos variables


2.2.1.

Fun in de regresin pobla ional (FRP)

2.2.2.

Espe i a in esto sti a de la fun in de regresin pobla ional

2.3.

. . . . . . . . . . . . . . .
. . . . . . . . . .

14
16

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

2.2.3.

Fun in de regresin muestral . . . . . . . . . . . . . . . .

19

2.2.4.

Propiedades de un Estimador

. . . . . . . . . . . . . . . .

22

Modelo de regresin on dos variables . . . . . . . . . . . . . . . .

25

2.3.1.

Mtodo de Mnimos Cuadrados Ordinarios . . . . . . . . .

25

2.3.2.

Supuestos detrs del mtodo MCO

30

2.3.3.

Errores estndar de los Estimadores Mnimos Cuadrados

. . . . . . . . . . . . .

Ordinarios . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

2.3.4.
2.4.

2.5.

Estimador Mnimo Cuadrado Ordinario de

. . . . . . .

35

. . . . . . . . . . . . . . . .

37

2.4.1.

Representa in Matri ial del Modelo de Regresin Lineal .

37

2.4.2.

Estimador Mnimo Cuadrados Ordinarios . . . . . . . . . .

38

Propiedades del estimador MCO . . . . . . . . . . . . . . . . . . .

40

2.5.1.

Propiedad de mejor estimador lineal insesgado . . . . . . .

41

2.5.2.

Teorema de Gauss-Markov . . . . . . . . . . . . . . . . . .

41

Modelo de Regresin on k variables

2.6.

Geometra del Estimador MCO

. . . . . . . . . . . . . . . . . . .

43

2.7.

Bondad de Ajuste y Anlisis de Varianza . . . . . . . . . . . . . .

44

2.7.1.

Modelo de Regresin Lineal en Desvos . . . . . . . . . . .

44

2.7.2.

Anlisis de Varianza

46

2.7.3.

Bondad de Ajuste:

R2

. . . . . . . . . . . . . . . . . . . . .

2
R

. . . . . . . . . . . . . . . . .

47

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49

2.8.1.

Test t (Una hiptesis lineal) . . . . . . . . . . . . . . . . .

52

2.8.2.

Test F (Conjunto de hiptesis lineales) . . . . . . . . . . .

60

2.8.3.

Intervalos de Conanza . . . . . . . . . . . . . . . . . . . .

60

2.8.4.

Test de Normalidad (Test de Jarque-Bera) . . . . . . . . .

62

Predi in . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

63

2.9.1.

Medi in de la pre isin de la predi in . . . . . . . . . .

66

2.10. Estima in Mximo Verosmil (EMV) . . . . . . . . . . . . . . . .

68

2.10.1. Propiedades de los estimadores MV . . . . . . . . . . . . .

69

2.10.2. Estima in MV . . . . . . . . . . . . . . . . . . . . . . . .

70

2.11. Inferen ia en el ontexto MV . . . . . . . . . . . . . . . . . . . . .

72

2.11.1. Test de Razn de Verosimilitud (LR) . . . . . . . . . . . .

72

2.8.

2.9.

Inferen ia

2.11.2. Test de Wald (W) . . . . . . . . . . . . . . . . . . . . . . .

73

2.11.3. Test del Multipli ador de Lagrange (LM) . . . . . . . . . .

73

2.12. Algunas a ota iones respe to a la estima in y la inferen ia MV .

75

3. Forma Fun ional y Espe i a in

77

3.1.

Regresores Esto sti os en el Modelo de Regresin Lineal . . . . .

77

3.2.

In orpora in de No Linealidades

. . . . . . . . . . . . . . . . . .

79

Test de No Linealidades Omitidas (Test de Reset) . . . . .

80

3.2.1.
3.3.

Variables Dummies o ualitativas


3.3.1.

3.4.

82

Posibles usos de las variables Dummies . . . . . . . . . . .

87

Variable Dependiente Rezagada


3.4.1.

3.5.

. . . . . . . . . . . . . . . . . .

. . . . . . . . . . . . . . . . . . .

91

Ejemplo y adverten ias sobre el uso de variable dependiente


rezagada omo regresor . . . . . . . . . . . . . . . . . . . .

93

Sele in de Modelos . . . . . . . . . . . . . . . . . . . . . . . . .

95

3.5.1.

Ejemplo: Retornos a la edu a in, diferen ias entre hombres y mujeres . . . . . . . . . . . . . . . . . . . . . . . . .

96

3.6.

Regresin Parti ionada . . . . . . . . . . . . . . . . . . . . . . . .

99

3.7.

Omisin de Variables Relevantes . . . . . . . . . . . . . . . . . . .

99

3.7.1.

Impa to sobre el Insesgamiento

. . . . . . . . . . . . . . .

99

3.7.2.

Impa to sobre la Varianza

. . . . . . . . . . . . . . . . . .

100

3.7.3.

Ejemplo

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

100

3.8.

In lusin de Variable Irrelevantes

. . . . . . . . . . . . . . . . . .

101

3.8.1.

Impa to sobre Insesgamiento . . . . . . . . . . . . . . . . .

101

3.8.2.

Impa to sobre Varianza

. . . . . . . . . . . . . . . . . . .

102

3.8.3.

Ejemplo

. . . . . . . . . . . . . . . . . . . . . . . . . . . .

103

3.9.

Perturba iones no Esfri as

. . . . . . . . . . . . . . . . . . . . .

105

3.9.1.

Conse uen ias de estima in por MCO . . . . . . . . . . .

106

3.9.2.

Estima in E iente: Mnimos Cuadrados Generalizados

106

3.9.3.

Test de Hiptesis

. . . . . . . . . . . . . . . . . . . . . . .

107

3.9.4.

Estima in uando

es des ono ida:

Mnimos Cuadrados Fa tibles

. . . . . . . . . . . . . . . .

108

3.9.5.

Hetero edasti idad

. . . . . . . . . . . . . . . . . . . . . .

109

3.9.6.

Auto orrela in . . . . . . . . . . . . . . . . . . . . . . . .

118

4. Problemas on los datos


4.1.

4.2.

137

Multi olinealidad . . . . . . . . . . . . . . . . . . . . . . . . . . .

137

4.1.1.

Multi olinealidad Exa ta y Multi olinealidad Aproximada

139

4.1.2.

Dete in de Multi olinealidad

. . . . . . . . . . . . . . .

139

4.1.3.

Otros mtodos de dete in de multi olinealidad . . . . . .

141

4.1.4.

Remedios ontra la Multi olinealidad . . . . . . . . . . . .

143

Error de Medi in . . . . . . . . . . . . . . . . . . . . . . . . . . .

145

4.2.1.

Estima in por Variables Instrumentales

. . . . . . . . . .

147

4.2.2.

Test de Hausman . . . . . . . . . . . . . . . . . . . . . . .

148

Captulo 1
Introdu in
E onometra es la ien ia que apli a mtodos matemti os y estadsti os al anlisis de datos e onmi os, on el objetivo de dotar de una base empri a a una
teora e onmi a, para as refutarla o veri arla.
Aunque la e onometra pare e ser tan antigua omo la misma ien ia e onmi a,
slo en 1930 se rea la

So iedad E onomtri a,

pr ti a. En 1933 se lanza el primer nmero de

la ual sistematiz su estudio y

E onometri a

en el que Ragnan

Frish (uno de los fundadores de la So iedad E onomtri a, a quin de he ho, se


le a redita el haber a uado el trmino .E onometra") desta a: "La experien ia
ha mostrado que ada uno de estos tres puntos de vista, el de la estadsti a, la
teora e onmi a y las matemti as, es ne esario, pero por si mismo no su iente
para una omprensin real de las rela iones uantitativas de la vida e onmi a
modera. Es la

unin

de los tres aspe tos lo que onstituye una herramienta de

anlisis potente. Es la unin lo que onstituye la e onometra".


Sin embargo, las metodologas apli adas en e onometra (los tres puntos de vista
de Frish), no han sido utilizados ex lusivamente por la ien ia e onmi a. Otras
ien ias naturales tambin han aprove hado sus ventajas. Sin embargo, en el
ampo del omportamiento e onmi o adquieren espe ial parti ularidad y relevan ia, en tanto el ambiente y el omportamiento e onmi os, son esen ialmente
no-experimentales, olo ndonos en situa iones donde todas las variables relevantes pare en moverse onstantemente y donde existen fa tores imprede ibles que
pueden alterar los resultados. Es por esto que la e onometra es esen ialmente
una ien ia no determinsti a, donde se re ono e la existen ia de fa tores esen ialmente imprede ibles que determinan nuestras on lusiones.

E onometra
Es uela de Nego ios, UAI

Capitulo 1: Introdu in

La metodologa e onomtri a se puede detallar (a grandes rasgos) segn lo enun ia la Figura 1. En primer lugar ontamos on una teora e onmi a que bus a
validez. Para ella, es ne esario en ontrar su equivalente modelo e onomtri o
(rela iones matemti as que des riban el omportamiento de los agentes involu rados). Para estimar enton es di ho modelo, se ne esita de la e ua in resultante
del modelo, los datos que ella impli a y los supuestos bajo los uales se onstruye.
Slo una vez que ontamos on di hos ingredientes se pro ede a estimar uantitativamente las predi iones o impli an ias expuestas por la teora e onmi a
ini ial. Luego, se debe realizar inferen ia o pruebas de hiptesis, las uales nos indi arn si nuestros resultados son estadsti amente signi ativos. Si la respuesta
es si, enton es slo queda realizar las predi iones pertinentes y las re omenda iones de polti a aso iadas. Si la respuestas es no, enton es, debemos revisar los
posibles errores que existan a nivel de teora o metodologa.

E onometra
Es uela de Nego ios, UAI

Capitulo 1: Introdu in

TEORIA ECONOMICA

MODELO ECONOMETRICO

ECUACION

DATOS

SUPUESTOS

ESTIMACION

INFERENCIA Y PRUEBA DE HIPOTESIS

SI

NO

PREDICCIONES Y
RECOMENDACIONES DE POLITICA

TEORIA VERIFICADA

E onometra
Es uela de Nego ios, UAI

Capitulo 1: Introdu in

Esta breve des rip in no es ms que una somera vista a lo que realmente impli a
ha er e onometra. El amino no est exento de di ultades (en trminos de la
alidad de los datos, de la di ultad de medir las variables que la teora indi a,
de los supuestos que realizamos, et ), sin embargo, esto, ms que una di ultad,
impli a un desafo.

Captulo 2
Modelo de Regresin Lineal
2.1.

Anlisis de Regresin

2.1.1. Qu es una regresin?


La regresin es un elemento fundamental en la E onometra, orresponde a un
estudio de dependen ia entre una

expli ativas.

variable dependiente

y una o ms

variables

El anlisis de regresin tiene omo objeto estimar y/o prede ir el

promedio pobla ional de la variable dependiente para valores jos de la(s) variable(s) expli ativa(s).
Por ejemplo, observemos la Figura 1, en el eje de las abs isas tenemos nuestra
variable expli ativa (X): notas ontroles, y en el eje de las ordenadas tenemos
nuestra variable dependiente (Y): nota examen.

Notas de los controles


Figura 1: Distribucin de las Notas del Examen vs. Promedio Notas de
Controles

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Podemos observar dos osas: primero, para ada nota posible en los ontroles
(3.0, 4.0,..) tenemos un rango o distribu in de notas en el examen y segundo,
el promedio de notas en el examen es mayor mientras mayores son notas de los
ontroles. Esto ltimo se puede apre iar al trazar una re ta que una los valores
promedios de notas en examen para ada nota en los ontroles (linea negra del la
Figura 1), la que orresponde a la

re ta de regresin. Esta nos permite, para

ada nivel de edad, prede ir la estatura promedio orrespondiente.

2.1.2. Rela iones estadsti as versus rela iones determinsti as


La alidad de un produ to, por ejemplo el vino, depender de omo fue su ose ha
y por lo tanto, de variables omo la temperatura al que estuvo expuesta la uva, la
antidad de lluvia, sol y los fertilizantes. La rela in entre estas variables expli ativas y la alidad del vino tiene una naturaleza estadsti a, ya que si bien estas
variables ayudan al produ tor de vino a saber ms o menos omo ser la ose ha,
no podr prede ir en forma exa ta la alidad del produ to debido a los errores
involu rados en estas variables y porque pueden haber otros fa tores dif iles de
medir que estn afe tando la alidad del vino.
La variable dependiente, en este aso la alidad del vino, tiene una variabilidad
aleatoria, ya que no puede ser expli ada en su totalidad por las variables expli ativas.
En la e onometra nos interesa la dependen ia estadsti a entre variables, donde
tratamos on

variables aleatorias,

es de ir, variables que tienen una distri-

bu in de probabilidad. La dependen ia determinsti a, por el ontrario, trata

rela iones omo la ley de gravedad de Newton , las que son exa tas (no tienen
naturaleza aleatoria).
1 La

ley de gravedad de Newton plantea que toda part ula en el universo atrae a ualquier
otra part ula on una fuerza dire tamente propor ional al produ to de sus masas e inversamente
propor ional al uadrado de la distan ia entre ellas: F=k( m1r2m2 ), donde F=fuerza, m1 y m2
son la masa de las dos part ulas, r es la distan ia y k una onstante de propor ionalidad. Esta
es una rela in determinsti a, ya que para valores de masas, distan ia y onstante sabemos
exa tamente a la fuerza que se atraen estas part ulas. Si alguna de las variables estuviera
medida on error, la ley de Newton pasa a ser una rela in estadsti a, y F se onvierte en una
variable aleatoria.

10

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.1.3. Regresin versus Causalidad


Es importante tener laro que la regresin es una rela in estadsti a, que no
impli a ausalidad apriori. En el ejemplo del vino, no hay una razn estadsti a
para suponer que la lluvia no depende de la alidad del vino. Pero nuestro sentido
omn nos ha e onsiderar omo variable dependiente la alidad del vino y no la

una rela in estadsti a


no puede por s misma impli ar en forma lgi a una ausalidad.
lluvia. Es importante re ordar de aqu en adelante que

2.1.4. Regresin versus Correla in


El

Anlisis de Correla in est estre hamente rela ionado on el de regresin

aunque on eptualmente son dos osas muy diferentes. El anlisis de orrela in


tiene omo objetivo medir el grado de aso ia in lineal entre dos variables, medida
a travs del

oe iente de orrela in. Por ejemplo, se puede estar interesado

en medir el grado de orrela in entre aos de edu a in y salario. En ambio, el


anlisis de regresin trata de estimar o prede ir el valor promedio de salario para
un nivel dado de edu a in.
Las diferen ias fundamentales son que, en el anlisis de regresin, tenemos una
variable dependiente y una o ms expli ativas, la que son tratadas en forma asimtri a: la variable dependiente es aleatoria, tiene una distribu in de probabilidad,
en ambio las variables expli ativas toman valores jos. En el anlisis de orrela in las variables son tratadas de forma simtri a: la orrela in entre edu a in
y salario es igual a la orrela in entre salario y edu a in. Adems ambas variables son aleatorias. As, si

son dos variables aleatorias, el oe iente de

orrela in se dene de la siguiente manera:

yx =

E {[x E(x)] [y E(y)]}


xy
p
=p 2 2
x y
var(x)var(y)

Lo que se al ula para una muestra de la siguiente forma:

yx

on

X=

1
n

Pn

i=1 xi e



Pn 
yi Y
i=1 xi X
= qP 
2 qPn 
2
n
x

X
i
i=1
i=1 yi Y
Y =

1
n

Pn

i=1

yi .

De ahora en adelante denotaremos on un

o obtenidos a partir de informa in muestral.

11

los estimadores de un estadsti-

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Ejemplo 1: Portales de Internet, orrela in entre nmero de visitas y valor de


la empresa:

Ejemplo 2: Correla in entre Empleo y Produ to (serie de tiempo):

12

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Ejemplo 3: Correla in entre Produ to per- apita y ranking ftbol:

Ejemplo 4: Correla in entre temperatura media del da y estudiantes ausentes


a lases:

13

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Algunas pre au iones on el oe iente de orrela in:

Cuidado uando el grado de orrela in muestral depende de solo unas


po as observa iones.
El oe iente de orrela in mide una rela in lineal. Por lo tanto, una
variable puede depender de otra an uando la orrela in sea ero si la
rela in es no lineal.
Correla in no impli a ausalidad e onmi a, es slo una rela in estadsti a.
Correla in puede indi ar rela in espuria.
No olvidar que la orrela in muestral es una variable aleatoria y que por
lo tanto, el oe iente por si slo no garantiza la existen ia de una rela in
estadsti a entre las series.

2.2.

Anlisis de regresin on dos variables

Para esta se in asumiremos que existe una variable dependiente (Y) que es
expli ada por slo una variable (X).
Consideremos el siguiente ejemplo. En la Tabla 1 se presentan datos de salarios
y nivel de edu a in para una pobla in de 60 individuos

Tabla 1: Salarios y Aos de Edu a in


Salario (Y)

E(Y|X)

16000
32868
50000
80000
100000
150000
219120
300000
547800
166199

18260
36520
54780
82170
109560
170000
273900
365200
730400
204532

10

15000
40000
58000
90000
120000
182600
280000
380000
913000
230956

11

15000
40000
60000
90000
120000
188973
328680
434120
821700
233164

Aos de Edu a in (X)

12

20000
50000
73040
100000
140000
219120
365200
500000
1064558
281324

13

20000
54780
80000
100500
160000
257880
400000
550000
1460800
342662

14

21912
60000
89000
120000
200000
300000
500000
650000
1500000
382324

15

35000
73040
100000
140000
230000
400000
600000
883085
1826000
476347

16

40000
90000
105000
180000
280000
434686
730400
1000000
2487041
594125

17

60000
120000
165784
250000
365200
600000
1095600
1643400
4000000
922220

La pobla in tiene 10 niveles distintos de edu a in, que van desde 8 a 17. Para
ada uno de estos niveles tenemos 9 individuos on distintos salarios. A pesar de la
variabilidad en los salarios para ada nivel edu a ional onsiderado, en promedio
2 Una

pobla in de 60 individuos puede pare er un po o pequea, pero por el momento


onsideremos que estas familias son el total existente
14

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

el salario se in rementa a medida que los aos de edu a in aumentan. Esto


ltimo se puede veri ar al al ular el promedio para ada nivel de edu a in, lo
que se presenta en la ltima linea de la Tabla 1, estos orresponden a los

valores

esperados ondi ionales, ya que dependen de los valores dados de la variable X.

En la Figura 2, los valores medios ondi ionales estn mar ados on una ruz. La
unin de estos valores representa la

Re ta de regresin pobla ional,

donde

el trmino pobla ional se reere a que estamos trabajando on el total de la

salario
2000000

3000000

4000000

pobla in.

1000000

Recta de regesin
poblacional (RRP)

x
10

14

12

16

18

Escolaridad
Figura 2: Distribucin de los salarios para distintos niveles de educacin.

Deni in: La urva de regresin pobla ional

es simplemente el lugar geomtri-

o de las medias ondi ionales de la variable dependiente para los valores jos de
la(s) variable(s) expli ativa(s).
En el ejemplo anterior los valores de Y (salario) no estaban distribuidos de forma
simtri a en torno al valor promedio para ada valor X, desde ahora asumiremos
que esto

si se umple, tal omo lo podemos apre iar en la Figura 3.

15

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Figura 3: Ingreso semanal y Gasto semanal. Distribucin simtrica

En este ejemplo, se ve la rela in entre ingreso semanal y gasto en onsumo


semanal, para ada nivel de ingreso se tiene un rango de gasto que se distribuye
en forma simtri a entorno al valor promedio ondi ional de gasto.

2.2.1. Fun in de regresin pobla ional (FRP)


De lo anterior es laro que la media ondi ional E(Y|Xi ) es fun in de Xi , donde
Xi es un valor dado de X:

E(Y |Xi ) = f (Xi )

(2.1)

donde f() es una fun in ualquiera, en el ejemplo anterior era una fun in lineal.

La e ua in (2.1) se denomina

Regresin Pobla ional.

Que forma tiene f() es una pregunta empri a, aunque mu has ve es la teora
nos puede ayudar bastante. Supongamos que en nuestro ejemplo anterior el sa-

lario esta rela ionado linealmente on la edu a in, as podemos suponer que la

16

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

fun in de regresin pobla ional E(Y|Xi ) es una fun in lineal de Xi , es de ir:

E(Y |Xi ) = 1 + 2 Xi

(2.2)

1 y 2 se denominan oe ientes de regresin. As el objetivo es estimar


2 a partir de datos de X e Y.

donde

2.2.2. Espe i a in esto sti a de la fun in de regresin


pobla ional
En los dos ejemplos anteriores veamos que a medida que se in rementa la variable expli ativa (edu a in o ingreso), el valor promedio de la variable dependiente
(salario o gasto) tambin se in rementaba. Sin embargo, este patrn se da solo
a nivel de promedios. A nivel individual esto no es ne esariamente ierto. En la
Tabla 1 podemos ver que el individuo que gana menos ingreso on 9 aos de edu a in, gana menos que el individuo on 8 aos de edu a in on mayor salario.
Existe una dispersion de los valores individuales de Yi en torno al promedio
ondi ional de esta variable. De esta forma, podemos denir:

ui = Yi E(Y |Xi )
o

Yi = E(Y |Xi ) + ui
donde

ui

(2.3)

es una variable aleatoria no observable que toma valores positivos o ne-

gativos. Este trmino surge pues no se puede esperar que todas las observa iones

Yi

sean igual al promedio ondi ional a

Xi .

Re ordemos que la regresin es una rela in estadsti a, a pesar de ono er los


valores de

Xi ,

esto no nos permite prede ir en forma exa ta

Yi .

Lo que no pode-

mos expli ar debido a que tiene naturaleza aleatoria se representa a travs de


denominado

trmino de error esto sti o.

ui ,

Enton es siguiendo el ejemplo de la Figura 3, podemos de ir que el gasto de una


familia individual (Yi ) orresponde a la suma de dos omponentes:

E(Y|Xi ), que orresponde a la media de gasto de todas las familias on el


mismo nivel de ingresos

ui

Componente Determinsti o

Componente Aleatorio
17

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Si E(Y|Xi ) es lineal en Xi , podemos es ribir la e ua in (2.3) de la siguiente


forma:

Yi = E(Y |Xi ) + ui
= 1 + 2 Xi + ui

(2.4)

Tomando el valor esperado ondi ional en Xi a la e ua in (2.4):

E(Yi |Xi ) = E[E(Y |Xi )|Xi ] + E(ui |Xi )


= E(Y |Xi ) + E(ui |Xi )
Debido a que

E(Yi |Xi ) = E(Y |Xi ),

(2.5)

impli a que:

E(ui |Xi ) = 0

(2.6)

As, el supuesto de que la re ta de regresin pasa a travs de las medias ondi ionales de Y, impli a que la media ondi ional de

18

ui

es ero.

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.2.3. Fun in de regresin muestral


En la mayora de los fenmenos e onmi os a estudiar, no disponemos de las
observa iones totales de la pobla in, omo hemos supuesto hasta ahora. En la
pr ti a se tiene al an e nada ms que a una

muestra de los valores de Y que

orresponden a unos valores jos de X. En este aso tenemos que estimar la fun in de regresin pobla ional en base a informa in muestral.
Los datos pobla ionales aso iados a la Figura 3 son los siguientes:

Tabla 2. Ingreso familiar (X) y


Y|X
80 100 120 140
Gasto en
55 65
79
80
onsumo
60 70
84
93
familiar
65 74
90
95
semanal
70 80
94 103
(Y)
75 85
98 108
88
113
115
Media Condi ional 65 77
89 101

Gasto en onsumo (Y).


160 180 200 220
102 110 120 135
107 115 136 137
110 120 140 140
116 130 144 152
118 135 145 157
125 140
160
162
113 125 137 149

240
137
145
155
165
175
189
161

260
150
152
175
178
180
185
191
173

Supongamos que nosotros no ono emos estos datos, es de ir, no tenemos a eso
a las observa iones orrespondientes a la pobla in total. Tenemos a nuestra disposi in slo una muestra (Tabla 3), la que ha sido obtenida de forma aleatoria
de la pobla in.
Es importante notar que a partir de una pobla in podemos sa ar una gran antidad de muestras en forma aleatoria y en la realidad nosotros observamos solo
una de ellas. Debido a esta variabilidad en las muestras podremos estimar la FRP
pero no de manera pre isa. Para ejempli ar esto supongamos que adems de la
muestra en la Tabla 3 se sa o otra muestra (Tabla 4) a partir de la informa in
pobla ional.

Tabla 3. Muestra aleatoria


de la pobla in en tabla 2.
Y
X
70
80
65
100
90
120
95
140
110
160
115
180
120
200
140
220
155
240
150
260

Tabla 4. Muestra aleatoria


de la pobla in en tabla 2.
Y
X
55
80
88
100
90
120
80
140
118
160
120
180
145
200
135
220
145
240
175
260
19

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Al gra ar los datos de las Tablas 3 y 4 obtenemos los diagramas de dispersion en

re tas de regresin muestral: FRM1 orresponde a la primera muestra y FRM2 orresponde a la segunda.

la Figura 4. En este diagrama se han trazado dos

Como vemos, no es posible asegurar ual de las dos re tas muestrales representa
mejor la re ta de regresin pobla ional.
Enton es es importante tener en mente que las re tas de regresin muestral representan la re ta de regresin pobla ional, pero debido a u tua iones muestrales
pueden ser onsideradas slo omo una aproxima in.
Como ontraparte muestral la

fun in de regresin muestral puede es ribirse

omo:

Yi = 1 + 2 Xi
donde
de

Yi

es el estimador de E(Y|Xi ),

es el estimador de

(2.7)

es el estimador

2 .

Figura 4: Rectas de Regresin basadas en dos muestras distintas

Deni in: Un estimador

es una regla, frmula o mtodo que di e mo deter-

minar el parmetro pobla ional a partir de la informa in suministrada por la


muestra disponible.
De igual manera que para el aso pobla ional la fun in de regresin muestral

20

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

tambin tiene una representa in esto sti a:

Yi = 1 + 2 Xi + ui

(2.8)

Enton es, el objetivo del Anlisis de Regresin es estimar la Fun in de regresin


pobla ional:

Yi = 1 + 2 Xi + ui

(2.9)

on base en la Fun in de regresin muestral:

Yi = 1 + 2 Xi + ui

(2.10)

Esta aproxima in se puede ver en la Figura 5:

Figura 5: Rectas de Regresin muestral y poblacional

En trminos de la fun in de regresin muestral, la

Yi

observada puede ser ex-

presada omo:

Yi = Yi + ui

(2.11)

y en trminos de la fun in de regresin pobla ional puede ser expresada omo:

Yi = E(Y |Xi ) + ui
21

(2.12)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

En la gura 5 podemos notar que para todo Xi a la dere ha del punto A,


sobreestima
A,

Yi

Yi

E(Y |Xi ). De igual manera, para ualquier punto a la izquierda de


E(Y |Xi ). Esta sobreestima in y subestima in del modelo po-

subestima

bla ional es inevitable debido a las u tua iones muestrales.

Cmo se puede onstruir la fun in de regresin muestral para 1


y 2 que este lo ms er a de los valores verdaderos (pobla ionales) de
1 y 2 ?

2.2.4. Propiedades de un Estimador


Un estimador, siendo fun in de la muestra, es una variable aleatoria y tiene su
propia distribu in de probabilidad.
Las propiedades de los estimadores son las siguientes:

1. Se denomina

sesgo

a la diferen ia entre el valor esperado del estimador y

.
E()

E() = .

su verdadero valor:

insesgado

si

2. El estimador es

e iente

o de

De esta forma, se di e que

mnima varianza

es

un estimador

si no hay ningn otro esti-

mador insesgado que tenga una varianza menor que

. En general se trata de

utilizar estimadores de varianza pequea, pues de este modo la estima in


es ms pre isa.
3. El

Error Cuadrti o Medio (ECM) es una propiedad de los estimadores que

mez la los on eptos de e ien ia e insesgamiento. El ECM de

se dene

omo:

= E[( )2 ]
ECM()
Lo que se puede expresar equivalentemente de la siguiente manera:

= V ar()
+ [Sesgo()]
2
ECM()
4. La ltima propiedad de un estimador es la

onsisten ia.

El estimador

es onsistente si onverge (en el limite) al verdadero valor del parmetro.


Se di e que la su esin de variables aleatorias

probabilidad

X1 , X2 ,...,Xn onverge en

a la variable aleatoria (o onstante) X si:

> 0,
Esto se denota

lm P r[|Xn X| < ] = 1

plim Xn = X .

Dos reglas tiles al respe to son:


22

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

plim

plimX
X
=
Y
plimY

plim (X Y )=plimX plimY

Ejemplo: Tenemos una variable yi que esta ompuesta por la suma de un omponente jo o determinsti o (c) y un omponente aleatorio(ui):

yi =

c
|{z}

componente
Si

ui N(0, u2 ),

enton es:

+
f ijo

ui
|{z}

componente

aleatorio

= E(yi ) = c
V (yi ) = E[(yi E(yi ))2 ] = E[u2i ] = u2
23

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Ahora onsideremos el siguiente estimador de la esperanza de

yi ,

la media mues-

tral:

1
1X

= Y = (y1 + y2 + ... + yn ) =
yi
n
n i=1
Veamos que propiedades tiene este estimador:

Insesgamiento: E() =

E(
) = E Y


1
= E
(y1 + y2 + ... + yn )
n
1
(E(y1 ) + E(y2 ) + ... + E(yn ))
=
n
dado que

E(yi ) = E(c) + E(ui ) = c,


| {z }
0

E(
) = c =

E ien ia: V ar()<V ar(1 )


Comparemos el estimador promedio muestral on un estimador que es simplemente ualquier valor de

yi:

=Y

1 = yi

E(Y ) = c
E(yi ) = c

V ar(Y )= nu
V ar(yi ) = u2

Enton es para n>1 siempre se umple que


rianza) que

Error Cuadrti o Medio:


igual que

1 ,

Como

es ms e iente (menor va-

es un estimador insesgado de

al

tiene menor error uadrti o medio

1.

Consisten ia: es un estimador onsistente dado que:


plim(
) = plim(Y ) = c
Ya que si

el error uadrti o medio de ambos estimadores es igual a la

varianza del estimador, de esta forma


que

1 .

lmn V ar(Y ) = 0 plim(Y ) = c.


24

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.3.

Modelo de regresin on dos variables

2.3.1. Mtodo de Mnimos Cuadrados Ordinarios


De la se in anterior tenamos que el error estimado era:

ui = Yi Yi
= Yi 1 2 Xi

(2.13)

es de ir, los residuos son simplemente la diferen ia entre los valores verdaderos y
estimados de Y.
Si queremos que la fun in de regresin muestral sea lo ms er ana posible
a la pobla ional, debemos tratar de es oger los oe ientes de regresin (los

's)

de forma tal que los errores sean lo ms pequeos posible. De a uerdo a esto
un riterio para es oger la fun in de regresin muestral podra ser minimizar
la suma de los los errores:

ui =

(Yi Yi ),

sin embargo este riterio no es

muy bueno. Observemos la Figura 6, existe una gran diferen ia en la magnitud


de los errores, sin embargo en la suma de los errores todos re iben el mismo peso.
Debido a esto es posible que la suma de los errores sea muy pequea er ana a
ero, in luso uando la dispersion de los errores en torno a la fun in de regresin
muestral es alta.

Figura 6: Mnimos Cuadrados Ordinarios

25

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Este problema puede ser solu ionado al onsiderar la suma de los errores al uadrado omo riterio a minimizar, en este aso los errores ms lejos re iben un
mayor peso:

X
El

u2i =
=

X
X

(Yi Yi )2

(Yi 1 2 Xi )2

(2.14)

Mtodo de Mnimos CuadradosPOrdinarios (MCO) es oge 1

de

u2i sea lo ms pequeo posible.

forma tal que para una muestra dada,

Enton es el problema que este mtodo propone resolver es el siguiente:

mn

1 ,2

(Yi 1 2 Xi )2

(2.15)

las ondi iones de primer orden de este problema son:

u2i

= 2

(Yi 1 2 Xi ) = 2

ui = 0
1
P
X
X
u2i
= 2
(Yi 1 2 Xi )Xi = 2
ui Xi = 0
2
Simpli ando (2.16) y (2.17) obtenemos las

(2.16)

(2.17)

e ua iones normales:

X
Yi = n1 + 2
Xi
X
X
X
Yi Xi = 1
Xi + 2
Xi2

(2.18)
(2.19)

Debemos resolver un sistema on dos e ua iones y dos in gnitas. De la e ua in


(2.18) podemos despejar

1 :

1 =

P
Yi 2 Xi
n

(2.20)

reemplazando (2.20) en (2.19):

Y i Xi =

Yi 2
n

Xi

Xi + 2

2 es:
P
P P
n

Y
X

X
Y
i
i
P 2
Pi 2 i
2 =
n Xi ( Xi )

Xi2

(2.21)

De esta forma, el estimador de

26

(2.22)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

El que puede ser es rito de la siguiente forma (ha erlo):

donde

xi = Xi X

P
xi yi

2 = P 2
xi

yi = Yi Y ,

X=

on

(2.23)

1
n

Reemplazando (2.22) en (2.20):

Pn

i=1 Xi

Y =

1
n

Pn

i=1

Yi

P
P P
Xi2 Yi Xi Xi Yi
P
P
n Xi2 ( Xi )2
= Y 2 X

1 =

(2.24)
(2.25)

Los resultados (2.23) y (2.25) podran haber sido obtenidos de igual forma, expresando ini ialmente el modelo de regresin en desvia iones on respe to a la media.
El modelo de regresin original es:

Yi = 1 + 2 Xi + ui
si le restamos el promedio de esta:

Y = 1 + 2 X + ui

(2.26)

y re ordando que el valor esperado del trmino de error es 0, tenemos el siguiente


modelo de regresin lineal expresado en desvia iones on respe to a la media:

(Yi Y ) = 2 (Xi X) + ui
yi = 2 xi + ui
As el problema de Mnimos Cuadrados Ordinarios es:

mn
2

(yi 2 xi )2

La ondi in de primer orden de este problema es:

u2i

= 2

As obtenemos el mismo estimador de

(yi 2 xi )xi = 0

2 ,

en ontrado en (2.23), y

simplemente despejando la e ua in (2.26):

1 = Y 2 X
27

se obtiene

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

que orresponde a lo mismo en la e ua in (2.25).


Una vez estimados los oe ientes de regresin mediante MCO y utilizando la

i
informa in muestral, la re ta de regresin muestral (Y

= 1 + 2 Xi )

puede ser

obtenida f ilmente.

Ejemplo 1: Disponemos

datos de una empresa qumi a sobre el gasto que ella

realiza en Investiga in y Desarrollo (I+D) y las ganan ias anuales de esta ompaia

Ejemplo 2:

Tenemos los siguientes datos de portales de internet, on los

uales queremos ver el impa to promedio del nmero de visitas en el valor de la


empresa:

VEMPRESA

VISITAS

Yi = 1 + 2 Xi

AOL

ui = Yi 1 2 Xi

134844

50

98976.5

Yahoo

55526

38

70403.7

-14877.7

Ly os

5533

28

46593.1

-41060.1

CNet

4067

-1028.3

5095.3

611

-1028.3

1639.3

NBC Internet

4450

16

18020.3

-13570.3

Earthlink

2195

-8171.5

10366.5

El Sitio

1225

-15314.7

16539.7

26056.4

19.4

26056.4

Juno Web

PROMEDIO

35867.5

Utilizando estos datos tenemos:

n
X
i=1

(Xi X)2 = 2137,9

n
X
(Yi Y )(Xi X) = 5090422,9
i=1

5090422,9
2 =
= 2381,1
2137,9
1 = 26056,4 2381,1 19,4 = 20076,8

28

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

29

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.3.2. Supuestos detrs del mtodo MCO


En el anlisis de regresin nuestro objetivo no es slo obtener los valores de

sino tambin ha er inferen ia sobre los verdaderos

2 .

Nos interesa saber

Yi
de la verdadera E(Y|Xi ). La Fun in de regresin pobla ional: Yi = 1 +2 Xi +ui ,
nos muestra que Yi depende de Xi y ui . As, los supuestos he hos para estas dos
que tan er a estn

de sus ontraparte pobla ional o que tan er a esta

variables son fundamentales para lograr una interpreta in vlida de los valores
estimados de la regresin. Mientras no se espe ique la forma omo se generan

Xi

ui ,

no hay forma de ha er inferen ia estadsti a sobre

Yi

ni sobre

2 .

Supuesto 1: Modelo de regresin lineal, el modelo de regresin es lineal en


parmetros:

Yi = 1 + 2 Xi + ui

Supuesto 2: Los valores de X son jos, X se supone no esto sti a. Esto impli a que el anlisis de regresin es un anlisis de regresin ondi ional,
ondi ionado a los valores dados del regresor X.

Supuesto 3: El valor medio del error ui es igual a ero. Dado el valor de


X, el valor esperado del trmino de error

ui

es ero:

E(ui |Xi ) = 0
Lo que nos di e este supuesto es que los fa tores que no estn onsiderados
en el modelo y que estn representados a travs de

ui ,

no afe tan sistem-

ti amente el valor de la media de Y. Es de ir, los valores positivos de


an elan on los valores negativos de
de

ui

sobre Y es ero. Ver Figura 7.

30

ui .

ui

se

De esta forma, el efe to promedio

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Figura 7: Distribucin condicional del trmino de error ui

Supuesto 4: Homo edasti idad o igual varianza de ui .


X, la varianza de

ui

Dado el valor de

es la misma para todas las observa iones:

var(ui |Xi ) = E[ui E(ui )|Xi ]2


= E(u2i |Xi ) por supuesto 3
= 2
En la Figura 8 podemos apre iar el signi ado del supuesto de homo edasti idad, la varia in alrededor de la re ta de regresin es la misma para
todos los valores de X. Esto impli a que la fun in de densidad del trmino
de error

ui

es la misma.

Figura 8: Homocedasticidad

31

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Por el ontrario, el la Figura 9 observamos el aso uando la varianza del


trmino de error varia para ada
error aumenta en la medida que

Xi , en este
Xi re e.

aso parti ular la varianza del

Figura 9: Heterocedasticidad

Esto se ono e omo

Hetero edasti idad o

varianza desigual, lo que se

expresa de la siguiente manera:

var(ui |Xi ) = i2

(2.27)

Supuesto 5: No existe auto orrela in entre los errores. Dado dos valores
de X,

Xi

Xj ,

on i6= j, la orrela in entre

ui

uj

es ero:

cov(ui , uj |Xi , Xj ) = E{[ui E(ui )]|Xi }{[uj E(uj )]|Xj }


= E(ui |Xi )(uj |Xj )
= 0
Yi = 1 + 2 Xi + ui , ui esta
uj , enton es Yi no depende solamente de Xi sino tambin

Si en la Fun in de regresin pobla ional


orrela ionado on
de

uj .

Al imponer le supuesto 5 estamos di iendo que solo se onsiderar

el efe to sistemti o de

Xi

sobre

Yi

sin preo uparse de otros fa tores que

pueden estar afe tando a Y, omo la orrela in entre los

u's.

Supuesto 6: La ovarianza entre ui y Xi es ero E(ui Xi ) = 0:


cov(ui , Xi ) =
=
=
=
=

E[ui E(ui )][Xi E(Xi )]


E[ui (Xi E(Xi )] por supuesto E(ui ) = 0
E(ui Xi ) E(ui )E(Xi ) por supuesto E(Xi ) no estocastica
E(ui Xi ) por supuesto E(ui ) = 0
0
32

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Como men ionamos en la se in 2.2.2 se supone que X y

tienen una in-

uen ia separada sobre Y (determinsti a y esto sti a, respe tivamente),


ahora si X y

estn orrela ionadas, no es posible determinar los efe tos

individuales sobre Y.
Este supuesto se umple automti amente si X es no esto sti a y el supuesto 3 se umple.

Supuesto 7: El nmero de observa iones n debe ser mayor que el nmero de parmetros por estimar. El nmero de observa iones tiene
que ser mayor que el nmero de variables expli ativas, de otra forma no se
puede resolver el sistema de e ua iones. Supongamos que tenemos una sola
observa in para nuestra variable dependiente y nuestra variable expli ativa
(Y 1 y

X1 ),

el modelo de regresin es tal que tiene inter epto, es de ir:

Y1 = 1 + 2 X1 + u1
el estimador MCO de

P
xi yi
2 = P 2
xi

xi = Xi X e yi = Yi Y , sin embargo on una observa in X1 = X


Y1 = Y , as 2 no esta determinado y as tampo o podemos determinar

donde
e

es :

1 .

Supuesto 8: Variabilidad en los valores de X. No todos los valores de X en


una muestra deben ser iguales, var(X) debe ser un nmero nito positivo.
Si las X son las mismas
estimados.

Xi = X ,

de esta forma ni

ni

pueden ser

Supuesto 9: El modelo de regresin esta orre tamente espe i ado.


Esto es muy importante, ya que por ejemplo la omisin de variables importantes en el modelo, o la ele in de la forma fun ional inade uada, o la
onsidera in de supuestos esto sti os equivo ados sobre las variables del
modelo, harn uestionable la validez de la interpreta in de la regresin
estimada. (Aspe tos que veremos ms adelante).

33

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.3.3. Errores estndar de los Estimadores Mnimos Cuadrados Ordinarios


Como vimos en la se in 2.3.1, los valores estimados para

dependen de

los datos muestrales, sin embargo, los datos ambian de una muestra a otra y
as los valores estimados tambin, por eso es ne esario tener una medida que nos
permita de ir que tan er ano son los valores estimados a los valores pobla ionales de los parmetros.

error estndar, que es la desvia in estndar de la distribu in muestral del estimador,


La medida que utilizaremos para medir la pre isin del estimador es el

la que a su vez es la distribu in del onjunto de valores del estimador obtenidos


de todas las muestras posibles de igual tamao de una pobla in dada.

2 :
P
xi yi
2 = P 2
xi

Re ordemos el estimador MCO de

yi = 2 xi +ui (modelo pobla ional en desvia iones on respe to a la media).


esta forma reemplazando yi en el estimador de 2 :
P
xi (2 xi + ui )
P 2
2 =
x
P 2 iP
x
ui xi
= 2 P i2 + P 2
x
xi
Pi
ui xi
= 2 + P 2
xi

donde
De

Apli ando valor esperado a la expresin anterior:

P

ui xi

E(2 ) = 2 + E P 2
xi
P

E(ui )xi
P 2
= 2 +
por
xi
= 2 por supuesto 3

supuesto 2

La e ua in (2.28) nos di e que en valor esperado el estimador MCO de

(2.28)

es

igual a su verdadero valor. Esta propiedad del estimador MCO se ono e omo

insesgamiento.

34

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Ahora pro edamos a al ular la varianza de el estimador MCO de

Por supuesto 4

var(2 ) = E[2 E(2 )]2


= E(2 2 )2
P

[ xi ui ]2
P
= E
[ x2i ]2

E(u2i ) = 2

E(ui uj ) = 0,

y por supuesto 6

2 :

esto impli a que:

2
var(2 ) = P 2
xi

(2.29)

2.3.4. Estimador Mnimo Cuadrado Ordinario de 2


2
Ahora debemos estimar el parmetro pobla ional , omo este orresponde al
2
valor esperado de ui y u
i es una estima in de ui , por analoga:
Pn 2
i
2
i=1 u

pare iera ser un estimador razonable. Pero los errores de MCO, estn estimados
imperfe tamente si los omparamos on los errores pobla ionales, ya que dependen de una estima in de

2 .

Veamos esto on ms detalle:

Partiendo del Regresin pobla ional expresado en desvia iones on respe to a


la media:

yi = 2 xi + (ui u)

(2.30)

ui = yi 2 xi

(2.31)

y re ordando tambin que:

Al sustituir (2.30) en (2.31), se obtiene:

ui = 2 xi + (ui u) 2 xi
Elevando al uadrado la expresin anterior, apli ando sumatoria y tomando valor
esperado:

X

u2i

= E(2 2 )2

x2i + E
|

hX

i
h
i
X
(ui u)2 2 E (2 2 )
xi (ui u)
{z
}
|
{z
}
(i)

(ii)

P

xi ui X
2

= var(2 )
xi + (n 1)var(ui ) 2E P 2
xi (ui u)
xi
= 2 + (n 1) 2 2 2
= (n 2) 2
X

35

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

(i) E

hX

(ui u)2

i
(u2i 2ui u + u2 )
hX
i
X
2
2
E
ui 2u
ui + nu
i
hX
X
n
E
u2i 2u
ui + nu2
n
i
hX
2
2
2
E
ui 2nu + nu
hX
i
E
u2i nu2
"
P 2 #
X
ui
E
u2i n
n
n
n 2 2
n
(n 1) 2

= E
=
=
=
=
=
=
=

hX

h
i
h
i
X
X

xi (ui u)
(ii) E (2 2 )
xi (ui u) = E (2 2 )
P

xi ui X
= E P 2
xi (ui u)
xi
P
P 
 P
xi ui xi
( xi ui )2
P 2 u
P 2
= E
xi
xi
2
=
Por lo tanto se dene el estimador de la varianza

De forma tal que,

e2

e =

u2i
n2

e2

es un estimador insesgado de

e2 =

2 :

X 
1
E
u2i = 2
n2

36

omo:

(2.32)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.4.

Modelo de Regresin on k variables

Ahora abandonemos la simpli a in de solo usar dos variables, de ahora en adelante generalizaremos el modelo de regresin lineal para que pueda tener hasta k
variables expli ativas.
A lara in: haremos un ambio de nota in, ada observa in i de la variable
dependiente ser denotada por
va, por ejemplo

X1 ,

yi

y ada observa in i de una variable expli ati-

ser denotada por

x1i .

Ahora las variables en mins ula no

signi a que estn en desvos.


El Modelo de Regresin Pobla ional en este aso es:

yi = 1 + 2 x2i + 3 x3i + ... + k xki + ui

i = 1, ..., n

2.4.1. Representa in Matri ial del Modelo de Regresin


Lineal
El modelo on k variables expli ativas puede ser expresado en nota in matri ial.

xj ,

En efe to, ada variable expli ativa

on j=1,..., k, es un ve tor olumna de

dimensin n, al igual que la variable dependiente y el trmino de error. De este


modo, el modelo puede ser rees rito de la siguiente forma:

1
x21
y1
x22
y2 1

.. = .. 1 +
..
. .

.
yn
1
x2n

x31
xk1

x32
xk2

2 +
.. 3 + ... +
..

.
.
x3n
xkn

u1

u2

k + ..

.
un

Donde las variables expli ativas se pueden agrupar en una sola matriz de dimensin nk, que denotaremos simplemente omo X, de esta manera el modelo se
expresa de la siguiente forma:


y1
1 x21 x31 xk1
y2 1 x22 x32 xk2


.. = ..
..
..
..
..
. .
.
.
.
.
yn
1 x2n x3n xkn

donde

1
u1
2 u2

.. + .. Y = X + u(2.33)
. .
k
un

es un ve tor de dimensin n1,

de dimensin nk y

es la matriz de variables expli ativas

es un ve tor orrespondiente al trmino de error on di-

mensin n1.

37

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Ahora debemos expresar la distribu in del trmino de error en trminos matri iales:

E(u1 )
E(u2 )

E(u) =
= 0
.
.

n1
.
E(un )

E(u21 ) E(u1 u2 ) E(u1 un )


E(u2 u1 ) E(u2 ) E(u2 un )
2

E(uu ) =
.
.
.
..
..
..
..

.
E(un u1 ) E(un u2 ) E(u2n )

2 0 0
0 2 0

= ..
.
.
..
..
..
.
.
2
0 0

= 2 I
nn

De los supuestos 3, 4 y 5, tenemos enton es que el trmino de error tiene la


siguiente distribu in:

0 , nn
I
2

n1

(2.34)

2.4.2. Estimador Mnimo Cuadrados Ordinarios


El mtodo de MCO, plantea que los parmetros del modelo pueden ser estimados

)), la que en trminos


minimizando la suma de los errores al uadrado (SE (
matri iales equivale a:

=
SE ()

n
X

u2i = uu

i=1

donde

u = Y X .

Enton es el problema de minimizar la suma de los errores al

uadrado se expresa de la siguiente forma:

h
i
= mn (Y X )
(Y X )

mn SE ()

h
i

= mn Y Y 2 X Y + X X

SE ()
= 2X Y + 2X X = 0

= (X X)1 X Y
38

(2.35)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

De (2.35) tenemos:

= 0 X u = 0
X (Y X )

(2.36)

(2.36) es la ondi in de ortogonalidad.


De esta forma, el ve tor de parmetros estimados

se obtiene de resolver el

siguiente sistema de e ua iones normales:

X X = X Y

1
1
1
1
x2,1 x2,2 x2,3 x2,n
x3,1 x3,2 x3,3 x3,n
.
..

.
..

.
..

..

.
..

xk,1 xk,2 xk,3 xk,n

1 x2,1 x3,1
1 x2,2 x3,2
1 x2,3 x3,3
.
..

.
..

.
..

..

xk,1
xk,2
xk,3
.
..

1 x2,n x3,n xk,n

1
1
1
1
x2,1 x2,2 x2,3 x2,n
x3,1 x3,2 x3,3 x3,n
..
.

..
.

..
.

..

..
.

xk,1 xk,2 xk,3 xk,n

Pn
Pn
n
i=1 x2,i
i=1 x3,i
P
P
P
n
n
2
n x2,i
i=1 x2,i x3,i
Pni=1
Pn i=1 x2,i
P
n
2

x
x
x
i=1 3,i
i=1 3,i 2,i
i=1 x3,i

..
..
..

Pn .
Pn .
Pn .
i=1 xk,i
i=1 xk,i x2,i
i=1 xk,i x3,i

P
P ni=1 xk,i
Pni=1 x2,i xk,i
n

i=1 x3,i xk,i


..

Pn

..
.

i=1

x2k,i

1
2
3
..
.

k
y1
y2
y3
..
.

yn
1
2
3
..
.

Pn
Pn i=1 yi
yi x2,i
Pi=1
n
i=1 yi x3,i

Pn

i=1

Es importante re ordar que el estimador MCO esta denido solo uando la matriz
(X'X) es invertible, lo que o urre siempre y uando:

1. Las k olumnas de la matriz X sean linealmente independientes.


2. Se disponga al menos de tantas observa iones omo variables expli ativas,
es de ir: n

k .(Supuesto

7)

Pongamos aten in en el segundo supuesto, uando n=k la matriz X tiene dimensin kk, por lo tanto salvo que no se umpla el supuesto 8, X es invertible, y de

1
esta forma (X X)
= X 1 (X )1 y por lo tanto:

= (X X)1 X Y = X 1 (X )1 X Y = X 1 Y
39

(2.37)

..
.

yi xk,i

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

el ve tor de residuos

u = Y X = Y X(X 1 Y ) = Y Y = 0n ,

de esta forma

el ajuste es perfe to, ya que todos los residuos son ero, la suma residual de igual
forma toma el mnimo valor posible, ero.
Sin embargo, esta no es una ara tersti a deseable, el ajuste perfe to o urre
porque tenemos una muestra muy redu ida. Esto trae omo onse uen ia po o
robustez e impre isin en las estima iones. Si es ogemos una nueva muestra, del
mismo tamao que la anterior, obtendremos otro estimador

on

suma residual

0, que puede diferir en forma arbitraria del anterior.


Para lograr estima iones pre isas de los parmetros, es ne esario tener un nmero de observa iones notablemente superior al de las variables expli ativas. La
diferen ia n-k se ono e omo el nmero de

2.5.

grados de libertad

de la estima in.

Propiedades del estimador MCO

Notemos que el ve tor

es un ve tor aleatorio, ya que depende del ve tor de

errores:

= (X X)1 X Y = (X X)1 X (X + u) = + (X X)1 X u

(2.38)

= E() + E[(X X)1 X u]


E()
= + (X X)1 X E(u)
La esperanza de

es el mismo parmetro, ya que este es un onstante (valor

pobla ional), y por supuestos 2 y 3 el segundo trmino de la expresin anterior


es ero,

=
E()
Es de ir, el estimador MCO es

(2.39)

insesgado, tal omo lo habamos mostrado en la

e ua in (2.28).
De (2.38) podemos denir el

error de estima in o sesgo

= (X X)1 X u

40

omo:

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Ahora al ulemos la varianza de

=
var()
=
=
=
=
=

( E())
]
E[( E())
E[( ) ( ) ]
E[(X X)1 X uuX(X X)1 ]
(X X)1 X E(uu)X(X X)1
(X X)1 X ( 2 In )X(X X)1
2 (X X)1

Para poder estimar la varianza de

ne esitamos reemplazar

(2.40)

en (2.40) por su

estimador insesgado:

u u

e =
nk
2

2.5.1. Propiedad de mejor estimador lineal insesgado


Se di e que

es el mejor estimador lineal insesgado (MELI) de

si se umple

lo siguiente:

1. El

lineal, es de ir, es una fun in lineal de una variable aleatoria, omo la

variable
2. Es

en el modelo de regresin.

insesgado,

valor,

es de ir, su valor esperado,

,
E()

es igual a el verdadero

3. Tiene varianza mnima dentro de la lase de todos los estimadores lineales


insesgados; un estimador insesgado omo varianza mnima es ono ido omo
un

estimador e iente.

2.5.2. Teorema de Gauss-Markov


Proposi in: El estimador MCO es el estimador lineal insesgado ptimo, en el
sentido de que ualquier otro estimador lineal e insesgado tiene una matriz de ovarianza

mayor

que la del estimador MCO. Es de ir, el estimador MCO es MELI.

e
Demostra in: Sea e = Ay

un estimador lineal de

41

donde

e
A

es una matriz

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

kn. Denotemos

e (X X)1 X ,
A=A

de modo que:

e = [A + (X X)1 X ]Y
= [A + (X X)1 X ](X + u)
= AX + + [A + (X X)1 X ]u

Apli ando esperanza a la expresin anterior:

El estimador
forma:

e = AX + + [A + (X X)1 X ]E(u)
E()
= AX +
ser insesgado solo si la matriz A es tal que AX=0kk . De esta

e = + [A + (X X)1 X ]u

y su matriz de ovarianza ser:

e = E[(e )(e )]
cov()
= E{([A + (X X)1 X ]u)([A + (X X)1 X ]u) }
= 2 AA + 2 (X X)1
| {z }

cov()

AA es semidenida positiva, se on luye la diferen ia entre la


e y es una matriz semidenida positiva, on lo que la ovarianza
ovarianza de
e

de es mayor o igual a la ovarianza de


Como la matriz

42

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.6.

Geometra del Estimador MCO

Re ordemos que el modelo de regresin muestral tiene la siguiente expresin:

Y = X + u
la que puede ser rees rita de la siguiente forma:

Y = P Y + MY
donde P se denomina

matriz de proye in

(2.41)

y se dene de la siguiente manera:

P = X(X X)1 X
Adems se tiene que M=I-P. De a uerdo a la e ua in (2.36) el estimador MCO
es tal que los errores son ortogonales a las X, es de ir se deben es oger los parmetros

de forma tal que el ve tor de errores sea ortogonal al espa io formados

por las variables expli ativas.


As, el estimador MCO nos permite des omponer

en dos trminos ortogonales

entre si: el primer omponente puede ser es rito omo una ombina in lineal
de las olumnas x y el segundo es un omponente ortogonal a X (el trmino de
error), tal omo lo muestra (2.41). Esto se representa gr amente en la Figura
10.

MY

x1

PY
x2

Col X

Figura 10: Descomposicin Ortogonal de Y

El trmino

PY

alternativamente se puede ver omo la proye in de

espa io barrido por las X's y

MY

omo la proye in de

a las X's.
43

en el

es el espa io ortogonal

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.7.

Bondad de Ajuste y Anlisis de Varianza

El objetivo de esta se in es introdu ir un riterio de ajuste de nuestra regresin, es de ir, un riterio que nos indique uan bien se ajusta nuestro modelo a
la muestra.
En prin ipio, podramos pensar que la suma de los residuos uadrados, es de ir, nuestro riterio original de ajuste, es una buena op in: a menor sea ste,
mejor es nuestro ajuste. Sin embargo, la suma de los residuos uadrados puede
ser arbitrariamente es alada al multipli ar la variable dependiente (Y) por el fa tor de es ala deseado, lo ual invalida su uso omo riterio de ajuste.
Por ello, se ha desarrollado un riterio que elimine el problema anterior. Di ho estadsti o ya no se basar en la

magnitud

de un valor ( omo la suma de los

uadrados de los residuos), sino que intentar preguntarse si la


riables independientes (X) expli a la

varia in de las va-

varia in de la variable independiente, omo

veremos ms adelante. Para ello analizaremos on un po o ms de profundidad


el modelo de regresin lineal en desvos on respe to a la media y presentaremos
la llamada des omposi in de varianza (o anlisis de varianza), ambos, insumos
fundamentales para obtener nuestro estadsti o de bondad de ajuste.

2.7.1. Modelo de Regresin Lineal en Desvos


Sea el modelo pobla ional usual on k variables:

yi = 1 + 2 x2i + 3 x3i + + k xki + ui


donde

i = 1...n

(2.42)

y uya ontraparte estimada es:

yi = 1 + 2 x2i + 3 x3i + + k xki + ui

(2.43)

Luego, si sumamos para todas las observa iones y dividimos a ambos lados por
el tamao muestral n, tenemos:

Y = 1 + 2 x2 + 3 x3 + + k xk

(2.44)

1 = Y 2 x2 + 3 x3 + + k xk

(2.45)

por lo ual:

La e ua in (2.45) muestra que el trmino independiente de una regresin queda


determinado por el resto de los k-1 oe ientes involu rados. Finalmente, note
44

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

que restando las e ua iones (2.43) y (2.44) obtenemos:

yi Y = 2 (x2i x2 ) + 3 (x3i x3 ) + + k (xki xk ) + ui

(2.46)

la ual es una expresin similar a (2.43), ex epto por dos importantes diferen ias.
Primero, el modelo no posee onstante y segundo, las variables se en uentran
expresadas en desvos on respe to a la media. A pesar de ello, note que los oe ientes y los residuos son los mismos en ambos modelos.
De lo anterior surge un importante orolario respe to del trmino onstante de
nuestro modelo. En general, el inters del investigador se entra en el impa to de
los regresores sobre la variable dependiente, por lo ual, el trmino onstante no
es ms que una

orre in

que garantiza que los promedios muestrales de ambos

miembros del modelo e onomtri o oin idan.


Para transformar en desvos on respe to a la media un modelo en trminos matri iales, introdu iremos una matriz fundamental para el anlisis de esta se in.
0
Denotaremos por M una matriz de n n, denida omo:


1 0 0
1 1 1
1 n1 n1 n1
1
1
1


ii
0 1 0 1 1 1 1 n 1 n n
0
M = I = .. .. . . .. .. .. . . .. = ..
..
..
..
nn
n
. .
.
.
.
.
. n .
.
.
.
.
1
1
0 0 1
1 1 1
n
n 1 n1
donde I es la identidad (nn) e

orresponde al ve tor unitario de dimensin n.


0
0
0
0
0
Di ha matriz es singular, simtri a (M '=M ) e idempotente (M M =M ). En
0
general, M es ono ida omo
, ya que resta a ada olumna de

matriz de desvos

la matriz involu rada, su media aritmti a. Por ejemplo, es f il omprobar que:

Pn
y1
yi
Pi=1
n

y
1
2 1 i=1 yi
M 0 Y = Y ii Y = ..
..
n
. n
Pn.
yn
i=1 yi

y1 Y
y2 Y

..

yn Y

Por lo tanto, nuestro modelo expresado en matri es, puede ser expresado en trminos de desvo on respe to a la media omo:

M 0 Y = M 0 X + M 0 u

45

(2.47)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.7.2. Anlisis de Varianza


Suponga enton es el siguiente modelo pobla ional:

Y = X + u
donde Y orresponde a una ve tor

n 1,

X orresponde a nuestra matriz de re-

gresores que in luye un trmino onstante, tal que X es de


a nuestro ve tor de errores de

n 1.

nk

y u orresponde

Bus amos enton es denir la varia in de la variable dependiente (Suma de los

uadrados totales = TSS) omo :

n
X
T SS =
(Yi Y )2

(2.48)

i=1

Para en ontrar enton es una expresin para (2.48), de la e ua in (2.47) tenemos


que nuestro modelo estimado en desvos on respe to a la media es:

M 0 Y = M 0 X + M 0 u
on lo ual, al parti ionar nuestra matriz X en X

parmetros en = [1
2 ] y onsiderando que

= [i X2 ], nuestro ve tor de
M 0 i = 0 y que M 0 u = u,

tenemos que:

M 0Y

= M 0 i1 + M 0 X2 2 + M 0 u
= M 0 X2 2 + u

(2.49)

Luego, para formar la TSS(suma de los uadrados totales o la suma de los uadrados de las desvia iones de Y on respe to a su media), de la e ua in (2.48),
multipli amos por Y' la e ua in (2.49):

Y M 0Y

=
=
=

0
Y M Y =
T SS =

Y (M 0 X2 2 + u)
(X + u) (M 0 X2 2 + u)
X M 0 X2 2 + X u + u M 0 X2 2 + u u
2 X2 M 0 X2 2 + u u
ESS + RSS

(2.50)
(2.51)

donde el segundo y el ter er trmino desapare en gra ias a que los residuos estimados son, por onstru in, ortogonales a las variables expli ativas

4 . La igualdad

3 Note que para di ha deni in utilizamos los uadrados de la desvia iones, ya que la suma
de las desvia iones es siempre ero.
4 Ya que X u
= X Y X Y = 0.
= X (Y X )
46

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

anterior es ono ida omo la

des omposi in de varianza.

El trmino de la

izquierda orresponde a TSS o la suma de los uadrados de las desvia iones de


la variable dependiente. En otras palabras, la variabilidad de Y. En la dere ha se
en uentra la variabilidad de las variables independientes o regresores y la variabilidad de los errores. Cul es enton es el objetivo?: des omponer la varianza de
la variable dependiente aquella parte que es expli ada por la regresin (ESS) de
aquella parte expli ada por los residuos (RSS). Por qu?: porque intuitivamente,
la regresin se ajusta mejor si las desvia iones de Y se expli an en su mayor parte
por desvia iones de X y no por desvia iones de los residuos.

2.7.3. Bondad de Ajuste: R2 y R 2


Denimos enton es la bondad de ajuste del modelo a travs del siguiente estadgrafo llamado tambin oe iente de determina in:

R2 =

ESS
T SS

(2.52)

es de ir, omo la propor in de la varianza de Y que es expli ada por la varianza


de la regresin. Alternativamente:

R2 = 1

RSS
T SS

(2.53)

Note que:
1. El oe iente de determina in es siempre menor a 1. Ello porque
T SS y por lo tanto RSS
1.
T SS

RSS

2. El anlisis de varianza anterior fue derivado bajo el supuesto que el modelo


0
in lua una onstante (por ello utilizbamos la matriz M ). En di ho aso,
2
ne esariamente R 0. En aso de que el modelo no in luya una onstante,
se debe utilizar la frmula (2.5.2) utilizando TSS=Y'Y (sin desvos).

3. Al agregar regresores al modelo, el

R2

nun a de re er (se mantendr ons-

tante o aumentar)
4. No es laro uan bueno sea omo predi tor de ajuste.

Para ver este ltimo punto, suponga que usted posee el siguiente modelo pobla ional:

Y = 1 + 2 X + u
47

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

donde X es un ve tor (n

1).

Suponga ahora que restamos X a ambos lados de

nuestro modelo. Obtenemos enton es:

Y X = 1 + X + u
Si

2 1,

enton es es f il veri ar que el

R2

del primer modelo ser er ano a

1, mientras que el del segundo sera er ano a ero, a pesar de que los modelos
son matemti amente equivalentes. A pesar de lo anterior, en trabajos apli ados,
2
el R es ampliamente utilizado, por lo ual se re omienda su publi a in.
Retro edamos ahora al punto tres. El nos di e que el oe iente de determina in
probablemente re er al in luir regresores. Ello plantea in entivos a in luir regresores no relevantes para nuestro modelo, on el n de obtener un mejor ajuste.
Porqu su ede esto?, ya que al in luir regresores, la RSS ne esariamente de re e
(o en el mejor de los asos se mantiene), mientras que la TSS permane e onstante.
Por esta razn se re el oe iente de determina in ajustado, el ual orri2
ge el R original por los grados de libertad del numerador y el denominador.
2
2 ) omo:
Enton es, denimos el R ajustado (R

2 = 1 u u/(n k)
R
Y MY /(n 1)

(2.54)

2 = 1 (1 R2 ) (n 1)
R
(n k)

(2.55)

o equivalentemente:

48

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.8.

Inferen ia

Una vez que hemos estimado nuestra regresin muestral, es ne esario preguntarse
uan buena aproxima in es di ha regresin de la pobla ional. Para que la aproxima in sea er ana, es ondi in ne esaria que los parmetros in luidos en la
regresin muestral sea estadsti amente distintos de ero (en aso ontrario, no
pertene en a la regresin pobla ional). As, uno de nuestros objetivos puede ser
el testear la signi an ia individual de los parmetros.
Pero lo anterior es slo una de las preguntas que omo investigadores podemos
estar interesados en responder. Por ejemplo, en la estima in de la fun in de
u
produ in de una rma, que asumimos Cobb Douglas (Y = AK L e o en logaritmo

ln Y = ln A + ln K + ln L + u), podemos estar interesados en des ubrir si

la rma presenta rendimientos onstantes, re ientes o de re ientes a la es ala, lo


ual se reejar en que

+ > o 1.

Por lo tanto, ello podra ser otra hiptesis

interesante de plantearse. Tambin podra ser interesante des ubrir si todos los
parmetros a la vez son distintos de ero, o de algn valor determinado.
La gama de preguntas posibles respe to del valor de los parmetros es slo a otada por la pregunta que el investigador desee responder. Nuestro objetivo es,
por lo tanto, desarrollar los mtodos de inferen ia y ontraste de hiptesis que
nos permitan responder, en el ontexto de una regresin muestral parti ular, las
preguntas anteriores.
Dos notas pre autorias. En esta se in nos o uparemos de restri iones o hiptesis

lineales sobre los oe ientes.

Restri iones no lineales son ms es asas

en e onometra apli ada y se desarrollan en ontexto de un modelo parti ular.


Segundo, en todo lo que se reere a este apartado, asumiremos que los errores de
nuestra regresin muestral siguen una distribu in normal (ya veremos porqu).
Enton es, sea nuestro modelo pobla ional

Y = X + u
donde X es una matriz de (n
(k

1).

k ),u

e Y son ve tores (n

1)

es ve tor de

Sean enton es las siguientes hiptesis:

1.

H0 : i = 0 Plantea que el regresor Xi

no posee inuen ia alguna sobre Y.

Este es el test ms omn y nos referiremos a l omo

49

test de signi an ia.

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.

H0 : i = i0 Plantea
por i0 sobre Y.

3.

H0 : i + j =1

que el regresor

Xi

posee un impa to determinado

Plantea que la suma de los regresores

Xi

Xj

poseen un

impa to onjunto de magnitud 1.

4.

H0 : i = j Plantea que

los regresores

Xi

Xj

poseen el mismo impa to

sobre Y.
5.

H0 : i =0

i=2. . . k

Plantea que todos los regresores onjuntamente,

ex epto la onstante, son ero.

6.

H0 : l =0
mensiones

ha sido parti ionado


(kp 1) respe tivamente, tal

donde el ve tor

(kl 1)

enton es que un

sub onjunto

en dos (l y
que

p ) on dikl + kp = k . Plantea

de parmetros son estadsti amente no signi-

 ativos.

Todas las hiptesis anteriores pueden ser resumidas en la siguiente expresin:

R = r

q k) onstantes ono idas ( eros o unos), uyo objetivo ser sele ionar los parmetros a testear, uyo nmero de las, q, representa
el nmero de restri iones. A su vez, r es un ve tor de dimensin q y ontiene el
donde

es una matriz de (

real al ual es restringido ada parmetro. Veamos omo sern las matri es

en ada una de nuestras hiptesis:

1.

R =[0. . . 010

. . . 0; r=0; q=1

donde 1 se en uentra en la i-sima posi in


2.

R =[0. . . 010

. . . 0; r=i0 ; q=1

donde 1 se en uentra en la i-sima posi in


3.

R =[0. . . 010

. . . 010 . . . 0; r=1; q=1

donde 1 se en uentra en la i-sima posi in y en la j-sima posi in.


4.

R =[0. . . 010

. . . 0-10 . . . 0; r=0; q=1

donde 1 se en uentra en la i-sima posi in y en la j-sima posi in.


5.

R =[0q1 Ik1 ; r=0;

6.

R =[0ki kj Iki ;

q=k

r= ; q=ki

50

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Enton es, nuestra hiptesis nula orresponde a:

H0 : R = r

(2.56)

on lo ual, slo nos resta derivar el test que nos permita re hazar o no re hazar
nuestra nula. La onstru in del estadgrafo es omo sigue. Dado que MCO
(bajo los supuestos relevantes) es insesgado, tenemos que

= R ,
E(R)

mientras que la varianza de

= , por lo tanto,
E()

orresponde a

= E[R( )( ) R ]
V [R]

= RV ar()R
= 2 R(X X)1 R
Ne esitamos an un supuesto ms para determinar la distribu in muestral de
es fun in de u y u N(0, 2 ), enton es N(, 2 (X X)1 )
nuestra nula. Dado que
N(r, 2 R(X X)1 R ), enton es:
y por lo tanto R

N[, 2 (X X)1 ]

(2.57)

R N[R, 2 R(X X)1 R ]

(2.58)

y si la nula

R = r

es ierta:

(R r) N[0, 2 R(X X)1 R ]

(2.59)

luego estandarizamos, on lo ual:

(R r)

2 R(X X)1 R

N[0, 1]

(2.60)

Adems, se puede demostrar que (ha erlo) :

u u
2(nk)
2

(2.61)

Luego, se puede demostrar que (ha erlo) :

(R r) [ 2 R(X X)1 R ]1 (R r) 2q
5 Basta

on re ordar que si

(2.62)

x orresponde a un ve tor de realiza iones normales (0,1), por lo

x N (0, 2 I) y A orresponde a una matriz simtri a e idempotente de rango n, enton es


1
2
= M Y = M u y que el rango de una matriz simtri a
2 x Ax n . Finalmente, re uerde que u

ual

e idempotente es su traza.
6 Basta on re order que

si el ve tor x, de dimensin n, es tal que

x 1 x 2n .

51

x N (0, ), enton es,

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

luego, ombinando los dos resultados anteriores, se puede demostrar que (ha er-

lo) :

[(R r) [R(X X)1 R ]1 (R r)]/q


F(q,nk)
u u/(n k)

(2.63)

El test expuesto en (2.63) orresponde a la forma general del test F. Di ho test


es de utilidad para testear ualquier hiptesis de la forma expuesta en (2.56). A
ontinua in veremos sub asos de di ho test general.

2.8.1. Test t (Una hiptesis lineal)


Rees ribiendo el test F omo:

]1 (R r)] F(q,nk)
[(R r) [RVd
ar()R

y ha iendo el reemplazo respe tivo de R y r orrespondientes a las hiptesis 1 o


2 (H 0 :

i = 0 = i0 ),

llegaremos a:

F =
Re ordando que

t2

( i0 )2
F (1, n k)
Vd
ar(i )

(2.64)

es una aso parti ular de una F on un grado de libertad en

el numerador, tenemos que:

i0
t= q
tnk
d
V ar(i )

Lo anterior es ono ido omo el


utilizada orresponde a

t=

(2.65)

test t

(test de signi an ia) y en su versin ms

, donde se bus a testear la hiptesis nula de


Vd
ar(i )

que el parmetro es ero.


El test t tambin ubre los asos 3. y 4.. En el aso 3. por ejemplo (H0 :

i +j =1),

el estadgrafo orresponder a:

t= q

i + j 1

d i , j ) + Vd
Vd
ar(i ) + 2Cov(
ar(j )

tnk

(2.66)

La distribu in t es simtri a y se aproxima a la normal para tamaos de muestras


7 Slo

un poquito de lgebra y re ordar omo se onstruye una distribu in F(q, n-k) a partir
de la divisin de dos 2 on grados de libertad q en el numerador y n-k en el denominador.
52

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

grandes, sin embargo, la t posee olas ms gruesas que la normal (lo ual es ms
pronun iado en muestras pequeas: n30). La siguiente gura expone la rela in
entre la distribu in t y la normal:

Probabilidad

Distribucin Normal

Distribucin t

Nota pre autoria:


Toda la deriva in anterior se basa en el estri to supuesto de normalidad de
los errores. En aso de que los mismos no distribuyan normal, la distribu in

des ono ida

del test F (y por lo tanto el del t) es


en muestras nitas. Sin ema
bargo, es posible demostrar que t N(0, 1), es de ir, que el test t distribuye

asintti amente normal. Luego, los valores rti os de t y

(normal estndar)

se en uentran sumamente er a si n-k30, por lo ual, en trminos pr ti os no

importa mu ho ual de ellas es ojamos para los valores rti os (a menos que la
muestra sea espe ialmente pequea).
Finalmente, nos queda examinar los riterios de re hazo del test y los niveles
de onanza. Como usted re ordar de sus lases de estadsti a, lo anterior depende de omo espe iquemos la hiptesis alternativa. A ontinua in, pasamos
a revisar este punto.
53

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Criterio de Re hazo y Nivel de Conanza


Una vez que hemos al ulado el valor del test para nuestra nula parti ular (o

valor al ulado ), resta al ular el valor rti o

o el valor que nos indi a la tabla t.

Di ho valor rti o nos dir si nuestra nula es falsa o si no podemos armar que lo
es. La ele in de di ho valor rti o se toma desde la tabla de distribu in t y el

nivel de signi an ia es ogido


determina el nivel de onanza del test

nmero debe ser es ogido tomado en uenta el


(1 %, 5 % o 10 %), el ual a su vez

(99 %, 95 % o 90 %, respe tivamente). El nivel de onanza posee una expli a in


intuitiva: Nuestro estadgrafo es fun in de la muestra on lo que estamos trabajando, por lo ual, si ontramos on una gran nmero de ellas y on ada una
pudisemos al ular nuestro estadgrafo, el nivel de onanza indi a el por entaje de ve es que al ulamos nuestro estadgrafo en que realmente no re hazamos
lo ierto o re hazamos orre tamente lo falso. La forma en que se distribuya la
probabilidad de re hazo, es de ir, el nivel de signi an ia, depende de nuestra
hiptesis alternativa. A ontinua in revisamos di ho asunto.

Test de una ola

Supongamos que nuestra hiptesis es:

H0 : i = io
H1 : i > io
donde

i0 R. En di ho aso, el estadgrafo es al ulado segn lo propuesto en la

se in anterior. El punto est en omo a umulamos la probabilidad de re hazo.

En este aso, el total de la probabilidad de re hazo se a umula en la ola dere ha

de la distribu in, omo lo muestra la siguiente gura :


8 Por

qu en la ola dere ha? Porque la probabilidad de re hazo, es de ir, el nivel de signi an ia, nos indi a hasta donde puedo tolerar un valor mayor a io , por lo ual, are era de
sentido que la zona de re hazo se en uentre en la ola izquierda de la distribu in. Por ejemplo,
si io =0, la distribu in de nuestro estadgrafo se entra en ero (vea la frmula), por lo ual la
hiptesis alternativa orrespondera a que el parmetro es positivo. el punto es un positivo
puedo a eptar que sea?.

54

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Probabilidad

Se Rechaza (5%)
No se Rechaza

por lo tanto, re hazaremos nuestra hiptesis nula de que el oe iente es ero
ontra la hiptesis alternativa que el parmetro es
ulado del test es

mayor

el parmetro es menor a

mayor

que

io ,

si el valor al-

al valor rti o de la tabla t. En el aso que

io ,

H1

sea que

enton es la probabilidad de re hazo se on entra en

la ola izquierda y se re haza la nula en el aso que el valor al ulado sea menor
que el valor rti o de la tabla t.

Test de dos olas


Supongamos que nuestra hiptesis es:

H0 : i = io
H1 : i 6= io
En este aso estamos repartiendo uniformemente la probabilidad de re hazo en
ambas olas de la distribu in omo lo muestra la siguiente gura (al 95 % de
onanza):

55

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Probabilidad

Se Rechaza (2,5%))

Se Rechaza (2,5%)
No se Rechaza

Por lo tanto, re hazaremos la nula si el valor al ulado es en

mdulo mayor

que

el valor rti o de tabla. Note que en este aso, la probabilidad de re hazo se


reparte un partes iguales en ambas olas. Ello se justi a en que la distribu in
t orresponde a una distribu in simtri a.

Error de Tipo I, Error de Tipo II, Tamao y Poten ia de un test


Antes de ontinuar, veremos uatro on eptos estadsti os importantes que nos
indi an ara tersti as de nuestro test.

1.

Error de Tipo I (ETI):

Corresponde a la probabilidad de re hazar la

nula uando es ierta.


2.

Error de Tipo II (ETII): Corresponde

a la probabilidad de a eptar la

nula uando es falsa.


3.

Tamao del Test: Corresponde la probabilidad de ometer ETI. Se dene


omo el nivel de signi an ia del test ().

4.

Poten ia del Test:

Corresponde a la probabilidad de re hazar la nula

uando es falsa. Se dene omo Poten ia =1-ETII.

El ptimo para el investigador sera minimizar ambos tipos de errores y tener un


test on un menor tamao y mayor poten ia posibles, sin embargo, note que el

56

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

tamao del test y por lo tanto, el ETI, es una variable endgena al investigador,
en tanto que l de ide on que nivel de onanza trabajar. Luego, el objetivo se
transforma en, dado un nivel de onanza, minimizar la o urren ia de ETII.
Intuitivamente, si usted es oge un nivel de signi an ia pequeo (1 %, por ejemplo), sus zonas de re hazo sern pequeas, on lo ual, inevitablemente, la zona de
no re hazo re e, lo ual impli a que por minimizar el ETI, ha aumentado el ETII.

P-value
Otra forma alternativa al valor rti o de tabla para re hazar o no re hazar nuestra nula, orresponde al uso de los llamados p-values, los uales son reportados
en ualquier paquete estadsti o. El p-value (p) se dene omo:

p = p(tcalculado ) = P (|Z| |tcalculado |) = 2(1 (|tcalculado |))

(2.67)

es de ir, el p-value representa la probabilidad de que el valor rti o (t de tabla, en


nuestro aso), sea mayor al valor t al ulado, es de ir, des ribe el nivel de signi an ia exa to aso iado a un resultado e onomtri o en parti ular. Por ejemplo,
un p-value de 0.07 indi a que un oe iente es estadisti amente signi ativo en
un nivel de 0.07 (o on un 93 % de onanza).

Ejemplo:
Suponga el siguiente Modelo de Regresin Lineal Simple:

Yi = 1 + 2 Xi + ui

para i = 1, ..., N

Adems posee la siguiente informa in muestral de X e Y:

10

18

20

1 y 2 es el siguiente:

 
1 
 

1
4 48
20
2,1935

= =
=
48 824
298
0,2338
2

El estimador MCO de

La matriz de varianzas y ovarianzas de

es:

=
V ()
u2 (X X)1

1 

0,436 4 48
0,180866 0,010536
=
=
48 824
0,010536 0,000878
2
57

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Primero veamos el ajuste de este modelo, es de ir, en que grado la variable


2
2
expli a a la variable y , para lo ual al ulemos el R y R :

R
R

P4
u2
RSS
0,436
= 1
= 1 P4 i=1 i
=1
= 0,969
2
T SS
14
i=1 (Yi Y )
P4
RSS/2
u2/2
= 1
= 0,953
= 1 P4 i=1 i
2
T SS/3
i=1 (Yi Y ) /3

Como podemos ver, el grado de ajuste del modelo es bastante bueno, omo el
2
modelo in luye onstante, el R se puede interpretar omo la propor in de la
variabilidad de la variable independiente que es expli ada por la variabilidad de
la variable dependiente, la que en este aso al anza un 97 %.
Ahora veamos si estos parmetros estimados son signi ativos a un 95 % de onanza, para lo ual realizaremos un test

1.

Test de signi an ia de

1 :

de signi an ia a ada uno de ellos:

H0 : 1 = 0
H1 : 1 6= 0
t=

1
V ar(1 )

t2

De esta forma, el valor al ulado para el estadsti o

es:

2,193548387
tc =
= 5,157850523
0,180866
El valor de tabla del estadsti o

a un 95 % de onanza y on dos grados

de libertad es 4,303.
Probabilidad

No se
Rechaza

Se
Rechaza
(2,5%))

Se
Rechaza
(2,5%)

t(2)=4,303

t(2)=4,303

tc=5,158

58

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

De esta forma, se re haza la hiptesis nula de que

1 =0,

y por lo tanto el

parmetro estimado resulta ser estadsti amente signi ativo.

2.

Test de signi an ia de

2 :

H0 : 2 = 0
H1 : 2 6= 0
t=

2
V ar(2 )

t2

De esta forma, el valor al ulado para el estadsti o

es:

0,233870968
= 7,892762865
tc =
0,000878
El valor de tabla del estadsti o

a un 95 % de onanza y on dos grados

de libertad es 4,303.
Probabilidad

No se
Rechaza

Se
Rechaza
(2,5%))

Se
Rechaza
(2,5%)

t(2)=4,303

t(2)=4,303

tc=7,893

De esta forma, se re haza la hiptesis nula de que

2 =0,

y por lo tanto el

parmetro estimado resulta ser estadsti amente signi ativo.

3.

TAREA: Testee la siguiente hiptesis nula:

H0 : 1 2 = 2
H1 : 1 2 6= 2

59

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.8.2. Test F (Conjunto de hiptesis lineales)


Los asos 6. y 5. orresponden a un

onjunto

de hiptesis a testear. En el aso

5. orresponda a un sub onjunto parti ular de parmetros, mientras que el aso


6. orresponda a la nula de que todos ellos eran ero, menos la onstante. En
di hos asos se apli a la frmula del test F segn la e ua in (2.63) y los riterios
de re hazo siguen lo expuesto en la se in anterior.
Sin embargo, en ambos asos podemos derivar expresiones alternativas para nuestro test.

Todas las pendientes del modelo son ero:

En este aso, se puede

demostrar que el test F puede expresarse omo:

F =

ESS/(k 1)
F(k1,nk)
RSS/(n k)

o alternativamente, utilizando la deni in del

F =

(2.68)

R2 :

R2 /(k 1)
F(k1,nk)
(1 R2 )/(n k)

(2.69)

Un sub onjunto de las pendientes del modelo son ero:

En este

aso, se puede demostrar que el test F puede expresarse omo:

F =
donde

(
uu u u)/k2
F (k2 , n k)
u u/(n k)

denotan los residuos MCO restringidos (donde

(2.70)

k2

representa el

nmero de regresores que han sido restringidos a ero), mientras que

representan los residuos del modelo MCO original.

2.8.3. Intervalos de Conanza


Una forma alternativa (o mejor di ho omplementaria) de examinar la signi an ia estadsti a de un parmetro ( o un onjunto de ellos) es a travs de intervalos
de onanza (IC). Ellos nos indi an, dado un nivel de onanza, el

rango de

valores admisibles del oe iente que se estima. Los niveles de onanza generalmente utilizados son 99 %, 95 % y 90 % (al igual que en los test de hiptesis),

60

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

donde el tamao de los mismos es ne esariamente de re iente .


Una manera natural de obtener el IC aso iado a

es a travs del test t aso-

iado. Vimos enton es que l orresponde a:

i0
qi
tnk

V ar(i )

enton es, si deseamos un IC del (1-) % de onanza (es de ir, de


an ia) para el parmetro

i ,

de signi-

basta obtener de las tablas de distribu in el valor

orrespondiente, es de ir:

1 = P r Z/2

i i0
q
Z1/2

V ar(i )

i i0
= P r Z1/2 q
Z1/2
V ar(i )


q
q
= P r i Z1/2 V ar(i ) i0 i + Z1/2 V ar(i )

donde la ter era expresin se obtiene de despejar

i0

de la segunda. Note que el

intervalo ha sido onstruido en base a una distribu in simtri a ( omo la t o la


normal), por lo ual el valor de tabla a es oger debe orresponder a

/2.

Note adems que di ho intervalo est onstruido slo en base a onstantes ono idas. Una vez onstruido, se puede ontrastar la nula (H0 :
de signi an ia

sen illamente observando si

i0

i = i0 )

al nivel

pertene e al intervalo (en uyo

aso no re hazamos la nula) o se en uentra fuera de l (en uyo aso re hazamos

10 . Nuevamente, la validez de di ho intervalo de onanza depende rti-

la nula)

amente del supuesto de distribu in de los errores. En el aso que el valor

se obtenga de la tabla t, omo ya sabemos, estamos suponiendo que los errores


siguen una distribu in normal. Un aso ms general es utilizar los valores rti os
de la distribu in normal estndar.
Tambin es posible derivar

regiones de onanza, es de ir, IC de onanza simul-

tneos para una onjunto de parmetros, sin embargo, su utiliza in es es asa en


9 Intuitivamente,

ya que a ms exa ta es mi estima in del rango posible, on menos onanza


puedo armar estar en lo orre to.
10 Una forma f il de verlo es pensando en =0, es de ir, que la variable x no ayuda a
i0
i
expli ar y .
61

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

e onometra apli ada (a menos que su pregunta puntual lo requiera!).


Finalmente derivaremos el intervalo de onanza para la varianza de los errores. Sabemos de la e ua in (2.61) que:

u u
2nk
2

(n k)
2
2nk
2

(2.71)

Utilizando la misma lgi a que utilizamos para el IC de un parmetro


2 orresponde a:
que el IC para

"

(n k)
2
(n k)
2
2

2nk,
2nk,1

, tenemos

= (1 )

Note que los valores rti os utilizados orresponden a


2
la distribu in es una distribu in asimtri a.

2nk,1

(2.72)

2nk,,

ya que

2.8.4. Test de Normalidad (Test de Jarque-Bera)


Consideramos ahora el problema de utilizar los momentos de los residuos MCO
para ha er inferen ia sobre la distribu in de los errores pobla ionales. Dado que
algunas de las propiedades de MCO y de la inferen ia dependen del supuesto de
normalidad en los errores, es importante poseer un ontraste para di ho supuesto.
Como es sabido, la distribu in normal es simtri a y meso rti a. La simetra
3
impli a que el ter er momento pobla ional E(u ) en torno a la media, es ero. El
he ho que sea meso rti a impli a que la kurtosis es 3 (es de ir, el an ho de las
olas de la distribu in, el ual se mide utilizando el uarto momento en torno
a la media). Re ordemos enton es que el oe iente de simetra pobla ional se
dene omo:

S=

E(u3 )
3

( 2 ) 2

mientras que la kurtosis (o oe iente de):

K=

E(u4 )
( 2 )2

62

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

En base a los anteriores, Bera y Jarke (1981), propusieron el siguiente estadgrafo,


onstruido

bajo la nula de normalidad:


"

3)2
S (K
JB = n
+
6
24

2(2)

Donde los estimadores muestrales del oe iente de asimetra y kurtosis se obtienen al onsiderar que un estimador natural de:

r = E[
ur ]
orresponde a:

1X r
mr =
u
n i=1 i

Note que el estadgrafo est denido en trminos del ex eso de kurtosis, por
lo ual, a menor sea el valor, menor es la probabilidad de re hazar la nula de
normalidad. Note adems que el estadsti o es esen ialmente no onstru tivo, en
trminos de que no nos indi a que amino seguir en aso de re hazar la nula,
adems de que no re hazar normalidad no impli a onrmar su existen ia. Sin
embargo, en la pr ti a orresponde al test ms utilizado.

2.9.

Predi in

La predi in es una de las herramientas ms atra tivas y utilizadas en E onometra. Si el modelo que hemos es ogido onrma la teora en onsidera in, es
de ir, a sobrevivido a las pruebas de hiptesis, podemos utilizar el modelo estima-

Yb = X b para prede ir.

La predi in se puede efe tuar para un valor puntual


0
de la variable dependiente, y , orrespondiente a un valor dado de los regresores,
x0 , o prede ir el valor esperado E[y 0 /x0 ] ondi ional a las variables expli ativas.

do

Supongamos primero que queremos prede ir un valor individual de Y,


0
do a un ve tor de regresores xj on j = 1, 2..., k de dimensin 1 k .

y 0 , aso ia-

0
0
0
De a uerdo on el modelo e onomtri o se tiene que y = 1 +x2 2 +.....+xk k +u0 .
0
Para prede ir el valor de y podemos utilizar la estima in MCO del modelo,
0
0b
yb = x .
De esta forma, el error de predi in estar dado por :

b + u0
e0 = y 0 yb0 = x0 ( )
63

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

En donde se distinguen dos fuentes del error de predi in

El error en la estima in del ve tor

El error esto sti o inherente al modelo

u0

Sin embargo, si onsideramos que el estimador MCO es insesgado y mantenemos


los supuestos de nuestro modelo de regresin lineal, es trivial mostrar que el valor
esperado del error de predi in ser ero. Adems, podemos al ular la varianza
del error de predi in:

b
b x0 + 2x0 ( )u
b 0 + u0 u0 ]
V ar(b
e0 ) = E[x0 ( )(
)
V ar(b
e0 ) = 2 + 2 x0 (X X)1 x0

La varianza del error de predi in depender de la matriz de regresores X de


dimensin

nk

que se utiliz para obtener las estima iones de

Sabemos que

a mayor dispersion de las variables expli ativas menor varianza tendrn nuestras
11
0
estima iones MCO . Adems depender del ve tor x que hemos asumido o2
no ido y del parmetro , el ual no ono emos y deber ser reemplazado por
su estimador
b2 si es que queremos onstruir un intervalo de onanza para la
predi in y
b0 .
Bajo supuestos de normalidad del trmino de error, el error de predi in es

una ombina in lineal de dos variables normales por lo tanto tiene una distribu in Normal(0, b
e2). Por lo tanto, por una razonamiento anlogo al de las se iones
anteriores se tiene que:

y 0 yb0

2 (1 + x0 (X X)1 x0 )

N(0, 1)

Por lo tanto, dada una predi in puntual

y 0 yb0
q
tnk

b2 (1 + x0 (X X)1 x0 )

yb0

y una estima in de la desvia in

estndar del error de predi in podemos onstruir un intervalo de onanza para


0
el valor de y :

P r[b
y 0 t1/2,nk
11 Es

V ar(b
e0 ) y 0 yb0 + t1/2,T k

V ar(b
e0 )] = 1

posible y se re omienda derivar una expresin para la varianza del error de predi in
utilizando un modelo on 2 regresores. En est expresin se apre ia laramente la dependen ia
de la varianza del error de predi in on la dispersion en torno a la media de las variables
expli ativas.
64

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Consideremos ahora que el investigador no est interesado en prede ir el valor de


0
0
0
la variable endgena y , si no tan solo su valor esperado E(y ) = x . La predi 0b
. La diferen ia es que el error de pre in, al igual que en el aso anterior, ser x
b.
di in en este aso estar denido por e
e = E[y 0 ] x0 b = x0 x0 b = x0 ( )

Cal ulando enton es la varianza (Ha erlo!) de este nuevo error de predi in
0
podemos onstruir ahora un intervalo de onanza para E(y ) de la misma forma
que antes.

E[y 0 ] yb0
q
N(0, 1)
2
0

1
0
(x (X X) x )
P r[b
y 0 t1/2,nk
Donde utilizamos

E[y 0 ] yb0
q
tnk
2
0

1
0

b (x (X X) x )

V ar(e
e0 ) E[y 0 ] yb0 + t1/2,T k

V ar(e
e0 )] = 1

b = x0 V ar()x
b 0 = 2 x0 (X X)1 x0 .
V ar(yb0) = V ar(x0 )

La siguiente gura ejempli a las predi iones de


de 2 variables independientes.

65

y0

E[y 0 /x0 ]

en un modelo

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.9.1. Medi in de la pre isin de la predi in


Se han propuesto varias medidas para valorar la pre isin de los modelos de
predi in. Mu has de estas medidas estn para evaluar la predi in expost, es
de ir, predi iones para las que las variables exgenas no tienen que ser predi has.
Dos de estas medidas que se basan en los residuos de la predi in, son la raz
uadrada del error uadrado medio y el error absoluto medio.

RMSE =

rP

ybi )2
n0

i (yi

66

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

MAE =
Donde

| yi ybi |
n0

n0 es el nmero de perodos que hay que prede ir. Estos mtodos presentan

un problema obvio de es ala. Algunas medidas que no presentan este problema


se basan en el estadsti o U de Theil.

U=

P
(1/n0 ) i (yi ybi )2
P
(1/n0 ) i yi2

67

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.10.

Estima in Mximo Verosmil (EMV)

Hasta el momento hemos adoptado el riterio de estima in onsistente on es,


oger los valores de los parmetros (
2 ) de modo de minimizar la suma de los
residuos al uadrado. A ontinua in, expondremos otra forma de obtener los
parmetros de inters, el ual, a diferen ia de OLS, des ansa en un determinado
supuesto respe to de la distribu in del trmino de error, teniendo por objetivo,
omo veremos ms adelante, determinar los parmetros que

bilidad de o urren ia de la muestra observada.

maximi en la proba-

La ventaja de MV es que puede

produ ir estimadores onsistentes y asintti amente e ientes uando MCO falla.


Sea Y'=[y1 ,

y 2 , . . ., y n

un ve tor

n1

de valores muestrales para la variable

k 1 '

dependiente, los uales dependen de un ve tor

f (y; )

= [1 ,

2 , . . ., k .

Sea

la densidad onjunta aso iada. A di ha probabilidad onjunta se le llama

fun in de Verosimilitud

L():

y se denota por

L(; y)

f (y; )

Note que hemos invertido la nota in entre L y la densidad. Ello porque la densidad des ribe los valores probables de

Y dado

un ve tor

determinado, sin

embargo, en nuestro aso el sentido es inverso: estamos interesados en el ve tor

dado

un ve tor Y determinado.

Al maximizar

L(; Y )

smiles

los uales

M V ),
(

observada, es

respe to de

se obtienen los estimadores mximo vero-

maximizan la probabilidad de o urren ia de la muestra

de ir:

M V = max L(; Y )

(2.73)

M V = max ln(L(; Y )) = max l(; Y )

(2.74)

12

o equivalentemente

Luego, si asumimos que las observa iones de Y son independientes, enton es

l(; Y ) = ln(

n
Y

Li (; yi )) =

i=1

12 En

n
X

li (; yi )

13 :

(2.75)

i=1

general se utiliza el logaritmo de la fun in de verosimilitud, denotado omo l = ln(L)


omo fun in objetivo. Note que di ha transforma in es ino ua, en trminos de que el ve tor

de parmetros que maximize l ser el que a su vez maximize L, ya que:


= L1 L

13 Bajo independen ia, la fun in de distribu in onjunta de una muestra orresponde a la


multipli a in de las fun iones de densidad individuales.
l

68

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

La primera derivada de L es generalmente ono ida omo


lo ual

M V

S ore, s = (; Y ), por

se obtienen al igualar el s ore a ero.

2.10.1. Propiedades de los estimadores MV


Las propiedades de los estimadores ML se derivan en grandes muestras, por lo
ual hablaremos de las propiedades

1.

asintti as

de los mismos. Ellas son:

Consisten ia:
plim(M V ) =

(2.76)

es de ir, asintti amente, el parmetro estimado orresponde al parmetro


pobla ional.
2.

E ien ia Asintti a: La varianza del estimador ML al anza la llamada


Cota Inferior de Cramer Rao, es de ir I()1 . Esta propiedad asintti a
es la prin ipal virtud de los estimadores ML. La ota inferior de Cramer
Rao orresponde al inverso de la matriz de informa in (que deniremos a
ontinua in), la ual orresponde a la mnima varianza que puede poseer
un estimador insesgado.

3.

Normalidad Asintti a:
M V a N(, I()1 )

(2.77)

es de ir, el estimador ML distribuye asintti amente normal, on media


y varianza igual al inverso de la llamada

matriz de informa in (I()).

Esta ltima se dene omo:


 2 
l l
l
I() = E
= E

donde note que la matriz hessiana de segundas derivadas de L es una matriz


uadrada y simtri a de orden
4.

k k.

Invarianza: Si es el estimador ML de
de

enton es

g()

es el estimador ML de

69

g()
g().
y

es una fun in ontinua

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.10.2. Estima in MV
Como ya es usual, sea el siguiente modelo pobla ional:

Y = X + u
donde las matri es poseen los tamaos usuales y

iid

u N(0, 2 I).

f (u1 , u2, . . . , un ; I) = f (u1 ) f (u2 ) f (un ) =

Enton es:

n
Y

f (ui )

i=1

y asumiendo una distribu in normal para los errores, tenemos que la fun in de
verosimilitud orresponde a:

f (u1, u2 , . . . , un ; I) =

n
Y
i=1

1
2 2

exp

u2
i
2 2

1
u u2
2
exp
n
(2 2 ) 2

(2.78)

(2.79)

luego, dado nuestro modelo pobla ional, tenemos que:

L = f (y1, y2 , . . . , yn ; X, 2 , ) =
on lo ual, nuestros estimadores

(Y X) (Y X)
1

2 2
n exp
(2 2 ) 2

M V = [M V

M
V]

(2.80)

se obtienen siguiendo la

regla expuesta en (2.74):


(Y X) (Y X)
1

2
2
ma2x ln(L) = ma2x ln
n exp
,
,
(2 2 ) 2


n
n
(Y X) (Y X)
2
= ma2x ln(2) ln( )
(2.81)
,
2
2
2 2
on lo ual, las CPO:

lnL
1
=0
= 2 X (Y X )

= M V = (X X)1 X Y

(2.82)

lnL
n
1
(Y X )
=0
= 2 + 4 (Y X )

(Y X M V ) (Y X M V )
= 2 M V =
n
70

(2.83)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Enton es, bajo normalidad de los errores, el estimador

M V

es equivalente al es-

timador MCO. Sin embargo, note que el estimador de la varianza de los errores
(
M V

da lugar al estimador sesgado.

Nos queda enton es derivar la varianza de los estimadores MV. Vimos que la
matriz de varianzas orresponda al inverso de la matriz de informa in (I( )).
Por fa ilidad de l ulo, generalmente se utiliza la segunda deni in de

I(),

es

de ir, la de las segundas derivadas de la fun in de verosimilitud. Enton es:

2l
X X
=


2l
X X
=
E

2


(2.84)

2l
X u
=

2
4


2l
=0
E
2

(2.85)

2l
n
u u
= 4 6
( 2 )2
2


n
2l
= 4
E
2
2
( )
2


(2.86)

donde esta ltima esperanza se deriva del he ho que

E(u u) = n 2 .

Enton es, la

matriz de informa in orresponde a:

I(, ) =

 XX
2

0
n
24

(2.87)

mientras que su inversa:

I(, )

 1 2
(X X)
=
0

0
24
n

(2.88)

Note que el he ho que la matriz de informa in (y por lo tanto su inversa) sea


una matriz diagonal, reeja que X y u se distribuyen independientemente (de otra

forma E(X u) 6=0).


71

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.11.

Inferen ia en el ontexto MV

2.11.1. Test de Razn de Verosimilitud (LR)


El valor de la fun in de verosimilitud,
militud


L(,
2 ), orresponde al valor de la verosi-

irrestri ta, es de ir, sin imponer ninguna restri in sobre los parmetros

del modelo. Suponiendo enton es que nuestro inters se entra en una serie de restri iones lineales del tipo

R = r (donde R y r se denen omo en la se in 2.8),

enton es el modelo original es estimable en su versin restringida, al maximizar


la fun in de verosimilitud sujeta a R = r , uyo resultado son los estimadores
.
y 2 . Luego L(, 2 ) orresponde al valor de la verosimilitud

restringida

El valor de la verosimilitud restringida no puede ser superior al de la no restringida, sin embargo, podra esperarse que si las restri iones impuestas son orre tas,
el valor de la primera est er a del de la segunda. Enton es, denimos la

de verosimilitud () omo:

razn

2 )
L(,

L(,
2)

El test LR se dene enton es omo:


2 )] a 2 (q)
LR = 2 ln = 2[ln L(,
2 ) ln L(,

(2.89)

donde q orresponde al nmero de restri iones impuestas (es de ir, el nmero de


las de R).
Intuitivamente, el valor del estadgrafo re er a mayor sea la dis repan ia entre
los valores de la verosimilitud restringida y la no restringida, lo ual nos aleja de
la posibilidad que las restri iones impuestas sea vlidas (no re hazo de la nula).
En el aso que los errores distribuyan normal, es posible derivar una versin
M V y 2 M V en
alternativa del estadgrafo utilizando los residuos. Reemplazando

es posible demostrar:

2 ) = (2e) n2 (2 ) n2 =
L(,
Luego, si denimos omo

uN R

2e
n

 n2

(
u u) 2

(2.90)

los residuos del modelo irrestri to y omo

uR ,

reemplazando en la deni in del test, obtenemos:

LR = n(ln uR uR ln uN R uN R )

72

(2.91)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

2.11.2. Test de Wald (W)


Un segundo test asintti o en el ontexto MV orresponde al llamado Test de
Wald. Di ho test se basa en evaluar la hiptesis nula en los oe ientes estimados
y evaluar uan er ano es el resultado omprado a lo propuesto por la nula. Una
de las ventajas del test de Wald es que slo ne esita de la estima in no restringida. As, una vez obtenido

un ve tor

la hiptesis nula.

(R r) er ano

a ero tendera a apoyar

Siguiendo la misma lgi a de la demostra in del test F, si:

a
(, I()1)

(2.92)

enton es, bajo la hiptesis nula:

(R r) (0, RI()1 R )

(2.93)

enton es, se puede demostrar que:

a
(R r) [RI()1 R ]1 (R r) 2q

(2.94)

donde q es el nmero de las de R y por lo tanto, el nmero de restri iones


(segn la denimos en la se in 2.8). Luego, omo los estimadores MV distribuyen asintti amente normales, enton es la matriz de informa in expuesta en
la e ua in (2.88) es vlida en muestras grandes, tenemos que el estadsti o de

14 :

Wald se dene omo

W =

(R r) [R(X X)1 R ]1 (R r) a 2
q

(2.95)

Una nota: Dijimos que el test era vlido asintti amente, donde hemos utilizado
el resultado de normalidad asintti a de MV. En aso de que los errores efe tivamente distribuyan normal en muestra nita, el test (lgi amente) mantiene su
distribu in.

2.11.3. Test del Multipli ador de Lagrange (LM)


Un ter er test orresponde al test LM, el ual tambin es ono ido omo el test
del S ore. re ordemos que el S ore orresponde a la matriz de primeras derivadas
14 Note

que hemos utilizado slo el bloque superior izquierdo de la inversa de la matriz de


informa in. Ello porque el test orresponde a los parmetros aso iados a los oe ientes de la
regresin. Adems, ello es posible porque la matriz es diagonal, lo ual impli a que no existe
orrela in entre los errores y los regresores.
73

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

de la fun in de Verosimilitud:

ln L

l
=

s() =

= 0, por lo ual, al evaluar el s ore en el


s()
), generalmente obtendremos un
estimador restringido bajo la nula R r = 0 (
Como vimos en la introdu in,

ve tor diferente de ero, sin embargo, si la nula no se puede re hazar, esperaramos obtener un ve tor er ano a ero.
Se puede demostrar que el s ore posee media ero y varianza igual a la matriz de
informa in (I()). Por lo tanto, tenemos que la forma uadrti a:

s ()I()1 s() 2
on lo ual, al evaluar en el ve tor de parmetros restringido tenemos que bajo
la nula, el test LM se dene y distribuye omo:

)
1 s()
a 2
LM = s ()I(
q

(2.96)

Note que ontraposi in al test de Wald, slo ne esitamos al ular el estimador


restringido. De he ho, su popularidad reside en que mu has ve es es ms f il
al ular el estimador restringido que el irrestri to.
Dada la normalidad asintti a de los estimadores MV, podemos redu ir el estadgrafo a una forma mu ho ms simple. Para ver lo anterior, onsidere una
nota in matri ial del s ore:

s() =

l
2

1
X u
2
u u
n
22 + 2
4

enton es, para evaluar el s ore en la estima in restringida, utilizamos los residuos
restringidos, los uales denotaremos por:

u = Y X
y por lo tanto:

2 =

u u
n

on lo ual:

=
s()

1
X u

74

(2.97)

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

Enton es, tomado en uenta la deni in de

I()1

dada en (2.87) y evalundola

en el estimador restringido, tenemos que nuestro test en (2.96) queda omo:

LM =
=
=
=
donde el

R2

2 (X X)1
0
0

1
u X(X X) X u
2

u X(X X)1 X u
n
u u
nR2 a 2q
1
uX

0
2
4
n



1
uX

(2.98)
(2.99)

orresponde a la bondad de ajuste de la regresin auxiliar entre

y X.
Resumiendo, el test se implementa en tres simples pasos:

1. Estimar el modelo restringido y obtener sus residuos


2. Con ellos orrer una regresin de ellos ontra X. Obtener el

R2

3. Construir el estadsti o

2.12.

Algunas a ota iones respe to a la estima in y la inferen ia MV

1. La se in 2.10.2 asume que la distribu in de los errores sigue una distribu in normal. Sin embargo, suponer errores normales es slo uno de los
posibles supuestos respe to a la distribu in de los errores. Existe una gran
antidad de posibilidades al respe to, utilizndose otras omo la distribu in
logsti a y la exponen ial, muy regularmente en otros tpi os e onomtri os.
Lo anterior es una ventaja de la estima in MV, dado que sus propiedades
asintti as se mantienen independientemente de la distribu in utilizada.
2. Otra ventaja orresponde a la posibilidad de utilizar modelos no lineales.
MCO (tal y omo lo hemos estudiado) slo permite estimar modelos lineales en parmetros, mientras que MV permite no linealidades (aunque ello
implique la imposibilidad de obtener de obtener formas fun ionales erradas
para nuestros estimadores, lo ual impli a ne esariamente utilizar mtodos
numri os para optimizar la fun in objetivo).

75

E onometra
Es uela de Nego ios, UAI.

Capitulo 2: Modelo de Regresin Lineal

3. Otra ventaja reside en la inferen ia. Toda la inferen ia vista en MCO posea
distribu in exa ta bajo el supuesto de normalidad. Los test asintti os
visto en la inferen ia MV son vlidos bajo ualquier distribu in supuesta
(aunque asintti amente).
4. Adi ionalmente, los tres test vistos son apa es de lidiar on restri iones no

15

lineales. Por qu? Porque MV es apaz de lidiar on modelos no lineales


5. Es posible demostrar que

W LR LM

al ser apli ados a un modelo

lineal. Los tres son asintti amente equivalentes, sin embargo, en muestras
nitas arrojarn resultados diferentes.
6. Cundo es re omendable utilizar un test t o un test F por sobre un test
asintti o?
7. Todos los paquetes estadsti os reportan el valor de la fun in de verosimilitud (es de ir, la fun in evaluada en los parmetros estimados). Ello,
mu has ve es es utilizado omo un riterio de sele in entre modelos (re uerde que nuestro objetivo es maximizar la fun in de verosimilitud).

15 Un

ejemplo de restri in no lineal orresponde a H0 : ln(32 ) = 0,1 + ln(2). Para estimar


el modelo restringido basta on aislar 2 e introdu irlo en la fun in de verosimilitud que ser
maximizada por mtodos numri os.
76

Captulo 3
Forma Fun ional y Espe i a in
3.1.

Regresores Esto sti os en el Modelo de Regresin Lineal

En el desarrollo del modelo de regresin lineal realizado en la se in 2.4 asumimos que nuestras variables expli ativas eran determinsti as (Supuesto 2). En
ese ontexto, ada vez que tombamos una muestra diferente los regresores permane an jos y solo la variable dependiente ambiaba, ha iendo enton es que
la regresin muestral fuera una aproxima in a la regresin pobla ional. En est

1 y veremos uales son las on-

se in pro ederemos a eliminar este supuesto

se uen ias de asumir regresores esto sti os en las estima iones del modelo de
regresin lineal. Es de ir, asumiremos ahora que X es obtenida aleatoriamente a
partir de alguna distribu in de probabilidad.
Si X es esto sti o, X debe ser independiente de u si queremos mantener las
propiedades estadsti as de los estimadores MCO. Un mtodo ade uado para obtener las propiedades estadsti as de

b onsiste

en obtener primero los resultados

ondi ionados en X. Esto equivale al aso de los regresores no esto sti os. Despus bus amos los resultados in ondi ionales "promediando"(por ejemplo, por
integra in total) las distribu iones ondi ionadas. La lave de este razonamiento es que, si podemos estable er insesgamiento ondi ionado en un X arbitrario,
podemos promediar las X para obtener un resultado in ondi ionado.
Manteniendo los supuestos 3 y 4 dados por
1 Todos

E(u|x)=E(u)=0, V ar(u|X) = V ar(u) =

los otros supuestos realizados anteriormente se mantienen.


77

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

podemos al igual que antes estudiar si MCO es insesgado.

b = + (X X)1 X u

b
E[|X]
= + (X X)1 X E[u|X] =

Ya que por supuesto 3

E[u|X] = 0.

Podemos ahora al ular el valor esperado

in ondi ional apli ando esperanza sobre todo el espa io posible de los regresores.

b = Ex [E[|X]]
b
E[]

Por lo tanto,

b = + Ex [(X X)1 X E[u|X]] =


E[]

b = Ex [E[|X]]
b
b tambin es insesgado in ondi ionalmente.E[]
= .

El insesgamiento de los parmetros MCO es robusto a los supuestos de la matriz


X.

Con respe to a la varianza de

ondi ionada en la matriz de variables inde-

pendientes tenemos

b
V [|X]
= 2 (X X)1

Sin embargo, la varianza in ondi ional de

b esta

dada por

b = Ex [V [|X]]
b
b
V []
+ Vx [E[|X]]
b = Ex [V [|X]]
b
V []
+ Vx []

b = Ex [V [|X]]
b
V []
= E[ 2 (X X)1 ] = 2 E[(X X)1 ]

Nuestra on lusin ini ial se altera un po o, tenemos que sustituir

(X X)1

por

su valor esperado para obtener la matriz de ovarianzas apropiadas. La varianza


in ondi ionada de

solo puede ser des rita en trminos del omportamiento

medio de X. Sin embargo, el teorema de Gauss Markov seguir apli ando. Ya que
si para ada X parti ular el estimador MCO es el mejor estimador lineal insesgado
tambin lo ser para los valores medios de los regresores.

2 Apli ando

des omposi in de la varianza(Ver).


78

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Con lusiones:

Si los errores son independientes de las X enton es se umplir el Teorema


de Gauss Markov.
Bajo normalidad del error los test estadsti os tienen la misma distribu in
que en el aso de las X no esto sti as.

3.2.

In orpora in de No Linealidades

En la se in 2 asumimos que el modelo de regresin deba ser lineal. Sin embargo,


mu has de las rela iones e onmi as no son lineales. Veamos el siguiente ejemplo
de la rela in entre las ventas de los portales de Internet y el nmero de visitas
al portal.

Claramente la rela in es no lineal. No es lo mismo en trminos de ventas aumentar desde 40 visitas a 50 que de 10 visitas a 20. Pero, Cmo podemos in orporar
no linealidad entre Y y X en nuestro modelo de regresin?. Bsi amente lo que
haremos es utilizar algunos tipos de transforma in de variables. Esto nos permitir tener un modelo no lineal y a partir de la apli a in de las transforma iones
tener un modelo de regresin lineal para el que se umplen todas las osas que
hemos visto.

79

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Transforma in Logartmi a

modelo original no lineal de la siguiente forma Yi = 1 Xi2 ui.


apli amos logaritmo nos quedar un modelo transformado de la si-

Suponga un
Si

guiente forma

ln(Yi ) = ln(1 ) + 2 ln(Xi ) + ln(ui )


Y X
orresponde a la elasti idad X de Y. Este tipo de
X Y
transforma iones es muy til en modelos de demanda y de produ in.
En donde

2 =

Transforma in Semilogartmi a

modelo original no lineal de la siguiente forma Yi = 1 e2Xi ui.


apli amos logaritmo nos quedar un modelo transformado de la si-

Suponga un
Si

guiente forma

ln(Yi ) = ln(1 ) + 2 Xi + ln(ui )


Y 1
orresponde a la semi elasti idad X de Y. Una utiX Y
liza in omn de la formula in semilogartmi a se da en los asos de
ln(Y )
re imiento exponen ial. Si X es el tiempo t, enton es
= 2 =Tasa
t
media de re imiento de Y.
En donde

2 =

Transforma in Re pro a

modelo original

Suponga un
no lineal de la siguiente forma
2 X1i + ui . El ual podemos expresar omo un
la siguiente forma

Yi = 1 +

modelo transformado de

Yi = 1 + 2 Zi + ui
En donde

2 =

Y
orresponde al parmetro usual.
X

Si no se ono e a priori la forma fun ional, existen algunos mtodos que podran
identi ar la existen ia de alguna no linealidad. A ontinua in veremos uno de
ellos.

3.2.1. Test de No Linealidades Omitidas (Test de Reset)


Una pregunta interesante de plantearse es si nuestro modelo ha omitido no linea-

lidades en iertos regresores . Ramsey (1969) introdujo el siguiente test. Bajo la


3 Es

importante no onfundir la no linealidad en regresores Vs no linealidades en parmetros.


Nuestro enfoque se basa en el primer tipo de ellas. El segundo es de mayor omplejidad en tanto
80

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

nula, el modelo pobla ional orresponde a:

Y = X + u
luego, denotamos, omo ya es usual,

Y = X .

Ramsey propuso estimar el si-

guiente modelo auxiliar a travs de MCO.

Y = X 1 + Z 2 + u
donde:

Z =
luego la nula:

H0 :

Y 2 Y 3 . . . Y m

No Existen no linealidades omitidas

H0 : 2 =0
puede ser testeada utilizando un test de Wald sobre 2 . Es posible demostrar que
a 2
bajo la nula W m1 . Por lo tanto, la nula se re haza al % de signi an ia si

el estadgrafo es mayor que el valor rti o orrespondiente. Para implementar el


test, m (es de ir, el nmero de poten ias de Y a in luir en la regresin auxiliar)
debe ser sele ionado previamente. Tpi amente, valores pequeos omo 2, 3 o 4
pare en fun ionar mejor.

que al derivar la fun in objetivo on respe to a los parmetros de inters, podemos no obtener
una forma fun ional errada para nuestro estimador. Ello nos llevar generalmente a utilizar
mtodos numri os para maximizar o minimizar nuestra fun in objetivo, la ual, in luso puede
dejar de ser estri tamente n ava.
81

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.3.

Variables Dummies o ualitativas

En en anlisis de regresin, la variable dependiente esta inuida fre uentemente


no solo por variables ontinuas omo so el ingreso, produ in, pre ios, ostos,
estatura, temperatura, et ..., sino tambin por variables que son esen ialmente
ualitativas, estos son regresores

binarios, es de ir, variables que slo toman el vavariables dummies, variables di otmi as

lor 0 o 1. Di has variables son llamadas


o

variables  ti ias.

Mu has ve es el regresor es binario porque as fue re ogido

en la en uesta. Sin embargo, en otros asos el regresor binario ha sido onstruido


a partir de otras variables de los datos.
Algunos ejemplos de variable dummies son: gnero, raza, religin, na ionalidad,
regin geogr a, et ....Con respe to a las dos primeras variables men ionadas
por ejemplo, se ha en ontrado que manteniendo todos los dems fa tores onstantes, las trabajadoras mujeres ganan menos que sus olegas hombres, y que las
personas de olor ganan menos que las blan as. Este patrn puede resultar de
dis rimina in sexual o ra ial, pero ualquiera sea la razn, las variables ualitativas tales omo gnero o raza s inuyen sobre la variable dependiente.
Por ejemplo, onsideremos la siguiente variable dummy para gnero (mujer/hombre)
del individuo. Enton es la variable dummy onsistir en un ve tor
elementos 0 o 1 segn orresponda. Es de ir:

(
1
d1i =
0

(n 1)

mujer
hombre

on

(3.1)

A modo de ejemplo, pensemos en una e ua in simple de salarios E(Salario(W)/Gnero),


la ual impli a el siguiente modelo:

Wi = 0 + 1 d1i + ui

(3.2)

enton es, dada la espe i a in es ogida para la dummy, tenemos que:

0 = E(W/hombre)
0 + 1 = E(W/mujer)
Alternativamente, podramos haber denido la dummy de la siguiente forma:

(
0
d2i =
1

mujer
hombre

82

(3.3)

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

y el modelo omo

Wi = 0 + 1 d2i + ui
enton es, en esta segunda espe i a in es ogida para la dummy, tenemos que:

0 + 1 = E(W/hombre)
0 = E(W/mujer)
Una ter era forma de denir el modelo sera in luyendo ambas dummies:

Wi = 1 d1i + 2 d2i + ui
on el ual tendramos que los retornos a ambos gneros seran:

2 = E(W/hombre)
1 = E(W/mujer)

Los tres modelos anteriores son equivalentes. Note que en el ter er modelo
no in luimos trmino onstante ya que ello hara que la matriz X fuese singular y
por lo tanto, no invertible. Di ho error de espe i a in es llamado en la literatura

Trampa de las Dummies

y orresponde a un error netamente del investigador,

no de los datos.
Un modelo de regresin puede ontener variables expli ativas que son ex lusi-

Modelos de
anlisis de varianza (ANOVA), estos modelos son utilizados para determinar
vamente di otmi as o ualitativas, tales modelos se denominas

la signi an ia estadsti a de la diferen ias de medias entre grupos, por ejemplo,


servira para determinar si existe diferen ia signi ativa entre los ingresos medios
de los hombres y mujeres.

Ejemplo I:
Contamos on datos de ingreso proveniente de la o upa in prin ipal para el ao
2000, de a uerdo a zona geogr a de Chile: Norte (de la primera a la uarta
regin), Centro (quinta regin, sexta regin y regin metropolitana) y Sur (de
la sptima a la duod ima regin). Suponga que deseamos averiguar si el salario
promedio diere entre las distintas zonas geogr as, si tomamos el promedio de
los salarios de los individuos en ada una de las zonas obtenemos lo siguiente:

Zona Geogrfi a Salario Promedio


Norte

$ 270,154

Centro

$ 296,857.8

Sur

$240,238.9
83

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Estos nmeros son laramente diferentes entre s, pero lo que nos interesa saber
es si esta diferen ia es estadsti amente signi ativa, para esto utilizaremos un
modelo ANOVA.
Consideremos el siguiente modelo de regresin:

Yi = 0 + 1 D1i + 2 D2i + ui
donde:

Yi =Salario del individuo i.


D1i =es una variable dummy

que toma valor 1 si la persona i vive en el norte y

ero sino.

D2i =

es una variable dummy que toma valor 1 si la persona i vive en el sur y

ero sino.
Este modelo es omo ualquier otro modelo de regresin lineal, la ni a diferen ia que ahora todo nuestras variables expli ativas son binarias. De esta forma,
el salario promedio de los individuos que viven en el norte es:

E(Yi |D1i = 1, D2i = 0) = 0 + 1


de igual forma el salario promedio de los individuos que viven en el sur es:

E(Yi |D1i = 0, D2i = 1) = 0 + 2


y por ltimo, el salario promedio de los individuos que viven en el entro es:

E(Yi |D1i = 0, D2i = 0) = 0


As, el salario promedio de los individuos de la zona entro esta dado por el inter epto de la e ua in de regresin, adems los oe ientes

("pendiente"),

indi an la antidad en que los salarios promedios del norte y sur dieren de los
del entro, respe tivamente. Ahora ne esitamos ver si estas diferen ias son estadsti amente signi ativas.
El modelo estimado es:

84

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Como los tres oe ientes estimados resultan ser estadsti amente signi ativos,
la diferen ia en los salarios promedios entre regiones es estadsti amente signi ativa. De esta forma, se puede on luir que los salarios en la zona entro son
estadsti amente mayores a los de la zona norte y sur, y que los de la zona norte
son estadsti amente superior a los de la zona sur.
Es importante tener laro que las variables di otmi as simplemente sealaran
las diferen ias, si es que estas existen, pero no sugieren razones por las uales
estas se presentan.
Desde ahora llamaremos a la ategora que no se le asigna dummy (en nuestro ejemplo la zona entro) omo

ategora base,

todas las ompara iones se

harn respe to a esta ategora. Los oe ientes orrespondientes a las variables
di otmi as los llamaremos

oe ientes de intera in diferen ial.

Los modelos ANOVA que a abamos de analizar no son muy fre uentes en e onoma, slo se utilizan para testear diferen ias de medias.
Los modelos e onomtri os generalmente son ms amplios e introdu en tanto
variables expli ativas ontinuas omo di otmi as. Por ejemplo, es razonable suponer que, adems del gnero, existen otros fa tores que expli an el salario (edu a in y experien ia (entre otros) siguiendo a Min er (1974)).
Espe iquemos nuevamente el modelo en (3.2) omo E(Salario (W)/Edu a in
(E), Gnero):

Wi = 0 + 1 d2i + 2 Ei + ui
Di ho modelo presenta un

efe to inter epto

para el gnero, es de ir, hombres

y mujeres poseen diferente inter epto, pero igual pendiente (2 ) en edu a in


(retorno a la edu a in):

Hombres

W
2
0+ 1

Mujeres

0
E
Salario y Educacin, diferencia de intercepto entre hombres
y mujeres

85

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Ahora, si quisiramos espe i ar un modelo en que adems las pendientes varen


on el gnero (retornos a la edu a in diferen iados), tendramos el siguiente
modelo:

Wi = 0 + 1 d2i + 2 Ei + 3 d2i Ei + ui
donde:
E(Salario (W)/Edu a in (E), Hombre)=0 +
E(Salario (W)/Edu a in (E),

E(Salario(W )/Educacin(E),Hombre)
E
E(Salario(W )/Educacin(E),M ujer)
E

1 +2 E +3 E .
Mujer)=0 +2 E .

= 2 + 3 .

= 2 .

En el aso que existan otros regresores ontinuos (experien ia, por ejemplo), podra ser deseable poseer efe tos diferen iados en la pendiente slo para algunos
de ellos.

Hombres

W
2+3

0+ 1

Mujeres

0
E
Salario y Educacin, diferencia de intercepto y pendiente
entre hombres y mujeres

86

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.3.1. Posibles usos de las variables Dummies


Como hemos men ionado las variable dummies pueden reejar ara tersti as individuales omo gnero, status marital,raza, et , y de esta forma las habiamos
llamado

variable ualitativas.

Sin embargo, este no es el ni o motivo para

in luir dummies en una regresin. Existen adems aquellas dummies llamadas

dummies esta ionales

uyo objetivo es ontrolar por fa tores temporales de

los datos. Por ejemplo, estimando la demanda de helados, es posible que exista

un .efe to verano"por lo ual la demanda aumente en algunos trimestres o bimestres, de esta forma para ontrolar di ho efe to, se deben in luir 4 dummies ada
una orrespondiente a un trimestre del ao (o 6 en el aso del bimestre, o 2 en
el aso del semestre, et .). Re uerde que el aso de in luir una onstante debe
retirar dis re ionalmente alguna de ellas, la ual servir omo trimestre de referen ia. Las dummies tambin pueden ser tiles para aptar

efe tos umbrales.

Siguiendo on nuestro ejemplo de edu a in, podramos tener que en la en uesta,


la variable Edu a in no fue re ogida en forma ontinua, sino dis reta (es de ir,
si la persona posee: Edu a in Bsi a (8 aos), Edu a in Media (12 aos), Edu a in Universitaria (17 aos), Edu a in universitaria on postgrado (19 aos)).
Deniendo una dummy por ada nivel de edu a in, el oe iente aso iado a ada una de ellas nos mostrara el retorno a ada tipo de edu a in. Finalmente,
las dummies pueden ser de utilidad para uanti ar

efe tos ondi ionales. Ya

habamos enun iado stas uando vimos E(W/E,gnero), en que permitimos que
la pendiente vare entre gneros. Di has dummies son de inters uando queremos
aptar algn efe to ondi ional a alguna ara tersti a. Por ejemplo, el retorno a
la edu a in dado que se es mujer, o que se es asado, o que se es blan o, et .
En di ho aso, basta introdu ir la dummy que identi a el estado ondi ional
multipli ada por la variable de inters.
Con luyendo, la forma en que se in luyan las variables binarias en el modelo
de regresin depende de la pregunta que el investigador desee responder o del
objetivo que tenga para in luirlas. Creatividad y teora.
Desde el punto de vista de la teora de regresin,

di

orresponde a un varia-

ble aleatoria del mismo pro eso de muestro que gener el resto de las variables.
Veamos enton es omo manejarlas algebrai amente. Sea el modelo simple:

Wi = 1 d1i + 2 d2i + ui
o en nuestra nota in matri ial usual:

Y = X + u
87

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

donde

= (1 2 )

X = [D1 D2 ],

enton es:

= (X X)1 X Y

1  
D1 D1 D1 D2
D1 Y
=

D2 D1 D2 D2
D2 Y
 Pn 2
1  Pn

Pn
d1i
d1i d2i
d1i yi
i=1
i=1
i=1
P
P
P
=
n
n
n
2
i=1 d1i d2i
i=1 d2i
i=1 d2i yi

1  Pn

n1 0
Pni=1 d1i yi
=
0 n2
i=1 d2i yi


y1
=
y2
n1 y n2 son el nmero de observa iones on d1i =1 y d2i =1, respe tivamente,
y y1 y y2 orresponden a las medias muestrales entre las respe tivas observa iones.
donde

Y on respe to a la varianza de los estimadores:

V () = (X X)1
2
" 2
#

0
n1
=
2
0 n 2
donde:

2 =

1X 2
u
n i=1 i

es el estimador basado en la muestra ompleta.

88

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Ejemplo II:

A ontinua in veremos la apli a in de la llamada .E ua in de Min er"para


estimar el retorno a la edu a in. Los datos orresponden a un grupo de jvenes
hilenos egresados de la edu a in media t ni a, los que fueron entrevistados en
1997. La primera gura muestra la estima in de la e ua in de Min er en su
versin original (1974):

ln(Salario)i = + 1 Educacioni + ui

Consideremos ahora una versin ms ompleta del modelo en que in luimos la


experien ia y una dummy que toma el valor 1 si el individuo es una mujer:

Note que el retorno a la edu a in sigue siendo positivo, mientras que la dummy
para mujer es negativa (Qu signi a que el parmetro sea negativo?). Veamos a
ontinua in, la misma espe i a in, slo que esta vez la dummy se dene omo
1 si el individuo es hombre:

89

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Cmo es el parmetro de la dummy para el hombre omparado on el de la


mujer? Qu pasa on la estima in del resto de los parmetros?.

90

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.4.

Variable Dependiente Rezagada

Cuando trabajamos on series de tiempo, es posible que sea de nuestro inters


in luir rezagos de la variable dependiente omo variables expli ativas. Ello puede
o urrir uando reemos que existe ierta persisten ia de nuestra variable dependiente. Por ejemplo, para tratar de expli ar el omportamiento de la ina in
(t ), tendra sentido introdu ir omo variables expli ativas, junto on la tasa de
re imiento del dinero (mt ), rezagos de la propia tasa de ina in:

t = 0 + 1 t1 + 2 mt + ut
Supongamos el modelo ms simple posible:

yt = 1 yt1 + ut

con |1 | < 1

(3.4)

Adelantndonos a la teora de series de tiempo, el modelo anterior re ibe el nombre de

Pro eso Autorregresivo de Primer Orden (AR(1)), donde el nombre

de autorregresivo se debe a que la variable se expli a por rezagos de ella misma y


de primer orden porque depende slo del primer rezago (el orden indi a el nmero
mximo de rezagos in luidos).
La estima in MCO del modelo anterior es

= (X X)1 X Y ,

donde X=[i,Yt1 ,

on la diferen ia que esta vez poseemos n-1 datos, a menos que supongamos un
valor ini ial para

Y0 .

En este aso dejan de umplirse uno de los supuestos bajo

los uales vimos las propiedades del estimador MCO y la inferen ia aso iada,
aunque ontinuemos ha iendo los supuestos pertinentes para el trmino de error,

el modelo viola el supuesto de regresores jos

(no esto sti os).

Anali emos esto on ms detalle, el estimador MCO de

1 =

PT

Pt=2
T

=
=

en (3.4) es:

yt yt1

t=2

PT

yt12

t=2 (1 yt1 + ut )yt1


PT 2
t=2 yt1
PT
ut yt1
1 + Pt=2
T
t=2 yt12

para que este estimador sea insesgado se requiere que:

"P

T
ut yt1
Pt=2
T
t=2 yt12
91

=0

(3.5)

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

lo ual se umplir en la medida que

ys

ut

sean independientes para todo (t,s).

Para examinar este punto on ms detalle, substituyamos el modelo en repetidas


o asiones hasta llegar a una forma general:

y1 = 1 y0 + u1
y2 = 1 y1 + u2 y2 = 1 (1 y0 + u1 ) + u2 = 12 y0 + (u2 + 1 u1 )
y3 = 1 y2 + u3 y3 = 1 (12 y0 + u2 + 1 u1 ) + u3 = 13 y0 + 12 u1 + 1 u2 + u3
.
..

yt = 1t y0 + (ut + 1 ut1 + 12 ut2 + + 1t1 u1 )


Luego, multipli ando

yt

por

ut , ut1 , ut2 ,

et . y tomando esperanza, tenemos

que:

E(yt ut ) = 2
E(yt ut1 ) = 1 2
E(yt ut2 ) = 12 2
Por lo tanto, el valor a tual de

se en uentra orrela ionado on el error a tual y

pasado (no on los futuros). De la misma forma, rezagando la expresin nal para

yt ,

multipli ando por

ut , ut1 , ut2 ,

et . se puede veri ar que el regresor

yt1

no

se en uentra orrela ionado on el valor a tual del error, pero si on sus valores
pasados. Ello impli a que nuestro supuesto

E(ui Xi ) = 0

ya no es vlido, por lo

ual, la matriz de varianzas y ovarianzas involu radas ya no ser una matriz de


eros, lo ual se tradu ir en que los estimadores MCO

ya no sern insesgados,

pero si onsistentes (Demostrarlo).


Note que lo anterior es vlido para rezagos de la variable dependiente, pero no
para rezagos de variables expli ativas, en uanto estos ltimos pueden ser an
interpretados omo jos. El ni o problema que puede presentar el in luir este
tipo de regresores es la alta orrela in que existente entre el valor presente del
regresor y de su o sus rezagos in luidos en el modelo. Ello da origen a problemas
de multi olinealidad.

92

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.4.1. Ejemplo y adverten ias sobre el uso de variable dependiente rezagada omo regresor
Tenemos la siguiente informa in sobre ndi e de Pre ios al Consumidor (IPC)

desde 1982 al 2003 . A partir de esta informa in podemos onstruir la ina in


( ambio por entual en el ndi e de pre ios):

t =

IP Ct IP Ct1
IP Ct1

Veamos que resultados obtenemos al realizar la siguiente regresin:

IP Ct = 0 + 1 IP Ct1 + ut

4 Informa in

obtenida del Ban o Central de Chile: www.b entral. l


93

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Cuando el oe iente de la variable dependiente rezagada es muy er ano a 1, se

di e que la serie tiene raiz unitaria . Sin embargo, este no es el aso. Si teori amente siempre se espera que la ina in sea pequea pero positiva, deberiamos
esperar que el ndi e de pre ios siempre fuera re iendo, y por lo tanto esta serie
ms que tener una raiz unitaria tiene una tenden ia.

La persisten ia en el ndi e de pre ios al onsumidor es asi obvia. Lo que nos


interesa es determinar si existe persisten ia en la ina in, la que deberamos
esperar fuera estable en el tiempo y on valores relativamente bajos y positivos.
Vemos que su ede al estimar el siguiente modelo:

t = 0 + 1 t1 + ut

El oe iente

es signi ativo y del orden del 0.8 Que signi a esto?.

5 Cuando

una serie tiene raiz unitaria, esta no es esta ionaria, lo que signi a que no u ta
en torno a su valor promedio. El test t de signi an ia del parmetro que a ompaa a la variable
dependiente, no sirve para evaluar la hiptesis de raiz unitaria. Comente error tipo I
94

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.5.

Sele in de Modelos

Una pregunta ru ial que se enfrenta en e onometra apli ada es omo es oger
entre diversas espe i a iones planteadas para responder una misma pregunta.
No existe un respuesta ni a al problema anterior, sin embargo, algunas re omenda iones son:

Elegir el modelo ms parsimonioso (lo ms pequeo posible)


Que posea un buen ajuste
Que sea onsistente on los datos observados

Sin embargo, el aso de tener que elegir entre modelos anidados, es posible utilizar
los llamados

Criterios de Informa in. Suponga que usted desea es oger entre

alguno de los siguientes modelos:

Y = 0 + 1 x1 + 2 x2 + 3 x3 + u (1)
Y = 0 + 1 x1 + 3 x3 + v
Y = 0 + (x1 + x2 ) +

(2)
(3)

en ompasa al (2) y al (3), ya que los dos segundos


son el versiones restringidas del primero. Luego, se di e (2) y (3) son anidados en

donde se di e que el modelo (1)


(1)

La pregunta relevante es Cul de las tres espe i a iones anteriores es mejor?.


Los riterios de informa in nos ayudan a responder di ha pregunta. El primer
riterio de informa in es el

Criterio de Akaike (ACI) y se dene omo:


ACI =

mientras que el

2 ln L k
+
n
n

Criterio de S hwarz (BIC) se dene omo:


BIC =

ln(n)
2 ln L
+k
n
n

Luego, el riterio de sele in entre modelos anidados orresponde a elegir el


modelo on

menor riterio de informa in. Note que para que los riterios sean

omprables, deben poseer el mismo tamao de muestra.

95

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.5.1. Ejemplo: Retornos a la edu a in, diferen ias entre


hombres y mujeres
Re ordemos lo aprendido en la se in 3.3 del urso. Veamos que para estimar el
retorno a la edu a in, es de ir, uanto ingreso adi ional me genera un ao ms
de edu a in, podamos onsiderar al menos tres espe i a iones:

Modelo I :
Modelo II :
Modelo III :
donde

Wi

Wi = 0 + 1 d2i + 2 Ei + 3 Ei d2i + ui
Wi = 0 + 1 d2i + 2 Ei + ui
Wi = 0 + 2 Ei + ui

era el logaritmo natural del salario del individuo i,

dummy que tomaba el valor 1 si la persona


aos de edu a in del individuo

Ei d2i

d2i

era una variable

era hombre y 0 sino,

Ei

eran los

era una variable intera tiva.

Adems tenemos que el Modelo II anida al modelo III, y el modelo I anida a los
modelos II y III. De esta forma, podemos utilizar los riterios de informa in de
Akaike y S hwarz para determinar on que espe i a in nos quedamos.

Estima in del Modelo I:


Wi = 0 + 1 d2i + 2 Ei + 3 Ei d2i + ui

96

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Estima in del Modelo II:


Wi = 0 + 1 d2i + 2 Ei + ui

Estima in del Modelo III:


Wi = 0 + 2 Ei + ui

97

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

En resumen:

Modelo

Akaike

S hwarz

2.278

-680692.847

II

2.279

-680676.053

II

2.338

-676154.845

Como debemos elegir el modelo que minimize el riterio de informa in, de a uerdo a ambos riterios debemos elegir el Modelo I.

98

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.6.

Regresin Parti ionada

3.7.

Omisin de Variables Relevantes

3.7.1. Impa to sobre el Insesgamiento


Considere el siguiente modelo pobla ional (expresado en desvos on respe to a
la media):

Y = X1 1 + X2 2 + u
Suponga ahora que el investigador se equivo a y estima el siguiente modelo:

Y = X1 1 + u
Estimando el modelo in orre to obtenemos:

1 = (X1 X1 )1 X1 Y
= 1 + (X1 X1 )1 X1 X2 2 + (X1 X1 )1 X1 u
por lo ual:

E(1 ) = 1 + (X1 X1 )1 X1 X2 2
= 1 + Z2
Ello impli a que por lo general, la omisin de variables relevantes (que pertene en
al modelo pobla ional), ausar que los parmetros estimados sea sesgados. Ello
no su eder, slo en el aso que Z=0 (es de ir que

2 =0

X1

X2

sea ortogonales) o si

(aunque di ho aso es ontradi torio, dado que impli ara que la variable

no pertene e al modelo pobla ional).


La dire in del sesgo es dif il de obtener, sin embargo, el anlisis se simpli a si pensamos en

omo es alares. En di ho aso:

E(1 ) = 1 +

Cov(X1 , X2 )
2
V (X1 )

De lo anterior, se desprende que la dire in del sesgo depende de omo ovarien


las variables in luidas on respe to a las ex luidas y del signo del parmetro
omitido.

99

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.7.2. Impa to sobre la Varianza


Estimando el modelo in orre to, el estimador de la varianza ser:

V (1 /X1 ) = 2 (X1 X1 )1
mientras que si hubiramos estimado el modelo orre to, se puede demostrar que
) orrespondera a:
la varianza del estimador insesgado de 1 (
1

V (1 /X1 , X2 ) = 2 (X1 M2 X1 )1
M2 = I X2 (X2 X2 )1 X2 .

donde
tri es:

Luego, omparamos las inversas de ambas ma-

(V (1 /X1 ))1 (V (1/X1 , X2 ))1 = 2 (X1 X2 (X2 X2 )1 X2 X1 )


tal que se puede demostrar que di ha matriz es denida positiva.
Por lo tanto, el omitir variables relevantes impli a que los parmetros estimados
sern sesgados y que sus varianzas sern menores. Ms an, tambin es posible
demostrar que el estimador de la varianza de los errores (
2 ) es sesgado ha ia
arriba (la varianza pobla ional es menor).

3.7.3. Ejemplo
Suponga que un investigador quiere estimar el retorno a la edu a in y que el
modelo verdadero(obviamente es un aso ilustrativo) est dado por:

Wi = 1 Ei + 2 EXPi + ui
Donde

Wi

(1)

orresponde al logaritmo del salario del individuo i,

los aos de edu a in del individuo i,

6 y

laboral del individuo i

ui

Ei

orresponde a

EXPi orresponde a los aos de experien ia

orresponde a un trmino de error bien omportado.

Sin embargo este investigador utiliza el siguiente modelo para su estima in.

Wi = 1 Ei + ui

(1)

Los resultados del modelo verdadero son


6 La

ual esta denida omo EXPi = Edadi Ei 6.

100

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Los resultados el modelo estimado son

Podemos ver el parmetro que a ompaa a la variable aos de edu a in es menor


en el modelo estimado que en el modelo verdadero. Esta dire in del sesgo se
puede expli ar por el signo del parmetro que a ompaa a la variable experien ia
en el modelo verdadero y a la rela in existente entre edu a in y experien ia en
el mer ado laboral.

3.8.

In lusin de Variable Irrelevantes

3.8.1. Impa to sobre Insesgamiento


Considere ahora el siguiente modelo pobla ional:

Y = X1 1 + u
Suponga ahora que el investigador se equivo a y estima el siguiente modelo:

Y = X1 1 + X2 2 + u
101

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Estimando el modelo in orre to obtenemos:

1 = (X1 M2 X1 )1 X1 M2 Y
= 1 + (X1 M2 X1 )1 X1 M2 u
donde

M2

se dene igual que el la se in anterior. Enton es:

E(1 ) = 1
y on el mismo razonamiento, se puede demostrar que:

E(
) = E

= 2

u u
T k1 k2

es de ir, la in lusin de variable irrelevantes no ausa sesgo en los parmetros


estimados, ni en la varianza de los errores estimados. Bajo di hos resultados,
pare iera que es mejor poner mu hos regresores en nuestro modelo. Sin embargo,
nos falta estudiar que su ede on la varianza de los parmetros estimados.

3.8.2. Impa to sobre Varianza


Re ordemos que:

1 = 1 + (X1 M2 X1 )1 X1 M2 u
on lo ual, la varianza estimada:

V (1 /X1 , X2 ) = 2 (X1 M2 X1 )1
mientras que la varianza verdadera:

V (1 /X1 ) = 2 (X1 X1 )1
enton es, omo probamos on anterioridad, la varianza verdadera es menor que
la varianza estimada. Ello impli a que el in luir regresores adi ionales, aumenta
la varianza de nuestros parmetros estimados, lo ual se tradu e en parmetros
menos e ientes.

102

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.8.3. Ejemplo
Suponga que un investigador quiere estimar el retorno a la edu a in y que el
modelo verdadero(obviamente es un aso ilustrativo) est dado por:

Wi = 1 + 2 Ei + ui
Donde

Wi

(1)

orresponde al logaritmo del salario del individuo i,

los aos de edu a in del individuo i y

ui

Ei

orresponde a

orresponde a u trmino de error bien

omportado.
Sin embargo este investigador utiliza el siguiente modelo para su estima in.

Wi = 1 + 2 Ei + 3 Di + ui
Donde

Di

(1)

orresponde a una variable di otmi a que toma el valor 1 si el indivi-

duo fuma y 0 si no fuma.


Los resultados del modelo verdadero son

Los resultados el modelo estimado son:

103

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Podemos ver no existe una varia in importante en los parmetros del modelo
estimado y el modelo verdadero. Sin embargo, tal omo habamos demostrado, la
varianza de los parmetros aumenta disminuyendo enton es la e ien ia.

104

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.9.

Perturba iones no Esfri as

Un supuesto importante en el modelo lsi o de regresin lineal (Supuesto 4) es


que los errores
valor de

ui

son homo edsti os, es de ir la varianza es onstante para todo

Xi :
V ar(ui ) = V ar(uj ) para i 6= j

Figura 8: Homocedasticidad

Cuando el supuesto 4 no se umple los errores son Hetero edasti os:

Figura 9: Heterocedasticidad

Adems se supona que los trminos de error no estaban orrela ionados entre si
(Supuesto 5):

Cov(ui uj ) = 0 para i 6= j
105

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Es de ir, tenamos que

E[uu ]= 2 In ,

ahora si el trmino de error no umple on

2
los supuestos del modelo de regresin lineal tenemos que E[uu ]= . Donde

es una matriz denida positiva.

3.9.1. Conse uen ias de estima in por MCO


Re ordemos que el estimador MCO es:

= (X X)1 X Y
= + (X X)1 X u
Como el supuesto de que
por lo tanto,

E[u|X] = 0

E[ ]=0.

se mantiene, tenemos que la

E[|X]
=

De esta forma, el estimador MCO on perturba iones

no esfri as sigue siendo insesgado y onsistente. Pero no ser e iente, dado


E[uu ]= 2 enton es la varianza de es:



 




= E (X X)1 X uuX(X X)1
= 2 (X X)1 (X X)(X X)1

= E
V ar()

De esta forma, solo si

= In la matriz de ovarianzas de ser igual a 2 (X X)1 ,

por lo tanto el estimador MCO en presen ia de perturba iones no esfri as no


tendr varianza mnima, es de ir, no ser e iente. Enton es ualquier inferen ia
e2 (X X)1 llevar a on lusiones errneas.
basada en

3.9.2. Estima in E iente: Mnimos Cuadrados Generalizados


La estima in e iente de

en el modelo generalizado, donde los errores pueden

no ser esfri os, requiere el ono imiento de

Para omenzar supondremos que

es una matriz ono ida, simtri a y denida positiva.

Bajo estas ondi iones el Mtodo de

Mnimos Cuadrados Generalizados nos

permite estimar de manera e iente los parmetros.


Dado que

es una matriz simtri a denida positiva, puede ser des ompues-

106

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

ta de la siguiente manera:

= CC
y los valores propios (j )
1/2
de se en uentran en la diagonal de . Enton es sea
, la matriz diagonal
p
1/2
on el j-simo elemento igual a
j y sea T = C . De esta forma, = T T .

1/2
1
Adems sea P = C
y por lo tanto,
= P P . 8
donde las olumnas de

Si pre multipli amos

son los ve tores propios de

Y = X + u

por

obtenemos:

P Y = P X + P u o
Y = X + u

(3.6)

Notemos que (3.6) es un modelo transformado de forma tal que:

V ar(u ) = E[u u ]
= 2 P P
= 2 In

(3.7)

Por lo tanto, el modelo transformado umple on los supuestos del modelo lsi o
de regresin, y se puede utilizar MCO para estimar el parmetro

M CG = (X X )1 X Y
= (X P P X)1X P P Y
= (X 1 X)1 X 1 Y
Como el estimador MCG de

es idnti o al estimador MCO apli ado al modelo

transformado (3.6) y que umple on los supuestos,

M CG

es MELI.

3.9.3. Test de Hiptesis


Nuevamente omo el estimador MCG es igual al estimador MCO slo que se apli a
al modelo transformado, todos los pro esos para testear hiptesis y onstruir
intervalos de onanza se mantienen.
Por ejemplo si queremos testear q hiptesis lineales
7 Esto

H0 : Q = c,

se tiene el

se ono e omo Des omposi in Espe tral de una matriz.


viene de la ortogonalidad de C, lo que impli a que I = C C = CC y enton es

1
C =C .
8 Esto

107

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

siguiente estadsti o F:

donde

Q M CG c

1
[Q
eM
CG (X X ) Q]



Q M CG c

Fq,nk





1

c
[Q
(X
X
)
Q]
Q

c
M
CG

M
CG

Fq,nk
2
q

eM
CG

eM
CG

esfri as:

es el estimador insesgado de

eM
CG =

u u
nk

en presen ia de perturba iones no





Y X M CG 1 Y X M CG
nk

3.9.4. Estima in uando es des ono ida:


Mnimos Cuadrados Fa tibles
Anteriormente asumimos que

era ono ida, en este aso una simple transfor-

ma in del modelo de regresin lineal lleva a una matriz de ovarianza esfri a.


En la pr ti a,

es

des ono ida y es ne esario estimar los parmetros al interior

de esta matriz.
Enton es lo que debemos ha er es sustituir
to se denomina estimador
estimador de

por un estimador de ella

Mnimos Cuadrados Fa tibles

El problema es que tenemos ms in gnitas (n(n+1)/2) en


fun in de un nmero jo y redu ido de parmetros
usarlo para omputar

.
= ()

108

que observa iones,

debemos asumir que es


. El problema se redu e a

para n>1. En la pr ti a para lograr la estima in de

Es-

(MCF), donde el

se dene de la siguiente forma:


1
1

1 y
M CF = X X
X

en ontrar

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.9.5. Hetero edasti idad


La Hetero edasti idad surge uando a pesar de que Cov(ui uj )=0 para i6= j, las
2
varianzas de ada observa in son diferentes, es de ir, V ar(uj ) = j para j=1,...,n.
La matriz de ovarianzas en este aso es:

12
.
..

..

.
..
n2

2
=

.
..

..

.
..

salario
2000000

3000000

4000000

E[uu] = 2 =

1000000

Recta de regesin
poblacional (RRP)

x
8

x
10

14

12

16

18

Escolaridad
Figura 2: Distribucin de los salarios para distintos niveles de educacin.

La hetero edasti idad es un problema bastante re urrente, espe ialmente al trabajar on datos de orte transversal. Algunas razones por las que

ui

puede variar

son las siguientes:

En los modelos de aprendizaje sobre errores, a medida que la gente aprende,


sus errores de omportamiento son menores, as en este aso a medida que
aumentan las horas de pr ti a de una ierta a tividad, la varianza de los
errores se redu e.
A medida que aumentan los ingresos, la gente tiene ms posibilidades de
disponer de parte de ese ingreso de la forma que desee. As en una regresin
2
de ahorro ontra ingreso, es posible que i aumente en la medida que el
ingreso aumenta.
La Hetero edasti idad tambin puede surgir por la presen ia de fa tores
atpi os, que es muy diferente a las restantes observa iones.

109

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Al omitir variables relevantes, a parte del sesgo que se produ e en las estima iones por esto, se produ e Hetero edasti idad ya que este variable estar
en el trmino de error y por lo tanto la varianza depender de ella.
Otra fuente de Hetero edasti idad es la asimetra en la distribu in de una
o ms variables expli ativas in luidas en el modelo, por ejemplo: ingreso,
riqueza y edu a in.

110

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Como men ionamos anteriormente en presen ia de Hetero edasti idad el estimador MCO seguir siendo insesgado, pero no tendr varianza mnima. El estimador que si umple on la propiedad de MELI es el de MCG. Este ltimo
estimador requiere ono imiento de la matriz

Sin embargo, White (1980) ha

propuesto una aproxima in a la matriz de ovarianzas del estimador MCO:

V ar(|X)
= (X X)1 (X 2 X)(X X)1
que no requiere una representa in espe i a de la forma fun ional que adopta la
hetero edasti idad, por lo que no tendremos riesgo de asumir una forma fun ional
in orre ta.
La sugeren ia de White es que la varianza del estimador

M CO

se exprese de

la siguiente forma:

V ar(|X)
= n(X X)1


1 2
X X (X X)1
n

se dene:

= n1 2 X X
n
X
1
= n
i2 xi xi
i=1

la que se estima de la siguiente forma:

= n1

n
X

ui 2 xi xi

i=1

White demuestra bajo ondi iones generales que:

= n1

n
X
i=1

ui 2 xi xi

De esta forma, una estima in onsistente de la matriz de ovarianzas es:

X)1
V ar(|X)
= n(X X)1 (X
su ompara in on

(3.8)

2 (X X)1 puede dar no in del grado de hetero edasti idad.

La estima in de White de una matriz onsistente on Hetero edasti idad es


un resultado muy til, ya que no se ne esita saber la naturaleza de la Hetero edasti idad. Ante la duda de presen ia de este problema es mejor o upar este
estimador ya que no produ e altera iones, y nos permite ha er inferen ia orre ta
on o sin la presen ia de Hetero edasti idad.
111

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Contrastes de Hetero edasti idad:


1.

El ontraste de White:

La hiptesis nula es de Homo edasti idad (al


H0 : i2 = 2
i, bajo la hiptesis nula el estimador de la matriz de ovarianzas de es

Vd
ar(|X)
=
e2 (X X)1 , pero bajo la hiptesis alternativa es (3.8). Basaigual que en todos los ontrastes que estudiaremos). Esto es,

do en la observa in de esto, White propone un test que puede obtenerse


2
al al ular nR de una regresin de u
2i ontra todos los produ tos posibles
2
2
entre las variables expli ativas. Demuestra que nR J1 , donde J es el
nmero de regresores de esta e ua in.
Consideremos el siguiente modelo:

yi = 0 + 1 xi + 2 zi + ui
Los pasos para realizar el test de White son:

a)
b)
)
d)

Obtener
{
ui }ni=1

y los residuos de la estima in del modelo anterior por MCO

Correr una regresin de

u2i

sobre una onstante,

xi , zi , x2i , zi2

xi zi .

2
Computar nR de la regresin anterior
2

Para el nivel de signi an ia es ogido, omparar nR

on el valor r2
ti o de una distribu in hi uadrado on 5 grados de libertad. Si nR
ex ede el valor rti o se re haza la hiptesis nula de Homo edasti idad.

2.

El ontraste de Goldfeld y Quandt: este ontraste parte del supuesto de


que la magnitud de

i2

depende de ierta variable

zi ,

la que generalmente

es una variable expli ativa pero no es ne esario. Supongamos que di ha


2
rela in es positiva, es de ir, para valores ms altos de zi mayor es i . Las
observa iones se dividen en dos grupos, bajo la hiptesis nula ambos grupos
tienen la misma varianza, pero bajo la alternativa las varianzas dieren
signi ativamente. Enton es el ontraste onsiste en:

a)

Ordenar las observa iones por los valores de la variable

zi ,

de menor a

mayor.

b)

Omitir p observa iones en la mitad de la muestra, se sugiere no eliminar


ms de la ter era parte de las observa iones.

np
Estimar dos ve es el modelo original, una on las
primeras ob2
np
serva iones muestrales y otra on las
ltimas observa iones en la
2
muestra. Notar que p debe ser lo su ientemente pequeo de manera
T p
que
sea mayor al nmero de parmetros.
2
112

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

d)

Se al ula es estadsti o:

u2 u2
Fm,m
u1 u1

con m =

np
k
2

Si se sospe ha que la varianza del error depende inversamente de

zi , enton es

las observa iones se deben ordenar de mayor a menor.


Si se llega a la on lusin de que el trmino de error del modelo no presenta
hetero edasti idad, podra deberse a que hemos omenzado on una mala
2
espe i a in del parmetro i , que quizs depende de un variable diferente
a la que hemos supuesto. Por esta razn el ontraste debera realizarse varias
ve es on distintas variables de las que tengamos sospe has pueda depender
la varianza del trmino de error.
3.

El ontraste de Breus h y Pagan:

supongamos que la varianza del

trmino de error de ada observa in depende de un ve tor de variables

zi

de dimensin p, es de ir:

i2 = h(zi ) = h(0 + 1 z1i + 2 z2i + ... + p zpi )


Notemos que si todos los oe ientes

's

ex epto el orrespondiente a

fuesen ero, tendramos una situa in de Homo edasti idad. Por lo tanto,
si puedieramos estimar los oe ientes

0 , 1 ,...,p

un ontraste para la

hiptesis nula de Homo edasti idad es:

H0 :

1 = 2 = ... = p = 0

Los pasos para realizar este ontraste son:

a)

Se estima por MCO el modelo original y se obtienen los residuos orrespondientes.

b)

Se obtiene la serie de residuos normalizados al uadrado:

e2i

i = 1, ..., n donde

Se estima una regresin de

z2i ,...,zpi

d)

u2i
= 2

e2i

u2

Pn

i=1

u2i

sobre una onstante y las variables

z1i ,

y se obtiene la suma expli ada (SE) de di ha regresin.

Bajo la hiptesis nula de Homo edasti idad y dado el supuesto de


SE
2
normalidad del trmino de error, la razn
se distribuye p .
2

9 Re ordemos

que la suma expli ada de una regresin es igual a


la variable dependiente.
113

Pn

yi
i=1 (

y)2 , uando yi es

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

4.

El ontraste de Glesjer: este ontraste es ms ambi ioso que el anterior,


ya que trata de estimar la verdadera estru tura de Hetero edasti idad, no
limitndose a una estru tura lineal. Sin embargo, una limita in del ontraste de Glesjer es que slo resulta til uando se ree que di ha estru tura
puede expli arse solo on una variable. Este ontraste se ha e en tres etapas:

a)
b)

Estimar el modelo por MCO y obtener los residuos orrespondientes.


Estimar una regresin del valor absoluto de
una poten ia de la variable

zi ,

ui , o su uadrado u2 , sobre

es de ir:

|
ui | = 0 + 1 zih + i
para distintos valores del exponente
valor de



h: h = 1, 1, 21 , 12 .

que propor ione una mejor regresin ( oe iente

Es oger el

signi-

ativo y una suma residual pequea).

h, se divide el ve tor de dimensin (k+1) formado


0 + 1 z h si se estimo la
por las observa iones (yi ,xi ) de ada periodo por
i
q
2
h

regresin de |u
i | y por 0 + 1 z si se estimo u , y se estima el modelo

Una vez sele ionado

i
i
de nuevo por MCO, pero ahora on las variables transformadas.

Ejemplo: Produ in y Empleo por omunidades autnomas de Espaa


Como ejemplo, estimemos la rela in que existe entre empleo y Pib en las omunidades autnomas espaolas. Se dispone datos del PIB en miles de millones de
pesetas, y de o upados, en miles de personas para 1989, los que se muestran en
la siguiente tabla:

114

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Estimador de la
desviacin estandar
del error
~2
u

SEC/(n-k)

4307097.27/16

269193.56

u =

115

518.84

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

El estimador del parmetro aso iado al empleo resulta ser signi ativo, por ada
1,000 empleador el PIB aumenta en 3,760 millones de pesetas. Sin embargo, la
estima in de la onstante es bastante impre isa, y por ello resulta ser no signi ativa. Existe la posibilidad de que la varianza del omponente del PIB no
expli ado por el empleo aumente on este, es de ir, tengamos un problema de
2
hetero edasti idad, donde i depende de empleoi , y de esta forma, i depende
2
de empleoi . Con esta sospe ha, es ne esario testear Hetero edasti idad.

1. Test Breus h-Pagan: para realizar este test, primero de la estima in MCO
del modelo de inters se obtienen los residuos, luego se omputan los residuos
normalizados (dividir ada residuo al uadrado por el estimador de la varianza
del error). Se estima una regresin entre los residuos generalizados y el empleo al
uadrado.

SE

SE
= 7,64, que resulta
Una vez realizada la estima in se onstruye el estadsti o
2
2
ser mayor al valor de tabla de una 1 al 95 % de onanza (3.84), de esta forma
se re haza la hiptesis nula de homo edasti idad.

2. Test Goldfeld y Quandt:

es de esperar que la varianza dependa positiva-

mente del nivel de empleo, de esta forma, ordenamos las observa iones de menor
a mayor nivel de empleo y omitimos las 6 observa iones que o upan los lugares entrales. Luego estimamos dos modelos ada uno on 6 observa iones, y se
omputa el estadsti o

igual a la divisin de la suma residual:


116

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

= 93.2

Este estadsti o

Fm,m

debe ser omparado on el valor de tabla de una distribu in

al 95 % de onanza, que es igual a 6.39. De esta forma, nuevamente se

re haza la hiptesis nula de Homo edasti idad.

117

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

3.9.6. Auto orrela in


Al omienzo de esta se in examinamos el aso general uando la matriz de
varianzas y ovarianzas del error dejaba de umplir los supuestos 4 y 5, en es2
2
te aso la matriz ya no era In , sino que era igual a . La forma que tome
esta matriz

depender de ual de los dos supuestos se estaba rompiendo. En

la se in 3.8.5, vimos que forma toma la matriz

si se rompe el supuesto 4

de Homo edasti idad en el trmino de error, en este aso la matriz de varianzas


y ovarianzas del error es no es alar (o no esfri a) porque los elementos de la
diagonal eran distintos para ada observa in i.
Por otra parte, la auto orrela in es un problema que surge uando rompemos el
supuesto 5 de no auto orrela in en los errores. Ello impli a que:

Cov(ui uj ) 6= 0 para i 6= j
La auto orrela in en el trmino de error se da en los datos se serie de tiempo,
donde es un problema bastante omn.
Luego, nuestra matriz de varianzas y ovarianzas del error ya no ser una matriz
diagonal ( omo en el aso de varianzas esfri as y no esfri a pero slo on he-

orrela ionado onsigo

tero edasti idad) ya que el trmino de error se en uentra

mismo a travs del tiempo.

La forma que toma la matriz uando slo tenemos

auto orrela in pero los errores son homo edsti os:

donde

E[uu] = 2 =

2
2,1
3,1
..
.

1,2 1,3 1,T


2 2,3 2,T
3,2 2 3,T
..
.

..
.

..

T,1 T,2 T,3

t,q = cov(ut uq ).

..
.
2

Nuestro modelo ahora ser:

yt = Xt + ut t = 1, 2, ..., T.
ut = ut1 + t
donde, omo vimos en la se in 3.4, el error sigue un pro eso AR(1).

118

(3.9)

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Matriz de Varianzas y Covarianzas uando ut es un AR(1):


En este aso el trmino de error tiene la forma sealada en (3.9):

ut = ut1 + t
1.

V (ut ) = V (ut1 + t )=2 V (ut1 ) + 2 ,

2. Como
ranza:

de esta forma

E(ut ) = 0, Cov(ut ut1 ) = E(ut ut1 ).

V (ut ) =

2
12

Cal ulemos esta ltima espe-

ut ut1 = ut1 (ut1 + t )


= u2t1 + ut1 t /E()
E(ut ut1 ) = E(u2t1 ) + E(ut1 t )
| {z } | {z }
2

E(ut ut1 ) = 2

3. Siguiendo la misma lgi a anterior,

E(ut , ut2 )

se al ula de la siguiente

forma:

ut ut2 = ut2 (ut1 + t )


= ut1 ut2 + ut2 t /E()
E(ut ut2 ) = E(ut1 ut2 ) + E(ut2 t )
|
{z
} | {z }
2

2 2

E(ut ut2 ) =

4. As se puede derivar la siguiente expresin genri a:

E(ut ut(T 1) ) = T 1 2

119

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Enton es:

2
E[uu ] = =

2
2,1
3,1

1,2 1,3 1,T


2 2,3 2,T
3,2 2 3,T

..
.

..
.

..
.

..

..
.
2

T,1 T,2 T,3


2
2
2 2

.
..
T 1

= 2

2
2
2

.
..
T 2

..
.
T 1

..
.
T 2

..
.
T 3

2 2
2
2
.
..
T 3

2
2

..

T 1 2
T 2 2
T 3 2
..

T 1
T 2

T 3

..

.
1

.
..
2

Naturaleza y ausas de la auto orrela in


Existe auto orrela in uando el trmino de error de un modelo e onomtri o est
orrela ionado onsigo mismo a travs del tiempo. Por supuesto, no es ne esario
que

ut

este orrela ionado onsigo mismo slo un periodo atrs, esta orrela in

puede ser de ualquier orden, es de ir,

ut

puede ser un AR(1), AR(2),...,AR(q),

et . As, dependiendo de ual sea el orden de la auto orrela in en el trmino de


error, la matriz de varianzas y ovarianzas ira tomando distintas formas.
La auto orrela in en el trmino de error puede ser produ ida por varias ausas:

Existen ia de i los y tenden ias : Si la auto orrela in es positiva (es de ir,


en (3.9) el oe iente
de

yt

es

positivo), un valor alto de

ut

que genera un valor

por sobre su media ondi ional, tendr una probabilidad elevada de ir

ut+1 , y por ello, de un valor de yt+1 por en ima


yt debajo del promedio.
auto orrela in negativa, valores de yt por sobre su

seguido por un valor alto de

del promedio; lo mismo o urra para


Sin embargo, si existe

valor promedio ondi ional irn seguidos, on alta probabilidad, de valores


de

yt+1

por debajo de su promedio. Por lo tanto, la auto orrela in positiva

esta aso iada a la existen ia de ra has de valores altos y bajos de


120

yt .

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Autocorrelacin Negativa

Autocorrelacin Positiva

Enton es, si debido a la iner ia presente en la mayora de las variables


ma roe onmi as la variable endgena presenta i los, y estos no son bien
expli ados por la variables exgenas del modelo, el trmino de error tendr
auto orrela in.
Por otra parte, tambin es ierto que la mayora de las variables e onmi as
(y espe ialmente las variables medidas en trminos nominales) tienen una
tenden ia, generalmente re iente. Si el onjunto de variables expli ativas
del modelo no expli an ade uadamente di ho omportamiento, enton es el
trmino de error in orporar di ha tenden ia, lo que ondu e a existen ia de
auto orrela in positiva:una primera ra ha de residuos negativos seguidos
por otra ra ha de residuos positivos.

X Modelo
verdadero
XX
X
Modelo
X
XX
X
estimado
X
X
X
X
XX
X
X
X
X
X
X
X X

Autocorrelacin producida por una tendencia

Variables omitidas :

Omisin tanto de variables relevantes, de no lineali-

dades y de rela iones dinmi as (rezagos de la variable dependiente) sern


121

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

in orporadas al trmino de error, ausando posible auto orrela in (adems


de las di ulatdes que usted ya omo e de las se iones 3.4 y 3.6).

Corolario:

Si usted en uentra auto orrela in en sus residuos, enton es

revise su modelo, ya que el error est aptando informa in relevante que


usted est omitiendo.

Todo lo di ho en las se iones 3.8.1 hasta 3.8.4 apli an en este ontexto (re uerde
que la matriz

se plante en trminos generales). De esta forma, MCO sigue

siendo insesgado, pero pierde e ien ia, por lo ual ya no es MELI. El estimador
de mnima varianza en este ontexto es MCG, y en aso de des ono erse la forma
de la auto orrela in se debe utilizar MCF.
Sin embargo y siguiendo el espritu de la orre in de White, Newey y West
(1987) propusieron una orre in para la matriz de varianzas y ovarianzas de
MCO. Re ordemos que en este ontexto se umple que:

V ar(M CO /X) = 2 (X X)1 X X(X X)1


mientras que el estimador de Newey-West orresponde a:

V ar(M CO /X) = n(X X)1 S(X X)1

(3.10)

donde el estimador onsistente de S es:

1XX
S =
w(t s)
ut us xt xs
n t=1 s=1

(3.11)

|ts|<L

donde L orresponde al orden mximo de auto orrela in del trmino de error


(que no siempre es f il de determinar).

122

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Contrastes de Auto orrela in


1.

Test de Durbin-Watson (d):

Lejos el test ms utilizado para dete tar

auto orrela in de los residuos es el test propuesto en 1951 por Durbin


y G.S Watson. El test est diseado para dete tar auto orrela in en los
residuos de la forma

ut = ut1 +t (AR(1)), donde es ruido blan o (media

ero y varianza onstante). La nula orresponde a no auto orrela in de los


residuos (H0

Si

> 0,

: = 0 H1 : 6= 0)y el test se dene


Pn
(
ut ut1 )2
d = t=2Pn 2
t
t=1 u

los valores de

omo:

(3.12)

probablemente sern muy er anos, por lo ual el

numerador ser muy pequeo en ompara in al residuo mismo. Ello impli a que

ser pequeo. Si

< 0,

enton es el numerador probablemente

ser grande, ms grande que el residuos n si mismo. Ello impli a que

10
grande .

Se puede demostrar que para muestra grandes

ser

onverge a:

d 2(1 )

(3.13)

on:

donde

Pn
t ut1
t=2 u
P
=
n
2t
t=1 u

puede ser obtenido de la siguiente regresin:

ut =
ut1 + ut

(3.14)

Respe to a los valores rti os del test, la distribu in en muestras nitas


depende del supuesto de normalidad de los errores y de la matriz X, por
lo ual Durbin y Watson derivaron las tablas de valores de rti os para
fa ilitar la apli a in del test. Sin embargo, di hos valores poseen rangos
indeterminados, en los uales no podemos tomar una de isin respe to a la
nula. El test distribuye on dos olas y se presenta en la siguiente gura:
10 Por

lo tanto, auto orrela in positiva tender a arrojar un pequeo d, mientras que auto orrela in negativa tender a arrojar un d grande

123

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Por ejemplo, el test re haza la nula de no auto orrela in en favor de la


alternativa de orrela in positiva si

DW < dl y lo re haza ante la alternaDW > 4 dl. El test posee dos

tiva de orrela in negativa de los errores si

zonas grises

que se presentan en los intervalos

(dl,du) y (4-du, 4-dl), en las

uales no podemos de ir nada respe to de la nula. Finalmente, si DW ae


dentro del intervalo

(du, 4-du)

no se re haza la nula de no auto orrela in.

Sin embargo, las tablas de valores rti os son raramente utilizadas. Lo


anterior debido a que si no existe auto orrela in, por la e ua in (3.13)
sabemos que el valor de

ser er ano a dos, mientras que si hay eviden ia

de auto orrela in positiva


auto orrela in negativa,

ser muy pequeo y si existe eviden ia de

ser grande.

El test posee dos grandes omisiones. Primero, slo sirve para dete tar auto orrela in de orden 1 en los errores y segundo, no puede ser apli ado si
se in luyen regresores de la variable dependiente en el modelo (porque se
onstruye bajo el supuesto de regresores determinsti os). Adems, se debe
tener presente que el test est onstruido bajo normalidad de los errores y
que existen las zonas grises o indeterminadas de las que hablbamos on
anterioridad.
2.

Test de h-Durbin (h)

Una varia in del test DW puede ser apli ada

uando existen variables rezagadas de la variable dependiente en nuestro

124

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

modelo. Esta varia in se ono e omo test de h-Durbin. El estadgrafo es:


r
n
DW
h =
1
a N(0, 1)
2
1 n
2
donde

(3.15)

a la varianza del parmetro aso iado al primer rezago de la va-

riable dependiente in luido en el modelo. Algunas notas respe to al test.


Primero, no importa uantos rezagos de Y se hallan in luido en el modelo:
slo nos interesa la varianza del primero de ellos. Segundo, el test no es
apli able uando n
2 > 1 y ter ero, las propiedades del test slo son ono idas asintti amente, por lo ual debe ser implementado on uidado en
muestras pequeas.
3.

Test de Breus h y Godfrey Este test es una alternativa para testear auto orrela iones de ordenes superiores a 1 y se basa en el test LM introdu ido
en la se in 2.12.3. La nula, al igual que en todos los test de auto orrela in es que los residuos no se en uentran orrela ionados. Consideremos
para distintos valores de k, el siguiente onjunto de estadsti os:

Pn
t utk
t=1 u
rk = P
n
2t
t=1 u

(3.16)

note que si k=1, enton es estamos en una aso pare ido al estadsti o DW.
Los pasos para realizar el test son:

a)

Estimar el modelo por MCO y obtener los residuos

u. El modelo puede

in luir rezagos de la variable dependiente.

b)

Estimar una regresin auxiliar de

ut

sobre p rezagos:

ut1 , . . . , utp ,

in luyendo las variables exgenas (X) del modelo original. Note que
deber ex luir p observa iones.

)
d)

Cal ular el

R2

de la regresin auxiliar

Construir el estadgrafo

nR2 2p

La lgi a del test se basa en que si no existe auto orrela in, enton es los
residuos MCO no deberan ser expli ados por sus retardos, por lo ual el
R2 de la regresin auxiliar debera ser er ano a ero, lo ual nos llevara a
un bajo valor del estadgrafo y a un no re hazo de la nula.
4.

Test de Box-Pier e-Ljung (Q-Stat)


de las primeras

Este test se basa en el uadrado

auto orrela iones de los residuos MCO. El estadgrafo se

dene omo:

Q=n

p
X
j=1

125

rj2

(3.17)

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

donde:

Pn
t utj
t=j+1 u
P
rj =
2t
t=1 u

La distribu in del estadgrafo bajo la nula de no auto orrela in es


grados de libertad igual a

on

menos el nmero de rezagos del error in luidos

en la espe i a in autorregresiva del error. De ello se dedu e que el test


permite dete tar auto orrela in de ordenes superiores a 1.

Estima in de Modelos on Auto orrela in

Como vimos anteriormente la matriz

2
..
.
T 1

en presen ia de auto orrela in es:

..
.
T 2

..
.
T 3

T 1
T 2
T 3
..

P en este aso
p
1 2 0
0

1
0

0
1
P =

.
.
.
..
..
..

0
0

Se puede demostrar que la matriz

..
.

es:

0
0

.
..
.
.
.
1

Enton es utilizando esta matriz P podemos transformar el modelo y apli ar Mnimos Cuadrados Generalizados. Al premultipli ar X e

por la matriz

tendremos

que la primera observa in se transforma de la siguiente forma:

p
p
p
1 2 y1 = ( 1 2 )x1 + ( 1 2 )u1

Y para el resto de las

(T 1)

(3.18)

observa iones la transforma in es la siguiente:

yt yt1 = (xt xt1 ) + ut ut1


| {z }

(3.19)

El que la primera observa in de la muestra tenga un trato espe ial, es porque


para ella no existe una observa in anterior, y por lo tanto, es imposible apli ar
la transforma in en (3.19).

126

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

1.

Estima in MCF: El Mtodo de Co hrane Or utt


La matriz P que transforma nuestro modelo en un libre de auto orrela in en el error, es tal que ada observa in de las variables dependientes,
expli ativas y trmino de error, se debe transformar de a uerdo a (3.19). Si
es que nuestro modelo es el siguiente:

yt = xt + ut
ut = ut1 + t
El modelo transformado es de la siguiente forma:

yt yt1 = (xt xt1 ) + ut ut1


| {z }
| {z }
|
{z
}
yt

xt

+ t

El Mtodo de Co hrane-Or utt es un


la estima in de

a)

xt

yt

pro edimiento iterativo

para obtener

Estimar por Mnimos Cuadrados Ordinarios la regresin de inters,


ignorando la presen ia ( ono ida) de auto orrela in de primer orden
en el trmino de error.

b)

Utilizar los residuos MCO para estimar el parmetro


ha erse mediante una regresin de

ut

ontra

ut1 ,

Esto puede

o a partir del esta-

dsti o DW de la estima in anterior.

)
d)

Utilizar este parmetro

y xt .

para

transformar las variables, y obtener

yt

Estimar por MCO un modelo on las variables transformadas, para

nuevo ve tor de oe ientes .


e ) Utilizar esta nueva estima in para omputar otro ve tor de residuos,
y utilizar estos residuos para obtener una nueva estima in de
f ) Repetir este pro edimiento hasta que los onvergan11 .
obtener un

Este Mtodo puede ser f ilmente generalizado on auto orrela in de orden


superior.
2.

Estima in por Mxima Verosimilitud

11 Esto

su ede uando la diferen ia entre el ve tor de parmetros diere innitesimalmente


del obtenido en la vuelta anterior.
127

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Supongamos que se pretende estimar el modelo de regresin on auto orrela in de primer orden. Adems debemos asumir alguna distribu in para

(re uerde que este es un requisito para poder estimar por mxima ve2
rosimilitud). Supongamos que t se distribuye N(0, ). As, la fun in de
verosimilitud es:

L=

T

"

exp

PT

2
t=1 t
22

#!

(3.20)

P es la matriz que transforma ut en t , es de ir, t =


P ut . La fun in de verosimilitud en (3.20) se puede expresar en fun in del
12
trmino de error ut (AR(1)) omo :
"
#!
PT

T p
2 2
2
1
(1

)u

(u

u
)
t1
1
t=2 t

1 2 exp
L=
2
2
2

Re ordemos que

P (|P |)

dado que en este aso el determinante de

es

1 2 .

Finalmente, la fun in de verosimilitud en fun in del trmino de error


original auto orrela ionado es:

L=

T p
 1 
u u
1 2 exp
22
2

La ventaja de este mtodo es que puedo estimar simultneamente


12 Ver

(3.21)

Greene, Anlisis E onomtri o pgina 69. Si la fun in de densidad onjunta de la


variable t es:
f () =

T

exp

"

PT

2
t=2 t
22

#!

o equivalentemente:
f () =

T

exp




22



la fun in de densidad de onjunta de P ut = t es:


f (u) =

T

|P | exp

128



u P P u
22



E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

13 en trminos de observables es:

El logaritmo de la Verosimilitud Condi ional

lnL =

T 1
2

ln(2)

T 1
2

ln(2 )

1 X
2
[(yt xt ) (yt1 xt1 )]2
2 t=2

Las ondi iones de primer orden del problema de Mxima Verosimilitud son:

T
1 X
lnL
=
t xt = 0 (k

2 t=2

ecuaciones)

T
lnL
1 X
=
(
ut ut1 )
ut1 = 0 (1 ecuacion)

2 t=2
PT 2
lnL
(T 1) 1

=
2 + t=24 t = 0 (1 ecuacion)
2

De (3.22) podemos en ontrar el estimador MV de

(3.22)

(3.23)

(3.24)

, que omo podemos observar

oin ide on el estimador MCF.


De (3.23) se determina el estimador MV de

PT

t=2

ut ut1

ut1

que orresponde exa tamente a lo sugerido por el mtodo de Co hrane-Or utt.

Ejemplo: Estima in de Fun in Consumo


Suponga estamos interesados en estimar una fun in Consumo:

Ct = 0 + 1 Yt + ut
donde

Ct

es el onsumo e

Yt

(3.25)

es el Ingreso. Para esto ontamos on informa in

del onsumo agregado del se tor pbli o y privado y del PIB de Espaa para los
aos 1954-1988. Estas series se muestran en el siguiente gr o:
13 La

estima in ondi ional toma la primera observa in omo dada y es eliminada de la


estima in, es de ir, se estima on (T-1) observa iones

129

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

20000

16000

12000

8000

4000
0
1955

1960

1980
1965 1970 1975
CONSUMO
PIB

1985

Ahora estimemos (3.25) utilizando la informa in disponible:

130

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Dependent Variable: CONSUMO


Method: Least Squares
Date: 11/09/04 Time: 15:51
Sample: 1954 1988
Included observations: 35
CONSUMO=C(1)+C(2)*PIB
Coefficient

Std. Error

t-Statistic

Prob.

76.53412
0.768971

81.89808
0.006842

0.934504
112.3909

0.3568
0.0000

C(1)
C(2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

0.997394
0.997315
180.8607
1079450.
-230.5536

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

8615.809
3490.620
13.28878
13.37765
0.338818

Si omparamos el valor del DW (0.34) on el valor de tabla (k'=1 y n=35 al 95 %


de onanza, di=1.4 y ds=1.52), tenemos que se re haza la hiptesis nula de no
auto orrela in a favor de auto orrela in positiva. Adems podemos apre iar
gr amente la forma autorregresiva de los residuos:
16000
12000
8000
400
4000
200
0
0
-200
-400
1955

1960

1965 1970 1975


Residual
Actual

1980

1985
Fitted

Veamos que su ede on nuestros parmetros estimados si apli amos la orre in


de Newey-West a nuestra estima in MCO:

131

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Dependent Variable: CONSUMO


Method: Least Squares
Date: 11/09/04 Time: 15:59
Sample: 1954 1988
Included observations: 35
Newey-West HAC Standard Errors & Covariance (lag truncation=3)
CONSUMO=C(1)+C(2)*PIB

C(1)
C(2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

Coefficient

Std. Error

t-Statistic

Prob.

76.53412
0.768971

105.8340
0.008968

0.723152
85.75039

0.4747
0.0000

0.997394
0.997315
180.8607
1079450.
-230.5536

Mean dependent var


S.D. dependent var
Akaike info criterio
Schwarz criterion
Durbin-Watson sat

132

8615.809
3490.620
13.28878
13.37765
0.338818

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Para realizar la estima in MCF de la propensin marginal a onsumir (que


es equivalente a la estima in Mximo Verosmil) debemos primero estimar la
fun in autorregresiva del error. Para esto determinemos primero el ve tor de
residuos de la estima in MCO de nuestro modelo de inters:

Y luego estimamos el siguiente modelo:

133

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Una vez estimado

podemos transformar el modelo original de a uerdo a la

e ua in (3.19), de forma que el error transformado (t ) umple on los requisitos


para que MCO sea MELI:

134

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

La estima in del modelo transformado arroja los siguientes resultados:

135

E onometra
Es uela de Nego ios, UAI

Capitulo 3: Forma Fun ional y Espe i a in

Primero, podemos notar que el DW es 1.81, mayor al lmite superior de tabla


(1.52) y menor a

(4 ds) = 2,48,

por lo tanto no se puede re hazar la nula

de no auto orrela in. El parmetro de la propensin marginal a onsumir es


exa tamente el mismo que el obtenido de la estima in MCO del modelo original.

136

Captulo 4
Problemas on los datos
4.1.

Multi olinealidad

Es pr ti amente imposible en ontrar dos variables e onmi as uyo oe iente


de orrela in es una determinada muestra sea numri amente ero, di ho oe iente puede tomar valores pequeos pero nun a llegar a ser ero. Granger y
Newbold (1974) entre otros autores han ilustrado omo el slo he ho de introdu ir una tenden ia lineal en dos series de tiempo independientes aumenta su
orrela in notablemente.
La

Multi olinealidad

apare e uando las variables expli ativas en modelo e o-

nomtri o estn orrela ionadas entre si, esto tiene efe tos negativas uando se
quire estimar los parmetros del modelo por MCO.
Existen diversas fuentes de la multi olinealidad:

El mtodo de re ole in de informa in empleado,

obten in de muestras

en un intervalo limitado de valores de los regresores en la pobla in.

Restri in en el modelo o en la pobla in objeto de muestreo.


Espe i a in del modelo.
Consideremos el siguiente modelo:

yi = 1 + 2 x2i + ... + k xki + ui


137

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

Si existe la inversa de X'X, el estimador MCO de este modelo, viene dado por
M CO = (X X)1 X y y su matriz de ovarianzas es Var()=u2 (X X)1 .
Supongamos que la

xji

tiene un alto grado de orrela in on las dems variables

expli ativas de modelo, es de ir que la regresin lineal:

xji = 1 + 2 x2i + ... + j1 xj1,i + j+1 xj+1,i + ... + k1 xki + i

(4.1)

tiene un oe iente de determina in alto.


En estas ondi iones la variable

xji

puede es ribirse aproximadamente omo una

ombina in lineal del resto de las variables expli ativas del modelo, lo que se
puede apre iar en la e ua in (4.1). Como onse uen ia una de las olumnas de
la matriz X, la orrespondiente a

xji ,

puede es ribirse omo una ombina in

lienal aproximada de las dems olumnas de X, y de esta forma (X'X) ser aproximadamente singular.
En la medida que el determinante de (X'X) sea distinto de ero, existir (X'X)

y por lo tanto tambin existir es el estimador MCO, y sigue umpliendo on la


propiedad de MELI, pero se tienen las siguientes onse uen ias:

1. La solu in del sistema de e ua iones normales est mal denido: mientras


la dependen ia de

xji

sea aleatoria omo lo muestra la e ua in (4.1) y no

exa ta, X'X no ser exa tamente singular y existir un ni o estimador


MCO, ya que existe una ni a solu in al sistema de e ua iones normales,
pero tambin habr un nmero de ve tores

1 , 2 ,

..., que al sustituirlos en

el sistema de e ua iones normales, seran aproximadamente una solu in al


mismo.
2. Pequeas varia iones muestrales por in orporar o sustraer un nmero redu ido de observa iones muestrales, introdu ir ligeros ambios en (X'X) y
X'y, pero podran generar importantes ambios en la solu in

del sistema

de e ua iones normales.
3. Al ser la matriz X'X asi singular, es muy pequea. Como onse uen ia la
matriz de ovarianzas ser muy grande, por lo tanto el estimador MCO es
po o pre iso en este aso.

138

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

4.1.1. Multi olinealidad Exa ta y Multi olinealidad Aproximada


La presen ia de multi olinealidad en un modelo de regresin lineal puede ser de
dos formas:

Multi olinealidad Exa ta: una de las variables expli ativas es una ombina in lineal determinsti a de todas las dems (o algunas de ellas).

Multi olinealidad Aproximada: o urre


aproximadamente

uando una de las variables es

igual a una ombina in lineal de las restantes, omo en

la e ua in (3.1).

En la pr ti a, ontrario a lo que se pudiera esperara es ms ompli ado la multi olinealidad aproximada que la exa ta.

4.1.2. Dete in de Multi olinealidad


Puesto que la multi olinealidad es un problema de naturaleza muestral, que surge
prin ipalmente por el ar ter no experimental de la mayora de la informa in
re opilada en las Cien ias So iales, no tiene una manera ni a de ser dete tada.
Lo que se tiene son algunas reglas pr ti as detalladas a ontinua in:

2
1. El R es alto, pero los parmetros no resultan ser individualmente signi ativos.
Por ejemplo: Considere los siguientes datos:
Tabla 6: Multi olinealidad
Periodo
yi x2i x3i x4i

Las variables

x3

x4

20

10

10

12

28

12

16

26

12

14

16

24

14

14

16

tienen las mismas observa iones numri as solo que en

distinto orden, de forma tal que la orrela in entre


139

x2

y estas dos variables

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

son:

23 = 0,32

Una regresin

24 = 0,93, altamente diferentes entre s.


de yi sobre x2i , x3i y una onstante gener
y

las siguientes

estima iones MCO:

yt = 10,81 + 2,92x2i 0,54x3i + ui


(2,6)

(0,42)

(4.2)

(0,21)

R2 = 0,92
u2 = 2,09

Una regresin de

ontra una onstante,

x2

x4 ,

produjo las siguientes

estima iones:

yi = 6,67 + 1,33x2i + 0,67x4i + ui


(3,27)

(1,61)

(4.3)

(0,81)

R2 = 0,83
u2 = 3,16

Ambas regresiones no in luyen las mismas variables expli ativas y por lo


tanto, no son omparables. Sin embargo, en el segundo modelo donde el grado de orrela in entre las variables expli ativas es alto, podemos apre iar
2
que a pesar de que el R es alto, los parmetros resultan ser insigni ativos
individualmente (t4 =2.78).
140

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

2. Pequeos ambios en los datos, produ e importantes varia iones en las estima iones mnimo uadrti as.
3. Los oe ientes pueden tener signos opuestos a los esperados o una magnitud po o reble.

4.1.3. Otros mtodos de dete in de multi olinealidad


(a) Mtodos basados en la orrela in entre variables expli ativas: una
de las onse uen ias de la multi olinealidad era varianzas de los estimadores
bastante altas. Enton es, Cal es la rela in entre la varianza estimada y
el grado de orrela in entre las variables expli ativas?.
Si des omponemos la matriz X de la siguiente forma:

X = [xj ; Xj ]
donde

xj

ativa y

es un ve tor olumna orrespondiente a la j-sima variable expli-

Xj

una matriz de n(k-1) on las observa iones de las restantes

variables. Enton es, X'X puede es ribirse omo:

XX=

xj xj xj Xj
Xj xj Xj Xj

De esta forma, el elemento (1,1) de

(X X)1

Demostrar ): 1

es (

[(xj xj ) xj Xj (Xj Xj )1 (Xj xj )]1 = (xj Mj xj )1


donde

Mj = In Xj (Xj Xj )1 Xj

los residuos al uadrado de una

xj Mj xj orresponde a la suma de
regresin de xj sobre Xj , de esta forma se
y donde

tiene que:

u2
xj Mj xj

(4.4)

u2
STj (1 Rj2 )

(4.5)

V ar(j ) =
Lo que tiene la siguiente expresin:

V ar(j ) =
1 Re ordar

que la inversa de una matriz parti ionada es:




A11
A21

A12
A22

1

1
1
A1
11 (I + A12 F2 A21 A11 ) A11 A12 F2
1
F2 A21 A11
F2

donde F2 =(A22 -A21 A1


11 A12 ).
141

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

Pn
donde STj es la suma total de la regresin entre xj y Xj (STj =
i=1 (xji
2
2
xj ) ) y Rj es el oe iente de determina in de esta misma regresin.
La varianza de

depende de tres osas:

La varianza del trmino de error, que es independiente del grado de


orrela in entre las x's.
La suma total propia de la variable

xj ,

la que depende solo de esta

variable.

2
El oe iente de determina in Rj , el que si depende del grado del grado de orrela in entre la variable

xj

y las restantes, es de ir, depende

del grado de multi olinealidad.


La ota inferior para la varianza de

j ,

2
uando Rj =0, es:

2
V ar(j0 ) = u
STj
Por lo que la rela in entre las varianzas de la estima in de

en un aso

de orrela in entre variables expli ativas y el aso de independen ia lineal


es:

V ar(j )
1
=
1 Rj2
V ar(j0 )

142

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

De a uerdo on este anlisis, los oe ientes de determina in obtenidos


en las regresiones de ada variable expli ativa on el resto son un buen
indi ador de una posible situa in de multi olinealidad.

(b) Mtodos basados en el tamao de la matriz X'X: uando tenemos multi olinealidad la matriz X'X es asi singular, de esta manera una medida de
tamao de esta matriz nos permite dete tar la presen ia de multi olinealidad. El determinante no es una medida buena, ya que tiene problemas de
sensibilidad a los ambios de unidades. Pero sabemos que el determinante
de una matriz simtri a es igual al produ to de sus valores propios, y por lo
tanto el examen de estos valores nos da una idea del tamao de la matriz.
De esta forma, Belsley propone la siguiente medida para ver el grado de
multi olinealidad:

=
Esta medida se denomina

max
min

nmero de ondi in de la matriz X,

y nmeros

de este indi ador mayores 25 suelen onsiderarse problemti os.

's orresponden a los valores propios de la


donde S es la siguiente matriz diagonal:

1
0

0
x2 x2
..

1
0
0
.
x3 x3
S=

..
..

.
.
0
0

0 1
Los

matriz

xk xk

B = S(X X)S ,

Esta matriz nos permite librarnos del problema de unidad en el tamao de


los valores propios, ya que normaliza ada una de las variables al dividir
todas las observa iones por su desvia in estndar.
El nmero de ondi in de la matriz X ( ), impli a que mientras mayor es
este valor, el valor de

min

es realmente pequeo al ompararlo on

max ,

indi ando el poten ial problema de multi olinealidad.

4.1.4. Remedios ontra la Multi olinealidad


Se han propuesto varios mtodos para ha er frente a la multi olinealidad. La solu in ms sen illa es eliminar de la regresin las variables que se sospe he son
la ausa del problema. Obviamente de este mtodo surgen problemas de espe i a in, omo la omisin de variables relevantes. Es ne esario re ordar que el
143

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

estimador MCO sigue siendo el mejor estimador lineal insesgado de los parmetros. El problema es que, uando hay multi olinealidad, el

mejor

no resulta ser

muy bueno.
Las solu iones propuestas en la literatura (estimador de ridge o estimador resta
y estimador de omponentes prin ipales) tienen omo ara tersti a bus ar un
estimador ligeramente sesgado pero uya varianza sea mu ho menor, es de ir, un
estimador on menor error uadrti o medio. No existe una metodologa que permita eliminar el problema de alta multi olinealidad sin alterar las propiedades y
la interpreta in de los parmetros.
Estas metodologas tienen po o respaldo intuitivo, por lo tanto la interpreta in
de los parmetros es des ono ida.

144

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

4.2.

Error de Medi in

Una di ultad en todo trabajo empri o en E onoma es la imposibilidad de disponer de las observa iones muestrales de las variables de inters. Por ejemplo,
las variables de ontabilidad na ional omo el PIB, sto k de apital o onsumo,
son slo estima iones de on eptos teri os que no se observan en la realidad. En
otros asos, omo la Renta Permanente, inteligen ia o habilidad de un trabajador,
no disponemos ni siquiera estima iones, y debemos utilizar variables

Proxies, que

aproximan los on eptos que se quieren utilizar. As por ejemplo se utilizan aos
de experien ia del trabajador para aproximar su habilidad.
Podemos adelantar que el error de medi in o el uso de variables proxies generar
sesgos en las estima iones por MCO, el que ser menor:

uanto ms se aproxime la verdadera variable que debera in luirse en el


modelo on que que in luyo efe tivamente.
uanto ms independiente sea el error de medida de las restantes variables
del modelo.

Consideremos el siguiente modelo lineal simple:

yi = xi + ui
en el que la variable dependiente

yi

i = 1, ..., n

(4.6)

est medida on error, es de ir, solo observa-

mos:

yi = yi + i
donde asumimos que

i N(0, 2 )

i = 1, ..., n

(4.7)

y es independiente de

xi

ui .

Reemplazando (4.7) en (4.6):

yi = xi + (ui + i ) = xi + i
Bajo los supuestos men ionados es f il darse uenta que el estimador de
el mismo que si observramos el verdadero valor de

(4.8)

ser

yi .

En onse uen ia, los errores de medida en la variable endgena no produ en ningn problema importante al estimar por MCO.
Ahora supongamos que la variable

xi

xi = xi + i

esta medida on error, es de ir:

i = 1, ..., n
145

(4.9)

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

donde

i N(0, 2 )

y es independiente de

ui , xi

y de

yi .

El modelo en trminos de las variables observables es:

yi = xi + (ui i ) = xi + i

(4.10)

ontrario a lo que o urra en (4.8) en este aso tenemos di ultad al estimar por

MCO, ya que el trmino de error i esta rela ionado on xi , lo que va en ontra


del supuesto 6, veamos:

Cov(i , xi ) = Cov(ui i , xi + i )
= Cov(ui , xi ) Cov(i , xi ) + Cov(ui , i ) Cov(i , i )
= 0 0 + 0 2
Esto ha e que el estimador MCO de

=
=
plim =
plim =
plim =
plim =
plim =
plim =
donde

Sx2 = plim n1

Pn

i=1

PN

en el modelo (4.10) sea sesgado:

1/N
i=1 xi yi

PN 2
1/N
i=1 xi
P

N
1

i=1 xi yi
N
plim
PN 2
1
i=1 xi
N
P

plim N1 N
i=1 xi yi
P
2
plim N1 N
i=1 xi
P
plim N1 N
i=1 (xi + i )(xi + ui )
P
2
plim N1 N
i=1 (xi + i )
P
plim N1 N
i=1 (xi + i )(xi + ui + i
P
2
plim N1 N
i=1 (xi + i )
P
plim N1 N
i=1 (xi + i )(ui i )
+
P
2
plim N1 N
i=1 (xi + i )
2
+ 2 2
Sx +

i )

1+
x2i ,

Sx2

que supondremos existe.

El resultado en trminos generales es que el estimador MCO en presen ia de

error de medi in

estar sesgado ha ia en origen.

146

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

En el aso del modelo de regresin mltiple:

y = X + u
X = X +
donde todas las variables pueden estar medidas on error. Extendiendo lo desarrollado anteriormente:

plim M CO = [xx + ]1
donde

xx = plim

XX
y
n

= plim

(4.11)


.
n

Lo que impli a que un slo error basta para generar in onsisten ias en todos
los oe ientes del modelo.

4.2.1. Estima in por Variables Instrumentales


La estima in onsistente de los parmetros en presen ia de errores de medida es
posible si se disponen de

instrumentos.

Deni in: Un instrumento es una variable no in luida en el modelo, que umple


on:

No estar orrela ionada on el trmino de error.


Esta orrela ionada on la variable expli ativa para la ual a ta omo
instrumento (en este aso la variable medida on error).

Volviendo al modelo en (4.10), el sesgo del estimador MCO de surge por la

orrela in entre la variable xi y i . Supongamos ahora que se dispone de la


variable zi , tal que:

E(zi i ) = 0 E(zi xi ) 6= 0
Enton es el estimador de variables instrumentales de (4.10) es:

Pn
zi yi

V I = Pni=1
i=1 zi xi

En un modelo de regresin mltiple, tenemos que en ontrar una matriz Z que


ontenga los instrumentos de las variables medidas on error. El estimador de
Variables Instrumentales se obtiene de una regresin MCO en dos etapas:
147

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

i.

En la primera etapa, se ha e una regresin entre

Z, para obtener el valor estimado de X :

X y la matriz de instrumentos

X = Z +
= (Z Z)1 Z X
= Z(Z Z)1 Z X
X

ii.

En la segunda etapa se reemplaza el valor estimado de

en el modelo de

regresin original:

y = X +
+
y=X
y obtengo el estimador de

mediante MCO:

X
)1 X
y
V I = (X

= [X Z(Z Z)1 Z X ]1 X Z(Z Z)1 Z y

(4.12)

Si todas las variables expli ativas estn medidas on error ada una de ellas se

ne esita un instrumento, enton es Z tiene dimensin nk al igual que X , en este

Ha erlo ) que:

aso se puede demostrar (

V I = (Z X )1 Z y

tambin demostrar ):

on matriz de varianzas y ovarianzas (

V ar(V I ) = 2 (Z X )1 (Z Z)(X Z)1

4.2.2. Test de Hausman


Bajo errores de medida, el estimador MCO es in onsistente, mientras que el estimador de variables instrumentales es onsistente. Si en ralidad no hubiese errores
de medida, ambos estimadores sern onsistentes, y MCO es adems e iente, lo
que no o urre on ualquier estimador de variables instrumentales (es un estimador en dos etapas, lo que ha e perder e ien ia).
Por lo tanto, para ontrastar la existen ia de errores de medida Hausman plantea

M CO
realizar un test estadsti o omparando (
y ovarianzas.

148

V I ) on

su matriz de varianzas

E onometra
Es uela de Nego ios, UAI

Capitulo 4: Problemas on los datos

La hiptesis nula es que no existe error de medida, es de ir:

H0 :

M CO V I = 0

M CO
Hausman demuestra que la matriz de varianzas y ovarianzas de (
es igual a

V (V I ) V (M CO ).

(4.13)

V I )

De esta forma, se puede onstruir el siguiente

estadsti o de Wald para la hiptesis nula en (4.13):

W = (M CO V I ) (V (V I ) V (M CO ))1 (M CO V I ) 2k

149

Potrebbero piacerti anche