1 Econometria Texto Ayuda Escuela Militar Ingenieria Comercial

Apuntes de Econometra
EMI Ingeniera Comercial
MODELO DE REGRESIN LINEAL

Estimacin por Mnimos Cuadrados Ordinarios (MCO)
Sea el siguiente modelo lineal simple:
Yi 1 2 X i i
(11 )
i 1.. N
En base a una muestra de tamao N , es posible estimar los parmetros del modelo.
Un criterio muy utilizado es el de Mnimos Cuadrados Ordinaros (MCO).
Este mtodo consiste en la minimizacin de la suma de los residuos del modelo elevados al
cuadrado.
El programa de Minimizacin es el siguiente:
N
i 1
i 1
Min i2 (Yi 1 2 X i ) 2 f ( 1 , 2 )
1 , 2
Se eleva al cuadrado de tal manera de ponderar o castigar ms a las observaciones ms

alejadas a la FRM y menos a las ms cercanas.
Asimismo a fin de evitar que los valores positivos se eliminen con los negativos.
Como se ver ms adelante, el criterio MCO tiene propiedades estadsticas muy deseables.
Ntese:
Yi 1 2 X i i
i Yi 1 2 X i
i2 (Yi 1 2 X i ) 2
N
i 1
i 1
i2 (Yi 1 2 X i ) 2
(12)
Condicin de primer orden:

i2
1
(Y
2 (Yi 1 2 X i ) 0
1 2 X i ) Y i N 1 2 X i 0
N 1 2 X i Yi
i2
2 (Yi 1 2 X i ) X i 0
(Y X ) X Y X
X X Y X
i
2
i
1 X i 2 X i2 0
Por tanto, las denominadas ecuaciones normales son:

N1 2 X i Yi
1 X i 2 X i2 Yi X i
Resolviendo el sistema de ecuaciones normales se obtienen las siguientes soluciones:
N
x
i 1
N
x
i 1
yi
(13)
2
i
1 Y 2 X
Donde:
(14)
xi ( X i X )
yi (Yi Y )
X ,Y
X , Y Son las medias muestrales de X i y Yi
Propiedades de la solucin MCO

1) Ntese que las estimaciones de los parmetros del modelo estn en funcin de las variables
del modelo, en trminos observables.
Si variamos la muestra de datos, tendremos diferentes estimaciones de los parmetros, de la
LRM y de la estimacin de los errores del modelo.
2) Obtenemos estimadores puntuales de los parmetros.
Los estimadores por intervalos los veremos ms adelante.
3) La LRM se puede escribir como:
Yi 1 2 X i
Yi Y 2 X 2 X i
Yi Y 2 ( X i X ) (15)
4)
Yi Y
Si :
Yi Y 2 ( X i X )
Yi (Y 2 ( X i X )) NY 2 ( X i X )
Yi
(X
Y
N
N
X ) X i NX
NX NX NX 0
5) La LRM pasa por las medias muestrales:
1 Y 2 X
Y 1 2 X
6)
(16)
Al minimizar la ecuacin (12) respecto a 1 obtuvimos la condicin de primer orden:

i2
1
2 (Yi 1 2 X i ) 0
(Yi 1 2 X i ) u i 0
7)
X
i
Al minimizar la ecuacin (2) respecto a 2 obtuvimos que:

i2
2
2 (Yi 1 2 X i ) X i 0
(Yi 1 2 X i ) X i i X i 0
8) El modelo en desviaciones a la media

Yi 1 2 X i i (11 )
Yi 1 2 X i i (10)
Yi 1 2 X i (9)
Y 1 2 X (16)
Restando a (10), (16), obtenemos:
Yi Y 1 1 2 X i 2 X i y i 2 x i i
(10)
Restando a (9), (16), obtenemos:

Yi Y y i 2 x i
(17 )
Operando sobre (11) tambin se puede obtener:

y i 2 x i i u 2 x i i*
9)
y i 0
y i i 2 x i 2
X
i
(18)
X i 0
Supuestos de la estimacin MCO

Sean los siguientes supuestos de la estimacin de MCO-Modelo clsico de regresin lineal:
1. El modelo de regresin es lineal en los parmetros
2. Los valores de X son fijos en muestreo repetido
3.
El valor esperado de la perturbacin estocstica condicionada en los
valores Xs es igual a cero
4. Homoscedasticidad
5. Ausencia de autocorrelacin en los errores
6. El modelo est correctamente especificado
7. Existe suficiente variabilidad en la(s) variable(s) explicativa(s)
1. El modelo de regresin es lineal en los parmetros
Yi 1 2 X i i
(11 )
Esto claramente se ve en la ecuacin (11).
Este supuesto se cumple mientras los parmetros del modelo son lineales en la LRP (es decir
Y
en la esperanza condicional de i )
2. Los valores de X son fijos en muestreo repetido: las Xs no son estocsticas
El investigador selecciona las X y en base a los valores de X realiza un muestreo aleatorio de
la variable dependiente.
Por ejemplo, selecciona X=80 y luego selecciona aleatoriamente el valor de Y.
Inicialmente se realiza el anlisis de regresin condicionado en las Xs.
3. El valor esperado de la perturbacin estocstica es igual a cero
Esto quiere decir que los valores de i no afectan sistemticamente a los valores de Yi
Si:
Yi 1 2 X i ui
(11 )
E i / X i 0 i 1... N
Entonces:
E (Yi / X i ) E ( 1 2 X i i / X i )
E (Yi / X i ) E ( 1 2 X i / X i ) E ( i / X i )
E (Yi / X i ) 1 2 X i
4. Homoscedasticidad o igual varianza de la perturbacin estocstica del modelo

Las varianzas condicionales de la perturbacin estocstica son iguales.
Bajo este supuesto:
) E ( )
var( i / X i ) E ( i E ( i )) 2 / X i
var( i / X i
var( i / X i ) 2
/ Xi
(19)
i 1... N
El supuesto anterior implica que:
var(Yi / X i ) var( 1 2 X i i / X i )
var(Yi / X i ) var( i / X i ) 2
5
Este resultado se obtiene fcilmente, ya sea utilizando las propiedades de la varianza o

mediante la definicin de varianza.
LRP
5. No existen problemas de autocorrelacin de los errores
) E (
cov( t t j / X t , X t j ) E ( t E ( t ))( t j E ( t j )) / X t , X t j
cov( t t j / X t , X t j
t j
/ X t , X t j 0 ( 20)
t 1..T j 1,2,...
El problema de autocorrelacin es generalmente un problema de series de tiempo.
La ausencia de autocorrelacin implica que Yt depende sistemticamente y nicamente de X t

.
Si existieran problemas de autocorrelacin, tambin dependera sistemticamente de los
errores rezagados del modelo.
6. No existen problemas de correlacin entre la(s) variable(s) explicativa(s) y el trmino

de error
cov( i X i / X i ) 0 ( 21)
i 1.. N
El segundo supuesto garantiza que esto se cumpla. Al ser las Xs determinsticas la covarianza
con el trmino de error es 0.
Ms adelante se levantar el supuesto de no aleatoriedad y se vern las consecuencias.
7. El nmero de observaciones debe ser por lo menos igual al nmero de parmetros a
estimar
Nk
k es el nmero de parmetros a estimar. k 2 en el modelo de regresin simple.
8. Existe suficiente variabilidad en las Xs
Esto se puede comprender mejor utilizando la solucin:
N
x
i 1
N
x
i 1
yi
2
i
Si las Xs no tuvieran variabilidad entonces:

N
x
i 1
2
i
Ello implicara que la solucin sera indeterminada.

9. El modelo est correctamente especificado
+ Todas las variables importantes estn incluidas en el modelo.
+ La forma funcional es la correcta.
+ El modelo est bien definido en trminos de las ecuaciones necesarias.
+ Los supuestos probabilisticos sobre Yi, Xi y ui son los correctos.
+ Las variables se miden correctamente.
7
+ En general, no se ha cometido ningn error de especificacin.

De haberlo hecho, dependiendo del tipo de error, ello tendra implicaciones ms o menos
serias sobre las propiedades de los estimadores MCO.
10. En un modelo de regresin mltiple, se agrega el supuesto de ausencia de
multicolinealidad
Ninguna de las variables explicativas puede ser escrita como combinacin lineal de las otras
variables explicativas del modelo (incluyendo la constante).
Propiedades del estimador de MCO bajo los supuestos del modelo lineal clsico
Bajo los supuestos del modelo lineal clsico, los estimadores MCO son los Mejores
Estimadores Lineales Insesgados (MELI o BLUE)
1) Los estimadores son una funcin lineal de la variable aleatoria dependiente
x y
x
2
i
Donde:
ki
Ntese:
x
k x
i
2
i
Por tanto:
ki yi
xi
x i2
k x
0;
2
i
2
i
2 k i (Yi Y ) k iYi Y k i k i Yi
2) Los estimadores son insesgados
x y k y k ( x
x
k x k k
k ( 22)
i
2
i
Tomando el valor esperado a la ecuacin 22 y sabiendo que las Xs son determinsticas
E E k E
E
E 2 E 2 k i i
2
3) Estimador MELI.
Para mostrar que los estimadores son MELI, debemos encontrar la varianza de los mismos.
Para 2 :
2 2 k i i
2 2 k i i
Var ( 2 ) E ( 2 E ( 2 )) 2
Var ( 2 ) E ( 2 2 ) 2
Var ( 2
) E ( k )
Var ( 2 ) ( k i E ( i )) 2
Var ( 2 ) E k 12 12 ... k N2 N2 2 k 1 k , 2 1 2 ... k N 1 k N N 1 N
Var ( 2 ) k 12 E ( u12 ) ... k N2 E ( u N2 ) 2 k 1 k , 2 E ( 1 2 ) ... k N 1 k N E ( N 1 N )
Utilizando los supuestos de homoscedasticidad y no autocorrelacin:

x12 2 ... x N2 2
2
Var ( 2 )
( x i2 ) 2
x i2
Teorema Gauss-Markov
El Estimador MCO es de Mnima Varianza entre los estimadores lineales e insesgados.
Sea:
2 k iYi
Definamos un estimador lineal e insesgado alternativo:
~2 w iYi
~2 w i ( 1 2 X i i )
E ~2 E w i ( 1 2 X i i )
~
E 2 1 E wi 2 E wi X i E wi i
~
E 2 1 wi 2 wi X i
E ~
Si : w 0;
w X 1
2
Sea:
~
Var 2 Var
w w i
2
i
xi
x i2
xi
x i2
w Y w Var (Y ) w
i
wi
2
i
2
i
xi
x i2
wi
xi
x i2
2 w i
2
i
xi
x i2
xi
x2
i
xi
x2
i
1
x i2
La expresin se minimiza cuando:

wi
xi
xi2
De lo que resulta que:
~2 w i yi
x y
x
i
2
i
2
~
Var ( 2 )
xi2
Por tanto, queda demostrado que el estimador lineal e insesgado que minimiza la varianza es
el de MCO.
Posteriormente, con un enfoque matricial se generalizar este resultado.
En el modelo lineal simple tambin se puede demostrar que:
var 1
2 X i2
N x i2
cov( 1 2 ) X var( 2 )
Para tener una estimacin de la varianza de los parmetros es necesario contar con una
estimacin de la varianza de los errores.
Se plantea el siguiente estimador insesgado:
10
2
i
N 2
(En el modelo lineal general, se har la demostracin del insesgamiento de este estimador de
la varianza de los errores).
Prueba de Bondad de Ajuste: coeficiente de determinacin R2
Si:
y i y i u i
Al cuadrado y sumando:
y
y
2
i
2
i
( y i u i ) 2
y i 2 y i u i u i
2
Pero:
y u
i
Entonces:
2
i
y i u i
2
STC SEC SRC

STC = Suma Total de Cuadrados
SEC = Suma Explicada de Cuadrados
SRC = Suma de Residuos al Cuadrado
La STC es la variacin total de la variable dependiente respecto a su media.
La SEC es la variacin de la variable dependiente respecto a su media explicada por la
regresin estimada.
La SRC es la variacin de la variable dependiente respecto a su media que no es explicada por
la regresin estimada.
11
R2
El
o coeficiente de determinacin se define como la proporcin de la variacin total
explicada por la regresin.
En trminos de las ecuaciones vistas:
R
2
i
Tambin puede expresarse como:

R2
y
y
R2
2
i
( x )
y
2
2
22 x i
x /( N 1) S
S
y /( N 1)
2
2
2
2
2
2
i
2
X
2
Y
2
2
Donde S X y S Y son las varianzas muestrales de X y Y respectivamente.
Asimismo:
R
x y x
x y
y
x y /( N 1)
S
2
22 x i
2
i
2 2
i
2
i
R2
x i /( N 1) y 2i /( N 1)
2
2
XY
S X2 S X2
r2
Donde r es el coeficiente de correlacin simple entre X y Y , y S XY es la covarianza muestral

entre X y Y.
12
El
R2
tambin se puede escribir como:

R
El
u
1
y
i
2
i
implica que:
0
Un
R2
R2
prximo a 1 implica un buen ajuste.
Por el contrario, cuando se aproxima a 0 implica un mal ajuste.

Supuesto de Normalidad de los errores
Se agrega un supuesto adicional, donde los errores del modelo se distribuyen normalmente:
i N (0, 2 )
Sin la necesidad de este nuevo supuesto, los estimadores eran MELI.
Sin embargo, eran estimadores puntuales para los cuales no se poda construir intervalos de
confianza.
El supuesto de normalidad permite, entre otras cosas solucionar este inconveniente.
Dado adems el supuesto de ausencia de correlacin entre los errores y el de
homoscedasticidad, se puede decir que los errores del modelo estn normal idntica e
independientemente distribuidos (iid).
Es razonable este supuesto?
R. S lo es en la medida que se considere que la perturbacin estocstica en i, mide el efecto
neto de un conjunto grande de variables/factores independientes.
Bajo el Teorema del Lmite Central si la perturbacin estocstica en i es la suma de un
conjunto grande (que tiende a infinito) de variables aleatorias distribuidas independientemente
unas de otras, entonces tendr una distribucin normal.
Incluso si no es un conjunto grandes de variables/factores, la suma podr aproximarse
mediante una distribucin normal.
La utilizacin de la distribucin genera algunas propiedades deseables adems de que hace
manejable la utilizacin de los estimadores (los intervalos de confianza y pruebas de hiptesis
se manejan en funcin a dos parmetros: la media y la varianza (y covarianzas) de los
estimadores)
13
Cules son las Implicaciones?

R. Gracias al supuesto de normalidad, los estimadores tendrn adicionalmente las siguientes
propiedades:
1)
2)
3)
4)
Los estimadores son consistentes

Los estimadores se distribuyen normalmente
Los estimadores son MEI
Los estimadores se distribuyen independientemente de la varianza estimada del
modelo.
5) La variable dependiente hereda una distribucin normal
6) El siguiente estadstico, hereda la distribucin Chi-cuadrado
N k 2 k2
2
1) Los estimadores son consistentes:

Esta es una propiedad asinttica que establece que a medida que la muestra aumenta de
tamao los estimadores del modelo convergen a su verdadero valor poblacional, es decir, a los
parmetros del modelo
Donde la probabilidad lmite (plim) se define de la siguiente manera:

plim
1 lim P ( 1 1 ) 1
plim
2 lim P ( 2 2 ) 1
N
N
es un valor arbitrariamente pequeo.

Es decir, a medida que aumenta la muestra, bajo la propiedad de consistencia, la probabilidad
que los estimadores difieran de su verdadero valor poblacional se hace cero.
Grficamente:
14
2) Los estimadores se distribuyen normalmente:

1 N ( 1 , 2 )
1
Donde:
2 2
1
En el caso de 2 :
X
N x
2
i
2
i
2 N ( 2 , 2 )
2
Donde:
2 2
2
1
xi2
Cabe notar que la variable Z se distribuye normal estndar:

Z
i i
N (0,1)

i
3) Bajo el supuesto de normalidad de los errores, los estimadores son los Mejores
Estimadores Insesgados.
Esto quiere decir que los estimadores son de mnima varianza, no solamente entre los
estimadores lineales sino entre los no lineales que son insesgados.
15
Bajo el supuesto de normalidad de los errores del modelo, el estimador MCO coincide con el
estimador de Mxima Verosimilitud (MV).
Una de las propiedades de MV es que los estimadores obtenidos por esta metodologa son
MEI.
2
1 2
4) Los estimadores
,
se distribuyen independientemente de
.
Esta es una propiedad estadstica muy til para obtener las distribuciones t-student de los
estimadores (vistas a continuacin).
5) La variable dependiente hereda la distribucin normal.
Habamos mostrado que:
E Yi / X i 1 2 X i
Var Yi / X i 2
Una propiedad deseable de una variable cuya distribucin es normal es que otra variable
aleatoria, que es combinacin lineal de la misma, tambin tendr distribucin normal.
Dado que:
Yi 1 2 X i i
Por tanto:
Yi N ( 1 2 X i , 2 )
6) Estadstico Chi-Cuadrado
El siguiente estadstico hereda la distribucin Chi-Cuadrado:
N k 2 k2
2
Junto a las propiedades 2) y 4), esta propiedad permite obtener la distribucin t-student
empricamente utilizada en las pruebas de hiptesis y en la construccin de intervalos de
confianza. Veamos cmo.
La primera propiedad estableca que:
i N ( i , 2 )
i
16
Sin embargo, no es posible utilizar directamente esta propiedad para construir intervalos de
confianza o pruebas de hiptesis, en la medida que
desconocido.
contiene un parmetro poblacional
Para ello utilicemos l siguiente resultado estadstico:

Si Z1
i i
N (0,1)

i
Y
Z2 N k
2
k2
2
Sabiendo adems que Z 1 y Z 2 se distribuyen independientemente, entonces:
Z1
Z 2 /( N k )
i i

N k 2 /( N k )
i i

tN k
Para 1 :
t
1
Z1
Z 2 /( N k )
1 1
X i2
N x i2
1 1
t N k
X i2
N x i2
Para 2 :
t
2
Z1
Z 2 /( N k )
2 2
1
xi2
2 2
t N k
1
xi2
17
Intervalo de Confianza-Estimador por intervalos

Intervalo de Confianza para los estimadores
Si:
i i
t / 2 ) 1

P ( t / 2 i
Entonces podemos construir un intervalo de confianza para cada uno de los parmetros del
modelo. En el caso de 1 :
1 t / 2 1 t / 2
1
X
N x
2
i
2
i
En el caso de 2 :
2 t / 2 2 t / 2
2
Donde
xi2
es el nivel de significancia y (1 ) es denominado coeficiente de confianza.
En (1 ) * 100 de las veces, el intervalo contendr el verdadero valor poblacional.

tambin es conocida como la probabilidad de cometer el error tipo I o como p-value.
El error tipo I es rechazar la hiptesis nula cuando es verdadera.

Intervalo de Confianza para la varianza
Tambin es posible construir un intervalo para la varianza del modelo:
( N k ) 2
/ 2
( N k ) 2
1 / 2
2.8 Prueba de Hiptesis

Pruebas individuales
Para llevar a cabo alguna prueba de hiptesis para los coeficientes del modelo, se pueden
construir intervalos de confianza o llevar a cabo una prueba de significancia.
En ambos casos es necesario plantear la hiptesis nula y la hiptesis alterna.
18
En el caso de una prueba de 2 colas:
H 0 : i i*
H 1 : i i*
*
Utilizando el intervalo de confianza, se concluye que si i est dentro del mismo no se puede
rechazar la hiptesis nula.
Bajo el segundo enfoque, se tiene la siguiente regla de decisin:
Si : t i t / 2 , N k RH 0
Donde:
t i
i i*

i
Una prueba muy utilizada en nuestro modelo de regresin simple es denominada prueba de
significancia individual de X.
Explica X a Y?
H0 : 2 0
H1 : 2 0
En este caso:
t 2
2
i
Si:
t 2 t / 2 , N k RH 0
Para N - k 20 y 0.05 , se puede utilizar la siguiente regla prctica:
Si:
t 2 2 RH 0
En el caso de una prueba de 1 cola:
H 0 : i i*
H 1 : i i*
Si:
19
t i t , N k RH 0
Donde:
t i
i i*

i
Otra prueba de 1 cola es:
H 0 : i i*
H 1 : i i*
Si:
t i t , N k RH 0
Donde:
t i
i i*

i
Prueba de significancia global del modelo-Anlisis de varianza

Sabamos que:
2
i
y i2 i2
STC SEC SRC
y
y

2
i
tiene N - 1 grados de libertad
2
i
tiene k - 1 grados de libertad
2
i
tiene N - k grados de libertad
Por tanto, tenemos la siguiente tabla ANOVA:

SC
gl
STC
2
i
N 1
SEC
2
i
k 1
SRC
2
i
N k
SPC
y i2
N 1
y i2
k 1
i2
N k
Puede demostrarse que bajo la hiptesis nula de que el modelo no es globalmente

significativo, o que ninguna de las variables explicativas del modelo explica Yi , el siguiente
estadstico:
20
y /( k 1) x /( k 1) F
/( N k ) /( N k )
2
i
2
2
2
2
i
k 1, N k
Ntese que en el modelo de regresin simple, la hiptesis nula equivale a 2 0 .
La regla de decisin es:

Si : F Fk 1, N k , RH 0
Para entender esta prueba, debemos tomar en cuenta que:
2
i
N k
2
i
k 1
2
2
x E 2
22 x i2 2
2
i
2
i
2
i
Bajo la hiptesis nula, 2 0 el modelo no tiene poder predictivo.

La variacin explicada es en valor esperado igual a la variacin no explicada.
No hay explicacin adicional porque la variacin es explicada por la varianza de la
perturbacin estocstica.
El estadstico F tiene la distribucin Ji-cuadrado debido al siguiente conjunto de resultados:
Si:
Z 1 N ( 0,1)
Donde:
Z1
( 2 2 )

2
Entonces:
Z
2
1
( 2 2 ) 2
21
Tiene una distribucin Ji-Cuadrado con 1 grado de libertad.

Adems habamos visto que:
( N k ) 2 i2
2
Z2
(N
-k)
2
2
Por tanto, bajo la hiptesis nula, y siguiendo el teorema que establece que si Z 1 y Z 2 son
variables ji-cuadradas independientemente distribuidas, con (k-1) y (N-k) grados de libertad,
respectivamente, entonces:
Z 1 /( k 1)
Fk 1 , N k
Z 2 /( N k )
22 x i2 / 2 /( k 1) 22 x i2 /( k 1)
F
Fk 1, N k
i2 / 2 /( N k ) i2 /( N k )
F
Para obtener el resultado anterior, tambin es necesario imponer el supuesto de normalidad de

la perturbacin estocstica del modelo.
Prueba de normalidad de Jarque-Bera
Puede demostrarse que bajo la hiptesis nula de normalidad el siguiente estadstico JarqueBera:
S 2 ( K 3) 2
JB N
24
6
Tiene una distribucin asinttica ji-cuadrado con 2 grados de libertad (correspondientes al
coeficiente de asimetra y al coeficiente de curtosis)
En una distribucin normal S=0 (coeficiente de asimetra) y K=3 (coeficiente de curtosis).
Estos coeficientes se definen de la siguiente manera:
1
S
N
1
K
N
1
N
2
i
Prediccin
En funcin al valor X 0 es posible llevar a cabo la prediccin media de la variable
dependiente.
Es decir, se intenta estimar: E (Y0 / X 0 )
22
E (Y0 / X 0 ) 1 2 X 0
Utilizando la regresin la prediccin media es:
Y0 1 2 X 0
Ntese que el valor esperado de la prediccin media coincide con:
E (Y0 / X 0 )
La varianza de prediccin es:
0 ) Var 1 2 X 0
Var( Y
0 Var 1 2Cov 1 , 2 X 0 Var 2 X 02
Var Y

X
Var Y
N x
2
i
2
i
Var Y0
X
N x
2
i
Var Y0 2
2
i
2
i
2 XX 0 2
X
N x
2
i
X2
2
i
2 XX 0
X2
2
i
1
X 02 2
2
x
i
1
X 02
2
x
i
2 XX 0
1
x i2
x i2
1
X 02
2
xi
x i2
( X X 0 )2
2 1
Var Y0
x i2
N
Por tanto,
E Y0 1 2 X 0
1 ( X X 0 )2
Var Y0 2
N
x i2
Al igual que en la construccin de intervalos de confianza para los parmetros del modelo,
resulta sencillo determinar que la prediccin tiene una distribucin t-student (utilizando el
estimador de la varianza de los errores).
Es decir:
23
Y0 ( 1 2 X 0 )
t N k
ee Y0
ee Y0
1 ( X X 0 )2

N
x i2
2
Pr 1 2 X 0 t / 2 ee Y0 1 2 X 0 1 2 X 0 t / 2 ee Y0
En funcin al valor X 0 es posible llevar a cabo la prediccin individual de la variable

dependiente.
Se intenta predecir:
Y0 1 2 X 0 0
La prediccin individual es:
Y0 1 2 X 0
Se define el error de prediccin como:
e0 Y0 Y0 1 2 X 0 0 1 2 X 0
El valor esperado del error de prediccin es:

E e (
E e 0 E ( 1 1 ) ( 2 2 ) X 0 0
0
1 ) ( 2 2 ) X 0 0
La varianza es:
Var e 0 Var ( 1 1 ) ( 2 2 ) X 0 0
Var e 0 Var 1 2 X 0 Var 0
1 ( X X 0 )2
2

2
N
x i
Var e 0 2
Var e 0
2
1 (X X0 )
1
x i2
2
De manera similar:
24
Y0 Y0
t N k
ee e 0
2
1 (X X )
ee e 0 1
x i2
Pr 1 2 X 0 t / 2 ee e 0 1 2 X 0 1 2 X 0 t / 2 ee e 0 1
MODELO DE REGRESIN LINEAL GENERAL

Introduccin.El modelo de regresin simple (visto anteriormente) puede ser inadecuado, en la medida que
una variable puede estar determinada por ms de una variable explicativa.
Es ms realista suponer que una variable depende de un conjunto k-1 de variables explicativas.
Es decir:
Yi f ( X 2 i , X 3i , X 4i ...., X ki , i ) i 1,2,...N (1)
El anterior sistema puede ser escrito alternativamente de la siguiente manera (Asumiendo
linealidad en los parmetros y que el trmino de error del modelo entra de manera aditiva en el
modelo):
Y1 2 X 21 3 X 31 X 41 ... k X k 1 1
Y2 2 X 22 3 X 32 X 42 ... k X k 2 2
...
Y N 2 X 2 N 3 X 3 N X 4 N ... k X kN N (2)
O tambin as:
y X
(3)
Donde las matrices estn conformadas de la siguiente manera:
Y1

Y2

YN
X 21
X 22
1 X 2 N
...
...
X k1
Xk2
X kN
Donde:
25
y es una matriz de dimensin N x 1

X es una matriz de dimensin N x k
es una matriz de dimensin N x 1
es una matriz de dimensin k x 1
Supuestos del modelo de regresin clsico
1) El modelo es lineal en los parmetros y la perturbacin estocstica entra de manera
aditiva en la ecuacin.
2) El valor esperado de la perturbacin estocstica es 0.
E ( 1 ) 0

E ( 2 ) 0
E 0 E

E ( N ) 0
3) Homoscedasticidad y ausencia de problemas de autocorrelacin
La matriz de varianzas y covarianzas de :
1

E ' E
2 ... N

E ( 12 )
E ( 1 2 )
E ( 2 1 )
E ( 22 )
E ( N 1 ) E ( N 2 )
...
...
...
E ( 1 N )
E ( 2 N )

E ( N2 )
Bajo el supuesto de homoscedasticidad y ausencia de autocorrelacin de los errores:

E ( i2 ) 2
i 1...N
E ( i j ) 0 i, j 1..N
i j
Por tanto:
Var ( E ( ' ) 2 I
4) X 2i , X 3i , X 4i ...., X ki son variables no estocsticas o determinsticas y, por tanto, no estn
correlacionadas con la perturbacin estocstica del modelo.
5) No existen problemas de multicolinealidad.
26
A lo largo de la muestra, ninguna variable explicativa puede escribirse como una combinacin
lineal de otra o de otras variables explicativas del modelo.
Asimismo, se supone que rango de X es k (rango completo) y que el nmero de observaciones
N es mayor o igual a k.
6) El modelo est bien especificado.
7) Se aade el supuesto de normalidad de los errores.
2
tiene distribucin normal multivariada. Es decir, N (0, I )
Estimacin por MCO

La ecuacin (3) puede escribirse de la siguiente manera:
y X
La cual premultiplicada por ' resulta en:
' y X ' y X i2
Que a su vez, puede escribirse como:
' y X ' y X y ' y y ' X ' X ' y ' X ' X

Debido a que y' X es un escalar que es igual a su transpuesta, ' X ' y .
Por tanto:
' y ' y 2 ' X ' y ' X ' X

El programa de minimizacin es, por tanto:
Min ( ' ) Min ( y ' y 2 ' X ' y ' X ' X )
Bajo la condicin de primer orden se deriva respecto a y se iguala a 0.

'
2 X ' y 2 X ' X 0
Donde se ha hecho uso de los siguientes resultados de la derivacin de matrices:
27
a ' x
a
x
x ' ax
2ax
x
Por tanto:
2 X ' y 2 X ' X 0 X ' y X ' X
( X ' X ) 1 ( X ' y )
(4)
Para que la solucin exista, la inversa de ( X ' X ) debe existir.

Es decir, ( X ' X ) no es una matriz singular.
Bajo la condicin de segundo orden obtenemos que:
2 '
X'X
'
Es una matriz semidefinida positiva lo cual garantiza que sea un mnimo.
Propiedades de MCO bajo los supuestos del modelo lineal clsico
En el modelo de regresin demostraremos que los estimadores son MELI (MEI aadiendo el
supuesto de normalidad de los errores):
1)
( X ' X ) 1 ( X ' y )
es un estimador lineal de las observaciones en y.
Esto se deduce rpidamente del resultado obtenido:
( X ' X ) 1 ( X ' y ) g ( X ) y
2)
( X ' X ) 1 ( X ' y )
es un estimador insesgado
( X ' X ) 1 ( X ' y ) ( X ' X ) 1 X ' ( X )

( X ' X ) 1 X '
(5)
28
Tomando el valor esperado de y utilizando el supuesto de que E ( ) 0 y que las Xs son

no estocsticas se obtiene:
E ( ) E ( X ' X ) 1 X ' E ( ) E (( X ' X ) 1 X ' ) ( X ' X ) 1 X ' E ( )

E ( )
Var ( ) 2 ( X ' X ) 1
3) La varianza de es
La definicin de la varianza es:

Var ( ) E ( E ( ))( E ( ))'
De la ecuacin (5) y sabiendo que el estimador es insesgado:
Var ( ) E ( E ( ))( E ( ))' E ( )( )'
Var ( ) E ( X ' X ) 1 X ' (( X ' X ) 1 X ' )' E ( X ' X ) 1 X ' ' X ( X ' X ) 1
Var ( ) ( X ' X ) 1 X ' E uu ' X ( X ' X ) 1 ( X ' X ) 1 X ' 2 IX ( X ' X ) 1
Var ( ) 2 ( X ' X ) 1 ( X ' X )( X ' X ) 1 2 ( X ' X ) 1

Var ( ) 2 ( X ' X ) 1
(6)
Donde se han utilizado algunos de los supuestos del modelo y otros resultados:
Xs no estocsticas y por tanto no correlacionadas con
E ( ' ) 2 I
es insesgado
3)
(( X ' X ) 1 )' ( X ' X ) 1
( X ' X ) 1 ( X ' y )
dado que
( X ' X ) 1
es simtrica
es MELI (Estimador de Mnima Varianza)
Es el Teorema de Gauss-Markov
~ ~
Sea A y un estimador lineal en y alternativo.
Adems, considrese la siguiente definicin de A:
29
~ ( X ' X ) 1 X '
A A
~ ( X ' X ) 1 X '
A
de tal manera que si A=0 entonces:
Desarrollando la expresin, se tiene que:
~ A ( X ' X ) 1 X ' y A ( X ' X ) 1 X ' ( X )

~ AX A ( X ' X ) 1 X ' X ( X ' X ) 1 X '
~ AX A ( X ' X ) 1 X '
Manteniendo los supuestos de que:
Xs no estocsticas
Xs no correlacionadas con
E ( ) 0
E ( ' ) 2 I
El estimador es insesgado slo si AX 0 ( AX )' X ' A' 0
~ AX A ( X ' X ) 1 X '
~ A ( X ' X ) 1 X '
E ( ~ ) 0 0
~ A ( X ' X ) 1 X '
(7 )
~
La varianza de es:
30
~
~
~
Var ( ) E ( )( )'
~
Var ( ) E ( A ( X ' X ) 1 X ' )( A ( X ' X ) 1 X ' )'
~
Var ( ) E A ( A )' E A (( X ' X ) 1 X ' )'
E ( X ' X ) 1 X ' )( A ' )' E ( X ' X ) 1 X ' )(( X ' X ) 1 X ' )'
~
Var ( ) E A ' A' E A ' X ( X ' X ) 1 E ( X ' X ) 1 X ' ) ' A'
2 ( X ' X ) 1
Var ( ~ ) 2 ( X ' X ) 1 AE ( ' ) A' AE ' X ( X ' X ) 1
( X ' X ) 1 X ' E ' A'

~
Var ( ) 2 ( X ' X ) 1 2 AA' 2 AX ( X ' X ) 1 2 ( X ' X ) 1 ( AX )'
~
Var ( ) 2 ( X ' X ) 1 2 AA'
Se puede demostrar que AA es una matriz semidefinida positiva por lo que se concluye que el
estimador alternativo tiene una varianza cuando menos igual a la varianza del estimador MCO.
Por tanto, MCO es el estimador de varianza mnima.
Resultados adicionales de la estimacin MCO
a) X ' 0
X ' X ' ( y X ) X ' y ( X ' X )( X ' X ) 1 X ' y X ' y X ' y 0
Donde se ha hecho uso de que la variable dependiente se expresa como combinacin lineal de
la lnea de regresin muestral y el error estimado:
y X
Veamos que significa este resultado
1
X
X ' 21

X k1
1
X 22
X kN
...
...
...
1
X 2 N

X kN
1

2

2i
X
i
ki
0
0

0
31
Establece que la suma de los residuos estimados es igual a cero (siempre que el modelo haya
sido especificado con constante) y que la suma del producto de los residuos estimados por
cada una de las variables explicativas es de la misma manera igual a cero.
En el modelo de regresin simple habamos obtenido este resultado, el cual simplemente
hemos generalizado para el caso de k 1 variables explicativas.
b)
SRC i2 ' y ' y ' X ' y
' ( y X )' ( y X ) y ' y y ' X ' X ' y ' X ' X

y ' y 2 ' X ' y ' X ' X y ' y 2 ' X ' y ' X ' y
y ' y ' X ' y
c)
SRC i2 ' y ' y y ' y
La lnea de regresin muestral es:

y X
Por tanto,
y ' y ( X )' ( X ) ' X ' X ' X ' X ( X ' X ) 1 X ' y ' X ' y
Utilizando el resultado de la propiedad b), se obtiene:
' y ' y y ' y

d) My M
Donde:
M I X ( X ' X ) 1 X '
Es una matriz singular, simtrica e idempotente (MM=M)
32
y X y X ( X ' X ) 1 X ' y ( I X ( X ' X ) 1 X ' ) y My

My M ( X ) MX M M
ya que
MX ( I X ( X ' X ) 1 X ' ) X X X ( X ' X ) 1 X ' X X X 0
e) ' ' M
' ( M )' M ' M ' M ' M '

Ya que M es una matriz idempotente.
Este resultado ser muy til cuando demostremos la propiedad de insesgamiento de la
estimacin de la varianza de los errores.
f) STC SEC SRC
Esta proposicin establece que la variacin total de la variable dependiente respecto a su
media (Suma Total de Cuadrados) es igual a la variacin explicada (Suma Explicada de
Cuadrados) ms la variacin no explicada del modelo (Suma de Residuos al Cuadrado)
Se haba mostrado que:
y ' y y ' y '
Donde se puede verificar fcilmente que:
y ' y Y1 Y2 ... YN
Y1
Y
2

YN
Yi 2
Y1

Y2
y ' y Y1 Y2 ... YN
Y 2
i

YN
Si:
33
STC (Yi Y ) 2 Yi 2 NY
STC y ' y NY
y ' y NY
De manera similar:
SEC (Yi Y ) 2 Yi 2 NY 2 y ' y NY 2
SEC y ' y NY 2
Donde fcilmente se verifica que:
Y Y
Yi Yi i
Y Y
Y Y
i
Y Y
Por tanto,
2
y ' y N Y y ' y N Y '

STC SEC SRC
2
g) SEC y ' y N Y ' X ' X N Y ' X ' y N Y

Este resultado es directo de demostraciones anteriores.
Sin embargo, requiere que el modelo tenga constante.
h) Bondad de Ajuste-Coeficiente de determinacin
34
R2
Se define el coeficiente de determinacin
, como el porcentaje de la variacin total de la
variable dependiente en torno a su media (STC) explicado por la variacin explicada por el
modelo (SEC).
Por tanto, de los resultados obtenidos anteriormente:
2
R2
SEC y ' y N Y
2
STC
y' y N Y
R2 1
SRC
1
STC
' X ' y N Y
2
y' y N Y
' X ' X N Y
2
y' y N Y
'
2
y' y N Y
2
i) El R ajustado
2
Se puede demostrar que el R es una funcin creciente del nmero de variables explicativas
del modelo (es decir, de k) independientemente si las variables que se incluyan tengan poder
explicativo o no sobre la variable dependiente.
2
Para corregir esta situacin se plantea el uso del R ajustado:
R2 1
( N 1)
(1 R 2 ) f (k )
(N k)
2
El R penaliza la introduccin de variables explicativas en el modelo.
'
2
N k es un estimador insesgado de
j)
'
E
2
Se puede demostrar que N k

2
Ntese que de la propiedad e):

E ' E ' M
Al ser un escalar y utilizando propiedades de traza, se obtienen los siguientes resultados:

E ' E ' M E tr ' M E tr M' tr E ' M tr( M ) 2
35
Pero:
tr( M ) tr ( I X ( X ' X ) 1 X ' ) tr( I ) tr X ( X ' X ) 1 X '
tr( I N ) tr ( X ' X ) 1 X ' X ) tr( I N ) tr( I k ) N k

Por tanto:
E ' N k 2
Resultado del cual se demuestra fcilmente que:
'
1
1
N k 2 2
E 2 E
E '
N k
N k
N k)
k) La normalidad de los errores aade los resultados vistos anteriormente que se generalizan
para el modelo de (k-1) variables explicativas. (
N (0, 2 I )
).
El estimador :
i) Es un estimador consistente: plim( )

ii) Es MEI
N ( , 2 ( X ' X ) 1 )
iii) Hereda la distribucin normal:
Yi N xi , 2
Y
i
iv)
tambin hereda la distribucin normal:
y 2
v)
son independientes entre s.
vi)
2
' ' M
(N k) 2
N2 k
2
2
l) tambin tiene distribucin normal
N (0, 2 M )
m) Contraste de normalidad de los errores del modelo
Para contrastar la normalidad de los errores, se utiliza la prueba de Jarque-Bera.
Bajo la hiptesis nula de normalidad de errores, en muestras grandes, el estadstico JB tiene
una distribucin Ji-Cuadrada con 2 grados de libertad
36
S2
JB N
(k 3) 2
24
Donde:
1
S
N
1
K
N
1
N
2
i
n) Para el parmetro estimado i :
E i i
var( i ) 2 aii
donde: i , i corresponden a los elementos en la i-ava posicin de los vectores columna ,

, respectivamente;
( X ' X ) 1
aii
corresponde al elemento de la i-ava fila e i-ava columna de la matriz
Considerando adicionalmente el supuesto de normalidad, entonces:
i N ( i , 2 aii )
Pruebas de hiptesis
Prueba t-student
La prueba de hiptesis para un parmetro del modelo (t-student) se puede generalizar para el
caso de (k-1) variables explicativas.
Dado que:
i N ( i , 2 aii )
, se tiene que:
Zi
i i
a ii
tiene una distribucin normal estndar.
37
Por otro lado, dado que:
2
( N k ) N2 k
2
y usando las propiedades estadsticas (anteriormente), se tiene que el siguiente estadstico

tiene una distribucin t-student con (N-k) grados de libertad.
i i
t
a ii
2
( N k ) /( N k )
2
i i
a ii
Como se estableci antes, sobre la base de este estadstico, se pueden llevar a cabo pruebas de
una o dos colas.
Bajo el razonamiento de los intervalos de confianza, tambin se pueden construir intervalos de
confianza:
Prob( i t / 2 aii i i t / 2 aii ) 1

Por lo que para que no se rechace la hiptesis nula, el valor planteado en la hiptesis debera
entrar dentro del intervalo.
Prueba de significancia global

En el modelo lineal general, la hiptesis de la prueba de significancia global es:
H 0 : 2 3 4 ..... k 0
contra la hiptesis alterna de que uno o ms de estos
parmetros es distinto de cero.

Se puede demostrar que bajo la hiptesis nula, el siguiente estadstico sigue una distribucin F,
con (k-1) grados de libertad en el numerador y (N-k) grados de libertad en el denominador.
2
( ' X ' y N Y ) /( k 1)
F
' /( N k )
El estadstico F, puede ser escrito en funcin del
R2
del modelo.
38
2
R 2 /( k 1)
( ' X ' y N Y ) /( k 1) y ' y NY
F
y ' y NY 2 (1 R 2 ) /( N k )
' /( N k )
Si el estadstico planteado supera el valor F de tablas con (k-1) grados de libertad en el

numerador y (N-k) grados de libertad en el denominador a un nivel de significancia
entonces se rechaza la hiptesis nula.
Prueba de hiptesis de un conjunto de restricciones lineales
La hiptesis nula bajo una prueba de hiptesis de un conjunto de restricciones lineales consiste
en:
H o : R r
Donde:
R de dimensin q x k (y de rango igual a q), tiene como elementos los coeficientes que
acompaan a cada uno de los parmetros en cada una de las restricciones.
r de dimensin q x 1, tiene como elementos los valores independientes en cada una de
las restricciones.
Bajo la hiptesis nula, el siguiente estadstico, sigue una distribucin F con q grados de
libertad en el numerador y (N-k) grados de libertad en el denominador.
( R r )' ( R ( X ' X ) 1 R ' ) 1 ( R r ) / q
' /( N k )
Esta prueba es muy poderosa en la medida que permite probar desde la hiptesis lineal ms
simple (significancia individual de algn parmetro) hasta hiptesis lineales ms complejas.
Ej: En el modelo
Yi 1 2 X 2i 3 X 3i 4 X 4i 5 X 5i i
Se desea probar la siguiente hiptesis:
2 3 1
H 0 : 3 4 0.5
1
5
39
En este caso:
0 1 1 0 0
R 0 0 0 3 0
0 0 0 0 1
1
r 0.5
1
Ntese que tanto las pruebas de significancia individual, como la prueba de significancia
global son casos particulares de esta prueba.
La regla de decisin establece que si el estadstico supera los valores crticos, se rechaza la
F
hiptesis nula: Si : F > q , N k , , entonces se rechaza Ho.
Prueba de hiptesis a travs del modelo restringido y el no restringido

Una forma alternativa de llevar a cabo pruebas de hiptesis es a travs del modelo restringido
y no restringido.
Se puede demostrar que bajo la hiptesis nula, el siguiente estadstico sigue una distribucin
F, con q grados de libertad en el numerador y (N-k) grados de libertad en el denominador.
( r' r nr' nr ) / q
nr' nr /( N knr )
Donde:
r , nr son los errores estimados del modelo restringido y no restringido, respectivamente.

k nr corresponde al nmero de parmetros estimados del modelo no restringido
La estimacin del modelo no restringido corresponde a la del modelo original, mientras que la
estimacin de los resultados del modelo restringido proviene de aquella estimacin donde una
vez introducidas en el modelo las restricciones se lleva a cabo la estimacin.
La regla de decisin establece que si el estadstico supera los valores crticos, se rechaza la
hiptesis nula: Si : F >
Fq , N k
n r ,
, entonces se rechaza Ho.
40
Ejemplo: La funcin de produccin Cobb-Douglas

La funcin de produccin de Cobb-Douglas se escribe en trminos estocsticos de la siguiente
manera:
Yi 0 Li 1 K i 2 e i
aplicando logaritmos:
Ln(Yi ) Ln( 0 ) 1 Ln( Li ) 2 Ln( K i ) i
Ln(Yi ) 0* 1 Ln( Li ) 2 Ln( K i ) i
a) Estimacin: Para estimar los parmetros de este modelo, podemos utilizar MCO.
Utilizando notacin matricial:
Ln( L )
X'X
Ln( L )
( Ln( L ))
Ln( Ki )
Ln( Ki ) Ln( Li )
Ln( K
Ln( K
Ln(Y
) Ln( Li )
( Ln( Ki ))
Ln(Y ) Ln( L )
Ln(Y ) Ln( K )
X'y
De esta manera:
( X ' X ) 1 ( X ' y )
Var ( ) 2 ( X ' X ) 1
'
N k
b) Pruebas de hiptesis:
Existen rendimientos constantes a escala... o en otras palabras 1 2 1 ?
Existen diferentes formas de probar esta hiptesis.
41
i)
Prueba t
H 0 : 1 2 1 1 2 1 0 3 0
H 0 : 1 2 1 1 2 1 0 3 0
t
3
3 0 1 2 1
Var ( 1 ) Var ( 2 ) 2Covar ( 1 , 2 )

3
En este caso, la regla de decisin es:

Si t t N k , / 2 RH 0
3
ii)
A travs del test F de un conjunto de restricciones lineales. En este caso:
R 0 1 1 r 1
y se construye el estadstico de prueba F.
( R r )' ( R ( X ' X ) 1 R ' ) 1 ( R r ) / q
' /( N k )
En este caso, notar que q=1.

La regla de decisin es la siguiente
Si F F1, N K ,
iii)
RH 0
A travs del modelo no restringido y el modelo restringido
El modelo no restringido es el modelo original:

Ln(Yi ) 0* 1 Ln( Li ) 2 Ln( K i ) i
42
Se estima dicho modelo y se calcula la suma de residuos al cuadrado de este modelo

denominada: nr ' nr
El modelo restringido se lo determina imponiendo al modelo original, la restriccin:
Ln(Yi ) 0* 1 Ln( Li ) 2 Ln( K i ) i
Ln(Yi ) 0* 1 Ln( Li ) (1 1 ) Ln( K i ) i
Ln(Yi ) Ln( K i ) 0* 1 ( Ln( Li ) Ln( K i )) i
La ltima ecuacin la estimamos y obtenemos la suma de residuos del modelo restringido:
r ' r
Temas adicionales de la estimacin MCO
Prediccin de un vector de valores de la variable endgena
Queremos predecir la evolucin de la variable dependiente del modelo a lo largo de un nmero
T1 de perodos.
La proyeccin a realizarse de la variable dependiente sobre T1 de perodos es
y f ' ( y T 1 , y T 2 ,..., yT T )
1
que en trminos de las variables explicativas del modelo puede
expresarse como:
y f X F T f
Donde X F es una matriz de dimensin T1 xk que contiene los valores de cada una de las
variables para cada momento en el perodo o ventana de proyeccin. f es el vector que

contiene los errores correspondientes asociados a la proyeccin (es de dimensin T1 x1 ).
T es el vector de parmetros usando T observaciones (a ser estimado en la ventana de

estimacin).
y
Ntese que cuando T1 1 , X F es una matriz de dimensin 1xk (vector fila) y f es un escalar
(En el modelo de regresin simple se analiz este caso).
La prediccin media en este caso es:
43
y f X F T
Donde T es la estimacin del vector de parmetros utilizando T observaciones.
El valor esperado de la variable dependiente, extendiendo al perodo de proyeccin los

supuestos vistos del modelo lineal clsico, es:
E ( y f ) E ( X F T ) X F T
La varianza de la prediccin media es:
Var ( y f ) Var ( X F T ) E ( X F T E ( X F T ))( X F T E ( X F T ))'
Var ( y f ) E X F ( T T )( T T )' X F ' X F E ( T T )( T T )' X F '

Var ( y f ) 2 X F ( X T X T ) 1 X F '
Donde X T es la matriz de las variables explicativas del modelo tomando las T observaciones
del mismo.
Si el trmino de error del modelo economtrico tiene una distribucin normal, entonces el
vector de errores de prediccin tambin seguir una distribucin normal:
y F X F T N ( X F T , 2 X F ( X T ' X T ) 1 X F ' ) N ( X F T ,V1 )
Para la prediccin individual, se define el error de prediccin:
e y y f y f X F T f X F T
f
E (e y ) E ( y f y f ) E ( X F T f X F T ) E ( X F T ) E ( f ) E ( X F T )
f
E (e y ) X F T X F T 0
f
La varianza del error de prediccin es:
Var (e y ) Var ( X F ( T T ) f ) Var ( X F ( T T )) Var ( f )

f
Var (e y ) 2 X F ( X T X T ) 1 X F ' 2 I
f
Donde se ha utilizado el resultado de la varianza de la prediccin media.

Asimismo, se toma en cuenta que el vector de perturbaciones en el perodo de proyeccin es
independiente de los parmetros estimados con T observaciones.
El vector de errores de prediccin tambin seguir una distribucin normal:
44
X N (0, 2 ( I X F ( X T ' X T ) 1 X F ' )) N ( X , V2 )

Cuando se quiere predecir un perodo adelante, las frmulas se simplifican.
La prediccin media es:
y t 1 x t 1 ' T
y
x '
Donde: t 1 es la prediccin media (un escalar) y, t 1 es un vector fila de los valores de las
variables explicativas en el perodo t+1.
La prediccin individual coincide con la prediccin individual.
La varianza de la prediccin media es:
Var ( y t 1 ) 2 x t 1 ' ( X T X T ) 1 x t 1
y la varianza del error de prediccin es:
Var (e y ) 2 (1 x t 1 ' ( X T X T ) 1 x t 1 )
t 1
El intervalo de confianza para la prediccin media es:
Pr xt 1 t t / 2 var yt 1 xt 1 t xt 1t t / 2 var y t 1 1
Para la prediccin individual es:
Pr xt 1 ' t t / 2 var e y
t 1
t 1
' t t 1 xt 1 ' t t / 2 var e y
Donde para generar la distribucin t-student se utiliza la estimacin de
t 1
2 : 2
Evaluacin predictiva del modelo

Habiendo estimado el modelo con T observaciones (ventana de estimacin), despus de haber
transcurrido T1 observaciones ms (ventana de proyeccin), se dispondr de estas ltimas
observaciones para evaluar la bondad de las predicciones que se hicieron.
Se define la Raz del Error Cuadrtico Medio, RECM:
RECM
1
T1
T T1
j T 1
yj
Mientras ms chico el RECM, mejor capacidad predictiva tiene nuestro modelo.
45
Otro estadstico similar es el denominado coeficiente de desigualdad de Theil.
1
T1
1
T1
T T1
( y
j T 1
T T1
y 2j
j T 1
y j )2
1
T1
T T1
j T 1
2
j
46
ERRORES DE ESPECIFICACIN
Omisin de variables relevantes e inclusin de variables irrelevantes:
Planteamiento General
Sea el modelo:
y X
E ( ) 0
Var ( ) 2 I
Los supuestos del modelo clsico se mantienen pero el investigador estima errneamente:
y X 0 0 0
X0
es una matriz de dimensin Txp

0 es una matriz de dimensin px1
0 es una matriz de dimensin Tx1
La estimacin MCO de este modelo ser:
0 ( X 0 ' X 0 ) 1 X 0 ' y ( X 0 ' X 0 ) 1 X 0 ' ( X ) ( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 '

Tomando esperanzas:
E ( 0 ) E (( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 ' ) ( X 0 ' X 0 ) 1 X 0 ' X
Por tanto, concluimos que el estimador es sesgado. Entonces, en el caso general tendremos
que cuando se cometen errores de especificacin (de los tipos mencionados) el estimador
MCO ser un estimador sesgado.
En caso de no haber cometido errores de especificacin X 0 X , el estimador ser insesgado
(resultado visto anteriormente):
E ( 0 ) ( X 0 ' X 0 ) 1 X 0 ' X ( X ' X ) 1 X ' X
Con errores de especificacin, la varianza de los errores tambin ser sesgada.

Veamos:
0 ' 0 y ' M 0 y ( X )' M 0 ( X )

' M 0 ' X ' M 0 X ' M 0 X ' X ' M 0
Donde, de manera similar:
47
M 0 I T X 0 ( X 0 ' X 0 ) 1 X 0 '
Tomando esperanzas:
E ( 0 ' 0 ) E ( ' M 0 ' X ' M 0 X ' M 0 X ' X ' M 0 )
E ( ' M 0 ) E ( ' X ' M 0 X )
E ( ' M 0 ) ' X ' M 0 X
2Tr ( M 0 ) ' X ' M 0 X
2 (T p ) ' X ' M 0 X
Por tanto, la varianza estimada de los errores (cometiendo errores de especificacin) es
sesgada.
'
' X ' M 0 X
1
E( 0 0 )
E ( 0 ' 0 ) 2
Tp
Tp
Tp
Si los errores de especificacin no hubieran sido cometidos:
T p T k
Y
' X ' M 0 X 0
ya que:
' X ' ( I X ( X ' X ) 1 X ' ) X ' X ' ( X X ( X ' X ) 1 X ' X ) ' X ' ( X X ) 0
Por tanto la varianza estimada de los errores ser insesgada cuando no se cometen errores de
especificacin. Se puede demostrar que el trmino ' X ' M 0 X es una matriz semidefinida
positiva. Ello implica que adems de ser sesgada la varianza (cuando se cometen errores de
especificacin), ser ineficiente respecto a una situacin en la cual no se hubieran cometido
errores de especificacin.
Omisin de variables relevantes
Sea la matriz X particionada de la siguiente manera
X X0 ;Z
Y se estima el modelo:
48
y X 0 0 0
En lugar de estimar el modelo verdadero:
y X
E ( ) 0
Var ( ) 2 I
Donde:
X0
es una matriz de dimensin Txr

Z es una matriz de dimensin Tx(k-r)
X es una matriz de dimensin Txk
Habamos visto que:
0 ( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 '

Si:
( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 ' X 0 ; Z
Que es, por propiedad de matrices particionadas es igual a:
( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 ' X 0 ; Z ( X 0 ' X 0 ) 1 X 0 ' X 0 ; ( X 0 ' X 0 ) 1 X 0 ' Z
( X 0 ' X 0 ) 1 X 0 ' X I r ; ( X 0 ' X 0 ) 1 X 0 ' Z

Por tanto:
0 I r ; ( X 0 ' X 0 ) 1 X 0 ' Z ( X 0 ' X 0 ) 1 X 0 '

Pero:
' 0' ; z'
Tomando valor esperado y utilizando propiedades de matrices particionadas:
E ( 0 ) E I r ; ( X 0 ' X 0 ) 1 X 0 ' Z 0' ; z' '( X 0 ' X 0 ) 1 X 0 '

E ( 0 ) 0 ( X 0 ' X 0 ) 1 X 0 ' Z z
Donde el sesgo es:

( X 0 ' X 0 ) 1 X 0 ' Z z
49
La varianza estimada de los errores tambin ser sesgada:

E(
0 ' 0
' X ' M 0 X
' Z ' M 0 Z z
1
)
E ( 0 ' 0 ) 2
2 z
T r
T r
T r
T r
Donde:
' X ' M 0 X z ' Z ' M 0 Z z
T r
T r
Veamos:
X
X
X
X
X
X
' X ' M 0 X 0' ; z' X ' M 0 X 0' ; z' '

' X 'M0
' X 'M0
' X 'M0
'
0
; z'
'
0
; z'
'
0
; z'
0
0
0
; Z ' M X ; M Z ; '
; Z ' 0; M Z ; ' 0;
; Z ' M 0 X 0 ; Z 0' ; z' '
0
'
0
'
0
'
z
'
z
' Z ' M 0 Z z
' X ' M 0 X z ' Z ' M 0 Z z

Por tanto, la varianza ser sesgada (como vimos anteriormente con sesgo positivo). Es decir,
ineficiente. Ejemplo: sea el modelo verdadero:
Yi 1 2 X 2i 3 X 3i i
y se estima:
Yi 1 2 X 2i i
La estimacin MCO de 2 es:
2
Pero si:
x y
x
2i
2
2i
y i 2 x 2 i 3 x 3i ( i u )
Entonces:
2i
( 2 x 2i 3 x3i ( i u ))
2
2i
x 2i x3i x 2i ( i u ))
2
2i
Tomando esperanzas:
50
3 x2i x3i x2i ( i u )) 3 x2i x3i

E ( 2 ) E 2
2
x22i
x22i
El sesgo es:
Sesgo ( 2 )
3 x 2 i x 3i
2
2i
Aplicando el operador plim, tambin se puede demostrar que el estimador es inconsistente.

Recordar que la varianza tambin es sesgada (ineficiente).
Cmo detectar el problema de variables omitidas?
Grficamente
Examinar residuos del modelo estimado y buscar patrones sistemticos, los cuales son
sntomas de omisin de variables. Problemas de autocorrelacin o heteroscedasticidad pueden
deberse a variables omitidas.
Durbin Watson
Pasos
1) Estimar el modelo y obtener los residuos estimados.
2) Ordenar los residuos en funcin de la variable que se cree est omitida
3) Calcular el estadstico Durbin-Watson.
4) Si se detecta autocorrelacin positiva, ello es evidencia de variable omitida (utilizar la
prueba DW modificada ver Gujarati).
Prueba de Ramsey-Reset
Pasos de la Prueba
1) Estimar el modelo
2) Volver a estimar el modelo e incluir trminos polinmicos de la variable dependiente
estimada.
3) Bajo la hiptesis nula de modelo bien especificado, el estadstico F, sigue una
distribucin F de Fisher con q (nmero de regresores adicionados en la regresin
N k 2)
estimada en el paso 2) grados de libertad en el numerador y
grados de libertad
en el denominador:
( R22) R12) ) / q
F
(1 R22) ) /( N k 2 ) )
Donde:
R12)
R
2
2)
k 2)
es el
es el
R2
R
del modelo original, estimado en el primer paso.
del modelo estimado en el segundo paso.
es el nmero de regresores en la estimacin del segundo paso.
51
Prueba de Multiplicadores de Lagrange

De la misma manera que en la prueba anterior
Pasos de la Prueba
1) Estimar el modelo original
2) Llevar a cabo una regresin entre los residuos estimados en la regresin original y las
variables que se presume deberan estar incluidas en el modelo.
TR 2
3) Bajo la hiptesis nula de modelo bien especificado, el estadstico
, sigue
asintticamente una distribucin chi-cuadrado con grados de libertad iguales al nmero
de regresoras incluidas en el paso 2.
Donde:
R2
El
corresponde a la estimacin del paso 2.
Inclusin de variables irrelevantes
Sea la matriz X particionada de la siguiente manera
X0 X;Z
Y se estima el modelo:
y X 0 0 0
En lugar de estimar el modelo verdadero:
y X
E ( ) 0
Var ( ) 2 I
Donde:
X 0 es una matriz de dimensin Tx(s+k)
Z es una matriz de dimensin T x s

X es una matriz de dimensin T x k
Habamos visto que:
0 ( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 '

Si:
( X 0 ' X 0 ) 1 X 0 ' X 0 I s k
Entonces, la matriz puede ser particionada de la siguiente manera:
52
1
0
1
(X0 ' X 0 ) (X 0 ' X0 )
0
0 0 ... 0
0 0
Ik
1 0 ... 0 0 sxk
0 1 ... 0

... 0 0 ... 1
0 0 ...
1 0 ...
1 ...
...
...
...
0 kxs
Is
Se tiene que:
( X 0 ' X 0 ) 1 ( X 0 ' X 0 ) ( X 0 ' X 0 ) 1 ( X 0 ' X ; Z ) ( X 0 ' X 0 ) 1 X 0 ' X ; ( X 0 ' X 0 ) 1 X 0 ' Z
( X 0 ' X 0 ) 1 X 0 ' X
Ntese que la primera parte de la particin
tiene dimensin ( s k ) xk , que
Ik
0
coincide con la dimensin de sxk . Por tanto:
I
( X 0 ' X 0 ) 1 X 0 ' X k
0 sxk
Reemplazando en la definicin de
I
0 ( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 ' k ( X 0 ' X 0 ) 1 X 0 '
0 sxk
Tomando valor esperado
E 0 E k ( X 0 ' X 0 ) 1 X 0 '
0 sxk
De manera extendida:
...
E

k 1

k s
2
...
53
Se concluye que los estimadores del modelo estimado sern insesgados. El valor esperado de
los estimadores que pertenecen al modelo verdadero es igual al verdadero valor poblacional en
tanto que el valor esperado de los estimadores que no estn en el modelo verdadero es igual a
cero. La varianza estimada de los errores ser insesgada:
E(
0 ' 0
' X ' M 0 X
1
)
E ( 0 ' 0 ) 2
T (k s )
T (k s )
T (k s )
Pero:
' X ' M 0 X
0
T (k s )
Demostracin:
Ik
0 s* x
M 0 X ( I X 0 ( X 0 ' X 0 ) 1 X 0 ' ) X X X 0 ( X 0 ' X 0 ) 1 X 0 ' X X X o
Pero:
Ik
X
0 sxk
X0
La manera ms simple de verlo es a travs de un pequeo ejemplo. Sea el modelo verdadero:

Yt 1 2 X t t
Pero se estima:
Yt 1 2 X t 3 Z t t
Las matrices sern:

1 X1
X0
1 XT
Z1
1 X1
1 0
X ;
0 1
0 s*k
1 XT
0 0
;
Z T
Ik
Donde claramente se puede apreciar que:

Ik
X
0 sxk
X0
Finalmente, cabe sealar que para detectar problemas de variables irrelevantes basta
considerar las pruebas t y F rutinarias.
54
Errores de Medida
En la variable dependiente del modelo
Sea el siguiente modelo verdadero:
Yt 1 2 X t t
*
*
Pero, problemas de medicin, se utiliza Yt en vez de Yt donde Yt Yt t y t es una
perturbacin estocstica con valor esperado igual a cero, homoscedstica, con varianza igual a
2 y no autocorrelacionada. Tampoco est correlacionada con la perturbacin estocstica del
modelo original. Reemplazando la variable dependiente, el modelo estimable se deduce de la

siguiente manera:
Y t* t 1 2 X t t
Y t* 1 2 X t t t
Y t* 1 2 X t v t
El error de medida, producir ineficiencia de los estimadores. La varianza de la perturbacin

del modelo estimado tendr dos componentes: la varianza del modelo original y la varianza
derivada del error de medicin. Es decir:
v2 2 2
Sin embargo, pese a esta prdida de eficiencia, la estimacin MCO genera estimadores MELI
(MEI y consistentes suponiendo normalidad de los errores del modelo).
Errores de medida en la(s) variable(s) explicativa(s) del modelo
Sea el siguiente modelo verdadero:
Yt 1 2 X t t
*
*
Pero, problemas de medicin, se utiliza X t en vez de X t donde X t X t t y t es una
perturbacin estocstica con valor esperado igual a cero, homoscedstica, con varianza igual a
2 y no autocorrelacionada. Al igual que t tampoco est correlacionada con la perturbacin
estocstica del modelo original. Reemplazando la variable explicativa, el modelo estimable se

deduce de la siguiente manera:
55
Yt 1 2 X t t
Yt 1 2 ( X t* t ) t
Yt 1 2 X t* 2 t t
Yt 1 2 X t* t
En este caso el error de medida, tendr consecuencias ms serias. Adems de producir
ineficiencia de los estimadores, la estimacin por MCO ser sesgada e inconsistente. Igual que
en el caso anterior, la varianza de la perturbacin del modelo estimado tendr dos
componentes: la varianza del modelo original y la varianza derivada del error de medicin. Es
decir:
2 2 22 2
La variable explicativa del modelo, estar correlacionada con la perturbacin estocstica del
modelo, lo cual viola uno de los supuestos importantes del modelo lineal clsico. Veamos:
Cov( X t* , t ) E ( X t* E ( X t* ))( t E ( t )) E ( t )( 2 t t )
Donde se han utilizado los siguientes resultados intermedios:

X t X t* t X t* X t t E ( X t* ) E ( X t t ) X t X t* E ( X t* ) t
t 2 t t E ( t ) E ( 2 t t ) 0 t E ( t ) 2 t t
Para resolver el problema de sesgo e inconsistencia del estimador, se recurre a otro mtodo de
estimacin. Uno muy conocido es el denominado mtodo de variables instrumentales (tema a
ser visto ms adelante).
56
PRUEBAS DE ESTABILIDAD
A continuacin veremos una serie de pruebas de estabilidad aplicables a los parmetros del
modelo estimado.
Prueba de cambio estructural de Chow
Esta prueba es utilizada cuando el investigador sospecha que a partir de un momento en el
tiempo o para un conjunto de observaciones, los parmetros del modelo han cambiado (son
diferentes).
Algunos ejemplos de estos cambios podran ser: el consumo de la economa en perodos
normales versus en perodos de guerra, la demanda diferenciada de un bien en funcin a cierta
cualidad (sexo, educacin, edad, etc.), cambios en las variables debido a cambios
institucionales o en la regulacin, etc.
Metodologa
En una muestra de series de tiempo supngase que se sospecha de un cambio estructural a
partir del perodo t1 1 .
Para verificar la sospecha definamos el modelo restringido y no restringido:
Modelo restringido
y t xt
t 1,2....t1 , t1 1,......T
Modelo no restringido
y t xt
y t xt
t 1,2....t1
t t1 1,......T
t1 observacio nes
t 2 observacio nes
Ntese que bajo la hiptesis nula .

Es decir, diferencias en los vectores que conforman los parmetros del modelo seran
evidencia del cambio estructural.
La hiptesis nula plantea que no existe tal cambio.
La verificacin de la hiptesis nula a travs de esta prueba comprende una serie de pasos:
1) Estimar el modelo restringido y obtener los residuos del modelo y calcular la suma de
los residuos al cuadrado, denominndose al resultado SRC 1 .
57
Ntese que en este caso los grados de libertad de

t1 t 2 k T k
SRC 1 son iguales a
2) Estimar las dos ecuaciones del modelo no restringido, cuyas sumas de residuos al
cuadrado se denominan SRC 2 y SRC 3 . SRC 2 tiene t1 k grados de libertad.
En tanto que SRC 3 tiene t 2 k .
3) Calculamos SRC 4 SRC 2 SRC 3 que tiene t1 t 2 2k T 2k grados de libertad.
4) Luego, calculamos SRC 5 SRC 1 SRC 4 que como puede comprobarse de manera
simple, tiene k grados de libertad.
5) Bajo la hiptesis nula de que no existe cambio estructural, el siguiente estadstico,
tiene una distribucin F con k grados de libertad en el numerador y T 2k grados de
libertad en el numerador:
6) La regla de decisin establece que si
SRC 5 / k
SRC 4 / T 2k
F Fk ,T 2 k ,
se rechaza la hiptesis nula.
Otros contrastes de estabilidad

Una serie de contrastes son tiles para verificar la homogeneidad temporal del modelo (es
decir cuan estables son empricamente los parmetros de los modelos presentados).
Son las denominadas pruebas CUSUM y CUSUMQ, que se construyen en base a los residuos
recursivos del modelo.
Sea la siguiente definicin del residuo recursivo:
t y t x't t 1
Donde t no es ms que el error de proyeccin en t calculado en base a la estimacin del
vector (fila) de parmetros que utiliza t-1 observaciones, t 1 . y t es la observacin en t de la

variable dependiente y xt ' es el vector de observaciones de las variables explicativas en t.
La varianza de prediccin es:
58
Var ( t ) 2 (1 xt' ( X t 1 ' X t 1 ) 1 xt )

Donde X t 1 es una matriz de dimensin (t-1)xk formada por las (t-1) observaciones recogidas
en la muestra. Se define finalmente el residuo recursivo normalizado:
t
~t
(1 xt' ( X t 1 ' X t 1 ) 1 xt )
~ N (0, 2 )
Bajo la hiptesis de estabilidad, t
y que este error es independiente de
~
s s t , el estadstico CUSUM ( Wt ) permite contrastar la hiptesis de estabilidad.
Se construye de la siguiente manera:
Wt
r k 1
~r / ~ ~
1
T k
r k 1
( ~r ) 2
1
T k
r k 1
Se puede demostrar que bajo la hiptesis nula de estabilidad, el estadstico Wt tiene una
distribucin normal con valor esperado igual a cero y varianza igual al nmero de residuos
W
acumulados. Se construyen bandas de confianza para t mediante lneas rectas que unen los
puntos k , a T k y T ,3a T k donde al 95% de confianza donde se ha calculado
a=0.948.
Al 99% el clculo corresponde a a=1.143. Se rechaza la hiptesis nula si Wt traspasa las
bandas.
El CUSUMQ se construye en base a los cuadrados de los residuos normalizados:
t
St
2
r
2
r
r
T
r
Cada trmino de la sumatoria tiene distribucin Ji-cuadrado con un grado de libertad. Dado
tk
E (S t )
T k
que son independientes, se puede demostrar que
El contraste consiste en dibujar S t , as como las lneas que limitan su banda de confianza.
El intervalo consiste en:
59
st c0
Los valores de
c0
t k
T k .
pueden encontrarse en la tabla A-10 de Novales.
Si el estadstico sale fuera de las bandas construidas, ello es seal de inestabilidad.

Variables dummy
Una variable dicotmica o dummy toma el valor de uno para alguna de las observaciones para
indicar la existencia de un efecto o la pertenencia a un grupo y cero para las observaciones
restantes que no presentan dicho efecto o no pertenecen al grupo.
Las variables dummy son un medio conveniente para tomar en cuenta cambios discretos en la
funcin estimada.
Ejemplos: efecto de la educacin sobre los salarios, efecto del sexo en la demanda de un bien,
cambios estructurales, o fenmenos puntuales (crisis).
En este ltimo caso, la inclusin de la dummy tiene el efecto de borrar la observacin
correspondiente al valor 1 de la variable dummy utilizada en el cmputo de los estimadores y
sus varianzas (no en el R2)
La forma de introducir una variable dummy es:
yi xi ' Di i
Di es la variable dummy que toma el valor de 1 cuando se cumple la existencia de un efecto o
la pertenencia a un grupo y de 0 cuando no es as.
es el parmetro a estimar que acompaa a la variable dummy.

En un modelo, puede ser necesario introducir varias categoras (efectos o grupos).
El ejemplo ms conocido es aqul donde es necesario tomar en cuenta la estacionalidad de las
series (trimestrales en el ejemplo dado a continuacin).
C t 1 1 Yt 1 D1t 2 D2 t 3 D3 t t
Donde se define la variable dummy Dit que toma el valor de 1 cuando la observacin
corresponde al i-avo trimestre y 0 cuando no es as (Ntese cuando todas las dummy son
iguales a 0, la observacin corresponde al cuarto trimestre).
60
Otra forma alternativa de representar el modelo anterior, garantizando que no existan

D
problemas de multicolinealidad exacta, consiste en que al introducir la variable 4 t (para
representar el cuarto trimestre) se elimine la constante del modelo.
En caso contrario, se produciran problemas de multicolinealidad exacta.
De esta forma:
C t 1 Yt 1 D1t 2 D2 t 3 D3 t 4 D4 t t
Podemos probar la relevancia de las variables dummy llevando a cabo pruebas t y F sobre los
coeficientes estimados correspondientes a dichas variables.
Ntese que en el anterior ejemplo, las dummy afectan el valor del intercepto.
Podran haberse introducido afectando a la pendiente o de tal manera de afectar tanto al
intercepto como a la pendiente.
Tambin podemos incorporar variables dummy para representar distintas caractersticas.
Por ejemplo, una categora para tomar en cuenta la estacionalidad de los datos y otra para
considerar el nivel de educacin.
La incorporacin de las variables dummy es flexible.
Por ejemplo, para explicar el nivel de salarios Wi adems del conjunto de variables
explicativas, sean tres niveles de educacin a ser representados por variables dummy (nivel
inferior, nivel intermedio y nivel superior).
Podemos definir las variables dummy de la siguiente manera: Dint con valor 1 si el mximo
nivel de educacin por la i-ava observacin obtenido es el nivel intermedio y cero en otro caso
D
y sup con valor 1 si el mximo nivel de educacin obtenido es educacin superior y cero en
otro caso.
El modelo en este caso es:
W i x i' int Dint,i sup Dsup,i i
Alternativamente, las variables podran haberse definido de la siguiente manera: Dint con
D
valor 1 si la observacin tiene nivel de educacin intermedia y cero en otro caso y sup con
valor 1 si la observacin tiene nivel de educacin superior y cero en otro caso (ntese que
alguien que tiene educacin superior, tambin tiene educacin intemedia y educacin inferior).
61
El modelo en este caso es igual al anterior pero la interpretacin es diferente. int mide el
efecto incremental de tener educacin intermedia y sup mide el efecto incremental de tener
educacin superior.
En el modelo anterior, las deltas medan los efectos totales de cada nivel de educacin sobre el
nivel base.
Utilizando variables dummy es posible construir hacer una regresin por secciones.
En un modelo de regresin simple se tiene un punto de quiebre en
cambio en la pendiente y en el intercepto).
X*
(que determina un
El modelo utilizando variables dummy se representa as:

Yi 1 2 X i 1 Di 2 X i Di i
Donde Di es una dummy que toma el valor 1 a partir de X * .
Se tiene que en el punto X * se cumple que:
1 2 X * 1 1 2 X * 2 X *
Por tanto,
1 2 X *
Reemplazando en el modelo original:
Yi 1 2 X i 2 X * Di 2 X i Di i
Yi 1 2 X i 2 Di ( X i X * ) i
62
Este ejemplo tambin nos da pautas de que las variables dummy pueden ser utilizadas para
probar la existencia de cambios estructurales.
Finalmente, se pueden construir modelos combinando varias caractersticas.
Por ejemplo, en el modelo de salarios presentado anteriormente (en su primera versin),
incluimos la variable dummy sexo S i que toma el valor de 1 si la observacin i-ava es mujer y
0 en otro caso:
Wi x i int Dint,i sup Dsup,i 1 S i i
En este modelo, el efecto incremental del sexo es el mismo independiente del nivel de
educacin.
Este supuesto podra no ser realista; es de esperar que cambiar de sexo tendr mayores efectos
en el salario en funcin al nivel de educacin.
Estos son efectos de interaccin en el modelo, que pueden ser incorporados reformulando el
modelo:
Wi x i int Dint,i sup Dsup,i 1 S i 1 Dint,i S i 2 Dsup,i S i i
63
Multicolinealidad
En el modelo de regresin y X suceden problemas de multicolinealidad cuando una de
las variables explicativas del modelo se puede escribir de manera exacta o aproximada como
una combinacin de alguna o de algunas de las variables explicativas restantes del modelo (o
de todas).
En el caso de multicolinealidad exacta existe una solucin distinta de la trivial para la
siguiente ecuacin:
X 1i 2 X 2i 3 X 3i 4 X 4i ... k X ki 0 i 1..N
donde para representar la constante, podemos decir X 1i 1 i 1..N .
Cabe recordar que la solucin trivial para el sistema es: 2 3 ... 0
En el caso de multicolinealidad aproximada existe una solucin distinta de la trivial para la
siguiente ecuacin:
X 1i 2 X 2i 3 X 3i 4 X 4i ... k X ki vi 0 i 1..N
donde
vi
es una perturbacin estocstica.
En este caso decimos que una de las variables explicativas puede ser escrita como una
combinacin lineal aproximada de una o de varias de las otras variables explicativas del
modelo.
Esta variable tambin responde a la perturbacin estocstica
aleatoria).
vi (de manera puramente
Multicolinealidad exacta
Cuando existe multicolinealidad exacta la matriz X deja de tener rango completo igual a k.
El rango de la matriz X es menor a k.
Ello implica, por una propiedad de matrices, que tambin la matriz X ' X tiene un rango
menor a k.
Recordemos que la solucin del modelo de regresin existe siempre que
existe siempre que sea una matriz de rango completo igual a k.
( X ' X ) 1
exista y
64
Por tanto, la consecuencia del problema de multicolinealidad exacta es que la solucin del
( X ' X ) 1 X ' y
modelo, dada por
no existe dado que ( X ' X ) es singular.
Veamos un ejemplo sencillo:
Yi X i i
i 1...N y se cumple X i
En este caso, la variable explicativa es una combinacin lineal del 1 que acompaa a la
1
Xi 1
constante del modelo:
En este caso, se observa que la matriz X es:
1 X1
X
1 XT
1

1
El rango de la matriz X es igual a 1.

Recordemos que el rango de una matriz es el nmero de columnas linealmente independientes.
Formando la matriz ( X ' X ) :
T T
2
T T
X'X
Vemos que su determinante es igual a 0.

det( X ' X ) T 2 2 T 2 2 0
Es decir es una matriz singular por tanto
( X ' X ) 1
no existe.
La solucin de mnimos cuadrados ordinarios no existe.

Veamos un segundo ejemplo para el modelo de dos variables explicativas.
Yi X 2i 3 X 3i
i 1..N
donde el problema de multicolinealidad exacta se da porque

constante conocida.
X 2i cX 3i
donde c es una
En este caso, la matriz XX es:

65
N
X ' X c X 3i
X 3i
c X 3i
c 2 X 3i
c X 32i
X
c X
X
3i
2
3i
2
3i
se puede observar claramente que la tercer columna es una combinacin lineal de la segunda
columna.
Ello implica que el rango de la matriz es igual a 2, y por tanto la matriz inversa de
existe.
(X ' X )
no
Sin embargo, ntese que el modelo puede ser en parte estimado. Introduciendo la relacin
entre las dos variables explicativas del modelo, se tiene que ste queda de la siguiente manera:
Yi cX 3i 3 X 3i i 1..N
Yi ( c 3 ) X 3i
En esta transformacin del modelo, ya no existen problemas de multicolinealidad.
Sin embargo, slo se puede estimar de manera nica la constante del modelo. Asimismo se
( c 3 )
estima la combinacin lineal
.
Condicionado en el valor de un parmetro del modelo que acompaa a una de las variables
explicativas se puede estimar el otro parmetro que va junto a la otra variable explicativa.
Las varianzas de cada uno de los modelos tampoco se pueden estimar de manera nica.
Cmo se detecta el problema de multicolinealidad exacta?
La forma de detectar este problema es muy sencilla pues la solucin de mnimos cuadrados no
existe.
Cuando existe este problema es generalmente atribuible a una mala construccin del modelo
por parte del investigador (nmero insuficiente de observaciones) o la trampa de la variable
dicotmica.
Multicolinealidad aproximada
La multicolinealidad aproximada tambin es un problema. Pero a diferencia de la
multicolinealidad exacta no es tan fcil de detectar.
66
En el caso de la multicolinealidad aproximada, la matriz X y la matriz ( X ' X ) pese al

problema de la multicolinealidad, tienen rango completo igual a k y por tanto la matriz
( X ' X ) 1
( X ' X ) 1 X ' y
existe as como la solucin de mnimos cuadrados ordinarios:
Sin embargo, decimos que la solucin est mal definida.
Cuando existan problemas de multicolinealidad exacta, recordemos que el determinante de
( X ' X ) era igual a cero.
En el mismo sentido, cuando existen problemas de multicolinealidad aproximada el
determinante de ( X ' X ) es casi igual a cero.
Establezcamos la siguiente analoga utilizando variables escalares para establecer por qu est
mal definida la solucin.
Sea:
a *b z
a
0
.
001
b 5000 z 5
Si
Suponiendo un pequesimo cambio en a de 0.001, por ejemplo, a 0.002 .

Entonces, para mantener el resultado de z 5 , se debe producir un cambio sustancial en b, de
5000 a 2500.
Es decir:
a *b z
0.001 * 5000 5
0.002 * 2500 5
Bajo un razonamiento similar aplicado a matrices, tenemos que en la derivacin del estimador
de mnimos cuadrados ordinarios habamos llegado a:
( X ' X ) X ' y
dado que el determinante de (XX) es prximo a 0 (es el trmino a en la expresin anterior),
se concluye que pequeos cambios en esta matriz, producirn grandes cambios en (es
similar al trmino b en la expresin escalar), si es que se decide mantener la matriz resultante
constante, es decir X ' y constante ( es similar al trmino z en la expresin escalar).
Resumiendo, se dice que la solucin est mal definida porque cuando existen problemas de
multicolinealidad aproximada, pequeos cambios en la matriz ( X ' X ) producirn cambios
importantes en los parmetros estimados del modelo.
67
Es decir, pequeas variaciones en las observaciones de las variables explicativas recogidas en

una muestra tendrn el potencial de cambiar drsticamente el valor de los parmetros
estimados.
Este no es un resultado deseable para un estimador ya que deja dudas sobre si los parmetros
estimados se acercan lo suficiente a los verdaderos valores poblacionales.
La multicolinealidad implica que la matriz de varianzas y covarianzas de sea grande ya que

Var ( ) 2 ( X ' X ) 1 ( X ' X ) 1
en
,
es, grande.
Siguiendo con la analoga anterior tenemos que si a 0 1 / a se vuelve grande.
Algo similar ocurre con
( X ' X ) 1
En resumen, tenemos que cuando existen problemas de multicolinealidad aproximada la

estimacin por MCO es posible sin embargo se producen dos consecuencias:
La solucin est mal definida y,
La matriz de varianzas y covarianzas de los estimadores es grande, lo cual produce

ineficiencia en los estimadores.
Ms especficamente, las consecuencias son:

a) Sin bien los estimadores MCO son MELI, stos presentan varianzas y covarianzas
grandes que hacen difcil la estimacin precisa.
b) Debido a que las varianzas son grandes, los intervalos de confianza son grandes y se
vuelve ms fcil no rechazar la hiptesis nula de no significancia individual.
R2
c) Pese al problema de multicolinealidad, el
no es necesariamente pequeo.
De hecho uno de los sntomas tpicos de la multicolinealidad es que se encuentran
pruebas de significancia individual junto a una bondad de ajuste alta.
d) Los estimadores MCO y sus errores estndar son sensibles a pequeos cambios en la
informacin.
Detectar la multicolinealidad aproximada no es una tarea fcil.
A disposicin del investigador solo existen un conjunto de reglas prcticas:
a) Anlisis de correlaciones simples y parciales entre las variables explicativas del
modelo.
68
b) Pruebas t y significancia global del modelo.

c) Regresiones auxiliares.
d) El ndice de condicin.
a)
Anlisis de correlaciones simples y parciales

Las correlaciones que miden el grado de asociacin entre variables, pueden ser utilizadas
cuando se sospecha de problemas de multicolinealidad aproximada.
Cuando se verifican altas correlaciones entre variables explicativas del modelo ello es
evidencia de multicolinealidad (mayores a 0.8).
Sin embargo, no es una prueba totalmente confiable pues todava pueden existir problemas
de multicolinealidad cuando las correlaciones son bajas (en modelos de regresin mltiple).
Un estudio de correlaciones parciales puede llevarse a cabo, pero este anlisis tiene algunas
dificultades (entre ellas determinar la forma de la colinealidad).
b) Pruebas t no significativas y significancia global del modelo exitosa
Un sntoma claro de problemas de multiciolinealidad es cuando en una estimacin aparecen
H )
pruebas t no significativas (no se rechaza 0 junto a una prueba de significacin global
exitosa.
Ello es comprensible en la medida que el denominador del estadstico t es la desviacin
estndar del estimador (la raz positiva de la varianza), la cual como se estableci
anteriormente, es grande.
c) Regresiones auxiliares
Consiste en efectuar la regresin de cada variable explicativa contra las dems variables
R2
explicativas y calcular el
de cada una de estas regresiones auxiliares.
Xj
Luego, se tiene que bajo la hiptesis nula de que la variable
no es colineal con las
dems regresoras, el siguiente estadstico, tiene una distribucin F con k 2 grados de
libertad en el numerador y n k 1 grados del libertad en el denominador:
F
R X2
(1 R X2
j .X2
, X 3 ,... X k
j .X 2 ,X3
,... X k
/( k 2)
) /( n k 1)
69
La crtica a esta prueba es que la misma puede ser insuficiente si se quieren detectar
multicolinealidades de naturaleza compleja.
En lugar de llevar a cabo la prueba F, se puede adoptar la regla de Klein que establece que
R2
R2
si el
de una regresin auxiliar en particular es mayor al
del modelo original, ello es
evidencia de multicolinealidad.
d) ndice de condicin
Se puede diagnosticar la presencia de multicolinealidad a partir de los valores propios de la
matriz estandarizada XX.
El ndice de condicin se calcula de la siguiente manera:
IC
Maximo valor propio

Mnimo valor propio
La regla utilizada establece que:
Menor a 10 No evidencia de multicolin ealidad
IC
Entre 10 y 30 Multicolin ealidad leve

Mayor a 30 Multicolin ealidad severa
Remedios contra la multicolinealidad aproximada

1) Informacin a priori
Yi 2 X 2i 3 X 3i i
A priori se cree que
0.1
Por tanto, utilizando esta informacin a priori
Yi 2 X 2i 0.1 2 X 3i i
Yi 2 ( X 2i 0.1X 3i ) i
Definiendo la nueva variable
X 4 i X 2 i 0 .1 X 3 i
, estimamos el modelo transformado:
Yi X 4i i
70
Solucionado el problema de multicolinealidad el parmetro puede ser estimado por

MCO.
Obtenida dicha estimacin, tambin puede ser obtenida la estimacin de : 0.1

2)Preestimacin:
Se desea estimar el siguiente modelo:
Ln(Yt ) Ln( Pt ) Ln( I t ) t
donde, las variables de la economa considerada son:
Yt : Autos vendidos en el perodo t
Pt : Precio de los autos vendidos en el perodo t
I t : Ingreso en el perodo t
Es de esperar que en el perodo t tanto el ingreso como el precio estn muy correlacionados.
Es decir, exista un problema de multicolinealidad.
Se sugieren utilizar una estimacin de obtenida a partir de una muestra de corte
transversal.
En el estudio de corte transversal, al ser una medicin en un instante de tiempo, los precios
de los autos no varan.
Es decir, la demanda de autos no depende del precio, solamente del ingreso.
Por tanto, estimamos utilizando MCO en la siguiente regresin:
Ln(Yi ) 3 Ln( I i ) i
La estimacin la utilizamos en el modelo original para solucionar el problema de
multicolinealidad:
Ln(Yt ) Ln( Pt ) Ln( I t ) t
Yt* Ln(Yt ) Ln( I t ) Ln( Pt ) t
Este modelo transformado puede ser estimado sin ninguna dificultad utilizando MCO.
71
Sin embargo, se ha criticado la utilizacin de esta solucin en la medida que la elasticidad

ingreso del modelo transversal mide un concepto diferente al establecido por la elasticidad
ingreso del modelo de series de tiempo.
El ltimo de estos conceptos es la elasticidad del consumo de autos cuando aumenta la
renta como un agregado.
En cambio el primero mide la elasticidad del consumo de autos en una coyuntura especfica
de un grupo de familia con ingresos a otro grupo con un nivel superior.
3)Exclusin de variables
En cualquiera de los modelos anteriores, una solucin podra ser excluir una de las
variables que produce el problema de multicolinealidad.
Es decir, el modelo verdadero es:
Yi 2 X 2i 3 X 3i i
pero se estima (utilizando MCO):
Yi X 2i i
Esta forma de solucionar el problema de multicolinealidad produce serios inconvenientes.
Los estimadores del modelo original son sesgados e inconsistentes.
Por ejemplo, se puede demostrar que el estimador de : es un estimador sesgado (e
inconsistente).
Sabemos que:
x y
x
2i
2
2i
2i
( x 2i 3 x 3i i )
2
2i
x x
x
2i
3i
2
2i
x
x
2i
2
2i
Bajo los supuestos del modelo lineal clsico y utilizando el operador esperanza, se tiene
que:
E ( ) E 3
x x
x
2i
2
2i
3i
x
x
2i
2
2i
E E 3
E ( ) 3
x x
x
2i
2
2i
3i
x x
x
2i
2
2i
3i
x
x
2i
2
2i
72
lo cual demuestra que el estimador es sesgado (la inconsistencia se demuestra utilizando el

operador plim).
El sesgo es:
Sesgo 3
x x
x
2i
3i
2
2i
Como se ve, este depende de las observaciones de las variables explicativas y del parmetro
poblacional .
4)El modelo en primeras diferencias
Una solucin para el modelo, podra ser correr una regresin del mismo sobre las primeras
diferencias:
Yt 2 X 2t 3 X 3t t
Rezagando un perodo, el modelo se escribe como:
Yt 1 2 X 2t 1 3 X 3t 1 t 1
Restando a la primera ecuacin, la segunda de stas, se tiene el modelo en diferencias:
Yt Yt 1 2 X 2t 2 X 2t 1 3 X 3t 3 X 3t 1 t t 1
Yt 2 X 2t 3 X 3t t
Yt 2 X 2t 3 X 3t t
Si el modelo original tena un problema de multicolinealidad, es muy probable que este
modelo en diferencias no tenga dicho problema.
Pero tiene un problema serio.
La perturbacin estocstica t tiene problemas de autocorrelacin de primer orden. (puede

mostrar?)
5)Regresin cresta
En el modelo:
y X
puede solucionarse el problema de la multicolinealidad, a travs del estimador cresta

definido como:
73
c ( X ' X cI k ) 1 X ' y
Analizando detenidamente la expresin, se tiene que el estimador cresta, es una versin
1
modificada del estimador de MCO, al cual, en la diagonal de la matriz ( X ' X ) se suma
una constante c.
Este estimador es sesgado pero con menor error cuadrtico medio que el estimador MCO.
Sin embargo, la direccin del sesgo es desconocida.
La matriz de varianzas y covarianzas es:
Var ( c ) ( X ' X cI k ) 1 X ' X ( X ' X cI k ) 1
Si se elige c de alguna manera ptima, la varianza obtenida puede ser menor a la de MCO.
Una forma de elegir c es de tal manera que se solucionen los problemas de mala definicin
del estimador, es decir que pequeos cambios en XX (a travs de variaciones en c), no
cambien dramticamente la estimacin de los parmetros.
Comentarios finales sobre la multicolinealidad
Con multicolinealidad, los estimadores siguen siendo MELI.
Sin embargo:
o Subsiste el problema de definicin.
Si bien los estimadores son insesgados, pequeos cambios en la muestra pueden generar
cambios importantes en los estimadores
o Si bien siguen siendo de mnima varianza, el problema de multicolinealidad ocasiona
que las varianzas tiendan a ser grandes (mnima, no quiere decir chica).
La multicolinealidad se genera por una serie de causas:
oMtodos de recoleccin de datos,

oRrestricciones sobre el modelo
oAdicin de trminos polinomiales cuando el nmero de variables explicativas es pequeo
oMuchas variables explicativas, pocas observaciones
oTendencias comunes en las series de tiempo v) mala construccin del modelo.
El problema de la multicolinealidad es muchas veces muestral.
74
Un cambio de muestra podra ser la solucin ... es fcil obtener una nueva muestra?
La multicolinealidad no es un problema serio si el fin del modelo estimado es la prediccin.

Lo es si lo que se desea es explicar estructuralmente la relacin entre las variables del
modelo construido.
La intuicin de esta afirmacin es evidente al obtener
R2
altos y pruebas t no significativas.
75
Heteroscedasticidad
Naturaleza y causas
En el modelo clsico habamos supuesto la homoscedasticidad de los errores del modelo. Es

decir:
Var ( i ) i 1..N
Dado que tambin habamos supuesto que:
E( i ) 0
Tenamos que:
Var ( i ) E ( i2 )
i 1..N
El supuesto de homoscedasticidad se representa grficamente, de la siguiente manera:
Sin embargo, un caso ms general para nuestro modelo de regresin es cuando las varianzas
de los errores del modelo no son constantes. Es el caso de la heteroscedasticidad. Es decir:
Var ( i ) E ( i2 ) i i 1..N
Grficamente, el caso de la heteroscedasticidad, se representa de la siguiente manera:
76
Los casos anteriores muestran como la heteroscedasticidad resulta de la estructura del

modelo, de la forma cmo las variables interactan dentro del mismo. Sin embargo, el
problema de la heteroscedasticidad tambin se presenta debido a valores atpicos dentro de la
muestra recogida (problema muestral) o porque se ha cometido un error de especificacin
(se puede generar heteroscedasticidad cuando se omite una de las variables importantes del
modelo). Adems, cabe sealar que generalmente la heteroscedasticidad es un problema de
series de corte transversal, aunque algunos estudios tambin muestran problemas de
heteroscedasticidad en series de tiempo.
Una vez definido el problema de la heteroscedasticidad, examinadas las causas de este
problema, veremos cmo detectar el problema de la heteroscedasticidad.
Formas de detectar problemas de heteroscedasticidad
Habida cuenta de que solamente contamos con una muestra de datos, slo veremos una serie
de reglas prcticas para detectar problemas de heteroscedasticidad. Si tuviramos a
disposicin la poblacin, la tarea de diagnstico sera mucho ms sencilla.
77
a) Mtodo grfico
Es un mtodo informal
Para verificar problemas de heteroscedasticidad, se estima el modelo y se obtienen los
2
residuos estimados del modelo elevados al cuadrado: i .
En el caso del ejemplo del modelo de consumo e ingreso, el problema de
heteroscedasticidad estaba generado por la variable explicativa ingreso. Segn el
mismo, a mayor ingreso, mayor variabilidad de los ingresos.
En este ejemplo, utilizando un diagrama de dispersin, se esperara encontrar una
2
2
relacin entre i y el ingreso. Cabe notar que cada i es una variable proxy a la
varianza correspondiente a cada i .
Por tanto, el mtodo grfico consiste en llevar a cabo un diagrama de dispersin entre
los errores estimados del modelo elevados al cuadrado y una o ms de las variables
explicativas del modelo y observar si existe algn patrn sistemtico. Una relacin
positiva o negativa sera indicio de problemas de heteroscedasticidad. Alternativamente
a las variables explicativas del modelo, tambin podemos utilizar la variable Yi que es
una combinacin de las variables explicativas del modelo.
b) Prueba de Park
Prueba ms formal que tiene elementos de evaluacin menos subjetivos que el
mtodo grfico.
Supone que la heteroscedasticidad est determinada por una de las variables
explicativas del modelo. Digamos por X 2i
La metodologa de la prueba es la siguiente:
78
2
o Primera etapa: Estimar el modelo original y obtener i
o Segunda etapa: Si se plantea una estructura de heteroscedasticidad del
siguiente tipo:
i X 2i e
Aplicando logaritmos:
ln( i ) ln( ) ln( X 2i ) i
i
Bajo el supuesto de que la perturbacin estocstica de este modelo se distribuye

normal, es homoscedstico y no autocorrelacinado, la segunda etapa consiste en
2
estimar este modelo reemplazando ln( i ) por ln( i ) .
o Tercera etapa: Bajo el supuesto de homoscedasticidad, el parmetro
debera ser cero, de tal manera que la varianza de cada perturbacin
estocstica del modelo original sea constante (ms un componente
puramente aleatorio). Es decir:
ln( i ) ln( ) i
o Para verificar la hiptesis nula, la tercera etapa consiste en llevar a cabo una
prueba t de student de significancia individual sobre el parmetro .
Utilizando la regla de decisin correspondiente, se concluye sobre la
existencia o no de heteroscedasticidad.
Entre los inconvenientes ms visibles de esta prueba, estn dos: i) la prueba
depende del supuesto de que la heteroscedasticidad se produce por X 2i . La
estructura de la heteroscedasticidad podra ser otra ii) i puede no ser
homoscedstico.
c) Prueba del Goldfeldt Quant

Tambin supone que la heteroscedasticidad est generada por una de las variables
explicativas del modelo.
En el modelo: y X sospechamos que existe un problema de
heteroscedasticidad (positiva) generada por la variable X 2i . Es decir,
f ( X 2i ) 2 X 2i
2
i
La metodologa de la prueba tiene los siguientes pasos:

o Primer paso: Ordenar la muestra de datos de manera ascendente en funcin
a X 2i .
o Segundo paso: Omitir c valores centrales de la muestra, quedando por tanto
(N-c) observaciones de la muestra original.
N c
2
o Tercer paso: Realizar una primera estimacin con las primeras
observaciones de la muestra, obteniendo la suma de residuos al cuadrado de
79
la misma, denominndola SRC 1 . Realizar una segunda estimacin con las

N c
ltimas 2 observaciones de la muestra, obteniendo la suma de residuos
al cuadrado de la misma, denominndola SRC 2 . Los grados de libertad en
N c
k
cada una de las regresiones es 2
o Cuarto paso: Bajo la hiptesis nula de homoscedasticidad, el estadstico:
SRC 2
F
SRC 1
N c
k
tiene una distribucin F de Fisher con 2
grados de libertad tanto en el
numerador como en el denominador.
N c
k
2
Si F es mayor que el valor de la F de tablas con
grados de libertad en el
numerador y en el denominador a un nivel de significancia

entonces rechazamos la
hiptesis nula de homoscedasticidad.
Para la eleccin de c se han sugerido los siguientes valores:
o Goldfeldt y Quant sugieren: c=4 si N=30 y c=6 para N=60
o Harvey sugiere la exclusin de un mximo de un tercio de la muestra
o Si c es chico, la prueba pierde potencia (capacidad de rechazar la hiptesis
nula cuando es falsa). Si c es grande, la estimacin tiene menores grados de
libertad.
Ntese que esta prueba debera ser utilizada en la medida que se ha identificado a
la variable que produce el problema de heteroscedasticidad.
d) Prueba de Glesjer
Esta prueba es muy similar en su concepcin a la de Park. Sin embargo, permite
probar la existencia de homoscedastidad sobre un conjunto ms grande de formas
funcionales.
Supone tambin que la heteroscedasticidad est determinada por la variable Z i
que puede ser o no una de las variables explicativas del modelo.
La metodologa de la prueba es la siguiente:
i , i2
o Primer paso: Estimar el modelo original y obtener
o Segunda etapa: Efectuar regresiones utilizando como
i2
dependientes i
que estn en funcin de :
0 1 Z ih t
donde h :
variables
80
h 1,1, 1 / 2, 1 / 2
Si 1 es significativo entonces rechazamos la hiptesis nula de homoscedasticidad.
e) Prueba Breush-Pagan-Goodfrey
En el modelo: y X sospechamos que existe un problema de
heteroscedasticidad cuya estructura es la siguiente:
i f ( Z 2i , Z 3i ,..., Z mi , i )
suponiendo linealidad:
i 2 Z 2i 3 Z 3i ... m Z mi i
No existe problemas de heteroscedasticidad bajo la siguiente hiptesis nula:
2 3 ... m 0
Los pasos de la prueba son los siguientes:
Primer paso: Estimar el modelo y obtener los residuos estimados del mismo:
1 , 2 , 3 ..., N
Segundo paso: Obtener la siguiente estimacin de la varianza
N

i 1
2
i
N
Calcular a lo largo de toda la muestra:
i2
pi 2
Llevar a cabo la siguiente regresin:

p i 2 Z 2i 3 Z 3i ... m Z mi i
De la estimacin anterior, se obtiene la suma explicada de cuadrados (SEC) y se
estima el siguiente estadstico:
1
SEC
2
Bajo la hiptesis nula de homoscedasticidad, el estadstico anterior se distribuye
asintticamente ji-cuadrado con (m-1) grados de libertad.
m2 1,
Para muestras grandes, si
entonces rechazamos la hiptesis nula de
homoscedasticidad.
Esta prueba, nuevamente supone el conocimiento preciso del patrn de

heteroscedasticidad, si bien el mismo no se restringe al conjunto de variables
explicativas del modelo (la prueba sirve incluso en caso de que otras variables, aparte
de las explicativas, generen el problema).
81
Sin embargo, adems de ser una prueba asinttica, la misma es limitante debido al
supuesto de normalidad de los errores del modelo original.
f) Prueba general de White

Prueba que no supone explcitamente un patrn para la heteroscedasticad, ni tiene
otros supuestos restrictivos como la normalidad de los errores del modelo original.
Pasos de la prueba:
o Primer paso: En el modelo Yi 2 X 2i 3 X 3i i se desea verificar la
existencia de heteroscedasticidad. No se presupone ninguna forma explcita de la
heteroscedasticidad. En el primer paso, se estima el modelo y se obtienen los
residuos estimados del mismo: i
o Segundo paso: Sobre la base de los residuos estimados, se estima la siguiente
regresin:
i2 1 2 X 2i 3 X 3i 4 X 22i 5 X 32i 5 X 2i X 3i i
Donde adems de las variables del modelo original se incluyen los trminos cuadrticos de los mismas (
como el trmino cruzado (
X 22i , X 32i ) as
X 2 i X 3i )
o Tercer paso: Obtener el
R2
de la regresin anterior.
NR 2
o Cuarto paso: Bajo la hiptesis nula de homoscedasticidad, el estadstico
, se
distribuye asintticamente ji-cuadrado con grados de libertad iguales al nmero
de regresoras de la ecuacin estimada en el segundo paso. Por tanto, si
NR 2 l2,
donde l es el nmero de regresoras del segundo paso (excluyendo la
constante) entonces rechazamos la hiptesis nula de homoscedasticidad.
Algunos de los inconvenientes de esta prueba son: la introduccin de trminos
cuadrticos o cruzados puede aumentar excesivamente los regresiones en la ecuacin
auxiliar; existe una hiptesis conjunta (heteroscedasticidad / errores de
especificacin) y si bien no se necesita explicitar la estructura de la
heteroscedasticidad, ello tambin es una desventaja en la medida que una vez
detectada la heteroscedasticidad, no sabremos cmo solucionar el problema.
82
Autocorrelacin
Uno de los supuestos del modelo clsico establece que:
Cov( t , t s ) 0 s 0 t 1,2..T
Es decir no existe relacin ninguna entre las perturbaciones estocsticas del modelo (Errores
no correlacionados)
Sin embargo, si tal relacin de dependencia existe, se habla de autocorrelacin.
Es un fenmeno mucho ms frecuente en series de tiempo que en series de corte transversal.
Causas
Inercia, producto del ciclo econmico. En un momento del ciclo (expansivo) es

posible que el valor posterior de una serie sea mayor al actual.
Sesgo de especificacin
1. Por exclusin de variables. Se estima el siguiente modelo
Yt X 2t vt
En vez del modelo verdadero
Yt X 2t 3 X 3t t
En ese caso, el error del modelo t dejar de ser puramente aleatorio y tendr
un patrn sistemtico:
t 3 X 3t t
2. Forma funcional errnea. Se estima el siguiente modelo
Cmgt X 2t vt
en vez del modelo verdadero
Cmgt X 2t 3 X 22t t
al igual que en el anterior caso, el error del modelo t dejar de ser puramente
aleatorio y tendr un patrn sistemtico:
t 3 X 22t t
3. Eliminacin de trminos rezagados. Se estima el siguiente modelo
Yt X 2t vt
en vez del modelo verdadero
Yt X 2t 3 Yt 1 t
t dejar de ser puramente aleatorio y tendr un patrn sistemtico:

t 3 Yt 1 t
4. Estructura del modelo. En el modelo:
Ot Pt 1 t
t podra estar negativamente correlacionado con t 1 . Si existen excedentes

en el perodo anterior, los productores reaccionarn reduciendo su produccin,
de tal manera de generar dficit y gastar sus excedentes.
5. Manipulacin de datos
83
i. Suavizamiento de series
ii. Interpolacin y extrapolacin
iii. Transformacin de datos
6. No estacionariedad (Tema a ser visto ms adelante)
Formas de detectar problemas de autocorrelacin
a) Mtodo grfico
La autocorrelacin implica que:
t f ( t s ) s 0
El caso ms analizado en la literatura es el proceso autorregresivo de orden uno o AR(1),
donde el error del modelo depende del error del modelo rezagado en un perodo bajo la
siguiente estructura:
homosceds tico
t t 1 t t N (0, 2 )
No autocorrel acionado
1 1 (Condicin de estacionariedad)
para un modelo del tipo y X . Las propiedades de t determina que se lo conozca
como trmino de error ruido blanco.
El mtodo grfico consiste en estimar primeramente el modelo original y luego llevar a
cabo un diagrama de dispersin donde los errores estimados estn en funcin de los errores
estimados rezagados. Un patrn sistemtico en este grfico ser indicio de autocorrelacin.
Alternativamente, se pueden graficar los residuos estimados del modelo contra el tiempo.
Un patrn sistemtico ser evidencia de autocorrelacin.
84
b) Prueba Durbin-Watson para detectar problemas de

autocorrelacin
Supuestos:
El modelo original tiene intercepto
Las Xs no son estocsticas
La perturbacin estocstica sigue un proceso AR(1)
La perturbacin estocstica tiene distribucin normal
No existen observaciones faltantes
Dentro de las variables explicativas no se incluyen rezagos de la variable dependiente
El estadstico de Durbin-Watson calculado es:
T
dw
(
t 2
t 1 ) 2
t
T

t 2
2
t
Dicho estadstico, tambin se puede expresar como:
2
dw

t 1
t 1
pero como:

2
t
Por tanto,
2
t 1
t t 1 2(1 )
dw 2 1
Claramente es el coeficiente de correlacin muestral. (Es adems el coeficiente estimado

por MCO de en la ecuacin del proceso AR(1))
Los lmites del coeficiente de correlacin muestral son:
1 1
Si 1 (autocorrelacin negativa) entonces dw 2(1 ( 1)) 4
Si 0 (no existe autocorrelacin) entonces dw 2(1 (0)) 2
Si 1 (autocorrelacin positiva) entonces dw 2(1 (1)) 0
Por tanto:
0 dw 4
85
En los extremos, no existir autocorrelacin cuando el dw sea igual a 2. Habr

autocorrelacin negativa si es igual a 4 y positiva si es igual a 0.
La distribucin de probabilidad de dw depende de manera compleja de las Xs. Para cada
conjunto de Xs habra que derivar una distribucin de probabilidad para dw. DurbinWatson han derivado lmites superiores denominados d L y lmites inferiores dU con los
cuales se pueden construir intervalos a fin de tomar decisiones sobre la existencia o no de
autocorrelacin del tipo AR(1)
Pasos de la Prueba: Para llevar a cabo la prueba, se siguen los siguientes pasos:
Paso 1: Utilizando MCO se realiza la regresin del modelo original y se estiman los
residuos del modelo.
Paso 2: Se calcula el estadstico dw.
Paso 3: Se determinan en tablas los valores crticos d L y d U para T y k dados.
Paso 4: Se ubica a dw dentro del siguiente rango y se toma una decisin.
Las desventajas de la prueba son:

Supuestos restrictivos
Qu hacer cuando el estadstico cae en alguna de las regiones de indecisin.
Otras pruebas
c)
Prueba asinttica
Puede demostrarse que bajo la hiptesis nula de ausencia de autocorrelacin ( tipo AR(1)),
el estadstico:
T
tiene una distribucin asinttica N(0,1). La regla de decisin determina que si:
T Z c , / 2
a un nivel de significancia , entonces rechazamos la hiptesis nula.
86
d) Prueba h de Durbin
Cuando el rezago de la variable dependiente se incluye como variable explicativa, Durbin
propuso esta prueba. Bajo la hiptesis nula de ausencia de autocorrelacin tipo AR(1), el
estadstico h tiene asintticamente una distribucin N(0,1):
T
h
1 T * var( 2 )
donde var( 2 ) es la varianza del coeficiente estimado que acompaa a la variable

dependiente rezagada. Si el estadstico h supera el valor de tablas de la distribucin normal
estndar a un nivel de significancia se rechaza la hiptesis nula.
e) Prueba de Breusch-Godfrey
Es tambin una prueba asinttica, que sin embargo, tiene algunas ventajas respecto a las
pruebas anteriores.
Se utiliza para probar la existencia de autocorrelacin hasta de orden p. Es decir, un proceso
autorregresivo para las perturbaciones estocsticas del modelo, expresado de la siguiente
manera:
t 1 t 1 2 t 2 3 t 3 ... p t p
Se lleva a cabo, siguiendo los siguientes pasos:
Paso 1: Estimar el modelo original utilizando MCO y obtener los residuos estimados del
modelo.
Paso 2: Llevar a cabo la regresin:
t X 1 t 1 2 t 2 3 t 3 ... p t p
Notar que en esta estimacin se pierden T p observaciones.
R2
Paso 3: Obtener el
de esta regresin auxiliar.
Paso 4: Calcular el estadstico:
(T p ) * R 2
2 3 ... p 0
Bajo la hiptesis nula de ausencia de autocorrelacin 1
, este
p
estadstico tiene una distribucin asinttica ji-cuadrada con grados de libertad.
Paso 5: La regla de decisin establece que si:
(T p) * R 2 2p ,
entonces se rechaza la hiptesis nula.
Esta prueba tiene grandes ventajas sobre las pruebas anteriores en la medida que no parte
de supuestos tan restrictivos. Sin embargo, presenta la dificultad de cmo determinar el
orden de autocorrelacin a probar (es decir el valor de p). Adems es una prueba asinttica.
87
f) Prueba Q de Box-Pierce
Es tambin una prueba utilizada para verificar la existencia de procesos autorregresivos de
orden p. El estadstico Q, bajo la hiptesis nula de ausencia de autocorrelacin
1 2 3 ... p 0
, tiene una distribucin asinttica ji-cuadrada con p grados de
libertad. Q se define de la siguiente manera:
p
Q T 2j
j 1
donde:
T
t j 1
Q 2p ,
t j

t 1
Si
2
t
entonces al nivel de significancia se rechaza la hiptesis nula.
Una correccin de muestras pequeas, est dada por el estadstico Lyung-Box. Bajo la
2 3 ... p 0
hiptesis nula 1
, el estadstico Q, tiene una distribucin jicuadrado con p grados de libertad.
p
2j
Q' T (T 2)
j 1 T j
Si
Q' 2p ,
entonces al nivel de significancia se rechaza la hiptesis nula.
1. Consecuencias de utilizar MCO con heteroscedasticidad y/o autocorrelacin

Cuando existe autocorrelacin y/o heteroscedasticidad, el modelo de regresin se define de
la siguiente manera:
y X
var(
La matriz de varianzas y covarianzas, var( , se expresa de la siguiente forma:
112
21
12 ... 1N E 2
E 1 2 ... E 1 N
2
22
... 2 N E 2 1
E 22
... E 2 N
2
var(
E '

2
E N2
N 1 N 2 ... NN E N 1 E N 2 ...
Recordemos que bajo homoscedasticidad los trminos de la diagonal son constantes
2
(iguales a
) mientras que bajo ausencia de autocorrelacin, los trminos fuera de la
88
diagonal son iguales a cero. La suma de estos dos supuestos determina que la matriz sea
var( I
igual a una matriz identidad de dimensin N de tal manera que
.
Bajo la forma ms general para la varianza de los errores, los resultados encontrados,
utilizando los supuestos del modelo clsico, no se modifican en algunos casos pero s en
otros (se mantienen los dems supuestos del modelo):
a) La solucin MCO para los parmetros del modelo es la misma. Es decir,
var(
independientemente de que
:
( X ' X ) 1 X ' y
Para ello, volviendo a lo encontrado en clases anteriores, hay que notar que la solucin
de MCO no depende de los supuestos realizados sobre la estructura de la matriz de
varianzas y covarianzas de los errores.
b) El estimador MCO sigue siendo insesgado independientemente de la estructura de la
matriz de varianzas y covarianzas. Para la demostracin de esta propiedad, revisando
tambin los apuntes anteriores, concluimos que tampoco se necesita tomar en cuenta la
estructura de la matriz de varianzas y covarianzas de los errores.
var(
c) La varianza de los parmetros bajo
s se modifica cuando existen
problemas de autocorrelacin y/o heteroscedasticidad.
Bajo la estructura general planteada anteriormente se encuentra que:
Var ( ) 2 ( X ' X ) 1 X ' X ( X ' X ) 1
Demostracin:
Var ( ) E E E ' E '
dado que el estimador sigue siendo insesgado: E . Asimismo, se puede demostrar

fcilmente que:
( X ' X ) 1 X ' ( X ' X ) 1 X '

que es tambin un resultado obtenido previamente. Por tanto,
89
Var ( ) E ' E ( X ' X ) 1 X ' X ' X ) 1 X ' '
Var ( ) E ( X ' X ) 1 X ' ' X ( X ' X ) 1 ( X ' X ) 1 X ' E ' X ( X ' X ) 1

Var ( ) ( X ' X ) 1 X ' 2X ( X ' X ) 1 2 ( X ' X ) 1 X ' X ( X ' X ) 1
Recordemos que bajo el supuesto de homoscedasticidad y ausencia de autocorrelacin se
Var ( ) 2 ( X ' X ) 1
obtuvo:
Por tanto, la principal implicacin de la demostracin anterior es que es simplemente
Var ( ) 2 ( X ' X ) 1
incorrecto utilizar la expresin
, para casos donde existe
autocorrelacin y/o heteroscedasticidad. En otras palabras, suponer no autocorrelacin
y/o heteroscedasticidad puede llevar a considerar errneamente que
Var ( ) 2 ( X ' X ) 1
cuando en realidad, bajo la existencia de estos problemas la
Var ( ) 2 ( X ' X ) 1 X ' X ( X ' X ) 1

varianza es:
.
d) Nada garantiza que cuando existe autocorrelacin y/o heteroscedasticidad, el estimador
MCO sea de mnima varianza. El teorema Gauss-Markov no funciona cuando
var(
(revisar la demostracin que se hizo del teorema Gauss-Markov).
Mtodos alternativos de estimacin bajo heteroscedasticidad y/o autocorrelacin
Mnimos Cuadrados Generalizados
Transformemos el modelo de regresin pre-multiplicando el mismo por la matriz P de

dimensin NxN (con elementos determinsticos).
Py PX P
Definamos:
y * Py
X * PX
* P
Por tanto,
y* X *
Tenemos que:
Var ( ) E ' E P P ' E P ' P ' PE ' P ' 2 PP '
90
Existe una matriz P tal que
2 P P ' 2 I
Ntese que si existe una P con la caracterstica mencionada, habremos logrado transformar
(multiplicando por dicha matriz) un modelo autocorrelacionado y/o heteroscedstico en un
modelo libre de estos problemas, que cumple con todos los supuestos requeridos por el
modelo lineal clsico.
Como es una matriz simtrica y definida positiva, respondemos afirmativamente a la
2 PP' 2 I
pregunta. Es decir, s existe una matriz P tal que
se puede descomponer de la siguiente manera:

VV '
V 1 V 1VV ' V '
V 1V ' 1 V 'V ' 1 I
2 P P ' 2 I
V 1
lo cual demuestra que la matriz P buscada que cumple con
es la matriz
.
Ntese adems que:
1 (VV ' ) 1 V ' 1 V 1
Aplicando propiedades de matrices inversas.
V 1
Conocida la matriz
llevamos a cabo la transformacin sugerida anteriormente y
obtenemos un modelo transformado que cumple con todos los requisitos del Modelo Lineal
Clsico.
El estimador obtenido de esta manera se denomina estimador de Mnimos Cuadrados
Generalizados (MCG). Ntese que MCG no es ms que la estimacin MCO a un modelo
transformado que cumple con los supuestos del modelo lineal clsico. Es decir:
y* X *
Var ( ) 2 I
Ntese que la matriz de parmetros es la misma que la del modelo original. El estimador
es, por tanto:
MCG ( X * ' X * ) 1 X * ' y * ( X ' 1 X ) 1 X ' 1 y

La varianza es:
91
Var ( MC ) 2 ( X * ' X * ) 1 2 ( X ' 1 X ) 1
Propiedades
El estimador MCG al ser un MCO aplicado sobre un modelo transformado hereda todas las
propiedades de cualquier estimador MCO. Es decir, el estimador MCG es:
a) Lineal
b) Insesgado
c) De varianza Mnima (MELI)
*
Asumiendo normalidad en los errores
, tambin heredar las dems propiedades
2
N ( , ( X ' X ) 1
(consistencia, MEI, MCG
, etc.).
Otros resultados son:
1.
2.
3.
2
MCG
2
MCG
* ' * ' 1
2
N k
N k es un estimador insesgado de .
y ' 1 y MCG X ' 1 y

N k
2
El R calculado del modelo transformado no es vlido para el modelo original:
2
y*
a. El R es vlido para la variable transformada del modelo
y no para y .
b. Adems, es posible que en casos de heteroscedasticidad el trmino constante resulte

2
eliminado por lo que el R resulta no vlido en dicho caso.
4.
En la Prueba de Hiptesis H 0 : R r donde:

F
la matriz
( R MCG r )' ( R( X ' 1 X ) 1 R' ) 1 ( R MCG r ) / q
' 1 /( N k )
no es conocida.
92
Utilizando una estimacin de dicha matriz, la distribucin de F converge asintticamente

aproximadamente a una distribucin F, con q grados de libertad en el numerador y
N k grados de libertad en el denominador. Su buena aproximacin depender de la
1
buena eleccin que se haga del estimador de
.
El caso de la heteroscedastidad (sin autocorrelacin)

Cuando existe solamente heteroscedasticidad la matriz de varianzas y covarianzas de las
perturbaciones estocsticas del modelo toma la forma siguiente:
Var ( )
2
12
0
22
N2
Asumiendo una forma ms explicita para la heteroscedasticidad:

Var ( i ) 2 X 22i
i 1..N
tenemos que la matriz de varianzas y covarianzas es:

2
X 21
0
2
2
Var ( )

0
2
X 22
X 22N
Es fcil demostrar que:
1
X
21
V 1
y verificar que bajo esta estructura:

Generalizados, tenemos que:
0
1
X 22
V 1V ' 1 I
1
X 2N
. Aplicando Mnimos Cuadrados
93
Y1
X 21
Y2
y* X
22

YN
X
2N
1
2
X 2i
1
X 21
1
X 22
1
X 2N
1 ...
1 ...

1 ...
1
X 2i
...
X 'y
*
X kN
X 2N
X ki
2
2i
Yi
X
Y
X
... ki
X 2i

X ki2
X2
2i
X *' X *
X k1
X 21
X k2
X 22
2i
Yi X ki
X 2i
Ntese que para eliminar el problema de heteroscedasticidad, lo que hace la metodologa

MCG (en este caso) es dividir cada observacin de la muestra por X 2i .
Es decir, si el modelo original es:
Yi 1 2 X 2i 3 X 3i ... k X ki i
se divide por X 2i . El estimador queda:
Yi
X
X
1
1
2 3 3i ... k Ki i
X 2i
X 2i
X 2i
X 2i X 2i
Ntese que en este modelo transformado, la varianza, como era de esperar, resulta
homoscedstica:
1
1
Var ( i ) 2 Var ( i ) 2 2 X 22i 2
X 2i
X 2i
X 2i
94
El caso de la autocorrelacin (sin heteroscedasticidad)

Cuando existe autocorrelacin, la estructura de la matriz es bastante ms compleja.
Veamos el caso de la autocorrelacin de primer orden o proceso AR(1). Habamos definido
el proceso AR(1) como:
t t 1 t
E ( t ) 0 Var ( t ) 2
Cov( t , t s ) 0 t 1..T
s 0
imponiendo:
(condicin de estacionariedad)
Para obtener la varianza de la perturbacin estocstica del modelo recurrimos a la

definicin de sta.
Pero primero expresamos t en funcin del valor actual y de los rezagos de t , operando
recursivamente la expresin:
t t 1 t ( t 2 t 1 ) t 2 t 2 t 1 t
t 2 ( t 3 t 2 ) t 1 t 3 t 3 2 t 2 t 1 t
t 3 ( t 4 t 3 ) 2 t 2 t 1 t 4 t 4 3 t 3 2 t 2 t 1 t
...
t s t s s 1 t ( s 1) ... 4 t 4 3 t 3 2 t 2 t 1 t
s t s 0
1
cuando s , entonces
dado que
. De esta manera, obtenemos una
expresin para la perturbacin del modelo donde depende nicamente del valor actual y de
los valores rezagados de t :
t s t s ... 4 t 4 3 t 3 2 t 2 t 1 t
El valor esperado de t ser igual a cero dado que uno de los supuestos del modelo es que
E ( t ) 0 t 1..T :
E ( t ) E ( s t s ... 4 t 4 3 t 3 2 t 2 t 1 t )
E ( t ) s E ( t s ) ... 4 E ( t 4 ) 3 E ( t 3 ) 2 E ( t 2 ) E ( t 1 ) E ( t )
E ( t ) 0
95
2
Por tanto, Var ( t ) E ( t ) . Es decir,
E ( t2 ) E ( s t s ... 4 t 4 3 t 3 2 t 2 t 1 t ) 2
(1)
El desarrollo de la expresin dentro del operador esperanza contiene trminos cuadrticos y

cruzados:
E ( t2 ) E 2 s t2 s ... 8 t2 4 6 t23 4 t22 2 t21 t2 2 trminos cruzados
A
l distribuir el valor esperado en cada uno de los trminos de la anterior expresin tenemos
que en el caso de los trminos cuadrticos se obtiene el siguiente resultado:
E ( t2 s ) ... E ( t24 ) E ( t23 ) E ( t2 2 ) E ( t21 ) E ( t2 ) 2
mientras que la esperanza de todos los trminos cruzados es igual a cero dado que se ha
Cov( t , t s ) 0 t 1..T s 0
supuesto que:
.
Por tanto,
E ( t2 ) 2 (1 2 4 6 8 ....)
1
1 2
La expresin entre parntesis es una progresin geomtrica que converge a:

. Por
2
Var ( t ) E ( t2 )
2 t 1..T
1 2
tanto,
. Ntese que la varianza encontrada es
2
homoscedstica dado que y son constantes poblacionales que no varan a lo largo de
la muestra.
La covarianza Cov( t t 1 ) E ( t t 1 ) se define como:
E ( t t 1 ) E ( s t s ... 3 t 3 2 t 2 t 1 t )( s t s 1 ... 3 t 4 2 t 3 t 2 t 1 )
E ( t t 1 ) 2 (1 2 4 6 8 ....)
2
2
1 2
La covarianza Cov( t t 2 ) E ( t t 2 ) se define como:
96
E ( t t 2 ) E ( s t s ... 3 t 3 2 t 2 t 1 t )( s t s 2 ... 3 t 5 2 t 4 t 3 t 2 )
E ( t t 2 ) 2 2 (1 2 4 6 8 ....) 2
2
2 2
1 2
...
Generalizando:
La covarianza
Cov( t t (T 1) ) E ( t t (T 1) )
E ( t t (T 1) ) T 1
es:
2
T 1 2
1 2
Por tanto, la matriz queda definida de la siguiente manera:

1
T 1
T 2
2 ... T 1
... T 2
1 ... T 3

...
1
donde:
Var ( ) 2
Afortunadamente la matriz depende solamente de un parmetro que es . Se puede
demostrar que:
1
1 2
...
...
0
0
0
0
0
0
...
1 2
Asimismo el siguiente resultado para
... 1 2
...
V 1
97
(1 2
0 ...
0 ...
1 ...
0
0
0
0
0 ...
Premultiplicando el modelo por esta matriz, logramos transformarlo en uno libre de

problemas de autocorrelacin. Luego si fuera conocido podramos seguir con la
estimacin de MCG. Sin embargo, no es conocido y por tanto no podemos obtener ni
V 1
.
Obtenemos estimadores de : mediante las cuales podemos encontrar estimaciones de
la matriz : . Algunas formas son las siguientes:
a) A partir del estadstico Durbin-Watson. Recordemos que:
dw 2(1 ) 1
dw
2
b) El modelo original es:

Yt 1 2 X 2t ... k X kt t
t t 1 t
Rezagando el modelo un perodo y multiplicando el resultado por obtenemos:
Yt 1 1 2 X 2t 1 ... k X kt 1 t 1
Restando esta expresin al modelo original y llevando a cabo algunas operaciones
algebraicas, logramos obtener un modelo libre de autocorrelacin:
Yt Yt 1 1 1 2 X 2t 2 X 2t 1 ... k X kt k X kt 1 t t 1
Yt Yt 1 1 (1 ) 2 ( X 2t X 2t 1 ) ... k ( X kt X kt 1 ) t
Yt 1 (1 ) 2 ( X 2t X 2t 1 ) ... k ( X kt X kt 1 ) Yt 1 t
Para obtener una estimacin de , estimamos la ltima de estas ecuaciones. Ntese que
la estimacin que buscamos es el coeficiente que acompaa a la variable dependiente
rezagada.
98
c) Se estima el modelo original, obtenindose los residuos estimados. Luego se halla una
estimacin de , llevando a cabo la siguiente estimacin por MCO:
t t 1 t
Utilizando estas estimaciones de aplicamos MCG que al haber utilizado una
estimacin de se denomina MCG factibles.
La utilizacin de estos mtodos es equivalente a medida que la muestra se hace ms
grande.
Una implicacin muy importante sobre la utilizacin de MCG factibles es que las
2
pruebas t , F y
son vlidas solamente para muestras grandes por lo que la utilizacin
de MCG factibles es recomendable para muestras grandes.
Consideraciones alternativas para la estimacin bajo autocorrelacin
y/o heteroscedasticidad
En el caso de heteroscedasticidad
a) Se pueden reducir los problemas de heteroscedasticidad transformando el modelo
original en logaritmos.
b) Un problema surge cuando no es conocida o no se est seguro o segura de la estructura
de la heteroscedasticidad (no se conoce la variable que est generando el problema). Se
puede resolver el problema estimando MCG usando como variable proxy generadora de
heteroscedasticidad a Yi que sabemos que es una combinacin lineal de las variables

explicativas (ver el mtodo grfico de deteccin de heteroscedasticidad)
c) Estimar el modelo por MCO y utilizar las varianzas calculadas por White en vez de las
convencionales de MCO (una generalizacin de este mtodo es el de Newey y West).
Utilizando estas varianzas las pruebas de hiptesis son asintticamente vlidas. La
matriz de varianzas y covarianzas de White es:
Var ( w ) N 2 (( X ' X ) 1
1
X ' X ( X ' X ) 1
N
Utilizando una estimacin de:
1
1
X ' X
N
N

i 1
2
i
( xt xt ')
'
donde: x t (1, X 2 t , X 3 t ,... X kt )
99
Sin embargo, cabe sealar que la aplicacin de las varianzas de White es para muestras
grandes (dado que las varianzas calculadas por White son consistentes). Una
comparacin de las varianzas de White y de MCO puede dar idea de la magnitud del
problema de heteroscedasticidad.
Hay que notar que en la prctica la estructura de la heteroscedasticidad es difcil de
conocer por lo que la utilizacin de cualquier transformacin ser prxima a la
verdadera estructura. Ello implica que estaramos utilizando aproximaciones a la matriz
. Es decir, estaramos utilizando MCG factibles por lo que la consideracin del tamao
de la muestra es fundamental a la hora de elegir este mtodo de estimacin.
En el caso de autocorrelacin
Existen diversos mtodos que se basan en utilizar la siguiente transformacin del
modelo:
Yt Yt 1 1 (1 ) 2 ( X 2t X 2t 1 ) ... k ( X kt X kt 1 ) t
(2)
a) A travs del estadstico Durbin-Watson
Se estima el modelo original
Se calcula el estadstico Durbin-Watson: dw
Con base al dw se estima :
Se utiliza la estimacin de para estimar por MCO la ecuacin (2).
Sin embargo, hay que observar que se ha perdido una observacin.

b) Durbin en dos pasos
Se estima una variacin de la ecuacin (2) para obtener una estimacin de .

Yt 1 (1 ) 2 ( X 2t X 2t 1 ) ... k ( X kt X kt 1 ) Yt 1 t
Esta forma de estimacin tambin induce a la prdida de una observacin.

c) Cochrane Orcut en dos pasos
100
Se estima el modelo original por MCO y se obtiene la estimacin de los residuos

del modelo.
Se halla una estimacin de , llevando a cabo la siguiente estimacin:
t t 1 t
Esta forma de estimacin tambin induce a la prdida de una observacin.

d) Cochrane Orcut iterativo
Pasos:
i. Se estima el modelo original por MCO y se obtiene la estimacin de los
residuos del modelo.
ii. Se halla una estimacin de , llevando a cabo la siguiente estimacin
(utilizando MCO):
t t 1 t
(3)
iii. Se utiliza la estimacin de para estimar por MCO la ecuacin (2).

iv. Se utiliza la estimacin de los parmetros para encontrar nuevos residuos.
Cabe recordar que y X

v. Con estos nuevos residuos se vuelve a estimar la ecuacin (3) y se obtiene una
nueva estimacin de .
vi. Se compara la estimacin del paso 2 con aquella del paso 5. Si la diferencia
entre ambas es mayor a un valor arbitrariamente pequeo previamente fijado, se
vuelve al paso 3 utilizando la estimacin de obtenida en el paso 2.
vii. En caso de no tener una diferencia significativa dejamos de iterar y elegimos la
ltima ronda de estimaciones de .
d) Utilizar MCO pero con errores estndares corregidos mediante el procedimiento por
Newey y West que no es ms que una generalizacin de los errores estndar
consistentes con la heteroscedasticidad de White. Su utilizacin es para muestras
grandes.
101
Comentarios finales sobre heteroscedasticidad y autocorrelacin
Utilizar los resultados MCO cuando existen problemas de autocorrelacin y/o

heteroscedasticidad puede llevar a cometer errores de apreciacin sobre los resultados
de nuestro modelo (sobre todo en las pruebas de hiptesis)
Una buena solucin es MCG. Sin embargo, debido a que generalmente la matriz no
es conocida, se debe recurrir a una estimacin de esta matriz, generndose as el
denominado estimador de MCG factibles.
Sin embargo, MCG factibles (o la correccin de White o Newey y West), deber ser
utilizado en muestras grandes, en este caso los estadsticos usuales tendrn las
distribuciones conocidas.
En muestras pequeas no es claro si MCO o MCG factibles es superior.
102

1 Econometria Texto Ayuda Escuela Militar Ingenieria Comercial

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

1 Econometria Texto Ayuda Escuela Militar Ingenieria Comercial

Caricato da

Copyright:

Formati disponibili

Apuntes de Econometra

EMI Ingeniera Comercial

MODELO DE REGRESIN LINEAL

Se eleva al cuadrado de tal manera de ponderar o castigar ms a las observaciones ms

Condicin de primer orden:

EMI Ingeniera Comercial

Por tanto, las denominadas ecuaciones normales son:

X , Y Son las medias muestrales de X i y Yi

Propiedades de la solucin MCO

EMI Ingeniera Comercial

5) La LRM pasa por las medias muestrales:

Al minimizar la ecuacin (12) respecto a 1 obtuvimos la condicin de primer orden:

Al minimizar la ecuacin (2) respecto a 2 obtuvimos que:

EMI Ingeniera Comercial

8) El modelo en desviaciones a la media

Restando a (9), (16), obtenemos:

Operando sobre (11) tambin se puede obtener:

Supuestos de la estimacin MCO

Esto claramente se ve en la ecuacin (11).

EMI Ingeniera Comercial

4. Homoscedasticidad o igual varianza de la perturbacin estocstica del modelo

EMI Ingeniera Comercial

Este resultado se obtiene fcilmente, ya sea utilizando las propiedades de la varianza o

5. No existen problemas de autocorrelacin de los errores

La ausencia de autocorrelacin implica que Yt depende sistemticamente y nicamente de X t

EMI Ingeniera Comercial

6. No existen problemas de correlacin entre la(s) variable(s) explicativa(s) y el trmino

Si las Xs no tuvieran variabilidad entonces:

Ello implicara que la solucin sera indeterminada.

EMI Ingeniera Comercial

+ En general, no se ha cometido ningn error de especificacin.

2) Los estimadores son insesgados

Tomando el valor esperado a la ecuacin 22 y sabiendo que las Xs son determinsticas

EMI Ingeniera Comercial

Var ( 2 ) E k 12 12 ... k N2 N2 2 k 1 k , 2 1 2 ... k N 1 k N N 1 N

Var ( 2 ) k 12 E ( u12 ) ... k N2 E ( u N2 ) 2 k 1 k , 2 E ( 1 2 ) ... k N 1 k N E ( N 1 N )

Utilizando los supuestos de homoscedasticidad y no autocorrelacin:

Definamos un estimador lineal e insesgado alternativo:

EMI Ingeniera Comercial

La expresin se minimiza cuando:

De lo que resulta que:

EMI Ingeniera Comercial

STC SEC SRC

EMI Ingeniera Comercial

Tambin puede expresarse como:

Donde r es el coeficiente de correlacin simple entre X y Y , y S XY es la covarianza muestral

EMI Ingeniera Comercial

tambin se puede escribir como:

prximo a 1 implica un buen ajuste.

Por el contrario, cuando se aproxima a 0 implica un mal ajuste.

EMI Ingeniera Comercial

Cules son las Implicaciones?

Los estimadores son consistentes

1) Los estimadores son consistentes:

Donde la probabilidad lmite (plim) se define de la siguiente manera:

es un valor arbitrariamente pequeo.

EMI Ingeniera Comercial

2) Los estimadores se distribuyen normalmente:

Cabe notar que la variable Z se distribuye normal estndar:

EMI Ingeniera Comercial

EMI Ingeniera Comercial

contiene un parmetro poblacional

Para ello utilicemos l siguiente resultado estadstico: