Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
(11 )
i 1.. N
En base a una muestra de tamao N , es posible estimar los parmetros del modelo.
Un criterio muy utilizado es el de Mnimos Cuadrados Ordinaros (MCO).
Este mtodo consiste en la minimizacin de la suma de los residuos del modelo elevados al
cuadrado.
El programa de Minimizacin es el siguiente:
N
i 1
i 1
Min i2 (Yi 1 2 X i ) 2 f ( 1 , 2 )
1 , 2
Yi 1 2 X i i
i Yi 1 2 X i
i2 (Yi 1 2 X i ) 2
N
i 1
i 1
i2 (Yi 1 2 X i ) 2
(12)
(Y
2 (Yi 1 2 X i ) 0
1 2 X i ) Y i N 1 2 X i 0
N 1 2 X i Yi
Apuntes de Econometra
i2
2 (Yi 1 2 X i ) X i 0
(Y X ) X Y X
X X Y X
i
2
i
1 X i 2 X i2 0
1 X i 2 X i2 Yi X i
Resolviendo el sistema de ecuaciones normales se obtienen las siguientes soluciones:
N
x
i 1
N
x
i 1
yi
(13)
2
i
1 Y 2 X
Donde:
(14)
xi ( X i X )
yi (Yi Y )
X ,Y
Apuntes de Econometra
Yi 1 2 X i
Yi Y 2 X 2 X i
Yi Y 2 ( X i X ) (15)
4)
Yi Y
Si :
Yi Y 2 ( X i X )
Yi (Y 2 ( X i X )) NY 2 ( X i X )
Yi
(X
Y
N
N
X ) X i NX
NX NX NX 0
1 Y 2 X
Y 1 2 X
6)
(16)
2 (Yi 1 2 X i ) 0
(Yi 1 2 X i ) u i 0
7)
X
i
2 (Yi 1 2 X i ) X i 0
(Yi 1 2 X i ) X i i X i 0
Apuntes de Econometra
(10)
(17 )
y i 0
y i i 2 x i 2
X
i
(18)
X i 0
(11 )
Apuntes de Econometra
Este supuesto se cumple mientras los parmetros del modelo son lineales en la LRP (es decir
Y
en la esperanza condicional de i )
2. Los valores de X son fijos en muestreo repetido: las Xs no son estocsticas
El investigador selecciona las X y en base a los valores de X realiza un muestreo aleatorio de
la variable dependiente.
Por ejemplo, selecciona X=80 y luego selecciona aleatoriamente el valor de Y.
Inicialmente se realiza el anlisis de regresin condicionado en las Xs.
3. El valor esperado de la perturbacin estocstica es igual a cero
Esto quiere decir que los valores de i no afectan sistemticamente a los valores de Yi
Si:
Yi 1 2 X i ui
(11 )
E i / X i 0 i 1... N
Entonces:
E (Yi / X i ) E ( 1 2 X i i / X i )
E (Yi / X i ) E ( 1 2 X i / X i ) E ( i / X i )
E (Yi / X i ) 1 2 X i
) E ( )
var( i / X i ) E ( i E ( i )) 2 / X i
var( i / X i
var( i / X i ) 2
/ Xi
(19)
i 1... N
El supuesto anterior implica que:
var(Yi / X i ) var( 1 2 X i i / X i )
var(Yi / X i ) var( i / X i ) 2
5
Apuntes de Econometra
LRP
) E (
cov( t t j / X t , X t j ) E ( t E ( t ))( t j E ( t j )) / X t , X t j
cov( t t j / X t , X t j
t j
/ X t , X t j 0 ( 20)
t 1..T j 1,2,...
El problema de autocorrelacin es generalmente un problema de series de tiempo.
Apuntes de Econometra
cov( i X i / X i ) 0 ( 21)
i 1.. N
El segundo supuesto garantiza que esto se cumpla. Al ser las Xs determinsticas la covarianza
con el trmino de error es 0.
Ms adelante se levantar el supuesto de no aleatoriedad y se vern las consecuencias.
7. El nmero de observaciones debe ser por lo menos igual al nmero de parmetros a
estimar
Nk
k es el nmero de parmetros a estimar. k 2 en el modelo de regresin simple.
8. Existe suficiente variabilidad en las Xs
Esto se puede comprender mejor utilizando la solucin:
N
x
i 1
N
x
i 1
yi
2
i
x
i 1
2
i
Apuntes de Econometra
x y
x
2
i
Donde:
ki
Ntese:
x
k x
i
2
i
Por tanto:
ki yi
xi
x i2
k x
0;
2
i
2
i
2 k i (Yi Y ) k iYi Y k i k i Yi
x y k y k ( x
x
k x k k
k ( 22)
i
2
i
Apuntes de Econometra
E E k E
E
E 2 E 2 k i i
2
3) Estimador MELI.
Para mostrar que los estimadores son MELI, debemos encontrar la varianza de los mismos.
Para 2 :
2 2 k i i
2 2 k i i
Var ( 2 ) E ( 2 E ( 2 )) 2
Var ( 2 ) E ( 2 2 ) 2
Var ( 2
) E ( k )
Var ( 2 ) ( k i E ( i )) 2
Var ( 2 )
( x i2 ) 2
x i2
Teorema Gauss-Markov
El Estimador MCO es de Mnima Varianza entre los estimadores lineales e insesgados.
Sea:
2 k iYi
~2 w iYi
Apuntes de Econometra
~2 w i ( 1 2 X i i )
E ~2 E w i ( 1 2 X i i )
~
E 2 1 E wi 2 E wi X i E wi i
~
E 2 1 wi 2 wi X i
E ~
Si : w 0;
w X 1
2
Sea:
~
Var 2 Var
w w i
2
i
xi
x i2
xi
x i2
w Y w Var (Y ) w
i
wi
2
i
2
i
xi
x i2
wi
xi
x i2
2 w i
2
i
xi
x i2
xi
x2
i
xi
x2
i
1
x i2
xi
xi2
~2 w i yi
x y
x
i
2
i
2
~
Var ( 2 )
xi2
Por tanto, queda demostrado que el estimador lineal e insesgado que minimiza la varianza es
el de MCO.
Posteriormente, con un enfoque matricial se generalizar este resultado.
En el modelo lineal simple tambin se puede demostrar que:
var 1
2 X i2
N x i2
cov( 1 2 ) X var( 2 )
Para tener una estimacin de la varianza de los parmetros es necesario contar con una
estimacin de la varianza de los errores.
Se plantea el siguiente estimador insesgado:
10
Apuntes de Econometra
2
i
N 2
(En el modelo lineal general, se har la demostracin del insesgamiento de este estimador de
la varianza de los errores).
Prueba de Bondad de Ajuste: coeficiente de determinacin R2
Si:
y i y i u i
Al cuadrado y sumando:
y
y
2
i
2
i
( y i u i ) 2
y i 2 y i u i u i
2
Pero:
y u
i
Entonces:
2
i
y i u i
2
11
Apuntes de Econometra
R2
El
o coeficiente de determinacin se define como la proporcin de la variacin total
explicada por la regresin.
En trminos de las ecuaciones vistas:
R
2
i
y
y
R2
2
i
( x )
y
2
2
22 x i
x /( N 1) S
S
y /( N 1)
2
2
2
2
2
2
i
2
X
2
Y
2
2
Donde S X y S Y son las varianzas muestrales de X y Y respectivamente.
Asimismo:
R
x y x
x y
y
x y /( N 1)
S
2
22 x i
2
i
2 2
i
2
i
R2
x i /( N 1) y 2i /( N 1)
2
2
XY
S X2 S X2
r2
12
Apuntes de Econometra
El
R2
El
u
1
y
i
2
i
implica que:
0
Un
R2
R2
13
Apuntes de Econometra
N k 2 k2
2
1 lim P ( 1 1 ) 1
plim
2 lim P ( 2 2 ) 1
N
N
14
Apuntes de Econometra
Donde:
2 2
1
En el caso de 2 :
X
N x
2
i
2
i
2 N ( 2 , 2 )
2
Donde:
2 2
2
1
xi2
i i
N (0,1)
i
3) Bajo el supuesto de normalidad de los errores, los estimadores son los Mejores
Estimadores Insesgados.
Esto quiere decir que los estimadores son de mnima varianza, no solamente entre los
estimadores lineales sino entre los no lineales que son insesgados.
15
Apuntes de Econometra
Bajo el supuesto de normalidad de los errores del modelo, el estimador MCO coincide con el
estimador de Mxima Verosimilitud (MV).
Una de las propiedades de MV es que los estimadores obtenidos por esta metodologa son
MEI.
2
1 2
4) Los estimadores
,
se distribuyen independientemente de
.
Esta es una propiedad estadstica muy til para obtener las distribuciones t-student de los
estimadores (vistas a continuacin).
5) La variable dependiente hereda la distribucin normal.
Habamos mostrado que:
E Yi / X i 1 2 X i
Var Yi / X i 2
Una propiedad deseable de una variable cuya distribucin es normal es que otra variable
aleatoria, que es combinacin lineal de la misma, tambin tendr distribucin normal.
Dado que:
Yi 1 2 X i i
Por tanto:
Yi N ( 1 2 X i , 2 )
6) Estadstico Chi-Cuadrado
El siguiente estadstico hereda la distribucin Chi-Cuadrado:
N k 2 k2
2
Junto a las propiedades 2) y 4), esta propiedad permite obtener la distribucin t-student
empricamente utilizada en las pruebas de hiptesis y en la construccin de intervalos de
confianza. Veamos cmo.
La primera propiedad estableca que:
i N ( i , 2 )
i
16
Apuntes de Econometra
Sin embargo, no es posible utilizar directamente esta propiedad para construir intervalos de
confianza o pruebas de hiptesis, en la medida que
desconocido.
i i
N (0,1)
i
Y
Z2 N k
2
k2
2
Z1
Z 2 /( N k )
i i
N k 2 /( N k )
i i
tN k
Para 1 :
t
1
Z1
Z 2 /( N k )
1 1
X i2
N x i2
1 1
t N k
X i2
N x i2
Para 2 :
t
2
Z1
Z 2 /( N k )
2 2
1
xi2
2 2
t N k
1
xi2
17
Apuntes de Econometra
i i
t / 2 ) 1
P ( t / 2 i
Entonces podemos construir un intervalo de confianza para cada uno de los parmetros del
modelo. En el caso de 1 :
1 t / 2 1 t / 2
1
X
N x
2
i
2
i
En el caso de 2 :
2 t / 2 2 t / 2
2
Donde
xi2
/ 2
( N k ) 2
1 / 2
18
Apuntes de Econometra
H 0 : i i*
H 1 : i i*
*
Utilizando el intervalo de confianza, se concluye que si i est dentro del mismo no se puede
rechazar la hiptesis nula.
Si : t i t / 2 , N k RH 0
Donde:
t i
i i*
i
Una prueba muy utilizada en nuestro modelo de regresin simple es denominada prueba de
significancia individual de X.
Explica X a Y?
H0 : 2 0
H1 : 2 0
En este caso:
t 2
2
i
Si:
t 2 t / 2 , N k RH 0
Para N - k 20 y 0.05 , se puede utilizar la siguiente regla prctica:
Si:
t 2 2 RH 0
En el caso de una prueba de 1 cola:
H 0 : i i*
H 1 : i i*
Si:
19
Apuntes de Econometra
t i t , N k RH 0
Donde:
t i
i i*
i
H 0 : i i*
H 1 : i i*
Si:
t i t , N k RH 0
Donde:
t i
i i*
i
2
i
y i2 i2
y
y
2
i
2
i
2
i
gl
STC
2
i
N 1
SEC
2
i
k 1
SRC
2
i
N k
SPC
y i2
N 1
y i2
k 1
i2
N k
Apuntes de Econometra
y /( k 1) x /( k 1) F
/( N k ) /( N k )
2
i
2
2
2
2
i
k 1, N k
2
i
N k
2
i
k 1
2
2
x E 2
22 x i2 2
2
i
2
i
2
i
( 2 2 )
2
Entonces:
Z
2
1
( 2 2 ) 2
21
Apuntes de Econometra
(N
-k)
2
2
Por tanto, bajo la hiptesis nula, y siguiendo el teorema que establece que si Z 1 y Z 2 son
variables ji-cuadradas independientemente distribuidas, con (k-1) y (N-k) grados de libertad,
respectivamente, entonces:
Z 1 /( k 1)
Fk 1 , N k
Z 2 /( N k )
22 x i2 / 2 /( k 1) 22 x i2 /( k 1)
F
Fk 1, N k
i2 / 2 /( N k ) i2 /( N k )
F
24
6
Tiene una distribucin asinttica ji-cuadrado con 2 grados de libertad (correspondientes al
coeficiente de asimetra y al coeficiente de curtosis)
En una distribucin normal S=0 (coeficiente de asimetra) y K=3 (coeficiente de curtosis).
Estos coeficientes se definen de la siguiente manera:
1
S
N
1
K
N
1
N
2
i
Prediccin
En funcin al valor X 0 es posible llevar a cabo la prediccin media de la variable
dependiente.
Es decir, se intenta estimar: E (Y0 / X 0 )
22
Apuntes de Econometra
E (Y0 / X 0 ) 1 2 X 0
Utilizando la regresin la prediccin media es:
Y0 1 2 X 0
Ntese que el valor esperado de la prediccin media coincide con:
E (Y0 / X 0 )
La varianza de prediccin es:
0 ) Var 1 2 X 0
Var( Y
0 Var 1 2Cov 1 , 2 X 0 Var 2 X 02
Var Y
X
Var Y
N x
2
i
2
i
Var Y0
X
N x
2
i
Var Y0 2
2
i
2
i
2 XX 0 2
X
N x
2
i
X2
2
i
2 XX 0
X2
2
i
1
X 02 2
2
x
i
1
X 02
2
x
i
2 XX 0
1
x i2
x i2
1
X 02
2
xi
x i2
( X X 0 )2
2 1
Var Y0
x i2
N
Por tanto,
E Y0 1 2 X 0
1 ( X X 0 )2
Var Y0 2
N
x i2
Al igual que en la construccin de intervalos de confianza para los parmetros del modelo,
resulta sencillo determinar que la prediccin tiene una distribucin t-student (utilizando el
estimador de la varianza de los errores).
Es decir:
23
Apuntes de Econometra
Y0 ( 1 2 X 0 )
t N k
ee Y0
ee Y0
1 ( X X 0 )2
N
x i2
2
Pr 1 2 X 0 t / 2 ee Y0 1 2 X 0 1 2 X 0 t / 2 ee Y0
E e (
E e 0 E ( 1 1 ) ( 2 2 ) X 0 0
0
1 ) ( 2 2 ) X 0 0
La varianza es:
Var e 0 Var ( 1 1 ) ( 2 2 ) X 0 0
Var e 0 Var 1 2 X 0 Var 0
1 ( X X 0 )2
2
2
N
x i
Var e 0 2
Var e 0
2
1 (X X0 )
1
x i2
2
De manera similar:
24
Apuntes de Econometra
Y0 Y0
t N k
ee e 0
2
1 (X X )
ee e 0 1
x i2
Pr 1 2 X 0 t / 2 ee e 0 1 2 X 0 1 2 X 0 t / 2 ee e 0 1
y X
(3)
Y1
Y2
YN
X 21
X 22
1 X 2 N
...
...
X k1
Xk2
X kN
Donde:
25
Apuntes de Econometra
E ( 2 ) 0
E 0 E
E ( N ) 0
3) Homoscedasticidad y ausencia de problemas de autocorrelacin
La matriz de varianzas y covarianzas de :
1
E ' E
2 ... N
E ( 12 )
E ( 1 2 )
E ( 2 1 )
E ( 22 )
E ( N 1 ) E ( N 2 )
...
...
...
E ( 1 N )
E ( 2 N )
E ( N2 )
i 1...N
E ( i j ) 0 i, j 1..N
i j
Por tanto:
Var ( E ( ' ) 2 I
4) X 2i , X 3i , X 4i ...., X ki son variables no estocsticas o determinsticas y, por tanto, no estn
correlacionadas con la perturbacin estocstica del modelo.
5) No existen problemas de multicolinealidad.
26
Apuntes de Econometra
A lo largo de la muestra, ninguna variable explicativa puede escribirse como una combinacin
lineal de otra o de otras variables explicativas del modelo.
Asimismo, se supone que rango de X es k (rango completo) y que el nmero de observaciones
N es mayor o igual a k.
6) El modelo est bien especificado.
7) Se aade el supuesto de normalidad de los errores.
2
tiene distribucin normal multivariada. Es decir, N (0, I )
y X
La cual premultiplicada por ' resulta en:
' y X ' y X i2
Que a su vez, puede escribirse como:
27
Apuntes de Econometra
a ' x
a
x
x ' ax
2ax
x
Por tanto:
2 X ' y 2 X ' X 0 X ' y X ' X
( X ' X ) 1 ( X ' y )
(4)
2 '
X'X
'
Es una matriz semidefinida positiva lo cual garantiza que sea un mnimo.
Propiedades de MCO bajo los supuestos del modelo lineal clsico
En el modelo de regresin demostraremos que los estimadores son MELI (MEI aadiendo el
supuesto de normalidad de los errores):
1)
( X ' X ) 1 ( X ' y )
( X ' X ) 1 ( X ' y ) g ( X ) y
2)
( X ' X ) 1 ( X ' y )
es un estimador insesgado
(5)
28
Apuntes de Econometra
(6)
Donde se han utilizado algunos de los supuestos del modelo y otros resultados:
Xs no estocsticas y por tanto no correlacionadas con
E ( ' ) 2 I
es insesgado
3)
( X ' X ) 1 ( X ' y )
dado que
( X ' X ) 1
es simtrica
Es el Teorema de Gauss-Markov
~ ~
Sea A y un estimador lineal en y alternativo.
Adems, considrese la siguiente definicin de A:
29
Apuntes de Econometra
~ ( X ' X ) 1 X '
A A
~ ( X ' X ) 1 X '
A
Xs no correlacionadas con
E ( ) 0
E ( ' ) 2 I
~ AX A ( X ' X ) 1 X '
~ A ( X ' X ) 1 X '
E ( ~ ) 0 0
~ A ( X ' X ) 1 X '
(7 )
~
La varianza de es:
30
Apuntes de Econometra
~
~
~
Var ( ) E ( )( )'
~
Var ( ) E ( A ( X ' X ) 1 X ' )( A ( X ' X ) 1 X ' )'
~
Var ( ) E A ( A )' E A (( X ' X ) 1 X ' )'
E ( X ' X ) 1 X ' )( A ' )' E ( X ' X ) 1 X ' )(( X ' X ) 1 X ' )'
~
Var ( ) E A ' A' E A ' X ( X ' X ) 1 E ( X ' X ) 1 X ' ) ' A'
2 ( X ' X ) 1
Var ( ~ ) 2 ( X ' X ) 1 AE ( ' ) A' AE ' X ( X ' X ) 1
Se puede demostrar que AA es una matriz semidefinida positiva por lo que se concluye que el
estimador alternativo tiene una varianza cuando menos igual a la varianza del estimador MCO.
Por tanto, MCO es el estimador de varianza mnima.
Resultados adicionales de la estimacin MCO
a) X ' 0
X ' X ' ( y X ) X ' y ( X ' X )( X ' X ) 1 X ' y X ' y X ' y 0
Donde se ha hecho uso de que la variable dependiente se expresa como combinacin lineal de
la lnea de regresin muestral y el error estimado:
y X
Veamos que significa este resultado
1
X
X ' 21
X k1
1
X 22
X kN
...
...
...
1
X 2 N
X kN
1
2
2i
X
i
ki
0
0
0
31
Apuntes de Econometra
Establece que la suma de los residuos estimados es igual a cero (siempre que el modelo haya
sido especificado con constante) y que la suma del producto de los residuos estimados por
cada una de las variables explicativas es de la misma manera igual a cero.
En el modelo de regresin simple habamos obtenido este resultado, el cual simplemente
hemos generalizado para el caso de k 1 variables explicativas.
b)
Por tanto,
y ' y ( X )' ( X ) ' X ' X ' X ' X ( X ' X ) 1 X ' y ' X ' y
Utilizando el resultado de la propiedad b), se obtiene:
32
Apuntes de Econometra
e) ' ' M
y ' y Y1 Y2 ... YN
Y1
Y
2
YN
Yi 2
Y1
Y2
y ' y Y1 Y2 ... YN
Y 2
i
YN
Si:
33
Apuntes de Econometra
STC (Yi Y ) 2 Yi 2 NY
STC y ' y NY
y ' y NY
De manera similar:
SEC (Yi Y ) 2 Yi 2 NY 2 y ' y NY 2
SEC y ' y NY 2
Y Y
Yi Yi i
Y Y
Y Y
i
Y Y
Por tanto,
2
34
Apuntes de Econometra
R2
Se define el coeficiente de determinacin
, como el porcentaje de la variacin total de la
variable dependiente en torno a su media (STC) explicado por la variacin explicada por el
modelo (SEC).
Por tanto, de los resultados obtenidos anteriormente:
2
R2
SEC y ' y N Y
2
STC
y' y N Y
R2 1
SRC
1
STC
' X ' y N Y
2
y' y N Y
' X ' X N Y
2
y' y N Y
'
2
y' y N Y
2
i) El R ajustado
2
Se puede demostrar que el R es una funcin creciente del nmero de variables explicativas
del modelo (es decir, de k) independientemente si las variables que se incluyan tengan poder
explicativo o no sobre la variable dependiente.
2
Para corregir esta situacin se plantea el uso del R ajustado:
R2 1
( N 1)
(1 R 2 ) f (k )
(N k)
2
El R penaliza la introduccin de variables explicativas en el modelo.
'
2
N k es un estimador insesgado de
j)
'
E
2
35
Apuntes de Econometra
Pero:
E ' N k 2
'
1
1
N k 2 2
E 2 E
E '
N k
N k
N k)
k) La normalidad de los errores aade los resultados vistos anteriormente que se generalizan
para el modelo de (k-1) variables explicativas. (
N (0, 2 I )
).
El estimador :
Yi N xi , 2
Y
i
iv)
tambin hereda la distribucin normal:
y 2
v)
son independientes entre s.
vi)
2
' ' M
(N k) 2
N2 k
2
2
N (0, 2 M )
m) Contraste de normalidad de los errores del modelo
Para contrastar la normalidad de los errores, se utiliza la prueba de Jarque-Bera.
Bajo la hiptesis nula de normalidad de errores, en muestras grandes, el estadstico JB tiene
una distribucin Ji-Cuadrada con 2 grados de libertad
36
Apuntes de Econometra
S2
JB N
(k 3) 2
24
Donde:
1
S
N
1
K
N
1
N
2
i
E i i
var( i ) 2 aii
aii
i N ( i , 2 aii )
Pruebas de hiptesis
Prueba t-student
La prueba de hiptesis para un parmetro del modelo (t-student) se puede generalizar para el
caso de (k-1) variables explicativas.
Dado que:
i N ( i , 2 aii )
, se tiene que:
Zi
i i
a ii
37
Apuntes de Econometra
2
( N k ) N2 k
2
i i
t
a ii
2
( N k ) /( N k )
2
i i
a ii
Como se estableci antes, sobre la base de este estadstico, se pueden llevar a cabo pruebas de
una o dos colas.
Bajo el razonamiento de los intervalos de confianza, tambin se pueden construir intervalos de
confianza:
( ' X ' y N Y ) /( k 1)
F
' /( N k )
R2
del modelo.
38
Apuntes de Econometra
2
R 2 /( k 1)
( ' X ' y N Y ) /( k 1) y ' y NY
F
y ' y NY 2 (1 R 2 ) /( N k )
' /( N k )
R de dimensin q x k (y de rango igual a q), tiene como elementos los coeficientes que
acompaan a cada uno de los parmetros en cada una de las restricciones.
r de dimensin q x 1, tiene como elementos los valores independientes en cada una de
las restricciones.
Bajo la hiptesis nula, el siguiente estadstico, sigue una distribucin F con q grados de
libertad en el numerador y (N-k) grados de libertad en el denominador.
' /( N k )
Esta prueba es muy poderosa en la medida que permite probar desde la hiptesis lineal ms
simple (significancia individual de algn parmetro) hasta hiptesis lineales ms complejas.
Ej: En el modelo
Yi 1 2 X 2i 3 X 3i 4 X 4i 5 X 5i i
Se desea probar la siguiente hiptesis:
2 3 1
H 0 : 3 4 0.5
1
5
39
Apuntes de Econometra
En este caso:
0 1 1 0 0
R 0 0 0 3 0
0 0 0 0 1
1
r 0.5
1
Ntese que tanto las pruebas de significancia individual, como la prueba de significancia
global son casos particulares de esta prueba.
La regla de decisin establece que si el estadstico supera los valores crticos, se rechaza la
F
hiptesis nula: Si : F > q , N k , , entonces se rechaza Ho.
( r' r nr' nr ) / q
nr' nr /( N knr )
Donde:
Fq , N k
n r ,
40
Apuntes de Econometra
Ln( L )
X'X
Ln( L )
( Ln( L ))
Ln( Ki )
Ln( Ki ) Ln( Li )
Ln( K
Ln( K
Ln(Y
) Ln( Li )
( Ln( Ki ))
Ln(Y ) Ln( L )
Ln(Y ) Ln( K )
X'y
De esta manera:
( X ' X ) 1 ( X ' y )
Var ( ) 2 ( X ' X ) 1
'
N k
b) Pruebas de hiptesis:
Existen rendimientos constantes a escala... o en otras palabras 1 2 1 ?
Existen diferentes formas de probar esta hiptesis.
41
Apuntes de Econometra
i)
Prueba t
H 0 : 1 2 1 1 2 1 0 3 0
H 0 : 1 2 1 1 2 1 0 3 0
t
3
3 0 1 2 1
ii)
R 0 1 1 r 1
y se construye el estadstico de prueba F.
' /( N k )
RH 0
42
Apuntes de Econometra
r ' r
Temas adicionales de la estimacin MCO
Prediccin de un vector de valores de la variable endgena
Queremos predecir la evolucin de la variable dependiente del modelo a lo largo de un nmero
T1 de perodos.
La proyeccin a realizarse de la variable dependiente sobre T1 de perodos es
y f ' ( y T 1 , y T 2 ,..., yT T )
1
que en trminos de las variables explicativas del modelo puede
expresarse como:
y f X F T f
Donde X F es una matriz de dimensin T1 xk que contiene los valores de cada una de las
43
Apuntes de Econometra
y f X F T
e y y f y f X F T f X F T
f
E (e y ) E ( y f y f ) E ( X F T f X F T ) E ( X F T ) E ( f ) E ( X F T )
f
E (e y ) X F T X F T 0
f
Var (e y ) 2 X F ( X T X T ) 1 X F ' 2 I
f
44
Apuntes de Econometra
Var (e y ) 2 (1 x t 1 ' ( X T X T ) 1 x t 1 )
t 1
Pr xt 1 t t / 2 var yt 1 xt 1 t xt 1t t / 2 var y t 1 1
Para la prediccin individual es:
Pr xt 1 ' t t / 2 var e y
t 1
t 1
t 1
2 : 2
RECM
1
T1
T T1
j T 1
yj
45
Apuntes de Econometra
1
T1
1
T1
T T1
( y
j T 1
T T1
y 2j
j T 1
y j )2
1
T1
T T1
j T 1
2
j
46
Apuntes de Econometra
ERRORES DE ESPECIFICACIN
Omisin de variables relevantes e inclusin de variables irrelevantes:
Planteamiento General
Sea el modelo:
y X
E ( ) 0
Var ( ) 2 I
Los supuestos del modelo clsico se mantienen pero el investigador estima errneamente:
y X 0 0 0
X0
Por tanto, concluimos que el estimador es sesgado. Entonces, en el caso general tendremos
que cuando se cometen errores de especificacin (de los tipos mencionados) el estimador
MCO ser un estimador sesgado.
En caso de no haber cometido errores de especificacin X 0 X , el estimador ser insesgado
(resultado visto anteriormente):
E ( 0 ) ( X 0 ' X 0 ) 1 X 0 ' X ( X ' X ) 1 X ' X
Apuntes de Econometra
M 0 I T X 0 ( X 0 ' X 0 ) 1 X 0 '
Tomando esperanzas:
E ( 0 ' 0 ) E ( ' M 0 ' X ' M 0 X ' M 0 X ' X ' M 0 )
E ( ' M 0 ) E ( ' X ' M 0 X )
E ( ' M 0 ) ' X ' M 0 X
2Tr ( M 0 ) ' X ' M 0 X
2 (T p ) ' X ' M 0 X
Por tanto, la varianza estimada de los errores (cometiendo errores de especificacin) es
sesgada.
'
' X ' M 0 X
1
E( 0 0 )
E ( 0 ' 0 ) 2
Tp
Tp
Tp
Si los errores de especificacin no hubieran sido cometidos:
T p T k
Y
' X ' M 0 X 0
ya que:
' X ' ( I X ( X ' X ) 1 X ' ) X ' X ' ( X X ( X ' X ) 1 X ' X ) ' X ' ( X X ) 0
Por tanto la varianza estimada de los errores ser insesgada cuando no se cometen errores de
especificacin. Se puede demostrar que el trmino ' X ' M 0 X es una matriz semidefinida
positiva. Ello implica que adems de ser sesgada la varianza (cuando se cometen errores de
especificacin), ser ineficiente respecto a una situacin en la cual no se hubieran cometido
errores de especificacin.
Omisin de variables relevantes
Sea la matriz X particionada de la siguiente manera
X X0 ;Z
Y se estima el modelo:
48
Apuntes de Econometra
y X 0 0 0
y X
E ( ) 0
Var ( ) 2 I
Donde:
X0
49
Apuntes de Econometra
0 ' 0
' X ' M 0 X
' Z ' M 0 Z z
1
)
E ( 0 ' 0 ) 2
2 z
T r
T r
T r
T r
Donde:
T r
T r
Veamos:
X
X
X
X
X
X
'
0
; z'
'
0
; z'
'
0
; z'
0
0
0
; Z ' M X ; M Z ; '
; Z ' 0; M Z ; ' 0;
; Z ' M 0 X 0 ; Z 0' ; z' '
0
'
0
'
0
'
z
'
z
' Z ' M 0 Z z
y se estima:
Yi 1 2 X 2i i
2
Pero si:
x y
x
2i
2
2i
y i 2 x 2 i 3 x 3i ( i u )
Entonces:
2i
( 2 x 2i 3 x3i ( i u ))
2
2i
x 2i x3i x 2i ( i u ))
2
2i
Tomando esperanzas:
50
Apuntes de Econometra
x22i
x22i
El sesgo es:
Sesgo ( 2 )
3 x 2 i x 3i
2
2i
2
2)
k 2)
es el
es el
R2
R
51
Apuntes de Econometra
Y se estima el modelo:
y X 0 0 0
y X
E ( ) 0
Var ( ) 2 I
Donde:
X 0 es una matriz de dimensin Tx(s+k)
52
Apuntes de Econometra
1
0
1
(X0 ' X 0 ) (X 0 ' X0 )
0
0 0 ... 0
0 0
Ik
1 0 ... 0 0 sxk
0 1 ... 0
... 0 0 ... 1
0 0 ...
1 0 ...
1 ...
...
...
...
0 kxs
Is
Se tiene que:
( X 0 ' X 0 ) 1 X 0 ' X
Ntese que la primera parte de la particin
tiene dimensin ( s k ) xk , que
Ik
0
coincide con la dimensin de sxk . Por tanto:
I
( X 0 ' X 0 ) 1 X 0 ' X k
0 sxk
Reemplazando en la definicin de
I
0 ( X 0 ' X 0 ) 1 X 0 ' X ( X 0 ' X 0 ) 1 X 0 ' k ( X 0 ' X 0 ) 1 X 0 '
0 sxk
Tomando valor esperado
E 0 E k ( X 0 ' X 0 ) 1 X 0 '
0 sxk
De manera extendida:
...
E
k 1
k s
2
...
53
Apuntes de Econometra
Se concluye que los estimadores del modelo estimado sern insesgados. El valor esperado de
los estimadores que pertenecen al modelo verdadero es igual al verdadero valor poblacional en
tanto que el valor esperado de los estimadores que no estn en el modelo verdadero es igual a
cero. La varianza estimada de los errores ser insesgada:
E(
0 ' 0
' X ' M 0 X
1
)
E ( 0 ' 0 ) 2
T (k s )
T (k s )
T (k s )
Pero:
' X ' M 0 X
0
T (k s )
Demostracin:
Ik
0 s* x
Pero:
Ik
X
0 sxk
X0
Pero se estima:
Yt 1 2 X t 3 Z t t
X0
1 XT
Z1
1 X1
1 0
X ;
0 1
0 s*k
1 XT
0 0
;
Z T
Ik
X0
Finalmente, cabe sealar que para detectar problemas de variables irrelevantes basta
considerar las pruebas t y F rutinarias.
54
Apuntes de Econometra
Errores de Medida
En la variable dependiente del modelo
Sea el siguiente modelo verdadero:
Yt 1 2 X t t
*
*
Pero, problemas de medicin, se utiliza Yt en vez de Yt donde Yt Yt t y t es una
perturbacin estocstica con valor esperado igual a cero, homoscedstica, con varianza igual a
2 y no autocorrelacionada. Tampoco est correlacionada con la perturbacin estocstica del
v2 2 2
Sin embargo, pese a esta prdida de eficiencia, la estimacin MCO genera estimadores MELI
(MEI y consistentes suponiendo normalidad de los errores del modelo).
Errores de medida en la(s) variable(s) explicativa(s) del modelo
Sea el siguiente modelo verdadero:
Yt 1 2 X t t
*
*
Pero, problemas de medicin, se utiliza X t en vez de X t donde X t X t t y t es una
perturbacin estocstica con valor esperado igual a cero, homoscedstica, con varianza igual a
2 y no autocorrelacionada. Al igual que t tampoco est correlacionada con la perturbacin
55
Apuntes de Econometra
Yt 1 2 X t t
Yt 1 2 ( X t* t ) t
Yt 1 2 X t* 2 t t
Yt 1 2 X t* t
En este caso el error de medida, tendr consecuencias ms serias. Adems de producir
ineficiencia de los estimadores, la estimacin por MCO ser sesgada e inconsistente. Igual que
en el caso anterior, la varianza de la perturbacin del modelo estimado tendr dos
componentes: la varianza del modelo original y la varianza derivada del error de medicin. Es
decir:
2 2 22 2
La variable explicativa del modelo, estar correlacionada con la perturbacin estocstica del
modelo, lo cual viola uno de los supuestos importantes del modelo lineal clsico. Veamos:
Cov( X t* , t ) E ( X t* E ( X t* ))( t E ( t )) E ( t )( 2 t t )
t 2 t t E ( t ) E ( 2 t t ) 0 t E ( t ) 2 t t
Para resolver el problema de sesgo e inconsistencia del estimador, se recurre a otro mtodo de
estimacin. Uno muy conocido es el denominado mtodo de variables instrumentales (tema a
ser visto ms adelante).
56
Apuntes de Econometra
PRUEBAS DE ESTABILIDAD
A continuacin veremos una serie de pruebas de estabilidad aplicables a los parmetros del
modelo estimado.
Prueba de cambio estructural de Chow
Esta prueba es utilizada cuando el investigador sospecha que a partir de un momento en el
tiempo o para un conjunto de observaciones, los parmetros del modelo han cambiado (son
diferentes).
Algunos ejemplos de estos cambios podran ser: el consumo de la economa en perodos
normales versus en perodos de guerra, la demanda diferenciada de un bien en funcin a cierta
cualidad (sexo, educacin, edad, etc.), cambios en las variables debido a cambios
institucionales o en la regulacin, etc.
Metodologa
En una muestra de series de tiempo supngase que se sospecha de un cambio estructural a
partir del perodo t1 1 .
Para verificar la sospecha definamos el modelo restringido y no restringido:
Modelo restringido
y t xt
t 1,2....t1 , t1 1,......T
Modelo no restringido
y t xt
y t xt
t 1,2....t1
t t1 1,......T
t1 observacio nes
t 2 observacio nes
57
Apuntes de Econometra
2) Estimar las dos ecuaciones del modelo no restringido, cuyas sumas de residuos al
cuadrado se denominan SRC 2 y SRC 3 . SRC 2 tiene t1 k grados de libertad.
En tanto que SRC 3 tiene t 2 k .
3) Calculamos SRC 4 SRC 2 SRC 3 que tiene t1 t 2 2k T 2k grados de libertad.
4) Luego, calculamos SRC 5 SRC 1 SRC 4 que como puede comprobarse de manera
simple, tiene k grados de libertad.
5) Bajo la hiptesis nula de que no existe cambio estructural, el siguiente estadstico,
tiene una distribucin F con k grados de libertad en el numerador y T 2k grados de
libertad en el numerador:
SRC 5 / k
SRC 4 / T 2k
F Fk ,T 2 k ,
t y t x't t 1
Donde t no es ms que el error de proyeccin en t calculado en base a la estimacin del
58
Apuntes de Econometra
~ N (0, 2 )
Bajo la hiptesis de estabilidad, t
y que este error es independiente de
~
s s t , el estadstico CUSUM ( Wt ) permite contrastar la hiptesis de estabilidad.
Se construye de la siguiente manera:
Wt
r k 1
~r / ~ ~
1
T k
r k 1
( ~r ) 2
1
T k
r k 1
Se puede demostrar que bajo la hiptesis nula de estabilidad, el estadstico Wt tiene una
distribucin normal con valor esperado igual a cero y varianza igual al nmero de residuos
W
acumulados. Se construyen bandas de confianza para t mediante lneas rectas que unen los
puntos k , a T k y T ,3a T k donde al 95% de confianza donde se ha calculado
a=0.948.
Al 99% el clculo corresponde a a=1.143. Se rechaza la hiptesis nula si Wt traspasa las
bandas.
El CUSUMQ se construye en base a los cuadrados de los residuos normalizados:
t
St
2
r
2
r
r
T
r
Cada trmino de la sumatoria tiene distribucin Ji-cuadrado con un grado de libertad. Dado
tk
E (S t )
T k
que son independientes, se puede demostrar que
El contraste consiste en dibujar S t , as como las lneas que limitan su banda de confianza.
El intervalo consiste en:
59
Apuntes de Econometra
st c0
Los valores de
c0
t k
T k .
60
Apuntes de Econometra
61
Apuntes de Econometra
El modelo en este caso es igual al anterior pero la interpretacin es diferente. int mide el
efecto incremental de tener educacin intermedia y sup mide el efecto incremental de tener
educacin superior.
En el modelo anterior, las deltas medan los efectos totales de cada nivel de educacin sobre el
nivel base.
Utilizando variables dummy es posible construir hacer una regresin por secciones.
En un modelo de regresin simple se tiene un punto de quiebre en
cambio en la pendiente y en el intercepto).
X*
(que determina un
1 2 X * 1 1 2 X * 2 X *
Por tanto,
1 2 X *
Reemplazando en el modelo original:
Yi 1 2 X i 2 X * Di 2 X i Di i
Yi 1 2 X i 2 Di ( X i X * ) i
62
Apuntes de Econometra
Este ejemplo tambin nos da pautas de que las variables dummy pueden ser utilizadas para
probar la existencia de cambios estructurales.
Finalmente, se pueden construir modelos combinando varias caractersticas.
Por ejemplo, en el modelo de salarios presentado anteriormente (en su primera versin),
incluimos la variable dummy sexo S i que toma el valor de 1 si la observacin i-ava es mujer y
0 en otro caso:
Wi x i int Dint,i sup Dsup,i 1 S i i
En este modelo, el efecto incremental del sexo es el mismo independiente del nivel de
educacin.
Este supuesto podra no ser realista; es de esperar que cambiar de sexo tendr mayores efectos
en el salario en funcin al nivel de educacin.
Estos son efectos de interaccin en el modelo, que pueden ser incorporados reformulando el
modelo:
Wi x i int Dint,i sup Dsup,i 1 S i 1 Dint,i S i 2 Dsup,i S i i
63
Apuntes de Econometra
Multicolinealidad
En el modelo de regresin y X suceden problemas de multicolinealidad cuando una de
las variables explicativas del modelo se puede escribir de manera exacta o aproximada como
una combinacin de alguna o de algunas de las variables explicativas restantes del modelo (o
de todas).
En el caso de multicolinealidad exacta existe una solucin distinta de la trivial para la
siguiente ecuacin:
X 1i 2 X 2i 3 X 3i 4 X 4i ... k X ki 0 i 1..N
donde para representar la constante, podemos decir X 1i 1 i 1..N .
Cabe recordar que la solucin trivial para el sistema es: 2 3 ... 0
En el caso de multicolinealidad aproximada existe una solucin distinta de la trivial para la
siguiente ecuacin:
X 1i 2 X 2i 3 X 3i 4 X 4i ... k X ki vi 0 i 1..N
donde
vi
En este caso decimos que una de las variables explicativas puede ser escrita como una
combinacin lineal aproximada de una o de varias de las otras variables explicativas del
modelo.
Esta variable tambin responde a la perturbacin estocstica
aleatoria).
Multicolinealidad exacta
Cuando existe multicolinealidad exacta la matriz X deja de tener rango completo igual a k.
El rango de la matriz X es menor a k.
Ello implica, por una propiedad de matrices, que tambin la matriz X ' X tiene un rango
menor a k.
Recordemos que la solucin del modelo de regresin existe siempre que
existe siempre que sea una matriz de rango completo igual a k.
( X ' X ) 1
exista y
64
Apuntes de Econometra
Por tanto, la consecuencia del problema de multicolinealidad exacta es que la solucin del
( X ' X ) 1 X ' y
modelo, dada por
no existe dado que ( X ' X ) es singular.
Veamos un ejemplo sencillo:
Yi X i i
i 1...N y se cumple X i
En este caso, la variable explicativa es una combinacin lineal del 1 que acompaa a la
1
Xi 1
constante del modelo:
En este caso, se observa que la matriz X es:
1 X1
X
1 XT
1
1
X'X
( X ' X ) 1
no existe.
i 1..N
X 2i cX 3i
donde c es una
Apuntes de Econometra
N
X ' X c X 3i
X 3i
c X 3i
c 2 X 3i
c X 32i
X
c X
X
3i
2
3i
2
3i
se puede observar claramente que la tercer columna es una combinacin lineal de la segunda
columna.
Ello implica que el rango de la matriz es igual a 2, y por tanto la matriz inversa de
existe.
(X ' X )
no
Sin embargo, ntese que el modelo puede ser en parte estimado. Introduciendo la relacin
entre las dos variables explicativas del modelo, se tiene que ste queda de la siguiente manera:
Yi cX 3i 3 X 3i i 1..N
Yi ( c 3 ) X 3i
En esta transformacin del modelo, ya no existen problemas de multicolinealidad.
Sin embargo, slo se puede estimar de manera nica la constante del modelo. Asimismo se
( c 3 )
estima la combinacin lineal
.
Condicionado en el valor de un parmetro del modelo que acompaa a una de las variables
explicativas se puede estimar el otro parmetro que va junto a la otra variable explicativa.
Las varianzas de cada uno de los modelos tampoco se pueden estimar de manera nica.
Cmo se detecta el problema de multicolinealidad exacta?
La forma de detectar este problema es muy sencilla pues la solucin de mnimos cuadrados no
existe.
Cuando existe este problema es generalmente atribuible a una mala construccin del modelo
por parte del investigador (nmero insuficiente de observaciones) o la trampa de la variable
dicotmica.
Multicolinealidad aproximada
La multicolinealidad aproximada tambin es un problema. Pero a diferencia de la
multicolinealidad exacta no es tan fcil de detectar.
66
Apuntes de Econometra
a *b z
a
0
.
001
b 5000 z 5
Si
a *b z
0.001 * 5000 5
0.002 * 2500 5
Bajo un razonamiento similar aplicado a matrices, tenemos que en la derivacin del estimador
de mnimos cuadrados ordinarios habamos llegado a:
( X ' X ) X ' y
dado que el determinante de (XX) es prximo a 0 (es el trmino a en la expresin anterior),
se concluye que pequeos cambios en esta matriz, producirn grandes cambios en (es
similar al trmino b en la expresin escalar), si es que se decide mantener la matriz resultante
constante, es decir X ' y constante ( es similar al trmino z en la expresin escalar).
Resumiendo, se dice que la solucin est mal definida porque cuando existen problemas de
multicolinealidad aproximada, pequeos cambios en la matriz ( X ' X ) producirn cambios
importantes en los parmetros estimados del modelo.
67
Apuntes de Econometra
( X ' X ) 1
68
Apuntes de Econometra
R X2
(1 R X2
j .X2
, X 3 ,... X k
j .X 2 ,X3
,... X k
/( k 2)
) /( n k 1)
69
Apuntes de Econometra
La crtica a esta prueba es que la misma puede ser insuficiente si se quieren detectar
multicolinealidades de naturaleza compleja.
En lugar de llevar a cabo la prueba F, se puede adoptar la regla de Klein que establece que
R2
R2
si el
de una regresin auxiliar en particular es mayor al
del modelo original, ello es
evidencia de multicolinealidad.
d) ndice de condicin
Se puede diagnosticar la presencia de multicolinealidad a partir de los valores propios de la
matriz estandarizada XX.
El ndice de condicin se calcula de la siguiente manera:
IC
IC
0.1
Por tanto, utilizando esta informacin a priori
Yi 2 X 2i 0.1 2 X 3i i
Yi 2 ( X 2i 0.1X 3i ) i
X 4 i X 2 i 0 .1 X 3 i
Yi X 4i i
70
Apuntes de Econometra
71
Apuntes de Econometra
x y
x
2i
2
2i
2i
( x 2i 3 x 3i i )
2
2i
x x
x
2i
3i
2
2i
x
x
2i
2
2i
Bajo los supuestos del modelo lineal clsico y utilizando el operador esperanza, se tiene
que:
E ( ) E 3
x x
x
2i
2
2i
3i
x
x
2i
2
2i
E E 3
E ( ) 3
x x
x
2i
2
2i
3i
x x
x
2i
2
2i
3i
x
x
2i
2
2i
72
Apuntes de Econometra
x x
x
2i
3i
2
2i
Como se ve, este depende de las observaciones de las variables explicativas y del parmetro
poblacional .
4)El modelo en primeras diferencias
Una solucin para el modelo, podra ser correr una regresin del mismo sobre las primeras
diferencias:
Yt 2 X 2t 3 X 3t t
Rezagando un perodo, el modelo se escribe como:
Yt 1 2 X 2t 1 3 X 3t 1 t 1
Restando a la primera ecuacin, la segunda de stas, se tiene el modelo en diferencias:
Yt Yt 1 2 X 2t 2 X 2t 1 3 X 3t 3 X 3t 1 t t 1
Yt 2 X 2t 3 X 3t t
Yt 2 X 2t 3 X 3t t
Si el modelo original tena un problema de multicolinealidad, es muy probable que este
modelo en diferencias no tenga dicho problema.
Pero tiene un problema serio.
y X
73
Apuntes de Econometra
c ( X ' X cI k ) 1 X ' y
Analizando detenidamente la expresin, se tiene que el estimador cresta, es una versin
1
modificada del estimador de MCO, al cual, en la diagonal de la matriz ( X ' X ) se suma
una constante c.
Este estimador es sesgado pero con menor error cuadrtico medio que el estimador MCO.
Sin embargo, la direccin del sesgo es desconocida.
La matriz de varianzas y covarianzas es:
Var ( c ) ( X ' X cI k ) 1 X ' X ( X ' X cI k ) 1
Si se elige c de alguna manera ptima, la varianza obtenida puede ser menor a la de MCO.
Una forma de elegir c es de tal manera que se solucionen los problemas de mala definicin
del estimador, es decir que pequeos cambios en XX (a travs de variaciones en c), no
cambien dramticamente la estimacin de los parmetros.
Comentarios finales sobre la multicolinealidad
Sin embargo:
o Subsiste el problema de definicin.
Si bien los estimadores son insesgados, pequeos cambios en la muestra pueden generar
cambios importantes en los estimadores
o Si bien siguen siendo de mnima varianza, el problema de multicolinealidad ocasiona
que las varianzas tiendan a ser grandes (mnima, no quiere decir chica).
74
Apuntes de Econometra
Un cambio de muestra podra ser la solucin ... es fcil obtener una nueva muestra?
R2
75
Apuntes de Econometra
Heteroscedasticidad
Naturaleza y causas
i 1..N
Sin embargo, un caso ms general para nuestro modelo de regresin es cuando las varianzas
de los errores del modelo no son constantes. Es el caso de la heteroscedasticidad. Es decir:
Var ( i ) E ( i2 ) i i 1..N
Grficamente, el caso de la heteroscedasticidad, se representa de la siguiente manera:
76
Apuntes de Econometra
Habida cuenta de que solamente contamos con una muestra de datos, slo veremos una serie
de reglas prcticas para detectar problemas de heteroscedasticidad. Si tuviramos a
disposicin la poblacin, la tarea de diagnstico sera mucho ms sencilla.
77
Apuntes de Econometra
a) Mtodo grfico
Es un mtodo informal
Para verificar problemas de heteroscedasticidad, se estima el modelo y se obtienen los
2
residuos estimados del modelo elevados al cuadrado: i .
En el caso del ejemplo del modelo de consumo e ingreso, el problema de
heteroscedasticidad estaba generado por la variable explicativa ingreso. Segn el
mismo, a mayor ingreso, mayor variabilidad de los ingresos.
En este ejemplo, utilizando un diagrama de dispersin, se esperara encontrar una
2
2
relacin entre i y el ingreso. Cabe notar que cada i es una variable proxy a la
varianza correspondiente a cada i .
Por tanto, el mtodo grfico consiste en llevar a cabo un diagrama de dispersin entre
los errores estimados del modelo elevados al cuadrado y una o ms de las variables
explicativas del modelo y observar si existe algn patrn sistemtico. Una relacin
positiva o negativa sera indicio de problemas de heteroscedasticidad. Alternativamente
a las variables explicativas del modelo, tambin podemos utilizar la variable Yi que es
una combinacin de las variables explicativas del modelo.
b) Prueba de Park
Prueba ms formal que tiene elementos de evaluacin menos subjetivos que el
mtodo grfico.
Supone que la heteroscedasticidad est determinada por una de las variables
explicativas del modelo. Digamos por X 2i
La metodologa de la prueba es la siguiente:
78
Apuntes de Econometra
2
o Primera etapa: Estimar el modelo original y obtener i
o Segunda etapa: Si se plantea una estructura de heteroscedasticidad del
siguiente tipo:
i X 2i e
Aplicando logaritmos:
ln( i ) ln( ) ln( X 2i ) i
i
2
estimar este modelo reemplazando ln( i ) por ln( i ) .
o Tercera etapa: Bajo el supuesto de homoscedasticidad, el parmetro
debera ser cero, de tal manera que la varianza de cada perturbacin
estocstica del modelo original sea constante (ms un componente
puramente aleatorio). Es decir:
ln( i ) ln( ) i
o Para verificar la hiptesis nula, la tercera etapa consiste en llevar a cabo una
prueba t de student de significancia individual sobre el parmetro .
Utilizando la regla de decisin correspondiente, se concluye sobre la
existencia o no de heteroscedasticidad.
Entre los inconvenientes ms visibles de esta prueba, estn dos: i) la prueba
depende del supuesto de que la heteroscedasticidad se produce por X 2i . La
estructura de la heteroscedasticidad podra ser otra ii) i puede no ser
homoscedstico.
f ( X 2i ) 2 X 2i
2
i
79
Apuntes de Econometra
d) Prueba de Glesjer
Esta prueba es muy similar en su concepcin a la de Park. Sin embargo, permite
probar la existencia de homoscedastidad sobre un conjunto ms grande de formas
funcionales.
Supone tambin que la heteroscedasticidad est determinada por la variable Z i
que puede ser o no una de las variables explicativas del modelo.
La metodologa de la prueba es la siguiente:
i , i2
o Primer paso: Estimar el modelo original y obtener
o Segunda etapa: Efectuar regresiones utilizando como
i2
dependientes i
que estn en funcin de :
0 1 Z ih t
donde h :
variables
80
Apuntes de Econometra
h 1,1, 1 / 2, 1 / 2
e) Prueba Breush-Pagan-Goodfrey
En el modelo: y X sospechamos que existe un problema de
heteroscedasticidad cuya estructura es la siguiente:
i f ( Z 2i , Z 3i ,..., Z mi , i )
suponiendo linealidad:
i 2 Z 2i 3 Z 3i ... m Z mi i
No existe problemas de heteroscedasticidad bajo la siguiente hiptesis nula:
2 3 ... m 0
Los pasos de la prueba son los siguientes:
Primer paso: Estimar el modelo y obtener los residuos estimados del mismo:
1 , 2 , 3 ..., N
Segundo paso: Obtener la siguiente estimacin de la varianza
N
i 1
2
i
N
Calcular a lo largo de toda la muestra:
i2
pi 2
81
Apuntes de Econometra
Sin embargo, adems de ser una prueba asinttica, la misma es limitante debido al
supuesto de normalidad de los errores del modelo original.
X 22i , X 32i ) as
X 2 i X 3i )
R2
de la regresin anterior.
NR 2
o Cuarto paso: Bajo la hiptesis nula de homoscedasticidad, el estadstico
, se
distribuye asintticamente ji-cuadrado con grados de libertad iguales al nmero
de regresoras de la ecuacin estimada en el segundo paso. Por tanto, si
NR 2 l2,
donde l es el nmero de regresoras del segundo paso (excluyendo la
constante) entonces rechazamos la hiptesis nula de homoscedasticidad.
Algunos de los inconvenientes de esta prueba son: la introduccin de trminos
cuadrticos o cruzados puede aumentar excesivamente los regresiones en la ecuacin
auxiliar; existe una hiptesis conjunta (heteroscedasticidad / errores de
especificacin) y si bien no se necesita explicitar la estructura de la
heteroscedasticidad, ello tambin es una desventaja en la medida que una vez
detectada la heteroscedasticidad, no sabremos cmo solucionar el problema.
82
Apuntes de Econometra
Autocorrelacin
Uno de los supuestos del modelo clsico establece que:
Cov( t , t s ) 0 s 0 t 1,2..T
Es decir no existe relacin ninguna entre las perturbaciones estocsticas del modelo (Errores
no correlacionados)
Sin embargo, si tal relacin de dependencia existe, se habla de autocorrelacin.
Es un fenmeno mucho ms frecuente en series de tiempo que en series de corte transversal.
Causas
83
Apuntes de Econometra
i. Suavizamiento de series
ii. Interpolacin y extrapolacin
iii. Transformacin de datos
6. No estacionariedad (Tema a ser visto ms adelante)
Formas de detectar problemas de autocorrelacin
a) Mtodo grfico
La autocorrelacin implica que:
t f ( t s ) s 0
El caso ms analizado en la literatura es el proceso autorregresivo de orden uno o AR(1),
donde el error del modelo depende del error del modelo rezagado en un perodo bajo la
siguiente estructura:
homosceds tico
t t 1 t t N (0, 2 )
No autocorrel acionado
1 1 (Condicin de estacionariedad)
para un modelo del tipo y X . Las propiedades de t determina que se lo conozca
como trmino de error ruido blanco.
El mtodo grfico consiste en estimar primeramente el modelo original y luego llevar a
cabo un diagrama de dispersin donde los errores estimados estn en funcin de los errores
estimados rezagados. Un patrn sistemtico en este grfico ser indicio de autocorrelacin.
Alternativamente, se pueden graficar los residuos estimados del modelo contra el tiempo.
Un patrn sistemtico ser evidencia de autocorrelacin.
84
Apuntes de Econometra
dw
(
t 2
t 1 ) 2
t
T
t 2
2
t
2
dw
t 1
t 1
pero como:
2
t
Por tanto,
2
t 1
t t 1 2(1 )
dw 2 1
Por tanto:
0 dw 4
85
Apuntes de Econometra
c)
Prueba asinttica
Puede demostrarse que bajo la hiptesis nula de ausencia de autocorrelacin ( tipo AR(1)),
el estadstico:
T
tiene una distribucin asinttica N(0,1). La regla de decisin determina que si:
T Z c , / 2
a un nivel de significancia , entonces rechazamos la hiptesis nula.
86
Apuntes de Econometra
d) Prueba h de Durbin
Cuando el rezago de la variable dependiente se incluye como variable explicativa, Durbin
propuso esta prueba. Bajo la hiptesis nula de ausencia de autocorrelacin tipo AR(1), el
estadstico h tiene asintticamente una distribucin N(0,1):
T
h
1 T * var( 2 )
e) Prueba de Breusch-Godfrey
Es tambin una prueba asinttica, que sin embargo, tiene algunas ventajas respecto a las
pruebas anteriores.
Se utiliza para probar la existencia de autocorrelacin hasta de orden p. Es decir, un proceso
autorregresivo para las perturbaciones estocsticas del modelo, expresado de la siguiente
manera:
t 1 t 1 2 t 2 3 t 3 ... p t p
Se lleva a cabo, siguiendo los siguientes pasos:
Paso 1: Estimar el modelo original utilizando MCO y obtener los residuos estimados del
modelo.
Paso 2: Llevar a cabo la regresin:
t X 1 t 1 2 t 2 3 t 3 ... p t p
Notar que en esta estimacin se pierden T p observaciones.
R2
Paso 3: Obtener el
de esta regresin auxiliar.
Paso 4: Calcular el estadstico:
(T p ) * R 2
2 3 ... p 0
Bajo la hiptesis nula de ausencia de autocorrelacin 1
, este
p
estadstico tiene una distribucin asinttica ji-cuadrada con grados de libertad.
Paso 5: La regla de decisin establece que si:
(T p) * R 2 2p ,
entonces se rechaza la hiptesis nula.
Esta prueba tiene grandes ventajas sobre las pruebas anteriores en la medida que no parte
de supuestos tan restrictivos. Sin embargo, presenta la dificultad de cmo determinar el
orden de autocorrelacin a probar (es decir el valor de p). Adems es una prueba asinttica.
87
Apuntes de Econometra
f) Prueba Q de Box-Pierce
Es tambin una prueba utilizada para verificar la existencia de procesos autorregresivos de
orden p. El estadstico Q, bajo la hiptesis nula de ausencia de autocorrelacin
1 2 3 ... p 0
, tiene una distribucin asinttica ji-cuadrada con p grados de
libertad. Q se define de la siguiente manera:
p
Q T 2j
j 1
donde:
T
t j 1
Q 2p ,
t j
t 1
Si
2
t
Una correccin de muestras pequeas, est dada por el estadstico Lyung-Box. Bajo la
2 3 ... p 0
hiptesis nula 1
, el estadstico Q, tiene una distribucin jicuadrado con p grados de libertad.
p
2j
Q' T (T 2)
j 1 T j
Si
Q' 2p ,
21
12 ... 1N E 2
E 1 2 ... E 1 N
2
22
... 2 N E 2 1
E 22
... E 2 N
2
var(
E '
2
E N2
N 1 N 2 ... NN E N 1 E N 2 ...
Recordemos que bajo homoscedasticidad los trminos de la diagonal son constantes
2
(iguales a
) mientras que bajo ausencia de autocorrelacin, los trminos fuera de la
88
Apuntes de Econometra
diagonal son iguales a cero. La suma de estos dos supuestos determina que la matriz sea
var( I
igual a una matriz identidad de dimensin N de tal manera que
.
Bajo la forma ms general para la varianza de los errores, los resultados encontrados,
utilizando los supuestos del modelo clsico, no se modifican en algunos casos pero s en
otros (se mantienen los dems supuestos del modelo):
a) La solucin MCO para los parmetros del modelo es la misma. Es decir,
var(
independientemente de que
:
( X ' X ) 1 X ' y
Para ello, volviendo a lo encontrado en clases anteriores, hay que notar que la solucin
de MCO no depende de los supuestos realizados sobre la estructura de la matriz de
varianzas y covarianzas de los errores.
b) El estimador MCO sigue siendo insesgado independientemente de la estructura de la
matriz de varianzas y covarianzas. Para la demostracin de esta propiedad, revisando
tambin los apuntes anteriores, concluimos que tampoco se necesita tomar en cuenta la
estructura de la matriz de varianzas y covarianzas de los errores.
var(
c) La varianza de los parmetros bajo
s se modifica cuando existen
problemas de autocorrelacin y/o heteroscedasticidad.
Bajo la estructura general planteada anteriormente se encuentra que:
Var ( ) 2 ( X ' X ) 1 X ' X ( X ' X ) 1
Demostracin:
89
Apuntes de Econometra
Py PX P
Definamos:
y * Py
X * PX
* P
Por tanto,
y* X *
Tenemos que:
90
Apuntes de Econometra
2 P P ' 2 I
Ntese que si existe una P con la caracterstica mencionada, habremos logrado transformar
(multiplicando por dicha matriz) un modelo autocorrelacionado y/o heteroscedstico en un
modelo libre de estos problemas, que cumple con todos los supuestos requeridos por el
modelo lineal clsico.
Como es una matriz simtrica y definida positiva, respondemos afirmativamente a la
2 PP' 2 I
pregunta. Es decir, s existe una matriz P tal que
2 P P ' 2 I
V 1
lo cual demuestra que la matriz P buscada que cumple con
es la matriz
.
Ntese adems que:
1 (VV ' ) 1 V ' 1 V 1
Aplicando propiedades de matrices inversas.
V 1
Conocida la matriz
llevamos a cabo la transformacin sugerida anteriormente y
obtenemos un modelo transformado que cumple con todos los requisitos del Modelo Lineal
Clsico.
El estimador obtenido de esta manera se denomina estimador de Mnimos Cuadrados
Generalizados (MCG). Ntese que MCG no es ms que la estimacin MCO a un modelo
transformado que cumple con los supuestos del modelo lineal clsico. Es decir:
y* X *
Var ( ) 2 I
Ntese que la matriz de parmetros es la misma que la del modelo original. El estimador
es, por tanto:
91
Apuntes de Econometra
Propiedades
El estimador MCG al ser un MCO aplicado sobre un modelo transformado hereda todas las
propiedades de cualquier estimador MCO. Es decir, el estimador MCG es:
a) Lineal
b) Insesgado
c) De varianza Mnima (MELI)
*
Asumiendo normalidad en los errores
, tambin heredar las dems propiedades
2
N ( , ( X ' X ) 1
(consistencia, MEI, MCG
, etc.).
Otros resultados son:
1.
2.
3.
2
MCG
2
MCG
* ' * ' 1
2
N k
N k es un estimador insesgado de .
2
El R calculado del modelo transformado no es vlido para el modelo original:
2
y*
a. El R es vlido para la variable transformada del modelo
y no para y .
la matriz
' 1 /( N k )
no es conocida.
92
Apuntes de Econometra
Var ( )
2
12
0
22
N2
i 1..N
0
2
2
Var ( )
0
2
X 22
X 22N
1
X
21
V 1
0
1
X 22
V 1V ' 1 I
1
X 2N
93
Apuntes de Econometra
Y1
X 21
Y2
y* X
22
YN
X
2N
1
2
X 2i
1
X 21
1
X 22
1
X 2N
1 ...
1 ...
1 ...
1
X 2i
...
X 'y
*
X kN
X 2N
X ki
2
2i
Yi
X
Y
X
... ki
X 2i
X ki2
X2
2i
X *' X *
X k1
X 21
X k2
X 22
2i
Yi X ki
X 2i
Yi
X
X
1
1
2 3 3i ... k Ki i
X 2i
X 2i
X 2i
X 2i X 2i
Ntese que en este modelo transformado, la varianza, como era de esperar, resulta
homoscedstica:
1
1
Var ( i ) 2 Var ( i ) 2 2 X 22i 2
X 2i
X 2i
X 2i
94
Apuntes de Econometra
t t 1 t
E ( t ) 0 Var ( t ) 2
Cov( t , t s ) 0 t 1..T
s 0
imponiendo:
(condicin de estacionariedad)
t t 1 t ( t 2 t 1 ) t 2 t 2 t 1 t
t 2 ( t 3 t 2 ) t 1 t 3 t 3 2 t 2 t 1 t
t 3 ( t 4 t 3 ) 2 t 2 t 1 t 4 t 4 3 t 3 2 t 2 t 1 t
...
t s t s s 1 t ( s 1) ... 4 t 4 3 t 3 2 t 2 t 1 t
s t s 0
1
cuando s , entonces
dado que
. De esta manera, obtenemos una
expresin para la perturbacin del modelo donde depende nicamente del valor actual y de
los valores rezagados de t :
t s t s ... 4 t 4 3 t 3 2 t 2 t 1 t
El valor esperado de t ser igual a cero dado que uno de los supuestos del modelo es que
E ( t ) 0 t 1..T :
E ( t ) E ( s t s ... 4 t 4 3 t 3 2 t 2 t 1 t )
E ( t ) s E ( t s ) ... 4 E ( t 4 ) 3 E ( t 3 ) 2 E ( t 2 ) E ( t 1 ) E ( t )
E ( t ) 0
95
Apuntes de Econometra
2
Por tanto, Var ( t ) E ( t ) . Es decir,
E ( t2 ) E ( s t s ... 4 t 4 3 t 3 2 t 2 t 1 t ) 2
(1)
A
l distribuir el valor esperado en cada uno de los trminos de la anterior expresin tenemos
que en el caso de los trminos cuadrticos se obtiene el siguiente resultado:
E ( t2 s ) ... E ( t24 ) E ( t23 ) E ( t2 2 ) E ( t21 ) E ( t2 ) 2
mientras que la esperanza de todos los trminos cruzados es igual a cero dado que se ha
Cov( t , t s ) 0 t 1..T s 0
supuesto que:
.
Por tanto,
E ( t2 ) 2 (1 2 4 6 8 ....)
1
1 2
Var ( t ) E ( t2 )
2 t 1..T
1 2
tanto,
. Ntese que la varianza encontrada es
2
homoscedstica dado que y son constantes poblacionales que no varan a lo largo de
la muestra.
La covarianza Cov( t t 1 ) E ( t t 1 ) se define como:
E ( t t 1 ) E ( s t s ... 3 t 3 2 t 2 t 1 t )( s t s 1 ... 3 t 4 2 t 3 t 2 t 1 )
E ( t t 1 ) 2 (1 2 4 6 8 ....)
2
2
1 2
96
Apuntes de Econometra
E ( t t 2 ) E ( s t s ... 3 t 3 2 t 2 t 1 t )( s t s 2 ... 3 t 5 2 t 4 t 3 t 2 )
E ( t t 2 ) 2 2 (1 2 4 6 8 ....) 2
2
2 2
1 2
...
Generalizando:
La covarianza
Cov( t t (T 1) ) E ( t t (T 1) )
E ( t t (T 1) ) T 1
es:
2
T 1 2
1 2
T 1
T 2
2 ... T 1
... T 2
1 ... T 3
...
1
donde:
Var ( ) 2
Afortunadamente la matriz depende solamente de un parmetro que es . Se puede
demostrar que:
1
1 2
...
...
0
0
0
0
0
0
...
1 2
... 1 2
...
V 1
97
Apuntes de Econometra
(1 2
0 ...
0 ...
1 ...
0
0
0
0
0 ...
dw
2
t t 1 t
Rezagando el modelo un perodo y multiplicando el resultado por obtenemos:
Yt 1 1 2 X 2t 1 ... k X kt 1 t 1
Restando esta expresin al modelo original y llevando a cabo algunas operaciones
algebraicas, logramos obtener un modelo libre de autocorrelacin:
Yt Yt 1 1 1 2 X 2t 2 X 2t 1 ... k X kt k X kt 1 t t 1
Yt Yt 1 1 (1 ) 2 ( X 2t X 2t 1 ) ... k ( X kt X kt 1 ) t
Yt 1 (1 ) 2 ( X 2t X 2t 1 ) ... k ( X kt X kt 1 ) Yt 1 t
Para obtener una estimacin de , estimamos la ltima de estas ecuaciones. Ntese que
la estimacin que buscamos es el coeficiente que acompaa a la variable dependiente
rezagada.
98
Apuntes de Econometra
c) Se estima el modelo original, obtenindose los residuos estimados. Luego se halla una
estimacin de , llevando a cabo la siguiente estimacin por MCO:
t t 1 t
Utilizando estas estimaciones de aplicamos MCG que al haber utilizado una
estimacin de se denomina MCG factibles.
La utilizacin de estos mtodos es equivalente a medida que la muestra se hace ms
grande.
Una implicacin muy importante sobre la utilizacin de MCG factibles es que las
2
pruebas t , F y
son vlidas solamente para muestras grandes por lo que la utilizacin
de MCG factibles es recomendable para muestras grandes.
Consideraciones alternativas para la estimacin bajo autocorrelacin
y/o heteroscedasticidad
En el caso de heteroscedasticidad
a) Se pueden reducir los problemas de heteroscedasticidad transformando el modelo
original en logaritmos.
b) Un problema surge cuando no es conocida o no se est seguro o segura de la estructura
de la heteroscedasticidad (no se conoce la variable que est generando el problema). Se
puede resolver el problema estimando MCG usando como variable proxy generadora de
1
X ' X ( X ' X ) 1
N
1
1
X ' X
N
N
i 1
2
i
( xt xt ')
'
donde: x t (1, X 2 t , X 3 t ,... X kt )
99
Apuntes de Econometra
Sin embargo, cabe sealar que la aplicacin de las varianzas de White es para muestras
grandes (dado que las varianzas calculadas por White son consistentes). Una
comparacin de las varianzas de White y de MCO puede dar idea de la magnitud del
problema de heteroscedasticidad.
Hay que notar que en la prctica la estructura de la heteroscedasticidad es difcil de
conocer por lo que la utilizacin de cualquier transformacin ser prxima a la
verdadera estructura. Ello implica que estaramos utilizando aproximaciones a la matriz
. Es decir, estaramos utilizando MCG factibles por lo que la consideracin del tamao
de la muestra es fundamental a la hora de elegir este mtodo de estimacin.
En el caso de autocorrelacin
Existen diversos mtodos que se basan en utilizar la siguiente transformacin del
modelo:
Yt Yt 1 1 (1 ) 2 ( X 2t X 2t 1 ) ... k ( X kt X kt 1 ) t
(2)
100
Apuntes de Econometra
t t 1 t
t t 1 t
(3)
101
Apuntes de Econometra
Una buena solucin es MCG. Sin embargo, debido a que generalmente la matriz no
es conocida, se debe recurrir a una estimacin de esta matriz, generndose as el
denominado estimador de MCG factibles.
Sin embargo, MCG factibles (o la correccin de White o Newey y West), deber ser
utilizado en muestras grandes, en este caso los estadsticos usuales tendrn las
distribuciones conocidas.
102