Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
(Revisado marzo2008)
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 2
ÍNDICE DE CONTENIDOS
El modelo básico de regresión lineal exige que la varianza condicional de las perturbaciones
aleatorias a los valores de los regresores X sea constante:
Var (u i / X i ) = σ 2
Para comprender de forma intuitiva esta restricción podemos razonar del siguiente modo.
Iguales varianzas de “u” para los distintos valores de “x” implica necesariamente igual
dispersión (varianzas) de “y” para distintos valores de “x” lo que implica necesariamente que la
recta de regresión va a representar con igual precisión la relación entre “x” e “y”
independientemente de los valores de “x”. Esto es muy importante porque debe recordarse
que el análisis de regresión es un análisis de regresión condicional de “y” sobre “x” lo cual
implica, por lógica, que si se desea obtener un parámetro de relación estable y útil entre ambas
variables, los valores muestrales de “y” deben mostrarse igualmente dispersos ante variaciones
de “x”. Dicho de otro modo, y en términos del error, aunque el error será mayor para mayores
valores de “x” (no se fuerza que el error tenga un tamaño igual para el recorrido de “x”) la
dispersión del error alrededor de la recta de regresión será la misma. Esto permite considerar
igualmente válidos todos los datos muestrales de los regresores “x” para determinar la relación
condicional de “y” a los valores de “x” sin tener que ponderar más o menos unos valores u otros
de “x” en función de la menor o mayor dispersión de “y” en los distintos casos.
E (u1 ) 2 . E (u1 ) 2 .
E (u1u 2 ) E (u 2 ) 2 = 0 E (u 2 ) 2
= σ 2 I = σ 2Σ
E (UU ' ) =
... 0 0 ... i n
2
E (u1u n ) E (u 2 u n ) E (u n ) 0 0 0 E (u n ) 2
Aunque las que se citan a continuación no son las únicas posibilidades que dan lugar a un
modelo heterocedástico, sí son las más frecuentes.
1
Etimológicamente, por cierto, la palabra deriva de “hetero” (distinto) y el verbo griego “skedanime” que
significa dispersar o esparcir.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 4
Si una variable explicativa presenta una distribución asimétrica (por ejemplo la renta), resultará
inevitable que, por ejemplo para el caso de asimetría a derechas, los valores mayores del
regresor estén asociados a una mayor dispersión en el término de error de la regresión.
El hecho de que se produzca un cambio de estructura determina un mal ajuste de los parámetros
al conjunto de los datos muestrales. Este no tiene porque influir del mismo modo en todo el
recorrido de la muestra2, pudiendo producir cuantías de desajuste del modelo diferentes y, por
tanto, varianza no constante por subperíodos.
La utilización de una forma funcional incorrecta, por ejemplo la utilización de una función
lineal en lugar de una logarítmica potencial, puede provocar que la calidad del ajuste de la
regresión varíe según los valores de las exógenas, por ejemplo, ajustando bien para los valores
pequeños y mal para los grandes; en ese caso, es posible que en las zonas de peor ajuste existan,
no sólo errores mayores, sino también errores más dispersos.
2
De hecho, los parámetros estimados "recogerán mejor" el comportamiento de la serie en aquella de las dos
estructuras distintas que se produzca durante mayor número de observaciones, ya que los parámetros estimados en
presencia de un cambio de estructura serán una media ponderada de los que resultarían de una estimación particular
para cada una de las dos submuestras
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 5
Esta causa, apuntada por Gujarati3, se refiere a la modelización de fenómenos que contienen un
mecanismo de auto - aprendizaje en función de los errores (desajustes) previos. En este tipo de
fenómenos, el paso del tiempo implica progresivamente, no sólo un menor tamaño del error,
sino además una varianza progresivamente inferior.
En todo caso, sea cuál sea el origen del problema, en muchas ocasiones es posible asociar la
varianza no constante de las perturbaciones aleatorias a los valores de alguna de las variables
incluidas4 en el modelo. Dicho de otro modo, podría suponerse que la varianza de la
perturbación se compone de una parte constante, homocedástica, y otra que varía según los
valores de una determinada variable Zi:
σ i2 = f (σ 2 Z i )
donde σ 2 sería la parte fija de la varianza, y Zi la variable o incluso la matriz de variables cuyos
valores se asocian con los cambios en la varianza de las perturbaciones aleatorias.
Es muy probable que esta asociación entre el proceso de heterocedasticidad y una determinada
variable o una combinación de ellas sea algo simplista, probablemente no sea muy realista y y
quizá no alcance a ser completamente satisfactoria para explicar el patrón de “movimiento” de
la varianza. Sin embargo, asumir este tipo de conexión entre varianza de “U” y una/s variable/ss
está en la base de la mayoría de los procedimientos de detección de la heterocedasticidad y,
desde luego, resulta imprescindible para los mecanismos de solución de la heterocedasticidad.
Efectivamente, este tipo de función podría ser empleada precisamente como el “supuesto
simplificador” al que anteriormente se hacía referencia para posibilitar la estimación mediante
MCG sin encontrarnos con más incógnitas (elementos de la matriz Σ) que observaciones.
3
Econometría. D.N Gujarati. Ed. Mc Graw Hill.
4
En realidad, cabe también pensar en la posibilidad que el patrón de heterocedasticidad esté relacionado con los
valores de alguna variable no incluida en el modelo (una variable omitida, consciente o inconscientemente) aunque,
en general, y quizá por un criterio de sencillez operativa, los métodos de corrección y detección se suelen concentrar
en la lista de variables exógenas incluidas en la especificación.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 6
Ante estos dos problemas, caben en realidad distintos escenarios en función de la estrategia
elegida por el modelizador:
En este caso, tenemos una varianza que, dado el error de cálculo es un estimador sesgado del
verdadero valor de la varianza (valor correctamente calculado) sin que, en general, se pueda
saber si ese cálculo incorrecto sobreestima o subestima el verdadero valor. Así pues, las
conclusiones derivadas de la utilización de los contrates habituales son, sencillamente,
incorrectas.5 Conviene además tener en cuenta que el problema del cálculo incorrecto deriva en
realidad de que el estimador insesgado de la varianza de la perturbación ya no resulta ser:
e' e
σ~ 2 =
n−k
de modo que, además del error de cálculo en la estimación de la varianza de los parámetros,
todos aquellos contrastes o tests basados en este estimador insesgado serán también incorrectos.
En todo caso, un error frecuente consiste en pensar que cualquier cálculo que implique la
utilización de los errores de un modelo heterocedástico será incorrecto cuando, en realidad, no
es así. Un ejemplo interesante es el cálculo del coeficiente de determinación R2 (o su versión
corregida) que no se ve afectado por la existencia de heterocedasticidad. La razón estriba en que
el cálculo de la R2 se realiza a partir del cálculo de las varianzas poblaciones de “u” (σu) y de
“y” (σy) y el hecho de que utilicemos conceptos poblaciones, no muestrales, implica que
5
Sobre esta reflexión puede ser interesante recordar un par de experimentos. El primero, realizado por Goldfeldt y
Quandt en 1972 (Non Linnear Methods in Econometrics. North Holland, pp 280.) llegó a dos conclusiones: (1) que la
pérdida de eficiencia de MCO respecto a MCG puede ser de hasta 10 veces en el parámetro constante y de 4 veces en
los parámetros que acompañan a variables explicativas y (2) que el cálculo incorrecto de de la varianza de los
estimadores ignorando la heterocedasticidad produce en general un sesgo por infravaloración de la real del orden del
doble. El segundo, realizado por Davidson y Mackinnon en 1993 (Estimation and Inference in Econometrics, OUP,
Nueva Cork, 19993, pp. 549-550) concluyó que el uso de MCO (con o sin corrección) sobreestima consistentemente
el verdadero error estándar de los parámetros obtenido mediante el procedimiento correcto (MCG) mientras que la
utilización de MCO sin corregir tienden a ofrecer menores varianzas que las obtenidos por MCO corregidos, para los
parámetros de pendiente, y mayores para el término independiente.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 7
Es evidente que esta parece la mejor de las soluciones aunque también debe observarse que
utilización de este estimador exigiría conocer o estimar de antemano los valores de los
elementos de Σ. Estimar las “n” varianzas distintas de Σ partiendo de “n” observaciones y “k”
variables explicativas es imposible, de modo que, como se verá más adelante, la utilización de
este estimador exigirá asumir algún supuesto simplificador sobre la causa de una eventual
heterocedasticidad, un supuesto simplificador que permita a su vez determinar, de forma
también simplificada, la forma de la matriz Σ. Evidentemente, encontrar una simplificación
correcta de Σ dotará de plena utilidad (eficiencia) a la estimación con MCG pero, a sensu
contrario, un mal diseño de la causa de la heterocedasticidad y su expresión en Σ no garantizará
esa eficiencia.
Antes de entrar a enumerar y revisar brevemente los principales procedimientos deben quedar
claras dos cuestiones preliminares:
2.- Antes de la aplicación de métodos técnicos (más o menos informales) debemos preguntarnos
por la existencia de heterocedasticidad desde un punto de vista teórico considerando la
naturaleza del problema analizado, las exógenas incluidas y, en definitiva, la propensión teórica
del modelo hacia la heterocedasticidad.
A. Contrastes Gráficos
A.1) Gráfica del error a través de las distintas observaciones del modelo
Dado que las series económicas presentan casi siempre una tendencia definida (positiva o
negativa), la simple gráfica de error puede servir para conocer intuitivamente si el mero
transcurso del tiempo da lugar a un incremento/decremento continuado del error, lo que sería
significativo de una relación entre la evolución de las variables del modelo y los valores cada
vez mayores o cada vez menores de éste.
10 6
4
5
2
0 0
-2
-5
-4
-10 -6
1
3
5
7
9
11
13
15
17
19
7
9
11
13
15
17
19
En ambos, la mera evolución del tiempo está correlacionada con valores cada vez mayores
(izquierda) del error o cada vez menores (derecha), con lo que el cálculo de la varianza por
subperíodos arrojaría valores significativamente diferentes; es decir la serie del error sería
heterocedástica. Evidentemente, este tipo de gráficos SÓLO tiene sentido si el modelo es
temporal ya que, en el caso del modelo transversal, la ordenación de valores del eje “X”
dependerá del criterio elegido para ordenar la muestra, un criterio que puede no coincidir con el
patrón de crecimiento o decrecimiento de la varianza.
A.2) Gráfica del valor cuadrático del error y los valores de “Y” y “X’s”
La representación de los valores del error al cuadrado6 y la variable endógena o cada una de las
variables exógenas puede revelar la existencia de algún patrón sistemático en la varianza de la
perturbación (se entiende que el error al cuadrado se asocia con la dispersión del error). Este
tipo de gráfico, no sólo permite obtener una idea preliminar de si existe o no heterocedasticidad
sino también de la o las variables que pudieran estar conectadas con la misma.
B. Contrastes numéricos
De forma similar al caso anterior, Glesjer propone descartar la variación del error en función de
una variable z, que ahora pueden estar elevadas a una potencia "h" que estaría comprendida
entre -1 y 1. El modelo que se propone es:
6
Eventualmente podrían también realizarse los gráficos con valores absolutos del residuo.
7
En particular, los contrastes que se presentan parten de una estructura acorde a la del Multiplicador de Lagrange. De
forma muy intuitiva, sin querer hacer una argumentación estrictamente académica, diremos que en este tipo de
contrastes se propone siempre dos modelos, uno inicial y otro en el que se incorpora algún añadido en la
especificación. A partir de un ratio sobre los errores de cada uno de estos modelos (o alguna transformada de estos),
se compara si el modelo más completo aporta suficiente explicación adicional de la endógena como para compensar
el coste de incorporar más variables.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 9
| ei |= α 0 + α1 z h ε i h{− 1,−0.5,0.5,1}
Se escogerá la regresión de las cuatro con parámetros significativos y con mayor R2.
La idea del contraste es comprobar si se puede encontrar un conjunto de variables Z que sirvan
para explicar la evolución de la varianza de las perturbaciones aleatorias, estimada ésta a partir
del cuadrado de los errores del modelo inicial sobre el que se pretende comprobar si existe o no
heterocedasticidad.
2. Calcular una serie con los errores del modelo anterior al cuadrado estandarizados:
e2
e~i 2 = i 2
σˆ
e' e
σˆ 2 =
n
3. Estimas una regresión del error calculado en el paso (2) explicado por una constante y
el conjunto de las variables Z que se pretende saber si producen o no heterocedasticidad
en el modelo, obteniéndose la R2 de este modelo y la varianza de la estimada:
Re~2
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 10
4. En principio, dado que el modelo tiene término constante, se cumple la regla general de
las regresiones según la cual la varianza de la endógena real es igual a la suma de la
varianza de la endógena estimada más la varianza del error obtenido en el modelo
( S e~ 2 = S e~ˆ 2 + Sεˆ ) o su equivalente multiplicando a ambos lados de la igualdad por el
2 2 2
El contraste de Breusch Pagan efectivamente nos servirá para aceptar o descartar la presencia de
heterocedasticidad debida a ese conjunto de variables Z citado, pero su operatividad es limitada.
Si el conjunto de las variables Z contiene variables no incluidas en el modelo original, parece
difícil no haberlas tenido en cuenta antes para realizar una buena especificación y sí tenerlas en
cuenta ahora para la contrastación. Por otro lado, la lista de variables Z debe ser necesariamente
pequeña para poder realizarse el contraste.
Aunque en apariencia esta prueba es parecida a las mencionadas anteriormente, parece admitido
que algo más robusta al no requerir supuestos previos como, por ejemplo, la normalidad de las
perturbaciones. Por otro lado, tal y como se verá a continuación, la prueba no exigirá determinar
a priori las variables explicativas de la heterocedasticidad (lo cual no es necesariamente una
virtud) y es por esta razón por lo que se denomina “prueba general”.
En este contraste la idea subyacente es determinar si las variables explicativas del modelo, sus
cuadrados y todos sus cruces posibles no repetidos sirven para determinar la evolución del error
al cuadrado. Es decir; si la evolución de las variables explicativas y de sus varianzas y
covarianzas son significativas para determinar el valor de la varianza muestral de los errores,
entendida ésta como una estimación de las varianzas de las perturbaciones aleatorias.
1. Estimar el modelo original por MCO, determinando la serie de los errores. Escrito esto
en forma matricial para un modelo con "n" observaciones y "k" variables explicativas:
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 11
Y = Xβ + U
βˆ = [X ' X ]−1 X ' Y
Yˆ = Xβˆ
e = Y − Yˆ
2. Estimar un modelo en el que la endógena sería los valores al cuadrado de los errores
obtenidos previamente (paso 1) con todas las variables explicativas del modelo inicial,
sus cuadrados y sus combinaciones no repetidas.
3. El valor de la Re2 de este segundo modelo (paso 2) nos dirá si las variables elegidas
sirven o no para estimar la evolución variante del error al cuadrado, representativo de la
varianza estimada de las perturbaciones aleatorias. Evidentemente, si la varianza de
éstas fuera constante (homocedasticidad), el carácter no constante de las variables
explicativas implicadas en el modelo no serviría para explicar la endógena, luego la Re2
debiera ser muy pequeña.
En principio, la Re2 , como proporción de la varianza de la endógena real8 que queda explicada
por la estimada, debiera ser muy pequeña si la capacidad explicativa de los regresores
considerados también es muy pequeña, siendo estos regresores, por su construcción,
representativos de varianzas y covarianzas de todas las explicativas del modelo original. Dicho
esto, evidentemente un valor de la R2 suficientemente pequeño servirá para concluir que no
existe heterocedasticidad en el modelo producida por los valores de las explicativas
consideradas en el modelo inicial. Para encontrar el valor crítico en esa consideración de
“suficientemente pequeño” se emplea la expresión deducida por Breusch y Pagan como
producto del coeficiente R2 por el número de datos del modelo, que se distribuiría del siguiente
modo:
n·Re2 → χ p −1
En definitiva, si obtenemos un valor del producto n·Re2 mayor que el reflejado por las tablas de
χ p2 −1 , afirmaremos que existe heterocedasticidad, y viceversa, si este valor es más pequeño
diremos que se mantiene la homocedasticidad (luego la hipótesis nula de este contraste es la
homocedasticidad).
8
En este caso, la endógena real será el valor del error muestral al cuadrado de la primera regresión practicada. En el
caso de homocedasticidad, este debe ser casi constante, por lo que difícilmente la evolución de otras variables podría
explicar un valor fijo. Por ello es intuitivo pensar que cuanto mayor sea la R2 de este modelo, más probable será la
heterocedasticidad.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 12
n
6∑ d i2
i =1
r =1−
n(n 2 − 1)
En esta expresión, una coincidencia máxima (todas las distancias son igual a cero), daría lugar a
una correlación de Spearman igual a uno; mientras que una distancia máxima, provocaría un
valor cero de dicho coeficiente de correlación9.
n
6∑ d i2
i =1 6 * 30
r =1− =1− = 1 − 1,8 = −0,8
n(n − 1)
2
5(25 − 1)
En este caso, el grado de correlación negativa de ambas series sería bastante elevado, dado que
los extremos de correlación serían +/-1.
9
Realmente, el coeficiente de correlación por rangos de Spearman es equivalente a emplear el coeficiente
cov( x, y )
de correlación lineal r ( x, y ) = a las variables de puntuación de orden de ambas colocadas
SxS y
según la progresión de una de ellas. Para ver el detalle del denominador, se puede acudir a Martín-
Guzmán y Martín Pliego (1985), páginas 312-314.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 13
rs N − 2
→ t n −2
1 − rS2
Con ello, si el resultado del ratio es superior al valor de tablas podremos afirmar que la
correlación es significativa o, de cara a nuestro interés en este caso, que hay indicios de
heterocedasticidad en el modelo provocada por la variable xji.
- Contraste de Harvey
- Contraste test de Park
- Contraste RESET de Ramsey
- Golfeld-Quandt
- Contraste de picos
- LM Arch
1.- La corrección que se verá en este apartado se plantea como una estrategia adaptativa, de
convivencia con la heterocedasticidad pero, en todo caso, debe entenderse que, en algunas
ocasiones, el problema que genera un comportamiento heterocedástico de la perturbación puede
resolverse variando la especificación lo que, sin duda alguna, sería una verdadera corrección del
problema.
Como hemos venido viendo repetidas veces a lo largo del tema, la heterocedasticidad viene
producida por la dependencia de la varianza de las perturbaciones aleatorias de una o más
variables que, a su vez, pueden estar presentes en el modelo o no. Los distintos métodos de
detectar este problema servían para probar la dependencia de la varianza de la perturbación
aleatoria de un conjunto de variables, a partir de lo que hemos llamado un supuesto
simplificador:
σ i2 = f (σ 2 Z i )
Para comprobar esto, podemos volver a la forma matricial de varianzas covarianzas no escalar:
E (u1 ) 2 . E (u1 ) 2 .
E (u1u 2 ) E (u 2 ) 2 = 0 E (u 2 ) 2
E (UU ' ) = = σ 2 I = σ 2Σ
... 0 0 ... i n
E (u1u n ) E (u 2 u n ) E (u n ) 2 0 0 0 E (u n ) 2
es decir, volveríamos al caso de una matriz de varianzas covarianzas escalar tal y como la que se
supone en el modelo básico de regresión lineal.
Formalmente, para probar esto seguimos los siguientes pasos. Dado que la matriz Σ es una
matriz semidefinida positiva (todos los elementos de su diagonal principal son necesariamente
positivos), siempre podremos descomponerla en dos matrices de la forma:
Σ = PP ' ⇔ Σ −1 = P −1 P −1 '
E (u1 ) 2 σ 1 2
. .
= 0 σ2
2 2
0 E (u 2 ) = σ 2Σ =
0 0 ... 0 0 ...
2
2
0 0 0 E (u n ) 0 0 0 σ n
'
σ 1 . σ 1 .
0 σ2 0 σ2 = σ 2 PP'
0 0 ... 0 0 ...
0 0 0 σ n 0 0 0 σ n
Si multiplicamos cada variable del modelo por esta matriz P, tal y como se ha sugerido,
obtenemos unas nuevas variables del siguiente tipo:
P −1Y = P −1 xβ + P −1U ⇔ Y * = X * β + U *
donde:
E (UU ' ) = σ 2 Σ
E (U *U * ' ) = E ( P −1UU ' P −1 ' ) = P −1 P −1 ' E (UU ' ) = −1 −1 −1
= Σ −1σ 2 Σ = σ 2 I n
P P ' = Σ
Por lo que podemos afirmar que el modelo transformado (aquel por el que se han dividido todas
las variables por la desviación típica estimada de las perturbaciones aleatorias) soporta una
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 15
matriz de varianzas covarianzas de las perturbaciones aleatorias escalar, con lo que se puede
estimar con toda garantía por MCO.
a) Se estiman los parámetros del modelo por MCO, ignorando por el momento el
problema de la heterocedasticidad de las perturbaciones aleatorias
b) Se establece un supuesto acerca de la formación de σ i2 y se emplean los residuos de la
regresión por MCO para estimar la forma funcional supuesta.
c) Se divide cada observación por σˆ i2 según el paso anterior (según el valor de esa
heterocedasticidad supuesta estimada, siempre y cuando un contraste nos haya
confirmado que el “modelo simplificador” es bueno).
d) Se estima el modelo original ahora con todas las variables transformadas según el paso
c).
El procedimiento propuesto por White permite una estimación que, en términos asintóticos,
permite la utilización de los procedimientos de inferencia estadística clásica.
Básicamente, la idea consiste en utilizar los errores cuadráticos de una estimación previa de
MCO como elementos de la matriz de varianzas de la perturbación (matriz Σ). White demostró
que, esta estrategia de “ponderación” permite obtener estimadores consistentes de las varianzas
de los parámetros. La mayor parte de los paquetes informáticos incorporan este cálculo de modo
que, en general, su utilización parece recomendable, al menos con fines exploratorios.
En todo caso, deben hacerse dos puntualizaciones que quizá resulten interesantes al que, por vez
primera, se asome a este procedimiento.
1.- Los parámetros estimados consistentemente con White coincidirán con los de la regresión
original MCO (en todo caso, recuerde que el problema de la heterocedasticidad no es un
problema de sesgo ni inconsistencia).
2.- Nada garantiza, a priori, que las varianzas de los parámetros estimados con White sean
menores que las originales, dado que debe recordarse que las MCO originales (mal calculadas)
presentaban un sesgo indeterminado, pero generalmente de infravaloración de la varianza real.
Se propone un modelo para cuantificar las ventas de Burger King (VTASBK) en una serie de 20
países, proponiéndose como explicativas las siguientes variables:
Realizada una primera regresión, los resultados obtenidos son los siguientes:
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 16
1000
800
600
400
20 200
10 0
0
-10
-20
-30
2 4 6 8 10 12 14 16 18 20
A la luz del gráfico de residuos, podría pensarse que que los cinco primeros países presentarían
una varianza mayor que los siguientes, aunque, como suele ocurrir con los gráficos, no se puede
apreciar nada claramente.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 17
En principio, el contraste expresado por White sería la segunda opción, pero, en modelos con
escasas observaciones, a lo mejor no es posible realizar la estimación con tantos regresores y es
más recomendable la primera opción (por no eliminar completamente los grados de libertad).
Para aplicar este contraste en E-views, desde la misma ventana donde se ha realizado la
regresión, se sigue el siguiente trayecto:
Los resultado de este Test de residuos White heteroskedasticity (cross terms) son:
Como resultado, se nos ofrecen dos formas de contrastar la validez de las variables elegidas para
explicar un comportamiento no homogéneo del error al cuadrado (estimador de la varianza de la
perturbación aleatoria en este caso):
- F-stastitic (como siempre con k-1; n-k grados de libertad), nos vendría a dar una medida
de la bondad del modelo (probabilidad de heterocedasticidad si se confirma la validez
conjunta de las variables elegidas para determinar la variación del error al cuadrado - la
endógena-).
La misma salida nos muestra la regresión utilizada para realizar estos cálculos, que sería la
siguiente:
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 04/04/01 Time: 18:13
Sample: 1 20
Included observations: 20
Variable Coefficient Std. Error t-Statistic Prob.
C -1244.796 761.4100 -1.634856 0.1331
PRECIOSBK -3872.145 4225.294 -0.916420 0.3810
PRECIOSBK^2 1071.919 452.8574 2.367012 0.0395
PRECIOSBK*PRECIOSMAC -423.3863 3433.568 -0.123308 0.9043
PRECIOSBK*RENTAPC 0.065588 0.019299 3.398529 0.0068
PRECIOSMAC 6562.125 4306.578 1.523745 0.1586
PRECIOSMAC^2 -2332.049 3209.945 -0.726507 0.4842
PRECIOSMAC*RENTAPC 0.048495 0.039574 1.225423 0.2485
RENTAPC -0.090230 0.034504 -2.615066 0.0258
RENTAPC^2 -7.94E-07 2.13E-07 -3.719294 0.0040
R-squared 0.870347 Mean dependent var 57.08155
Adjusted R-squared 0.753659 S.D. dependent var 104.1942
S.E. of regression 51.71438 Akaike info criterion 11.03620
Sum squared resid 26743.77 Schwarz criterion 11.53407
Log likelihood -100.3620 F-statistic 7.458779
Durbin-Watson stat 1.810789 Prob(F-statistic) 0.002102
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 19
El programa E-views permite realizar la estimación por MCG usando como valor de Σ el
obtenible a partir de la propuesta de White (1980).
El estimador consistente de la matriz de covarianzas para lograr una estimación correcta de los
parámetros en presencia de heterocedasticidad es el siguiente:
n
[X ' X ]−1 ∑ eit2 x't xt [X ' X ]−1
n
Σˆ =
n−k i =1
Para lograr una estimación empleando esta corrección en E-views, es necesario, una vez se
ejecuta una estimación lineal normal, pulsar el botón de “estimate”. Aparecerá entonces, a la
derecha, un botón de opciones que, pulsado, permite señalar “Heteroskedasticity: consistent
covariance White”.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 20
Referencias bibliográficas
NOVALES, A. (1993): Econometría. Editorial M'c Graw Hill, segunda edición. Madrid.
Capítulo 6, página: 193.
- Signos correctos
- Variables no significativas ni individualmente ni de forma conjunta
- R2 escaso
A la vista de la fuerte correlación entre ventas y beneficios, lo más probable es que SI.
No obstante, vamos a mantener la regresión sin cambios con estas dos explicativas con
el fin de ilustrar los procedimientos de detección de heterocedasticidad en este contexto
multivariante.
150000
100000
50000
100000
50000 0
-50000
-100000
2 4 6 8 10 12 14 16 18
5.E+09
4.E+09
3.E+09
RESID2
2.E+09
1.E+09
0.E+00
0 1000000 2000000 3000000
VENTAS
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 25
5.E+09
4.E+09
3.E+09
RESID2
2.E+09
1.E+09
0.E+00
0 50000 100000 150000 200000 250000
BENEFICIOS
8.E+08
6.E+08
RESID_AT
4.E+08
2.E+08
0.E+00
0 1000000 2000000 3000000
VENTAS
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 26
8.E+08
6.E+08
RESID_AT
4.E+08
2.E+08
0.E+00
0 50000 100000 150000 200000 250000
BENEFICIOS
ei = β 0 + β1 X ih + vi
Beneficios Ventas
2 2
R p-value R p-value
h=0,5 0.57 0.0004 0.46 0.0019
h=1 0.63 0.0001 0.42 0.0034
h=2 0.68 0.0000 0.27 0.0280
h=-0.5 0.25 0.0358 0.33 0.0123
h=-1 0.17 0.0862 0.23 0.0461
h=-2 0.13 0.1392 0.11 0.1842
A la vista de los resultados, se confirma la evidente relación del error con las variables
exógenas, especialmente con la variable de beneficios. La parametrización con mejores
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 27
2
~ e
ei = i
σ e2
Para realizar este cálculo, primero necesitamos conocer el valor de la varianza residual
de los residuos originales que resulta ser:
σ 2
=
∑e 2
i
=
11.101.429.732,93
= 616.746.096,27
e
n 18
RGID_2ST
RGID
ei2
ei
σ e2
-480,17 0,0004
-4.156,22 0,0280
-581,86 0,0005
-6.806,36 0,0751
1.228,31 0,0024
-2.099,32 0,0071
5.018,89 0,0408
-11.846,96 0,2276
-15.734,91 0,4014
22.961,39 0,8549
16.594,31 0,4465
-21.285,29 0,7346
25.552,56 1,0587
-10.109,80 0,1657
-9.424,18 0,1440
62.836,05 6,4019
-66.054,61 7,0746
14.388,17 0,3357
ei = β 0 + β1 ⋅ (BENEFICIOS )i + β 2 ⋅ (BENEFICIOS )i + vi
~ 2
10
En E-Views, si nuestra variable original de residuos se denomina RGID, la variable
transformada para BP podría generarse como: rgid_2st=(rgid/(@var(rgid))^0.5)^2
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 28
∑ e~ˆ i
2
= 56.2901
es decir:
∑ e~ˆ i
2
= 28.14500503
2
11
La opción “cross terms” utiliza como exógenas los productos cruzados de las variables exógenas
mientras que opción “no cross terms” sólo emplea las exógenas y sus cuadrados.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 29
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/02/06 Time: 15:29
Sample: 1 18
Included observations: 18
Variable Coefficient Std. Error t-Statistic Prob.
C 69515964 2.65E+08 0.262044 0.7977
VENTAS 1349.794 1077.114 1.253157 0.2340
VENTAS^2 -0.002708 0.000790 -3.426789 0.0050
VENTAS*BENEFICIOS 0.050108 0.020746 2.415348 0.0326
BENEFICIOS -19656.93 12978.05 -1.514630 0.1558
BENEFICIOS^2 -0.116371 0.146632 -0.793626 0.4428
R-squared 0.889997 Mean dependent var 6.17E+08
Adjusted R-squared 0.844162 S.D. dependent var 1.30E+09
S.E. of regression 5.15E+08 Akaike info criterion 43.21768
Sum squared resid 3.18E+18 Schwarz criterion 43.51448
Log likelihood -382.9592 F-statistic 19.41756
Durbin-Watson stat 2.127352 Prob(F-statistic) 0.000022
Una vez más, los indicios de autocorrelación son claros. Los resultados del test de
White muestran, por un lado, el elevado valor de la R2 en la regresión instrumental, que
supera el valor de una Chi cuadrado con “p-1”=”6-1” grados de libertad, para un nivel
de significación del 0.67%, es decir, del 99,3%. Por otro lado, aparecen coeficientes
estadísticamente significativos al 99,5% para la variable de “Beneficios al cuadrado” y
al 96,8% para el producto cruzado de los Beneficios por las Ventas.
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 30
1 Ventas1
1
Benef1 Benef1
1 Ventas1 Benef1 1 Ventas 2
1
1 Ventas 2 Benef 2 Benef Benef 2
1 2
Ventas3 Benef 3 1 Ventas3
⇒ 1
.. Benef 3 Benef 3
..
..
1 Ventas18 Benef18 ..
1 Ventas18
1
Benef18 Benef18
Si se desea comparar los coeficientes de esta nueva regresión con los de la original,
podría multiplicarse toda la regresión por la variable “Beneficios”. Los parámetros de
la regresión original son ahora ligeramente distintos a los de la original, sus errores
estándar mucho más reducidos y el coeficiente de determinación ha mejorado
sustancialmente:
Conceptos básicos sobre Heterocedasticidad y Tratamiento en E-views 32
2.5
2.0
1.5
1.0
0.5
0.4 0.0
0.2
0.0
-0.2
-0.4
2 4 6 8 10 12 14 16 18