Sei sulla pagina 1di 16

BREVE EJEMPLO PRCTICO DE ANLISIS

DE HETEROCEDASTICIDAD
Ramn Maha Marzo 2010

I.- REGRESIN INICIAL


Los datos para realizar esta regresin se han tomado del ejemplo 11.10 del libro
Econometra de D.N. Gujarati, Ed. Mc.Graw Hill. Cuarta Edicin. Los datos se refieren
a gastos en I+D (GID), Ventas y Beneficios para 18 sectores industriales considerados y
fueron a su vez extrados de Business Week, Special 1989 Bonus Issue, R&D Scorecard,
pp. 180-224. .
El ejemplo utilizado no se corresponde, sin embargo, con el realizado por Gujarati en el
texto arriba indicado: la regresin que se propone para el anlisis en este ejemplo
trata de explicar (en niveles) el volumen sectorial de gastos en I+D en funcin de las
ventas y los beneficios sectoriales.

I.A.- Output de la Estimacin


Dependent Variable: GID
Method: Least Squares
Date: 03/02/06 Time: 11:36
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
VENTAS
BENEFICIOS

-139.3921
0.012558
0.239862

9920.038
0.017998
0.198594

-0.014052
0.697731
1.207801

0.9890
0.4960
0.2458

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.524535
0.461139
27204.69
1.11E+10
-207.7006
3.173929

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

30568.83
37060.02
23.41118
23.55957
8.274023
0.003788

II.- DETECCIN DE LA HETEROCEDASTICIDAD


II.B.- Aproximacin Terica
La utilizacin de modelos transversales, especialmente cuando las unidades
observadas presentan, para las variables de inters, amplios recorridos, supone un
riesgo evidente de heterocedasticidad. Por otro lado, cabe suponer que los gastos en
I+D sean, no slo ms grandes cuanto mayor sea la empresa (mayor sea su volumen de

ventas), sino probablemente tambin ms heterogneos; algo similar ocurre de hecho


con otras variables empresariales que presentan una distribucin heterocedstica
respecto al tamao (la distribucin de salarios, la productividad, etc.).

II.B.- Aproximacin Grfica


II.B.1.- Real, estimada, error.
La muestra aparece ordenada segn el tamao (ventas) de la empresa. Por ello, y a
pesar de tratarse de un modelo transversal, este tipo de grfico tiene sentido en este
ejemplo si suponemos que la heterocedasticidad est relacionada con el tamao del
sector.
150000
100000
50000

100000

50000
0
-50000
-100000
2

6
Residual

10

12

Actual

14

16

18

Fitted

El grfico de los errores muestra, efectivamente, que la dispersin de los mismos


alrededor de la media nula aumenta segn el tamao de la empresa tambin lo hace
(en este caso, insisto, el eje horizontal no representa slo la transicin de unas
empresas a otras sino tambin el incremento de tamao dado que la muestra aparece
ordenada por volumen de ventas).
Para realizar este grfico en E-views, basta con realizar la regresin analizada y, una
vez creada, solicitar en el cuadro de dilogo de esa ecuacin E-Views la opcin ViewActual,Fitted,Residual Graph.

Debe recordarse que, en el caso de un modelo transversal, el grfico residual slo


permite observar la presencia de heterocedasticidad si a muestra est ordenada
conforme a algn criterio que, eventualmente, pueda relacionarse con ella. En nuestro
fichero de ejemplo, los datos sectoriales ya estaban ordenados por ventas (de menor a
mayor), pero si no hubiera asido as o se desea ordenarlos conforme a otro criterio, el
comando a utilizar en E-Views es SORT. Este comando puede ejecutarse
escribindolo directamente en la pantalla de comandos escribiendo SORT seguido de
la variable de ordenacin (por ejemplo VENTAS:

o bien puede ejecutarse en el men del Workfile usando la secuencia Procs -Sort
Series.

II.B.2.- Grficos X/Y (scat) entre errores y variables


La representacin de los residuos al cuadrado de la regresin y la variable de ventas o
beneficios (ambas representan el tamao), arroja, nuevamente un claro indicio de
relacin entre ambas. Se ilustran dos versiones de los mismos grficos, en la primera
versin se ha utilizado la muestra completa de errores, en la segunda, con el fin de
acentuar el grfico, se han eliminado los dos residuos atpicamente grandes de la serie
de errores cuadrticos (observaciones 16 y 17). En todos los casos se muestra la lnea
de regresin de la nube de puntos en la que se aprecia, claramente, una pendiente
positiva. La utilizacin de residuos en valor absoluto en lugar de residuos cuadrticos
no implica diferencias sustanciales.

Grficos Errores Cuadrticos / Exgenas (sin correccin de atpicos)


5.E+09

RESID2

4.E+09

3.E+09

2.E+09

1.E+09

0.E+00
0

1000000

2000000

3000000

VENTAS
5.E+09

RESID2

4.E+09

3.E+09

2.E+09

1.E+09

0.E+00
0

50000 100000 150000 200000 250000


BENEFICIOS

Grficos Errores Cuadrticos / Exgenas (corregidos atpicos observaciones 16 y 17)

8.E+08

RESID_AT

6.E+08

4.E+08

2.E+08

0.E+00
0

1000000

2000000

3000000

VENTAS

8.E+08

RESID_AT

6.E+08

4.E+08

2.E+08

0.E+00
0

50000 100000 150000 200000 250000


BENEFICIOS

Para efectuar estos grficos en Eviews puede utilizarse en la pantalla de comandos la


orden SCAT seguida de las variables que ocuparn el eje X e Y. Por ejemplo, para
representar BENEFICIOS y Residuos al cuadrado podemos escribir:

Alternativamente, podemos marcar con el ratn las dos series que queremos
representar y despus abrir ambas simultneamente como grupo Open As group.
En este caso, debemos haber guardado los errores al cuadrado previamente en una
serie especficamente creada (de otra forma resulta imposible marcarla). En todo caso,
guardar los residuos de la regresin, automticamente almacenados en la serie resid
del sistema resulta siempre conveniente, para evitar que, al realizar alguna regresin
intermedia distinta a la analizada, el contenido de resid cambie automticamente.
Guardamos los errores en una serie aparte RGID con el comando GENR:

Creamos tambin la serie RGID2 de errores cuadrticos:

Marcamos entonces la exgena para el eje X, por ejemplo BENEFICIOS y los errores
cuadrticos RGID2. Una vez abiertas, pedimos entonces la representacin del Scatter
con la secuencia de comandos View-Graph-Scatter-Simple Scatter.

Puede optarse tambin por representar una recta de regresin en el Scatter eligiendo
la opcin Scatter with Regression lo que ayuda a valorar la existencia d euna relacin
entre el tamao del error cuadrtico (no su varianza) y el tamao de la variable
exgena utilizada.

II.C.- Mtodos numricos


II.C.1.- Regresiones univariantes de Glesjer
Conforme al procedimiento descrito en los documentos tericos, realizamos la
estimacin del valor absoluto del residuo en funcin de cada una de las dos exgenas
utilizando distintas parametrizaciones para el modelo (distintos valores de h).
| ei | 0 1 x hji vi

Para estas regresiones, observamos el valor del coeficiente de determinacin R2 y el


p-value del contraste t de Student para el coeficiente 1.

h=0,5
h=1
h=2
h=-0.5
h=-1
h=-2

R
0.57
0.63
0.68
0.25
0.17
0.13

Beneficios
p-value
0.0004
0.0001
0.0000
0.0358
0.0862
0.1392

R
0.46
0.42
0.27
0.33
0.23
0.11

Ventas
p-value
0.0019
0.0034
0.0280
0.0123
0.0461
0.1842

A la vista de los resultados, se confirma la evidente relacin del error con las variables
exgenas, especialmente con la variable de beneficios. La parametrizacin con mejores
resultados (la que en mayor medida evidencia la heterocedasticidad) supone la
relacin entre los errores absolutos y el beneficio al cuadrado lo cual puede ser de
inters a la hora de proponer una transformacin homocedstica para el modelo.

II.C.2.- Contraste de Breusch - Pagan


La regresin estndar propuesta por BP es:
ei2 1 2 x2i 3 x3i ... k xki vi

De modo que en nuestro caso, dado que los residuos estn almacenados en la variable
RGID, tenemos:
Dependent Variable: RGID^2
Method: Least Squares
Date: 03/03/10 Time: 09:08
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
BENEFICIOS
VENTAS

-3.57E+08
17834.05
-524.7229

3.50E+08
6998.425
634.2368

-1.021727
2.548294
-0.827330

0.3231
0.0223
0.4210

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.523148
0.459567
9.59E+08
1.38E+19
-396.1594
2.128415

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

6.17E+08
1.30E+09
44.35105
44.49944
8.228139
0.003872

De modo que el valor del estadstico de contraste para la nula de homocedasticidad


resulta:

BP n Re22 18 0,52 9,41

El valor crtico de una Chi con k-1 (2) grados de libertad para la nula de
homocedasticidad est en torno a 6, de modo que rechazamos la nula y aceptamos la
hiptesis alternativa de heterocedasticidad.
Podemos realizar tambin la regresin de la serie de residuos cuadrtica en funcin de
otra especificacin alternativa, por ejemplo, utilizando el beneficio y su cuadrado
como variables explicativas:
Dependent Variable: RGID^2
Method: Least Squares
Date: 03/03/10 Time: 09:14
Sample: 1 18
Included observations: 18
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
BENEFICIOS
BENEFICIOS^2

3.36E+08
-16179.01
0.137550

3.62E+08
9523.253
0.043750

0.928802
-1.698895
3.144029

0.3677
0.1100
0.0067

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.699449
0.659376
7.61E+08
8.69E+18
-392.0051
2.615532

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

6.17E+08
1.30E+09
43.88946
44.03785
17.45420
0.000121

El contraste de Breusch Pagan para la nula de homocedasticidad es ahora aun ms


claro a favor de la alternativa de heterocedasticidad:

BP n Re22 18 0,699 12,59

II.C.3.- Contraste de White


No parecen necesarios contrastes adicionales para asegurar la presencia de
heterocedasticidad ligada a la variable de beneficios pero, no obstante, realizamos la
prueba de White con fines ilustrativos. E-Views realiza de forma automtica este
contraste si, una vez realizada la regresin, hacemos clic sobre la opcin ViewResidual Test White Heteroskedasticity1.

La opcin cross terms utiliza como exgenas los productos cruzados de las variables exgenas
mientras que opcin no cross terms slo emplea las exgenas y sus cuadrados.

La regresin de White, efectuada para los residuos cuadrticos en funcin de las


variables exgenas, sus cuadrados y sus productos cruzados resulta ser:
White Heteroskedasticity Test:
F-statistic
Obs*R-squared

19.41756
16.01994

Probability
Probability

0.000022
0.006787

Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
VENTAS
VENTAS^2
VENTAS*BENEFICIOS
BENEFICIOS
BENEFICIOS^2

69515964
1349.794
-0.002708
0.050108
-19656.93
-0.116371

2.65E+08
1077.114
0.000790
0.020746
12978.05
0.146632

0.262044
1.253157
-3.426789
2.415348
-1.514630
-0.793626

0.7977
0.2340
0.0050
0.0326
0.1558
0.4428

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/02/06 Time: 15:29
Sample: 1 18
Included observations: 18

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.889997
0.844162
5.15E+08
3.18E+18
-382.9592
2.127352

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

6.17E+08
1.30E+09
43.21768
43.51448
19.41756
0.000022

Una vez ms, los indicios de autocorrelacin son claros. Los resultados del test de
White muestran, por un lado, el elevado valor de la R2 en la regresin instrumental,
que supera el valor de una Chi cuadrado con p-1=6-1 grados de libertad, para un
nivel de significacin del 0.67%, es decir, del 99,3%. Por otro lado, aparecen
coeficientes estadsticamente significativos al 99,5% para la variable de Beneficios al
cuadrado y al 96,8% para el producto cruzado de los Beneficios por las Ventas.

III.- CORRECCIN DE LA HETEROCEDASTICIDAD


III.A.- Utilizacin de MCO y procedimientos de inferencia robustos
El propio E-Views ofrece la posibilidad de utilizar una estimacin consistente de la
matriz de varianzas y covarianzas. Esta opcin est disponible en la pantalla del men
de estimacin de la ecuacin, dentro de la opcin Options:

Para nuestro ejemplo, activando esta opcin se obtiene la siguiente estimacin:


Dependent Variable: GID
Method: Least Squares
Date: 03/02/06 Time: 16:14
Sample: 1 18
Included observations: 18
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
VENTAS
BENEFICIOS

-139.3921
0.012558
0.239862

6783.051
0.014446
0.244817

-0.020550
0.869279
0.979758

0.9839
0.3984
0.3427

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.524535
0.461139
27204.69
1.11E+10
-207.7006
3.173929

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

30568.83
37060.02
23.41118
23.55957
8.274023
0.003788

Puede comprobarse que los parmetros obtenidos en la regresin no difieren de los


iniciales pero, sin embargo, s lo hace su precisin (su Std. Error) y, por tanto, sus
estadsticos de significatividad individual. En nuestro caso, la precisin del parmetro
relativo a las ventas es menor si se utiliza la correccin de White mientras que sucede
lo contrario para el caso de la variable beneficios.

III.A.- Transformacin de las variables originales (Mnimos cuadrados


ponderados con modelo de heterocedasticidad conocido)
Proponemos como solucin al problema la transformacin de los datos originales
utilizando para la transformacin la variable de Beneficios al cuadrado, es decir,
aquella que en mayor medida se ha mostrado conectada con la heterocedasticidad.
En la prctica, eso supone dividir la endgena y las exgenas entre la variable de
beneficios (la raz de los beneficios al cuadrado son los propios beneficios). Por
ejemplo, y para el caso de la endgena, la regresin se efectuara ahora utilizando
como variable a explicar la ratio de los Gastos en I+D sobre los beneficios.
Pantalla de Estimacin: INICIAL

Pantalla de Estimacin: TRANSFORMADA

Pueden observarse los siguientes cambios que merecen atencin:


1.- Al dividir todas las variables entre la variable BENEFICIOS, debemos observar
que tambin quedar dividida la propia variable BENEFICIOS, generando por

tanto una variable con todos sus valores iguales a 1; es decir, generando un
trmino independiente. Por esa razn no se especifica en la versin corregida
de E-Views la aparicin del trmino C.
2.- El trmino independiente de la regresin original, especificado en E-Views
originalmente como C, era en realidad una variable con todos sus valores
iguales a 1. Al dividir ese trmino independiente entre la variable
BENEFICIOS tenemos en realidad una nueva variable 1/Beneficios, que es la
que aparece en la pantalla de estimacin.
Esta transformacin puede observarse matricialmente aqu:
Matriz Original X Matriz Transformada X

1
1

..
..

Ventas 1
Ventas 2
Ventas 3

Ventas 18

Benef 1
Benef 1 1

Benef 2 Benef
2

Benef 3 1

Benef 3
..

Benef 18 ..
1

Benef 18

Ventas 1
Benef 1
Ventas 2
Benef 2
Ventas 3
Benef 3

Ventas 18
Benef 18

Dependent Variable: GID/BENEFICIOS


Method: Least Squares
Date: 03/02/06 Time: 15:58
Sample: 1 18
Included observations: 18
White Heteroskedasticity-Consistent Standard Errors & Covariance
Variable

Coefficient

Std. Error

t-Statistic

Prob.

1/BENEFICIOS
VENTAS/BENEFICIOS
BENEFICIOS/BENEFICIOS

-1269.387
0.022273
0.124798

365.6084
0.001510
0.064034

-3.471986
14.75451
1.948917

0.0034
0.0000
0.0703

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat

0.819102
0.794982
0.225319
0.761527
2.924325
2.486807

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)

0.467849
0.497624
0.008408
0.156804
33.95985
0.000003

Si se desea comparar los coeficientes de esta nueva regresin con los de la original,
podra multiplicarse toda la regresin por la variable Beneficios. Los parmetros de
la regresin original son ahora ligeramente distintos a los de la original, sus errores
estndar mucho ms reducidos y el coeficiente de determinacin ha mejorado
sustancialmente:

Regresin Inicial
-139.39
9920.038
0.9890
0.012558
0.017998
0.4960
0.239862
0.198594
0.2458
0.5245

Trmino Independiente
Std. Error
p-value
Ventas
Std. Error
p-value
Beneficios
Std. Error
p-value
R2

Regresin Corregida
-1269,38
365.6084
0.0034
0.022273
0.001510
0.0000
0.124798
0.064034
0.0703
0.8191

Por otro lado, la representacin de los residuos de la regresin no muestra,


aparentemente, indicios de heterocedasticidad:

2.5
2.0
1.5
1.0
0.5
0.4

0.0

0.2
0.0
-0.2
-0.4
2

6
Residual

10

12

Actual

14

16

18

Fitted

La estimacin de un modelo ponderado de esta naturaleza en E-Views, puede


realizarse de forma ms sencilla y directa en el men de Opciones de la Regresin. Es
decir, si se desea ponderar todo el modelo por el inverso de los BENEFICIOS, como en
esta ocasin, basta especificar la ecuacin original (sin transformar las variables) y
despus marcar la opcin options y activar Weighted LS sealando en la casilla la
variable de ponderacin (en este caso, 1/BENEFICIOS).

Potrebbero piacerti anche