Metodos Estadasticos y Econometricos en La Empresa y para Finanzas

MTODOS ESTADSTICOS Y
ECONOMTRICOS EN LA EMPRESA Y
PARA FINANZAS
Jos Antonio Ordaz Sanz

Mara del Carmen Melgar Hiraldo
Carmen Mara Rubio Castao
Departamento de Economa, Mtodos Cuantitativos e Historia Econmica

Universidad Pablo de Olavide
INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

Mtodos Estadsticos y Economtricos en la Empresa y para Finanzas Universidad Pablo de Olavide
TEMA 1
Introduccin a las tcnicas de Anlisis Multivariante en el
mbito de la Economa y la Empresa
1.1. Introduccin al Anlisis Multivariante: definicin y clasificacin.El Anlisis Multivariante comprende un conjunto de tcnicas o mtodos estadsticos
cuya finalidad es analizar simultneamente informacin relativa a varias variables para
cada individuo o elemento estudiado. Algunos de estos mtodos son puramente
descriptivos de los datos muestrales, mientras que otros utilizan dichos datos muestrales
para realizar inferencias acerca de parmetros poblacionales.
Entre los propsitos de estas tcnicas, podemos citar, por ejemplo:
Describir informacin de forma resumida.
Agrupar observaciones o variables en subconjuntos homogneos.
Explorar la existencia de asociaciones entre variables.
Explicar (o probar) comportamientos.
Existen diferentes clasificaciones de los mtodos de Anlisis Multivariante. Una de las
ms usuales distingue dos grandes grupos, segn el objetivo del anlisis: mtodos de
dependencia y mtodos de interdependencia. Adems, dentro de cada uno de estos
grupos, la naturaleza de las variables juega un papel importante en la definicin de los
diversos mtodos. Asimismo, cada mtodo exige unas determinadas condiciones de
aplicacin para asegurar la fiabilidad de los resultados obtenidos.
Los mtodos de dependencia suponen que las variables analizadas estn divididas en
dos grupos: las variables dependientes y las variables independientes. El objetivo de los
mtodos de dependencia consiste en determinar si el conjunto de variables
independientes afecta al conjunto de variables dependientes y de qu forma.
En cuanto a los mtodos de interdependencia, stos no distinguen entre variables
dependientes e independientes, sino que tienen como objetivo identificar qu variables
pueden estar relacionadas entre s, cmo lo estn y por qu.
A continuacin se seala una relacin de mtodos, clasificados segn el criterio
mencionado.

MTODOS DE DEPENDENCIA
Variable(s) independiente(s)
Variable(s) dependiente(s)
Cuantitativa(s)
Cuantitativa(s)
- Regresin
- Anlisis factorial
confirmatorio
- Ecuaciones estructurales
Cualitativa(s)
- Anlisis discriminante
(con 2 ms grupos)
- Probit
- Logit
Cualitativa(s)
- Regresin dummy
- t-test
- ANOVA
- MANOVA
- Anlisis discriminante
dummy
- Anlisis conjunto
(conjoint)
MTODOS DE INTERDEPENDENCIA
Anlisis Factorial (AF)
AF de correlaciones (para variables cuantitativas)
AF de correspondencias (para variables cualitativas)
Anlisis de Componentes Principales

Anlisis cluster (o de conglomerados)
1.2. El Anlisis de la Varianza (ANOVA): introduccin.Los modelos de ANOVA (ANalysis Of VAriance) son tcnicas de Anlisis
Multivariante de dependencia, que se utilizan para analizar datos procedentes de diseos
con una o ms variables independientes cualitativas (medidas en escalas nominales u
ordinales) y una variable dependiente cuantitativa (medida con una escala de intervalo o
de razn). En este contexto, las variables independientes se suelen denominar factores
(y sus diferentes estados posibles o valores son niveles o tratamientos) y la variable
dependiente se conoce como respuesta.
Los modelos ANOVA permiten, bsicamente, comparar los valores medios que toma la
variable dependiente en J poblaciones en las que los niveles de factores son distintos,
con la finalidad de determinar si existen diferencias significativas segn dichos niveles
o si, por el contrario, la respuesta en cada poblacin es independiente de los niveles de
factores. Se trata, por tanto, de un contraste paramtrico que extiende al caso de J
poblaciones el contraste de la igualdad de medias entre dos poblaciones independientes.
Algunos ejemplos de aplicacin de estos modelos podran ser los siguientes:
2

Anlisis de la duracin media de varios tipos de lmparas.

La variable dependiente indicara la duracin de una lmpara y el factor podra
ser la potencia de la lmpara. Las poblaciones estaran formadas por lmparas
con la misma potencia y habra tantas poblaciones como potencias distintas
(stas seran los niveles del factor considerado). Se tratara de contrastar la
igualdad de las duraciones medias de las lmparas de cada poblacin, para
determinar si la potencia influye o no en dicha duracin media.
Estudio del efecto de varios tipos de fertilizantes sobre un cultivo.
La variable dependiente podra ser la produccin o el rendimiento de cada
parcela; los factores seran, por ejemplo, el tipo de suelo de la parcela y el tipo
de fertilizante utilizado. Cada poblacin estara formada por las parcelas que
tienen un tipo concreto de suelo y en las que se utiliza un fertilizante
determinado. El ANOVA se aplicara para analizar la posible existencia de
diferencias en las producciones medias de las parcelas segn el tipo de suelo y el
tipo de fertilizante utilizado.
Aunque existen muchos y muy diferentes modelos de ANOVA, puede obtenerse una
clasificacin bastante simple de los mismos atendiendo a tres criterios: el nmero de
factores, el tipo de muestreo efectuado sobre los niveles de los factores y el tipo de
aleatorizacin utilizada para seleccionar las muestras representativas de cada poblacin
y agrupar sus elementos (o unidades experimentales) en los distintos grupos que se
desea comparar. Veamos esto con ms detenimiento:
Segn el nmero de factores, se llama ANOVA de un factor al modelo en el que

existe una nica variable independiente; en cambio, si el modelo consta de ms
de un factor se le denomina modelo factorial o se habla de Anlisis de Varianza
Factorial.
En cuanto al muestreo de niveles, se refiere a la forma de establecer los niveles

de cada factor. Esto depende, normalmente, de los intereses del investigador. Si
se fijan nicamente aquellos niveles del factor que realmente interesa estudiar,
estamos ante un modelo de ANOVA de efectos fijos (tambin llamado modelo I)
mientras que si los niveles se seleccionan aleatoriamente de entre todos los
posibles, se trata de un modelo ANOVA de efectos aleatorios (o modelo II).
Las distinciones basadas en el tipo de aleatorizacin son equivalentes a las que

se establecen al hablar de muestras independientes y muestras relacionadas.
Como en todo experimento estadstico en el que no resulta posible trabajar con
la poblacin en su totalidad, se deben elegir muestras aleatorias y asignarse
tambin aleatoriamente sus elementos a los diferentes niveles o tratamientos,
para asegurar que no se cometan errores sistemticos. Si las unidades
experimentales reaccionan o responden a los tratamientos de la misma manera,
se dice que son homogneas. Por el contrario si responden de diferente manera a

los tratamientos debido a sus diferencias intrnsecas, se dirn heterogneas. Por

otra parte, el tamao de las muestras puede ser o no el mismo. Diremos que un
diseo es equilibrado o balanceado si todas las muestras tienen el mismo
tamao y no equilibrado o no balanceado en caso contrario.
Como ya hemos indicado, el ANOVA trata de determinar si los niveles de factores
pueden conllevar diferencias en la respuesta en los distintos grupos o poblaciones,
contrastando la igualdad de medias de la variable dependiente en dichos grupos. Para
ello, se basa en el estudio de la varianza.
Si dos poblaciones tienen la misma media y la misma varianza, la unin de ambas
tambin tendr la misma media y la misma varianza que las originales. Por tanto, es
razonable pensar que, si se estimara la varianza poblacional a partir de muestras de las
dos poblaciones iniciales, se obtendra un resultado similar al que se tendra si la
estimacin se efectuara con la unin de ambas muestras.
Sin embargo, si las dos poblaciones tienen distinta media (pero la misma varianza), al
combinarlas cambiaran tanto la media de la nueva distribucin como su varianza. En
este caso, si se estimara la varianza poblacional a partir de una muestra extrada de las
poblaciones iniciales, el resultado sera sustancialmente diferente de una estimacin
efectuada a partir de la muestra conjunta. Lo mismo ocurrira si estuviramos hablando
de ms de dos poblaciones.
Esta observacin es el punto de partida del ANOVA, que permite comparar las medias
de varias poblaciones a partir del estudio de sus varianzas. En concreto, como se ver
ms adelante, se analiza la relacin entre las llamadas medias cuadrticas inter-grupos
y medias cuadrticas intra-grupos, que deben ser iguales si las medias de las
poblaciones lo son.
Para poder aplicar esta tcnica, es necesario que se verifiquen las siguientes condiciones
previas:
Independencia: los individuos estudiados han de ser independientes unos de
otros.
Aleatoriedad: las muestras o grupos objeto de estudio deben haberse obtenido de
forma aleatoria.
Normalidad: las muestras o grupos analizados deben seguir una distribucin
Normal.
Homocedasticidad: debe haber igualdad de varianzas en las muestras o grupos
estudiados.
Veremos a continuacin cmo se plantea un problema con la tcnica ANOVA, primero
para el caso de un factor y luego para el caso factorial.

1.3. ANOVA de un factor.El anlisis de la varianza de un factor se utiliza para comparar el valor medio de una
variable dependiente cuantitativa en varios grupos, que se diferencian por los niveles del
factor considerado.
En este apartado, se considerar un modelo de efectos fijos no equilibrado, en el que,
por tanto, los tamaos muestrales no tienen por qu ser iguales.
Si denotamos por Y a la variable dependiente; J al nmero de muestras o grupos
considerados (correspondientes cada uno a un nivel distinto del factor); n1 , n2 , , n J a
J
los tamaos de cada una de las muestras; n n j al tamao muestral total; e Yij al
j 1
valor de la variable Y correspondiente a la observacin i de la muestra j (para
j 1,2, , J e i 1,2,, n j ), la tabla siguiente resumira los datos disponibles:

Muestras
Observaciones
Total
Medias
Y11 Y21 Yi1 Yn11
T1
Y1
Y12 Y22 Yi 2 Yn2 2
T2
Y2
Tj
Yj
TJ
YJ
Y1 j Y2 j Yij Yn j j
Y1J
Y2 J
YiJ
YnJ J
T T j
j 1
T
n
La aplicacin de la tcnica ANOVA se basa en un contraste de hiptesis. La hiptesis

nula que se contrasta en el ANOVA de un factor es que las medias poblacionales son
iguales:
H 0 : 1 2 J
H 1 : En caso contrario
Si se acepta la hiptesis nula, significar que los grupos no difieren en el valor medio de
la variable dependiente y que, en consecuencia, dicho valor medio se podr considerar
independiente del factor.
Para contrastar dicha hiptesis, introducimos los conceptos de media cuadrtica intergrupos (CME) y de media cuadrtica intra-grupos (CMD), que vienen dados,
respectivamente, por las expresiones:

n j Y j Y
J
CM E
j 1
y CM D
J 1
nj
Yij Y j
J
j 1 i 1
nJ
Los numeradores de cada una de estas medias cuadrticas se conocen como suma de
cuadrados entre grupos, SC E , y como suma de cuadrados dentro de grupos, SC D . Por
su parte, los denominadores son los llamados grados de libertad asociados a dichas
sumas: J 1 y n J , respectivamente.
El estadstico de prueba que utiliza ANOVA para contrastar la hiptesis nula planteada
se construye a partir de los conceptos anteriores; concretamente, viene dado por:
n Y
J
j 1
FJ 1, n J
CM E
CM D
J 1
nj
Y
J
j 1 i 1
ij
Yj
nJ
Suponiendo cierta H 0 , este estadstico sigue una distribucin F de Snedecor con J-1 y
n-J grados de libertad; por lo que dado un nivel de significacin , la regin crtica
vendr
determinada
por
los
valores
tales
que
F FJ11,n J ,
siendo
P [ F FJ11,n J ] 1 .
Ejemplo:
Consideremos cuatro compaas A, B, C y D, cuyas acciones cotizan en Bolsa y
seleccionamos aleatoriamente las cotizaciones de esas acciones en diferentes instantes
de tiempo. As, para la compaa A se observa aleatoriamente la cotizacin en 5
instantes de tiempo, en la B se observa en 4 instantes, en la C en 6 y, por ltimo, en la
compaa D se observa la cotizacin de las acciones en 5 instantes de tiempo.
En la tabla siguiente se muestra la cotizacin en euros de las diferentes acciones en los
instantes de tiempo seleccionados:
Factor
Observaciones
Total
Medias
3.800
760
Tamao
( ni )
670 840 780 610 900
600 800 690 650
2.740
685
800 810 730 690 750 720
4.500
750
970 840 930 790 920
4.450
890
n 20
T 15.490
Y 774,5

Suponiendo que se verifican las hiptesis de normalidad, aleatoriedad, independencia y

homogeneidad de varianzas, se desea contrastar al nivel de significacin del 1% si la
cotizacin media de las acciones de cada una de las cuatro compaas se pueden
considerar iguales.
Solucin:
La hiptesis nula que se debe contrastar es:
H 0 : A B C D
La tabla ANOVA, en la que se indican las sumas de cuadrados, sus grados de libertad y
las medias cuadrticas inter-grupos e intra-grupos, es en este ejemplo:
Fuente de
variacin
Suma de cuadrados
Grados de
libertad
Entre
compaas
SC E 103.395
J 1 3
Dentro de las
compaas
SC D 111.100
n J 16
Total
SCT 214.495
n 1 19
Medias cuadrticas
CM E
SC E
34.465
J 1
CM D
SC D
6.943,75
nJ
CM E
4,96
CM D
La hiptesis nula H 0 se rechazar si F F30,16,99 . A partir de las tablas estadsticas de la

distribucin F de Snedecor, determinamos que F30,16,99 5,29 , por lo que aceptaramos la
hiptesis nula, al ser 4,96<5,29. Por tanto se puede concluir que, para un nivel de
significacin del 1%, la cotizacin media coincide en las 4 compaas consideradas;
esto es, que la evolucin de las cotizaciones de la Bolsa es independiente de la
compaa en que se analice.
Veamos a continuacin cmo se resolvera este problema utilizando el paquete
estadstico PASW Statistics.
En primer lugar, un estudio grfico nos ayudar a formarnos una idea de la situacin. A
travs de la sucesin de comandos Grficos / Generador de grficos / Barras / Barras
de error simple y eligiendo el nivel de confianza en Propiedades del elemento, se llega
a la representacin de intervalos de confianza para las cotizaciones medias en cada
empresa. As, la Figura 1 representa dichas medias y sus correspondientes intervalos de
confianza al 99%. Grficamente, no se observa gran diferencia en las cotizaciones
medias y adems los intervalos de confianza se solapan en buena medida, lo que podra
indicar que los cuatro promedios no son significativamente distintos.

Sin embargo, los mtodos grficos no son, en general, definitivos. Por tanto, para poder
determinar si existen diferencias y, en caso afirmativo, entre qu grupos existen, ser
necesario recurrir al anlisis de varianza. Para llegar a la tabla ANOVA, deberemos
pulsar Analizar / Comparar medias / ANOVA de un factor y a continuacin indicamos
la variable dependiente (cotizacin) y el factor (empresa). Podemos observar que el
resultado, que se muestra en la Figura 2, coincide con el que se ha mostrado en la tabla
de resultados anterior.
Figura 1
Figura 2
Adems, la tabla ANOVA que proporciona PASW Statistics nos da el p-valor asociado
al estadstico de prueba, lo que facilita la toma de decisin en relacin a la aceptacin o
rechazo de la hiptesis nula. Como sabemos, al ser el p-valor superior al nivel de
significacin elegido (0,013>0,01) aceptaramos la hiptesis nula con lo que la
cotizacin media ser independiente de la empresa. Si embargo, si trabajramos con un
nivel de significacin del 5%, la conclusin sera distinta, puesto que 0,013<0,05.
8

Una limitacin importante del mtodo que acabamos de desarrollar es que nicamente
permite contrastar la hiptesis general de que los J promedios comparados son iguales.
Sin embargo, en el caso de que se rechace esa hiptesis y por tanto las medias no sean
iguales, no se podr precisar cules son las muestras que tienen medias distintas. Para
resolver esta cuestin, se deben utilizar otros contrastes, conocidos como
comparaciones mltiples post-hoc o comparaciones a posteriori. Los mtodos de este
tipo que ofrece PASW Statistics son muy diversos y cada uno de ellos necesita de unas
condiciones iniciales para su aplicacin. Desarrollaremos a continuacin el mtodo de
Scheff, que tiene menos restricciones para su aplicacin que los dems.
Mtodo de Scheff de comparaciones mltiples
En general, este mtodo consiste en formular un contraste sobre una combinacin lineal
de cualquier nmero de medias poblacionales. En el caso particular que nos interesa de
comparacin de medias, las hiptesis que se formulan para los distintos valores de j
son las siguientes:
H 0 : j1 j2 0
y, para ello, se utiliza el estadstico de prueba: FJ 1,n J
j1
Y j2
, que,
SC D 1
1
J 1
n J n j1 n j2
suponiendo cierta H 0 , sigue una distribucin F de Snedecor con J-1 y n-J grados de
libertad, por lo que dado un nivel de significacin , la regin crtica vendr
determinada por los valores tales que F FJ11,n J , siendo P [ F FJ11,n J ] 1 .

Ejemplo:
El departamento de marketing de una empresa desea estudiar la repercusin de sus
campaas publicitarias en las cifras de ventas de uno de sus productos. Se realizaron
tres campaas diferentes, cada una en una provincia de la misma Comunidad
Autnoma.
Las tres campaas tenan diferentes caractersticas en cuanto al medio de comunicacin
utilizado. La campaa A se centraba en la prensa escrita, la B en las emisoras de radio y
la C en anuncios en vallas publicitarias.
Durante los tres primeros meses, las cifras de ventas (en cientos de unidades) en cinco
tiendas fueron las siguientes:

Medio de
comunicacin
Ventas
(en cientos de unidades)
A (prensa)
30 20 35 42 60
B (radio)
85 73 92 86 75
C (vallas)
40 28 39 41 50
Se desea contrastar, a un nivel de confianza del 95%, si existen diferencias

significativas en cuanto a las cifras medias de ventas segn el tipo de campaa
publicitaria utilizada y, si es as, determinar entre qu tipos de campaa se dan tales
diferencias.
Solucin:
En este caso, el grfico de barras de error (Figura 3) parece indicar que existen
diferencias significativas entre las ventas medias en cada nivel del factor, puesto que los
intervalos de los 3 no se solapan. Adems, parece que las diferencias se darn cuando la
campaa elegida es la radio, pues los otros casos s se solapan.
Figura 3
Antes de contrastar la hiptesis de igualdad de medias, comprobaremos si se verifican
las hiptesis de aplicacin del ANOVA de un factor; en concreto, la normalidad y la
10

homoscedasticidad, puesto que los otros dos supuestos (independencia y aleatoriedad)

hacen referencia a la eleccin de las muestras.
Normalidad. sta se puede estudiar a travs del test de Shapiro-Wilk (dado que el
tamao muestral es inferior a 50), que se obtiene a travs de Analizar / Estadsticos
descriptivos / Explorar, indicando la variable dependiente (ventas) y el factor
(campaa publicitaria) y pulsando seguidamente en Grficos, donde se elige la
opcin Grficos con prueba de normalidad 1 .
Figura 4
En este contraste, la hiptesis nula plantea que los datos proceden de poblaciones
normales. En las tres muestras (correspondientes a los tres tipos de campaa
publicitaria: prensa, radio y vallas publicitarias) se acepta la hiptesis nula,
dado que los p-valores toman, respectivamente, los valores 0,881; 0,509 y 0,600 que
son mayores que 0,05, que es el nivel de significacin con el que estamos
trabajando. 2
Homoscedasticidad. En este caso, aplicamos el test de Levene, que establece como

hiptesis nula la igualdad de varianzas en las distintas poblaciones. La forma de
operar con PASW Statistics aqu es: Analizar / Estadsticos descriptivos / Explorar,
indicando la variable dependiente (ventas) y el factor (campaa publicitaria) y
pulsando seguidamente en Grficos, donde se elige, dentro del apartado Dispersin
por nivel con prueba de Levene, la opcin Estimacin de potencia.
Como muestra la Figura 5, la prueba de homogeneidad de la varianza arroja pvalores mayores que el nivel de significacin fijado del 5%, lo que lleva a aceptar la
hiptesis nula y por tanto la igualdad de varianzas (generalmente se suele utilizar la
prueba efectuada basndose en la media).
Al elegir esta opcin, junto a una serie de grficos denominados Grficos Q-Q normales, PASW
Statistics nos ofrece una tabla donde se recogen los resultados analticos de las pruebas de normalidad.
Dado que esta tabla es la que fundamentalmente nos interesa, es lo nico que mostramos en la Figura 4,
obviando los referidos grficos.
2
Obsrvese en la Figura 4 que al efectuar el contraste con PASW Statistics, tambin obtenemos el
resultado del test de Kolmogorov-Smirnov, que se aplica para tamaos muestrales superiores a 50.
1
11

Figura 5
Una vez comprobadas las hiptesis necesarias para llevar a cabo el ANOVA, podemos
aplicarlo. La Figura 6 nos muestra el resultado. Para un nivel de significacin del 5%,
el p-valor resultante (0,000) nos lleva a rechazar la hiptesis nula de igualdad de
medias. Concluimos, por tanto, que el tipo de campaa publicitaria utilizado repercute
en las ventas medias.
Figura 6
Para saber entre qu tipos de campaas publicitarias se encuentran las diferencias,
llevamos a cabo un contraste de comparaciones mltiples, pulsando Analizar /
Comparar medias / ANOVA de un factor / Post hoc y eligiendo la opcin Scheff en el
cuadro Asumiendo varianzas iguales.
El resultado obtenido se muestra en la Figura 7, donde se ofrecen las distintas
combinaciones de pares de tipos de campaas publicitarias, con el p-valor asociado al
contraste que plantea, como hiptesis nula, la nulidad de diferencia de las medias
correspondientes. Se observa que existen diferencias significativas de medias entre las
campaas de radio y prensa y las de radio y vallas publicitarias; en ambos
casos, el p-valor es de 0,000, esto es, menor que el nivel de significacin del 5%
(adems, las diferencias significativas aparecen marcadas con * por PASW Statistics).
Ntese, sin embargo, que no sucede as en el caso de la prensa y las vallas
publicitarias.
12

Figura 7
Otro modo alternativo de llegar a esta conclusin es comprobar si el intervalo de
confianza para la diferencia de medias contiene o no al cero. Si es as, se acepta la
hiptesis nula y consecuentemente no hay diferencias significativas; por el contrario, si
no, se rechaza la hiptesis nula y s se evidencian diferencias significativas.
Adems, el programa PASW Statistics tambin proporciona una clasificacin de los
grupos considerados en subconjuntos homogneos en cuanto a la media de la variable
dependiente (Figura 8). As, en nuestro ejemplo se observa que las campaas de
prensa y vallas publicitarias pertenecen al mismo subconjunto (sus medias pueden
considerarse iguales al nivel de significacin del 5%), mientras que la campaa de
radio forma un segundo subconjunto.
Figura 8
1.4. Anlisis de Varianza Factorial.El Anlisis de Varianza Factorial permite estudiar la influencia de dos o ms factores
sobre la variable dependiente. En estos experimentos factoriales se pueden considerar
por separado los efectos individuales de los factores y adems se puede estudiar su
interaccin, que se introduce en el modelo de forma multiplicativa. La existencia de
13

interaccin indica por tanto que el efecto de los factores sobre la variable respuesta no
es totalmente aditivo.
En un anlisis de varianza factorial existe una hiptesis nula por cada factor y por cada
posible combinacin de factores. La hiptesis nula referida a un factor individual afirma
que las medias de las poblaciones definidas por los niveles del factor son iguales; la
referida al efecto de una interaccin entre factores afirma que tal efecto es nulo.
Para contrastar cada una de estas hiptesis, el ANOVA factorial se sirve de estadsticos
basados en la lgica ya expuesta para el ANOVA de un factor, y que siguen
distribuciones de probabilidad F de Snedecor.
En un ANOVA factorial se trabaja con tantas poblaciones (que se suponen normales y
homoscedsticas) como combinaciones haya de todos los niveles de los factores
involucrados. Tambin se asume que las observaciones han sido aleatoriamente
seleccionadas (una muestra en cada poblacin) y que, por tanto, son independientes
entre s.
Ejemplo:
Una subdelegacin del Ministerio de Educacin y Ciencia est interesada en estudiar la
cantidad anual pagada por los padres de alumnos de Enseanza Primaria en los colegios
privados pertenecientes al territorio de su mbito de competencia. Para realizar el
estudio se clasificaron los colegios privados de este territorio por bloques, segn su
localizacin geogrfica y segn el nmero de alumnos por aula que los colegios
afirmaban tener (considerando sta ltima variable como categrica: 25 alumnos o ms,
o bien, menos de 25 alumnos). En cada una de las combinaciones obtenidas se
seleccion una muestra aleatoria de 3 colegios y se recogi informacin correspondiente
a la cantidad anual (en cientos de euros) que el colegio reciba por cada alumno de
Enseanza Primaria. Los datos obtenidos se muestran en la tabla siguiente:
Alumnos \ Zona
Zona Norte
Zona Centro
Zona Sur
Menos de 25
alumnos por
aula
32
25,4
50
45,5
37,2
20,9
28,95
23
27
21,6
26,5
15
25
17,2
24
19
22
18
25 ms
alumnos por
aula
Suponiendo que se verifican las hiptesis de normalidad, independencia y

homoscedasticidad, se desea saber si los colegios privados pertenecientes a esta
subdelegacin presentan diferencias significativas en las cantidades cobradas a los
alumnos de Enseanzas Primarias, segn su localizacin y nmero de alumnos por aula.
14

Solucin:
En este caso, se trata de un modelo con 2 factores: localizacin y nmero de alumnos
por aula (por tramos). El primero de estos factores tiene 3 niveles: zona norte, zona
centro y zona sur; mientras que el segundo tiene 2 niveles: menos de 25 alumnos por
aula y 25 ms alumnos por aula. De la combinacin de los niveles, se obtienen 6
poblaciones que vamos a suponer normales, independientes y homoscedsticas, con las
que se trabajar.
Para llevar a cabo un ANOVA factorial con PASW Statistics se utilizarn las
especificaciones del procedimiento Univariante al que se llega a travs de: Analizar /
Modelo Lineal General / Univariante.
La primera de las tablas (Figura 9) ofrece datos generales del problema: nombre de las
variables independientes (factores), sus niveles y el tamao de cada grupo resultante.
Figura 9
La tabla resumen del ANOVA (Figura 10) contiene informacin similar a la que
proporcionaba la tabla del modelo de un nico factor: las fuentes de variacin, las
sumas de cuadrados, los grados de libertad, las medias cuadrticas, los estadsticos de
prueba y los p-valores asociados a cada uno de estos estadsticos, que nos permite
finalmente obtener la conclusin del contraste llevado a cabo.
Las filas correspondientes a Numalumnos (nmero de alumnos) y Zona recogen los
efectos principales, es decir, los efectos individuales de los dos factores incluidos en el
modelo: nmero de alumnos por aula y zona en la que se encuentra el colegio. Los
p-valores indican que, mientras los grupos definidos por la variable nmero de alumnos
pagan unas cantidades medias significativamente diferentes (el p-valor = 0,014 < 0,05
que aparece nos lleva a rechazar la hiptesis nula de igualdad de medias), las cantidades
medias pagadas en los grupos definidos por la variable zona no parecen diferir (el pvalor = 0,753 > 0,05, por lo que se acepta la hiptesis nula de igualdad de medias).
La siguiente fila (Numalumnos*zona) contiene informacin sobre el efecto interaccin
entre ambas variables. El estadstico F correspondiente a este efecto tiene asociado un
15

nivel crtico de 0,714 > 0,05, lo que indica que el efecto de la interaccin no es
significativo.
Figura 10
Finalmente, es interesante observar el coeficiente que se ofrece en una nota al pie de la
tabla: R 2 0,44 . Dicho coeficiente se obtiene dividiendo la suma de cuadrados del
Modelo corregido entre la suma de cuadrados Total corregida, e indica que los tres
efectos incluidos en el modelo (nmero de alumnos, zona y su interaccin, el producto
de ambos: nmero de alumnos*zona) son capaces de predecir el 44% de la cantidad
pagada.
16

En este tema se ofrecen las nociones fundamentales de dos tcnicas de Anlisis

Multivariante que tienen un extenso nmero de aplicaciones en el mbito de la
Economa y la Empresa. En concreto, se trata del Anlisis discriminante y del Anlisis
cluster o de conglomerados. Ambos anlisis se utilizan para clasificar elementos en
grupos o categoras. Sin embargo, mientras que el Anlisis discriminante parte ya de
grupos existentes y proporciona un medio para realizar futuras asignaciones de nuevos
casos a partir de los valores de un conjunto de variables independientes, el Anlisis
cluster no tiene preestablecidos los grupos, sino que el anlisis de las variables es el que
determina cmo agrupar en conglomerados a los elementos de la muestra.
A continuacin, se introducirn brevemente los aspectos tericos ms importantes
relativos a ambas tcnicas y se ver su aplicacin prctica, mediante distintos ejemplos,
a travs del programa PASW Statistics.
1.5.
Anlisis discriminante.-
El Anlisis discriminante es una tcnica de Anlisis Multivariante que pertenece al

grupo de los mtodos de dependencia. Como todos stos, estudia la relacin entre varias
variables que se clasifican unas como dependientes y otras como independientes.
Partiendo de un conjunto de elementos que pertenecen a diferentes grupos previamente
establecidos, se trata de analizar la informacin relativa a una serie de variables
independientes con un doble fin:
- Explicativo: Determinar la contribucin de cada variable independiente a la
clasificacin correcta de cada elemento.
- Predictivo: Determinar el grupo al que pertenece un nuevo elemento para el que se
conocen los valores que toman las variables independientes.
La pertenencia de los elementos objeto de estudio a un grupo u a otro se introduce en el
anlisis a travs de una variable cualitativa que toma tantos valores como grupos
existentes. Esta variable juega el papel de variable dependiente. Las variables
independientes suelen llamarse en este anlisis, variables discriminantes o
clasificadoras.
De acuerdo con el razonamiento que se indicar seguidamente, la informacin
inicialmente disponible se sintetiza en las llamadas funciones discriminantes, que no
son ms que combinaciones lineales de las variables clasificadoras.
Antes de ello, es importante sealar que el Anlisis discriminante, como todas las
tcnicas estadsticas, tiene que cumplir unos requisitos para su aplicacin. En concreto,
se trata de los siguientes:
-
Los grupos deben ser mutuamente excluyentes y deben existir al menos 2.

Cuando hay ms de 2 grupos, se habla de Anlisis discriminante mltiple.
17

Para cada grupo, son necesarios ms de 2 elementos o casos.
El nmero de variables discriminantes a emplear no puede ser superior al

nmero de casos menos 2.
La variable dependiente que define los grupos ha de ser nominal.
No puede haber relacionales lineales (multicolinealidad) entre las variables

discriminantes.
El nmero de funciones discriminantes que se pueden obtener viene dado por el

mnimo entre J-1 y m, siendo J el nmero de grupos y m el nmero de variables
clasificadoras empleadas.
Las matrices de varianzas-covarianzas de cada grupo han de ser iguales

(homoscedasticidad).
Las variables discriminantes han de seguir una distribucin normal

multivariante.
Hay autores que consideran que las tres ltimas hiptesis se deben contemplar de forma
laxa; si no se verifican, los resultados pueden estar condicionados, pero no se invalida
su calidad. Es decir, es preferible su verificacin, pero no imposibilitan la aplicacin del
Anlisis discriminante.
Existen varios procedimientos para calcular las funciones discriminantes y, a partir de
ellas, asignar a los elementos entre los distintos grupos. Uno de los ms utilizados es el
mtodo de Fisher, que describiremos brevemente para el caso de 2 grupos y m variables
clasificadoras. Para el caso general, la idea subyacente es similar.
Como ya se ha indicado, se trata de crear, a partir de m variables clasificadoras que
denotaremos por X 1 , X 2 , , X m , una funcin D , que ser combinacin lineal de
dichas variables:
D a1 X 1 a 2 X 2 a m X m
El objetivo que se persigue es que los valores de esta funcin se diferencien lo ms
posibles de un grupo a otro y sean muy parecidas para los elementos de un mismo
grupo. Habr que encontrar entonces los valores de los coeficientes a1 , a 2 , , a m para
que esto se cumpla. De este modo, se pretende reducir la dimensionalidad de las m
variables independientes a una nica dimensin, la de la combinacin lineal D . Una
vez creada esta funcin discriminante, se calcular su valor para los nuevos elementos
(puntuacin discriminante) y stos se clasificarn en el grupo que corresponda segn la
puntuacin obtenida.
El planteamiento del mtodo de Fisher para hallar los coeficientes de la funcin
discriminante consiste en maximizar la variacin de la funcin D entre grupos y, al
mismo tiempo, para evitar errores, se deber tratar de que la variacin dentro de cada
18

grupo sea lo menor posible. Atendiendo a este razonamiento, se debe maximizar la

ratio:
variacin inter - grupos

.
variacin intra - grupos
Las variaciones inter-grupos e intra-grupos se calculan a partir de las correspondientes

sumas de los cuadrados de las desviaciones de las puntuaciones con respecto a las de los
centroides, es decir a las puntuaciones discriminantes correspondientes a valores de las
variables independientes iguales a las medias de cada grupo; esto es:
D1 a1 X 1(1) a 2 X 2(1) a m X m(1) ;
D2 a1 X 1( 2 ) a 2 X 2( 2 ) a m X m( 2) .
As, puede expresarse en funcin de los coeficientes desconocidos a1 , a 2 , , a m ; se

tratar entonces de maximizar esa funcin de dos variables para obtener los coeficientes
de la funcin discriminante. La solucin resultante indica que a1 , a 2 , , a m son las
coordenadas de un autovector asociado al mayor autovalor de cierta matriz cuyos
elementos dependen nicamente de los valores observados de las variables
independientes X 1 , X 2 , , X m .
Si existieran ms grupos, sera necesario definir r funciones discriminantes (siendo r el
mnimo entre J-1 y el nmero de variables clasificadoras m). En tal caso, se elegiran los
autovectores asociados a los r mayores autovalores de la matriz.
Una vez definida la funcin discriminante, se debe fijar un criterio para clasificar a los
nuevos elementos. Uno de ellos consiste en calcular el punto de corte discriminante
(PCD) que no es ms que la media de las puntuaciones discriminantes medias de cada
grupo:
D (1) D ( 2 )
PCD
.
2
y aplicar el siguiente criterio para clasificar un elemento i:

-
Si Di PCD , se clasifica al elemento en el grupo 1.
Si Di PCD , se clasifica al elemento en el grupo 2.
Cuando existen ms de 2 grupos y, por tanto, ms funciones discriminantes, el criterio

para clasificar los nuevos elementos no resulta, desde el punto de vista terico, tan
evidente. Sin embargo, el procedimiento que usa el programa PASW Statistics, que es el
que utilizaremos para desarrollar este tipo de anlisis, es bastante sencillo: consiste en
calcular una funcin de clasificacin para cada grupo y asignar los elementos al grupo
para el que esta funcin tome el valor ms elevado. Estas funciones de clasificacin son
19

combinaciones lineales de las variables clasificadoras y constan, adems, de un trmino

independiente.
Veremos este procedimiento a continuacin, resolviendo con PASW Statistics dos
ejemplos: en el primero de ellos se considerarn dos grupos nicamente, mientras que
en el segundo ejemplo se trabajar con tres grupos.
Ejemplo:
En un banco se tiene informacin acerca de 16 clientes que solicitaron prstamos
instantneos por valor de 6.000 euros cada uno. Al cabo de 3 aos desde la concesin de
dicho crdito haba 8 clientes, de ese grupo de 16, que fueron clasificados como
fallidos, mientras que los otros 8 clientes resultaron no fallidos o cumplidores, ya que
reintegraron el prstamo. Para cada uno de los clientes se dispone de informacin sobre
su patrimonio neto y deuda pendiente correspondientes al momento de la solicitud,
ambas variables medidas en miles de euros. Todo ello aparece recogido en la siguiente
tabla:
Fallidos
Cliente
1
2
3
4
5
6
7
8
Patrimoni
o neto
7,80
22,20
30,00
35,40
42,60
24,00
47,40
30,60
No fallidos
Deuda
pendiente
24,60
41,40
18,00
39,00
32,40
16,20
45,60
22,80
Cliente
9
10
11
12
13
14
15
16
Patrimoni
o neto
31,20
58,80
54,00
72,00
37,80
52,20
66,60
59,40
Deuda
pendiente
6,00
25,20
28,80
12,00
31,20
6,60
24,60
9,60
En la mesa del director del banco hay ahora dos nuevas solicitudes de prstamo
instantneo. El primer solicitante dispone de un patrimonio neto de 60,6 (miles de
euros), con deudas pendientes por valor de 40,8 (miles de euros). Para el segundo
solicitante estos valores son de 58,2 y 13,2 (miles de euros) respectivamente
Se pide, mediante la aplicacin del Anlisis discriminante, construir una funcin
discriminante a partir de las variables patrimonio neto y deuda pendiente, que
permita clasificar, con el menor error posible, a los nuevos clientes en el grupo de
fallidos, o bien en el de no fallidos.
Solucin:
Partiendo de las variables clasificadoras patrimonio neto y deuda pendiente, se
estimar 1 funcin discriminante.
Junto a las dos variables citadas, en PASW Statistics se debe crear una variable ms que
indique el grupo al que pertenece cada elemento. Esta variable la vamos a denominar
20

aqu Grupo y le asignaremos el valor 1 para los clientes fallidos y el 2 para los no
fallidos. Una vez introducidos todos los datos, si se pulsa Analizar / Clasificar /
Discriminante, se obtendr el siguiente cuadro de dilogo, en el que se ha elegido como
variable de agrupacin la variable Grupo, que es la que indica a qu grupo pertenece
cada individuo:
Figura 1
Como puede verse en la Figura 1, tras el nombre de la variable de agrupacin aparecen,
entre parntesis, dos signos de interrogacin. Se deber pulsar en Definir rango e
indicar los valores mnimo y mximo de los grupos que deseamos analizar, que son 1 y
2, respectivamente. A continuacin, deberemos seleccionar las dos variables
independientes e introducirlas en el cuadro en blanco habilitado para ellas
(Independientes).
Seguidamente pulsaremos Aceptar, dejando las opciones que vienen predeterminadas
por PASW Statistics. 3
Las Figuras 2 a 5 muestran algunos de los cuadros que se obtienen en el visor de
resultados y que resultan de inters para nuestro propsito.
En primer lugar, se presentan algunos datos puramente descriptivos. En concreto, la
Figura 2 contiene un resumen de los casos, clasificndolos en vlidos y perdidos. Por su
parte, la Figura 3 recoge el nmero de casos existentes en cada grupo. Es importante
observar si existe mucha diferencia en el tamao de los grupos, porque esto podra
En particular, se ha seleccionado Introducir independientes juntas, lo que significa que todas las
variables independientes sern consideradas en el proceso discriminante. Si se hubiera elegido Usar
mtodo de inclusin por pasos, se iran seleccionando las variables independientes de mayor a menor
poder discriminante y siempre que tuvieran un mnimo de poder discriminante. En lo que respecta a las
opciones que pueden elegirse en Estadsticos, Mtodo, Clasificar y Guardar, ms adelante se explorarn
algunas de ellas.
21

afectar a la clasificacin; si as fuera, PASW Statistics nos dar la opcin de tenerlo en

cuenta.
Figura 2
Figura 3
La tabla Coeficientes estandarizados de las funciones discriminantes cannicas (Figura
4) contiene la versin tipificada de los coeficientes de las funciones cannicas
discriminantes. No se trata de la funcin discriminante que se utiliza para clasificar a los
individuos en un grupo u otro (sta se conoce como funcin discriminante cannica no
tipificada). Estos coeficientes, al estar tipificados, son independientes de la mtrica
original de las variables independientes y permiten determinar el peso relativo de cada
variable en la funcin discriminante (fijndonos en su valor absoluto), as como el
sentido de su efecto (observando su signo).
As, en este ejemplo puede concluirse que la variable patrimonio neto tiene mayor
relevancia que la deuda pendiente a la hora de predecir el grupo de pertenencia de los
individuos, puesto que su coeficiente en valor absoluto es ms elevado (0,922 frente a
0,686). Y en cuanto a la interpretacin exacta de los signos, es preciso conocer el signo
de las puntuaciones de los centroides de cada grupo, es decir el signo de la funcin
discriminante correspondiente a los valores medios de cada variable clasificadora
22

(Figura 5). Segn esto, en el presente ejemplo los signos indican que el grupo de los
clientes fallidos se encuentra localizado, en promedio, en las puntuaciones negativas
de la funcin, mientras que los clientes no fallidos se hallan en las positivas.
Figura 4
Figura 5
En general, se dir que si la variable clasificadora toma un valor por encima de la
media, el individuo se clasificar en el grupo en el que el signo de la puntuacin del
centroide coincida con el signo del coeficiente de la variable. De este modo, se puede
afirmar que un patrimonio neto por encima de la media 4 hace ms probable la obtencin
de una puntuacin discriminante positiva (al ser positivo el coeficiente) y, de esta
manera, se ajustar ms al patrn de los clientes no fallidos (ya que para stos la
puntuacin del centroide es positiva). Por el contrario, una deuda pendiente por encima
de la media propiciar una puntuacin discriminante negativa (puesto que el coeficiente
asociado a esta variable es negativo) y esto llevar a clasificar al individuo entre los
fallidos (cuyo centroide tiene puntuacin negativa).
Seguidamente se van a mostrar algunas opciones de PASW Statistics que se pueden
elegir dentro del Anlisis discriminante y que nos aportarn informacin determinante
para clasificar nuevos individuos en los grupos existentes, as como para estudiar la
fiabilidad de los resultados.
Los valores medios de las variables pueden fcilmente conocerse en PASW Statistics llevando a cabo un
anlisis descriptivo de las mismas.
23

Como se recordar, en el cuadro de dilogo que se obtena tras pulsar Analizar /

Clasificar / Discriminante aparecan, entre otros, los botones Estadsticos y Clasificar
(Figura 1).
Si dentro de Estadsticos se eligen como estadsticos descriptivos ANOVAs univariados
y M de Box y como coeficientes de la funcin De Fisher y No tipificados, se obtendrn,
adems de los resultados ya descritos, los que se muestran en las Figuras 6 a 9.
La Figura 6 proporciona los resultados de la aplicacin de ANOVA a cada variable
clasificadora, de manera que se puede contrastar, para cada una de ellas, la igualdad de
medias en los dos grupos. En lo que se refiere al patrimonio neto, su p-valor asociado
nos lleva a rechazar la hiptesis nula, lo que significar que el patrimonio neto medio es
distinto para fallidos y no fallidos; la conclusin sera la misma en lo que respecta a la
deuda pendiente, para un nivel de significacin mnimo del 4,4%. Este hecho
constituye un indicio de que las dos variables tienen poder discriminante y por tanto
deben introducirse como tales en el anlisis. Por el contrario, si no se observaran
diferencias de medias entre los grupos para alguna de las variables clasificadoras, quizs
no sera necesario incluirla en el modelo.
Figura 6
En cuanto a la prueba M de Box, se utiliza para contrastar la hiptesis nula de igualdad
de las matrices de varianzas-covarianzas de los grupos que, como ya se coment, es uno
de los requisitos para la aplicacin del Anlisis discriminante. Dicho contraste se lleva a
cabo utilizando el estadstico M de Box (0,951) que muestra la Figura 7. Su p-valor
asociado vale 0,849, lo que lleva a aceptar la hiptesis nula de que las matrices de
varianzas-covarianzas son iguales.
Figura 7
24

A continuacin, podemos observar los coeficientes de la funcin de clasificacin para

cada grupo (Figura 8) que tambin se suelen denominar funciones discriminantes
lineales de Fisher. Estos coeficientes se emplean nicamente para clasificar a los
nuevos individuos en alguno de los grupos ya existentes. Para ello, se calcula el valor de
las dos funciones (una por grupo) y el individuo se clasificar en el grupo para el que se
obtenga una mayor puntuacin.
Figura 8
De acuerdo con todo lo expuesto hasta ahora, procedamos a clasificar a los nuevos
solicitantes de prstamo. Recordemos que el primero dispona de un patrimonio neto de
60,6 (miles de euros) y tena deudas pendientes por valor de 40,8 (miles de euros); por
su parte, para el segundo solicitante estos valores eran de 58,2 y 13,2 respectivamente.
La funcin de clasificacin para el grupo de fallidos sera:
0,130 * Patrimonio neto 0,216 * Deuda pendiente - 5,876 .

Segn esto, para el solicitante 1 esta funcin valdra: 10,8148; y para el solicitante 2
sera: 4,5412.
En cuanto a la funcin de clasificacin para los no fallidos, sta vendra dada por:
0,302 * Patrimonio neto 0,61 * Deuda pendiente - 9,396 .
La puntuacin del solicitante 1 en este caso sera: 11,394; y para el solicitante 2: 8,9856.
Como podemos ver, ambos solicitantes obtienen mayores puntuaciones en la segunda
funcin, por lo que los dos se clasificarn en el grupo de los clientes no fallidos.
La ltima de las opciones elegidas en el cuadro Estadsticos nos da los coeficientes de la
funcin cannica discriminante. stos son los coeficientes que el programa utiliza para
clasificar a los individuos, calculando las puntuaciones y comparndolas con el punto
medio de los centroides. Sin embargo, para nosotros no es relevante, puesto que no las
utilizaremos para la clasificacin y, adems, al tratarse de coeficientes no tipificados,
pueden estar afectados por las unidades de medidas de las variables independientes, lo
que dificulta su interpretacin.
25

Figura 9
Para terminar, vamos a examinar algunas de las opciones disponibles en la opcin

Clasificar del Anlisis discriminante; en concreto Probabilidades previas (donde
marcaremos Todos los grupos iguales 5 ) y Visualizacin (aqu elegiremos Resultados
para cada caso y Tabla de resumen).
La primera tabla resultante (Figura 10) indica simplemente el porcentaje de los casos
totales que pertenecen al grupo fallidos y al grupo no fallidos, bajo la denominacin
Probabilidades previas. Vendra a ser una referencia inicial, en el sentido de que si
eligisemos un cliente al azar y lo clasificsemos sistemticamente como perteneciente
al grupo de los fallidos, acertaramos en el 50% de los casos, ya que se es el
porcentaje de clientes de la muestra inicial que se encuentran en ese grupo (lo mismo
ocurrira, en este caso, con los no fallidos). La aplicacin del Anlisis discriminante
resultar tanto mejor en cuanto se incremente el porcentaje de aciertos.
Figura 10
Los Resultados para cada caso se recogen en la Figura 11. Para cada cliente de la
muestra inicial, se seala el grupo real al que pertenece, el pronosticado, si ha habido
error en la prediccin (se indica con **) y la probabilidad de que cada caso pertenezca a
cada grupo condicionada a la distancia existente al centroide de cada grupo. Como se
puede observar, ha habido nicamente un cliente mal clasificado: el nmero 13.
Marcamos esta opcin porque as es en nuestro ejemplo. Si las muestras tuvieran tamaos distintos,
habra que elegir Calcular segn tamaos de grupos.
26

Figura 11
Por ltimo, la Tabla de resumen, tambin llamada Matriz de confusin se muestra en la

Figura 12. En ella pueden apreciarse los aciertos y errores obtenidos en la clasificacin
realizada con la funcin discriminante calculada. De los 8 clientes fallidos, los 8 se
han pronosticado en ese grupo (100% de aciertos), mientras que 1 de los no fallidos
se ha clasificado errneamente como fallido (87,5% de aciertos). En total, la
clasificacin ha acertado en: 8 + 7 = 15 casos, lo que representa un 93,8% del total y
significa que el poder discriminante de las variables independientes consideradas resulta
muy alto.
Figura 12
A continuacin, se resolver un nuevo ejemplo de Anlisis discriminante con PASW

Statistics, esta vez con tres grupos.
Ejemplo:
Un banco ordena un estudio que permita identificar con la mayor precisin posible
aquellas solicitudes de prstamos que probablemente puedan llegar a convertirse en
morosos o fallidos en el caso que se concedieran. Para ello, dispone de la informacin
27

reflejada en la tabla ms abajo, relativa a 25 clientes y a las variables que se definen a

continuacin:
- Ingresos: ingresos anuales del cliente, en miles de euros.
- Patrneto: patrimonio neto del cliente, en miles de euros.
- Proviv: variable dicotmica que toma el valor 1 si el cliente es propietario de la
vivienda que habita; 0 en caso contrario.
- Casado: variable dicotmica que toma el valor 1 si el cliente est casado; 0 en caso
contrario.
- Salfij: variable dicotmica que toma el valor 1 si el cliente es asalariado con contrato
fijo; 0 en caso contrario.
- Categ: grado de cumplimiento del cliente en el reintegro del prstamo. Toma el valor 1
si el cliente es cumplidor; 2 si el cliente es moroso; 3 si el cliente es fallido.
Client
e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Categor
a
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
3
3
3
3
3
Ingreso
s
32,7
18,6
24,6
37,2
23,7
7,5
29,4
53,4
20,1
31,2
17,1
39
45,6
26,1
8,1
12,6
8,7
38,4
22,8
14,7
19,8
5,1
7,2
11,1
15,9
Patneto
336
204
138
270
114
132
90
228
324
480
108
132
216
234
48
114
150
24
114
60
42
72
30
36
150
Provi
v
1
1
0
1
1
1
0
1
0
1
1
1
1
1
0
0
1
0
1
0
0
0
1
1
0
Casad
o
1
0
1
0
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1
1
1
0
0
Salfij
0
1
1
1
1
1
1
1
1
0
1
1
1
0
1
1
1
1
0
1
0
0
1
0
0
Solucin:
En este caso, se trata de aplicar el Anlisis discriminante mltiple, ya que el banco ha
clasificado a sus clientes en tres grupos.
Habr que construir funciones de clasificacin que permitan clasificar, con los menores
errores posibles, a los clientes en los diferentes grupos. Si se obtienen buenos
28

resultados, estas funciones se podrn utilizar para analizar si se concede o no un

prstamo a un futuro solicitante.
Como ya sabemos, en Analizar / Clasificar / Discriminante se obtiene un cuadro de
dilogo en el que tenemos que seleccionar la variable de agrupacin (cuyo rango es
ahora 1 3) y las variables independientes. Asimismo podemos elegir las opciones
adecuadas para los resultados que deseamos analizar.
Para cada variable clasificadora contrastamos la igualdad de medias entre los grupos,
para tratar de determinar si las variables sern realmente discriminantes. Los ANOVAs
de la Figura 13 nos indican que no se observan diferencias significativas entre los
cumplidores, morosos y fallidos, en cuanto al hecho de ser propietario o no de la
vivienda que habitan (Proviv) y de estar o no casado (Casado). Por tanto estas variables
no deberan tener una gran influencia a la hora de clasificar a los clientes en uno u otro
grupo.
Figura 13
En este punto, podemos dar respuesta ya a la peticin del banco calculando las
funciones de clasificacin para cada grupo. La Figura 14 muestra los coeficientes de
cada una de ellas, para el grupo de clientes cumplidores, para los morosos y para
los fallidos.
Figura 14
De acuerdo con los coeficientes estimados, se obtienen las siguientes funciones:

29

- Clientes cumplidores:
0,201 * Ingresos 0,076 * Patrneto 5,074 * Proviv 9,363 * Casado 19,210 * Salfij - 25,768
- Clientes morosos:
- Clientes fallidos:
Cuando el banco reciba una nueva solicitud de prstamo, podr determinar a qu grupo
puede pertenecer el cliente evaluando las tres funciones y asignndolo al grupo para el
que se haya obtenido una mayor puntuacin.
El poder predictivo de estas funciones de clasificacin se puede valorar a travs de la
Tabla de resumen (Figura 15) que ofrece PASW Statistics. Como puede observarse, se
han clasificado correctamente 12 + 6 + 4 clientes, o sea 22 de los 25 que conformaban
la muestra inicial. Esto representa un 88,0% de aciertos, lo que nos lleva a afirmar que
nuestro modelo es bastante bueno.
Figura 15
1.6. Anlisis cluster o de conglomerados.A diferencia del Anlisis discriminante, el Anlisis cluster o de conglomerados es una
tcnica de Anlisis multivariante de interdependencia. No distingue por tanto entre
variables dependientes e independientes, sino que, dado un conjunto de variables (las
variables de decisin), analizar la informacin contenida en ellas para clasificar a los
elementos segn su similitud en conglomerados, los cuales deben ser entre s lo ms
distintos posible. Aqu no se parte de grupos previamente establecidos para la muestra,
como se hace en el Anlisis discriminante. Se trata de un anlisis meramente
descriptivo, que no tiene bases estadsticas sobre las que se puedan deducir inferencias
para la poblacin a partir de una muestra.
30

El Anlisis cluster es ampliamente usado en diversas disciplinas. Por ejemplo, en el

mbito del mundo empresarial esta tcnica es comnmente usada en Marketing para,
por ejemplo, dividir el mercado potencial de un nuevo producto en grupos, cada uno de
los cuales estara formado por consumidores homogneos en base a una serie de
caractersticas, facilitando as el diseo de polticas comerciales.
En la realizacin de un Anlisis cluster se suelen distinguir tres etapas:
1) Eleccin de variables relevantes y su tratamiento.
2) Eleccin de la medida de proximidad entre elementos.
3) Criterio para agrupar elementos en conglomerados.
Las decisiones que se tomen en estas etapas determinarn la clasificacin resultante, de
forma que no es posible hablar de una clasificacin idnea. A continuacin, se
describir brevemente la tarea a realizar en cada etapa.
1) Eleccin de variables relevantes y su tratamiento.
La clasificacin final depender de las variables de decisin que se introduzcan en el

anlisis, por lo que su eleccin es de vital importancia para la obtencin de una correcta
clasificacin. Ser necesario, por tanto, seleccionar las variables que sean tiles para el
propsito planteado. En lo que se refiere al nmero de variables, si ste es excesivo,
aumentarn los clculos necesarios y podra complicarse la interpretacin de los
resultados. Para simplificar el nmero de variables existen distintas soluciones, como
las tcnicas de reduccin de datos; es el caso, por ejemplo, del Anlisis de componentes
principales, que selecciona nicamente los primeros factores (los que explican un
mayor porcentaje de la varianza) para su introduccin como variables de entrada en el
Anlisis cluster.
La siguiente cuestin a abordar es la estandarizacin de los datos, proceso que consiste
en transformar las unidades de medida de las variables para que stas pasen a estar
expresadas en unidades adimensionales. As se contribuye a que el clculo de
similitudes sea ms equilibrado. Sin embargo, esto no siempre es necesario, e incluso
hay autores que son reacios a su utilizacin. El programa PASW Statistics ofrece
distintas posibilidades de estandarizacin de los datos.
2) Eleccin de la medida de proximidad entre elementos.
El Anlisis cluster intenta que los conglomerados sean exhaustivos, mutuamente

excluyentes y lo ms homogneos posible, de manera que los casos que pueden ser
considerados similares sean asignados a un mismo grupo, mientras que los considerados
distintos estarn en grupos diferentes. Es necesario por tanto dar una definicin de
similitud de los casos o de distancia entre ellos.
Existe una gran variedad de medidas de distancia, basadas en los valores de las
variables de decisin, estando condicionada la eleccin de una u otra por la escala de
31

medida que adoptan dichas variables. Si los datos estn estandarizados, en general una
de las medidas ms utilizada es la distancia eucldea al cuadrado.
Las medidas de distancia se recogern en la denominada matriz de semejanzas,
proximidades o distancias. Se trata de una matriz simtrica en la que cada elemento
determina la distancia entre los pares de individuos correspondientes a la fila y columna
donde se ubica dicho elemento.
3) Criterio para agrupar elementos en conglomerados.
El siguiente paso consiste en elegir las reglas que determinan el modo de agrupar los
individuos en conglomerados. Las posibilidades que se pueden plantear son muy
diversas y ninguna es manifiestamente mejor que las dems, por lo que el analista se
ver obligado a emplear distintos mtodos con el objeto de contrastar los resultados. En
general, los mtodos de agrupamiento se suelen dividir en dos grandes grupos: mtodos
jerrquicos y mtodos no-jerrquicos.
Mtodos jerrquicos: contemplan todas las agrupaciones posibles, incluyendo las ms
extremas de un solo conglomerado formado por todos los individuos y la de n
conglomerados diferentes formados cada uno por un nico individuo.
Existen dos tipos de tcnicas jerrquicas: las aglomerativas y las divisivas. Las primeras
parten de la existencia de un conglomerado distinto para cada observacin, para
posteriormente irlos fusionando hasta alcanzar a lo sumo un nico grupo. Por su parte,
en las tcnicas divisivas la situacin de partida es un nico conglomerado que engloba a
todas las observaciones y que progresivamente se va subdividiendo hasta que, a lo
sumo, cada observacin pertenece a un cluster diferente. Los mtodos divisivos
requieren demasiados clculos, lo que motiva que los autores se inclinen habitualmente
por los mtodos aglomerativos. De hecho, el programa PASW Statistics incluye
nicamente mtodos de este tipo.
Mtodos no-jerrquicos: la caracterstica fundamental que los distingue de los mtodos
jerrquicos es que solamente llevan a cabo agrupaciones de los individuos en un nmero
concreto de conglomerados, que debe ser fijado de antemano con coherencia.
Una posibilidad para esto es realizar en primer lugar un Anlisis cluster mediante
procedimientos jerrquicos, que nos permite no slo determinar el nmero de grupos o
conglomerados K ms adecuado, sino tambin la configuracin de stos que se tomarn
como punto de partida.
A partir de aqu, la mayora de los mtodos no-jerrquicos establecen K entidades
(estadsticos que representan, de alguna forma, a los elementos que conforman dichos
conglomerados de partida), que servirn para ir definiendo la clasificacin final de los
elementos entre los distintos conglomerados fijados.
Cada tipo de mtodo no-jerrquico proceder de un modo diferente para asignar los
elementos a algn grupo. As, por ejemplo, el mtodo de K-medias implementado en
32

PASW Statistics selecciona como entidades iniciales los centroides de cada uno de los K
conglomerados conformados por el mtodo jerrquico aplicado. Posteriormente, va
asignando el resto de elementos al grupo cuyo centroide se encuentre ms prximo. Se
puede hacer una nueva estimacin de los centroides a medida que se van incorporando
nuevos elementos, o bien, cuando todos hayan sido asignados a los distintos grupos.
Tras esta clasificacin inicial, el mtodo o algoritmo utilizado busca reasignaciones de
los elementos entre los grupos que den lugar a una mejora en el criterio de agrupacin
considerado. De no poder realizar ningn cambio que mejore el resultado, el proceso se
dar por concluido.
Ejemplo:
La Fundacin La Caixa ha llevado a cabo un estudio6 en el que caracteriza a las 50
provincias espaolas mediante los siguientes ndices sintticos, expresados en una
escala del 1 al 10:
ndice de renta
ndice de salud
ndice de servicios sanitarios
ndice de nivel educativo y cultural
ndice de oferta educativa, cultural y de ocio
ndice de empleo
ndice de condiciones de trabajo
ndice de vivienda y equipamiento del hogar
ndice de accesibilidad econmica y seguridad vial
ndice de convivencia y participacin social
ndice de seguridad ciudadana
ndice de entorno natural y clima
Se desea agrupar las provincias en una serie de conglomerados de acuerdo con su

similitud en los ndices sealados.
Solucin:
Desarrollaremos este ejemplo utilizando algunas de las opciones que nos brinda PASW
Statistics. En concreto, utilizaremos el mtodo no jerrquico de K-medias. Previamente,
ser necesario fijar el nmero de grupos que se quiere obtener y los valores iniciales que
se tomarn como centroides y constituirn las entidades de partida. Para ello, se puede
aplicar primero un mtodo jerrquico, con el que se obtendr el nmero de grupos
adecuados y el valor inicial de los centroides de cada grupo. Despus se podr ya aplicar
6
Datos del Anuario Social de Espaa 2004. Coleccin Estudios Sociales. Fundacin La Caixa.
33

el mtodo de K-medias y se obtendr la clasificacin final en conglomerados. Hay que

sealar que, en ocasiones, debido al gran tamao de algunas de las tablas de resultados
obtenidas, no se incluir la totalidad de stas, aunque s se har mencin a ellas.
En primer lugar, hay que tener en cuenta que, adems de las variables que recogen los
distintos ndices sintticos que se van a considerar en el estudio, es necesario crear una
variable nominal en la que se identifique a cada elemento de la muestra, para que una
vez formados los conglomerados se tenga claro qu provincias se han agrupado. Con
este fin, se crea una variable de tipo cadena denominada Provinci en la que se han
incluido los nombres de las 50 provincias consideradas.
Una vez incluidos todos los datos, a travs de Analizar / Clasificar / Conglomerados
jerrquicos se obtiene un cuadro de dilogo en el que se deben indicar tanto las
variables de decisin como la creada para etiquetar los casos (Figura 16).
Figura 16
A continuacin, se debe indicar la medida de proximidad entre casos con la que se desea
trabajar, as como el mtodo elegido para la formacin de conglomerados. Esto se har a
travs del botn Mtodo. Nos hemos decantado por las opciones ms habituales: la
vinculacin inter-grupos 7 , como mtodo para clasificar a los elementos en
conglomerados, y la distancia eucldea al cuadrado, como medida de proximidad. En
ese mismo cuadro, se nos da la opcin de estandarizar las variables, pero en este caso no
es necesario porque se trata de ndices sintticos que estn todos expresados en una
escala del 1 al 10.
Este mtodo se basa en valores medios. La distancia entre dos conglomerados se calcula tomando la
media de las distancias entre cada elemento de uno y otro conglomerado. Los dos grupos que se
encuentren a una menor distancia se fusionan para formar un nuevo cluster o conglomerado.
34

En cuanto a los resultados que queremos que nos devuelva PASW Statistics, hemos
seleccionado en el botn Estadsticos: el Historial de conglomeracin, la Matriz de
distancias y un rango de soluciones de entre 3 y 5 conglomerados para el
Conglomerado de pertenencia (con ello, le pedimos al programa que nos muestre el
resultado que se obtendra si tuvisemos 3 conglomerados, 4 5, para a partir de ah
decidir qu nos parece mejor; esto es ya decisin del investigador 8 ).
Asimismo, escogemos la opcin Dendograma en el botn Grficos.
Adems, en Guardar tenemos la posibilidad de crear nuevas variables en las que se
incluir el conglomerado asignado a cada provincia, para el nmero de conglomerados
que fijemos. Para ello, se deber proceder como muestra la Figura 17. Al haber
decidido formar entre 3 y 5 conglomerados, se crearn tres variables con los nombres
CLU3_1, CLU4_1 y CLU5_1, donde se guardarn los resultados en cada caso.
Figura 17
Una vez seleccionadas todas las opciones anteriores, se obtienen los resultados que
comentaremos a continuacin.
En primer lugar, se muestra un resumen de los casos, distinguiendo entre vlidos y
perdidos (Figura 18).
Seguidamente, aparece la Matriz de distancias, que no reproduciremos por su tamao.
Se trata de una tabla con 50 filas y 50 columnas (una por provincia), simtrica, en la que
cada elemento indica la distancia (medida como el cuadrado de la distancia eucldea)
entre las provincias correspondientes a la fila y la columna en la que se encuentra el
elemento. Con esta medida de proximidad calculada a partir de los ndices sintticos, las
provincias ms cercanas son A Corua y Pontevedra, cuya distancia es de 12.
Igualmente, tambin es decisin del investigador decidir dichos nmeros de conglomerados iniciales, de
3 a 5, que desea tener a priori.
35

Figura 18
Teniendo en cuenta estas distancias entre provincias, se van formando los

conglomerados uniendo las ms cercanas. El Historial de conglomeracin (Figura
19) muestra las distintas etapas del proceso, indicando en cada una de ellas los
elementos combinados y la distancia (coeficientes) entre ellos. As, se observa que en la
1 etapa se han unido las provincias 40 (A Corua) y 43 (Pontevedra) que eran las ms
prximas. A continuacin, se volvera a calcular la distancia entre todos los
conglomerados existentes: el formado por A Corua y Pontevedra, y los formados
individualmente por cada una de las provincias restantes. Las ms cercanas luego
resultan ser las provincias 26 (Albacete) y 30 (Toledo), que se unen en un
conglomerado en la 2 etapa. As se va procediendo sucesivamente hasta tener un nico
conglomerado con todos los elementos.
La tabla Conglomerado de pertenencia indica el conglomerado al que se ha asignado
cada provincia, para cada nmero de conglomerados diferentes solicitado, es decir para
los casos de 3 conglomerados, 4 5. Estos valores, que pueden verse en la Figura 20,
son tambin los que se guardan en las variables CLU3_1, CLU4_1 y CLU5_1.
El proceso iterativo de formacin de conglomerados suele representarse grficamente en
el llamado dendograma, que puede verse en la Figura 21. Este grfico muestra cmo
las provincias (sealadas en el eje vertical) se agrupan en los sucesivos pasos, as como
los niveles de distancia para los que las agrupaciones tienen lugar (en el eje horizontal).
La ventaja del dendograma es que nos permite ver de forma rpida a simple vista lo
semejantes que son los elementos que constituyen un conglomerado, comparados con
los elementos de otros conglomerados, por lo que nos ayuda en la tarea de determinar el
nmero final de conglomerados ms adecuado, dependiendo de nuestro objetivo. Esto,
generalmente, ser una decisin subjetiva del investigador, dependiendo del grado de
proximidad que considere aceptable entre los elementos de un grupo. Normalmente se
preferir un nmero de grupos no demasiado elevado, pero tambin hay que tener en
cuenta que, a medida que disminuye el nmero de grupos, aumenta la falta de similitud
entre los elementos que componen esos grupos.
En el dendograma se observa que, en efecto, a medida que nos desplazamos hacia la
derecha, disminuye el nmero de conglomerados, pero tambin aumenta la distancia
entre sus elementos. En el caso de nuestro ejemplo, vamos a optar por los 5
36

conglomerados que aparecen determinados por la lnea roja discontinua que hemos
dibujado, aunque otras opciones podran ser igualmente aceptables.
Figura 19
37

Figura 20
38

Figura 21
39

Una vez que se ha definido el nmero de grupos, el siguiente paso para poder aplicar el
mtodo no-jerrquico de K-medias consiste en calcular los centroides de los 5 grupos
definidos. Estos centroides se tomarn como valores iniciales del proceso de iteracin
en el mtodo de K-medias. Recordemos que el centroide de un grupo o conglomerado
ser un vector cuyas componentes son los valores medios de cada una de las variables
independientes, para las provincias pertenecientes a ese grupo.
Para calcular estas medias, se pulsa Analizar / Comparar medias / Medias y, en el
cuadro de dilogo resultante, se introducen todas las variables de las que se quiere
calcular la media (en Lista de dependientes) y se indican asimismo los conglomerados
que nos interesan (en Lista de independientes): los 5 con los que hemos decidido
quedarnos. Estos conglomerados estn incluidos en una variable cuya etiqueta es
Average Linkage (Between Groups). Pero debemos tener cuidado, porque hay tres
variables con esa misma etiqueta, las correspondientes a los casos de 3, 4 y 5
conglomerados que queramos analizar. Movindonos sobre ellas, aparece el nombre de
la variable correspondiente. Nos interesa CLU5_1, que es la que guardaba los resultados
para 5 conglomerados.
El informe resultante es el que se muestra en la Figura 22. Las 12 medias que aparecen
en cada fila son las componentes del centroide de cada grupo. Estos valores se deben
copiar en un archivo de PASW Statistics, del que el programa los importar luego para
tomarlos como valores iniciales del proceso de iteracin del mtodo no-jerrquico de Kmedias. Dicho archivo lo hemos nombrado en este ejemplo centroides.sav. Se deben
cumplir dos requisitos: la variable que identifica a los conglomerados debe denominarse
cluster_ y el resto de variables debe conservar el nombre del archivo inicial.
Una vez creado el archivo que contiene a los centroides, estamos en condiciones de
ejecutar el anlisis de conglomerados de K-medias. Para ello, en el archivo inicial
pulsamos Analizar / Clasificar / Conglomerado de K medias, resultando el cuadro de la
Figura 23. Deberemos introducir tanto las variables de decisin como la que usamos de
etiqueta de las provincias. Indicaremos que el nmero de conglomerados es 5 y la ruta
en la que se encuentra el archivo donde hemos guardado los centroides. Este se hace en
Centros de los conglomerados / Leer iniciales / Archivo de datos externo / Archivo.
En Iterar... se pueden modificar opciones de clculo, como el nmero mximo de
iteraciones o el criterio de convergencia para detener el proceso iterativo en que se basa
el mtodo de K-medias o la posibilidad de actualizar los centroides cada vez que se
asigne una provincia a un conglomerado. Dejaremos las opciones que aparecen por
defecto (10 iteraciones y que no se actualicen las medias (centroides)).
Guardar permite crear dos variables que PASW Statistics denomina por defecto
QCL_1 y QCL_2, en las que se almacenarn, respectivamente, el conglomerado al que
estar asignada cada provincia una vez terminado el proceso de agrupacin y la
distancia de cada provincia al centroide de su conglomerado. Marcaremos ambas
opciones.
40
Figura 22
OTRAS TCNICAS DE ANLISIS MULTIVARIANTE APLICADAS A LA ECONOMA Y A LA EMPRESA

41

Figura 23
Tambin marcaremos todos los estadsticos optativos en el botn Opciones: Centros de

conglomerados iniciales, Tabla de ANOVA e Informacin del conglomerado para cada
caso.
A partir de los valores iniciales de los centroides, el proceso va asignando las provincias
a aquel centroide que est a una menor distancia. Cuando todas las provincias se hayan
asignado, se recalculan los centroides de los conglomerados (dado que no marcamos la
opcin Usar medias actualizadas). Se sigue iterando hasta que ninguna reasignacin de
una provincia a otro grupo permita reducir la distancia entre las provincias dentro de
cada conglomerado ni aumentar la distancia entre conglomerados. Conviene recordar
que, a diferencia de los mtodos jerrquicos, este procedimiento permite que un
elemento asignado a un grupo en una iteracin previa, pueda ser asignado a otro grupo
en una iteracin posterior.
El resultado del estudio, en cuanto al conglomerado o cluster al que finalmente
pertenece cada provincia, as como la distancia entre sta y el centroide de su cluster,
puede verse en la Figura 24. Estos datos estn tambin incluidos en las variables
QCL_1 y QCL_2 que se crearon al efecto. Como ejemplo, cabe sealar que Barcelona,
Madrid, Navarra, lava, Guipzcoa y Vizcaya se han agrupado en un nico cluster.
42

Figura 24
43

La asignacin resultante puede compararse con la obtenida mediante el procedimiento

jerrquico; si se observa una elevada cantidad de reasignaciones, ser indicativo de que
el mtodo jerrquico empleado no era el adecuado para los datos analizados.
Las Figuras 25, 26 y 27 nos aportan datos complementarios del anlisis.
As, la Figura 25 nos indica el tamao de cada conglomerado.
La Figura 26 muestra los centros de los conglomerados finales, es decir, los valores
medios de cada variable de decisin en cada uno de los grupos de provincias
configurados.
Figura 25
Figura 26
44

Por su parte, la Figura 27 seala la distancia entre los centros de los conglomerados, lo
que puede servir para determinar la heterogeneidad entre grupos, aunque no para
estudiar la homogeneidad interna de cada conglomerado. Recordemos que el objetivo
del Anlisis cluster es establecer grupos lo ms homogneos posible internamente pero
los ms heterogneos posible entre s.
Figura 27
Una forma de analizar si la variabilidad entre conglomerados es mayor que dentro de los
conglomerados es a travs de la tabla ANOVA que se proporciona en la Figura 28.
Figura 28
45

As, para cada variable de decisin, se contrasta la igualdad de medias entre

conglomerados, a travs de un estadstico F que es el cociente de las medias cuadrticas
inter-grupos e intra-grupos. Como es sabido, valores elevados del estadstico F
reflejarn que la variabilidad entre los grupos es mucho mayor que la variabilidad
dentro de cada grupo, por lo que preferiremos aquellas soluciones que lleven a mayores
valores de F. De esta forma, los conglomerados o clusters elaborados son homogneos
especialmente en el factor ndice de Renta (para el que la F alcanza el valor ms
elevado). En la ltima columna de la tabla aparecen los p-valores asociados a cada
contraste, pudindose observar que en todos los factores salvo en dos (ndice de
condiciones de trabajo e ndice de entorno natural y clima) la variabilidad entre grupos
supera a la variabilidad intra-grupos (en estos dos casos se acepta la hiptesis nula de
igualdad de medias en los 5 conglomerados). No obstante, hay que ser prudente a la
hora de extraer conclusiones en este sentido, puesto que como el mismo programa
seala en una nota al pie de la tabla, este test debe usarse solamente con una finalidad
descriptiva. En cualquier caso, se puede emplear para valorar la relevancia de las
variables empleadas y comparar las diferentes agrupaciones.
Para terminar, una cuestin adicional que se podra plantear es determinar cules son los
perfiles comunes de las provincias que constituyen cada uno de los 5 conglomerados
construidos. Esto es lo que se denomina perfilar los segmentos, y puede hacerse
mediante la tcnica multivariante del Anlisis discriminante. Lo lgico sera emplear
para ello nuevas variables, distintas a las empleadas en el anterior proceso de
agrupacin. Esta manera de proceder resulta muy habitual en este tipo de estudios.
46
EL MODELO CLSICO DE REGRESIN LINEAL: ESPECIFICACIN Y ESTIMACIN

TEMA 2
El modelo clsico de regresin lineal:
especificacin y estimacin
La Econometra no es Estadstica econmica. Tampoco es lo que llamamos Teora
Econmica (...). La Econometra tampoco debe ser considerada como sinnimo de
aplicacin de las Matemticas a la Economa. La experiencia ha demostrado que cada
uno de estos tres puntos de vista, el de la Estadstica, la Teora Econmica y las
Matemticas, es necesario, pero por s mismo no son condicin suficiente para una
comprensin real de las relaciones cuantitativas en la vida econmica moderna. Es la
unin de los tres aspectos lo que constituye una herramienta de anlisis potente. Es esta
unin lo que constituye la Econometra. 9
Comienza con este tema el anlisis del modelo economtrico, el eje central en torno al
que se desarrollan los mtodos economtricos.
En concreto, en el presente tema empezaremos viendo qu se entiende por un modelo
economtrico. Despus, iremos desarrollando las principales etapas que lo configuran:
especificacin, estimacin, inferencia y prediccin. Las dos primeras se vern en este
mismo Tema, en tanto que las dos ltimas se analizarn en el Tema 4. Todo este estudio
se har basndonos en el modelo clsico de regresin, caracterizado por cumplir una
serie de supuestos y disfrutar con ello de un conjunto bien definido de propiedades.
Una vez conocido este modelo perfecto, proseguiremos con el anlisis del modelo
cuando no se cumplen todos los requisitos o propiedades descritas previamente, viendo
cules son las consecuencias principales de ello y tomando las medidas ms oportunas
para afrontarlas. ste es el objetivo que nos plantearemos en el Tema 5.
Finalmente, en el Tema 6 abordaremos el estudio de un tipo de modelo muy importante
en el mundo de la Empresa: los modelos de eleccin discreta. Estos modelos se
caracterizan por ser su variable dependiente de tipo discreto y una de sus principales
utilidades es su consideracin en procesos de toma de decisiones.
3.1.
Definicin del modelo economtrico.-
Un modelo es una representacin simplificada de la realidad, que debe ser plausible y

manejable. Teniendo presente cul es el objetivo de la Econometra, un modelo
economtrico es un modelo que incluye las especificaciones necesarias para tratar de
reflejar las relaciones empricas del mbito de la Economa.
9
R. Frisch (Econometrica, vol. 1, n 1, 1933).

47

La realidad econmica es absolutamente inalcanzable en trminos de modelizacin

determinstica. En todo modelo econmico es preciso considerar un componente
aleatorio que permita incluir:
a) todas aquellas variables relevantes que pudieran no estar especificadas
inicialmente en el modelo (ya sea por ignorancia o consideracin de teoras
incompletas, por ausencia de datos disponibles o, simplemente, por sencillez en
la definicin del modelo);
b) variables de tipo cualitativo que por su naturaleza no sean cuantificables;
c) la aleatoriedad del comportamiento humano; y
d) posibles errores de medida en las variables utilizadas.
As, el punto de partida de un modelo economtrico se fundamenta en dos componentes:
el determinstico (formado por aquellas

explcitamente deseamos considerar); y
el aleatorio.
variables
cuyas
relaciones
Analticamente, pues, al tratar de estudiar el comportamiento de una cierta variable Y,

tendramos que el mismo estara definido por una serie de variables conocidas
( X 1 , X 2 , , X k ) consideradas de forma explcita (y que se relacionan con Y segn una
determinada forma o funcin matemtica) y por un elemento aleatorio, que
denominamos perturbacin, que comprendera todo lo dems:
Y f ( X 1 , X 2 ,, X k ) u .
La definicin completa de un modelo economtrico comprende una serie de
etapas o fases, que se muestran en la Figura 1:
Teora econmico-empresarial
Especificacin
Estimacin
Prediccin / Explicacin /
Toma de decisiones
Figura 1
48
Datos,
informacin
previa

3.2.
El modelo economtrico de regresin lineal: especificaciones

simple y mltiple. Supuestos del modelo clsico.-
El modelo clsico de regresin lineal: especificaciones simple y mltiple
Como se acaba de ver, en trminos generales, el modelo economtrico plantea que la

variable dependiente (o explicada) est relacionada funcionalmente con una o varias
variables independientes (o explicativas), pero asumiendo que la relacin entre ambas
partes no es exacta. Y para tener en cuenta la relacin inexacta entre todas ellas, se
aade una variable aleatoria estocstica o perturbacin, que representa de alguna forma
a todas las variables que no se tienen en cuenta de manera especifica en el modelo, los
errores de medicin y otros factores aleatorios.
La primera de las fases de definicin de un modelo economtrico consiste en su
especificacin, esto es, en plantear qu variable econmica queremos estudiar y qu
variable o variables pueden determinar su comportamiento, eligiendo adems la forma
funcional matemtica que las relaciona. A partir de ah, seguidamente se procede a la
siguiente fase, la estimacin o concrecin de dicha relacin funcional.
Para dar contenido emprico al modelo, es decir, para estimar sus parmetros o
coeficientes, utilizamos como herramienta el anlisis de regresin. El anlisis de
regresin trata del estudio de la dependencia o explicacin del comportamiento de una
variable respecto a una o varias variables independientes o explicativas, con el objetivo
de estimar y/o predecir el valor esperado o valor promedio poblacional de la primera
en trminos de los valores conocidos o fijos (en muestras repetidas) de las ltimas.
En este tema, vamos a empezar estudiando un caso particular de forma funcional para
nuestro modelo: la funcin lineal. En concreto, la linealidad la interpretaremos tanto
referida a las variables explicativas X como a los parmetros o coeficientes de regresin
.
La razn primera de esta eleccin radica en su sencillez matemtica, pero se ve
reforzada adems por el hecho de que, empricamente, el comportamiento de buena
parte de la realidad econmico-empresarial se puede modelizar de un modo
razonablemente aceptable mediante relaciones lineales.
As pues, nos centraremos en el modelo economtrico de regresin lineal:
Yi 1 2 X 2i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., N ,
donde el subndice j se refiere a las variables explicativas del modelo (hasta k) y el

subndice i a las distintas observaciones poblacionales de todas las variables del modelo
(hasta N).
A la hora de especificar un modelo, un primer aspecto que debemos tener claro es si el
trmino independiente est presente o no en el modelo. El trmino independiente no
es ms que la ordenada en el origen matemtica del modelo; es decir, la variable a la
49

que acompaa el parmetro 1 en la ecuacin anterior. Obsrvese que dicha variable,

que podemos llamar X 1 , se caracteriza porque adopta el valor 1 para todas las
observaciones; esto es: X 1i 1, i 1, 2, ..., N .
Lo ms habitual es que los modelos se especifiquen de forma que incluyan trmino
independiente, pero no tiene por qu ser as.
La distincin entre modelo de regresin simple y modelo de regresin mltiple hace
referencia al nmero de variables explicativas que presenta un modelo. De este modo,
cuando el comportamiento de una variable es explicado nicamente por otra variable, se
habla de regresin simple. En cambio, cuando dicho comportamiento viene explicado
en funcin de 2 ms variables deterministas, se considera que la regresin es mltiple.
Segn esto, por tanto, cuando se habla de un modelo de regresin lineal simple, su
expresin (considerando la ordenada en el origen) es:
Yi 1 2 X 2i u i
i 1, 2, ..., N ,
que, como podemos apreciar, no es sino un caso particular del modelo de regresin
lineal en el que k = 2. (Por mayor simplicidad incluso, X 2i se podra escribir como X i ,
ya que por ser la nica variable X visible, se podra prescindir de su subndice 2).
En la mayora de las ocasiones, nosotros nos referiremos al modelo de regresin
mltiple, que es el caso general. Sin embargo, en otras, por simplicidad en las
explicaciones (y sobre todo a nivel grfico), haremos referencia al modelo de regresin
simple.
Precisamente, la siguiente argumentacin la haremos basndonos en un modelo de
regresin lineal simple.
Pensemos que queremos estudiar una variable econmica (variable dependiente) cuyo
comportamiento creemos que depende, segn una relacin lineal, del de otra variable
que acta como independiente o explicativa de la primera. Si dispusisemos de los
valores de las N observaciones que conforman la poblacin de tales variables,
tericamente podramos representar una nube de puntos en la que podramos cruzar,
en unos ejes cartesianos, los valores observados para ambas variables.
A cada valor de la variable explicativa X le podran corresponder varios valores de la
variable dependiente o explicada Y (si nos fijamos en la Figura 2, para un valor
particular de X, por ejemplo, X 0 , le podran corresponder distintos valores de Y:
Y0 , Y ' 0 , Y ' ' 0 ). Si quisiramos asociar a cada valor de la variable explicativa un nico
valor de la variable explicada, nos surgira entonces la pregunta de cul tomar. En este
punto, parece que lo lgico sera elegir un valor representativo de todos los posibles
valores de Y que aparecen ligados a cada uno de los valores de X; este valor elegido
sera el valor esperado o esperanza matemtica de la variable Y, dado el valor de X:
E Y | X 0 .
50

Por tanto, el par de valores que asociaramos sera: X i , E Y | X i . De esta manera lo

que modelizaramos no sera el comportamiento de la variable dependiente, sino su
comportamiento promedio o esperado; es decir, nuestro objetivo va a consistir en
estimar el valor promedio de la variable dependiente, conocidos los valores de la
variable explicativa: E Y | X i f ( X i ) .
Si tomamos como ejemplo un modelo de regresin lineal simple (con ordenada en el
origen), tendramos entonces lo que se conoce como Recta de Regresin Poblacional
(RRP):
E Y | X i 1 2 X i .
Grficamente (Figura 2), nuestro objeto de estudio son, por tanto, del conjunto de datos
poblacionales, los puntos que conforman la RRP. Sobre esta recta se representan los
valores medios de la variable Y para cada valor de la variable dependiente X.
Yi
Y0
Y0
E(Y| X0)
u 0 Y0 E Y | X 0
Y0
RRP
E Y | X i 1 2 X i
X0
Xi
Figura 2
La RRP constituye un instrumento con el que intentamos estudiar la nube de puntos (o

Modelo de Regresin Poblacional). En particular, muestra que, dado un determinado
valor de X, los valores de la variable dependiente estn agrupados alrededor de su
esperanza condicional. La diferencia entre un valor concreto Y0 de la variable explicada
asociado a un valor concreto X 0 de la variable explicativa y el valor promedio o
esperado para dicho X 0 , E Y | X 0 , se correspondera conceptualmente con la parte del
comportamiento no determinada por X 0 , es decir, con la perturbacin aleatoria:
Y0 E Y | X 0 u 0 ; o lo que es lo mismo: Y0 E Y | X 0 u 0 .
51

Generalizando para cualquier observacin i, tendramos por tanto que:

u i Yi E Y | X i , o bien: Yi E Y | X i u i .
Obsrvese que, dado que el trmino de perturbacin u es una variable aleatoria, la

variable dependiente Y tambin lo va a ser, puesto que depende de la anterior. Su
funcin de probabilidad va a ser la misma que la de la perturbacin aleatoria. El
siguiente paso sera determinar cul es esta distribucin de probabilidad.
El hecho de que la perturbacin aleatoria represente la influencia combinada (sobre la
variable dependiente) de un elevado nmero desconocido de variables independientes
que no se han incluido de forma explcita en el modelo de regresin, las cuales se
suponen entre s independientes e idnticamente distribuidas, as como con esperanza y
varianza finitas, conduce a considerar, por el Teorema Central del Lmite, que se
comporte segn una distribucin normal de probabilidad. As pues:
ui N .
El supuesto de normalidad del trmino de perturbacin aleatoria constituye un pilar

fundamental sobre el que se asienta toda la teora economtrica que vamos a desarrollar,
en especial los aspectos inferenciales de la misma.
Prosiguiendo con el anlisis de u, si nos centramos en el concepto que representa, no
hay motivos para pensar que presente una tendencia o error sistemtico hacia
desviaciones siempre del mismo signo (positivas o negativas). Si tuviera tal desviacin
sistemtica, dejara de ser una componente aleatoria. Evidenciara que el modelo se
habra especificado incorrectamente. Por tanto, se supone que unas desviaciones sern
positivas y otras negativas, de forma que estas diferencias poblacionales a la larga se
vern compensadas; es decir, asumimos que:
E (ui | X i ) 0 .
Este supuesto 10 se ve adems reforzado por el hecho de que parece razonable pensar
que lo deseable es que las desviaciones ms frecuentes entre los valores observados de Y
y sus promedios (que no es ms que la definicin de u) sean pequeas. Si estamos ante
una distribucin normal, recurdese que la moda y la media (adems de la mediana)
coinciden en esta distribucin, por lo que esta media tendera a ser cero.
Volviendo a la RRP, con ella lo que intentamos es analizar la nube de puntos
poblacional, que lo habitual es que no sea conocida pues no se suele disponer de la
totalidad de los valores poblacionales. En la prctica, slo se tiene al alcance una
muestra de valores de Y que se corresponden con valores fijos de X. En esta situacin,
nuestro objetivo final consiste en ajustar o estimar la RRP, esto es, obtener una
Si bien el modo correcto de escribir esta expresin es: E (u i | X i ) 0 , en la notacin economtrica
resulta habitual obviar que cuando estudiamos las variables estocsticas, stas estn condicionadas a los
valores de las variables explicativas; de este modo, se suele escribir simplemente: E (u i ) 0 .
10
52

estimacin numrica de los valores de los parmetros desconocidos, usando para ello
la informacin proporcionada por observaciones muestrales de las variables del modelo.
Se obtiene de este modo la denominada Recta de Regresin Muestral, (RRM), que no es
sino una estimacin de la RRP, una aproximacin de la verdadera RRP, puesto que sta
no se puede estimar de manera precisa debido a las fluctuaciones muestrales.
RRM
Yi 1 2 X i
Yi
Y0
Y0
E(Y| X0)
RRP
E Y | X i 1 2 X i

e0
u0
X0
Xi
Figura 3
Es preciso resear que la RRM nos proporciona una estimacin de E Y / X i , no de Yi ;

es decir, con la RRM lo que se obtiene es una estimacin, a travs de la inferencia
estadstica, del valor medio de Y y no de las observaciones reales 11 de Y.
Las estimaciones obtenidas tambin dan lugar a desviaciones respecto a los valores
reales de Y, registrndose el denominado error o residuo muestral, que se denota por ei :
ei Yi Yi .
Conceptualmente, este error muestral es similar a la perturbacin aleatoria u i , pero no

debe confundirse con sta. Si se observa, el residuo es una estimacin muestral de la
perturbacin aleatoria, que es poblacional: ei u i .
11
Obsrvese, sin embargo, cmo la notacin parece estar mal escrita, pues se indica Yi , en lugar de
E Y / X i , que sera lo correcto. No obstante, sta es la notacin habitual en el mbito economtrico y as

seguiremos utilizndola, teniendo en todo caso presente cul es el significado correcto de lo que
estudiamos.
53

Para llevar a cabo la explicacin de conceptos que hemos desarrollado hasta este punto,
hemos recurrido en buena parte de nuestra exposicin al caso del modelo de regresin
simple (fundamentalmente en el aspecto grfico), pero como bien podr apreciarse, todo
ello se puede extender fcilmente al caso general. 12 En lugar de Recta de Regresin
Poblacional (RRP) y de Recta de Regresin Muestral (RRM), podramos hablar de
forma generalizada de Funcin de Regresin Poblacional (FRP) y de Funcin de
Regresin Muestral (FRM).
Formulacin matricial del modelo
Como ya sabemos, la formulacin del modelo general de regresin lineal con k

variables explicativas puede escribirse como:
Yi 1 2 X 2i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
Si se escribe la ecuacin que se obtiene para cada una de las n observaciones,

tendremos:
Y1 1 2 X 21 3 X 31 ... k X k1 u1
Y2 1 2 X 22 3 X 32 ... k X k 2 u 2
Yn 1 2 X 2 n 3 X 3n ... k X kn u n
Si nos fijamos, podemos expresar el conjunto de todas estas ecuaciones de forma

matricial, de modo que:
Y1 1 X 21

Y2 1 X 22

Y 1 X
2n
n
X k1 1 u1

X k 2 2 u2
, o abreviadamente: Y X u ,

X kn k u n
donde la matriz Y es una matriz columna, de orden n x 1, cuyos elementos son los n
valores de la variable dependiente Y; X es una matriz de orden n x k, estando
conformadas sus columnas por los n valores de cada una de las k variables
independientes del modelo; es una matriz de orden k x 1, siendo sus elementos cada
uno de los k parmetros que acompaan a cada una de las variables independientes del
modelo; y u es una matriz de orden n x 1, referida las perturbaciones de cada una de las
n observaciones del modelo.
12
En el caso del modelo lineal simple, geomtricamente hemos trabajado con una recta. Si el modelo
tuviese dos variables explicativas, estaramos ante un plano de regresin; y si tuvisemos ms de dos,
hablaramos, en general, de un hiperplano de regresin.
54

Supuestos del modelo clsico
En el anlisis de regresin, nuestro objetivo no va a ser slo estimar los parmetros del
modelo considerado, sino tambin hacer un ejercicio de inferencia sobre los verdaderos
valores de tales parmetros o coeficientes. Para ello deben hacerse ciertos supuestos
sobre los distintos componentes que conforman el modelo (algunos de los cuales ya se
han referido). El cumplimiento de estos supuestos da lugar al llamado modelo clsico de
regresin lineal.
Vamos a distinguir 3 tipos de supuestos: no estocsticos, estocsticos y los referidos a la
distribucin de probabilidad.
Supuestos no estocsticos
1. El modelo de regresin es lineal en los parmetros y en las variables explicativas.

(Ya comentado).
2. Los valores de las variables explicativas X son fijos en muestreo repetido; es decir,
las variables X se suponen no estocsticas. As, suponiendo fijo el valor de X, se
pueden observar los distintos niveles de la variable Y a la hora de obtener la
muestra. Por ello, el anlisis es de regresin condicional, esto es, condicionado a los
valores dados de las variables X.
3. El nmero de observaciones n debe ser mayor o igual que el nmero de parmetros
o coeficientes de regresin k a estimar (es decir, mayor o igual que el nmero de
variables explicativas): n k .
4. No existe multicolinealidad perfecta entre las variables explicativas del modelo, es
decir, no hay relaciones lineales exactas entre las mismas. Matemticamente, ello
significa que teniendo en cuenta que la matriz X es de orden n x k, su rango debe ser
k, con n k .
5. El modelo de regresin est correctamente especificado. Esto supone asumir que
todas las variables relevantes estn incluidas en el modelo, que la forma funcional
elegida es la correcta y que los supuestos que planteamos sobre las variables
estocsticas (que veremos seguidamente) son ciertos. Este supuesto es lo
suficientemente restrictivo como para cuestionar las conclusiones extradas en el
momento que se detecta algn error en las cuestiones anteriores. As, debemos tener
presente que en todo momento los resultados basados en el anlisis de regresin
lineal estn condicionados al modelo escogido, debindose pensar cuidadosamente
su formulacin.
Supuestos estocsticos
1. El valor medio o esperanza de la perturbacin u i es igual a cero para todas las

observaciones i. (Ya razonado anteriormente).
55

Esto significa que los factores explicativos incluidos en la perturbacin no influyen

de forma sistemtica en el valor promedio de Y.
Si se considera el vector o matriz columna de las perturbaciones asociadas a cada
observacin i, se expresara de este modo:
u1 E u1 0

u 2 E u 2 0
E u n1 , o lo que es lo mismo: E
.

u E u 0
n

n
2. La varianza de la perturbacin aleatoria es igual para todas las observaciones i; es

decir, es algn nmero positivo constante que denotaremos por u2 . Es lo que se
denomina homoscedasticidad.
Var u i Eu i E u i E u i2 E u i E u i2 u2
2
i 1,2,...n
Este supuesto implica que la variabilidad en torno a la media de las observaciones

de la variable dependiente es igual para cualquier observacin o valor de la variable
explicativa, es decir, que las varianzas condicionadas de Y son tambin
homoscedsticas.
3. No existe autocorrelacin entre las perturbaciones. Dados dos valores cualesquiera i
y j, la correlacin entre las correspondientes perturbaciones ui y u j , es cero.
Cov(ui , u j ) E ui E(ui ) u j E(u j ) E(ui u j ) E(ui ) E(u j ) E(ui u j ) 0
i j
Esto significa que, dados los valores de X, las desviaciones de dos valores
cualesquiera de Y en relacin a su media no muestran patrones sistemticos.
Expresado en forma sencilla, este supuesto implica que el trmino de perturbacin
relacionado con una observacin no est influenciado por el trmino de perturbacin
de otra observacin diferente.
Estos dos ltimos supuestos sobre la perturbacin aleatoria, homoscedasticidad y no
autocorrelacin, pueden expresarse matricialmente mediante su matriz (simtrica)
de varianzas-covarianzas de la siguiente forma:
Varu1 Covu1, u2 Covu1, u3
Varu2 Covu2 , u3
Var Covu
Covu1, un u2 0 0 0

Covu2 , un
u2 0 0
2
u Inn

Varun
u2
56

4. Las covarianzas entre la perturbacin y los valores de las variables explicativas X

son cero.
Covu i , X ji E u i E u i X ji E X ji E u i X ji E u i E X ji E u i X ji 0
j 1, 2, ..., k
i 1, 2, ..., n
Este supuesto implica asumir que X y u tienen una influencia separada y aditiva
sobre Y, y por tanto es posible determinar por separado sus efectos sobre la variable
dependiente.
Supuestos sobre la distribucin de probabilidad
1. La perturbacin aleatoria u se distribuye segn una distribucin normal. (Ya

comentado).
Teniendo en cuenta este supuesto, as como los supuestos estocsticos sobre la
media y la varianza y la covarianza de cada una de las u i , tenemos que:
u i N 0, u2 , i 1, 2,, n .
Matricialmente, refirindonos al vector de perturbacin aleatoria u, esto se

expresara:
u N n n1 ; u2 I nn .
Consecuencia: Dado que la variable Y depende de u (a travs de la expresin

Y X u ), y puesto que u es un vector aleatorio normal, Y resulta ser tambin un
vector aleatorio normal.
En particular, su media o esperanza matemtica va a ser: E Y X .
Este resultado se puede deducir fcilmente de:
E Y E X E u E X X , ya que E u y X son no estocsticas.
En cuanto a la matriz de varianzas-covarianzas de Y, tendremos que sta coincide

Var CovY u2 I nn , ya que:
con la de la perturbacin aleatoria u:
Var Yi E Yi E Yi E u i2 Var u i u2 , i , y adems las covarianzas entre

2
distintas observaciones de Y son cero, como se puede ver si se deduce a partir de la

definicin de la expresin de la covarianza y teniendo en cuenta que la perturbacin
aleatoria es la diferencia entre las observaciones de Y y sus valores esperados:
Cov Yi , Y j E Yi E Yi Y j E Y j E u i u j 0, i j .
As pues, en definitiva, la distribucin de probabilidad del vector de todas las

observaciones de Y, resulta ser:
Y N n X , u2 I nn .
57

3.3.
Estimacin
por
mnimos
cuadrados
ordinarios
(MCO).
Interpretacin de los coeficientes de regresin. Efecto marginal.Estimacin por mnimos cuadrados ordinarios (MCO)
El objetivo en el anlisis de regresin es estimar la FRP a partir de la informacin

proporcionada por una muestra en la forma ms precisa posible, es decir, llegar a tener
una FRM.
En trminos generales hay dos mtodos principales de estimacin: el mtodo de los
mnimos cuadrados ordinarios (MCO) y el mtodo de mxima verosimilitud (MV).
El mtodo de MCO, que estudiamos en este apartado, es el que ms se emplea en el
anlisis de regresin, sobre todo por ser en gran medida intuitivo y matemticamente
ms simple que el mtodo de MV.
Considrese el modelo de regresin lineal general:
Yi 1 2 X 2i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n ,
que no resulta observable de forma directa. Mediante el anlisis de regresin,

realizamos una estimacin del mismo, obteniendo finalmente la FRM:
Yi 1 2 X 2i ... j X ji ... k X ki
j 1, 2, ..., k
i 1, 2, ..., n .
Como ya vimos anteriormente de manera grfica para el caso de un modelo de regresin

lineal simple (Figura 3), esta aproximacin va a registrar desviaciones respecto a los
valores reales de Y, obtenindose un error o residuo muestral:
ei Yi Yi Yi 1 2 X 2i ... j X ji ... k X ki .
Si nos fijamos, partiendo de una nube de puntos, nuestro objetivo final sera encontrar
aquella funcin lineal concreta, de entre las infinitas posibilidades existentes, que fuese
lo ms representativa posible de dicha nube de puntos; esto es, aqulla que diese lugar
a valores estimados de Y ( Y ) que hiciera que los residuos fuesen los ms pequeos
i
posibles en su conjunto.
De este modo, nuestro objetivo se puede alcanzar mediante un problema de
optimizacin matemtica; en particular, de minimizacin de una funcin que sera la
suma de los residuos al cuadrado 13 (SCR):
13
Al considerar la suma, estaramos teniendo en cuenta el conjunto de todos los residuos. El hecho de
tomar la suma del cuadrado de los residuos, en lugar de la suma de dichos residuos directamente, radica
fundamentalmente en que, si se observa, los valores de los residuos sern en unos casos positivos y en
otros negativos. Al tomar la suma de todos ellos, las desviaciones de un signo se podran compensar con
las del otro signo y acabar finalmente anulndose, desvirtundose entonces nuestro objetivo. Esto, sin
embargo, no ocurrir si tomamos el cuadrado de los residuos.
58

Min SCR Min

1 , 2 ,..., k
Min
Yi Yi
ei2 Min
1 , 2 ,..., k i 1
1 , 2 ,..., k i 1
Yi 1 2 X 2i ... j X ji ... k X ki
n
1 , 2 ,..., k i 1
Este mtodo de estimacin recibe el nombre de Mnimos Cuadrados Ordinarios (MCO).

Para obtener la solucin ptima a travs de este mtodo, el llamado estimador mnimocuadrtico, calculamos los puntos crticos de la funcin, es decir, aqullos que anulan el
gradiente (primeras derivadas) de SCR (condicin necesaria de 1er orden) y
posteriormente, segn el signo de la matriz Hessiana (segundas derivadas) de SCR,
determinamos si se trata de un mximo o un mnimo (condicin suficiente de 2 orden).
As pues, si calculamos el gradiente de nuestra funcin objetivo SCR, tendremos que:
SCR
1
SCR

2
SCR .
SCR

j

SCR

k
Donde:
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki 1

i 1
1
2 Yi 1 2 X 2i ... j X ji ... k X ki 0 ;
i 1
Y
n
es decir:
i 1
1 2 X 2 i ... j X ji ... k X ki Yi Yi
i 1
i 1
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki X 2i

i 1
2
2 Yi 1 2 X 2i ... j X ji ... k X ki X 2i 0 ;
i 1
esto es:
Y
n
i 1
1 2 X 2i ... j X ji ... k X ki X 2i Yi Yi X 2i
59
i 1
e
i 1
X 2i 0

Si seguimos calculando la primera derivada parcial de SCR respecto a los sucesivos

parmetros o coeficientes de regresin , tendremos que:
j
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki X ji

i 1
j
2 Yi 1 2 X 2i ... j X ji ... k X ki X ji 0 ;
i 1
por tanto:
Y
n
i 1
1 2 X 2 i ... j X ji ... k X ki X ji Yi Yi X ji
i 1
e
i 1
X ji 0
Finalmente, para el caso de la derivada respecto al ltimo parmetro k , obtendremos:
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki X ki

i 1
k
2 Yi 1 2 X 2i ... j X ji ... k X ki X ki 0 ;
i 1
por consiguiente:
Y
n
i 1
1 2 X 2 i ... j X ji ... k X ki X ki Yi Yi X ki
i 1
e
i 1
X ki 0
Segn hemos podido apreciar, la aplicacin de la condicin necesaria de optimalidad, es

decir, el clculo de las derivadas parciales de la funcin SCR respecto a cada uno de los
parmetros igualadas a cero, da lugar a un sistema de k ecuaciones, que reciben el
j
nombre de ecuaciones normales.

La resolucin del sistema de ecuaciones normales nos dara los valores de los
estimadores de los parmetros (es decir, los ), que podran hacer mnimo el valor
j
14
de la funcin SCR. Para poder asegurar que, en efecto, minimizan la SCR, habra
luego que aplicar la condicin suficiente, como ya se indic anteriormente. Al llevar a
cabo el estudio del signo de la matriz Hessiana, comprobaramos que al ser sta definida
14
En el caso de que estuvisemos considerando un modelo de regresin lineal simple, obtendramos los
valores de y ya conocidos de las materias de Estadstica:
1
1 Y 2 X
2
60
Cov ( X , Y ) S XY
2 .
Var ( X )
SX

positiva 15 , podemos asegurar que nuestros valores j obtenidos como solucin del
sistema de ecuaciones normales constituyen efectivamente un mnimo para la SCR.
De este modo, habramos obtenido la estimacin por MCO de nuestro modelo:
Yi 1 2 X 2i ... j X ji ... k X ki
j 1, 2, ..., k
i 1, 2, ..., n .
La resolucin del sistema de ecuaciones normales y, consiguientemente, la obtencin de

los estimadores MCO podemos realizarla mediante el anlisis matricial.
Como ya sabemos, nuestro modelo de regresin lineal general puede expresarse:
Y X u .
La estimacin del vector supone la estimacin de nuestro modelo: Y X .

De este modo, podemos definir el vector de residuos muestrales como:
e Y Y Y X ,
siendo e la matriz-vector columna:

e1 Y1 Y1

e Y Y
e 2 2 2 .

e Y Y
n n n
Si desarrollamos la expresin de la SCR en el caso matricial 16 , obtenemos:
n
SCR ei2 e ' e Y X ' Y X Y ' ' X ' Y X

i 1
Y ' Y ' X ' Y Y ' X ' X ' X .

En esta expresin se cumple que: ' X ' Y Y ' X , puesto que un lado de la ecuacin es
el traspuesto del otro y se trata de un escalar (un nmero); as, pues, tenemos que:
SCR Y ' Y 2 ' X ' Y ' X ' X .
15
Este paso se obviar por motivos de simplificacin de nuestra exposicin, pudiendo encontrarse en
cualquier manual de Econometra.
16
A la hora de trabajar con el anlisis matricial, deben tenerse en cuenta las propiedades de las
operaciones con matrices; en particular, las ms importantes son:
1. ( A B ) ' A ' B ' .
2. ( A B) ' B ' A '
3. ( A B ) 1 B 1 A 1
4. ( A ' )
( A 1 ) '
Para poder realizar estas operaciones, las matrices deben cumplir los requisitos exigibles en lo que a sus
rdenes respectivos se refiere.
61

Por tanto, el desarrollo del mtodo de estimacin por MCO de manera matricial, podra
escribirse como sigue:
Min
SCR Min
e
i 1
2
i
Min
e ' e Min
Y ' Y 2 ' X ' Y ' X ' X
La aplicacin de la condicin necesaria de primer orden dara como resultado:

SCR
2 X ' Y 2 X ' X .
A partir de ah, se obtendra la expresin matricial del sistema de ecuaciones normales:

X ' X X ' Y .
Y despejando la matriz , esto es, el vector de coeficientes de regresin estimados,
tendramos que:
X ' X 1 X ' Y .
La aplicacin de la condicin suficiente de segundo orden nos demostrara
posteriormente que esta solucin (punto crtico) representa efectivamente un mnimo de
la funcin objetivo SCR.
La utilizacin del anlisis matricial a la obtencin de los estimadores del modelo por el
mtodo de MCO presenta como ventaja que se obtienen de una vez los valores de
todos los parmetros del vector : , , ..., , ..., .
En este punto, cabe hacer las siguientes observaciones:

1. La matriz X ' X , que es cuadrada, simtrica y de orden k, debe ser no singular; esto
es, su determinante ha de ser distinto de cero. O lo que es lo mismo, no puede haber
multicolinealidad (relacin lineal) perfecta entre las variables explicativas del
modelo. De este modo, el rango de X ' X ser k y se asegurar as la existencia de la
matriz inversa de X ' X , posibilitando la obtencin del vector de los coeficientes de
regresin .
2. El nmero de observaciones debe ser sensiblemente superior al nmero de variables
explicativas: n k . Si n k , entonces el estimador MCO no est unvocamente
definido (matemticamente, el sistema de ecuaciones normales es compatible
indeterminado). Y si n k , el modelo no tiene grados de libertad (concepto que
veremos ms adelante).
Como se ha visto, la obtencin de supone la consideracin de las matrices X ' X y
X ' Y . Seguidamente se muestran las expresiones operativas de stas para cuando se
precisen:
62

X 21
X 'X
X
k1
X
X ' Y 21
X
k1
1
X 22
X k2
1
X 22
X k2
1 1 X 21

X 2 n 1 X 22
X kn 1 X 2 n
X 31
X 32
X 3n
X k1
X k2
X kn
2i
2
2i
i 1
n
i 1
i 1
X 2i X ki
i 1
n
X ki2
i 1
X
n
i 1
X
i 1
2i
3i
X 3i
ki
n
Yi
1 Y1 i 1

n
X 2 n Y2 X Y .
2i i
i 1
n
X kn Yn
X ki Yi
i 1
Propiedades de los estimadores MCO
Los estimadores MCO poseen una serie de propiedades, que podemos diferenciar en dos
tipos. Por un lado, las propiedades numricas, y por otro, las propiedades estadsticas o
probabilsticas.
Propiedades numricas de los estimadores MCO
Las propiedades numricas de los estimadores MCO son aqullas que se mantienen
como consecuencia de la aplicacin del mtodo de MCO sobre el modelo de regresin,
sin considerar la forma en la que se generaron los datos. Son:
1. Los estimadores por MCO estn expresados en trminos de cantidades
observables muestrales. Por consiguiente, pueden ser fcilmente calculados.
2. Los estimadores por MCO son estimadores puntuales; es decir, dada la muestra,
cada estimador proporciona un solo valor (puntual) del parmetro poblacional
correspondiente.
3. Una vez determinada por MCO la FRM (recta, o hiperplano de regresin en el caso
mltiple), se cumplir que:
a) La FRM pasa necesariamente por las medias muestrales de la variable explicada
Y y de todas las variables explicativas X.
n
b) La suma de los residuos mnimo-cuadrticos es igual a cero:
e
i 1
0 , siempre
y cuando el modelo tenga ordenada en el origen (como seala la primera

ecuacin normal, referida al parmetro 1 ).
63

c) Los residuos ei no estn correlacionados con las variables explicativas

X j , j 1, 2, ..., k , es decir:
e
i 1
X ji 0 .
Esta propiedad es consecuencia directa de lo expresado por las ecuaciones

normales derivadas de todos y cada uno de los parmetros j que acompaan a
las correspondientes variables explicativas X j .
Matricialmente, esta propiedad, de ortogonalidad entre las variables explicativas
y los residuos mnimo-cuadrticos, se puede expresar: X ' e .
Su demostracin sera muy sencilla:
1
X ' e X ' Y X X ' Y X ' X X ' Y X ' X X ' X X ' Y X ' Y X ' Y .
d) Los residuos ei estn incorrelados con Yi , es decir:
e
i 1
Yi 0 , i 1, 2, ..., n .
Matricialmente, esta propiedad, de ortogonalidad entre la variable explicada del

modelo y los residuos mnimo-cuadrticos, se puede expresar: Y ' e . La
demostracin, muy sencilla, sera:
Y ' e X ' e ' X ' e ' .

e) El valor promedio del valor estimado de Y coincide con el valor medio de la
variable real Y: Y Y .
La demostracin de esta propiedad comienza teniendo en cuenta que:
ei Yi Yi , o lo que es lo mismo: Yi Yi ei . De este modo, se cumple que:
n
Y Y e Y ; dividiendo ambos miembros de la igualdad por n,

i 1
i 1
i 1
i 1
se cumple finalmente que: Y Y .
Propiedades estadsticas de los estimadores MCO
Frente a las anteriores, las propiedades estadsticas o probabilsticas de los estimadores

MCO estn basadas en los supuestos del modelo (ya analizados anteriormente) y estn
avaladas por el Teorema de Gauss-Markov. En este sentido, dados los supuestos del
modelo clsico de regresin lineal, los valores estimados de los parmetros por MCO
poseen algunas propiedades ideales u ptimas.
1. El vector de parmetros o coeficientes de regresin estimados del modelo, , es un
vector aleatorio que sigue una distribucin de probabilidad normal.
Demostracin:
64

Sea el modelo: Y X u . Como sabemos, la estimacin por MCO de se

1
obtiene a travs de la expresin: X ' X X ' Y .
Desarrollando sta se tiene que:
X ' X 1 X ' Y X ' X 1 X ' X u X ' X 1 X ' X X ' X 1 X ' u

X ' X X 'u
1
1
As pues: X ' X X ' u . Dado que, de acuerdo con esta expresin,
depende de u, y u es un vector aleatorio normal, entonces se deduce que tambin

es un vector aleatorio normal.
2. Si E (u ) , entonces es un estimador insesgado de ; es decir, E .

Demostracin:
1
1
E E X ' X X ' u X ' X X ' E u .
1
3. Si Var Covu u2 I , entonces Var Cov u2 X ' X .
Demostracin:
'
'
Var Cov E E E E ;
1
1
teniendo en cuenta que: X ' X X ' u , entonces: X ' X X ' u .
Por tanto, retomando la expresin anterior tendremos que:
Var Cov E
X ' X
X ' u X ' X X ' u

1
'
E X ' X X ' u u ' X X ' X

1
X ' X X ' E u u ' X X ' X X ' X X 'Var Cov(u ) X X ' X

1
X ' X X ' u2 I X X ' X

1
u2 X ' X X ' I X X ' X

1
u2 X ' X
Como conclusin de las tres propiedades anteriores, tenemos en definitiva que:
N k ; u2 X ' X 1 .
4. Teorema de Gauss-Markov 17 : El estimador MCO es un estimador lineal, insesgado
y ptimo (ELIO), entendiendo por ptimo que tiene mnima varianza.
Por su propia definicin, el mtodo de estimacin por MCO nos proporciona los
estimadores ptimos a nivel muestral. El Teorema de Gauss-Markov es
fundamental, ya que nos garantiza, adems, que este mtodo de estimacin nos
proporciona los mejores resultados posibles tambin a nivel inferencial, ya que los
17
Obviamos aqu la demostracin de este Teorema, pudiendo consultarse en cualquier manual de

Econometra.
65

estimadores cumplen las propiedades deseables que se le exigen a un buen

estimador.
5. La combinacin lineal C ' es ELIO de C ' , donde C ' es un vector de constantes
numricas de orden 1 x k.
Para entender bien esta propiedad, podemos indicar que la estimacin ELIO, por
ejemplo, de 2 es 2 .
1
6. El vector de residuos MCO puede expresarse como una transformacin lineal de la

variable dependiente y tambin de las perturbaciones aleatorias.
e Y X Y X X ' X X ' Y I X X ' X X ' Y M Y

1
M X u M X M u M u M u
Una conclusin importante de esta propiedad es que, al poder expresarse el vector

de los residuos linealmente en funcin del vector de perturbaciones aleatorias, los
residuos tambin resultan ser un vector aleatorio que, adems, sigue una distribucin
de probabilidad normal (como u).
De manera adicional, tambin se va a verificar que: e ' e u ' M u .
El cumplimiento de lo establecido en esta propiedad se basa, a su vez, en una serie
de propiedades que posee la matriz M:
a) M es singular: M 0 .
b) M es simtrica: M M ' .
c) M es idempotente: M M n , n 2, 3, ... .
d) M . X .
Demostracin:
Basndonos en las propiedades de M, se puede demostrar la ltima parte de lo
indicado en esta propiedad del modo que sigue:
e ' e M u ' M u u ' M ' M u u ' M M u u ' M 2 u u ' M u .
7. El valor esperado del vector de residuos mnimo-cuadrticos y su matriz de
varianzas-covarianzas son, respectivamente:
E e
Var Cov e u2 M .
66

Obsrvese, a partir de la expresin de la matriz de varianzas-covarianzas, cmo

mientras las perturbaciones aleatorias son incorreladas 18 , los residuos en cambio son
linealmente dependientes.
Demostracin:
E e E M u M E u M
Var Cov e Var Cov M u M 2 Var Cov u M 2 u2 I

u2 M 2 I u2 M 2 u2 M
Como conclusin de las dos ltimas propiedades, 6 y 7, tenemos que:
e N n ; u2 M .
Propiedades del estimador MCO de la varianza de la perturbacin aleatoria
Adems de los coeficientes de regresin , segn se ha podido ir viendo, en el modelo

hay otro importante parmetro a estimar: u2 , esto es, la varianza de la perturbacin
aleatoria. En tanto que este parmetro no se estime, todas las expresiones en las que
aparezca tendrn carcter poblacional. Slo cuando se estime a partir de datos
muestrales, dichas expresiones se convertirn en estimaciones y, por tanto, en
cantidades numricas concretas de carcter muestral.
Si nos centramos en el mtodo de MCO, podemos citar tres importantes propiedades 19
relativas a u2 :
n
1. El estimador de u2 viene dado por la expresin: u2
2. Este estimador resulta ser insesgado; esto es: E u2
e
i 1
2
i
nk
e 'e
SCR
.
nk nk
u2 .
3. u2 es una variable aleatoria de la que se no conoce exactamente su distribucin de

probabilidad. Sin embargo, s se sabe que la siguiente expresin, donde se incluye,
sigue una distribucin de tipo chi-cuadrado. En particular:
u2
n k n2k .
2
u
Recurdese que la matriz de varianzas-covarianzas de u hemos asumido que es diagonal:

Var Cov u u2 I , esto es, las covarianzas referidas a distintas observaciones valen 0. Sin embargo,
18
la matriz Var Cov e u2 M no es diagonal, por lo que las covarianzas entre distintas observaciones
son distintas de 0.
No vamos a demostrar ni deducir matemticamente ninguna de las propiedades referidas a u2 . stas
pueden ser consultadas por el alumno en cualquier manual de Econometra.
19
67

Interpretacin de los coeficientes de regresin
Consideremos el modelo de regresin lineal general:

Yi 1 2 X 2i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
Como se ha visto, una vez estimado, tenemos que:

Yi 1 2 X 2i ... j X ji ... k X ki
j 1, 2, ..., k
i 1, 2, ..., n .
Dados los supuestos del modelo de regresin clsico, la estimacin obtenida en el

modelo de regresin permite predecir el valor esperado de la variable dependiente en
funcin de los valores dados de las variables independientes.
Los parmetros o coeficientes de regresin estimados del modelo tienen un
significado muy concreto. En concreto:
j , j 2, ..., k , expresa la variacin media que experimenta el valor de la

variable dependiente Y cuando se incrementa en 1 unidad 20 el valor de la
variable explicativa X j , manteniendo constantes los valores del resto de
variables explicativas presentes en el modelo. La variacin referida puede ser
positiva o negativa, dependiendo del signo que tenga , expresando as si la
j
relacin entre la variable Y y la variable X j en cuestin es directa (signo

positivo) o inversa (signo negativo).
1 es la ordenada en origen del modelo. Proporciona el valor esperado de la

variable dependiente Y cuando se consideran nulas todas las variables
independientes X. En ocasiones, dependiendo del problema que se est
analizando, este valor puede no tener sentido econmico.
Efecto marginal
El efecto marginal de una variable explicativa X j sobre la variable explicada Y es un

concepto econmico que expresa la relacin entre variaciones absolutas de Y ante
variaciones absolutas de X j . En concreto, expresa la variacin media que experimenta
la variable dependiente Y cuando se incrementa en 1 unidad el valor de la variable
explicativa X j , manteniendo constantes las dems variables explicativas que pueda
haber en el modelo 21 . Es decir:
20
Habitualmente, en el mbito de la Economa y la Empresa, se suelen considerar variaciones unitarias.

No obstante, dichas variaciones pueden ser perfectamente infinitesimales, dependiendo del problema
analizado.
Y
21
Este concepto se corresponde matemticamente con el de la derivada parcial:
.
X j
68

Efecto marginal
Y
.
X j
Si nos fijamos, el efecto marginal coincide con el significado de los coeficientes de

regresin en el caso de un modelo de regresin lineal. No obstante, como se ver ms
adelante, en otros tipos de modelos los coeficientes de regresin no van a coincidir con
este concepto.
3.4.
Bondad del ajuste. El coeficiente de determinacin. El coeficiente

de determinacin corregido.-
Bondad del ajuste
Despus de estimar la funcin de regresin poblacional, en concreto, los coeficientes de

regresin, y de ver sus propiedades, vamos a analizar en este punto la bondad del ajuste
obtenido, esto es, cmo es el ajuste de nuestro modelo al conjunto de datos de que
disponemos. 22
Para responder a esta cuestin, analizamos e intentamos determinar qu parte de la
variabilidad de la variable dependiente Y puede atribuirse a la variabilidad de las
variables explicativas X y qu parte no, atribuyndose al efecto de la perturbacin
aleatoria u. En otras palabras, parte del comportamiento de Y es explicado por las
variables X; en cambio hay otra parte que no consigue ser explicada y,
consiguientemente, se le atribuye a la perturbacin aleatoria u, a la variable aleatoria
que no controlamos. En este sentido, pues, cuanto mayor sea la parte de la
variabilidad de Y que es explicada por la variabilidad de las variables independientes,
mejor se ajusta nuestro modelo estimado de regresin a la muestra de datos
considerada. 23
La descomposicin de la variabilidad de Y podemos analizarla analtica y grficamente
(esto ltimo es posible si nos fijamos en un modelo de regresin simple).
La forma ms sencilla de representar a un conjunto de datos muestrales Yi de una
determinada variable es tomar el valor de su media muestral ( Y ). Por ello, cuando
22
En este punto, cabe resaltar la diferencia entre los conceptos de buen ajuste y mejor ajuste. Ya
hemos visto que el mtodo de estimacin por MCO nos proporciona el mejor ajuste posible a los datos de
la muestra disponible (nube de puntos); sin embargo, ello no significa necesariamente que dicho ajuste
sea bueno. Puede que el mejor ajuste posible sea malo. As pues, lo que estudiaremos ahora es si
nuestro ajuste obtenido, aun siendo el mejor posible, es bueno o no.
23
Cuando hablemos de bondad del ajuste, nos referiremos a la obtenida en relacin a una muestra
considerada. Tericamente tambin podramos referirnos a la poblacin, pero no es lo que solemos tener
en la realidad, dada la habitual imposibilidad de disponer de toda la informacin poblacional.
69

analizamos la variabilidad de la variable dependiente, hacemos referencia a la

variabilidad que muestra en torno a su valor medio: Yi Y .
Un indicador adecuado para considerar el conjunto de las desviaciones que muestran los
datos individuales en relacin a su media es la Suma de Cuadrados Totales (SCT):
Y
n
i 1
Y . Si nos fijamos bien, la SCT no es ms que el numerador de la expresin

2
de la varianza de la variable explicada Y (el denominador sera n).

Teniendo en cuenta lo expuesto hasta ahora, nuestro objetivo va a ser descomponer en
dos partes la SCT, de tal manera que, por un lado, se recojan las variaciones de Y
atribuibles al conjunto de variables explicativas X presentes en el modelo de regresin y,
por otro, aqullas que provienen del trmino aleatorio u del mismo.
Podemos ver esto fcilmente de manera grfica si tomamos como ejemplo un modelo de
regresin lineal simple: Yi 1 2 X i u i , i 1, 2, ..., n .
Yi
Y0
Y0 Y
Y0
Y
Yi 1 2 X i
Y Y e

0
RRM
Y
0
Xi
X0
Figura 4
Como se puede ver en la Figura 4, para un valor concreto de la variable Y0 , tenemos:
Y0 Y Y0 Y Y0 Y0 Y0 Y e0 .
Es decir, la variacin de cada valor observado respecto a su media muestral puede

descomponerse como la suma de la desviacin del valor estimado proporcionado por la
recta respecto al valor de la media muestral de la variable dependiente, ms el valor del
residuo de la recta de regresin.
70

Si nos fijamos bien, esta descomposicin puede perfectamente hacerse extensiva a un

modelo de regresin lineal mltiple.
Por tanto, si tomamos en consideracin la variabilidad total de Y a travs de la SCT,
vemos que sta se podra escribir as:
Y
n
i 1
Y Y e
Y 2 Yi Y ei
n
i 1
i 1
i 1
2
i
2 Yi Y ei
i 1
Utilizando las propiedades numricas 3-b) y 3-d) de los estimadores MCO (ya vistas),
tenemos que 24 :
Yi Y ei Yi ei Y ei
n
i 1
i 1
i 1
0.
As pues, hemos llegado a que:
Y
n
i 1
Y 2 Yi Y
n
i 1
e
n
i 1
2
i
Esto significa que, al analizar la variabilidad de Y, parte de este comportamiento viene

explicado por el modelo estimado (y con ello por las variables explicativas que
conforman ste) y parte no, que se corresponde con los errores o residuos muestrales. El
primero de los sumandos recibe el nombre de Suma de Cuadrados Explicados (SCE), en
tanto que el segundo es, como ya sabemos, la Suma de Cuadrados Residuales (SCR).
Segn esto, en definitiva tenemos que:
SCT SCE SCR .
De acuerdo con esta igualdad 25 , resulta evidente que a la hora de llevar a cabo un ajuste
de regresin, lo deseable es que el valor de la SCE sea lo mayor posible y,
consecuentemente, el de la SCR lo menor posible. Es decir, el ajuste del modelo ser
tanto mejor, en tanto ms alto sea la SCE en relacin con la SCT. De este modo, se
define un indicador para medir la bondad del ajuste: el coeficiente de determinacin,
que se denota por R 2 .
24
Si el modelo no tuviera ordenada en el origen, al no cumplirse la propiedad numrica 3-b) de los

estimadores MCO, esta expresin no tendra entonces por qu ser 0 y, por tanto, el desarrollo matemtico
que se obtiene a partir de este punto no sera vlido para este tipo de especificacin del modelo.
25
Esta igualdad tambin se mantendra si dividisemos todas las sumas de cuadrados por el tamao de la
muestra considerada (n); en este caso, nos encontraramos con la conocida expresin estadstica:
SCT SCE SCR
VT VE VNE ;
n
n
n
esto es, la varianza total de Y (VT) es igual a la varianza explicada (VE) ms la varianza no explicada o
residual (VNE).
71

El coeficiente de determinacin
El coeficiente de determinacin se define concretamente como: R 2
SCE
.
SCT
R 2 mide la proporcin (en tanto por uno) o el porcentaje (si se multiplica por cien) de la
variacin total de la variable dependiente que es explicada por el conjunto de las
variables explicativas que conforman el modelo de regresin. 26
El coeficiente de determinacin puede expresarse tambin como: R 2 1
SCR
.
SCT
Ello se deduce directamente al dividir la igualdad de la descomposicin de las sumas de

cuadrados entre STC:
STC SCE SCR

SCR
SCR
1 R2
R2 1
.
STC SCT SCT
SCT
SCT
De estas expresiones puede deducirse, igualmente, que el rango de valores de R 2 es:
0 R2 1 .
Si R 2 1 , esto significara un ajuste perfecto del modelo estimado, es decir:
SCE SCT , y lgicamente: SCR 0 .
Por el contrario, si R 2 0 , ello supondra que no habra relacin alguna entre la
variable explicada y las variables explicativas: SCE 0 y SCR SCT . En este caso,
Yi 1 Y , es decir, la mejor prediccin de cualquier valor de Y sera simplemente el
valor de su media.
Por tanto, cuanto ms cerca de 1 se halle el valor de R 2 , tanto mejor ser la bondad del
ajuste analizado. En trminos generales, la literatura estadstico-economtrica considera
que un ajuste de regresin puede considerarse bueno si el coeficiente de determinacin
presenta un valor que se sita a partir, aproximadamente, de 0,75.
Expresiones operativas de SCT, SCE y SCR
En este punto vamos a mostrar distintas expresiones que pueden adoptar las sumas de
cuadrados que hemos visto. 27
SCT Yi Y Yi 2 n Y 2 Y ' Y n Y 2
n
i 1
i 1
26
No debe confundirse el concepto de coeficiente de determinacin R 2 con el de coeficiente de

correlacin lineal R , que numricamente se corresponde con su raz cuadrada positiva. R expresa el
grado de asociacin lineal existente entre las variables en cuestin, movindose sus valores entre 0 y 1, si
la relacin entre las variables es directa, y entre -1 y 0, si la relacin es inversa. Cuanto ms cerca se halle
el valor de 1 ( -1), ms fuerte es esta relacin.
27
Nos vamos a limitar simplemente a exponer estas expresiones. Sus deducciones y demostraciones
pueden consultarse en cualquier manual de Econometra.
72

n
SCE Yi Y
i 1
i 1
i 1
i 1
SCR ei2 Yi Yi
n Y 2 Y ' Y n Y 2 ' X ' X n Y 2 ' X ' Y n Y 2
Y ' Y Y ' Y Y ' Y ' X ' X Y ' Y ' X ' Y
A partir de stas, pueden a su vez configurarse distintas expresiones del coeficiente de

determinacin R 2 , dependiendo de cules se tomen en concreto. Ello depender
normalmente del problema particular que se est estudiando. 28
El coeficiente de determinacin corregido
A la hora de evaluar si un modelo es adecuado o no, es evidente que el coeficiente de

determinacin juega un papel importante; sin embargo, no es el nico indicador a tener
en cuenta. De hecho, su papel no debe sobrevalorarse. Obtener un valor elevado de R 2
no implica que nuestros resultados puedan ser fiables. Puede darse el caso extremo de
tener un R 2 1 , es decir, que el modelo presente un ajuste perfecto entre las variables
explicativas X y la variable explicada Y, pero sin embargo, que no tenga sentido
econmico o estadstico.
Podemos poner un ejemplo para ilustrar esto. Consideremos, por simplicidad, un
modelo de regresin lineal simple, con ordenada en el origen (es decir, k 2 ), y que
para su estimacin contamos nicamente con un tamao muestral n de 2 observaciones.
As pues, en este caso: n k 2 . Pensemos que nuestro modelo pretende estudiar el
precio del transporte pblico de nuestra ciudad (Y) en funcin del precio del pan en un
pas de Extremo Oriente (X). Grficamente, nuestro resultado podra ser el que se
muestra en la Figura 5; esto es, puesto que nuestro modelo es una recta y la nube de
puntos se compone nicamente de 2 puntos, obviamente la mejor recta posible pasar
necesariamente por los 2 puntos. De acuerdo con ello, en este caso nuestro coeficiente
de determinacin arrojar un valor igual a 1.
Si atendemos a este resultado, nos encontramos con que el ajuste de nuestro modelo es
perfecto y, sin embargo, a todas luces, desde el punto de vista de la interpretacin
econmica, el resultado es absurdo.
Cul es entonces el fallo? Pues ste radica en que estamos considerando el mismo
nmero de observaciones muestrales (n) que de variables explicativas en el modelo (k).
En este caso, matemticamente el ajuste resulta necesariamente perfecto, pese a no tener
ningn sentido.
28
En el caso particular de que consideremos un modelo de regresin lineal simple, las expresiones ms
habituales (y de sobra conocidas por las materias de Estadstica) del coeficiente de determinacin son:
R2
2
2
S XY
S XY 2 S X .
2
2
S X2 S Y2
S Y2
S Y2
73

Yi
Yi 1 2 X i
Y2
R2 = 1
Y1
X1
X2
Xi
Figura 5
Si considersemos en lugar de 2 observaciones muestrales, 3, el ajuste ya no sera
perfecto y, consiguientemente, el valor de R 2 disminuira. Si fuesen 4 las
observaciones, R 2 sera todava menor y as podramos ir actuando sucesivamente. Es
decir, con un mayor tamao muestral en relacin al nmero de variables explicativas, el
valor de R 2 ira decreciendo y la conclusin a la que se llegara sera ms realista.
Volviendo a nuestro ejemplo, si el tamao de la muestra fuese grande, con toda
seguridad acabaramos teniendo un coeficiente de determinacin con un valor bajo,
siendo as coherente el resultado obtenido.
Por tanto, hay que tomar con precaucin las conclusiones que se extraen sobre la
bondad de ajuste de un modelo al interpretar el valor de R 2 . Debemos tener presente el
tamao muestral con el que se trabaja en comparacin con el nmero de variables
explicativas del modelo. La diferencia entre ambos, n k , es lo que se conoce como
grados de libertad. Cuanto ms elevado sea el valor de los grados de libertad de un
ajuste, ms realista, y por consiguiente fiable, ser la explicacin proporcionada por el
coeficiente de determinacin de un modelo. El modelo captar mejor la relacin entre
las variables cuanta ms informacin muestral (considerada a travs de sus
observaciones) incorporemos en el estudio, es decir, cuantos ms grados de libertad
existan.
En definitiva, el fallo en nuestro ejemplo era que nuestro ajuste no tena grados de
libertad: n k 0 .
74

Otra forma de abordar la cuestin de los grados de libertad de un modelo es ver qu

sucede si se produce un incremento del nmero de variables explicativas k del modelo.
Esto conlleva, en la generalidad de los casos, un incremento del valor de R 2 .
Cuando se introduce una nueva variable explicativa en el modelo, sta en general
siempre va a aportar, es decir, va a mejorar la explicacin de la variable dependiente
del modelo, lo que supone un incremento de R 2 . Obsrvese que en el peor de los casos
simplemente no va a aportar nada, permaneciendo entonces invariable el valor del
coeficiente de determinacin.
As pues, de acuerdo con esto, debemos tener presente que el incremento del nmero de
variables explicativas en un modelo podra estar arrojndonos un valor elevado del R 2
un tanto artificial, es decir, podra enmascarar un ajuste aparentemente bueno, aun
no sindolo en la realidad.
Si nos fijamos bien, si el nmero de observaciones muestrales n permanece constante y
aumentamos el nmero de variables explicativas k del modelo, estamos reduciendo el
nmero de grados de libertad n k de ste, lo que resta credibilidad al valor de R 2 .
Tras lo visto en los puntos anteriores, cuando se habla del coeficiente de determinacin
que presenta un modelo, tambin es preciso hacerlo de los grados de libertad que tiene.
Cuanto mayor sea el nmero de grados de libertad que presente un modelo, ms fiable
resultar el valor de su R 2 , y viceversa.
Dicho esto, lo ideal sera poder tener un indicador que aunase las dos informaciones del
modelo, esto es, el valor del coeficiente de determinacin y el nmero de grados de
libertad. De alguna manera, este indicador debera penalizar o corregir el valor de R 2
en funcin del nmero de grados de libertad, de forma que cuanto menor fuese ste,
tambin fuese menor el valor de R 2 .
En este sentido, surge entonces el denominado coeficiente de determinacin corregido,
que se denota por Rc2 o R 2 , el cual matiza o penaliza, de alguna manera, la inclusin de
nuevas variables explicativas en el modelo, o bien el escaso nmero de observaciones
muestrales en relacin al nmero de variables explicativas consideradas. Este
coeficiente se define:
n 1
Rc2 1 1 R 2
.
n k
Ntese, segn esta expresin, que si se produce un incremento del nmero de variables
explicativas en el modelo, tendremos que:
k n k
75
n 1
Rc2 .
nk

Obsrvese tambin que este coeficiente nos sirve para ver si el nmero de observaciones
muestrales que estamos considerando es suficiente o no, pues manteniendo fijo el
nmero de variables explicativas k, cuando n tiende a infinito se tiene que:

n 1
n 1
2
2
Rc2 lim 1 1 R 2
1 1 R lim
1 1 R 1
n
n n k
n k
1 1 R 2 1 1 R 2 R 2 .
Es decir, cuando el nmero de observaciones es suficientemente elevado, ambos

coeficientes tienden a ser iguales. Esto nos puede servir para hacer el razonamiento
inverso, esto es, si nos encontramos que los valores de R 2 y de Rc2 son muy similares,
ello significar que estamos ante un tamao muestral suficiente.
Pero debemos tener muy presente que, ante muestras pequeas, el valor de Rc2 nos
arrojar informacin sobre la bondad del ajuste del modelo ms fiable que la del R 2 .
Consideraciones sobre el uso del coeficiente de determinacin y del coeficiente de

determinacin corregido
1. El valor del coeficiente de determinacin hay que tomarlo con precaucin, puesto
que en funcin del tamao muestral, puede estar mostrando resultados engaosos y
no del todo fiables.
2. En el caso de un modelo sin ordenada en el origen, segn las razones matemticas
que se expusieron en su momento, no se tiene por qu cumplir la igualdad
SCT SCE SCR . Este hecho tiene como consecuencia que el rango de valores de
R 2 no se cie al intervalo (0, 1). De hecho, bajo determinadas circunstancias, en

estos casos el valor del coeficiente de determinacin puede llegar a ser incluso
negativo. Tan slo puede asegurarse que su valor es, como mximo, 1: R 2 1 . As
pues, el coeficiente de determinacin hay que tomarlo con mucha precaucin.
3. Si no hay ordenada en el origen, y aun cuando R 2 0 , el coeficiente de
determinacin se puede utilizar para comparar modelos que no presenten ordenada
en el origen, siempre que tengan la misma variable dependiente, igual nmero de
variables explicativas y utilicen una muestra del mismo tamao, pero nunca se podr
tomar para comparar un modelo con ordenada en el origen con otro sin ordenada en
el origen.
4. El coeficiente de determinacin se puede utilizar para comparar modelos que
presenten la misma variable dependiente, el mismo nmero de variables explicativas
y una muestra de igual tamao. En el caso de que la variable dependiente sea
diferente, es necesario utilizar otros indicadores para juzgar la bondad de un modelo
de regresin, como por ejemplo, el criterio de informacin de Akaike, que se ver
ms adelante.
76

5. Para modelos anidados con igual variable dependiente 29 , la comparacin debe

realizarse utilizando el coeficiente de determinacin corregido.
6. Para establecer si el modelo que se analiza resulta adecuado o no, no es suficiente
estudiar nicamente la bondad del ajuste. El investigador debe preocuparse antes por
estudiar la relevancia lgica o terica que tienen las variables explicativas para la
variable dependiente, as como la significatividad estadstica de sus coeficientes,
aspecto ste que se estudiar ms adelante.
3.5.
Introduccin en el modelo de variables ficticias.-
Hasta este momento, hemos estado asumiendo que todas las variables de nuestro
modelo economtrico eran de tipo cuantitativo, esto es, variables que toman de forma
continua valores reales.
Sin embargo, la realidad est tambin plagada de factores de tipo cualitativo cuya
inclusin en los modelos se puede hacer igualmente necesaria: sexo, estado civil, nivel
de estudios, localizacin geogrfica; es decir, los modelos pueden tener entre sus
variables explicativas, tanto variables cuantitativas como variables cualitativas.
Aparecen entonces las denominadas variables ficticias, tambin conocidas como
binarias o dicotmicas, o dummy (en terminologa anglosajona), que reflejan la
presencia o no de un determinado atributo.
Las variables ficticias se caracterizan porque:
Toman nicamente los valores 1 y 0, de manera que stos indican:

1 Presencia de determinado atributo.
0 Ausencia del atributo considerado.
Suelen referirse a variables cualitativas: sexo, localizacin geogrfica, etc.
Tambin son susceptibles de utilizacin para variables cuantitativas (por

ejemplo, la edad), refirindose a tramos en los que se puede dividir el rango
de valores de stas.
A continuacin, mostraremos un ejemplo ilustrativo para entender la interpretacin y

uso de las variables ficticias.
29
Los modelos anidados son aqullos que tienen en comn una serie de variables explicativas, a las
cuales se les suman adems otras variables explicativas diferentes. Por ejemplo:
Consumo i 1 2 Precio i u i
Consumo i 1 2 Precio i 3 Renta i u i
77

Interpretacin de los coeficientes de regresin
Ejemplo de una variable cualitativa con dos modalidades:

Supngase que se pretende estudiar el salario que gana una poblacin de titulados
universitarios, donde stos pueden ser exclusivamente licenciados o doctores, y se
quiere conocer si existen diferencias salariales entre los dos tipos de titulados debidas a
esa diferente condicin. Para ello se establece el siguiente modelo de regresin lineal:
Yi 1 2 X i u i ,
donde:
Yi Salario del titulado i-simo

1, si el titulado i es doctor
Xi
0, si el titulado i es licenciado
u i Perturbacin aleatoria que cumple los supuestos del modelo clsico de
regresin lineal.
De acuerdo con ello, si se toman los valores esperados del salario para los distintos
valores que puede adoptar la variable ficticia considerada, se tiene que:
E Yi | X i 1 1 2 1
E Yi | X i 0 1 0
Salario medio poblacional que tienen los doctores.

Salario medio poblacional que tienen los licenciados.
Segn las expresiones anteriores, se deduce que:
1 0
2 1 0
Salario medio poblacional de los licenciados.

Diferencia en el salario medio poblacional entre los doctores y
los licenciados.
Obsrvese que la categora referente a los licenciados (aqulla en la que la variable

ficticia toma el valor 0) es sobre la que se compara la otra categora (en este caso,
doctores). Los licenciados forman lo que se denomina la categora base de la
variable relativa al grado de los titulados universitarios.
Teniendo en cuenta la interpretacin dada de los coeficientes de regresin del modelo
planteado, si se quisiera comprobar si las retribuciones entre ambos grados de titulados
son iguales, se podra plantear un contraste de hiptesis 30 , donde la hiptesis nula sera:
H0 : 2 0 .
30
En el siguiente tema, trataremos los contrastes de hiptesis. No obstante, el alumno conoce ya estos
conceptos, por anteriores materias de Estadstica que ha estudiado previamente.
78

Los coeficientes de regresin 1 y 2 se estiman por el mtodo de MCO habitual:
( X ' X ) 1 X ' Y , siendo las matrices de datos de las variables del modelo:
Y1
1 1

Y2
1 0
Y Y3 y X 1 0 ,

1 1
Yn
donde la 2 columna de la matriz X, relativa a los valores de la variable explicativa, est

formada slo por ceros y unos, dependiendo de si la observacin en cuestin se
refiere a un licenciado o a un doctor, respectivamente.
Si tenemos en cuenta que el nmero de datos ( n ) es tal que n n0 n1 , siendo n0 el
nmero de datos de X cuyo valor es 0 y n1 el nmero de datos que son 1, y denotamos
por Y0 a la variable dependiente del modelo asociada a los valores de X que son 0 y
por Y1 a la que corresponde a los valores de X iguales a 1, entonces tendremos que:
n
X'X n
X i
i 1
Xi
i 1
n
n
n
2
1
X
i
i 1
n
n
Yi Yi
i 1 nY .
X ' Y n i 1
n1 n1Y1
X
Y
2i i Yi
i 1
i 1
n1
n1
Si se desarrolla la expresin de la estimacin de por MCO, ( X ' X ) 1 X 'Y ,

finalmente se llega a:
,
Y Y
0
1
Y0
cuyo significado coincide, en trminos muestrales, con el de los poblacionales.
Ejemplo de una variable cualitativa con tres modalidades:

Supngase ahora que se quiere estudiar, a travs de un modelo de regresin lineal, el
salario de una poblacin ( Yi ) en funcin de su nivel de estudios, distinguindose
aqu tres posibles: primarios, secundarios y superiores.
Estas tres modalidades vienen expresadas por las siguientes variables ficticias:
1, si el individuo i tiene estudios secundarios

D2 i
0, en caso contrario
79

1, si el individuo i tiene estudios superiores

D3 i
Obsrvese que no es necesario definir una tercera variable para el caso de los individuos
con estudios primarios, ya que esta circunstancia es la que se da cuando D2 i y D3 i
toman el valor 0 simultneamente. La modalidad estudios primarios se considerar la
categora base de la variable nivel de estudios.
De acuerdo con todo esto, el modelo que se especifica es:
Yi 1 2 D2 i 3 D3 i u i
E Yi | D2i 1, D3i 0 1 2 SEC
Salario medio de los individuos con

estudios secundarios.
E Yi | D2i 0, D3i 1 1 3 SUP
Salario medio de los individuos con

estudios superiores.
E Yi | D2i 0, D3i 0 1 PRI
Salario medio de los individuos con estudios

primarios.
A partir de aqu, puede deducirse fcilmente el significado de los coeficientes de

regresin del modelo:
1 PRI
2 SEC PRI
Salario medio de los individuos con estudios primarios.

Diferencia en el salario medio de los individuos con estudios
secundarios respecto a los que tienen estudios primarios.
3 SUP PRI
Diferencia en el salario medio de los individuos con estudios

superiores respecto a los que tienen estudios primarios.
De nuevo se observa que las comparaciones de los salarios para las distintas
modalidades de la variable nivel de estudios se hacen con respecto a la categora base.
Tipos de especificaciones en la construccin de modelos con variables ficticias
A la hora de construir un modelo con variables ficticias, puede optarse por una de las
dos especificaciones siguientes:
31
Aditiva: Yi 1 2 Di 3 Z i u i
Multiplicativa 31 : 1 2 Di 3 Z i 4 Di Z i u i
Existen otras variantes de la especificacin multiplicativa, como es el caso de:
1 2 Di 3 Di Z i u i .
80

donde Di y Z i son, en este caso, variables ficticias en ambas especificaciones y se

supone que la perturbacin aleatoria u i cumple los supuestos del modelo clsico de
regresin lineal.
Para comprobar la diferencia entre ambas alternativas, nos serviremos del siguiente
ejemplo.
Pensemos en un modelo de regresin lineal mediante el cual pretendemos explicar el
salario de una poblacin en funcin del sexo del individuo (cuyas dos posibles
modalidades resultan ser: varn o mujer) y su zona geogrfica de residencia
(donde se consideran tambin slo dos posibles modalidades o categoras: zona
urbana o zona rural). Se definen para ello las siguientes variables:
Yi Salario del individuo i

1, si el individuo i es mujer
Di
0, si el individuo i es varn
1, si el individuo i reside en una zona rural
Zi
0, si el individuo i reside en una zona urbana
Ntese que las categoras base para el caso del sexo (variable Di ) y la zona
geogrfica de residencia (variable Z i ) son varn y zona urbana, respectivamente.
Especificacin aditiva:
En el caso de considerar la especificacin aditiva, el modelo es:
Yi 1 2 Di 3 Z i u i .
Si se toman los valores esperados del salario para las distintas combinaciones de valores
que pueden adoptar las dos variables ficticias introducidas en el modelo, se deduce de
manera inmediata que:
E Yi | Di 1, Z i 1 1 2 3 M , R
Salario medio de las mujeres que

residen en una zona rural.
E Yi | Di 1, Z i 0 1 2 M , U
Salario medio de las mujeres que residen

en una zona urbana.
E Yi | Di 0, Z i 1 1 3 V , R
Salario medio de los varones que residen

en una zona rural.
E Yi | Di 0, Z i 0 1 V , U
Salario medio de los varones que residen en

una zona urbana.
As, el significado de los distintos coeficientes de regresin resulta ser entonces:
81

1 V , U
Salario medio de los varones que residen en una zona urbana.
2 M , U V , U M , R V , R
Diferencia en el salario medio de las mujeres

respecto a los varones, dentro de cada zona
de residencia.
3 V , R V , U M , R M , U
Diferencia en el salario medio de los que

residen en una zona rural respecto a los que
lo hacen en una zona urbana, dentro de cada
sexo.
Una vez ms puede observarse cmo las comparaciones se hacen sobre las categoras
base: varn y zona urbana.
Especificacin multiplicativa:
En este caso, el modelo que se especifica resulta ser:
Yi 1 2 Di 3 Z i 4 Di Z i u i ,
Los valores esperados del salario, teniendo en cuenta los posibles valores de las
variables ficticias consideradas, son en este modelo:
E Yi | Di 1, Z i 1 1 2 3 4 M , R
Salario medio de las mujeres que

residen en una zona rural.
E Yi | Di 1, Z i 0 1 2 M , U
Salario medio de las mujeres que residen

en una zona urbana.
E Yi | Di 0, Z i 1 1 3 V , R
Salario medio de los varones que residen en

una zona rural.
E Yi | Di 0, Z i 0 1 V , U
Salario medio de los varones que residen en una

zona urbana.
A partir de las expresiones anteriores, se deduce el significado de los coeficientes de

regresin del modelo:
1 V , U
2 M , U V , U
Salario medio de los varones que residen en una zona urbana.

Diferencia en el salario medio, en las zonas urbanas, de las
mujeres respecto a los varones.
3 V , R V , U
Diferencia en el salario medio, en los varones, de los que

residen en una zona rural respecto a los de una zona urbana.
82

Obsrvese, por su parte, que las otras dos diferencias posibles, distinguiendo sexo y
zona geogrfica de residencia, vienen dadas por combinaciones de coeficientes de
regresin y no por coeficientes aislados:
2 4 M , R V , R
Diferencia en el salario medio, en las zonas rurales, de

las mujeres respecto a los varones.
3 4 M , R M ,U
Diferencia en el salario medio, en las mujeres, de las

que residen en una zona rural respecto a las de una
zona urbana.
El significado de 4 se puede ver a partir de las relaciones anteriores:
Compara la diferencia media de salarios entre mujeres y varones de zona

rural a zona urbana ( ( 2 4 ) 2 ); asimismo ofrece la comparacin de
la diferencia media de salarios entre zona rural y zona urbana de mujeres a
varones ( ( 3 4 ) 3 ).
La principal aportacin del esquema multiplicativo frente al aditivo es que permite tener
en cuenta la interaccin entre variables. En concreto, en el ejemplo que nos ocupa, se
pueden apreciar distintas diferencias de salario entre mujeres y varones segn cual sea
su zona de residencia, mientras que con el esquema aditivo la diferencia salarial entre
varones y mujeres resulta ser la misma tanto en la zona rural como en la zona urbana.
Del mismo modo, la especificacin multiplicativa hace posible la percepcin de
distintas diferencias de salario entre zona rural y zona urbana segn se trate de mujeres
o varones, hecho que no ocurre con el esquema aditivo.
La trampa de las variables ficticias
A lo largo de todos los ejemplos que se han ido exponiendo en este tema, obsrvese que
cuando las variables cualitativas incluidas en los modelos tenan m modalidades, se han
utilizado m-1 variables ficticias para su consideracin. La razn de ello, en lugar de
utilizar m variables ficticias, no slo reside en el hecho de que no resulta necesario, sino
en evitar la presencia de multicolinealidad perfecta entre los trminos independientes y
las variables ficticias en los correspondientes modelos.
Si, por ejemplo, tuvisemos una variable con tres modalidades y emplesemos tres
variables ficticias ( D1 , D2 , D3 ) en el modelo:
Yi 1 2 D1i 3 D2i 4 D3i u i ,

tendramos que: D1 D2 D3 1 ; esto es, la suma de estas tres variables sera igual a la
ordenada en el origen: X 1 . Por tanto, estaramos ante una situacin de multicolinealidad
perfecta, que nos impedira calcular de forma unvoca la estimacin de los parmetros.
83

Para evitarla, caben dos soluciones alternativas:

a) incluir slo m 1 variables ficticias en el modelo; o bien,
b) incluir m variables ficticias, pero en un modelo sin ordenada en el origen.
Por qu valores 0 y 1?
Otro aspecto importante a tener en cuenta en la construccin de variables ficticias es el

hecho de que no sera correcto emplear valores distintos a 0 y 1 en ellas, tal como las
hemos estudiado. El porqu de ello lo ilustraremos mediante el siguiente ejemplo.
Considrese el modelo: Yi 1 2 Z i u i , donde:
Yt Salario anual del individuo i

0, si el individuo i tiene un nivel de cualificacin " A"
Z i 1, si el individuo i tiene un nivel de cualificacin " B"

2, si el individuo i tiene un nivel de cualificacin " C"
E Yi | Z i 0 1 A
Salario anual medio de los individuos con un nivel de

cualificacin A.
E Yi | Z i 1 1 2 B
Salario anual medio de los individuos con un nivel

de cualificacin B.
E Yi | Z i 2 1 2 2 C
Salario anual medio de los individuos con un

nivel de cualificacin C.
Ntese que con esta especificacin se est asumiendo que:
C B B A 2
C A 2 2 .
Es decir, que la diferencia en los salarios entre los individuos con un nivel de
cualificacin A respecto de los de B es igual que la diferencia de los de un nivel
B respecto de los de C y que, por tanto, entre A y C esta diferencia es el doble.
Todo ello, evidentemente, no tiene por qu ser as. sta es la razn, pues, por la que no
deben darse a las variables ficticias valores distintos a 0 y 1.
Ejemplos
Consideremos un modelo de regresin lineal que explica los ingresos netos familiares
en funcin de diversas caractersticas de la persona principal del hogar: edad, estado
civil y nivel mximo de estudios alcanzado. En concreto, las variables del modelo son:
ING = Ingresos netos familiares (en )
EDAD = Edad de la persona principal del hogar (en aos)
84

1, si la persona principal del hogar est casada

CASADO
1, si los mximos estudios de la persona ppal. del hogar son secundarios
SECUNDAR
1, si los mximos estudios de la persona principal del hogar son superiores
SUPERIOR
En el nivel de estudios, se considera un tercer nivel: el PRIMARIO, que constituye la

categora base (esto es, cuando SECUNDAR y SUPERIOR toman a la vez valores 0).
Un aspecto importante que cabe sealar es el hecho de que la asignacin de los valores
0 y 1, as como la eleccin de la categora o modalidad bsica, resultan arbitrarias.
nicamente habr que estar atentos a la interpretacin de los signos y valores de los
correspondientes coeficientes de regresin.
A partir de una muestra de 3.000 hogares espaoles con datos relativos a 1998, se han
planteado dos modelos distintos: segn un esquema aditivo y segn un esquema
multiplicativo. Se muestran a continuacin los resultados obtenidos en ambos casos.
Especificacin aditiva:
De acuerdo con la definicin de las variables realizada, el modelo a estimar es:
ING 1 2 EDAD 3 CASADO 4 SECUNDAR 5SUPERIOR u
El resultado de la estimacin por MCO de este modelo resulta ser:
ING = 6.030,49 + 199,90*EDAD + 1.205,63*CASADO + 2.897,10*SECUNDAR +
13.181,26*SUPERIOR
El significado de los coeficientes de regresin estimados sera:
1 - Su significado es el habitual de todo modelo de regresin lineal. Es la ordenada

en el origen y, a veces, no tiene sentido econmico. En este caso, sin embargo, s lo
tiene; 6.030,49 seran los ingresos netos familiares que, en promedio, tendran
como mnimo aquellos hogares cuya persona principal no est casada y tiene
estudios primarios, sin tener en cuenta el efecto de la edad.
2 - Es el efecto marginal medio de la edad sobre los ingresos netos familiares.

Cada ao de edad de la persona principal de hogar supondra, por trmino medio, un
incremento de 199,90 en los ingresos netos familiares.
85

3 - Este parmetro recoge el efecto del estado civil en nuestro modelo. En este
caso viene a significar que estar casado supone, por trmino medio, unos ingresos
netos adicionales en el hogar de 1.205,63 , frente a otros estados civiles.
4 - El valor de este coeficiente muestra el efecto diferencial de las personas

principales del hogar que tienen un nivel mximo de estudios secundarios frente a
los de estudios primarios. Como pareca lgico esperar, el signo de este parmetro
es positivo y, en concreto, su valor indica que los ingresos netos de estos hogares
son, por trmino medio, 2.897,10 ms altos que los de la categora base.
5 - El coeficiente que acompaa a los estudios superiores muestra, por su parte,

cul es la influencia que stos tienen sobre los ingresos netos, en comparacin con
los correspondientes a los estudios primarios. Al igual que en el caso anterior, de
nuevo el signo es positivo, reflejando su valor que los ingresos netos de los hogares
cuya persona principal alcanza los estudios superiores son 13.181,26 ms elevados
que los de la categora base, por trmino medio.
Si se quisiera comparar la diferencia, en sus efectos sobre los ingresos netos familiares,
entre los hogares cuya personal principal tiene estudios superiores y los de estudios
secundarios, bastara con ver la diferencia entre los valores de los respectivos
coeficientes de regresin; es decir: 13.181,26 2.897,10 = 10.284,16 .
Obsrvese que, aplicando el significado de las variables ficticias, llegamos a distintas
ecuaciones segn sea el perfil de la persona principal del hogar:
-
Persona principal no casada y con estudios primarios:

ING = 6.030,49 + 199,90*EDAD
Persona principal no casada y con estudios secundarios:

ING = 6.030,49 + 2.897,10 + 199,90*EDAD = 8.927,59 + 199,90*EDAD
Persona principal no casada y con estudios superiores:

ING = 6.030,49 + 13.181,26 + 199,90*EDAD = 19.211,75 + 199,90*EDAD
Persona principal casada y con estudios primarios:

ING = 6.030,49 + 1.205,63 + 199,90*EDAD = 7.236,12 + 199,90*EDAD
Persona principal casada y con estudios secundarios:

ING = 6.030,49 + 1.205,63 + 2.897,10 + 199,90*EDAD = 10.133,22 + 199,90*EDAD
Persona principal casada y con estudios superiores:

ING = 6.030,49 + 1.205,63 + 13.181,26 + 199,90*EDAD = 20.417,38 + 199,90*EDAD
86

Especificacin multiplicativa:
Planteamos ahora un modelo alternativo que permitir distinguir posibles diferencias en
el efecto marginal medio de la edad sobre los ingresos netos familiares, dependiendo del
nivel mximo de estudios alcanzado por la persona principal del hogar:
ING 1 2 EDAD 3 CASADO 4 SECUNDAR 5SUPERIOR
6 EDAD * SECUNDAR 7 EDAD * SUPERIOR u
Los ingresos estimados vienen dados ahora por:

ING = 11.778,99 + 73,06*EDAD + 1.000,14*CASADO + 4.398,71*SECUNDAR +
7.333,88*SUPERIOR + 170,00*EDAD*SECUNDAR + 478,99*EDAD*SUPERIOR
En cuanto al significado de los coeficientes de regresin estimados, resulta que:
1 - 11.778,99 seran los ingresos familiares netos que, en promedio, tendran

como mnimo aquellos hogares cuya persona principal no est casada y tiene
estudios primarios, sin tener en cuenta el efecto de la edad.
2 - Es el efecto marginal medio de la edad sobre los ingresos netos familiares en el

caso en que la persona principal del hogar tiene estudios primarios. Cada ao de
edad de dicha persona supondra, por trmino medio, un incremento de 73,06 en
los ingresos netos familiares.
3 - Los ingresos netos familiares de los hogares cuya persona principal est casada
superan en 1.000,14 , por trmino medio, a los ingresos netos familiares de los
hogares en los que el estado civil de la persona principal es otro (estando en
igualdad de condiciones para el resto de variables).
4 - Los ingresos netos familiares mnimos de los hogares cuya persona principal
tiene estudios secundarios sern, en promedio y sin tener en cuenta el efecto de la
edad, de 4.398,71 ms que los correspondientes cuando la persona principal tiene
estudios primarios.
5 - Los ingresos netos familiares mnimos de los hogares cuya persona principal
tiene estudios superiores sern, en promedio y sin tener en cuenta el efecto de la
edad, de 7.333,88 ms que los correspondientes cuando la persona principal tiene
estudios primarios.
6 - Este coeficiente muestra la diferencia en el efecto marginal medio de la edad

sobre los ingresos familiares netos de las personas principales del hogar que tienen
un nivel mximo de estudios secundarios frente a los que tienen estudios primarios.
En el caso de estudios secundarios, cada ao de edad supone 170,00 ms de
ingresos, por trmino medio, que con estudios primarios.
87

7 - El significado de este coeficiente es similar al de 6 , referido a los estudios

superiores. Es decir, si la persona principal del hogar tiene estudios superiores, cada
ao de edad supondr un incremento de 478,99 ms en los ingresos que si tuviera
nicamente estudios primarios, por trmino medio.
Para comparar los efectos marginales medios de la edad sobre los ingresos netos de los
hogares cuyas personas principales tienen estudios superiores respecto a las que tienen
estudios secundarios, de nuevo sera suficiente con calcular la diferencia entre los
valores de los respectivos coeficientes de regresin; es decir: 478,99 170,00 = 308,99 .
Igualmente se podran comparar los ingresos mnimos de los hogares, en trmino medio
y sin tener en cuenta el efecto de la edad, cuando la personal principal tiene estudios
superiores frente a estudios secundarios. En este caso, dichos ingresos se diferenciaran
en 7.333,88 4.398,71 = 2.935,17 , esto es, seran 2.935,17 ms cuando se tienen
estudios superiores.
Los distintos perfiles de las personas principales de los hogares dan lugar a las
siguientes ecuaciones para la estimacin de los ingresos netos familiares:
-
Persona principal no casada y con estudios primarios:

ING = 11.778,99 + 73,06*EDAD
Persona principal no casada y con estudios secundarios:
ING = 11.778,99 + 4.398,71 + 73,06*EDAD + 170,00*EDAD = 16.177,70 + 243,06*EDAD
Persona principal no casada y con estudios superiores:
ING = 11.778,99 + 7.333,88 + 73,06*EDAD + 478,99*EDAD= 19.112,87 + 552,05*EDAD
Persona principal casada y con estudios primarios:

ING = 11.778,99 + 1.000,14 + 73,06*EDAD = 12.779,13 + 73,06*EDAD
Persona principal casada y con estudios secundarios:

ING = 11.778,99 + 1.000,14 + 4.398,71 + 73,06*EDAD + 170,00*EDAD = 17.177,84 + 243,06*EDAD
Persona principal casada y con estudios superiores:

ING = 11.778,99 + 1.000,14 + 7.333,88 + 73,06*EDAD + 478,99*EDAD= 20.113,01 + 552,05*EDAD
En las ecuaciones anteriores, puede observarse que el efecto marginal de la edad sobre
los ingresos netos familiares vara dependiendo del nivel de estudios de la persona
principal del hogar. Esto no ocurra con la especificacin aditiva, sino que dicho efecto
marginal era entonces el mismo en todos los casos.
88

3.6. Formas funcionales linealizables. Elasticidad vs. efecto marginal.En este apartado, se van a considerar diversas formas funcionales alternativas a la lineal.
Todas ellas se caracterizan por el hecho de que, pese a no ser lineales, a partir de
sencillas transformaciones matemticas se convierten en tales; por esta razn, reciben el
nombre de formas funcionales linealizables.
Vamos a ver, para cada uno de los modelos que consideramos, cul es el significado de
sus coeficientes de regresin, as como la forma en que se obtienen el efecto marginal y
la elasticidad. Por ltimo, nos fijaremos en el modo en el que debemos actuar para
poder establecer comparaciones entre los distintos modelos, a fin de elegir el mejor.
Por simplicidad en la explicacin, se van a considerar en todos los casos modelos de
regresin simple (con ordenada en el origen), donde Y es la variable cuyo
comportamiento se trata de explicar segn los valores de la variable explicativa X .
Elasticidad vs. efecto marginal
Comenzamos exponiendo los conceptos de efecto marginal y de elasticidad:
Efecto marginal
Elasticidad
dY
. Expresa la relacin entre variaciones absolutas de Y y de X .
dX
dY Y
dY X
. Expresa la relacin entre variaciones relativas de Y

dX X dX Y
y de X .
Anlisis de los modelos
Antes de abordar el estudio de las diferentes formas funcionales linealizables, vamos a

tratar el modelo lineal brevemente para poder contrastar sus resultados frente a los de
los dems modelos.
Modelo lineal
Como bien sabemos ya, la expresin de este modelo es:
Yi 1 2 X i u i , donde i 1,, n .
-
El coeficiente de regresin 2 expresa: 2
dY
.
dX
Su interpretacin puede verse con el ejemplo: CONSUMO 3,28 0,37 RENTA .

Si ambas variables viniesen expresadas en euros, un incremento de renta de 1
supondra un incremento medio en el consumo de 0,37 .
89

Efecto marginal 2 .
Obsrvese que este valor es constante.

-
Elasticidad
dY Y
dY X
X
2 .
dX X dX Y
Y
El valor de la elasticidad en el modelo lineal es variable, dependiendo de los

valores del par de observaciones concreto de X e Y que se considere. Por este
motivo, se suele hablar de la elasticidad media, que no es sino el valor de la
elasticidad correspondiente a los valores medios de X e Y .
Modelo log-log o log-lineal
Este modelo puede proceder originariamente de un modelo potencial. As, si se parte

de
ste:
Yi 1 X i 2 e ui ,
tomando
logaritmos
podemos
llegar
a:
ln Yi ln 1 2 ln X i u i . Si hacemos que: ln 1 1 y 2 2 , entonces

tendremos finalmente la expresin del modelo log-log, o tambin llamado loglineal, o incluso doble log:
ln Yi 1 2 ln X i u i , donde i 1, , n .
1
dY
d ln Y
Y dY Y .
El coeficiente de regresin 2 expresa: 2

1
d ln X
dX X
dX
X
Su interpretacin podra verse con: ln CONSUMO 4,37 0,1582 ln RENTA .
Un incremento del 1% en la renta supone un incremento medio en el consumo
del 0,1582%.
Elasticidad 2 .
Obsrvese que este valor es constante.

-
Efecto marginal
dY Y Y
dY
Y
2 .
dX dX X X
X
El valor del efecto marginal en este modelo es variable, dependiendo de los

valores del par de observaciones concreto de X e Y que se considere. Por este
motivo, se suele hablar del efecto marginal medio, que es el que corresponde a
los valores medios de X e Y .
90

Modelos semi-logartmicos
Dentro de stos, pueden considerarse dos tipos: log-lin y lin-log.

-
Modelo log-lin.
Este modelo puede proceder en su origen de un modelo exponencial. De este modo,

partiendo de ste: Yi 1 2
Xi
e ui , tomando logaritmos se puede llegar a:
ln Yi ln 1 ln 2 X i u i . Si hacemos que: ln 1 1 y ln 2 2 , entonces se

llegar finalmente a la expresin del modelo log-lin:
ln Yi 1 2 X i u i , donde i 1, , n .
1
d ln Y dY Y dY Y
Su coeficiente de regresin 2 expresa: 2

.
dX
dX
dX
Su interpretacin puede verse mediante: ln CONSUMO 8,23 0,0023RENTA .
Un incremento de renta de 1 supone un incremento medio en el consumo del
0,23%.
Efecto marginal
dY dY Y
Y 2 Y .
dX
dX
El valor del efecto marginal en este modelo depende del valor concreto de Y
que se considere. Por ello, suele hablarse del efecto marginal medio, que es el
que corresponde con el valor medio de dicha variable.
-
Elasticidad
dY Y
dY Y
X 2 X .
dX X
dX
El valor de la elasticidad tambin es variable, dependiendo del valor concreto

que se tome de X . Debido a ello, suele hablarse de la elasticidad media,
correspondiente al valor medio de X .
-
Modelo lin-log.
La expresin de este modelo es: Yi 1 2 ln X i u i , donde i 1, , n .

-
El coeficiente de regresin 2 expresa aqu: 2
dY
d ln X
dY
dX
1
X
dY
.
dX X
Sobre su interpretacin, considrese: CONSUMO 1,23 348,27 ln RENTA .

Un incremento de renta del 1% supone un incremento medio de 3,4827 en el
consumo.
91

Efecto marginal
dY
dY
1
1
2 .
dX dX X X
X
El valor del efecto marginal en este modelo depende del valor concreto de X
que se tome. Debido a esto, suele hablarse del efecto marginal medio, que es el
que corresponde con el valor medio de X .
-
Elasticidad
dY Y
dY
1
1
2 .
dX X dX X Y
Y
El valor de la elasticidad depende del valor concreto de Y que se considere. Por

esta razn, se suele hablar de la elasticidad media, que es la correspondiente al
valor medio de dicha variable.
Modelo recproco
Este modelo viene expresado a travs de la forma funcional:

1
Yi 1 2
Xi
u i , donde i 1,, n .
Su coeficiente de regresin nos da: 2
dY
dY
.
1 dX X 2
d
X
La interpretacin de 2 no resulta inmediata en este modelo, por lo que la

obviaremos.
-
Efecto marginal
dY
dY
1
1
2 2 .
2
2
dX dX X X
X
El valor del efecto marginal en este caso depende del valor concreto que adopte
X . Por ello, suele considerarse el efecto marginal medio, que es el relativo al
valor medio de dicha variable.
-
Elasticidad
dY Y
dY
dX X dX X 2
1
1
2
.
XY
XY
El valor de la elasticidad en el modelo recproco tambin es variable,

dependiendo de los valores del par de observaciones concreto de X e Y que se
considere. Por este motivo, se suele hablar de la elasticidad media, que es la que
corresponde a los valores medios de X e Y .
92

Comparacin entre modelos
Para poder comparar modelos alternativos y elegir qu opcin resulta mejor, debemos
fijarnos en dos aspectos esenciales:
El nmero de variables explicativas.
La unidad de medida de la variable dependiente.
Los indicadores ms habituales para la comparacin de modelos son:

1. El coeficiente de determinacin: R 2 , que evala la bondad del ajuste de un modelo,
siendo el ajuste tanto mejor cuanto ms cercano a 1 sea su valor.
2. El coeficiente de determinacin corregido o ajustado: Rc2 , que evala de igual modo
la bondad del ajuste de un modelo, pero teniendo en cuenta los grados de libertad de
ste, y que seala tambin que el ajuste es tanto mejor cuanto ms cercano a 1 sea su
valor.
3. El criterio de informacin de Akaike: AIC, que expresa que el ajuste de un modelo
es tanto mejor cuanto menor sea el valor de este estadstico.
Ya sabemos que cuando se consideran modelos donde la variable dependiente es la
misma y tienen igual nmero de variables explicativas, puede emplearse el coeficiente
de determinacin R 2 para su comparacin y dilucidar de este modo qu modelo es el
que presenta un mejor ajuste.
Por su parte, en el caso de modelos anidados, considerando la misma variable
dependiente, debe utilizarse el coeficiente de determinacin corregido Rc2 . Como es ya
sabido, este coeficiente penaliza el aumento de la capacidad explicativa del modelo
(resultante de aadir nuevas variables) por el hecho de la prdida de grados de libertad
en el mismo.
La comparacin de modelos lineales y logartmicos no puede realizarse, en cambio, de
forma directa, puesto que la unidad de medida de la variable dependiente es distinta: en
un caso se trata de Y , mientras que en el otro se refiere a ln Y . Una forma de comparar
los resultados del ajuste de modelos lineales y no lineales es a travs del AIC.
En concreto habra que comparar el valor del AIC del modelo en el que Y fuese lineal,
con el de un AIC* transformado para el caso del modelo en el que se considerase el
ln Y . Este AIC* se obtendra del siguiente modo:
AIC* AIC 2 ln Y
93

Ejemplo
La siguiente tabla muestra los valores de los indicadores comentados para la relacin
entre las variables CONSUMO y RENTA, segn las distintas formas funcionales
consideradas:
Modelo
Rc2
R2
AIC
Lineal
0,458367 0,444113
5,2374
Log-log
0,518989 0,506331
0,2364
Lin-log
0,456735 0,442439
5,2404
Log-lin
0,497778 0,484561
0,2794
Recproco 0,428070 0,413019
5,2918
En este ejemplo el nmero de variables explicativas es siempre el mismo en los

diferentes modelos planteados; sin embargo, la variable dependiente en ocasiones es
CONSUMO y en otras es ln CONSUMO.
Teniendo en cuenta esto, se pueden comparar directamente entre s, mediante el
coeficiente de determinacin R 2 , los modelos lineal, lin-log y recproco (cuya variable
explicada es en todos ellos CONSUMO). De ellos, el mejor ajuste correspondera al
modelo lineal: 0,458367.
De igual forma, tambin se podran comparar entre s los modelos log-log y log-lin (ya
que en stos la variable explicada resulta ser ln CONSUMO). En este caso, el valor ms
alto de R 2 se registra en el modelo log-log: 0,518989.
Para poder, seguidamente, dilucidar qu modelo presenta en nuestro ejemplo un mejor
ajuste: el lineal o el log-log, deberamos hacer lo siguiente (sabiendo que el valor
medio 32 de la variable ln CONSUMO es 2,3719):
AIC* = 0,2364 + (2 . 2,3719) = 4,9802.

Una vez calculado AIC*, se puede comparar directamente con el AIC del modelo lineal.
En este caso, como 5,2374 (mod. lineal) > 4,9802 (mod. log-log), entonces el mejor
ajuste resulta ser el del modelo log-log, ya que presenta un valor menor.
32
Al igual que los coeficientes mostrados en la tabla de este ejemplo, este valor ha sido calculado de
forma externa a partir de los datos originales que se han empleado para el mismo.
94
INTRODUCCIN AL USO DE EVIEWS (I)

Introduccin al uso de EViews (I).En este apartado comenzamos nuestro aprendizaje del programa informtico
Econometric Views (ms conocido abreviadamente como EViews). En concreto, nos
vamos a centrar en su versin 3.1.
Nuestra primera aproximacin a este software de extendido uso en el mbito
economtrico, se va a estructurar en los siguientes puntos:
Acerca de EViews
Ficheros de trabajo (Workfiles)
Series de datos: introduccin e importacin
Anlisis de una serie de datos
Estimacin de un modelo lineal por MCO
Ejemplo de estimacin de un modelo no lineal por MCO: el modelo log-log
Cmo guardar un archivo de trabajo
Acerca de EViews
Al iniciar una sesin de EViews, la primera imagen que aparece es la pantalla que se
muestra en la Figura 1, donde se recogen diversas informaciones.
Ventana
de
Barra
principal de
rea de
Lnea de
Figura 1
95

En la parte superior se nos muestra una barra de color azul con el ttulo del programa y a
continuacin la barra principal de mens. La franja blanca que aparece bajo la barra
principal de mens se denomina ventana de comandos y permite trabajar en EViews
introduciendo directamente los comandos necesarios, ejecutndolos posteriormente con
la tecla Enter.
En la parte inferior de la pantalla, se encuentra la llamada lnea de estado donde se
especifica, por ejemplo, el directorio donde por defecto se guardar el archivo en curso
o en el caso de haber iniciado la sesin, si tenemos o no un fichero de trabajo en
memoria (WF = none).
La zona amplia de color gris es el rea de trabajo donde EViews ir desplegando las
ventanas que vayamos utilizando a medida que sea necesario en el transcurso de la
sesin.
Elementos de la barra principal de mens (Men principal de EViews)
File; Incluye las operaciones usuales relacionadas con ficheros, datos y programas
dentro de un entorno Windows: abrir y cerrar ficheros de trabajo nuevos y ya
guardados anteriormente, guardar ficheros de trabajo, imprimirlos, importar ficheros
desde una hoja de clculo o base de datos o exportarlos hacia una hoja de clculo o
base de datos, salir del programa EViews, etc.
Edit; Contiene las operaciones bsicas (cortar, copiar, pegar, deshacer, buscar,
reemplazar, etc.) de cualquier programa en entorno Windows.
Objects; Contiene las funciones para manejar los distintos objetos que se almacenan
en un fichero de trabajo: borrar, nombrar, imprimir, importar, etc.
View; Para habilitar este men desplegable es necesario antes abrir un fichero de
trabajo (o Workfile). En funcin del tipo de ventana activa en cada caso, se
obtendrn diferentes aspectos relacionados con la visualizacin en pantalla.
Procs; Contiene las operaciones relacionadas con series de datos principalmente. De
nuevo en este caso y al igual que en la opcin VIEW es necesario tener un fichero
de trabajo abierto para habilitar el men desplegable, el cual ser distinto segn la
ventana activa que utilicemos. En este men podremos seleccionar una muestra de
los datos, ordenarlos, generar nuevas series a partir de otras ya existentes, importar y
exportar series de datos, as como cambiar el rango poblacional de las series.
Quick; Proporciona acceso directo a los comandos que se utilizan con mayor
frecuencia: generar series a partir de otras ya existentes, seleccionar una muestra,
representar grficamente las series de datos, editar las series, estimar modelos de
regresin por MCO, representar las series a travs de histogramas y sus estadsticos
ms representativos (media, mediana, curtosis, etc.), hallar las matrices de
covarianzas y de correlaciones en un modelo de regresin, aplicar diversos mtodos
de tratamiento de series temporales (alisado exponencial, test de races unitarias,
96

correlogramas, test de causalidad de Granger, test de cointegracin, etc.) y estimar

modelos VAR, entre otros. Al igual que en las opciones VIEW y PROCS, es
necesario tener un fichero de trabajo abierto para habilitar el men desplegable, el
cual ser distinto segn la ventana activa que utilicemos.
Options; Contiene los parmetros de funcionamiento general de EViews. Por
ejemplo, el tamao y las fuentes de las ventanas de resultados que obtendremos al
estimar modelos (Window and Font Options), el comando que permite a EViews
guardar la ltima versin actualizada de nuestro fichero de trabajo (Backup files), el
nmero de iteraciones y grado de convergencia en procesos de estimacin iterativos
tales como el mtodo de Cochrane-Orcutt en la autocorrelacin (Estimation
Defaults), tamao, colores y fuentes de los grficos (Graphic Defaults), etc.
Window; Proporciona acceso directo a las distintas ventanas que tengamos abiertas
durante la sesin de trabajo.
Help; Es el men de ayuda usual de un entorno Windows. Se organiza de acuerdo
con varias opciones: referencias a objetos, comandos, funciones, matrices y
programacin. Adems, en cada una de ellas se puede hacer uso de la ayuda en
funcin de un ndice, una pgina de contenido y una opcin de bsqueda,
constituyendo una completa base de consulta de los ms variados mtodos
economtricos que EViews es capaz de aplicar.
Ficheros de trabajo (Workfiles)
El elemento bsico de EViews es el fichero de trabajo o WORKFILE; por ello, el primer

paso antes de empezar a trabajar con este programa es la creacin de un fichero de
trabajo. Para crear un fichero de trabajo seleccionamos dentro del men principal:
FILE / NEW / WORKFILE

De este modo nos aparecer en pantalla (Figura 2) un men llamado Rango del Fichero
de Trabajo (Workfile Range).
Aqu debemos especificar la frecuencia de los datos (anuales, semestrales, trimestrales,
mensuales, semanales, diarios para semanas de 5 7 das; o bien, datos irregulares o sin
periodicidad especfica). En series temporales, la fecha inicial (Start date) y la final
(End date) permiten definir el rango en el que deber moverse la serie, teniendo en
cuenta que deber incluirse el periodo de prediccin, puesto que EViews no admitir
datos para series que superen el rango establecido pero s que sean inferiores.
Al seleccionar, por ejemplo, la opcin de frecuencia trimestral (Quarterly) e indicar la
fecha de inicio como 1980:1 y 2005:4 como fecha final, se creara una sesin de trabajo
con datos trimestrales cuyos valores extremos deberan situarse entre el primer trimestre
del ao 1980 y el cuarto trimestre de 2005.
97

Figura 2
El problema que vamos a plantear en esta sesin de trabajo es el Ejercicio n 10 del
Boletn del Tema 3, que nos ofrece datos de 20 valores contables y de mercado de las
acciones correspondientes a otros tantos bancos espaoles en un da determinado de
agosto de 1995 (es decir, se trata de datos de corte transversal o no temporales). Nuestro
objetivo ser tratar de establecer una relacin economtrica entre el valor de mercado de
las acciones de los bancos y sus respectivos valores contables.
Por tanto, en la opcin del men que se nos ha abierto elegiremos Undated or irregular
y, seguidamente, escribiremos: 1 en Start observation; y 20 en End observation, tal y
como se indica en la Figura 3. Tras esto, nos aparecer la VENTANA DEL FICHERO
DE TRABAJO (Workfile: UNTITLED). Esto se puede ver en la Figura 4.
En esta ventana, RANGE mostrar el rango en el que toda la serie de datos debe
moverse; en cambio SAMPLE sealar el periodo o muestra concreta que se utiliza en el
estudio. Aunque inicialmente ambos se igualan, es muy habitual que la muestra se
cambie durante la sesin de trabajo para adecuarla a cada clculo que se desee realizar.
El espacio en blanco en la ventana es el DIRECTORIO DE OBJETOS en el que irn
apareciendo todos los objetos del fichero de trabajo con su nombre correspondiente y un
icono que indica de qu tipo de objeto se trata: vector de coeficientes de regresin,
ecuacin, grfico, grupo de series, matrices, modelos, series, datos de panel, tablas, etc.
Por defecto, aqu siempre aparecern dos elementos: un vector de coeficientes de
regresin denominado c y representado por , que incluir los coeficientes estimados de
98

la ltima ecuacin activa; y una serie llamada resid que, como su propio nombre
sugiere, est destinada a guardar los residuos de la ltima ecuacin estimada.
Figura 3
Figura 4
99

La ventana del Fichero de Trabajo contiene, adems, una barra de mens propia cuyos
elementos describiremos brevemente:
View, Procs y Objects; Nos proporcionan los mismos mens desplegables que
vimos en la barra de mens principal de EViews.
Save; Permite guardar el fichero de trabajo en uso en el disco duro o en una unidad
externa de almacenamiento (disquete, CD, pen-drive).
Label +/-; Permite visualizar el detalle de los objetos que se presentan en la ventana
de trabajo, as como fecha y hora de creacin.
Show; Permite visualizar una serie de datos, una lista de series y grficos en una
misma ventana o una serie generada a travs de una frmula apropiada.
Fetch; Permite importar objetos tales como ecuaciones estimadas, series de datos o
grficos de otro fichero de trabajo distinto de EViews, que hayamos almacenado
previamente.
Store; Permite exportar objetos tales como ecuaciones estimadas, series de datos o
grficos a otro fichero de trabajo distinto de EViews, que hayamos almacenado
previamente.
Delete; Permite borrar cualquier objeto que est en la ventana del fichero de trabajo.
Genr; Permite generar cualquier serie de datos a partir de una operacin con otras
ya establecidas.
Sample; Permite seleccionar la amplitud de la muestra dentro del rango que se ha
especificado para el fichero de trabajo.
Llegados a este punto, ya estamos en condiciones de empezar a trabajar con series de

datos y de iniciar nuestra sesin de trabajo.
La opcin puede ser doble: crear una nueva serie, o bien importarla desde otro fichero
de trabajo de EViews o de cualquier base de datos u hoja de clculo, como por ejemplo
Excel.
A continuacin vamos a explicar el procedimiento para introducir nuevas series, aunque
posteriormente optaremos, para trabajar con los datos del Ejercicio n 10, por la
importacin del fichero Agosto95.xls, que previamente deberemos descargar en el
Escritorio de nuestro PC desde el espacio reservado a la Asignatura en la plataforma de
docencia virtual WebCT.
Series de datos: introduccin e importacin
Para la introduccin directa de los datos, a modo de ejemplo, haremos lo siguiente:
En la opcin OBJECTS del men de Workfile se selecciona NEW OBJECT, lo que

dar lugar a una ventana (Figura 5) donde podemos elegir entre diversas opciones:
100

series, ecuaciones, grficos, etc., y nombrarlos como creamos oportuno. En este

punto, se selecciona SERIES y le damos el nombre CONSUMO (sobrescribiendo en
Untitled). Se pueden aadir etiquetas que ayuden a describir el contenido de las
series; ello se hace abriendo la serie CONSUMO (haciendo clic en ella) y
pulsando a continuacin la opcin NAME en la ventana correspondiente.
Finalmente, se pulsa OK. El resultado de lo realizado puede verse posteriormente
pulsando LABEL +/- en la ventana de trabajo.
Una vez creada la serie CONSUMO, introduciremos los datos; por ejemplo:
CONSUMO
125
205
333
214
512
Para ello, podemos hacer doble clic sobre la nueva serie CONSUMO que aparece
junto a c y resid en el Directorio de Objetos de Workfile. Tras abrirse la ventana
correspondiente, pulsaremos en EDIT +/- para poder comenzar a introducir los
datos. La pantalla deber quedar finalmente como aparece en la Figura 6.
Obsrvese cmo antes de introducir los datos, la serie no tiene todava valores,
como lo indica su referencia NA (Not Available).
Un ltimo aspecto que debemos resear aqu es que en EViews los decimales estn
en notacin anglosajona, es decir, precedidos de un punto.
Figura 5
101

Figura 6
Despus de haber visto este breve ejemplo de introduccin directa de datos en EViews,
pasamos ya a resolver nuestro ejercicio. Cerramos entonces la ventana de trabajo de la
serie CONSUMO (e incluso, si queremos, podemos eliminarla situndonos sobre ella y
pulsando la opcin DELETE en el men de Workfile).
Los datos relativos al problema sobre los valores bancarios que queremos analizar se
encuentran en un fichero de Excel, del que deberemos importarlos. Para ello, desde el
men principal del fichero de trabajo deberemos seleccionar la opcin: FILE / IMPORT
/ READ TEXT-LOTUS-EXCEL.
De este modo, se obtendr la pantalla que vemos en la Figura 7, donde se debe
especificar la ruta por la que se accede al fichero Agosto95.xls, que es la siguiente:
Escritorio \ Agosto95.xls
Tras haber seleccionado este fichero y pulsado la opcin ABRIR, obtendremos el men
desplegable correspondiente a la importacin de ficheros Excel (Excel Spreadsheet
Import).
En este men debemos atender a varias cuestiones importantes:
-
En la opcin Order of Data, el programa EViews nos permite especificar si los datos
que vamos a insertar de Excel estn ordenados por columnas (columns) o por filas
(rows). En este caso, seleccionamos la primera opcin.
En segundo lugar, debemos indicar a EViews en qu celda de Excel se sita el

primer dato de nuestras series (Upper-left data cell). Por defecto, nos propone B2 y
102

as lo vamos a aceptar puesto que el fichero est preparado en este sentido.

Igualmente, debemos indicar el nombre de la hoja donde estn nuestros datos (para
versiones de Excel superiores a la 5, y siempre y cuando haya datos en ms de una
hoja).
-
En tercer lugar, hemos de especificar el nombre de las series que vamos a utilizar o,
en su defecto, si el fichero Excel ya trae en su primera fila los nombres, slo el
nmero de series que vamos a importar. Como este ltimo es nuestro caso, slo
escribiremos en Names for series or Number of series if names in file un 2.
Por ltimo, debemos cerciorarnos de que tenemos correctamente especificada la

muestra de datos que queremos importar; esto es, en Sample to import debe figurar:
1 20.
La Figura 8 muestra el resultado final de la pantalla.

Una vez que hayamos seleccionado todos estos argumentos en este submen, estaremos
en condiciones de pulsar OK y proceder a la importacin de las dos series de datos de
nuestro ejercicio: VACC, como el valor de las acciones de los 20 bancos ms
importantes de Espaa; y VCON, como el valor contable de las acciones de dichos
bancos (ambas variables expresadas en la unidad monetaria de entonces; concretamente,
en millones de pesetas).
Figura 7
103

Figura 8
La Figura 9 representa el estado final de la ventana del fichero de trabajo despus de
importar los datos.
Figura 9
104

Anlisis de una serie de datos
El programa EViews nos ofrece la posibilidad de realizar un rpido anlisis

estadstico de nuestras series de datos.
Si hacemos, por ejemplo, doble clic sobre la serie VACC, aparecer, como ya
vimos antes con la serie CONSUMO, la ventana correspondiente de esta serie
(Figura 10).
Figura 10
En esta ventana surge una nueva barra de mens, cuyos componentes son: View,
Procs, Objects, Print, Name, Freeze, Edit+/-, Smpl+/-, Label+/-, Wide+-, InsDel,
Title, Sample y Genr. Cada uno de ellos, a su vez, contiene numerosas posibilidades.
La opcin VIEW resulta muy interesante. Permite, entre otras acciones (Figura 11):
La representacin grfica de la serie seleccionada en funcin de un grfico de

lneas o uno de barras: LINE GRAPH o BAR GRAPH, respectivamente.
El anlisis del histograma y los estadsticos descriptivos de la serie: media,

mediana, valor mximo, valor mnimo, desviacin tpica, coeficiente de
asimetra de Fisher y coeficiente de curtosis de Fisher, as como el estadstico de
Jarque-Bera, que permite contrastar la normalidad de la serie en cuestin.
Todo esto se hace a travs de: DESCRIPTIVE STATISTICS / HISTOGRAM
AND STATS. El resultado puede observarse en la Figura 12.
Otras posibilidades de esta opcin del men, tales como CORRELOGRAM, se

vern ms adelante.
105

Tras realizar cualquiera de las acciones indicadas en VIEW, puede que queramos
volver al listado de datos de la variable. En este caso, bastar con elegir
SPREADSHEET.
Figura 11
Figura 12
106

Estimacin de un modelo lineal por MCO
El presente ejercicio trata de plantear la existencia de una relacin economtrica entre el

valor de las acciones de mercado de 20 bancos en un da determinado y sus
correspondientes valores contables. En concreto, estableceremos una relacin lineal.
En principio, sera interesante conocer la representacin grfica de la nube de puntos
con objeto de tener una idea de la idoneidad o no de la forma lineal que vamos a
plantear. Para ello, en la barra principal de mens seleccionaremos QUICK / GRAPH.
Se crear as una nueva ventana (Figura 13) en la que escribiremos en primer lugar la
variable independiente y luego la dependiente (en nuestro caso, VCON y VACC,
respectivamente). Tras pulsar OK, se nos abrir un nuevo cuadro de dilogo en el que
podremos indicar el tipo de grfico que queremos: aqu elegiremos Scatter Diagram (es
decir, grfico de dispersin o nube de puntos). Antes de aceptar, podemos pulsar SHOW
OPTIONS y seleccionar Regression line; de este modo, el programa nos trazar tambin
la recta de regresin que mejor se ajustara a la nube de puntos (Figura 14). El resto de
opciones no las tocaremos.
Para concluir, pulsaremos OK. El resultado final es el que aparece en la Figura 15.
Si queremos guardarlo, basta con pulsar NAME y llamarlo, por ejemplo, NUBE. Se
crear as un objeto con formato grfico.
Figura 13
107

Figura 14
Figura 15
A continuacin, para obtener la recta estimada de regresin, seleccionamos la opcin
QUICK / ESTIMATE EQUATION en la barra principal de mens (Figura 16).
108

Figura 16
Como resultado, se obtiene la pantalla de Especificacin de la Ecuacin (Equation
Specification), donde deberemos atender a dos aspectos importantes:
Equation Specification; en este apartado debemos especificar la regresin lineal
que vamos a realizar. En primer lugar hay que escribir el nombre de la serie
que actuar como variable dependiente. Tras ello deberemos escribir,
separados por espacios, la relacin de variables independientes o explicativas
del modelo, comenzando por la constante u ordenada en el origen (que se
denota por la letra C) si deseamos que est presente en nuestro modelo.
As pues, dado que en este caso el modelo que planteamos es:
VACC 1 2VCON u ,
escribiremos entonces: VACC C VCON.

Estimation Settings; aqu se configuran las caractersticas de la estimacin,
seleccionndose tanto el mtodo de estimacin (MCO, mtodos para modelos
binarios, etc.), como la muestra a utilizar.
En nuestro caso elegiremos MCO, que en ingls es: LS (Least Squares).
Tras especificar la ecuacin y el mtodo de estimacin (Figura 17), pulsaremos OK,

obteniendo la Ventana de Ecuacin (Equation: Untitled), donde se muestran tres
tipos de resultados: los resultados bsicos del proceso de estimacin, las
estimaciones de los coeficientes de regresin y los estimadores destinados a estudiar
109

su significatividad y, finalmente, los estadsticos ms relevantes empleados en

cualquier mtodo economtrico (Figura 18).
Figura 17
Figura 18
110

Resultados bsicos del proceso de estimacin: (parte superior de la ventana)
El nombre de la variable dependiente o explicada de la ecuacin.

El mtodo de estimacin aplicado. En este caso, MCO: LS (Least Squares Method).
La fecha y hora de realizacin de la estimacin.
La muestra empleada en la estimacin.
El nmero de observaciones utilizadas en la estimacin.
Estimaciones de los coeficientes de regresin y estimadores relevantes para el

anlisis de su significatividad: (parte central de la ventana)
El nombre de las variables independientes o explicativas de la ecuacin.

Estimacin de los coeficientes de regresin asociados a las variables independientes
o explicativas (Coefficient: y , en este caso).
1
Estimacin de los errores estndar de los coeficientes de regresin (Std. Error).

El valor del estadstico t-Student bajo la hiptesis nula de no significatividad de la
variable correspondiente (t-Statistic).
Nivel de significacin mnimo al que se puede rechazar la hiptesis nula anterior
bajo el supuesto de que fuera cierta (Prob.). Es lo que se conoce como p-valor y nos
permite realizar un contraste sin necesidad de tablas estadsticas de distribucin de
probabilidades.
Estadsticos relevantes de la estimacin economtrica: (parte inferior de la ventana)
El valor del coeficiente de determinacin del modelo (R-Squared): R 2 .

El valor del coeficiente de determinacin corregido del modelo (Adjusted R-Squared): Rc2 .
Estimacin de la raz cuadrada positiva de la varianza (desviacin tpica o error
estndar) de la perturbacin aleatoria (S.E. of regresin: u ).
El valor de la suma de cuadrados residuales de la estimacin (Sum Squared Resid).
El valor del logaritmo de la funcin de verosimilitud sujeto al valor estimado de los
coeficientes de regresin (Log likelihood).
El valor del estadstico de Durbin-Watson, que permite la deteccin de problemas de
autocorrelacin en el modelo segn esquemas AR de orden 1 (Durbin-Watson stat).
El valor de la media de la variable dependiente (Mean dependent var).
El valor de la cuasi-desviacin tpica de la variable dependiente (S.D. dependent var).
El valor del estadstico del criterio de informacin de Akaike, el cual puede utilizarse
para elegir entre diversas especificaciones de modelos cuando la variable
111

dependiente presenta diferentes formas funcionales, o bien tambin para elegir entre
distintas especificaciones de modelos de eleccin discreta (Akaike info criterion).
El valor del estadstico del criterio de Schwarz, como alternativa al criterio de
informacin de Akaike (Schwarz criterion).
El valor del estadstico F de Fisher-Snedecor bajo la hiptesis nula de no
significatividad del modelo.
Nivel de significacin mnimo al que se puede rechazar la hiptesis nula de no
significativad del modelo bajo el supuesto de que fuera cierta (Prob.(F-statistic)). Es
el p-valor asociado a la significatividad global del modelo. Permite estudiar este
aspecto sin usar las tablas estadsticas de distribucin de probabilidades.
Esta ventana nos da una completa visin inicial del modelo especificado. En nuestro
ejemplo, si atendemos al signo del coeficiente de regresin estimado de VCON,
deducimos que la relacin entre las variables del modelo es directa (como cabra
esperar, segn la Teora Econmica), concretndose en que cuando el valor contable
se incrementa en 1 milln de pesetas, el de las acciones se incrementa por trmino
medio en casi 1,22 millones de pesetas (ntese que en el modelo lineal, el significado
de los coeficientes de regresin coincide con el concepto econmico de efecto
marginal). En cuanto a la bondad del ajuste muestral, tanto el valor del coeficiente de
determinacin (0,836480), como el del coeficiente de determinacin corregido
(0,827396), son bastante aceptables. Y en el terreno inferencial, que veremos en
breve, la variable explicativa resulta significativa, como evidencia el p-valor
asociado a su estadstico t-Student, o bien el estadstico F de significatividad global
del modelo (que en este caso, al tratarse de un modelo de regresin lineal simple,
coinciden en su significado).
Resulta conveniente guardar esta ventana como objeto para que a lo largo de la
sesin, cuando se desee, podamos recuperarla en la ventana del fichero de trabajo y
no haya que volver a realizar la estimacin. As, en la Ventana de Ecuacin
seleccionamos la opcin NAME y le damos un nombre; por ejemplo: VACC_VCON.
EViews, adems, nos permite conocer la serie de los residuos, la de los valores
estimados de la variable dependiente y la de los valores reales, comparndolas a su
vez en un grfico. Para ello, debemos seleccionar desde el men de la Ventana de
Ecuacin, la opcin VIEW, en la que aparecern a su vez varias opciones tales como
REPRESENTATIONS, que nos indica el modelo estimado o, entre otras: ACTUAL,
FITTED, RESIDUAL (Figura 19), donde podemos elegir entre cuatro ms detalladas:
Actual, Fitted, Residual Table; representa los valores reales (actual), estimados
(fitted) y los residuales (residual) en una tabla, junto con un grfico a su derecha.
Actual, Fitted, Residual Graph; representa grficamente los valores anteriores.
Residual Graph; representa grficamente slo la serie residual.
112

Standardized Residual Graph; representa grficamente los residuos tipificados.
Las Figuras 20 y 21 muestran, respectivamente, los resultados de elegir la primera y la

segunda de las opciones indicadas.
Figura 19
113

Figura 20
Figura 21
Otro resultado interesante es el clculo de la matriz de varianzas-covarianzas estimada
de los estimadores de los coeficientes de regresin (Figura 22).
114

Figura 22
Este resultado, muy til en los procesos de inferencia, se obtiene tambin a partir del
men VIEW; en concreto, pulsando dentro de l la opcin COVARIANCE MATRIX.
Ejemplo de estimacin de un modelo no lineal por MCO: el modelo log-log
En ocasiones, puede resultar que el modelo lineal no sea el ms adecuado para explicar
la relacin entre distintas variables. Modelos como el potencial, el exponencial u otros
no lineales, pero linealizables, pueden ser entonces opciones ms apropiadas. El carcter
linealizable de stos permite que a travs de determinadas transformaciones de las
variables originales se pueda llegar a una sencilla especificacin lineal. De este modo,
se obtienen modelos como el log-log, el log-lin o el lin-log.
Para poder estimar por MCO un modelo de estas caractersticas, debemos en primer
lugar definir las nuevas variables. EViews habilita la opcin GENR para generar
series a partir de otras ya existentes. Esta opcin se encuentra tanto en la ventana
principal del fichero de trabajo, como en la barra principal de mens: QUICK /
GENERATE SERIES.
En este punto vamos a plantear como ejemplo un modelo log-log para las variables
de nuestro ejercicio; es decir:
ln VACC 1 2 ln VCON u
Por tanto, tras seleccionar la referida opcin QUICK / GENERATE SERIES, en el

recuadro Enter equation escribiremos: LOGVACC = LOG(VACC), tal y como
aparece en la Figura 23. Al aceptar pulsando OK, se obtiene la nueva serie.
Debemos resear que LOGVACC es el nombre que nosotros hemos querido
asignar a la nueva serie; y puede cambiarse a gusto del usuario. Por su parte, en el
miembro de la derecha de la expresin (a partir del signo =) debemos escribir
necesariamente el nombre de la funcin matemtica correspondiente que entiende
EViews (en este caso, LOG), a partir de la cual se genera la nueva serie.
De igual forma, se deber proceder con la otra variable, VCON. Tendremos entonces
LOGVCON.
Una vez creadas las nuevas variables logartmicas, llevaremos a cabo la estimacin
del modelo de forma anloga a como se hizo anteriormente con el modelo lineal. Los
resultados obtenidos se muestran en la Figura 24.
Podemos luego grabar el modelo nombrndolo en NAME, por ejemplo,
LOGVACC_LOGVCON.
Recurdese que en un modelo log-log, los coeficientes de regresin expresan
elasticidades. Por tanto, en este caso, tendramos que cuando el valor contable se
115

incrementa un 1%, el valor de las acciones se incrementa por trmino medio casi un
0,94%.
Figura 23
Figura 24
116

Cmo guardar un archivo de trabajo
Concluida la sesin de trabajo, una de las maneras ms rpidas de salir de EViews y

guardar el fichero de trabajo es haciendo clic en el aspa de la esquina superior
derecha, como en cualquier otro programa que opera en el entorno Windows.
Otra forma es ir, en la barra de mens principal, a FILE / EXIT.
Antes de cerrarse, EViews proceder a confirmar si el usuario desea guardar el fichero, o
bien no guardarlo o no registrar los ltimos cambios en el caso de que ya existiera
(Figura 25).
Para finalizar, cabe sealar que los ficheros realizados en EViews se distinguen porque,
tras el nombre que les queramos dar, la terminacin o sufijo que los caracteriza es
.wf1.
Figura 25
117
EL MODELO CLSICO DE REGRESIN LINEAL: INFERENCIA Y PREDICCIN

TEMA 3
inferencia y prediccin
4.1.
Normalidad en las perturbaciones. Contraste de Jarque-Bera.-
Consideremos el modelo clsico de regresin lineal, en su expresin matricial:

Y X u . Como ya sabemos, la perturbacin u es un vector aleatorio que sigue una
distribucin de probabilidad normal: u N n ( ; u I ) .
2
Precisamente la normalidad de u es uno de los supuestos bsicos del modelo clsico de

regresin. A partir del mismo, hemos visto que tanto Y como el vector de coeficientes
de regresin estimados siguen tambin distribuciones de probabilidad normales. Y
sobre esta premisa veremos que se basa todo nuestro anlisis de inferencia estadstica
aplicado al modelo.
As pues, resulta esencial comprobar que u se comporta efectivamente siguiendo una
distribucin normal de probabilidad, pues de ello depender la validez de todas las
conclusiones que podamos extraer sobre los aspectos inferenciales del modelo.
Para llevar a cabo el estudio de la normalidad de u, se utiliza un contraste estadstico: el
contraste de Jarque-Bera.
Como en todo contraste de hiptesis, debemos establecer una hiptesis nula y, frente a
ella, una hiptesis alternativa. En particular, en este contraste, stas son:
H 0 : u Normal
H 1 : u No normal
Una vez definidas las hiptesis nula y alternativa, en un contraste es preciso tambin
establecer un estadstico de prueba, que tendr carcter aleatorio (tomando diferentes
valores segn la muestra que se considere) y seguir una determinada distribucin de
probabilidad. En este caso, el estadstico de Jarque-Bera sigue una distribucin chicuadrado con 2 grados de libertad, siendo su expresin:
2
JB
12 2 32
n
24
6
22 ,
donde n hace referencia al tamao muestral, 1 3 / 3 es el coeficiente de asimetra

de la distribucin y 2 4 / 4 es su coeficiente de curtosis.
En una distribucin normal, tendramos que 1 0 (al ser simtrica) y 2 3 , con lo
que si la perturbacin aleatoria cumpliese la hiptesis nula de normalidad, el estadstico
118

2
valdra 0 ( un valor muy prximo a 0); es decir, si la perturbacin es normal,
JB
2
tendr asociado un valor pequeo del estadstico JB
. Por tanto:
H 0 : u Normal
2
( JB
0)
H 1 : u No normal
2
( JB
0)
En este punto debemos de hacer una observacin importante. Nuestra variable objeto de
estudio es la perturbacin aleatoria; sin embargo, sta resulta inobservable, por lo que
no podremos analizarla directamente. Por ello, a la hora de estudiar u, tendremos que
recurrir a una estimacin de la misma: al residuo o error muestral. Recordemos que
ei u i . As pues, a la hora de la verdad nosotros estudiaremos la normalidad de los
residuos, en tanto que stos constituyen una estimacin muestral de las perturbaciones.
2
2
Si denotamos por JB
exp el valor que toma el estadstico JB para la serie de los
residuos de la muestra que estamos considerando; y por 22,1 el valor terico del
mismo para un nivel de significacin , entonces tendremos que:
2
2
Si JB
exp 2 ,1 , nos situaramos en la regin de aceptacin (RA) y, por tanto, no
habra evidencias para rechazar la hiptesis de normalidad de las perturbaciones;

esto es, asumiramos que stas siguen una distribucin normal.
2
2
Si JB
exp 2 ,1 , nos encontraramos en la regin crtica (RC) y rechazaramos la
hiptesis nula de normalidad de las perturbaciones.

Grficamente puede verse esto en la Figura 1.
2
JB
exp
RA
RC
22,1
Figura 1
119

4.2.
Intervalos de confianza.-
Intervalo de confianza para los coeficientes de regresin ( j )
Una vez obtenida, mediante MCO, la estimacin del vector de parmetros del modelo
de regresin , y para valorar si sta resulta ser una aproximacin adecuada de los
parmetros poblacionales , podramos en primera instancia atender a las propiedades
que posee este estimador calculado por el citado mtodo: es ELIO (esto es, resulta ser
lineal, insesgado y de mnima varianza, como ya se ha estudiado).
Una forma adicional de valorar la precisin de la estimacin consiste en establecer un
intervalo de confianza: un intervalo de valores dentro del cual consideramos que se
encuentran los parmetros poblacionales con un determinado nivel de confianza 33 .
Recordemos que el vector de estimadores es un vector aleatorio que sigue una
1
distribucin normal multivariante. En particular: N k ; u2 X ' X .
De este modo, la distribucin de cada uno de los coeficientes de regresin estimados

que conforma este vector ( j , j 1,2,..., k ) es: j N j ;Var ( j ) .
Var ( j ) es un elemento de la matriz de varianzas-covarianzas de ; en concreto, de su

diagonal principal:
2
Var Cov ( ) u ( X ' X ) 1
Var ( 1 ) Cov( 1 , 2 ) Cov( 1 , 3 )
Var ( 2 )
Cov( 2 , 3 )
Var ( j )
a11
a12
a 22
a13
a 23
Cov( 1 , k )
Cov( 2 , k )
Var ( k )
a1k
a 2k
.

a jj
a kk
Podemos recordar brevemente el concepto de intervalo de confianza: supongamos que es el

estimador puntual de . Nuestro objetivo ser determinar qu valores conforman el intervalo
, , de tal forma que la probabilidad de que contenga a sea 1 (nivel de confianza).
33
Si nos fijamos, la estimacin es el centro o pivote del intervalo y es un nmero positivo, es el radio de
dicho intervalo, que sumado y restado al valor central configura finalmente la amplitud del intervalo. El
valor de va a depender del nivel de confianza.
120

As, podremos escribir que:
j N j ; u2 . a jj , siendo a jj
el elemento j
correspondiente de la diagonal principal de la matriz (X ' X ) 1 .

Nuestro objetivo en este apartado es establecer un intervalo de confianza de j a partir
de su estimador j . Si nos fijamos en la expresin anterior, vemos que en la
caracterizacin de la distribucin de probabilidad normal de j figura el parmetro
poblacional, y por tanto desconocido, u2 . Esto supone un problema. En las siguientes
lneas vamos a proceder a realizar una serie de transformaciones que concluirn
finalmente con una nueva expresin donde aparecer la estimacin del mismo, lo cual
nos permitir poder trabajar con ella. Veremos, adems, cmo pasaremos de una
distribucin normal a una distribucin t-Student.
Consideremos la ltima expresin que hemos expuesto:
j N j ; u2 . a jj .
Tipificando esta variable aleatoria, tendramos que:
j j
u 2 . a jj
j j
Var ( j )
j j
ES ( j )
N (0,1) ,
donde ES ( j ) es el error estndar de j ; esto es, su desviacin tpica: la raz cuadrada

positiva de la varianza de j .
Por otro lado, tomemos en consideracin tambin el siguiente estadstico, ya conocido,
referido a u2 :
u2
(n k ) n2 k .
2
u
A partir de los dos ltimos estadsticos podemos generar un nuevo estadstico que
seguira una distribucin de probabilidad t-Student, con n k grados de libertad 34 ; en
concreto, dividiendo el estadstico normal entre la raz del cociente del estadstico chicuadrado entre sus grados de libertad:
Si atendemos a la definicin de una variable aleatoria que sigue una distribucin t-Student, tenemos:
que si se toman dos variables aleatorias independientes, Z y V , de modo que Z N (0,1) y V s2 ;
34
entonces, la variable aleatoria T
Z
V
s
se distribuye segn una t-Student con s grados de libertad.
Se representa por: T t s .
121

j j
j j
u 2 . a jj
u 2 . a jj
u2
(n k )
u2
u2
u2
j j
u 2 . a jj
j j
ES ( j )
nk
La expresin final de este estadstico la vamos a denotar por t j , de modo pues que:
t j
j j
tnk .
ES ( j )
Obsrvese que la diferencia entre este estadstico y el de la normal tipificada expuesta

anteriormente es que en su denominador aparece ahora no el error estndar de , sino
j
su estimacin, y ello es debido a que ya no se considera el parmetro poblacional u2 ,

sino su estimacin: u2 . De esta manera, cuando trabajemos con j , no lo haremos con
la distribucin de probabilidad normal (que es la propia suya), sino con la t-Student, ya
que as evitaremos tratar con un parmetro poblacional desconocido.
La Figura 2 muestra cmo es una funcin de densidad de una distribucin t-Student:
una funcin de dos colas y simtrica, siendo el eje de simetra el 0.
t j
/2
/2
a t n k , / 2
b t n k ,1 / 2
Figura 2
A partir de aqu, podemos deducir un intervalo de confianza para j , j 1,2,..., k .
122

Como se puede ver en la Figura 2: P a t j b 1 , donde es el nivel de

significacin y a b , dada la simetra de la funcin de densidad de la distribucin tStudent. Desarrollando esta expresin, tenemos entonces que:
P a t j b 1 P b t j b 1
j j
P t n k ,1 / 2
t n k ,1 / 2 1
ES ( j )
P t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1
P j t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1
P j t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1
P j t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1 .
Si nos fijamos, llegados a este punto ya tenemos definido el intervalo de confianza de

j , para un nivel de significacin :
j t n k ,1 / 2 ES ( j ) ; es decir:
j t n k ,1 / 2 ES ( j ), j t n k ,1 / 2 ES ( j )
Esto viene a decir que el parmetro poblacional j se encuentra contenido en este

intervalo 35 con un nivel de confianza cifrado en el (1 ).100 %.
35
Obsrvese cmo el centro o pivote del intervalo es la estimacin j del parmetro poblacional. Por su
parte, el radio del mismo viene dado por:
t n k , 1 / 2 ES ( j ) ,
que al sumarse y restarse a j , determinan finalmente el intervalo de confianza.
123

Intervalo de confianza para la varianza de la perturbacin aleatoria ( u2 )
El otro parmetro de inters en el modelo de regresin es la varianza de la perturbacin

aleatoria, u2 , cuya estimacin puntual ya se ha visto con anterioridad y para el que, de
igual modo, podemos establecer un intervalo de confianza, esta vez basndonos
directamente en la distribucin de probabilidad chi-cuadrado que tiene asociada:
2
2
u
u2
2 (n k ) n2k .
u
En la Figura 3 se muestra grficamente la distribucin de este estadstico:

Funcin de densidad chi-cuadrado
2
u
/2
/2
a n2k , / 2
b n2 k , 1 / 2
Figura 3
De aqu se deduce que:
P a 2 2 b 1
u
P n2 k , / 2 2 2 n2 k ,1 / 2
u
2
P n2 k , / 2 u2 (n k ) n2 k ,1 / 2 1
u
n2 k , / 2
n2 k ,1 / 2
1
P 2
2 2
1
u .(n k ) u u .(n k )
2 .(n k )
u2 .(n k )
2 .(n k )
2 .(n k )
P u 2
u2 u2
u2 u 2
P 2
1 .
n k ,1 / 2
n k , / 2
n k , / 2
n k ,1 / 2
124

As pues, el intervalo de confianza de u2 , para un nivel de significacin , es:
u2 .(n k ) u2 .(n k )
.
,
n2 k ,1 / 2 n2 k , / 2
El significado de este intervalo es anlogo al del desarrollado anteriormente para el caso

de los coeficientes de regresin del modelo.
Para concluir, puesto que: u2
SCR
nk
SCR u2 . (n k ) . De esta forma, el
intervalo de u2 tambin puede expresarse de manera que:
SCR
SCR
, 2
2
n k ,1 / 2 n k , / 2
4.3.
Contraste de significatividad individual de las variables

explicativas, de significatividad global del modelo, y general de
un conjunto de restricciones lineales. El modelo restringido.-
Volvemos a centrarnos en este apartado en los contrastes de hiptesis, todos ellos

referidos a los coeficientes de regresin del modelo.
Contraste de significatividad individual de las variables explicativas
Considrese el modelo economtrico clsico de regresin lineal mltiple:
Yi 1 2 X 2 i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
En este punto vamos a estudiar si la variable X j resulta significativa o no en el modelo;

es decir, si realmente dicha variable explica, al menos parte, del comportamiento de la
variable Y a nivel poblacional con un determinado nivel de error.
Para ello, planteamos la realizacin del siguiente contraste de hiptesis sobre el
coeficiente de regresin j que lo acompaa:
H0 : j 0
H1 : j 0
Si se acepta H 0 X j no sera relevante o significativa a la hora de explicar la

variable Y, ya que desaparecera de la especificacin del modelo.
Si se rechaza H 0 X j sera significativa, pues permanecera en el modelo.
125

Para llevar a cabo el contraste necesitamos un estadstico de prueba, que obtendremos

partiendo del estadstico t j que vimos en el apartado anterior:
t j
j j
tnk .
ES ( j )
Si asumimos como cierta la hiptesis nula ( j 0 ), y con los datos de la muestra que
estemos considerando, obtendremos un valor concreto para dicho estadstico: el
estadstico experimental, que adoptara la forma 36 :
exp
t nk .
ES ( j )
En la Figura 4 se puede ver la distribucin de este estadstico, mostrndose asimismo la
regin de aceptacin (RA) y la regin crtica (RC) (que en este caso estara conformada
por dos reas simtricas separadas, dado que estamos ante una distribucin t-Student),
que vendran delimitadas por los valores crticos t n*k , 1 / 2 y t n* k ,1 / 2 . stos ltimos
se estableceran a partir de los grados de libertad del modelo estudiado ( n k ) y del
nivel de significacin considerado.
t exp t n k
RA
1
RC
RC
/2
/2
t n* k ,1 / 2
t n*k ,1 / 2
Figura 4
36
Ntese que el estadstico de prueba podra igualmente utilizarse para cualquier otra hiptesis nula que
quisisemos contrastar en relacin a un valor concreto 0 del parmetro j ; esto es: H 0 : j 0 .
Tenida en cuenta la informacin muestral del caso concreto analizado, el estadstico experimental sera:
j 0
.
ES ( )
j
126

Segn esto, tendremos:
Si t exp t n k ,1 / 2 nos encontraramos en la regin de aceptacin y por tanto

no encontraramos evidencia para rechazar la hiptesis nula. Podramos, por tanto,
considerar que la variable X j no es significativa en el modelo.
Si t exp t n k ,1 / 2 nos encontraramos en la regin crtica y rechazaramos,

consecuentemente, la hiptesis nula. La variable X j sera, pues, significativa.
Para finalizar, podemos resear que, si se ha establecido el mismo nivel de significacin

, un intervalo de confianza de j nos ofrece un rango de valores para dicho
parmetro asumibles como hiptesis nulas, sin necesidad de llevar a cabo
explcitamente los contrastes correspondientes.
Contraste de significatividad global del modelo
Tomemos nuevamente en consideracin el modelo economtrico clsico de regresin

lineal mltiple:
Yi 1 2 X 2 i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
El contraste de significatividad global de un modelo pretende analizar si las variables

independientes son capaces de explicar de manera conjunta el comportamiento de la
variable Y. En este caso, las hiptesis nula y alternativa se expresan como sigue:
H0 : 2 0
3 0
......
k 0
H 1 : algn j 0,
j 2, ..., k
Si se acepta H 0 ninguna variable explicativa del modelo sera relevante; es

decir, no habra modelo: no sera significativo.
Si se rechaza H 0 tendramos que al menos una variable explicativa del modelo

sera relevante; es decir, habra modelo: ste sera significativo.
Con la informacin muestral del modelo que se estudie, el estadstico de prueba

experimental que se utiliza en este contraste es:
SCE / SCT
R2
k 1 F
k 1
k 1
k 1, n k .
SCR
SCR / SCT (1 R 2 )
nk
nk
nk
SCE
F exp
127

Segn puede observarse, este estadstico sigue una distribucin de probabilidad F de

Fisher-Snedecor. En la Figura 5 se muestra su funcin de densidad (positiva y de una
nica cola), as como la regin de aceptacin (RA) y la regin crtica (RC), que estn
delimitadas por el valor crtico Fk*11,n k . Este valor se fija a partir del nmero de
ecuaciones que tiene la hiptesis nula (que en este caso es k 1 ), de los grados de
libertad del modelo ( n k ) y del nivel de significacin que se establezca.
F exp Fk 1, n k
RA
RC
Fk*11,n k
Figura 5
De acuerdo con esto:
Si F exp Fk*11,n k estaramos en la regin de aceptacin y, en consecuencia, el

modelo no sera significativo en su conjunto.
Si F exp Fk*11,n k nos hallaramos en la regin crtica. En este caso, el modelo

s sera globalmente significativo.
Contraste general de un conjunto de restricciones lineales
Los dos contrastes que hasta el momento se han visto en este apartado sobre los
coeficientes de regresin del modelo, el de significatividad individual de los parmetros
y el de significatividad global del modelo, no dejan de ser dos contrastes particulares de
la generalidad de contrastes que pueden plantearse para dichos coeficientes.
En efecto, nuestro inters puede centrarse en comprobar si se cumplen una serie de
relaciones (siempre lineales) entre los coeficientes, que pueden venir dadas por 1
ecuacin, o por ms de 1.
Sea el modelo economtrico clsico de regresin lineal mltiple:
128

Yi 1 2 X 2 i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
Las hiptesis de nuestro contraste podran expresarse matricialmente, con carcter

general, de la forma:
H 0 : R r
H 1 : R r
donde R recoge combinaciones lineales de los parmetros j que conforman el
vector , siendo R la matriz de coeficientes reales de dichas combinaciones; por su
parte, r es una matriz-columna de nmeros reales.
En este caso general, el estadstico de prueba experimental que se utiliza es:
R r ' R X ' X R ' R r

1
F exp
SCR
Fq ,n k .
nk
Como sabemos, n k son los grados de libertad del modelo y q hace referencia al
nmero de ecuaciones o restricciones que forman la hiptesis nula a contrastar (nmero
de filas de R ), debiendo ser linealmente independientes y verificar que: q k .
Obsrvese que, si desarrollamos este estadstico de prueba, ste puede expresarse de
forma alternativa como sigue:
R r ' R X ' X R ' R r
F exp
SCR
R r ' R
2
u
R r ' R X ' X R ' R r
nk
X ' X 1 R '
2
u
R r R r ' R Var Cov R ' R r .

1
En este punto merece tambin hacer alusin al denominado estadstico de Wald (que es
utilizado por el programa EViews para llevar a cabo este tipo de contrastes). El
estadstico Fq , n k se construye a partir del cociente de dos variables aleatorias
independientes, cuyas distribuciones son del tipo chi-cuadrado con q y n k grados de
libertad, respectivamente. As:
R r
W R r ' R u2 X ' X R '

1
2
q
SCR
2
u
n2 k ,
donde W es el estadstico de Wald.

Si nos fijamos, en el estadstico W la varianza de las perturbaciones u2 es desconocida,
por lo que suele emplearse para realizar el contraste de hiptesis (y as lo hace EViews)
129

la distribucin lmite del estadstico de Wald. sta se puede definir de igual modo, slo
que utilizando la estimacin insesgada de la varianza de las perturbaciones por MCO,
esto es:
R r
1
W R r ' R u2 X ' X R '
2
q
En definitiva, si como hemos visto, el estadstico experimental F de Fisher-Snedecor se

poda escribir como:
F
entonces: F exp
exp
R r ' R
2
u
X ' X 1 R '
R r F
q , nk
W
; o lo que es lo mismo: W q F exp .
q
Los siguientes ejemplos pueden ayudarnos a entender bien quines son los distintos
elementos que intervienen en el estadstico de prueba de este contraste:
a) Supongamos el siguiente modelo: Yi 1 2 X 2i 3 X 3i u i .
La hiptesis nula 37 a contrastar podra ser: H 0 : 2 3 , que si la rehacemos para
que queden despejados los parmetros j , quedara: H 0 : 2 3 0 .
En este ejemplo, tenemos que q 1 y H 0 se podra expresar matricialmente de la
forma:
1

1 2 0 ,

3
R 0 1 1
siendo:
r 0
b) Planteemos este otro modelo: Yi 1 2 X 2i 3 X 3i 4 X 4i 5 X 5i u i .

En este caso, la hiptesis nula a contrastar podra estar conformada por 2
restricciones, esto es, q 2 , siendo:
H 0 : 2 3 3 4
1 2 5 3
Si despejamos los parmetros j hacia el miembro de la izquierda de las
ecuaciones, tenemos:
H 0 : 2 3 3 4 0
1 2 5 3
37
La hiptesis alternativa, lgicamente, sera el incumplimiento de la hiptesis nula.

130

La hiptesis nula se podra entonces expresar matricialmente del siguiente modo:

1

2
0 0
0 1 3 1
3 ,
0
0 2 3
1 0
4

5
donde:
0
0 1 3 1
R
0
0 2
1 0
0
r
3
La Figura 6 ofrece la funcin de densidad del estadstico de prueba experimental, junto

con la regin de aceptacin (RA) y la regin crtica (RC), las cuales vienen delimitadas
por el valor crtico Fq*, n1k . ste se obtiene a partir del nmero de restricciones que
configura la hiptesis nula (que hemos denominado de manera general q), de los grados
de libertad del modelo ( n k ) y del nivel de significacin que se considere.
As:
Si F exp Fq*, n1k aceptaramos la hiptesis nula que hubisemos establecido en

relacin a los coeficientes de regresin del modelo R r .
Si F exp Fq*, n1k rechazaramos dicha hiptesis nula.
F exp Fq , n k
RA
RC
Fq*, n1k
Figura 6
Para finalizar este punto, debemos resaltar que este estadstico que aqu hemos expuesto
sirve para contrastar cualquier hiptesis lineal que podamos plantearnos, incluidos los
131

contrastes de significatividad individual de los coeficientes de regresin 38 y el de

significatividad global del modelo que, como ya sealamos al principio, pueden verse
simplemente como casos particulares del caso general.
El modelo restringido
En este punto abordamos el estudio de los contrastes de hiptesis sobre los coeficientes
de regresin del modelo desde otra perspectiva. En particular, comparamos dos
modelos: uno, el original; y otro, que llamamos modelo restringido, que es aqul que
asume como cierta la hiptesis nula y la incorpora en su propia definicin.
Por ejemplo, sea el siguiente modelo: Yi 1 2 X 2i 3 X 3i 4 X 4i 5 X 5i u i .
Supongamos que nos planteamos contrastar para el mismo esta hiptesis nula:
H0 : 4 0
5 0
En este caso, el modelo: Yi 1 2 X 2i 3 X 3i u i , sera el modelo restringido, ya
que, si nos fijamos ha incluido en su definicin las 2 restricciones indicadas por la
hiptesis nula.
Por su parte, el modelo original lo podramos denominar modelo no restringido.
Si abordsemos el anlisis de ambos modelos a partir de este punto, podramos obtener
en cada uno de ellos toda su informacin caracterstica; en particular: sus coeficientes
estimados ( y ), sus sumas de cuadrados residuales (SCR y SCRr) o sus
r
coeficientes de determinacin ( R 2 y Rr2 ), donde el subndice r hace referencia al

modelo restringido frente al original o no restringido.
En este caso, podra comprobarse que el estadstico F de contraste general adopta las
siguientes expresiones:
R r ' R X ' X R ' R r

1
exp
SCR
SCRr SCR
nk
SCR
Rr2
(1 R )
nk
Fq , n k
nk
Al igual que en los contrastes anteriores, debemos nuevamente tener en cuenta la

funcin de densidad de la distribucin F de Fisher-Snedecor (Figura 7).
38
En el caso del contraste de significatividad individual de un parmetro j , si partisemos del
2j
estadstico F de prueba general, ste terminara adoptando la forma: F exp
F1, n k , el cual,
Var ( j )
si nos fijamos, coincide con el cuadrado del estadstico de prueba t; esto es: F
132
exp
t exp .
2

F exp Fq , n k
RA
RC
Fq*, n1k
Figura 7
A la vista de esto:
Si F exp Fq*, n1k nos encontraramos en la regin de aceptacin y, por tanto,

aceptaramos la hiptesis nula que hubisemos establecido en relacin a los
coeficientes de regresin del modelo.
Si F exp Fq*, n1k estaramos en la regin crtica y rechazaramos, pues, la

hiptesis nula.
4.4.
Contraste de Chow de cambio estructural.-
Un contraste de especial inters por la frecuencia con la que aparece en aplicaciones

empricas es el que se utiliza para analizar si bajo un conjunto de datos subyace una
nica estructura econmica o modelo, o si por el contrario, se puede considerar que es
divisible en dos o ms submuestras y que cada una de ellas ha sido generada por
estructuras distintas.
Este contraste se conoce como test de Chow, test de cambio estructural, o contraste de
estabilidad de los parmetros y pretende analizar la hiptesis nula de ausencia de
cambio estructural.
En el caso de que se est trabajando con datos de series temporales, se utiliza
habitualmente cuando se cuenta con informacin acerca de algn acontecimiento
relevante que se piensa que puede provocar una variacin estructural en un momento
del periodo muestral considerado y que, por tanto, tiene capacidad suficiente para
afectar a los parmetros o coeficientes del modelo. Sera el caso, por ejemplo, de
133

analizar cmo puede verse afectado un modelo de consumo en Espaa entre los aos
1990 y 2010 ante la entrada del euro en 2002; es decir, si este hecho supuso un cambio
en la estructura de consumo.
Este contraste se utiliza tambin frecuentemente con datos de corte transversal; en esta
ocasin, para comparar dos o ms grupos de la muestra. Por ejemplo, si se est
analizando un modelo que explique el salario y se quiere estudiar si su comportamiento
es el mismo para hombres y mujeres o si, por el contrario, el modelo debe ser diferente
para uno y otro caso. O, por poner otro ejemplo, en el caso de un modelo de consumo, si
se quisiera comparar si su estructura es la misma para residentes en zona urbana o no
urbana, etc.
As pues, el planteamiento de este tipo de contraste sera el siguiente:
H 0 : Ausencia de cambio estructural
H 1 : Existencia de cambio estructural
Si nos fijamos, la hiptesis nula contempla el caso en que un mismo modelo subyace
bajo el total de los datos de la muestra. Por el contrario, la hiptesis alternativa asumira
que seran precisas distintas estimaciones del modelo para cada uno de los periodos
temporales o divisiones transversales (segn el tipo de datos) considerados de la
muestra.
Es decir, supongamos el siguiente modelo general:
Yi 1 2 X 2i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, ..., n
Y queremos ver si (pensando que son datos temporales), ocurre en un momento

determinado un cierto hecho que nos lleva a plantearnos si se produce un cambio en la
estructura de dicho modelo, de forma que el problema analizado se explica mejor
mediante 2 modelos diferentes: uno para la etapa previa al hecho en cuestin y otro
correspondiente a la etapa posterior de dicho hecho.
La aceptacin de la hiptesis nula implica que el modelo original sera vlido para todas
las observaciones i del periodo muestral completo n.
Por el contrario, la hiptesis alternativa supone considerar dos subperiodos en la
muestra ( n1 y n2 , de forma que: n n1 n 2 ), cada uno de los cuales ha sido generado
por un modelo distinto. Tendramos as:
-
Subperiodo 1
Yi 1* 2* X 2i ... *j X ji ... k* X ki u i*
j 1, 2, ..., k
i 1, ..., n1
j 1, 2, ..., k
i n1 1,..., n
Subperiodo 2
Yi 1** 2** X 2i ... *j * X ji ... k** X ki u i**
134

Como se expuso en el apartado anterior, el modelo en el que se considera cierta la

hiptesis nula sera el modelo restringido (en este caso, el modelo original, vlido
para toda la muestra); por su parte, los modelos relativos a los dos superiodos, y que se
corresponden con la hiptesis alternativa, constituiran la especificacin sin restringir.
De este modo, podramos utilizar el estadstico F relativo a la realizacin de contrastes
desde la ptica del modelo restringido, de manera que tendramos:
SCRr SCR1 SCR2

F
exp
SCR1 SCR2
k F
k , n2 k ,
n 2k
donde SCRr es la suma de cuadrados residuales que corresponde al modelo de un nico

periodo muestral y SCR1 y SCR2 son las de los subperiodos 1 y 2, respectivamente. 39
Para finalizar, en el caso de que la hiptesis alternativa considere un nmero genrico
de h subperiodos o subdivisiones muestrales, en lugar de slo 2, la expresin general
del test de Chow sera:
SCRr SCR1 ... SCRh

F exp
SCR1 ... SCRh
(h 1)k
F( h 1) k , n hk .
n hk
La forma de llevar a cabo el contraste sera anloga a la ya explicada para los

estadsticos F ya vistos anteriormente en el presente Tema.
Es decir, atendiendo a la grfica de la funcin de densidad de la distribucin F de
Fisher-Snedecor (Figura 8), tendramos:
Si F exp F(*h 11)k , n hk estaramos en la regin de aceptacin y asumiramos que

hay ausencia de cambio estructural; esto es, que el modelo planteado es vlido para
la totalidad de la muestra.
Si F exp F(*h 11)k , n hk nos hallaramos en la regin crtica y concluiramos que

hay un cambio estructural en nuestra muestra, que nos aconseja considerar diversos
modelos, uno por cada subdivisin o periodo muestral tomado.
39
Obsrvese que en este contraste la hiptesis nula contiene una ecuacin por cada igualdad entre los
coeficientes de regresin asociados a una misma variable en cada subperiodo; esto es: q k . Igualmente,
los grados de libertad asociados al denominador de este estadstico son: n1 k para el caso del modelo
del primer subperiodo y n2 k , para el segundo; por tanto, la suma de ambos hace que sea: n 2k .
135

F exp F( h 1) k , n hk
RA
RC
F(*h 11)k , n hk
Figura 8
4.5.
Prediccin.-
Sea el modelo economtrico clsico de regresin lineal mltiple:

Yi 1 2 X 2 i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
Como sabemos, este modelo se puede expresar de manera matricial: Y X u .

Mediante el mtodo de MCO podemos estimar el modelo, por lo que tendremos:
Yi 1 2 X 2i ... j X ji ... k X ki
j 1, 2, ..., k
i 1, 2, ..., n .
O bien, matricialmente: Y X .
A partir del modelo estimado, si dispusisemos de una serie de valores concretos para
todas y cada una de las variables explicativas X j que conforman la matriz X,
podramos obtener una estimacin del valor de la variable dependiente Y.
Si tales valores de las variables independientes fuesen extra-muestrales, es decir, valores
distintos a los que integran la muestra objeto de estudio (que denotaremos de forma
general X ), entonces dicha estimacin de Y (que denotaremos por Y ) sera en
j 0
realidad una prediccin. sta podra plantearse tanto para series temporales (pensando
en la obtencin de un valor futuro de Y), como para datos transversales.
As, si nos facilitan la serie de valores extra-muestrales de las variables independientes
X 0 , tendramos:
136

X1 0 1
X2 0 X2 0
X0
Y0 X 0' .
Xk 0 Xk 0
La estimacin o prediccin, sin embargo, no ser completa si no viene acompaada de

un intervalo de confianza. Para ello, se precisa introducir el concepto de error de
prediccin puntual.
El error de prediccin puntual ( e0 ) se define como la diferencia entre el valor real de Y
correspondiente a los valores dados de las variables independientes ( Y0 ) y la prediccin
obtenida a partir de los mismos ( Y0 ); es decir:
e0 Y0 Y0 .
Si desarrollamos esta expresin, tenemos que:

e0 Y0 Y0 X 0' u 0 X 0' X 0' ( ) u 0 ,
de la cual podemos deducir cules son las fuentes del error de prediccin, esto es, de
dnde pueden provenir los errores o desviaciones que se produzcan a la hora de
contrastar la realidad con la estimacin. Tales fuentes son:
-
Errores en la informacin de partida de las variables explicativas: X 0 .
Errores en la estimacin de : .
Errores estocsticos procedentes de la perturbacin aleatoria: u 0
Asimismo, tambin se puede ver que, puesto que e0 depende de u 0 y sta tiene
naturaleza aleatoria, entonces e0 es una variable aleatoria; adems, dado que u 0 es
normal, entonces e0 sigue igualmente una distribucin normal de probabilidad y, como
tal, nos interesa conocer tanto su valor esperado como su varianza. stos resultan ser:
E e0 0
Var (e0 ) u2 1 X 0' ( X ' X ) 1 X 0 .
As pues, en definitiva: e0 N 0; u2 1 X 0' ( X ' X ) 1 X 0
De aqu, podemos establecer un intervalo de confianza para la prediccin, de forma

similar al referido a los coeficientes de regresin del modelo, ya visto.
En efecto, si tipificamos el error e0 , tendremos:
e0
u2 1 X 0' ( X ' X ) 1 X 0
137
e0
N 0,1 .
ES (e0 )

Con ello, junto con el estadstico:
u2
(n k ) n2 k ,
2
u
podramos generar un nuevo estadstico que seguira una distribucin de probabilidad tStudent, con n k grados de libertad:
e0
u2 1 X 0' ( X ' X ) 1 X 0
u2
(n k )
u2
e0
1 X 0 ( X ' X ) X 0
2
u
'
e0
t nk .
ES (e0 )
nk
Este estadstico resultante vamos a denotarlo por t e0 . En la Figura 9 se representa la
funcin de densidad que seguira.
t e0
/2
/2
b t n k ,1 / 2
b t n k ,1 / 2
Figura 9
Partiendo de aqu, podemos deducir un intervalo de confianza para la prediccin puntual
Y0 :
P b t e0 b 1
e0
P t n k ,1 / 2
t n k ,1 / 2 1
ES (e0 )
Y0 Y0
P t n k ,1 / 2
t n k ,1 / 2 1
ES (e0 )
138

P t n k ,1 / 2 ES (e0 ) Y0 Y0 t n k ,1 / 2 ES (e0 ) 1
P Y0 t n k ,1 / 2 ES (e0 ) Y0 Y0 t n k ,1 / 2 ES (e0 ) 1 .
En definitiva, el intervalo de confianza de Y0 , para un nivel de significacin es:
Y0 t n k ,1 / 2 ES (e0 ) ; es decir: Y0 t n k ,1 / 2 ES (e0 ), Y0 t n k ,1 / 2 ES (e0 ) .
Como sabemos, esto quiere decir que el valor real Y0 que se corresponda con la
observacin de nuestra prediccin se encuentra contenido en este intervalo con un nivel
de confianza cifrado en el (1 ).100 %.
Para concluir, podemos sealar las condiciones que deben cumplirse para que las
predicciones que llevemos a cabo sean fiables; seran:
-
Que la relacin lineal estimada entre Y y X se mantenga estable en el futuro (si

estamos trabajando con datos de series temporales) o fuera de la muestra (si estamos
considerando datos de corte transversal).
Que los coeficientes de regresin sean suficientemente estables como para que sus
estimaciones actuales muestrales sean una buena aproximacin a los valores
obtenidos tras incorporar observaciones futuras o extra-muestrales.
Que se conozcan los valores futuros o extra-muestrales de X, o que los modelos de

prediccin utilizados para su obtencin sean fiables.
Que no existan errores de especificacin en el modelo estimado.
Que el horizonte de prediccin no sea muy lejano.
139
INTRODUCCIN AL USO DE EVIEWS (II)

Introduccin al uso de EViews (II).Continuamos en este apartado profundizando en nuestro conocimiento del manejo de
EViews. En particular, veremos cmo se llevan a cabo los distintos contrastes de
hiptesis ms comnmente aplicados en el proceso de validacin de un modelo
economtrico y aprenderemos, asimismo, a realizar predicciones. Como primer paso
para desarrollar esta tarea, procederemos a establecer un modelo economtrico que nos
servir as de ejemplo.
Nuestra explicacin se va a estructurar siguiendo estos puntos:
Especificacin y estimacin del modelo
Contrastes de significatividad individual de las variables explicativas y contraste

de significatividad global del modelo
Contraste de normalidad de la perturbacin aleatoria del modelo
Contrastes de hiptesis sobre los coeficientes de regresin del modelo basados

en el test general de restricciones lineales
Contraste de estabilidad: test de cambio estructural de Chow
Estimacin y prediccin puntual de valores de la variable dependiente del

modelo
Especificacin y estimacin del modelo

La estimacin de un modelo economtrico es un proceso interactivo que empieza con la
especificacin de la relacin supuesta entre ciertas variables. La seleccin de una
especificacin adecuada del modelo requiere, generalmente, la consideracin de varias
posibilidades de estimacin. Por un lado, el nmero y tipo de variables a incluir, junto
con la forma funcional del modelo, y por otro, la estructura dinmica subyacente entre
las variables para el caso de series temporales. Evidentemente, siempre tendremos la
incertidumbre acerca de la idoneidad o no de esta especificacin inicial. Por ello, una
vez estimada la ecuacin, debemos proceder a evaluar la calidad de la misma mediante
la aplicacin de una serie de contrastes de hiptesis que garanticen la viabilidad de la
estructura estimada.
La mayor parte de los contrastes utilizados para validar un modelo se plantean bajo la
consideracin de una hiptesis nula, por lo que cuando se aplica uno de ellos, EViews
proporciona el valor del test estadstico en cuestin y la probabilidad asociada al mismo
(p-valor). Este ltimo valor indica el nivel de significacin mnimo (o si nos referimos a
1 p-valor, el nivel de confianza mximo) al que se puede rechazar la hiptesis nula
suponiendo que sta fuera cierta. O bien, el nivel de significacin mximo (o si nos
referimos a 1 p-valor, el nivel de confianza mnimo) al que se puede aceptar la
hiptesis nula suponiendo que sta fuera cierta.
140

As, un valor pequeo de esta probabilidad conduce a rechazar la hiptesis nula,

mientras que un valor elevado (siempre menor que 1) significa que aceptaremos la
hiptesis nula. Por ejemplo, un p-valor comprendido entre 0,05 y 0,01, implica rechazar
la hiptesis nula al 5% de nivel de significacin, pero no al 1%. Con este
procedimiento, EViews no precisara del manejo de tablas estadsticas para efectuar
contrastes de hiptesis.
Para utilizar los contrastes disponibles en EViews dirigidos a la evaluacin de un
modelo tras su estimacin, vamos a resolver el Ejercicio n 23 del Boletn del Tema 4.
Los datos del mismo estn disponibles en el archivo tests.wf1, por lo que previamente
deberemos descargarlo en el Escritorio de nuestro PC desde el espacio reservado a la
Asignatura en la plataforma de docencia virtual WebCT.
En dicho fichero aparecen las variables o series de datos siguientes, correspondientes al
periodo 1980-2007:
CONSUMO: Tasas de variacin anuales del consumo privado no alimenticio en
trminos reales de 1992
PRECIO: Tasas de variacin anuales de los precios del consumo privado no
alimenticio con base 1992
RENTA: Tasas de variacin anuales de la renta familiar disponible en trminos
reales de 1992
EMPLEO: Tasas de variacin anuales del empleo total
PRECA: Precariedad en el mercado de trabajo (porcentaje de contratos temporales
sobre total de contratos)
TIR: Tipos de inters reales en base 1992
A partir de ellas vamos a especificar, y seguidamente a estimar, un modelo donde la

variacin del consumo privado no alimenticio es explicada por las dems variables.
Al abrir el fichero tests.wf1 (y pulsar luego la opcin LABEL+/-), obtendremos la
pantalla de la Figura 1. Dado que el modelo que vamos a especificar con los datos
disponibles (1980-2007) se utilizar luego para realizar una prediccin para 2008,
obsrvese en RANGE cmo el fichero ya est preparado en este sentido.
A continuacin, procedemos al ajuste mnimo-cuadrtico del modelo. La
especificacin que vamos a plantear de nuestro modelo es:
CONSUMO 1 2 PRECIO 3 RENTA 4 EMPLEO 5 PRECA 6TIR u
Para realizar esta estimacin se selecciona QUICK / ESTIMATE EQUATION. La

ventana de dilogo que se abre entonces se cumplimenta como puede observarse en la
Figura 2.
141

Figura 1
Figura 2
La Figura 3 muestra los resultados obtenidos del modelo estimado. Podemos guardar
ste dndole un nombre; por ejemplo: REG. Lo haremos pulsando el botn NAME.
142

Figura 3
De estos resultados, lo primero que podemos resear es el signo de los coeficientes de
regresin estimados, el significado de tales coeficientes, as como la bondad del ajuste:
-
En efecto, parece que se ha obtenido una especificacin correcta del modelo en

cuanto a los signos de los parmetros se refiere. Desde el mbito terico, un
crecimiento de la renta y del empleo propiciarn un incremento del consumo no
alimenticio, mientras que un incremento de los precios, de la precariedad laboral y
de los tipos de inters contribuirn a retraer el consumo.
En cuanto a los parmetros estimados, dado como estn definidas las variables, en
este caso stos reflejan una aproximacin al concepto de elasticidad. As, el
coeficiente asociado a la renta familiar disponible representa la elasticidad renta del
consumo privado de productos no alimenticios; para nuestro caso, un crecimiento de
un 1% en la renta se traduce en un incremento de un 0,324123% en el consumo de
productos no alimenticios. El significado para el resto de variables es anlogo.
Respecto a la bondad del ajuste, los coeficientes de determinacin (0,893785) y de

determinacin corregido (0,869645) pueden considerarse aceptables.
Contrastes de significatividad individual de las variables explicativas y contraste

de significatividad global del modelo
Junto a los resultados anteriores, bsicos de la estimacin del modelo, la Figura 3

tambin nos ofrece la informacin precisa para realizar los contrastes de significatividad
143

individual de las variables explicativas y del contraste de significatividad global del

modelo:
-
La significatividad individual de las distintas variables explicativas del modelo

puede contrastarse a travs del p-valor asociado al estadstico t-Student de cada una
de ellas. Segn esto, todas son estadsticamente significativas a un nivel de
confianza del 95% (e incluso del 99%), a excepcin de TIR. Puesto que el nivel de
confianza mnimo para aceptar la hiptesis nula de no significatividad de la variable
de tipos de inters (TIR) es del 85,42% (la cifra complementaria al 14,58% que
aparece), podemos entonces suponer que dicha variable no va a tener efectos
relevantes sobre el consumo privado no alimenticio.
En cuanto a la significatividad conjunta o global del modelo, vemos que el p-valor

(0,000000) asociado al estadstico F de este contraste (37,02546) as lo evidencia;
esto es, el nivel de significacin mnimo para rechazar la hiptesis nula de no
significatividad del modelo suponiendo que sta fuese cierta es del 0,00%.
Contraste de normalidad de la perturbacin aleatoria del modelo
Como bien sabemos, uno de los pilares fundamentales sobre los que se sustenta la
construccin del modelo clsico de regresin lineal es el hecho de que la perturbacin
aleatoria siga una distribucin de probabilidad normal, puesto que en ello se basa todo
el desarrollo de la teora inferencial del modelo (contrastes e intervalos de confianza).
As pues, antes de seguir adelante debera contrastarse si, en efecto, la perturbacin de
nuestro modelo se comporta como una normal. Pero dado que la perturbacin es
aleatoria e inobservable por definicin, el estudio de su normalidad debe hacerse a partir
de una estimacin de la misma; la serie de los residuos o errores muestrales del modelo
constituye dicha estimacin.
Por tanto, nuestro objetivo en este punto ser analizar la normalidad de los residuos.
Este anlisis se realiza situndonos en la ventana de la ecuacin estimada, donde
seleccionaremos VIEW. De este modo se despliega un men en el que, entre otras,
tenemos las opciones siguientes para elegir:
Coefficient Tests; nos facilitar los instrumentos para realizar cualquier tipo de
contrastes de hiptesis nulas lineales sobre los coeficientes de regresin bien a
travs del estadstico de Wald o el de Fisher-Snedecor.
Residual Tests; presenta diversas opciones destinadas a realizar un anlisis
exhaustivo de los residuos y con ello de la perturbacin aleatoria del modelo:
normalidad, heteroscedasticidad, autocorrelacin
Stability Tests; ofrece la oportunidad de identificar cambios estructurales a travs
del Test de Chow, errores de especificacin general con el Test RESET de Ramsey y
analizar la inestabilidad de los parmetros utilizando los residuos recursivos.
144

En nuestro ejemplo, elegiremos RESIDUAL TESTS y luego HISTOGRAM-NORMALITY

TEST, segn aparece en la Figura 4. El resultado aparece en la Figura 5.
Figura 4
Figura 5
145

De esta salida, el aspecto que ms nos interesa en este punto es el relativo al contraste
de Jarque-Bera. Como ya sabemos, este contraste plantea como hiptesis nula la
normalidad de la serie de datos analizada, que en este caso es la de los residuos. De
acuerdo con el p-valor asociado al estadstico de Jarque-Bera, el nivel de confianza
mximo para rechazar la hiptesis nula es del 78,19%, por lo que incluso para un 90%
aceptaremos la hiptesis nula.
En definitiva, acabamos de contrastar que la serie de los residuos de la estimacin, y
con ello la perturbacin aleatoria del modelo, sigue una distribucin normal de
probabilidad.
Contrastes de hiptesis sobre los coeficientes de regresin del modelo basados en el

test general de restricciones lineales
Seguidamente vamos a realizar diversos contrastes de hiptesis lineales sobre los

coeficientes de regresin del modelo.
Como ya es sabido, para ello se puede utilizar tanto un estadstico Fq , n k de FisherSnedecor, como el estadstico W de Wald, que sigue una distribucin chi-cuadrado (en
concreto: W q2 ). Adems, se verifica que: W q F , siendo q el nmero de

restricciones o ecuaciones que conforman la hiptesis nula a contrastar.
En nuestro ejercicio podemos plantearnos, por ejemplo, si las elasticidades de la renta y
del empleo sobre el consumo son iguales. Para ello, estableceremos las hiptesis:
H 0 : 3 4
H1 : 3 4
Dentro de la ventana de la ecuacin REG, seleccionaremos nuevamente en la barra de
mens la opcin VIEW y despus COEFFICIENT TESTS, donde elegiremos WALDCOEFFICIENT RESTRICTIONS, segn se muestra en la Figura 6.
Aqu escribiremos la restriccin referida a la hiptesis nula (Figura 7).
Tras pulsar seguidamente OK, obtendremos la pantalla de resultados que aparece en la
Figura 8, donde puede verse, en primer lugar, cmo queda perfectamente indicada la
hiptesis nula que estamos verificando; en segundo lugar, el valor del estadstico F (que
sigue aqu una distribucin de Fisher-Snedecor con 1 y 22 grados de libertad) coincide
con el del estadstico 2 de Wald (con 1 grado de libertad), puesto que la hiptesis nula
slo se compone en este caso de 1 restriccin; y, finalmente, si atendemos a los pvalores asociados a cualquiera de los dos estadsticos indicados, veremos que podemos
aceptar la hiptesis nula a partir de un nivel de confianza de en torno al 5,3%. En
definitiva, a tenor de estos resultados podemos afirmar que ambas elasticidades son
prcticamente iguales.
146

Figura 6
Figura 7
147

Figura 8
Para aplicar este test en el caso en que se considere ms de una restriccin en la
hiptesis nula a contrastar, debemos separar stas entre comas al indicarlas en el cuadro
de dilogo del test.
Por ejemplo, podemos contrastar ahora que la suma de las elasticidades de la renta y el
empleo sea igual a 1, a la vez que el valor de la primera sea el doble que el de la
segunda; esto es:
H 0 : 3 4 1
3 2 4
H 1 : No se verifican a la vez
ambas restricciones
En la Figura 9 aparece el resultado de este contraste: el valor del estadstico de Wald en
este caso es el doble que el del estadstico F (pues ahora hay 2 restricciones en la
hiptesis nula) y la hiptesis nula se puede rechazar, atendiendo a cualquiera de los dos
estadsticos de prueba, para todos los niveles de significacin estndar en el mbito de
la Estadstica (incluso del 1%).
148

Figura 9
Contraste de estabilidad: test de cambio estructural de Chow
Para comprobar si la estructura estimada, definida por los coeficientes de regresin del
modelo, es constante en el tiempo, podemos aplicar el contraste de cambio estructural
de Chow.
Este tipo de contraste se recoge en el tercer grupo de contrastes definidos al inicio de
este ejercicio, de forma que accederemos a l a partir del men contenido en la ventana
de la ecuacin estimada, con VIEW / STABILITY TESTS / CHOW BREAKPOINT TEST.
Para realizar este contraste, es necesario definir un punto de corte de la muestra total, de
forma que ste la divida en dos submuestras. Este punto es escogido a priori por el
investigador, dependiendo de las circunstancias particulares de espacio y tiempo en que
se muevan las variables (crisis del petrleo, etc.), as como del objetivo del anlisis.
En el ejercicio que estamos desarrollando como ejemplo, vamos a comprobar si los
grandes eventos del ao 1992 en Espaa (Juegos Olmpicos de Barcelona y Exposicin
Universal de Sevilla) tuvieron algn efecto sobre el consumo de productos no
alimenticios. As pues, seleccionamos el Test de Chow e indicamos como punto de
corte: 1992 (Figura 10).
En este test, la hiptesis nula establece la ausencia de cambio estructural. El resultado
final aparece en la Figura 11.
149

Figura 10
Figura 11
150

Aunque EViews nos calcule de nuevo dos estadsticos, vamos a centrarnos esta vez
exclusivamente en el estadstico F de Fisher-Snedecor. Este estadstico se basa en la
comparacin entre la suma de los residuos al cuadrado de la regresin total (1980-2007)
y las correspondientes a las regresiones de las dos submuestras (1980-1991 y 19922007). El elevado p-valor obtenido nos conduce a aceptar la hiptesis nula de ausencia
de cambio estructural a un nivel mximo de significacin del 43,06%; es decir, el
consumo no alimenticio no presenta un comportamiento diferenciado en el transcurso
de todo el periodo.
Estimacin y prediccin puntual de valores de la variable dependiente del modelo
En este ltimo punto vamos a llevar a cabo una prediccin para el ao 2008 de la tasa de
variacin del consumo en productos no alimenticios, con base 1992, a partir de nuestra
especificacin del modelo. Para ello, se dispone de los datos correspondientes a 2008 de
las variables explicativas de dicho modelo:
PRECIO
RENTA
EMPLEO
PRECA
TIR
3,2348
2,8722
2,1521
35,0152
4,2807
Lo primero que deber hacerse es introducir las cifras indicadas para 2008 en todas y
cada una de las series correspondientes. Con este fin, deber irse abriendo cada serie y
pulsar EDIT +/- entre sus opciones, escribindose entonces la cifra en la posicin
sealada, tal y como se refleja en la Figura 12 para el caso de la variable PRECIO. (No
debe olvidarse que los decimales en EViews deben escribirse en notacin anglosajona,
es decir, tras un punto.) Despus de introducir cada cifra, pulsaremos nuevamente EDIT
+/- para bloquear la escritura y evitar modificar alguna otra cifra por error.
A continuacin se realiza la prediccin del valor de la cifra de consumo utilizando la
especificacin lineal del modelo; para ello habr de seleccionarse la ecuacin estimada
REG. Una vez abierta, se elige la opcin FORECAST, obteniendo una ventana en la que
deberemos dar un nombre a la nueva serie de los valores estimados de la variable
dependiente. Por defecto, EViews nombra a esta serie igual que a la serie original pero
aadindole al final una F (del ingls, forecast). En este caso, CONSUMOF.
Podemos dejar este nombre, pero puede cambiarse a gusto del investigador. Asimismo
deberemos elegir el rango de datos de la salida estimada. Aqu deber elegirse 1980
2008. Con ello, las cifras de 1980 a 2007 de la serie CONSUMOF sern datos
estimados, en tanto que la correspondiente a 2008 ser una verdadera prediccin extramuestral. Adems de ello, EViews permite crear la serie de errores estndar estimados
de los errores de prediccin puntual, que puede nombrarse como se desee (por ejemplo,
ESERRORF). Por lo dems, vamos a dejar las opciones sealadas por defecto. La
pantalla quedara tal como se indica en la Figura 13.
151

Figura 12
Figura 13
La Figura 14 muestra el resultado obtenido. En ella se ofrecen algunos estadsticos de
referencia para evaluar la estimacin-prediccin realizada (raz cuadrada del error
152

cuadrtico medio, error medio absoluto, etc.), as como el grfico de la misma y un

intervalo de confianza especfico (para una amplitud igual a dos veces la desviacin
tpica de la muestra; es decir, en torno al 95%).
Figura 14
Igualmente, resulta interesante ver la Figura 15, donde se representan grficamente para
el periodo 1980-2007 la serie de datos reales de las tasas de variaciones del consumo
con base 1992, conjuntamente con la de sus valores estimados a partir del modelo lineal
establecido (CONSUMO y CONSUMOF, respectivamente), as como la de los residuos
MCO resultantes tras el ajuste. Con ello podemos ver que dicho ajuste resulta bastante
bueno y tambin qu observaciones son las que presentan mayores desviaciones entre el
dato real y el estimado; esto es, dnde se registran los mayores residuos, siendo en este
caso los correspondientes a los aos 2003, 1981 y 1985. Esto se hace a travs de: VIEW
/ ACTUAL, FITTED, RESIDUAL / ACTUAL, FITTED, RESIDUAL GRAPH.
Por ltimo, podemos resear cmo en la ventana de trabajo puede observarse que
aparecen las nuevas series de datos CONSUMOF y ESERRORF generadas. Adems, si
se abre la primera de ellas (CONSUMOF), se podr comprobar que, junto con las
estimaciones de los datos que van de 1980 a 2007, para 2008 aparece un nuevo dato:
2,8033, que resulta ser en este caso una prediccin extra-muestral. Todo esto puede
apreciarse en la Figura 16.
Para finalizar, podemos guardar este fichero para su uso en una sesin de trabajo
posterior. Esto lo haremos yndonos a FILE / EXIT en la barra principal de mens. De
153

este modo, podremos aprovechar este mismo modelo para analizar ms adelante
posibles problemas que pudiese presentar.
Figura 15
Figura 16
154
EL MODELO CLSICO DE REGRESIN LINEAL: INCUMPLIMIENTO DE SUPUESTOS

TEMA 4
incumplimiento de supuestos
Hasta este momento hemos estado trabajando con un modelo de regresin lineal
perfecto, que posee toda una serie de propiedades sustentadas en un amplio conjunto
de supuestos de distinta naturaleza, estocsticos y no estocsticos. En este Tema vamos
a estudiar qu sucede en nuestro modelo clsico de regresin lineal cuando no se
cumplen todos los requisitos o supuestos descritos previamente. Analizaremos distintas
situaciones: problemas de errores de especificacin en el modelo (que pueden provenir
de diferentes causas), presencia de multicolinealidad entre las variables explicativas del
modelo y existencia de heteroscedasticidad y/o autocorrelacin en la perturbacin
aleatoria de ste.
5.1.
Errores de especificacin del modelo.-
La especificacin de un modelo constituye la primera fase, y fundamental, de todo el

proceso de anlisis de la realidad econmica a travs de la teora economtrica. Sin
embargo, en este primer paso puede que cometamos errores, originados por diferentes
fuentes, que condicionen gravemente los resultados finales de nuestra modelizacin.
En este apartado vamos a ir analizando, de manera muy sinttica, cada una de estas
posibles fuentes o causas que pueden dar lugar a errores de especificacin de nuestro
modelo.
Omisin de variables explicativas relevantes
Ante un problema de omisin de variables explicativas relevantes en la especificacin

del modelo:
-
En general, las estimaciones MCO de los coeficientes de regresin ( ) resultan

sesgadas e inconsistentes.
La varianza estimada de la perturbacin aleatoria ( u2 ) es sesgada.
Las varianzas estimadas de los coeficientes de regresin ( Var ( ) ) resultan ser

sesgadas, sobreestimando su verdadero valor. Esto hace que la construccin de
intervalos de confianza y la realizacin de contrastes de hiptesis no sea fiable, ya
que, por una parte, la amplitud de los intervalos de confianza aumenta y, por otra,
155

disminuye la potencia de los contrastes (es decir, aumenta la probabilidad de aceptar

hiptesis nulas aun siendo falsas).
Inclusin de variables explicativas irrelevantes
En el caso de que en el modelo se incluyan variables explicativas irrelevantes:

-
Los estimadores MCO de los coeficientes de regresin correctamente incluidos son

insesgados y consistentes. Por su parte, el valor esperado de los incorrectamente
incluidos ser 0, por lo que cabe prever que ante un contraste de su significatividad,
se evidencie que no lo son.
La varianza estimada de la perturbacin aleatoria ( u2 ) es insesgada.
Las varianzas estimadas de los coeficientes de regresin ( Var ( ) ) son ineficientes;

son, por lo general, mayores que lo que debieran ser. Los estimadores no son, por
tanto, ELIO, ya que son insesgados, pero no son los mejores.
Los procedimientos estndares de definicin de intervalos de confianza y contrastes

de hiptesis siguen siendo, pese a todo, vlidos en lneas generales, aunque no los
mejores posibles.
Adopcin de la forma funcional incorrecta
Si se elige la forma funcional equivocada, la principal consecuencia es que:

-
Los coeficientes estimados por MCO ( ) pueden ser estimaciones sesgadas de los
parmetros poblacionales del modelo que resultara ms adecuado en la realidad.
Errores de medicin
Errores de medicin en la variable explicada
Los estimadores MCO de los coeficientes ( ) son insesgados.
Sus varianzas son tambin insesgadas, aunque mayores que en el caso en que no
hubiera este error. As pues, los estimadores no son ELIO, pues no son eficientes.
Errores de medicin en las variables explicativas
Los estimadores MCO de los coeficientes ( ) son sesgados e inconsistentes.
ste es, por tanto, un problema ms grave que el caso anterior. Se podra trabajar
entonces, en lugar de con las variables verdaderas, con variables que fuesen
aproximaciones de stas (variables instrumentales o proxy).
156

Tests de deteccin de errores de especificacin
Seguidamente se exponen dos tests, muy generalizados, que permiten detectar la

presencia de algunos de los problemas de especificacin en un modelo:
Test de la F de comparacin entre modelos restringidos y sin restringir
Se utiliza bsicamente para contrastar los errores relativos a omisin de variables

relevantes o inclusin de variables irrelevantes. La hiptesis nula y el estadstico de
prueba experimental en este test son:
H 0 :m
F
exp
SCRr SCR / m
SCR / n k
Rr2 / m
1 R 2 /(n k ) Fm,nk ,
2
donde:
m es el vector de coeficientes correspondientes a las m variables incluidas de

ms u omitidas (segn el tipo de error que se contraste)
n = n de datos empleados en la modelizacin
k = n de variables explicativas (incluida la ordenada en el origen) del modelo
planteado de partida
Test RESET de Ramsey
Este test es un test general de mala especificacin de un modelo, aplicable para detectar
la omisin de variables relevantes y la eleccin de una forma funcional inadecuada. La
hiptesis nula es que el modelo de partida est bien especificado.
Los pasos que se siguen en este test son:
1. A partir del modelo inicialmente elegido, se obtienen los valores estimados de la
variable dependiente: Y .
i
2. Se vuelve a estimar el modelo elegido aadindole como variables explicativas

potencias de Yi ; esto es: Yi 2 , Yi 3 , para capturar de este modo las posibles
relaciones sistemticas existentes entre los residuos y las Yi .
3. Se calcula entonces el siguiente estadstico F de prueba:
1 R
2
exp
R 2 ANTIGUO / l
Fl ,n m ,
2
NUEVO /( n m)
NUEVO
donde:
l = n de nuevos regresores
m = n de parmetros del nuevo modelo
El objetivo es comprobar si el nuevo modelo supone una aportacin significativa
(vista a travs de su R 2 ) respecto al original.
157

4. Segn esto, por tanto, si el valor de la F es estadsticamente significativo al nivel

elegido, entonces podemos concluir que el modelo inicial est mal especificado.
Una ventaja del test RESET es que es fcil de aplicar, porque no requiere especificar
cul es el modelo alternativo; pero esto tambin puede resultar un inconveniente, ya que
si se rechaza el modelo inicialmente elegido, no se tiene entonces uno alternativo para
sustituirlo. As pues, este test puede considerarse fundamentalmente como una
herramienta de diagnstico.
5.2.
Multicolinealidad perfecta y aproximada.-
Definicin de multicolinealidad
Consideremos, en su expresin matricial, el modelo clsico de regresin lineal mltiple

Y X u , que cumple las hiptesis habituales.
Como es bien sabido, la estimacin de los coeficientes de regresin del modelo por el
1
mtodo de MCO se obtiene a travs de la expresin: X ' X X ' Y , verificndose
1
que su matriz de varianzas-covarianzas viene dada por: Var Cov ( ) u2 X ' X .
El concepto de multicolinealidad hace referencia a la existencia de relacin lineal entre

las variables explicativas del modelo. Esta relacin puede ser de distinto grado, lo que
tiene distintas consecuencias. As, puede darse desde la multicolinealidad perfecta hasta
la ausencia total de relacin lineal entre las X j .
La multicolinealidad perfecta significa que existe una relacin lineal exacta entre las
variables explicativas del modelo, lo que implica que: X ' X 0 No existe X ' X .
1
En este caso, es posible obtener una estimacin de una combinacin lineal de los
parmetros del modelo, pero no calcular
de forma nica.
MCO
Cuando no hay relacin lineal alguna entre las distintas variables explicativas (es decir,
el coeficiente de correlacin lineal entre X j y X m vale 0, X j X m ), la estimacin
por MCO de los parmetros poblacionales del modelo puede llevarse a cabo tanto de
1
manera conjunta a travs de la expresin X ' X X ' Y , como efectuando por
separado las regresiones simples de la variable explicada con cada una de las variables
explicativas; los resultados coincidiran exactamente. Esto es, se podra plantear:
Yi 1 2 X 2i i , de donde se obtendra 2 ,
Yi k k X ki 'i , de donde se obtendra k .

Y finalmente: 1 Y 2 X 2 k X k .
158

Los supuestos anteriores son extremos y prcticamente no se dan en la realidad. Lo

usual es que exista cierta relacin lineal entre las variables explicativas, en un mayor o
menor grado. El problema aparece cuando este grado, sin ser mximo, es elevado; es lo
que se conoce como multicolinealidad aproximada (o casi perfecta). Aunque X ' X 0 ,
resulta que es cercano a 0. Las consecuencias de esta situacin son:
-
Los MCO son estimadores lineales, insesgados y ptimos (en el sentido de mnima
varianza); es decir, siguen siendo ELIO.
Se trata de un fenmeno muestral: la multicolinealidad puede estar presente en una

muestra y no en la poblacin.
Altos valores de los elementos de la matriz de var cov ( MCO ) ; esto conlleva:
o Amplios intervalos de confianza para los parmetros poblacionales j ,
j t n k ,1 / 2 ES ( j ) , con la consiguiente disminucin de la precisin de
sus estimadores.
o Disminucin drstica de la potencia de los contrastes de significatividad

j
.
individual de los parmetros 40 : t j
ES ( j )
Amplios intervalos de confianza para la prediccin de valores de la variable
explicada Y0 , Y0 t n k ,1 / 2 ES (e0 ) , perdiendo con ello precisin la prediccin.
Los MCO y ES ( MCO ) son muy sensibles a fluctuaciones muestrales.
El tratamiento de la multicolinealidad es muy desigual por parte de los econmetras en

la literatura. As, si el objetivo es la prediccin, en general se seala que no existen
graves problemas; pero si lo que se atiende es a la significativad de las variables del
modelo, entonces debe tratarse la cuestin con sumo cuidado y detenimiento.
Deteccin de la multicolinealidad
Para detectar la presencia de multicolinealidad en el modelo, existen diversos

procedimientos:
40
Obsrvese que al aumentar ES( j ) , disminuye el valor del estadstico t j , con lo que aumenta la
probabilidad de aceptar hiptesis nulas aun siendo falsas.

159

1. Observar un valor del X ' X prximo a cero. No obstante, este mtodo no resulta
definitivo, ya que puede deberse a los valores concretos de la muestra escogida. Su
principal limitacin es que no tiene cota superior.
2. Estar ante un R 2 elevado (y, por tanto, ante una F que indica que el modelo es
globalmente significativo) y pocos estadsticos t-Student significativos asociados a
las variables explicativas. Se trata de un rasgo habitual en situaciones de
multicolinealidad, si bien no es del todo concluyente.
3. Constatar altos valores de los coeficientes de correlacin lineal simple ( R 0,8 )
entre las variables explicativas. Es una condicin suficiente.
4. Prueba de eliminacin de variables. Este mtodo comienza calculando R 2 para el
modelo completo; si se elimina luego aquella variable que se considere ms
correlacionada, y resulta que el nuevo valor de R 2 apenas vara, entonces es signo
evidente de que la relacin de colinealidad exista.
5. Mtodo de las regresiones auxiliares de Farrar-Glauber. Este mtodo consiste en
efectuar las regresiones de cada variable explicativa X j en funcin de las restantes
(denominadas regresiones auxiliares), calculando sus correspondientes coeficientes
de determinacin R 2j . Para cada una de estas regresiones auxiliares se lleva entonces
a cabo el siguiente contraste mediante el estadstico F de Fisher-Snedecor:
H 0 : R 2j 0
Fj
R 2j (k 1) 1
(1 R 2j ) n (k 1)
Fk 2, n ( k 1) .
Si la regresin auxiliar resulta estadsticamente significativa, ello sera indicativo de

que X j presenta fuerte relacin lineal con las restantes variables; esto es, habra
multicolinealidad.
6. Factor de agrandamiento (o inflacin) de la varianza, de Klein. Este coeficiente,
FAV ( j ) , se define como el cociente de la varianza observada de j y la que
habra sido si X j fuese incorrelada con el resto de variables explicativas del
modelo, que de forma prctica es la inversa de 1 R 2j , donde R 2j es el coeficiente de
determinacin de la regresin auxiliar de X j con el resto de variables explicativas:
FAV ( j )
var ( j )
1
.
2
var ( j ) 0 1 R j
Cuanto mayor sea el valor de FAV ( j ) , mayor ser la relacin lineal entre las
variables explicativas del modelo.
160

7. Nmero de condicin, de Belsley, Kuck y Welsch. Es el mtodo considerado ms

actual; se define como:
n ( x)
donde
mx
mn
mx
,
mn
son los autovalores mximo y mnimo, respectivamente, de la
matriz de correlaciones de las variables explicativas R XX .

Atendiendo al valor de este nmero, se tiene que:
n (x) 1 hay ausencia total de correlacin lineal.
1 n ( x ) 20 ; esto indica escasa multicolinealidad.
20 n ( x ) 30 ; esto conlleva un problema de multicolinealidad que empieza a
merecer su consideracin.
n ( x ) 30 ; implica la presencia prcticamente segura de multicolinealidad.
Tratamiento de la multicolinealidad
Una vez detectada la presencia de multicolinealidad, existen diversas formas de
acometer su correccin. Entre ellas, pueden destacarse las siguientes:
1. Eliminacin de variables explicativas del modelo. El problema de la

multicolinealidad denota, en esencia, la falta de informacin suficiente en la muestra
para permitir una estimacin precisa de los parmetros individuales. En ocasiones,
puede interesar eliminar algunas variables del modelo original cuando existe una
alta correlacin entre ellas. Sin embargo, esto tiene consecuencias; la principal es
que la estimacin por MCO de los parmetros deja de ser ELIO, pues dejan de ser
insesgados; sin embargo, la varianza resulta ser menor. En estos casos, donde los
parmetros ya no son insesgados, es el error cuadrtico medio (ECM) lo que debe
observarse, eligindose el que sea mnimo.
2. Actuaciones sobre la muestra. Dado que la multicolinealidad hace aumentar la
varianza muestral de los MCO , se puede intentar actuar sobre la muestra para
disminuirla; as, se podran introducir nuevas observaciones o bien mezclar datos de
tipo transversal y temporal. Estas alternativas, sin embargo, en muchas ocasiones no
resultan factibles.
3. Establecimiento de restricciones sobre el comportamiento de los parmetros
poblacionales. Se puede intentar corregir el problema de la multicolinealidad
utilizando toda la informacin extra-muestral disponible, estableciendo restricciones
sobre el comportamiento de los parmetros del modelo. Con ello, se reducira el
nmero de parmetros a estimar.
161

4. Transformacin de variables. Cuando se manejan, sobre todo, series temporales, la

multicolinealidad puede reducirse transformando las variables mediante la
aplicacin de primeras diferencias, transformaciones logartmicas; sin embargo,
estas modificaciones aparte de requerir una justificacin econmica, pueden
conllevar efectos no deseados: reduccin de grados de libertad, incumplimiento de
alguna hiptesis bsica del modelo (como introduccin de heteroscedasticidad en la
perturbacin aleatoria), etc.
5. Tcnicas multivariantes. Con frecuencia para tratar el problema de la
multicolinealidad se emplean tcnicas pertenecientes al anlisis multivariante, tales
como el anlisis factorial y el de componentes principales.
5.3.
Aplicacin de EViews al anlisis de errores de especificacin y

multicolinealidad en el modelo.-
En este apartado vamos a ver cmo analizar con EViews algunos de los errores de
especificacin que puede presentar un modelo, as como la posible existencia de
multicolinealidad entre las variables explicativas del mismo. Para ello resolveremos, a
modo de ejemplo, el Ejercicio n 40 del Boletn del Tema 5, donde el modelo
considerado ya se especific en una sesin anterior de trabajo con EViews a partir del
archivo tests.wf1, disponible en el espacio reservado a la Asignatura en WebCT.
Al abrir este fichero (FILE / OPEN / WORKFILE), veremos que este fichero contena
los datos de las variables siguientes, correspondientes al periodo 1980-2007 (Figura 1):
CONSUMO: Tasas de variacin anuales del consumo privado no alimenticio en
trminos reales de 1992
PRECIO: Tasas de variacin anuales de los precios del consumo privado no
alimenticio con base 1992
RENTA: Tasas de variacin anuales de la renta familiar disponible en trminos
reales de 1992
EMPLEO: Tasas de variacin anuales del empleo total
PRECA: Precariedad en el mercado de trabajo (porcentaje de contratos temporales
sobre total de contratos)
TIR: Tipos de inters reales en base 1992
A partir de stas, se especific el modelo:

CONSUMO 1 2 PRECIO 3 RENTA 4 EMPLEO 5 PRECA 6TIR u
Su estimacin por MCO, mediante QUICK / ESTIMATE EQUATION, nos daba como
resultado lo mostrado en la Figura 2.
162

Podemos guardarlo, pulsando el botn NAME, con el nombre REG, por ejemplo. 41
Figura 1
Figura 2
Si guardamos el fichero en la sesin anterior de trabajo con EViews que hemos referido, podemos
entonces recuperarlo directamente y comenzar en este punto en la presente sesin.
41
163

El anlisis inicial de los resultados obtenidos nos llev a comprobar cmo los signos de
todos los coeficientes de regresin parecan correctos.
Asimismo, del estudio de la significatividad individual de las variables explicativas, a
travs de los p-valores asociados a los correspondientes estadsticos t-Student, poda
deducirse que, con la excepcin de la variable TIR, todas ellas eran estadsticamente
significativas a un nivel de confianza incluso del 99%. En el caso de TIR, sta no lo
resulta siquiera para un 10% .
Respecto a la significatividad global del modelo, el p-valor (0,000000) asociado al
estadstico F de este contraste (37,02546) evidenciaba que as era, para un nivel de
confianza prcticamente del 100%.
En cuanto a la bondad del ajuste, el valor del coeficiente de determinacin (0,893785)
reflejaba que el ajuste resultaba muy aceptable. Por su parte, el valor del coeficiente de
determinacin corregido (0,869645), no slo reflejaba este hecho, sino tambin que no
existan problemas importantes de grados de libertad, dado que su valor no haba
sufrido un gran descenso en relacin al original.
Junto a todo esto, el contraste que se hizo posteriormente sobre la normalidad de la
perturbacin aleatoria del modelo, a travs del test de Jarque-Bera, vino a confirmar que
efectivamente u resultaba normal.
Llegados a este punto, y antes de dar definitivamente por bueno nuestro modelo,
podemos plantearnos si el modelo presenta algn tipo de error de especificacin.
Segn se ha podido comprobar al analizar la significatividad individual de cada una de
las variables del modelo, quizs no se debera considerar la de tipos de inters (TIR).
Para analizar si esta variable, incluida en la especificacin inicial, es necesaria o no,
podemos aplicar el test de variables irrelevantes o redundantes. Para llevar a cabo este
test en EViews, dentro de nuestro modelo estimado, debemos seleccionar la opcin
VIEW / COEFFICIENT TESTS / REDUNDANT VARIABLES y escribir el nombre de la
variable (TIR) en el cuadro de dilogo que surge (Figura 3).
La salida de EViews de la Figura 4 nos ofrece el resultado del test, bajo la hiptesis nula
de que el coeficiente de la variable seleccionada es cero, a travs del estadstico F (y el
ratio de verosimilitud o LR (Log likelihood ratio), que no consideraremos), adems del
resultado de realizar la regresin del modelo restringido, es decir, sin incluir la variable
seleccionada. Como sabemos, el estadstico F compara la suma de cuadrados residuales
calculada con y sin restricciones impuestas; si las restricciones planteadas son vlidas,
la diferencia entre los dos valores ser mnima y, por tanto, el valor de F ser pequeo
(conduciendo ello a aceptar la hiptesis nula). Este estadstico tiene como grados de
libertad del numerador el nmero de restricciones de coeficientes establecido en la
hiptesis nula (en este caso, 1) y en el denominador, los grados de libertad de la
regresin total (en este caso, 22).
164

Figura 3
Figura 4
En este caso, los resultados obtenidos nos conducen a aceptar la hiptesis nula, pues el
p-valor asociado al estadstico F nos indica que el nivel de significacin mnimo al que
165

se puede rechazar la hiptesis nula es del 14,58%, o bien el nivel de confianza mximo
para rechazar dicha hiptesis es del 85,42%. Por tanto, la variable TIR no es necesaria
en nuestro modelo. Si bien la nueva especificacin perdera algo de bondad de ajuste
(evidenciada por la comparacin de los correspondientes valores del coeficiente de
determinacin corregido: 0,869645 frente a 0,862429), dicha prdida no sera relevante.
As pues, podemos eliminarla de nuestra estimacin. Ello lo haremos editando el
modelo en el botn ESTIMATE de nuestra ecuacin REG y borrando simplemente la
variable en cuestin.
Tras llevar a cabo esta depuracin de nuestro modelo, resulta que nos facilitan los
datos de una nueva variable que consideramos que podra ser relevante en el mismo:
TIPIMP: Tipo medio impositivo en trminos reales con base 1992
Si fuese significativa, su no inclusin representara otro tipo de error en la especificacin

del modelo. La omisin de una variable explicativa relevante en nuestro modelo tendra,
adems, consecuencias ms graves que la inclusin de una variable irrelevante.
Los valores de dicha variable se encuentran a nuestra disposicin en un archivo de
Excel, denominado omitida.xls, que se encuentra en el espacio de la Asignatura en
WebCT. Para incorporarlo a nuestro anlisis deberemos importarlo a nuestro fichero de
trabajo. Como sabemos, para ello deberemos seleccionar, desde el men principal del
fichero de trabajo, la opcin: FILE / IMPORT / READ TEXT-LOTUS-EXCEL
La Figura 5 muestra la pantalla del men correspondiente a la importacin de ficheros
Excel (Excel Spreadsheet Import), con las opciones correspondientes seleccionadas.
Figura 5
166

Una vez importada TIPIMP, vamos a comprobar si esta nueva variable debe estar
presente en el modelo; es decir, si es una variable relevante que hasta el momento
hemos omitido en su especificacin. Para verlo, aplicaremos el test de variables
omitidas, que establece como hiptesis nula que la variable o variables a considerar en
el nuevo modelo no son significativas. El estadstico F de este contraste se calcula a
partir de la diferencia de la suma de cuadrados residuales de la regresin inicial (que
sera la restringida) y de la regresin con las variables que se omitieron en principio.
Sus grados de libertad son en este caso 1, 22.
Para la realizacin de este contraste, dentro de nuestro modelo REG, deberemos
seleccionar VIEW / COEFFICIENT TESTS / OMITTED VARIABLES y seguidamente
introduciremos la variable TIPIMP (Figura 6). 42
Figura 6
Los resultados se pueden ver en la Figura 7. Aparte de los estadsticos y p-valores
asociados a F y LR (aunque ste ltimo lo obviaremos), la aplicacin de este test
incluye la regresin realizada aadiendo esta nueva variable en la estimacin. De este
modo, podemos comprobar que:
-
El p-valor asociado al estadstico F es pequeo; a un nivel de significacin del 5%

se puede rechazar la hiptesis nula que establece que la variable TIPIMP no es
significativa. Por tanto, se trata de una variable que haba sido omitida.
42
En este test debemos tener presente que la nueva variable que introduzcamos en el modelo ha de tener
el mismo nmero de observaciones que las de la especificacin inicial (en este caso, datos de 1980 a
2007).
167

-
El signo que presenta TIPIMP es correcto (negativo), tal como era de esperar.
La variable TIPIMP es estadsticamente significativa para un 5% .
El coeficiente de determinacin corregido ha mejorado: 0,886568.
Figura 7
En definitiva, hemos visto cmo nuestro modelo debe incluir la variable TIPIMP. Para
llevar a cabo de manera definitiva el nuevo ajuste, dentro de nuestro modelo REG,
pulsaremos una vez ms la opcin ESTIMATE y aadiremos la variable TIPIMP. El
resultado de la estimacin puede apreciarse en la Figura 8.
Otro tipo de test destinado a detectar problemas en la especificacin del modelo es el
denominado Test RESET de Ramsey. Este test permite detectar la omisin de variables y
la eleccin de una forma funcional inadecuada.
La realizacin del Test de Ramsey en EViews se hace, tambin dentro de la Ventana de
Ecuacin, a travs de VIEW / STABILITY TESTS / RAMSEY RESET TEST (Figura 9).
La base de este test reside en la comparacin de la especificacin inicial del modelo con
una nueva que se plantea como alternativa y que aade, a las variables explicativas
originales, potencias de la estimacin de la variable endgena; de este modo, se
pretenden capturar posibles relaciones sistemticas existentes entre los residuos y las
estimaciones de Y y que no son recogidas por el modelo inicial. En este contraste se
emplea un estadstico F cuyo clculo se basa en la diferencia entre los coeficientes de
determinacin del nuevo modelo y el del original. La aceptacin de la hiptesis nula
supone asumir que el modelo inicial resulta aceptable; por el contrario, su rechazo
implica pensar que el modelo est mal especificado.
168

Figura 8
Figura 9
En este caso, hemos aadido a nuestra especificacin 2 potencias de Y : Y 2 e Y 3 .
Normalmente con este nmero ya resulta suficiente para tener conclusiones (Figura 10).
169

Figura 10
En la Figura 11 aparece el resultado de este contraste, aprecindose que la hiptesis
nula se acepta para un nivel mximo de significacin del 56,50%. As pues, se acepta la
hiptesis nula: nuestra ltima especificacin del modelo resulta correcta.
Figura 11
170

Por ltimo, podemos analizar si nuestro modelo evidencia algn problema de

multicolinealidad. Como sabemos, ante la presencia de sta los coeficientes de regresin
estimados por MCO siguen siendo ELIO, pero sin embargo la potencia de los contrastes
de significacin individual de las variables explicativas disminuyen drsticamente, lo
cual puede tener consecuencias para la correcta especificacin final de un modelo.
La obtencin de un R 2 elevado para el modelo (y, por tanto, de significatividad global
de ste manifestada a travs del estadstico F) y simultneamente de pocos estadsticos
t-Student significativos de las variables explicativas, resulta un claro indicio de
existencia de multicolinealidad, si bien no es del todo concluyente. Puesto que en este
ejercicio no son stas las circunstancias que se dan, ello parece sugerirnos que no
tenemos problemas de multicolinealidad.
Adicionalmente, podemos emplear otro mtodo de deteccin, consistente en el estudio
de los coeficientes de correlacin lineal simple entre las variables explicativas. Valores
altos ( | R | 0,8 ) son condicin suficiente, pero no necesaria, para afirmar que existe
multicolinealidad en el modelo. La Figura 12 muestra cmo obtener con EViews la
matriz de coeficientes de correlacin lineal de las variables explicativas: debemos
seleccionar de una en una todas stas (manteniendo pulsada la tecla Ctrl) y tras esto,
pulsando el botn derecho del ratn, se elige la opcin OPEN / AS GROUP.
Figura 12
Una vez aqu (Figura 13), en VIEW, podremos escoger realizar la matriz de
correlaciones (CORRELATIONS). Al analizar los resultados de sta (Figura 14), no
171

parece que haya problemas de multicolinealidad, pues no hay ningn valor absoluto que
se site por encima de 0,8. Con esto, finaliza as el presente ejercicio.
Figura 13
Figura 14
172

5.4.
Heteroscedasticidad y autocorrelacin. Estimacin por mnimos

cuadrados generalizados (MCG).-
Conceptos de heteroscedasticidad y autocorrelacin
Considrese el modelo clsico de regresin lineal general:

Yi 1 2 X 2 i ... j X
ji
... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n ,
o bien, mediante su expresin matricial: Y X u .

Hasta este momento, todo nuestro anlisis se ha basado en el hecho de que, para todas
las observaciones i del modelo, la perturbacin aleatoria ha presentado entre sus
principales supuestos homoscedasticidad e incorrelacin, lo cual se ha concretado en
que su matriz de varianzas-covarianzas resulta escalar de orden n x n:
u2
0
Var Cov (u )
2
u
0
1
0
0
2
u2 u
0
u2
0 0
1 0 0
0 1 u2 I .

0 1
Es decir, todos los elementos de la diagonal principal son iguales (homoscedasticidad:

varianza constante para todas las observaciones) y el resto de elementos de la matriz
valen todos ellos cero (incorrelacin: covarianzas correspondientes a distintas
observaciones iguales a cero).
En este escenario, el investigador se encuentra con k 1 parmetros a estimar:
1 , 2 , k y u2 . Como sabemos, el mtodo de MCO nos ofrece para ello estimadores

ideales: ELIO (insesgados y ptimos, adems de lineales). Toda la teora inferencial que
se ha desarrollado en torno a nuestro modelo se ha basado de manera fundamental en la
homoscedasticidad e incorrelacin de la perturbacin aleatoria.
Sin embargo, estos supuestos son slo eso: supuestos. En la realidad, podemos
encontrarnos con que alguno de ellos (o incluso los dos) no se cumpla. Cabra entonces
evaluar cules son las consecuencias que esto tiene sobre nuestro modelo, tanto en lo
que a su estimacin se refiere como respecto a los aspectos inferenciales del mismo
(contrastes de hiptesis e intervalos de confianza).
As pues, por un lado podramos tener que la varianza de la perturbacin aleatoria fuese
distinta de unas observaciones a otras, esto es: Var (u i ) u2i , con u2i u2j , i j .
De esta forma, se quebrara el supuesto de homoscedasticidad y estaramos ante lo que
se denomina heteroscedasticidad de la perturbacin aleatoria, que es una situacin
caracterstica sobre todo de modelos de series de corte transversal, si bien tambin
puede encontrarse en series de datos temporales.
173

La matriz de varianzas-covarianzas de u sera en este caso:

u21
Var Cov (u )

u2
u2
u2n
En esta situacin estaramos ante un importante problema de resolucin matemtica, de

sobreparametrizacin, pues tendramos k n parmetros a estimar ( 1 , 2 , k y
u2 , u2 , , u2 ), en tanto que slo tendramos n observaciones. Para abordar este

1
problema sera preciso establecer algn tipo de supuesto que permitiese, de algn modo,
reducir el nmero de parmetros a estimar, de forma que finalmente fuese menor que n .
Ante la presencia de heteroscedasticidad, la matriz de Var Cov (u ) es una matriz
diagonal, que podra expresarse de la forma:
u21
2

0
Var Cov (u ) 2

u2
u2
0
2

2
un
2
0
Obsrvese cmo sera una matriz diagonal con un formato caracterstico.

Por otro lado, podramos plantearnos un escenario en el que ui no fuese incorrelada
para todas las observaciones; esto es, que existiese autocorrelacin: Cov(ui , u j ) ij 0 ,
i j . Ello conllevara que los elementos que no pertenecen a la diagonal principal de la
matriz de Var Cov (u ) no tendran por qu ser todos cero, por lo que sta ya no sera
diagonal 43 :
u2
12
Var Cov (u )
1n
12
u2
23
u2
2n
43
1n
2n
.

u2
Ntese que al plantear autocorrelacin estamos suponiendo homoscedasticidad, lo mismo que

anteriormente cuando planteamos heteroscedasticidad supusimos incorrelacin. Es decir, estamos
considerando la quiebra de estos supuestos por separado. Si nos encontrsemos con ambas situaciones de
forma simultnea, procederamos primero suponiendo slo una y, una vez solucionada, afrontando la otra.
174

n2 n
2
parmetros, que evidentemente es un nmero mayor que el de observaciones muestrales
Ante la presencia de autocorrelacin, el investigador ha de estimar k 1
n2 n
n : 1 , 2 , k , ms los
elementos diferentes que se hallan por encima de la
2
diagonal principal de la matriz 44 . Por tanto, al igual que suceda con la
heteroscedasticidad, se deber establecer algn tipo de supuesto que conduzca a reducir
dicho nmero de incgnitas hasta que sea menor que n .
2
u
La autocorrelacin es una situacin que se registra especialmente en modelos referidos a

series temporales, viniendo motivada por ejemplo por la existencia de ciclos y
tendencias, relaciones dinmicas, etc. Igualmente, tambin puede estar presente en
series transversales; por ejemplo, por haber omitido variables relevantes en la
especificacin del correspondiente modelo.
Vase cmo ante la existencia de autocorrelacin en la perturbacin aleatoria del
modelo, la matriz de varianzas-covarianzas de sta se podra expresar de modo que:
1
12 2
u
Var Cov (u ) u2

1n 2
12
2
u
2n
u2
23
u2
1n

2n
u2
u2

2
u
La matriz tendra aqu tambin una forma caracterstica, si bien distinta a la del caso
de heteroscedasticidad.
En definitiva, ante la presencia de heteroscedasticiad o de autocorrelacin en la
perturbacin aleatoria u del modelo, tendramos que su matriz de varianzas-covarianzas
se podra escribir de forma general:
Var Cov (u ) 2 , siendo I .
Segn esto, como puede apreciarse, el cumplimiento de los supuestos de

homoscedasticidad e incorrelacin en la perturbacin da lugar a un caso particular de
matriz de Var Cov (u ) donde I y, adems, el parmetro 2 se correspondera
con el valor de la varianza de u , constante para todas las observaciones muestrales 45 ,
esto es: 2 u2 .
44
Los elementos que hay por debajo de la diagonal principal de la matriz son los mismos que hay por
encima de la misma, dado que la matriz es simtrica: ij ji , i j .
45
Obsrvese que, de acuerdo con las hiptesis establecidas, esto ltimo tambin sera cierto aun
presentando autocorrelacin la perturbacin aleatoria.
175

Cuando la perturbacin aleatoria cumple estos supuestos, se dice que es esfrica. En los
casos en que incumple al menos alguno de ellos, es decir, que presenta
heteroscedasticidad y/o autocorrelacin, se habla de perturbacin no esfrica.
Propiedades de los estimadores MCO ante una perturbacin no esfrica
Llegados a este punto, nos planteamos qu sucede con la estimacin de los parmetros
del modelo por el mtodo de MCO si la perturbacin aleatoria resulta ser no esfrica;
esto es, nos planteamos el modelo de regresin lineal Y X u , donde
Var Cov (u ) 2 , con I .
En esta situacin, el estimador MCO de sigue siendo una solucin del sistema de
ecuaciones normales: X ' X X ' Y , por lo que si la matriz ( X ' X ) es invertible, la
solucin nica a dicho sistema es: MCO X ' X 1 X ' Y . As pues, podemos seguir
estimando el modelo por MCO.
El siguiente paso ser comprobar si el estimador MCO sigue conservando sus
propiedades ideales; es decir, si en este escenario sigue siendo ELIO: insesgado y
ptimo (de mnima varianza). Para ello, vamos a analizar qu sucede con el valor
esperado y la matriz de varianzas-covarianzas de
.
MCO
1
Como ya sabemos, MCO puede expresarse como: MCO X ' X X ' u .
A partir de aqu, si calculamos su valor esperado, tenemos que:
1
1
E MCO E X ' X X ' u X ' X X ' E u .
Con lo que vemos que MCO sigue siendo un estimador insesgado.

En cuanto a su matriz de varianzas-covarianzas:
'
'
Var Cov MCO E MCO E MCO MCO E MCO E MCO MCO
1
1
E X ' X X ' u X ' X X ' u
'
E X ' X X ' u u ' X X ' X

1
X ' X X ' E u u ' X X ' X X ' X X ' Var Cov (u ) X X ' X

1
1
1
1
1
X ' X X ' 2 X X ' X 2 X ' X X ' X X ' X .
A la vista de este resultado, deducimos que la expresin general de la matriz de

Var Cov MCO resulta muy distinta a la que ya conocamos cuando u era esfrica:
1
Var Cov MCO u2 X ' X .
176

Ntese que si u fuese esfrica, estaramos en el caso particular de que I y
2 u2 , y entonces ambas expresiones coincidiran. Por tanto, si se utiliza sta ltima

en los procesos inferenciales donde resulte preciso, cuando la u no sea esfrica,
resultara del todo incorrecto, pudiendo conducir a errores importantes.
1
1
En definitiva, tenemos que: MCO N k ; 2 X ' X X ' X X ' X .
El problema que nos encontramos sin embargo con el mtodo de estimacin de MCO es
aun siendo correcta, no resulta la menor posible,
que esta matriz de Var Cov
MCO
por lo que el estimador MCO deja de ser ELIO.

Para finalizar, tenemos que la estimacin insesgada del otro parmetro relevante en
nuestro anlisis, 2 , cuando u no es esfrica resulta ser:
2
MCO
e ' MCO 1 e MCO

,
nk
donde: eMCO Y YMCO Y X MCO .
Definicin del mtodo de estimacin por mnimos cuadrados generalizados (MCG)
Segn acabamos de mostrar, la estimacin por MCO de los parmetros del modelo ya
no resulta de mnima varianza ante la presencia de heteroscedasticidad y/o
autocorrelacin en la perturbacin aleatoria. Esto, unido a que adems la matriz de
que estemos utilizando pueda no ser la correcta, lo que invalidara
Var Cov
MCO
todas las conclusiones de los procesos de inferencia estadstica referidos al modelo

economtrico, nos hace pensar por un momento que todo lo estudiado hasta ahora sobre
el modelo clsico de regresin lineal ha podido resultar en vano. Sin embargo, veremos
que no es as.
En estas circunstancias, sera interesante poder transformar nuestro modelo
economtrico en otro, de tal forma, que los nuevos coeficientes fuesen los mismos que
los del modelo original, pero cuya perturbacin aleatoria fuese esfrica, es decir,
resultase homoscedstica e incorrelada. De este modo, si aplicsemos el mtodo de
estimacin de MCO sobre este modelo transformado, todos los supuestos de ste se
cumpliran y, por el Teorema de Gauss-Markov, tendramos que los estimadores
obtenidos seran ELIO y podramos seguir asegurando todos los resultados inferenciales
derivados de los mismos.
As pues, si partimos del modelo de regresin lineal general, Y X u , la idea es
poder transformarlo de manera que, si pre-multiplicamos los valores de todas las
variables presentes en el modelo por una matriz de coeficientes P , cuadrada de orden n,
es decir: PY PX Pu , la nueva perturbacin aleatoria resultante ( Pu ) fuese
esfrica.
177

Tendramos, por tanto, un nuevo modelo lineal que sera:

Y * X * u* ,
donde: Y * PY , X * PX , u * Pu y el objetivo es que u * sea esfrica, es decir,
homoscedstica e incorrelada.
Bajo estas condiciones, obsrvese que, gracias a la linealidad del modelo, el vector de
coeficientes sera el mismo que el del modelo original, pero con la diferencia de que
al aplicar el mtodo de MCO sobre este nuevo modelo transformado estaramos en las
mismas condiciones que las conocidas de un modelo clsico.
Respecto a las nuevas variables transformadas Y * y ( X 1* , X 2* , , X k* ) que integran X * ,
cabe resear que stas se obtendran como combinaciones lineales de las variables
originales Y y ( X 1 , X 2 , , X k ) que conforman X , por lo que no tendran un
significado claro. 46
Y en cuanto a la nueva perturbacin aleatoria, u * , tendremos que su valor esperado y su
matriz de varianzas-covarianzas son:
E u * E Pu PE u P
Var Cov u * E u *u * ' E Pu ( Pu )' E Pu u ' P ' P E u ' u P '
PE u ' u P ' P 2 P ' 2 P P '
Puesto que lo que perseguimos es que Var Cov u * sea escalar, nuestro objetivo final
ser ver qu matriz P debemos elegir para transformar el modelo, de tal manera que
verifique que: P P ' I .
Sabiendo que es una matriz simtrica y definida positiva, matemticamente se puede
llegar a demostrar que existe una matriz cuadrada no singular V , de tal modo que:
V V ' . Pues bien, la matriz P que buscamos resulta ser:
P V 1 .
Como se puede ver, esta matriz efectivamente verifica:
'
1
Var Cov u * 2 P P ' 2 V 1 V V ' V 1 2 V 1 V V ' V ' 2 I .
En resumen, cuando estemos ante un modelo Y X u con perturbacin aleatoria no

esfrica ( Var Cov (u ) 2 , siendo I ), deberemos obtener a partir de la
matriz V que cumple que V V ' ; tomaremos luego V 1 para llevar a cabo una
Ntese que los elementos de la matriz P son simplemente los coeficientes de dichas combinaciones
lineales.
46
178

transformacin lineal del modelo original, de modo que: Y * X * u * , haciendo

Y * V 1 Y , X * V 1 X y u * V 1 u . La nueva perturbacin u * ser entonces
esfrica, es decir, homoscedstica e incorrelada.
Sobre este modelo transformado, que cumple ya los supuestos de un modelo clsico,
aplicaremos seguidamente MCO para su estimacin. Este mtodo de estimacin (la
aplicacin de MCO sobre el modelo transformado) se denomina mtodo de mnimos
cuadrados generalizados (MCG). De este modo, el estimador MCG viene dado por:
MCG X * ' X * X * ' Y * .

1
O, si lo expresamos en funcin de las variables originales X e Y del modelo 47 :
MCG X ' 1 X X ' 1 Y ,

1
ya que:
MCG
X 'X
*
* 1
'
'
X ' V 1 V 1 X X ' V 1 V 1Y X ' 1 X
'
'
X ' Y V 1 X V 1 X V 1 X V 1Y
X ' 1 Y .
Propiedades de los estimadores MCG de los coeficientes de regresin
1. El estimador MCG de los coeficientes de regresin satisface el sistema de

ecuaciones normales del modelo:
X * ' X * MCG X * ' Y * ,

o bien, teniendo en cuenta las transformaciones lineales X * V 1 X e Y * V 1 Y ,
esto puede expresarse en funcin de las variables originales X e Y :
X '
X MCG X ' 1 Y .
2. El estimador MCG es un vector aleatorio que sigue una distribucin de probabilidad

normal.
1
Dado que MCG se puede expresar como: MCG X * ' X * X * ' u * , y puesto
que u * es normal, al depender MCG de u * se deduce que MCG es tambin un

vector aleatorio normal.
3. Si E u * , entonces MCG es insesgado; es decir: E MCG .
47
Obsrvese que, en el caso de que se trabajase con los datos originales, habra que calcular la matriz
1 , la cual es cuadrada de orden n x n. En cambio, si se trabaja con los datos de las variables
transformadas, el orden de las matrices cuya inversa debera calcularse sera slo de orden k x k.
179

4. La matriz de varianzas-covarianzas de MCG viene dada por:
Var Cov MCG 2 X * ' X *
o de manera alternativa, teniendo en cuenta la transformacin lineal X * V 1 X , se

puede expresar en funcin de las variables originales que conforman X :
Var Cov MCG 2 X ' 1 X
Como conclusin de las tres propiedades anteriores, tenemos que:
MCG N k ; 2 X * ' X *
, o bien:
N k ; 2 X ' 1 X
MCG
5. El estimador MCG es ELIO de .

Puesto que el modelo transformado satisface las condiciones supuestas de un
modelo clsico de regresin lineal, de acuerdo con el Teorema de Gauss-Markov, el
estimador MCO de los coeficientes de regresin de dicho modelo transformado
(esto es, el estimador MCG), resulta entonces ELIO.
En particular, dado que MCG es ptimo, tenemos que:
Var Cov MCG Var Cov MCO ,
pues: 2 X ' X X ' X X ' X 2 X ' 1 X

1
es una matriz semidefinida
positiva.
Propiedades del estimador MCG del parmetro 2
1. La estimacin por MCG del otro parmetro relevante del modelo, 2 , se obtiene a
partir de la expresin:
2
MCG
u2*
e * ' e * SCR *
,
nk
nk
o en funcin de las variables del modelo original:

2
MCG
e ' MCG 1 e MCG

,
nk
donde:
*
e * Y * YMCG
Y * X * MCG V 1 Y (V 1 X ) MCG V 1 Y X MCG V 1 eMCG .
2
2. Este estimador es insesgado; es decir: E MCG
180
2.

Coeficiente de determinacin
Una dificultad aadida que surge en el contexto de un modelo cuya perturbacin

aleatoria no es esfrica se refiere a la utilizacin del coeficiente de determinacin R 2
del modelo transformado como medida de bondad del ajuste. En primer lugar, dicho
modelo transformado puede no tener trmino independiente, con lo que R 2 ya no
estara acotado entre 0 y 1. Y, en segundo lugar, tendremos que conformarnos con
medir la capacidad del modelo para explicar la variable transformada Y * , que, sin
embargo, no olvidemos que no es nuestra variable de inters, pues sta es Y .
Inferencia estadstica
Como hemos podido apreciar, el nuevo modelo transformado, obtenido tras premultiplicar las observaciones de las variables originales por la matriz de coeficientes
lineales apropiada, no slo tiene los mismos coeficientes de regresin que el modelo
original, sino que tambin cumple los supuestos propios de la modelizacin
economtrica clsica, para la cual se ha desarrollado en temas anteriores toda la teora
inferencial referida a dichos coeficientes. Por consiguiente, todos los estadsticos
entonces establecidos podrn seguir siendo vlidos, con la nica salvedad de que en
lugar de referirnos a las variables originales X e Y , deberemos hacerlo ahora a las
variables transformadas X * e Y * , respectivamente. O de forma alternativa, si se
desease seguir trabajando con las variables originales, siempre que aparezca un
producto entre las matrices de datos de dichas variables, deber considerarse en medio
de ellas la matriz 1 , de manera anloga a lo que ya se ha mostrado en expresiones
anteriores de este mismo Tema.
Deteccin y tratamiento de la heteroscedasticidad con ayuda de EViews
Como ya hemos visto, si nos centramos en el problema de la heteroscedasticidad,

nuestro modelo de regresin lineal, Y X u , se caracteriza porque la matriz de
varianzas-covarianzas de la perturbacin aleatoria u adopta la forma:
u21
0
2
Var Cov (u )

u2
u2
Es decir, en general: u2i u2j y uiu j 0, i j .
181
0
.

u2n
2
0

La deteccin de la heteroscedasticidad constituye una labor ardua, ya que, como

sabemos, la perturbacin aleatoria del modelo no es una variable directamente
observable. No obstante, por el tipo de datos considerado o de anlisis realizado, se
pueden tener ciertas sospechas en relacin a este problema; as, las series de datos de
corte transversal son ms proclives a presentar esta circunstancia que las series de
datos temporales.
Existen distintos tipos de mtodos para detectar la heteroscedasticidad en un modelo
y algunos de ellos no slo sirven para este fin, sino que tambin constituyen la base
para ayudarnos a establecer la matriz V 1 que debe usarse posteriormente para
transformar el modelo original y estimar luego ste por el mtodo de MCG.
Los diferentes mtodos se podran clasificar, bsicamente, en:
Mtodos grficos
Mtodos analticos
o
Contrastes paramtricos (basados

establecidas): Park, Glesjer, White
en
las
hiptesis
estadsticas
Contrastes no paramtricos (no basados en las hiptesis estadsticas

establecidas; en particular, no tienen en cuenta el supuesto de normalidad
de ui): picos, Spearman
A continuacin, y con ayuda de EViews, analizaremos un modelo que nos servir de

ejemplo para ir viendo la aplicacin de algunos de estos mtodos. Una vez que
evidenciemos con ellos la existencia de heteroscedasticidad, procederemos
finalmente a estimar dicho modelo por MCG.
El Ejercicio que vamos a plantear es el n 41 del Boletn del Tema 5, donde se refiere
que se quiere estimar la relacin existente entre el Valor Aadido Bruto (VAB) y el
empleo en las Comunidades Autnomas espaolas y las Ciudades Autnomas de
Ceuta y Melilla, que consideraremos como un nico ente territorial. Con el propsito
indicado, se utilizan los datos del VAB a coste de factores y el nmero medio de
ocupados, para el ao 1991. El fichero het.wf1 recoge esta informacin, definindose
las variables:
VAB: Valor Aadido Bruto a coste de factores del ao 1991 (en millones de
unidades monetarias)
EMPLEO: Nmero medio de ocupados en 1991 (en miles de personas)
Este fichero se encuentra en el espacio reservado a la Asignatura en la plataforma de

docencia virtual WebCT. Tras descargarlo en el Escritorio de nuestro PC, procederemos
a abrirlo con EViews en FILE / OPEN / WORKFILE.
Lo primero que haremos ser estimar por MCO nuestro modelo:
VAB 1 2 EMPLEO u .
182

Como ya es bien sabido, para ello seleccionaremos: QUICK / ESTIMATE EQUATION.

En el cuadro de dilogo resultante escribiremos entonces: VAB C EMPLEO, aceptando
luego (OK) y obteniendo la Figura 15.
Figura 15
A continuacin, seleccionamos la opcin NAME de la Ventana de Ecuacin para
guardar dicha estimacin con el nombre, por ejemplo, de AJUSTEMCO, cerrando
seguidamente dicha ventana.
La observacin de los parmetros, coeficientes y estadsticos conocidos obtenidos
podra hacernos pensar inicialmente que el modelo resulta aceptable; sin embargo por la
naturaleza de los datos, de tipo transversal, sospechamos que puede presentar problemas
de heteroscedasticidad. En particular, pensamos que el comportamiento de la varianza
de la perturbacin aleatoria depende directamente de la variable explicativa del modelo,
esto es, del EMPLEO, o bien de una transformacin de sta. Por este motivo, vamos a
estudiar por distintos mtodos la existencia de este posible problema.
Mtodos grficos de deteccin
El primer tipo de mtodos que pueden utilizarse para estudiar la posible presencia de
heteroscedasticidad en un modelo consiste en la realizacin de determinados grficos.
En concreto, se trata de representar, de forma terica, la varianza de la perturbacin
aleatoria en funcin de alguna variable explicativa X j , j 2, , k del modelo (o bien
varias de ellas o, incluso, la variable explicada): u2i f X ji , i 1, 2, , n .
183

Sin embargo, dado que la variable aleatoria u no es observable (y por tanto, tampoco su
varianza), una opcin es tomar los cuadrados de los residuos ( ei2 ) como aproximacin
de la varianza de ui ; es decir, plantear 48 :
ei2 f X ji , i 1, 2, , n .
Para realizar estos grficos, habra que definir primero la serie de los residuos al cuadrado.
La serie de residuos del modelo es calculada de forma automtica cuando ste se estima.
Sus valores se hallan en resid. No obstante, hay que tener presente que resid es un
objeto donde se van guardando los valores de los residuos de la ltima estimacin que
se lleve a cabo. Dado que vamos a trabajar con la serie concreta de residuos MCO
recin creada, deberemos crear sta como una variable especfica a partir de lo que hay
en este instante almacenado en resid. Para hacer esto, seleccionaremos GENR en la
Ventana de Trabajo y escribiremos en el cuadro de dilogo que surge (Enter equation):
RS = RESID, segn se muestra en la Figura 16. Tras ello, aceptaremos pulsando OK.
Figura 16
Una vez hecho esto, puesto que nuestra intencin es trabajar ahora con los residuos al
cuadrado, seguidamente generaremos dicha serie a partir de RS. Esto es, nuevamente
elegiremos GENR y en el correspondiente cuadro de dilogo que se abre, escribiremos
esta vez: RS2 = RS^2. Despus pulsaremos OK.
48
Junta a esta opcin, existen otras posibilidades consistentes en plantear funciones para los residuos
directamente, o bien, para sus valores absolutos.
184

A partir de aqu, podemos proceder a realizar los grficos entre los cuadrados de los
residuos y una funcin de la variable explicativa que consideramos que puede ser la
principal generadora del problema de la heteroscedasticidad en el modelo.
En el presente ejercicio, la seleccin de la variable explicativa que puede causar la
heteroscedasticidad no presenta problemas, pues slo estamos considerando una: el
EMPLEO. Sin embargo, si tuvisemos ms, deberamos hacer previamente esta
seleccin, bien gracias al conocimiento econmico de las variables en cuestin que
estuvisemos considerando, o bien a travs de la aplicacin de este mtodo a todas ellas.
La siguiente cuestin que se planteara sera la seleccin de la funcin de X j que habra
que tomar; es decir, la variabilidad de la perturbacin aleatoria sigue el patrn de
comportamiento de la variable X j de forma directa, de forma inversa, de su
cuadrado? En este caso, vamos a representar grficamente el cuadrado de los residuos
nicamente en funcin del EMPLEO. Pero, de forma anloga, se podra hacer con otras
formas funcionales: su inversa, cuadrado, etc.
Para obtener dicho grfico, debemos elegir en la barra principal de mens: QUICK /
GRAPH. Se crear de este modo una nueva ventana donde escribiremos en primer lugar
la variable independiente (a representar en el eje horizontal) y luego la dependiente (a
representar en el eje vertical): EMPLEO y RS2, respectivamente. Despus de aceptar
(OK), en el nuevo cuadro de dilogo que se abre elegiremos Scatter Diagram como tipo
de grfico. Para concluir, aceptaremos (OK). La Figura 17 muestra el grfico indicado.
Figura 17
185

A la vista de ello, se puede comprobar cmo la variabilidad del cuadrado de los residuos
es mayor conforme crecen las cifras de EMPLEO, no siendo por lo tanto constante. Por
tanto, parece evidente que existe una relacin directa entre la varianza de los residuos
(y, por consiguiente, de la perturbacin aleatoria) y la variable EMPLEO, lo que parece
apuntar a la existencia de heteroscedasticidad en el modelo.
Podemos guardar este grfico llamndolo, por ejemplo, METGRAF al pulsar NAME.
Contrastes paramtricos
Junto con los mtodos grficos (ms intuitivos que precisos), se han desarrollado un
buen nmero de estadsticos para contrastar la hiptesis nula de igualdad de varianza u
homoscedasticidad de la perturbacin aleatoria correspondiente a cada observacin de la
muestra estudiada. Esta gran variedad se debe a que la especificacin de la hiptesis
alternativa de heteroscedasticidad no suele ser conocida y puede ser ms o menos
general. A continuacin, vamos a revisar algunos de estos contrastes. En concreto, nos
vamos a centrar en tres contrastes de tipo paramtrico: Park, Glesjer y White, que se
caracterizan por estar basados en las hiptesis y supuestos estadsticos establecidos en el
modelo.
El contraste de Park parte del establecimiento de una relacin funcional entre los
valores de la varianza de la perturbacin aleatoria correspondiente a las distintas
observaciones, u2i , y los de la variable explicativa X ji , para algn j 2, , k , del
tipo:
u2 2 X ji e v
i 1, , n ,
o de forma equivalente:
ln u2i ln 2 ln X ji vi
i 1,, n .
Dado que u2i se desconoce, Park propone utilizar como aproximacin los residuos al
cuadrado: ei2 . De esta forma, finalmente considera la expresin:
ln ei ln X ji vi
2
i 1,, n ,
donde ln 2 es, simplemente, una constante.

El contraste o prueba de Park consiste, en definitiva, en realizar el ajuste MCO del
logaritmo neperiano del cuadrado de los residuos respecto al logaritmo neperiano de la
variable explicativa que se considere que puede ocasionar el problema de
heteroscedasticidad (en el caso de nuestro problema, slo puede ser el EMPLEO) y
verificar si dicha relacin es significativa, mediante la hiptesis nula:
H0 : 0
H1 : 0
186

Este contraste se puede realizar con el estadstico t-Student habitual de significatividad

individual del parmetro , o bien con el estadstico F de significatividad global del
modelo, ya que en este caso, por ser un modelo de regresin lineal simple, la
interpretacin del resultado es idntica.
El rechazo de la hiptesis nula supone admitir la existencia de heteroscedasticidad.
Sin embargo, la prueba de Park presenta de forma general algunas limitaciones:
a) Se adopta ei2 como una aproximacin de u2i .
b) Es preciso seleccionar la variable X j posible causante de la heteroscedasticidad
del modelo.
c) La perturbacin aleatoria de la regresin auxiliar considerada, vi , puede
presentar problemas de heteroscedasticidad, los cuales son obviados.
Estas limitaciones nos llevan a que tengamos presente que si en el contraste se aceptase
la hiptesis nula, ello no tendra por qu significar necesariamente que el modelo resulta
homoscedstico; simplemente se estara poniendo de manifiesto que la relacin
planteada no es significativa, pero sin embargo podra haber otras que s lo fuesen, por
lo que finalmente el modelo podra presentar heteroscedasticidad.
Para llevar a cabo este contraste, deberemos estimar por MCO la regresin auxiliar
propuesta por Park y comprobar la significatividad de este ajuste. En el presente
ejercicio sera la regresin lineal entre el logaritmo neperiano del cuadrado de los
residuos (RS2) y el logaritmo neperiano de la variable EMPLEO (que es la nica
variable explicativa que tenemos, por lo que no tenemos dudas sobre su eleccin).
La realizacin de este contraste con ayuda de EViews comenzar con la estimacin del
modelo indicado segn el procedimiento habitual: seleccionando QUICK / ESTIMATE
EQUATION en la barra principal de mens y seguidamente, tal y como se muestra en
la Figura 18, escribiendo en la Ventana de Especificacin de la Ecuacin (Equation
Specification):
LOG(RS2) C LOG(EMPLEO).
Tras pulsar OK, se obtiene la pantalla del resultado de la estimacin mostrada en la
Figura 19, donde se puede comprobar cmo la regresin auxiliar planteada es
significativa para un nivel de confianza mximo del 96,42%. As pues, para un nivel de
significacin del 5%, la prueba de Park sugiere la presencia de heteroscedasticidad en
nuestro modelo.
Para conservar el ajuste llevado a cabo, podemos seleccionar la opcin NAME y darle
un nombre a esta ecuacin; por ejemplo, PARK.
187

Figura 18
Figura 19
El contraste de Glesjer constituye un test de deteccin de la heteroscedasticidad
similar en concepcin al de Park. En concreto, este contraste se basa en la regresin del
188

valor absoluto de los residuos mnimo-cuadrticos, frente a distintas especificaciones de

la variable X j , j 2, , k , que supuestamente puede estar creando los problemas de
heteroscedasticidad en el modelo; esto es:
ei X hji vi
i 1,..., n ,
con h {1, -1, 1/2, -1/2}.
En cada una de estas cuatro regresiones distintas, se trata de contrastar la

significatividad del parmetro . Es decir, este contraste tambin toma como hiptesis
nula el hecho de que la perturbacin sea homoscedstica, especificando, para el caso de
que hubiese heteroscedasticidad, varios esquemas alternativos diferentes en un intento
de determinar cul sera la pauta de comportamiento seguida por sta.
Al igual que ocurra con la prueba de Park, el contraste de Glesjer presenta ciertas
limitaciones derivadas de su propia definicin. Bsicamente son:
a) Se adopta ei como una aproximacin de ui .
b) Es preciso seleccionar la variable X j posible causante de la heteroscedasticidad
del modelo.
c) La perturbacin aleatoria de la regresin auxiliar considerada, vi , puede
presentar problemas de heteroscedasticidad, los cuales son ignorados.
Si en alguna de las regresiones auxiliares planteadas rechazamos la hiptesis nula, eso
significar que existe heteroscedasticidad en el modelo y adems esto nos permite
conocer su estructura, es decir, el supuesto de comportamiento que debemos tomar
sobre la varianza de las perturbaciones. Por el contrario, si en ninguna de las regresiones
planteadas el parmetro resulta significativo, las limitaciones anteriormente expuestas
no nos permitirn asegurar que el modelo es homoscedstico, sino simplemente que los
patrones de una posible existencia de heteroscedasticidad no son los planteados, pero
sin embargo s podran ser otros.
Si en ms de uno de los ajustes estimados el regresor es significativo, a la hora de elegir
la estructura de heteroscedasticidad ms apropiada, deberemos quedarnos con aqul que
sea ms significativo.
Cabe resaltar que, al utilizar el valor absoluto de los residuos como variable endgena
de la regresin auxiliar de Glesjer, estamos utilizando una aproximacin de la
desviacin tpica de la perturbacin y, por tanto, a la hora de determinar la estructura de
su varianza tendremos que considerar el cuadrado de la relacin detectada.
Volviendo al ejemplo sobre el que estamos trabajando, deberemos por tanto plantear
cuatro regresiones distintas, donde en todas ellas la variable dependiente ser el valor
absoluto del residuo MCO y, en cuanto, a la variable independiente sta ser: el
EMPLEO, la inversa del EMPLEO, la raz cuadrada del EMPLEO y la inversa de la raz
cuadrada del EMPLEO, respectivamente en cada caso.
189

Para hacerlo con EViews, deberemos llevar a cabo los cuatro ajustes indicados y fijarnos
en la significatividad estadstica de cada uno de ellos. As pues, deberemos seleccionar
QUICK / ESTIMATE EQUATION y escribir en la Ventana de Especificacin de la
Ecuacin 49 :
-
El primero de los ajustes: ABS(RS) C EMPLEO
El segundo: ABS(RS) C 1/EMPLEO
El tercero: ABS(RS) C SQR(EMPLEO)
Y finalmente el cuarto: ABS(RS) C 1/SQR(EMPLEO)

Los resultados de cada una de las cuatro estimaciones pueden verse en las Figuras
20, 21, 22 y 23, respectivamente.
Cabe decir que para llevar a cabo cada una de las especificaciones del modelo, no es
necesario realizar cada vez el proceso QUICK / ESTIMATE EQUATION, sino que una
vez estimado el primer ajuste, basta con seleccionar la opcin ESTIMATE de la Ventana
de Ecuacin e ir cambiando la variable explicativa en cuestin.
Como se ha indicado, en cada caso hay que realizar un contraste de significatividad
individual del coeficiente asociado a la variable explicativa en cuestin (o de
significatividad global del modelo, ya que se trata de modelos de regresin simple).
Figura 20
Ha de tenerse en cuenta que la funcin valor absoluto de una variable se escribe en EViews de la
forma: ABS(nombre de la variable). Por su parte, la raz cuadrada se escribe: SQR(nombre de la
variable).
49
190

Figura 21
Figura 22
191

Figura 23
A la vista de los resultados obtenidos, se puede observar que, para un nivel de
significacin 5% , en las regresiones primera (respecto a EMPLEO) y, en mayor
medida, tercera (respecto a su raz, SQR(EMPLEO)), los estadsticos tStudent se
sitan en la regin crtica, y, por tanto, se considera que las correspondientes variables
explican el comportamiento de los residuos; es decir, se puede concluir que la varianza
de la perturbacin aleatoria no permanece constante a lo largo de la muestra. Y, adems,
vemos que stas son las pautas de comportamiento que la heteroscedasticidad puede
seguir. As pues, vamos a guardar la regresin ms significativa, la relativa a la raz
cuadrada del EMPLEO: SQR(EMPLEO), dndole en NAME el nombre de GLESJER.
El contraste de White es un contraste paramtrico ms general y robusto, ya que no
precisa de la eleccin inicial de una variable concreta del modelo de la que dependa la
heteroscedasticidad bajo la hiptesis alternativa.
Este contraste se basa en la regresin de los cuadrados de los errores MCO, que se
toman como aproximacin de las varianzas de las perturbaciones, en funcin de: un
trmino independiente, las variables independientes del modelo, los cuadrados de stas
y, de forma optativa, sus productos cruzados dos a dos. De acuerdo con esto ltimo,
EViews incorpora dos versiones de este contraste: una en la que se incluyen en la
regresin los productos cruzados dos a dos y otra en la que stos no se incorporan. En
ambos casos, el estadstico del test de White es el producto del nmero de
observaciones por el coeficiente de determinacin de la regresin propuesta, el cual se
distribuye asintticamente, bajo la hiptesis nula, como una 2 con m grados de libertad
192

(donde m es el nmero de variables explicativas de esta regresin, sin contar la

ordenada en el origen):
W2 n R 2 m2 .
La interpretacin del contraste reside en que si las perturbaciones fueran
homoscedsticas, las variables incluidas en la regresin auxiliar no deberan tener
ningn poder explicativo sobre los residuos al cuadrado y, por tanto, el valor del
coeficiente de determinacin debera ser muy pequeo y con ello el valor del
estadstico. Por esta razn, en el caso contrario, si el valor muestral del estadstico es
suficientemente alto como para que la probabilidad de rechazar la hiptesis nula, siendo
cierta, sea menor que el nivel de significacin que nos fijemos (por ejemplo, el 5%),
rechazaremos la hiptesis nula y admitiremos la existencia de heteroscedasticidad.
Este test es el nico de los contrates considerados que viene programado en EViews.
Para realizarlo, abriremos la ecuacin AJUSTEMCO haciendo doble clic sobre ella en
el Directorio de Objetos. Una vez aqu, se sigue la secuencia VIEW / RESIDUAL
TESTS. Se abrir entonces un submen donde se nos presentar la opcin de realizar el
contraste de White con o sin trminos cruzados. Vamos a elegir la opcin con trminos
cruzados: WHITE HETEROSKEDASTICITY (CROSS TERMS), como se puede ver en
la Figura 24 (aunque en nuestro ejemplo, de cualquier forma, los resultados del
contraste de White van a ser iguales con o sin trminos cruzados, pues el modelo slo
tiene una variable explicativa distinta del trmino independiente).
Figura 24
193

El resultado del contraste, as como la regresin auxiliar estimada, se muestran en la

Figura 25.
Figura 25
A la vista del p-valor (0,051177) que aparece asociado al estadstico de prueba de White
(Obs*R-Squared), podemos sealar que para un nivel de significacin estrictamente del
5% no se podra rechazar la hiptesis nula de homoscedasticidad. No obstante, este
valor es muy prximo al 5%, con lo que dado el reducido tamao de la muestra y el
carcter asinttico de este contraste, as como por lo apuntado por todas las pruebas
anteriores realizadas (grficos y contrastes paramtricos), como conclusin final lo ms
prudente es asumir que pueden existir problemas de heteroscedasticidad en nuestro
modelo. Por tanto, lo ms apropiado es proceder a su estimacin por el mtodo de
MCG, que, como bien sabemos, proporciona estimadores lineales insesgados y ptimos
(ELIO) en estos casos. 50
Solucin a la heteroscedasticidad: estimacin del modelo por el mtodo de MCG
El mtodo de estimacin de los mnimos cuadrados generalizados (MCG) aparece como

el idneo para tratar los problemas de heteroscedasticidad, ya que hace que los
estimadores del modelo resulten ELIO.
50
En caso de duda, siempre ser preferible optar por pensar que hay un problema de heteroscedasticidad
en el modelo y proceder a su estimacin por el mtodo de MCG, cuyo estimador ser ELIO. Ntese que,
si finalmente el modelo fuese homoscedstico el estimador MCG coincidir con el obtenido por MCO. En
caso contrario, habremos cometido un error, pues el estimador MCO no sera ELIO.
194

Como ya sabemos, bsicamente el mtodo consiste en transformar el modelo original de

una forma determinada y estimar este modelo transformado por MCO.
La existencia de heteroscedasticidad supone que la matriz de varianzas-covarianzas de
la perturbacin aleatoria adopta la forma general:
u21
Var Cov (u )

2
u2
0
2
u3
0
2

u2n
donde:
u21
0
2

2
u2
0
2

0
0
2
u3
0
.

2
un
2

0
A partir de la matriz , se obtienen las matrices 1 y V 1 , donde sta ltima es tal

'
que: V V ' ; o de forma equivalente: 1 V 1 V 1 . Sus expresiones son:
2
2
u1
u2
u2
u2
u1
, V 1
u
0
Ya es sabido que, en trminos matriciales, partiendo del modelo original Y X u , la

transformacin requerida por el mtodo de MCG consiste en pre-multiplicar sus
variables por la matriz V 1 :
V 1Y V 1 X V 1u .
A nivel de las observaciones individuales i, esto se expresara de la forma:

u
i
Yi 1
X 2i j
X ji k
195
X ki
u
i
u i , i 1, 2, , n

Obsrvese que todas las variables del modelo, tanto la explicada, como las explicativas
y la perturbacin aleatoria, simplemente estn multiplicadas por un factor de
ponderacin, que podramos denominar i :
u
.
u
i
La utilizacin de esta ponderacin logra que la perturbacin aleatoria resulte

homoscedstica y que la aplicacin entonces del mtodo de MCO a este modelo
transformado, o ponderado, d lugar a estimadores ELIO. Todo este proceso, en
conjunto, no es ms que el mtodo de MCG, o tambin llamado en este caso de MCP
(mnimos cuadrados ponderados). 51
El problema de esta ponderacin reside en que lo habitual es que tanto como ui
resulten desconocidos. Dependiendo del patrn de comportamiento que se considere
que sigue la varianza de la perturbacin aleatoria (o error estndar en su caso), la
ponderacin se concretar en una expresin diferente.
A continuacin, vamos a plantear de forma sinttica los supuestos ms habituales que se
suelen asumir sobre el comportamiento de la varianza de la perturbacin y las
expresiones respectivas de las ponderaciones a que dan lugar, para su utilizacin en el
mtodo de MCG:
1. La varianza de la perturbacin aleatoria es directamente proporcional al cuadrado de
una variable explicativa X j , j 2, , k .
2
2
2
Es decir: ui X ji , i 1, 2,, n .
En este caso, V 1
1
X j1
X j2
X j3
0
1
.
; esto es: i
X ji
1
X jn
0
2. La varianza de la perturbacin aleatoria es directamente proporcional a una variable

explicativa X j , j 2, , k .
Es decir: u2i 2 X ji , i 1, 2,, n .
51
Ntese que si todas las ui fuesen iguales a (es decir, si estuvisemos ante homoscedasticidad),
todas las ponderaciones adoptaran el mismo valor, siendo ste igual a 1. As pues, el mtodo de MCO no
es ms que un caso particular de MCP donde las ponderaciones valen 1.
196

Aqu, V 1
X j1
0
1
X j2
X j3
X jn
; y: i
1
.
X ji
3. La varianza de la perturbacin aleatoria es directamente proporcional al cuadrado de

la variable estimada Y .
Es decir: u2i 2 Yi 2 , i 1, 2, , n .
En este supuesto, V 1
Y1
0
Y2
0
Y3
1
; esto es: i .
Yi

1
Yn
Lgicamente, la dificultad a la hora de llevar a cabo un ajuste por MCG consiste en

tratar de averiguar cul es el patrn de comportamiento ms adecuado que debe
adoptarse, para posteriormente fijar la ponderacin precisa. Una idea de ello la pueden
proporcionar los contrastes de deteccin de heteroscedasticidad que se deben aplicar
previamente.
La ltima de las soluciones propuestas, la que hace referencia a Y , precisamente se
elige cuando no resulta fcil detectar qu variable explicativa del modelo es la que
condiciona la heteroscedasticidad. Tomando Y , con ello se recoge el efecto de todas las
variables explicativas del modelo y, en particular, el de la variable o variables que estn
generando esta situacin.
Volviendo a nuestro ejercicio, una vez efectuados los diversos contrastes para detectar
la presencia de heteroscedasticidad en nuestro modelo, podemos suponer, segn los
resultados que obtuvimos del test de Glesjer, que la varianza de la perturbacin aleatoria
es proporcional a la variable EMPLEO (recurdese que segn la especificacin elegida
como ms significativa, el valor absoluto del residuo, que se puede considerar como una
aproximacin al error estndar de u, era proporcional a la raz cuadrada de EMPLEO).
As pues:
u2 2 EMPLEOi .
i
197

Por tanto, se tratar de transformar el modelo original dividiendo cada uno de sus
miembros por la raz cuadrada de esa variable, o lo que es lo mismo ponderndolos por:
i 1
EMPLEOi
Para llevar a cabo con EViews la estimacin por MCG en este caso, en primer lugar
haremos doble clic sobre la ecuacin ajustada por MCO (AJUSTEMCO) y
seleccionaremos ESTIMATE (Figura 26).
Despus, en el cuadro de dilogo que aparece (que ya nos resulta familiar), pulsaremos
Options. Seguidamente, marcaremos la opcin Weighted LS/TSLS (Unavailable with
ARMA) y escribiremos en Weight la ponderacin concreta que vamos a utilizar 52 :
1/SQR(EMPLEO) tal y como se muestra en la Figura 27.
Tras pulsar OK, obtendremos finalmente la salida de resultados, que podremos guardar
seguidamente con el nombre AJUSTEMCG, que se observa en la Figura 28, donde se
nos ofrecen los coeficientes estimados por MCG y los valores de los estadsticos ms
relevantes del modelo transformado obtenido tras aplicar la ponderacin
correspondiente segn el mtodo de MCG (Weighted Statistics). Junto a ello, en la parte
inferior se muestran los estadsticos derivados del ajuste MCG considerando las
variables originales del modelo (no transformadas o ponderadas) (Unweighted
Statistics).
Figura 26
52
Esta ponderacin deberemos escribirla en EViews en letras minsculas.

198

Figura 27
Figura 28
199

Otra solucin a la heteroscedasticidad: la estimacin consistente de White
Otra opcin que se puede tomar para tratar la presencia de heteroscedasticidad en un

modelo economtrico es la estimacin consistente de White. Esta solucin no da lugar
a resultados ptimos, por cuanto los estimadores obtenidos por este mtodo no son
ELIO; sin embargo, esta alternativa a MCG es muy utilizada porque no precisa conocer
el patrn de comportamiento que sigue la varianza de la perturbacin aleatoria del
modelo y, al tiempo, da lugar a resultados ms correctos que los obtenidos directamente
a travs del mtodo de MCO.
La estimacin consistente de White halla los estimadores de los parmetros del modelo
por MCO, pero adicionalmente calcula la matriz de varianzas-covarianzas de los
coeficientes de regresin de manera correcta, esto es, utilizando la expresin:
1
1
Var Cov MCO 2 X ' X X ' X X ' X .
As pues, este mtodo toma en consideracin el hecho de que la perturbacin aleatoria

u resulta no esfrica; es decir: I . Por tanto, los procedimientos de inferencia
estadstica pasan a ser asintticamente vlidos, es decir, aceptables para muestras
grandes. Se dice entonces que las varianzas de los estimadores MCO son consistentes
con heteroscedasticidad.
La estimacin consistente de White puede considerarse como una va intermedia entre
MCO y MCG.
EViews permite obtener esta estimacin de forma inmediata, puesto que tiene
programado este procedimiento. Para ello, basta con proceder del modo habitual
(QUICK / ESTIMATE EQUATION) y despus de introducir la especificacin del
modelo, manteniendo la eleccin del mtodo de MCO (LS Least Squares), se pulsa el
botn de Options, donde debe escogerse Heteroskedasticity Consistent Covariance
White (Figura 29).
Tras confirmarse esta opcin, se tendrn finalmente los resultados perseguidos (Figura
30). Si se comparan stos con los de la Figura 15 (la relativa en nuestro caso a la
ecuacin AJUSTEMCO), podr comprobarse cmo las estimaciones MCO de los
coeficientes de regresin resultan las mismas en ambas. En cambio, los valores de
los errores estndar asociados a tales coeficientes y, por consiguiente, los de los
estadsticos t-Student y los p-valores asociados a ellos, resultan diferentes. En
particular, en este caso los valores de los errores estndar son mayores en la estimacin
consistente de White. A simple vista, ello parecera peor; sin embargo, estos valores
estaran correctamente calculados, ya que tienen en cuenta la presencia de
heteroscedasticidad en el modelo.
Este resultado podramos guardarlo, como siempre pulsando NAME, con el nombre
AJUSTEWHITE.
200

Figura 29
Figura 30
201

Otra solucin ms a la heteroscedasticidad: la transformacin logartmica
Para finalizar, cabe resear que otra tcnica muy empleada en Econometra para abordar
los problemas de heteroscedasticidad detectados en un modelo, consiste en realizar una
transformacin logartmica de sus variables. Es decir, trabajar con un modelo log-log:
ln Yi 1 ' 2 ' ln X 2i j ' ln X ji k ' ln X ki vi , i 1, 2,, n .
La razn de este proceder reside en que las transformaciones logartmicas comprimen
las escalas en que se miden las variables, reduciendo as la magnitud de la variabilidad
del modelo; de este modo, al menos se atena, si no se elimina completamente, el
problema de la heteroscedasticidad. Adems, la interpretacin de los parmetros resulta
sencilla y usual en el mbito de la Economa, ya que se tratara de elasticidades. 53
En el caso que nos ocupa, para especificar un modelo de estas caractersticas
procederamos de la manera habitual seleccionando QUICK / ESTIMATE EQUATION y
escribiendo despus en la ventana que se nos abre:
LOG(VAB) C LOG(EMPLEO)
El resultado sera el que se muestra en la Figura 31.
Figura 31
Con ello, daramos por finalizado este ejercicio. Si lo deseamos, podemos guardar
nuestro fichero de trabajo a travs de FILE / SAVE AS.
53
Este mtodo, sin embargo, no sera vlido si alguna de las variables del modelo presentase valores
negativos. Asimismo, debe researse que resulta ms eficaz cuanto mayor es el tamao muestral.
202

Deteccin y tratamiento de la autocorrelacin con ayuda de EViews
Abordamos ahora con mayor profundidad el estudio de la autocorrelacin en el modelo,

consistente en la existencia de correlacin en la perturbacin aleatoria correspondiente a
las distintas observaciones de la muestra considerada.
Segn se indic con anterioridad, la autocorrelacin es un problema muy caracterstico
de los modelos de series temporales, si bien tambin puede estar presente con datos de
corte transversal.
Al igual que ocurre ante la presencia de heteroscedasticidad, cuando hay
autocorrelacin las estimaciones por MCO ya no resultan ELIO y para solucionar este
aspecto se utiliza como mtodo de estimacin alternativo el de MCG.
Si el modelo de regresin lineal Y X u presenta nicamente el problema de la
autocorrelacin, la matriz de Var Cov (u ) puede escribirse de la forma:
u2
12
Var Cov (u )
1n
12
u2
2n
23
u2
1n
1
2n
12
2
u
u2
1n
donde u2 (la varianza de u ) es constante y ij
12
23
2n
ij
u2
1n
2n
u2
cov (u i , u j )
u2
, i j , es el
coeficiente de correlacin lineal entre u i y u j .

Como ya es sabido, la autocorrelacin conlleva un problema de exceso de parmetros a
n2 n
es mayor que el nmero de
estimar en el modelo: su nmero k 1
2
observaciones ( n ), por lo que resulta imposible estimarlos. Por esta razn, se hace
necesario adoptar algn tipo de supuesto que contribuya a disminuir dicho nmero. Se
imponen as dos tipos de restricciones. Por un lado, restricciones sobre la propia
hiptesis de autocorrelacin y, por otro, restricciones sobre la estructura de
comportamiento de la perturbacin aleatoria.
Restricciones sobre la hiptesis de autocorrelacin
1. Como supuesto simplificador, ya sealado desde el principio, estableceremos la no

existencia de heteroscedasticidad en la perturbacin aleatoria.
2. La covarianza de la perturbacin aleatoria correspondiente a distintas observaciones
depende nicamente de la distancia entre ellas, es decir:
cov (u i , u i s ) s , s 1, 2, , n 1, i 1, 2, , n s .
De esta forma, la matriz de Var Cov (u ) puede expresarse de la forma:
203

1
2
2
Var Cov (u ) u u
n 1
1
1
2 n 1
1 n 2

1
1
donde u2 es la varianza (constante) de la perturbacin y s
1
1
s
es el coeficiente de
u2
correlacin lineal entre dos perturbaciones cuya distancia entre ellas es s .

Los elementos no diagonales distintos de la matriz se reducen as a n 1 y, en
consecuencia, el nmero total de parmetros a estimar pasa a ser k n . A pesar de la
disminucin experimentada, sta no resulta an suficiente, puesto que el nmero de
parmetros sigue siendo superior al nmero de observaciones n . Por este motivo, deben
establecerse hiptesis adicionales sobre la estructura de comportamiento de u .
Restricciones sobre la estructura de comportamiento de la perturbacin aleatoria
Las restricciones sobre el comportamiento de la perturbacin aleatoria dan lugar al

planteamiento de dos modelos distintos muy frecuentes: los modelos autorregresivos
(AR) y los modelos de medias mviles (MA).
Un modelo autorregresivo de orden p, AR(p), es aqul en el que la perturbacin
aleatoria u i presenta una componente sistemtica de p retardos, que pretende captar la
incidencia de momentos anteriores en el tiempo, y una componente estrictamente
aleatoria i .
Analticamente, estos modelos se expresan de la forma siguiente:
AR(1): u i 1 u i 1 i , i 2, , n
AR(2): u i 1 u i 1 2 u i 2 i , i 3, , n
AR(p): u i 1 u i 1 2 u i 2 p u i p i , i p 1, , n .
La componente aleatoria i se dice que es ruido blanco; esto significa que es una
variable aleatoria que satisface las siguientes condiciones 54 :
E ( i ) 0, i 1, , n
var ( i ) 2 , i 1,, n
cov ( i , j ) 0, i j , i, j 1, 2, , n .
Obsrvese que la perturbacin aleatoria u que cumple las hiptesis establecidas en el modelo de
regresin lineal clsico es ruido blanco.
54
204

Si nos centramos en un modelo autorregresivo de orden 1, el parmetro 1 se

corresponde con el coeficiente de correlacin lineal entre u i y u i 1 . Por esta razn,
podemos cambiar su notacin por 1 , o ms abreviadamente, por . De este modo,
tendramos que un modelo de este tipo se escribe habitualmente de la forma:
AR(1): u i u i 1 i , i 2, , n .
La matriz de Var Cov (u ) en un AR(1) adquiere una forma particular que reduce
notablemente el nmero de parmetros a estimar.
Si calculamos la varianza de u , resulta que:
u2 Var (u i ) Var ( u i 1 i ) 2Var (u i 1 ) Var ( i ) 2 Cov (u i 1 , i ) 2 u2 2 .

(Ntese que Cov (u i 1 , i ) 0 , por depender u i 1 de i 1 y ser i ruido blanco.)
Despejando de la expresin anterior, se tiene finalmente que:
2

, debiendo ser 1 .
1 2
2
u
En cuanto a las covarianzas, se obtienen las siguientes relaciones:
cov (u i , u i 1 ) u2 , i 1, 2,, n 1
cov (u i , u i 2 ) 2 u2 , i 1, 2,, n 2
cov (u1 , u n ) n1 u2
de donde se deduce que los coeficientes de correlacin lineal s entre perturbaciones
que distan s retardos, vienen dados por:
cov (u i , u i s )
u2
s u2
s , s 1, 2, , n 1 .
2
u
Y por tanto, se tiene que:

1
2 n1
n 2
2
2
Var Cov (u ) u

,
2
1

1

n 1

1
que quedar determinada conociendo 2 y .

De esta manera, en un modelo AR(1) el nmero de parmetros a estimar se ha reducido
en ltima instancia a k 2 : 1 , 2 , , k , 2 , .
205

Un modelo de media mvil de orden q , MA(q), se caracteriza porque la perturbacin

aleatoria u i presenta una componente aleatoria i (que se supone ruido blanco) y un
comportamiento sistemtico en funcin de q retardos de sta, i s , 1 s q .
Analticamente, el esquema de comportamiento de la perturbacin en un modelo de
media mvil es, segn el orden:
MA(1): u i i 1 i , i 2, , n
MA(2): u i 1 i 1 2 i 2 i , i 3, , n
MA(q): u i 1 i 1 2 i 2 q i q i , i q 1, , n
Centrndonos en un modelo de medias mviles de orden 1, es decir: MA(1), se puede
ver que la varianza de u adquiere como expresin:
u2 Var (u i ) Var ( i 1 i ) 2 Var ( i 1 ) Var ( i ) 2 Cov ( i 1 , i )

2 2 2 ( 2 1) 2 .
As pues: u2 2 2 2 ( 2 1) 2 .
En cuanto a las covarianzas:
cov (u i , ui 1 ) 2 , i 1, 2,, n 1
cov (u i , u i s ) 0, s 2, , n 1, i 1, 2,, n s .
Se dice de este modelo que no tiene memoria, en el sentido de que cuando la distancia
en la perturbacin de dos observaciones es mayor que 1, la covarianza entre ellas es
nula. Los coeficientes de correlacin correspondientes sern entonces, nulos:
s 0, s 2, , n 1 .
Por otro lado, para observaciones consecutivas se tiene que:
cov (u i , u i 1 )
u2
2
2
.
2
2
u
(1 ) 1 2
La matriz de Var Cov (u ) puede escribirse, consiguientemente, como:
1 0 0

1 0
1 2
Var Cov (u ) u2 u2
(1 2 ) 2
206
1 2
1
1 2
1 2
1 2

que quedar determinada conociendo: u2 y ; equivalentemente: 2 y . De

nuevo, pues, hemos reducido el nmero de parmetros a estimar a k 2 .
Para detectar la posible existencia de autocorrelacin, se pueden aplicar distintos
mtodos. En particular, podemos citar:
Mtodos grficos: representaciones de los residuos y correlogramas
Contrastes analticos: Durbin-Watson, Breusch-Godfrey
A continuacin, vamos a describir los mtodos indicados, aplicndolos de manera

prctica con ayuda de EViews sobre un modelo que especificaremos para tomar como
ejemplo.
As, vamos a plantear la estimacin, a travs de un modelo de regresin lineal, del
consumo pblico de cierto pas en funcin de su Producto Interior Bruto a precios de
mercado (Ejercicio n 42 del Boletn del Tema 5).
Con este fin usaremos la informacin referida al periodo 1998-2010 que nos
proporciona el fichero aut.wf1, disponible en el espacio virtual de la Asignatura en la
WebCT, relativa a las variables:
CP: Consumo pblico (en millones de unidades monetarias)
PIB: Producto Interior Bruto a precios de mercado (en millones de unidades
monetarias)
Tras abrir el fichero en EViews a travs de la sucesin de comandos FILE / OPEN /

WORKFILE, procederemos a estimar mediante QUICK / ESTIMATE EQUATION el
modelo:
CP 1 2 PIB u .
Con este propsito, en el usual cuadro de dilogo resultante deberemos escribir:
CP C PIB
Tras pulsar OK, se obtienen los resultados que muestra la Figura 32.
La observacin de todos los coeficientes, expresiones y estadsticos obtenidos podra
hacernos pensar que el modelo resulta aceptable; sin embargo, por la naturaleza de los
datos, de corte temporal, sospechamos que puede haber problemas de autocorrelacin
en la perturbacin aleatoria.
Vamos a guardar este ajuste con el nombre AJUSTEMCO, por ejemplo, seleccionando
la opcin NAME de la Ventana de Ecuacin. De este modo, podremos tener as acceso a
la estimacin cuando lo deseemos.
207

Figura 32
Mtodos grficos de deteccin
El anlisis de la posible presencia de autocorrelacin en un modelo debera basarse,

tericamente, en el estudio del comportamiento de la perturbacin aleatoria. Pero dado
que sta no es observable, en la prctica se analiza la serie de los residuos MCO que,
como sabemos, es su estimacin.
Los mtodos grficos ms usuales de deteccin de la autocorrelacin consisten, por un
lado, en representar los residuos, bien a lo largo del tiempo, o bien en relacin a los del
periodo anterior; y, por otro, en dibujar sus correlogramas. A continuacin, veremos
cada uno de ellos de forma ms concreta.
Previamente, vamos a crear en EViews una serie de datos que contenga los residuos de
la estimacin AJUSTEMCO. Recordemos que EViews, al hacer el ajuste, incluye
automticamente en la variable Resid los residuos del modelo. Pero, si se lleva a cabo
otra estimacin, estos valores sern reemplazados por los residuos del ltimo modelo
estimado. Puesto que nos interesa trabajar con los residuos de nuestro modelo
AJUSTEMCO, optamos entonces por convertirlos en un objeto especfico. De este
modo, a nuestra serie de residuos MCO la llamaremos, por ejemplo, RS. Para hacer
esto, elegimos la opcin GENR en la Ventana de Trabajo y escribimos luego en la
ventana que se abre (Enter equation): RS = RESID. Tras aceptar (OK), tendremos en el
Directorio de Objetos de nuestro fichero de trabajo el nuevo objeto RESID.
Llegados a este punto, ya estamos en condiciones de llevar a cabo los mtodos grficos
para detectar la existencia de autocorrelacin.
208

En primer lugar, analizaremos cul es el comportamiento grfico que se observa al

representar los residuos en relacin con el tiempo. Cuando se observan rachas de
residuos con el mismo signo, suele ser indicativo de autocorrelacin. Si hay pocos
cambios de signo, la autocorrelacin ser positiva; por el contrario, cuando hay muchas
rachas, se tiene evidencia de autocorrelacin negativa.
Veamos qu sucede en nuestro ejemplo al aplicar este mtodo grfico con EViews. Para
ello, nos iremos a la barra principal de mens y elegiremos: QUICK / GRAPH. Al
abrirse la ventana correspondiente, escribiremos la serie a representar: RS. Tras hacer
clic en OK, seleccionaremos Line Graph en tipo de grfico. Despus, en SHOW
OPTIONS, optaremos por Symbols only en el apartado Line Graphs. Para concluir,
pulsaremos OK.
Podemos ver el resultado en la Figura 33, que podramos grabar con el nombre GRAF1.
En el periodo 1998-2001 hay una racha de residuos negativos; le sigue una racha de
residuos positivos correspondientes al periodo 2002-2007; y, finalmente, otra racha de
residuos negativos en el periodo 2008-2010. Podemos por tanto intuir la existencia de
autocorrelacin y, adems, como hay nicamente dos cambios de signo, sera positiva.
Figura 33
Otro procedimiento grfico interesante consiste en la representacin de los residuos
frente a los del periodo anterior. Este mtodo es til para detectar, al menos, la
existencia de autocorrelacin que sigue un esquema AR(1). ste ser el caso si se
observa una relacin lineal clara entre ambas variables, ya que indicara que la
perturbacin aleatoria u i es una funcin lineal de la perturbacin aleatoria u i 1 , tal
209

como formula el modelo AR(1). Adems, podremos indicar si se trata de

autocorrelacin positiva o negativa, dependiendo del signo de la pendiente de la recta
que ajusta estos puntos.
Para hacer esta grfica con EViews, seleccionamos en el men principal QUICK /
GRAPH, y escribimos las series que deseamos representar, RS(-1) y RS, recordando que
en primer lugar debe ir aqulla que queramos posicionar sobre el eje X. Obtendremos el
grfico que aparece en la Figura 34, bajo la seleccin previa del tipo de grfico Scatter
Diagram. La nube de puntos resultante, que podemos nombrar como GRAF2, parece
indicar claramente la existencia de una relacin lineal directa entre ambas variables,
sugiriendo la posible presencia de autocorrelacin positiva, siguiendo, al menos, un
esquema AR(1).
Figura 34
Otro mtodo grfico habitual para evidenciar la posible existencia de autocorrelacin es
la realizacin del correlograma de los residuos.
Aqu podemos encontrar dos variantes. La primera se refiere a la representacin grfica
de la llamada funcin de autocorrelacin (FAC), es decir, de los coeficientes de
correlacin ( s ) entre distintas observaciones de la serie de los residuos en funcin de
la distancia o retardo s que hay entre ellas. La otra posibilidad consiste en trabajar con
los coeficientes de correlacin parcial ( s ), que miden la correlacin entre dos
observaciones de dicha serie en funcin de los retardos, sin tener en cuenta la influencia
de las dems observaciones, obtenindose as la representacin de la denominada
funcin de autocorrelacin parcial (FACP).
210

El comportamiento de la FAC y la FACP se puede resumir en el siguiente cuadro:

Funcin de Autocorrelacin
(FAC)
Funcin de Autocorrelacin
Parcial (FACP)
AR(p)
Muchos coeficientes no nulos

que decrecen con el retardo
como mezcla de exponenciales y
senoides
p primeros coeficientes no nulos

y el resto cero
MA(q)
q primeros coeficientes no nulos

y el resto cero
Muchos coeficientes no nulos

que decrecen con el retardo
como mezcla de exponenciales y
senoides
En la prctica, se representan los correlogramas de los residuos y no de la serie de la

perturbacin aleatoria, que en teora es lo que debera hacerse. Esto da lugar
generalmente a que los correlogramas estimados no sigan claramente el comportamiento
terico esperado. Por esta razn, las consideraciones prcticas a tener en cuenta seran:
-
La identificacin del proceso se lleva a cabo con la FAC para los AR y la FACP
para los MA. Si la FAC presenta un mayor nmero de coeficientes significativos en
los primeros retardos, estaramos ante un proceso AR; en cambio, si esto ocurre en
la FACP, sera un proceso MA.
La identificacin del orden del modelo se realiza en los AR con la FACP y en los
MA con la FAC, y vendr dado por el nmero de coeficientes que se muestren
significativos en la funcin correspondiente.
Un coeficiente significativo para un retardo que no corresponda a los primeros

valores de retardos, en principio, no ser relevante.
Para llevar a cabo los correlogramas, el modo de proceder con EViews es seleccionar, en
la Ventana de Ecuacin de nuestro modelo AJUSTEMCO, la opcin VIEW /
RESIDUAL TESTS / CORRELOGRAM Q-STATISTICS, indicando el nmero de
retardos que se quieren incluir (Lags to include). Por defecto, EViews nos plantea 11
retardos (Figura 35). Generalmente este nmero es suficiente, por lo que nos
quedaremos con esta propuesta.
El resultado se muestra en la Figura 36, donde podemos apreciar que hay un mayor
nmero de coeficientes significativos (o prximos a serlo para un 5 % ) en la FAC
que en la FACP, lo que nos indica que estamos antes un modelo AR para la
perturbacin aleatoria. Para determinar el orden, nos fijamos entonces en los
coeficientes de la FACP que se salen del intervalo de confianza sealado con lneas
verticales de trazo discontinuo (para un 95% de nivel de confianza). Vemos que
nicamente el primero de ellos est fuera de dicho intervalo, lo que nos permite pensar
211

que estamos ante un modelo AR de orden 1, al igual que nos sugeran los otros grficos
representados anteriormente.
Figura 35
Figura 36
212

Contrastes analticos
Adems de los mtodos grficos, existen diversas posibilidades de tipo analtico para
contrastar la existencia de autocorrelacin. La hiptesis nula que se establece en todos
los casos es la ausencia de autocorrelacin y la diferencia entre unos contrastes y otros
radica en la hiptesis alternativa que se formula. A veces, stas son muy generales y
nicamente nos indican la existencia de autocorrelacin, mientras que en otros casos, no
slo plantean la existencia de autocorrelacin, sino tambin el esquema concreto de la
misma que est presente en el modelo.
A continuacin, vamos a revisar dos de estos contrastes.
El contraste de Durbin-Watson permite comprobar la existencia de autocorrelacin de
tipo AR(1). Recordemos que sta responde al siguiente esquema: u i u i 1 i ,
i 2, , n , donde i es ruido blanco.
La hiptesis nula que se plantea en el contraste de Durbin-Watson es:

H 0 : Ausencia de autocorrelacin de tipo AR(1) ( 0 )
La hiptesis alternativa puede tener dos formulaciones distintas:
H 1 : Autocorrelacin positiva de tipo AR(1) ( 0 )
o bien, autocorrelacin negativa de tipo AR(1) ( 0 )

El estadstico de Durbin-Watson se define, a partir de los residuos, como 55 :
n
DW
e
i 2
ei 1
e
i 2
2
i
Asimismo, se puede demostrar que DW 2(1 ) , siendo
e
i 2
ei 1
ei2
i 2
Como 1 1 , se deduce que 0 DW 4 . A partir de aqu, se pueden extraer las

siguientes conclusiones:
a) Cuando 1 (que refleja autocorrelacin positiva plena en la perturbacin
aleatoria para las distintas observaciones de la muestra), el estadstico DW
tomar un valor muy prximo a 0.
55
Algunos autores inician el sumatorio de la expresin del denominador en i 1 .

213

b) Cuando 1 (que refleja autocorrelacin negativa plena en la perturbacin

c) Cuando 0 (que refleja ausencia de autocorrelacin en la perturbacin
Este contraste tiene, sin embargo, algunas limitaciones:
1. Slo permite contrastar la existencia de autocorrelacin de tipo AR(1).
2. No es vlido si entre las variables explicativas del modelo se encuentra la variable
endgena retardada.
3. No es estrictamente vlido si el modelo no tiene ordenada en el origen.
4. La distribucin del estadstico de Durbin-Watson, DW, depende de la matriz de
datos X de las variables explicativas del modelo, lo que hace imposible obtener una
tabla de valores crticos nica a partir de la cual se puedan efectuar contrastes de
hiptesis independientemente de la muestra utilizada.
Este ltimo problema fue resuelto por Durbin y Watson con la obtencin de cotas
inferior ( d L ) y superior ( dU ) sobre el conjunto de todas sus posibles distribuciones de
probabilidad, para cada nivel de significacin y cada tamao muestral. De esta manera,
grficamente se pueden representar las distribuciones de probabilidad de dichas cotas,
las cuales son independientes de X , aunque s dependen del nivel de significacin, del
nmero de variables explicativas y del tamao muestral.
La representacin grfica de estas distribuciones (Figura 37) nos permite distinguir
distintas zonas, de modo que:
Si DW d L , entonces existe autocorrelacin positiva.
Si DW d U , entonces no existe autocorrelacin positiva.
Si d L DW d U , nos encontramos en una zona de duda, si bien est claro

que no existe autocorrelacin negativa.
Si DW 4 d L , entonces existe autocorrelacin negativa.
Si DW 4 d U , entonces no existe autocorrelacin negativa.
Si 4 d U DW 4 d L nos encontramos en una zona de duda, aunque est

claro que no existe autocorrelacin positiva.
En el caso de que el estadstico DW caiga en alguna de las zonas de duda, una forma
conservadora de proceder sera actuar como si existiese autocorrelacin aunque no la
hubiese, en lugar de lo contrario.
214

Figura 37
Cuando trabajamos con EViews, el estadstico de Durbin-Watson aparece directamente
entre los estadsticos de la salida de resultados bsicos (Estimation Output) que se
muestran al hacer la estimacin.
As, en la salida de la regresin AJUSTEMCO (Figura 32) se puede encontrar el valor
del estadstico Durbin-Watson (Durbin-Watson stat): 0,343122. Para un nivel de
significacin del 5% las cotas inferior y superior con un tamao muestral igual a 13 son
1,01 y 1,34, respectivamente (estas cotas se buscan en las tablas correspondientes).
Estamos entonces en el caso en que DW d L , con lo que, adems de rechazar la
hiptesis nula de no autocorrelacin, podemos decir que la autocorrelacin presente es
positiva y de tipo autorregresivo de orden 1.
El contraste de Breusch-Godfrey permite contrastar la existencia de autocorrelacin
de forma ms general que el contraste de Durbin-Watson, puesto que es vlido tanto
para procesos AR como MA y para cualquier orden de autocorrelacin. Tiene adems la
ventaja, con respecto al contraste de Durbin-Watson, de que se puede aplicar incluso
cuando entre las variables explicativas est presente la variable endgena retardada.
Las hiptesis nula y alternativa que se plantean en este contraste son:
H 0 : Ausencia de autocorrelacin de orden p
H 1 : Autocorrelacin de orden p (AR(p) MA(p)).
215

Este contraste parte de la estimacin por MCO del modelo analizado en cuestin.
Seguidamente se estima una regresin auxiliar de sus residuos en funcin de p retardos
de stos y de las variables explicativas del modelo (pudiendo, incluso, introducirse
variables endgenas retardadas):
ei 1 2 X 2i k X ki 1ei 1 p ei p vi .
Se calcula entonces el coeficiente de determinacin R 2 de esta regresin auxiliar y con

l se construye el estadstico de prueba siguiente:
2
BG
n R 2 p2 ,
donde n es el nmero de observaciones que conforman la muestra y p es el nmero de

retardos de los residuos que se introducen en la regresin auxiliar.
EViews ofrece la posibilidad de realizar directamente este contraste, solicitando como
informacin el nmero de retardos p a introducir en la regresin auxiliar que se plantea.
La forma prctica de operar es ir seleccionando progresivamente los retardos, hasta que
se acepte la hiptesis nula de no autocorrelacin del orden indicado o el contraste de
significacin individual del residuo correspondiente al ltimo retardo introducido
indique no rechazo de la hiptesis nula. En ese momento, acabar el proceso y el orden
de la autocorrelacin ser el del ltimo retardo que haya resultado significativo (si
ninguno lo es, se aceptar entonces la hiptesis nula de ausencia de autocorrelacin).
El contraste de Breusch-Godfrey presenta como inconveniente el hecho de que si bien
puede indicar el orden de retardos hasta el que llega la autocorrelacin de la
perturbacin aleatoria en un modelo (caso de estar presente), no permite sin embargo
discernir cul es el esquema exacto de la misma; esto es, si es de tipo AR, o bien de tipo
MA.
Para aplicar el contraste de Breusch-Godfrey a nuestro ejemplo, abriremos la Ventana
de Ecuacin AJUSTEMCO y seleccionaremos VIEW / RESIDUAL TESTS / SERIAL
CORRELATION LM TEST (Figura 38). Aqu escribiremos, en principio, 1 retardo.
En la Figura 39, vemos que EViews nos ofrece el valor (8,473176) del estadstico
experimental de Breusch-Godfrey (Obs*R-squared), siendo su p-valor asociado
0,003604, por lo que incluso para un nivel de confianza del 99% dicho estadstico se
sita en la regin crtica, lo que nos lleva a rechazar la hiptesis nula de no
autocorrelacin. Adems, en la parte inferior de la salida se ofrece la regresin auxiliar
de los residuos MCO en funcin de las variables explicativas del modelo y de los
retardos elegidos de dichos residuos (en este caso 1). En relacin con dicha salida,
debemos fijarnos en que el p-valor del estadstico t correspondiente al primer retardo de
los residuos RESID(-1) es igualmente muy pequeo (0,0015), por lo que para los
niveles de confianza ms exigentes tambin resulta significativo.
216

Figura 38
Figura 39
Seguidamente se puede operar de manera anloga con 2 retardos en los residuos de la
regresin auxiliar (Figura 40).
217

Figura 40
El estadstico experimental del contraste de Breusch-Godfrey, cuyo valor es 8,997396,
tiene ahora una probabilidad asociada de 0,011123 y si trabajsemos con un nivel de
significacin del 5%, el estadstico se situara, como en el caso anterior, en la regin de
rechazo de la hiptesis nula de no autocorrelacin (en cambio, no sucedera as para un
1%). Si atendisemos a la regresin auxiliar, el contraste de significacin individual del
segundo retardo de los residuos RESID(-2) llevara a no rechazar la hiptesis nula, dado
que el p-valor de su estadstico t experimental es 0,3058. As pues, este segundo retardo
parece que ya no es significativo en el comportamiento de los residuos MCO.
La conclusin del contraste de Breusch-Godfrey es, por tanto, que existe
autocorrelacin en la perturbacin aleatoria y que sta es de orden 1.
Solucin a la autocorrelacin: estimacin del modelo por el mtodo de MCG
Como bien sabemos, el mtodo de MCG es el mtodo alternativo a MCO que debe
aplicarse para obtener estimadores ELIO cuando el modelo presenta autocorrelacin.
El modo de operar con EViews es bien sencillo, una vez que se ha identificado la
estructura de comportamiento de la perturbacin aleatoria del modelo. En el presente
ejemplo, hemos visto que parece que se trata de un modelo autorregresivo de orden 1.
Bastar entonces con aadir al ajuste de regresin el trmino AR(1).
Para ello, seleccionamos QUICK / ESTIMATE EQUATION y escribimos en el cuadro
de dilogo resultante:
CP C PIB AR(1)
218

Despus de aceptar (OK), el resultado obtenido se puede observar en la Figura 41.

Podemos guardarlo con el nombre AJUSTEMCG, en NAME.
Figura 41
El coeficiente asociado a AR(1) es la estimacin del coeficiente de correlacin
correspondiente al esquema que sigue la perturbacin. Puede observarse que dicho
coeficiente es estadsticamente significativo a un nivel de confianza mximo de ms del
99% y que su valor (0,860219) est bastante prximo a 1, lo que reafirma la existencia
de autocorrelacin positiva (y adems muy elevada) de orden 1.
Los coeficientes asociados a C y PIB son los estimadores MCG del modelo, que
resultan ser ELIO.
Para concluir, cabe resear que si la autocorrelacin siguiera un esquema AR(p), se
aadiran a la estimacin los trminos AR(1), AR(2), , AR(p), siendo sus parmetros
de la regresin:
asociados las estimaciones de los coeficientes i
u i 1 u i 1 p u i p i . En el caso de que se tratase de un modelo de medias
mviles de orden q, MA(q), se aadiran a la estimacin los trminos MA(1), MA(2)

hasta MA(q); los parmetros asociados a estas variables sern las estimaciones de los
coeficientes i de la regresin u i 1 i 1 2 i 2 q i q i , que establece el
modelo MA(q).
Tras esto, el ejercicio estara concluido y, si lo deseamos, podemos guardar el fichero de
trabajo a travs de FILE / SAVE AS.
219
MODELOS CON VARIABLES DEPENDIENTES DISCRETAS

TEMA 5
Modelos con variables dependientes discretas
Con la introduccin de variables ficticias en el modelo ya vimos que las variables de
tipo cualitativo podan estar presentes en el mismo, actuando en tal caso como
explicativas.
Pero la presencia de una variable cualitativa en un modelo tambin puede darse en el
papel de variable dependiente. Quizs nuestro objetivo sea estudiar los factores que
influyen en la ocurrencia o no de un determinado suceso o fenmeno econmico, como
la disponibilidad de vivienda, la compra de un determinado bien o el disfrute de un
servicio. De esta forma, surgen los modelos con variables dependientes discretas.
3.7.
Definicin de los modelos de eleccin discreta.-
Los modelos de eleccin discreta se caracterizan por el hecho de permitir reflejar la

eleccin o toma de decisin por parte de un individuo entre diversas alternativas
posibles. Si stas son solamente dos, hablaremos de modelos de eleccin binaria. En el
caso de que se traten de ms de dos, entonces estaremos ante los denominados modelos
de eleccin discreta de respuesta mltiple, donde se pueden encontrar varios tipos,
aunque bsicamente se puede hacer una primera distincin en relacin a si las diferentes
alternativas posibles estn ordenadas o no.
En nuestro caso, nos vamos a centrar en el estudio de los modelos de eleccin discreta
binaria, esto es: al individuo se le plantea tomar una decisin de entre nicamente dos
posibilidades mutuamente excluyentes. La variable endgena Y de estos modelos adopta
dos nicos valores numricos discretos, normalmente 0 y 1; de modo que si el sujeto se
decanta por la ocurrencia del suceso objeto de estudio entonces Y toma el valor 1, y 0, si
no es as.
Estos modelos facilitan la tarea de identificacin de las caractersticas o factores que
inciden en un comportamiento de los individuos diferente ante los procesos de
decisin 56 . Algunas situaciones a las que les son aplicables son, por ejemplo: acudir o
no al mdico, disponer o no de cobertura aseguradora, adquirir o no una vivienda, etc.
Podemos plantear este tipo de modelos como sigue.
Si suponemos que la variable Y depende de un conjunto de variables explicativas X, de
manera que:
56
La base econmica sobre la que se fundamentan estos modelos es la Teora de la Utilidad de Von
Neumann-Morgenstern, establecida en 1944. De acuerdo con sta, los sujetos se comportan ante una
disyuntiva, de tal modo que tratan de maximizar la utilidad esperada que les reporta cada una de las
alternativas posibles sobre las que han de decidirse.
220

Yi F ( X i ) u i ,
donde X i X 1i , X 2i , , X ki hace referencia a las observaciones de todas las variables
explicativas del modelo, entonces se tiene que:
E Yi | X i E F ( X i ) E u i F ( X i ) ,
manteniendo el supuesto de que E u i 0 .
Por otra parte, si se calcula la esperanza condicionada de Y en trminos probabilsticos,
entonces:
E Yi | X i Yi P (Yi | X i ) 1 P (Yi 1 | X i ) 0 P (Yi 0 | X i ) P (Yi 1 | X i ) .
i
De donde se deduce, pues, que:

E Yi | X i F ( X i ) P (Yi 1 | X i ) .
Teniendo en cuenta que la variable Yi nicamente puede tomar los valores 1 y 0, el
significado del modelo implica que ste asigna cierta probabilidad condicional de que
Yi 1 , que denotaremos por Pi , es decir:
P (Yi 1 | X i ) Pi F ( X i ) ;
y, en consecuencia:
P (Yi 0 | X i ) 1 Pi 1 F ( X i ) .
El modelo estima, por tanto, la probabilidad para la observacin i de elegir la opcin 1,
ya que:
Yi F ( X i ) Pi .
Dependiendo de la forma funcional concreta que adopte F ( X i ) , se obtienen distintos

modelos de eleccin binaria. Veremos los principales.
3.8.
Modelo lineal de probabilidad.-
El modelo lineal de probabilidad (MLP) es un modelo de respuesta o eleccin binaria

caracterizado porque F ( X i ) adopta la forma de una funcin lineal, de modo que:
F ( Xi ) Xi .
As pues:
Yi F ( X i ) u i X i u i .
221

De este modo:
E Yi | X i F ( X i ) X i 1 Pi 0 (1 Pi ) Pi , por lo que:
E Yi | X i Pi X i .
En definitiva, la probabilidad de que ocurra el suceso objeto de estudio, se puede

estimar a partir de un ajuste de regresin lineal entre la variable dependiente Y y las
independientes X:
Yi Pi X i ;
es decir, los valores estimados del modelo Yi , representan las estimaciones de la

probabilidad de que Yi 1 .
En cuanto a la interpretacin de los valores estimados de los parmetros o coeficientes
de regresin del MLP, stos miden el efecto, en trminos de probabilidad de eleccin de
la alternativa estudiada, de un cambio unitario en cada una de las variables explicativas
Xj (j = 1, 2,, k):
Pi
F ( X i )
j.
X ji
X ji
En el caso de que Xj sea una variable ficticia o dummy, entonces el efecto de una
variacin de dicha variable sobre la probabilidad de que Y tome el valor 1 se calcula a
travs de la diferencia entre los valores obtenidos por E Yi | X ji 1 y E Yi | X ji 0 .

Pese a la facilidad de planteamiento de este modelo, presenta importantes limitaciones.
stas son:
No normalidad de la perturbacin aleatoria; en efecto: para Yi 1 tenemos que

u i 1 X i 1 Pi , y para Yi 0 , u i 0 X i Pi , por lo que 1 u i 1 ,
cuando el rango de variacin de una variable aleatoria normal es (,) . En
concreto, u i sigue una distribucin binomial.
Escasa fiabilidad del coeficiente de determinacin R 2: sus valores suelen ser

muy bajos debido a lo elevadas que son las sumas cuadrticas de los residuos;
tngase en cuenta que lo que se trata es de ajustar una funcin lineal a
observaciones que adoptan dos nicos valores extremos: 1 y 0 (Figura 1).
Estimaciones de la probabilidad no acotadas: el MLP no garantiza

matemticamente que los valores que se estimen, Yi Pi , estn comprendidos
entre 0 y 1, lo que contradice gravemente el concepto terico de probabilidad.
ste es uno de los principales problemas de este modelo.
Planteamiento poco realista sobre el comportamiento de la probabilidad; sta es

otra grave limitacin. El hecho de suponer que la probabilidad aumenta
linealmente con los valores de X, es decir, que el efecto marginal de X se
222

mantiene constante a lo largo de todas las observaciones, resulta difcil de

admitir empricamente 57 .
Heteroscedasticidad de la perturbacin aleatoria; an cuando se puedan

mantener en este modelo las hiptesis de que la perturbacin aleatoria tiene
media 0 y que es serialmente independiente, si acudimos a la definicin de su
varianza, veremos que sta tiene un valor distinto para cada observacin i-sima.
************
Eleccin
************
Figura 1
Debido al problema de heteroscedasticidad de este modelo, la aplicacin de MCO dara
lugar a estimadores que no seran ELIO, porque si bien seran lineales e insesgados, no
tendran mnima varianza. El mtodo de estimacin ms adecuado sera entonces el de
los mnimos cuadrados generalizados (MCG) 58 .
Pero aunque la estimacin por el mtodo de MCG permite obtener estimadores
eficientes del modelo, los problemas persisten:
Los estimadores son eficientes, pero si se eliminan aquellas estimaciones

incoherentes, entonces ya no son robustos.
Con la transformacin realizada, el modelo pierde su trmino independiente, lo

que puede originar problemas sobre R 2, ya de por s subestimado, pues puede
llegar a tener valor negativo.
57
Si se piensa por ejemplo en la adquisicin de una pliza privada de enfermedad por parte de los hogares
en funcin de su renta, parece evidente que a niveles bajos, la probabilidad ir creciendo lentamente, ya
que se carece de posibilidades; a partir de un cierto momento comenzar a subir ms rpidamente; y, de
nuevo, en niveles de probabilidad cercanos a 1, correspondientes a altos niveles de renta, el efecto
marginal ser de nuevo menor, pues muchos hogares dispondrn ya de dicha cobertura.
58
Como ya sabemos, si bien el modo ms correcto de actuar sera estimar el modelo por el mtodo de
MCG, una opcin intermedia, fcil y ms eficiente que MCO, sera aplicar la estimacin consistente de
White. Recurdese que, mediante este mtodo, la estimacin de los coeficientes de regresin del modelo
es la misma que por MCO, pero sin embargo, la matriz de varianzas-covarianzas de stos se estima
correctamente, lo que repercute en una mayor fiabilidad de los contrastes de hiptesis que se planteen.
223

La perturbacin aleatoria contina sin seguir una distribucin normal, lo que

invalida todos los desarrollos inferenciales establecidos por la Teora
Economtrica para los modelos clsicos de regresin lineal. No obstante, este
problema se puede solventar empleando muestras con un tamao
suficientemente grande. De acuerdo con el Teorema Central del Lmite, la
distribucin binomial en el lmite se comporta como una distribucin normal.
Pero los principales problemas del MLP permanecen: la adopcin del supuesto
lineal y que no hay nada que asegure que las estimaciones de la probabilidad
estn entre 0 y 1.
Est claro, pues, que la solucin pasa por encontrar algn tipo de funcin F ( X ) que en
lugar de ser lineal, tenga forma de S (vase la Figura 2). Es aqu cuando surgen
entonces modelos como el logit o el probit.
************
Eleccin
************
Figura 2
3.9.
Modelo logit y modelo probit.-
Los modelos logit y probit son modelos de eleccin binaria no lineales muy semejantes.
Presentan una serie de propiedades que justifican su utilizacin:
Se definen para todo valor de las variables explicativas: , .
Sus funciones de distribucin son continuas y toman siempre valores

comprendidos entre 0 y 1.
Cuando X i Pi 0 .
Cuando X i Pi 1 .
Incrementan montonamente respecto a X i .

224

La diferencia bsica entre ellos radica en la funcin de distribucin de probabilidad

sobre la que se basan, F (.) . En concreto, el logit emplea la funcin logstica de
distribucin: (.) y el probit, la correspondiente a la distribucin normal: (.) . Estas
funciones de distribucin se caracterizan por tener forma de S; su punto de inflexin
depende de cada una de ellas.
Definicin del modelo logit
El modelo logit es un modelo de respuesta o eleccin binaria, caracterizado porque la

funcin F ( X i ) se corresponde con la de la distribucin logstica, de modo que si
denotamos sta por (.) , tenemos que:
Yi ( X i ) u i .
De esta forma:
E Yi | X i P Yi 1 | X i Pi ( X i )
1
1 e Xi
y
P Yi 0 | X i 1 Pi 1
1
1
.
Xi
1 e
1 e Xi
As pues, la estimacin del modelo proporciona la cuantificacin de la probabilidad de

elegir la opcin 1; es decir:
Yi Pi ( X i )
1
1 e X i
La interpretacin de los parmetros j en un modelo logit no es inmediata, ya que no

nos proporciona, como en el caso de los modelos lineales, el efecto marginal de un
cambio unitario en Xj sobre la probabilidad de elegir la alternativa 1 (la variable
endgena Y).
En efecto, dada la no linealidad del modelo, se tiene que:
1
Xi
Pi
1 e
e Xi ,
1
1 Pi
1 e Xi
de donde:
P
X i ln i
1 Pi
Li .
Li recibe el nombre de logit, y es lo que da nombre al modelo. El logit representa el

logaritmo neperiano de la razn de la probabilidad a favor de la alternativa 1. Por tanto:
225

Li
.
X ji
Es decir, los parmetros miden el cambio en el logit ocasionado por un cambio unitario
en la variable Xj; esto es, cunto vara el logaritmo de la razn de probabilidades a favor
de la ocurrencia de la opcin 1, ante incrementos unitarios de Xj , no el efecto marginal
de un cambio unitario en Xj sobre la probabilidad de ocurrencia de la opcin 1, Pi.
ste ltimo viene dado por la expresin:
Pi
( X i )
(Xi) j ,
X ji
X ji
donde ( X i ) es la funcin de densidad de la distribucin logstica.

Esto es, la variacin en la probabilidad de la ocurrencia de la opcin estudiada ante
variaciones unitarias de Xj viene dada por el producto de j por el valor que toma la
funcin de densidad de la distribucin logstica en la observacin i-sima.
Este ltimo detalle es importante. La magnitud de la variacin de la probabilidad, dado
un incremento unitario de la correspondiente variable explicativa, depende de su nivel
de partida y, por consiguiente, de los valores de todos y cada uno de los regresores y
coeficientes en la observacin donde se estudie. Esto supone, como puede observarse, la
superacin de la limitacin que ofreca el MLP respecto a la consideracin de un efecto
marginal de las variables explicativas sobre la probabilidad constante para todas las
observaciones; supuesto que considerbamos poco ajustado a la realidad.
En el caso de que Xj sea una variable dummy, el anlisis del efecto marginal de sta
sobre la probabilidad se calcula a travs de la diferencia de los valores proporcionados
por E Yi | X ji 1 y E Yi | X ji 0 .
Como el efecto marginal de un cambio unitario de Xj sobre la probabilidad vara
dependiendo de la observacin donde se realice, para obtener un valor representativo
ste se suele medir en los valores medios de los regresores.
Es importante resear que el signo de j s indica el sentido del cambio en la
probabilidad, aunque no su cuanta.
La estimacin de este modelo se realiza habitualmente a travs del mtodo de mxima
verosimilitud (MV). Los estimadores MV resultan ser consistentes y asintticamente
eficientes, por lo que este mtodo es recomendable que se emplee para muestras
suficientemente grandes.
226

Definicin del modelo probit
Otro de los modelos de eleccin binaria es el modelo probit. Este modelo se caracteriza
porque la funcin de distribucin que utiliza es la correspondiente a la normal: (.) . De
este modo, se tiene que:
Yi ( X i ) i .
Y consiguientemente:
Xi
E Yi | X i P Yi 1 | X i Pi ( X i ) ( s ) ds ,
s
1
2 es la funcin de densidad de la distribucin normal y s es
donde ( s )
e
(2 )1 / 2
una variable muda de integracin con media cero y varianza 1.

As que, la estimacin del modelo ofrece la cuantificacin de la probabilidad de elegir la
alternativa 1; esto es:
Yi Pi ( X i )
X i
1
e
(2 )1 / 2
s2
2
ds .
En cuanto a la interpretacin de los parmetros, en el modelo probit sucede exactamente

igual que en el modelo logit. Los parmetros estimados no determinan el efecto
marginal de variaciones de las variables explicativas Xj sobre la probabilidad, aunque su
signo s determina el sentido del cambio. El efecto marginal resulta del producto del
valor de la funcin de densidad del modelo (en este caso la normal) en un punto
determinado y el parmetro correspondiente:
Pi
(Xi)
(Xi ) j .
X ji
X ji
Como se puede observar, la magnitud de las variaciones de la probabilidad depende del

nivel donde se observe, por lo que (de forma anloga a como sucede en el modelo logit)
es funcin de los valores de todas y cada una de las variables explicativas y de sus
coeficientes en aquella observacin donde se estudie.
Si Xj fuese una variable ficticia o dummy, el anlisis de su efecto marginal sobre la
probabilidad, se realiza a travs de la diferencia de los valores proporcionados por
E Yi | X ji 1 y E Yi | X ji 0 .
De nuevo, para obtener un valor representativo de los efectos marginales stos se suelen
medir en los valores medios de los regresores.
Un aspecto ms que se puede considerar, a la hora de interpretar el significado de estos
modelos, es el relativo a los denominados odds y ratio odds.
227

El estadstico odds mide el cociente de probabilidades para una observacin i de elegir

la opcin 1 frente a la opcin 0; es decir: 59
Odds
Pi
.
1 Pi
Si lo que se quiere es comparar la utilidad que la opcin elegida proporciona al

individuo (observacin) i, con respecto a la utilidad percibida por el individuo
(observacin) m, entonces se define el cociente o ratio odds:
Pi
1 Pi
.
Ratio odds
Pm
1 Pm
De este modo, si la ratio odds es:

- mayor que 1: la utilidad para el individuo i es mayor que para el individuo m;
- menor que 1: la utilidad para el individuo i es menor que para el individuo m;
- igual a 1: la utilidad para ambos individuos, i y m, es la misma.
Al igual que el modelo logit, el modelo probit suele estimarse por el mtodo de MV.
Contraste de significatividad individual
La estimacin de los parmetros de estos modelos por MV resulta asintticamente

normal, por lo que los contrastes resultan asintticos. stos se realizan de forma similar
a como se hace en el modelo de regresin lineal, con la diferencia de que en lugar de
emplear estadsticos que siguen la distribucin t-Student, en este caso se trabaja con la
distribucin normal tipificada.
De este modo, para contrastar la hiptesis nula H 0 : j 0 , se tendr que:
P N / 2
N / 2 1 ,
ES ( j )
donde para un nivel de confianza 1 , N / 2 y N / 2 son los valores crticos

(simtricos) de la distribucin normal tipificada, j se refiere a cada uno de los
parmetros estimados, y ES ( j ) es la estimacin del error estndar del parmetro
estimado correspondiente.
Como bien sabemos, si la desigualdad se verifica, ello supondr aceptar la hiptesis
nula, con lo que el parmetro j, y con ello la variable explicativa Xj, no sern
59
Obsrvese cmo lo que se defini como logit, no es ms que el logaritmo del estadstico odds.
228

significativos. Si por el contrario, no se verificase, querr decir que la variable en

cuestin es relevante en la explicacin de la variable dependiente del modelo.
Medidas de bondad del ajuste y de contraste de significatividad global de los

modelos de eleccin discreta binarios
En estos modelos, el habitual coeficiente de determinacin R 2 no resulta vlido como

medida de bondad del ajuste. Por ello, se han desarrollado otras medidas alternativas.
- R2 de McFadden:
Su expresin es:
R 2 de McFadden 1
ln( L)
,
ln( LR )
donde ln(LR) es el logaritmo neperiano de la funcin de verosimilitud del modelo

restringido, bajo la hiptesis nula H 0 : 2 k 0 , mientras que ln(L) es el
logaritmo de la funcin de verosimilitud del modelo original (sin restricciones).
El valor de este estadstico est comprendido entre 0, que implica nula significatividad
del modelo, y 1, que supone un ajuste perfecto, pero para los valores intermedios su
significado no es tan claro ni directo como en el caso del R2 lineal.
- Estadstico LR (LR-statistic) o test de la razn de verosimilitud:
El estadstico LR se define de la forma:

LR 2
ln( LR )
,
ln( L)
donde, al igual que en el caso del R 2 de McFadden, ln(LR) es el logaritmo neperiano de

la funcin de verosimilitud del modelo restringido, bajo la hiptesis nula
H 0 : 2 k 0 y ln(L) es el logaritmo de la funcin de verosimilitud del modelo
original (sin restricciones).
Este estadstico sigue una distribucin 2 con k 1 grados de libertad.
El rechazo de H 0 implica que el modelo es, en su conjunto, significativo. Por el
contrario, su aceptacin implica que no lo es.
- Pseudo R2 de prediccin:
Esta medida indica la proporcin de predicciones correctas que realiza el modelo.

Concretamente, se define como:
Pseudo R 2 de prediccin
Predicciones correctas
,
n
donde n es el nmero de observaciones muestrales.

229

Normalmente, el valor umbral que se suele adoptar para asignarle un valor a una
prediccin es 0,5; de tal manera que:
si Yi 0,5 , entonces se asigna a la prediccin el valor 1;
y si Yi 0,5 , se asigna a la prediccin el valor 0.
A partir de aqu, se cuentan entonces los valores 1 y 0 asignados, comparndolos con

los de las observaciones reales, para calcular as el Pseudo R2 de prediccin.
Comparacin y eleccin entre modelos de eleccin discreta binarios
Los siguientes estadsticos que vamos a tratar se refieren a prdida de informacin.

De algn modo sirven tambin para evaluar la bondad de un modelo, por cuanto se
utilizan, en base a sus valores, para comparar las estimaciones realizadas por distintas
modelizaciones y seleccionar de este modo la mejor.
- Akaike Information Criterion (AIC): AIC
- Schwarz Criterion (SC): SC
2k 2 ln( L)
n
k ln(n) 2 ln( L)
n
- Hannan-Quinn Information Criterion (HQ): HQ
2k ln ln(n) 2 ln( L)
n
donde, para los tres estadsticos:

- k: nmero de regresores (incluido el trmino independiente);
- n: tamao de la muestra;
- L: valor de la funcin de verosimilitud.
A la hora de establecer comparaciones entre distintos modelos, se considera con mejor
ajuste aqul que presente unos valores ms bajos en estos estadsticos. Adems de estos
estadsticos, tambin se podra emplear el estadstico de la razn de verosimilitud (LRstatistic), ya visto anteriormente.
Ejemplo con EViews
En este punto vamos a mostrar un ejemplo de especificacin y estimacin de un modelo

de eleccin discreta binaria. En concreto, vamos a estudiar la demanda de compra de un
seguro privado de enfermedad por parte de los hogares, en funcin de diversas
caractersticas de la persona principal del hogar: edad y nivel mximo de estudios
alcanzado, as como tambin de los ingresos netos familiares. La informacin procede
de una muestra de 3.000 hogares espaoles de 1998. Las variables del modelo son:
1, si el hogar posee seguro privado de enfermedad
SEGPRIV
230

EDAD = Edad de la persona principal del hogar (en aos)

1, si los mximos estudios de la persona ppal. del hogar son secundarios
SECUNDAR
1, si los mximos estudios de la persona principal del hogar son superiores
SUPERIOR
LNING = Logaritmo de los ingresos netos familiares

Obsrvese que, en el nivel de estudios, se considera el PRIMARIO como su categora
base.
La variable a explicar de nuestro modelo es una variable dicotmica, que nicamente
toma dos posibles valores, 1 0, segn si el hogar dispone o no de seguro privado de
enfermedad. Por tanto, el objeto de estudio de nuestro modelo es estimar la probabilidad
de que el hogar i elija la opcin 1: Y F ( X ) P ; es decir, estimar la probabilidad
i
de que un hogar disponga de seguro privado de enfermedad. Respecto a las variables

explicativas, entre ellas hay tanto cuantitativas (edad y logaritmo de los ingresos), como
cualitativas (nivel de estudios), y lo que haremos es ver si realmente son significativas o
no en la decisin de compra del mencionado seguro, as como determinar cul es su
aportacin en trminos cuantitativos.
A partir de aqu, podemos optar por diversas formas funcionales F ( X i ) para
especificar nuestro modelo. En particular, se han visto de forma terica tres: el modelo
lineal de probabilidad (MLP), el modelo logit y el modelo probit:
MLP - Yi X i u i
Logit - Yi ( X i ) u i
Probit - Yi ( X i ) u i
Yi Pi X i
Yi Pi ( X i )
Yi Pi ( X i )
1
1 e X i
X i
1
e
(2 )1 / 2
s2
2
ds
La Figura 3 muestra el cuadro de dilogo de EViews para llevar a cabo la estimacin del
MLP. Obsrvese que en Options se elige la estimacin consistente de White
(Heteroskedasticity Consistent Covariance).
Las Figuras 4 y 5, por su parte, nos ofrecen los pasos necesarios que deben seguirse en
EViews para estimar los modelos logit y probit.
231

Figura 3
Figura 4
232

Figura 5
En las Figuras 6, 7 y 8 se muestran, respectivamente, las regresiones estimadas de cada

una de las tres posibilidades sealadas.
Lo primero que puede afirmarse es que para las tres estimaciones realizadas, todas las
variables explicativas resultan significativas, como indican los p-values asociados a los
estadsticos t-Student (en el caso del MLP) o z-normales (para el logit y el probit) de
cada uno de los respectivos coeficientes de regresin.
Figura 6
233

Figura 7
Figura 8
234

Si nos centramos en la salida del MLP, puede comprobarse el bajo valor reflejado por el
coeficiente de determinacin lineal R 2 , ya comentado a nivel terico.
Como ya se ha indicado, conceptualmente los modelos logit y probit resultan ms
apropiados que el MLP. A la hora de elegir entre uno u otro, podemos atender a los
resultados arrojados por medidas como el R 2 de McFadden (McFadden R-squared), el
estadstico LR o razn de verosimilitud (LR-statistic), o los estadsticos de Akaike,
Schwarz y Hannan-Quinn de prdida de informacin. Al observar los valores de todos
estos indicadores en nuestras estimaciones de los modelos logit y probit, puede
comprobarse que, de acuerdo con todos ellos, el modelo logit parece (aunque por muy
poco) ms adecuado.
En el siguiente Cuadro se ofrece, para los tres modelos estimados, los efectos
marginales de cada variable explicativa sobre la probabilidad de tenencia de seguro
privado de enfermedad (junto con los valores medios de cada variable, necesarios para
el clculo de dichos efectos en los modelos logit y probit 60 ).
Variables
Valores
medios
Efectos
marginales
MLP
Efectos
marginales
Logit
Efectos
marginales
Probit
-0,5032
-0,6916
-0,7512
EDAD
42,17733
0,0026
0,0022
0,0023
SECUNDAR
0,331667
0,0707
0,0694
0,0684
SUPERIOR
0,168667
0,1277
0,1087
0,1146
LNING
9,664755
0,0465
0,0390
0,0414
Para explicar el significado de los efectos marginales derivados de los coeficientes de

regresin de estos modelos, vamos a basarnos, a modo de ejemplo, en las estimaciones
obtenidas a partir del modelo logit, ya que ste parece la eleccin ms adecuada. En los
otros, el significado es anlogo.
C - Como siempre, aqu se hace referencia a la ordenada en el origen y, a veces, no

tiene sentido econmico. En este caso, as ocurre.
EDAD El efecto marginal de esta variable indica que por cada ao adicional que
tenga la persona principal del hogar, la probabilidad de que se ste disponga de un
seguro privado de enfermedad se incrementa en un 0,22%.
SECUNDAR - El efecto marginal asociado al nivel de estudios secundarios de la

persona principal del hogar muestra una relacin de este nivel de estudios, con la
probabilidad de que el hogar posea un seguro privado de enfermedad, superior a la
60
Debe indicarse que los efectos marginales de los modelos logit y probit no son proporcionados por
EViews, sino que se han calculado aparte, tomando no obstante la informacin bsica precisa para ello de
los resultados de EViews.
235

asociada a la categora base. En concreto, un 6,94% mayor que en el caso de los

hogares cuya persona principal tiene slo estudios primarios.
SUPERIOR - El significado de este efecto es similar al anterior. Los hogares donde

la persona principal posee estudios superiores evidencian un 10,87% ms de
probabilidad de tener un seguro privado de enfermedad que aqullos donde la
persona principal tiene nicamente estudios primarios.
LNING - El efecto marginal correspondiente al logaritmo de los ingresos netos

familiares indica que la relacin entre esta variable y la probabilidad de que el hogar
tenga seguro privado de enfermedad es positiva. Dado que la variable ingresos viene
medida en logaritmos, este coeficiente de regresin coincide con la elasticidad renta
de este bien, de forma que un incremento de un 1% en los ingresos, conlleva un
aumento de la referida probabilidad en un 0,0390%.
236

Metodos Estadasticos y Econometricos en La Empresa y para Finanzas

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Metodos Estadasticos y Econometricos en La Empresa y para Finanzas

Caricato da

Copyright:

Formati disponibili

MTODOS ESTADSTICOS Y

Jos Antonio Ordaz Sanz

Departamento de Economa, Mtodos Cuantitativos e Historia Econmica

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

AF de correlaciones (para variables cuantitativas)

AF de correspondencias (para variables cualitativas)

Anlisis de Componentes Principales

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

Anlisis de la duracin media de varios tipos de lmparas.

Segn el nmero de factores, se llama ANOVA de un factor al modelo en el que

En cuanto al muestreo de niveles, se refiere a la forma de establecer los niveles

Las distinciones basadas en el tipo de aleatorizacin son equivalentes a las que

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

los tratamientos debido a sus diferencias intrnsecas, se dirn heterogneas. Por

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

valor de la variable Y correspondiente a la observacin i de la muestra j (para

j 1,2, , J e i 1,2,, n j ), la tabla siguiente resumira los datos disponibles:

Y11 Y21 Yi1 Yn11

Y12 Y22 Yi 2 Yn2 2

La aplicacin de la tcnica ANOVA se basa en un contraste de hiptesis. La hiptesis

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

670 840 780 610 900

600 800 690 650

800 810 730 690 750 720

970 840 930 790 920

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

Suponiendo que se verifican las hiptesis de normalidad, aleatoriedad, independencia y

La hiptesis nula H 0 se rechazar si F F30,16,99 . A partir de las tablas estadsticas de la

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

Mtodo de Scheff de comparaciones mltiples

y, para ello, se utiliza el estadstico de prueba: FJ 1,n J

determinada por los valores tales que F FJ11,n J , siendo P [ F FJ11,n J ] 1 .

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

Se desea contrastar, a un nivel de confianza del 95%, si existen diferencias

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

homoscedasticidad, puesto que los otros dos supuestos (independencia y aleatoriedad)

Homoscedasticidad. En este caso, aplicamos el test de Levene, que establece como

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

Suponiendo que se verifican las hiptesis de normalidad, independencia y

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

En este tema se ofrecen las nociones fundamentales de dos tcnicas de Anlisis

El Anlisis discriminante es una tcnica de Anlisis Multivariante que pertenece al

Los grupos deben ser mutuamente excluyentes y deben existir al menos 2.

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

Para cada grupo, son necesarios ms de 2 elementos o casos.

El nmero de variables discriminantes a emplear no puede ser superior al

La variable dependiente que define los grupos ha de ser nominal.

No puede haber relacionales lineales (multicolinealidad) entre las variables

El nmero de funciones discriminantes que se pueden obtener viene dado por el

Las matrices de varianzas-covarianzas de cada grupo han de ser iguales

Las variables discriminantes han de seguir una distribucin normal

INTRODUCCIN A LAS TCNICAS DE ANLISIS MULTIVARIANTE

grupo sea lo menor posible. Atendiendo a este razonamiento, se debe maximizar la

variacin inter - grupos

Las variaciones inter-grupos e intra-grupos se calculan a partir de las correspondientes

As, puede expresarse en funcin de los coeficientes desconocidos a1 , a 2 , , a m ; se

y aplicar el siguiente criterio para clasificar un elemento i: