Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ECONOMTRICOS EN LA EMPRESA Y
PARA FINANZAS
TEMA 1
Introduccin a las tcnicas de Anlisis Multivariante en el
mbito de la Economa y la Empresa
1.1. Introduccin al Anlisis Multivariante: definicin y clasificacin.El Anlisis Multivariante comprende un conjunto de tcnicas o mtodos estadsticos
cuya finalidad es analizar simultneamente informacin relativa a varias variables para
cada individuo o elemento estudiado. Algunos de estos mtodos son puramente
descriptivos de los datos muestrales, mientras que otros utilizan dichos datos muestrales
para realizar inferencias acerca de parmetros poblacionales.
Entre los propsitos de estas tcnicas, podemos citar, por ejemplo:
Describir informacin de forma resumida.
Agrupar observaciones o variables en subconjuntos homogneos.
Explorar la existencia de asociaciones entre variables.
Explicar (o probar) comportamientos.
Existen diferentes clasificaciones de los mtodos de Anlisis Multivariante. Una de las
ms usuales distingue dos grandes grupos, segn el objetivo del anlisis: mtodos de
dependencia y mtodos de interdependencia. Adems, dentro de cada uno de estos
grupos, la naturaleza de las variables juega un papel importante en la definicin de los
diversos mtodos. Asimismo, cada mtodo exige unas determinadas condiciones de
aplicacin para asegurar la fiabilidad de los resultados obtenidos.
Los mtodos de dependencia suponen que las variables analizadas estn divididas en
dos grupos: las variables dependientes y las variables independientes. El objetivo de los
mtodos de dependencia consiste en determinar si el conjunto de variables
independientes afecta al conjunto de variables dependientes y de qu forma.
En cuanto a los mtodos de interdependencia, stos no distinguen entre variables
dependientes e independientes, sino que tienen como objetivo identificar qu variables
pueden estar relacionadas entre s, cmo lo estn y por qu.
A continuacin se seala una relacin de mtodos, clasificados segn el criterio
mencionado.
MTODOS DE DEPENDENCIA
Variable(s) independiente(s)
Variable(s) dependiente(s)
Cuantitativa(s)
Cuantitativa(s)
- Regresin
- Anlisis factorial
confirmatorio
- Ecuaciones estructurales
Cualitativa(s)
- Anlisis discriminante
(con 2 ms grupos)
- Probit
- Logit
Cualitativa(s)
- Regresin dummy
- t-test
- ANOVA
- MANOVA
- Anlisis discriminante
dummy
- Anlisis conjunto
(conjoint)
MTODOS DE INTERDEPENDENCIA
Anlisis Factorial (AF)
1.2. El Anlisis de la Varianza (ANOVA): introduccin.Los modelos de ANOVA (ANalysis Of VAriance) son tcnicas de Anlisis
Multivariante de dependencia, que se utilizan para analizar datos procedentes de diseos
con una o ms variables independientes cualitativas (medidas en escalas nominales u
ordinales) y una variable dependiente cuantitativa (medida con una escala de intervalo o
de razn). En este contexto, las variables independientes se suelen denominar factores
(y sus diferentes estados posibles o valores son niveles o tratamientos) y la variable
dependiente se conoce como respuesta.
Los modelos ANOVA permiten, bsicamente, comparar los valores medios que toma la
variable dependiente en J poblaciones en las que los niveles de factores son distintos,
con la finalidad de determinar si existen diferencias significativas segn dichos niveles
o si, por el contrario, la respuesta en cada poblacin es independiente de los niveles de
factores. Se trata, por tanto, de un contraste paramtrico que extiende al caso de J
poblaciones el contraste de la igualdad de medias entre dos poblaciones independientes.
Algunos ejemplos de aplicacin de estos modelos podran ser los siguientes:
2
1.3. ANOVA de un factor.El anlisis de la varianza de un factor se utiliza para comparar el valor medio de una
variable dependiente cuantitativa en varios grupos, que se diferencian por los niveles del
factor considerado.
En este apartado, se considerar un modelo de efectos fijos no equilibrado, en el que,
por tanto, los tamaos muestrales no tienen por qu ser iguales.
Si denotamos por Y a la variable dependiente; J al nmero de muestras o grupos
considerados (correspondientes cada uno a un nivel distinto del factor); n1 , n2 , , n J a
J
los tamaos de cada una de las muestras; n n j al tamao muestral total; e Yij al
j 1
Observaciones
Total
Medias
T1
Y1
T2
Y2
Tj
Yj
TJ
YJ
Y1 j Y2 j Yij Yn j j
Y1J
Y2 J
YiJ
YnJ J
T T j
j 1
T
n
Si se acepta la hiptesis nula, significar que los grupos no difieren en el valor medio de
la variable dependiente y que, en consecuencia, dicho valor medio se podr considerar
independiente del factor.
Para contrastar dicha hiptesis, introducimos los conceptos de media cuadrtica intergrupos (CME) y de media cuadrtica intra-grupos (CMD), que vienen dados,
respectivamente, por las expresiones:
n j Y j Y
J
CM E
j 1
y CM D
J 1
nj
Yij Y j
J
j 1 i 1
nJ
Los numeradores de cada una de estas medias cuadrticas se conocen como suma de
cuadrados entre grupos, SC E , y como suma de cuadrados dentro de grupos, SC D . Por
su parte, los denominadores son los llamados grados de libertad asociados a dichas
sumas: J 1 y n J , respectivamente.
El estadstico de prueba que utiliza ANOVA para contrastar la hiptesis nula planteada
se construye a partir de los conceptos anteriores; concretamente, viene dado por:
n Y
J
j 1
FJ 1, n J
CM E
CM D
J 1
nj
Y
J
j 1 i 1
ij
Yj
nJ
Suponiendo cierta H 0 , este estadstico sigue una distribucin F de Snedecor con J-1 y
n-J grados de libertad; por lo que dado un nivel de significacin , la regin crtica
vendr
determinada
por
los
valores
tales
que
F FJ11,n J ,
siendo
P [ F FJ11,n J ] 1 .
Ejemplo:
Consideremos cuatro compaas A, B, C y D, cuyas acciones cotizan en Bolsa y
seleccionamos aleatoriamente las cotizaciones de esas acciones en diferentes instantes
de tiempo. As, para la compaa A se observa aleatoriamente la cotizacin en 5
instantes de tiempo, en la B se observa en 4 instantes, en la C en 6 y, por ltimo, en la
compaa D se observa la cotizacin de las acciones en 5 instantes de tiempo.
En la tabla siguiente se muestra la cotizacin en euros de las diferentes acciones en los
instantes de tiempo seleccionados:
Factor
Observaciones
Total
Medias
3.800
760
Tamao
( ni )
2.740
685
4.500
750
4.450
890
n 20
T 15.490
Y 774,5
Suma de cuadrados
Grados de
libertad
Entre
compaas
SC E 103.395
J 1 3
Dentro de las
compaas
SC D 111.100
n J 16
Total
SCT 214.495
n 1 19
Medias cuadrticas
CM E
SC E
34.465
J 1
CM D
SC D
6.943,75
nJ
CM E
4,96
CM D
Sin embargo, los mtodos grficos no son, en general, definitivos. Por tanto, para poder
determinar si existen diferencias y, en caso afirmativo, entre qu grupos existen, ser
necesario recurrir al anlisis de varianza. Para llegar a la tabla ANOVA, deberemos
pulsar Analizar / Comparar medias / ANOVA de un factor y a continuacin indicamos
la variable dependiente (cotizacin) y el factor (empresa). Podemos observar que el
resultado, que se muestra en la Figura 2, coincide con el que se ha mostrado en la tabla
de resultados anterior.
Figura 1
Figura 2
Adems, la tabla ANOVA que proporciona PASW Statistics nos da el p-valor asociado
al estadstico de prueba, lo que facilita la toma de decisin en relacin a la aceptacin o
rechazo de la hiptesis nula. Como sabemos, al ser el p-valor superior al nivel de
significacin elegido (0,013>0,01) aceptaramos la hiptesis nula con lo que la
cotizacin media ser independiente de la empresa. Si embargo, si trabajramos con un
nivel de significacin del 5%, la conclusin sera distinta, puesto que 0,013<0,05.
8
Una limitacin importante del mtodo que acabamos de desarrollar es que nicamente
permite contrastar la hiptesis general de que los J promedios comparados son iguales.
Sin embargo, en el caso de que se rechace esa hiptesis y por tanto las medias no sean
iguales, no se podr precisar cules son las muestras que tienen medias distintas. Para
resolver esta cuestin, se deben utilizar otros contrastes, conocidos como
comparaciones mltiples post-hoc o comparaciones a posteriori. Los mtodos de este
tipo que ofrece PASW Statistics son muy diversos y cada uno de ellos necesita de unas
condiciones iniciales para su aplicacin. Desarrollaremos a continuacin el mtodo de
Scheff, que tiene menos restricciones para su aplicacin que los dems.
En general, este mtodo consiste en formular un contraste sobre una combinacin lineal
de cualquier nmero de medias poblacionales. En el caso particular que nos interesa de
comparacin de medias, las hiptesis que se formulan para los distintos valores de j
son las siguientes:
H 0 : j1 j2 0
H 1 : En caso contrario
j1
Y j2
, que,
SC D 1
1
J 1
n J n j1 n j2
suponiendo cierta H 0 , sigue una distribucin F de Snedecor con J-1 y n-J grados de
libertad, por lo que dado un nivel de significacin , la regin crtica vendr
Ventas
(en cientos de unidades)
A (prensa)
30 20 35 42 60
B (radio)
85 73 92 86 75
C (vallas)
40 28 39 41 50
Figura 3
Antes de contrastar la hiptesis de igualdad de medias, comprobaremos si se verifican
las hiptesis de aplicacin del ANOVA de un factor; en concreto, la normalidad y la
10
Normalidad. sta se puede estudiar a travs del test de Shapiro-Wilk (dado que el
tamao muestral es inferior a 50), que se obtiene a travs de Analizar / Estadsticos
descriptivos / Explorar, indicando la variable dependiente (ventas) y el factor
(campaa publicitaria) y pulsando seguidamente en Grficos, donde se elige la
opcin Grficos con prueba de normalidad 1 .
Figura 4
En este contraste, la hiptesis nula plantea que los datos proceden de poblaciones
normales. En las tres muestras (correspondientes a los tres tipos de campaa
publicitaria: prensa, radio y vallas publicitarias) se acepta la hiptesis nula,
dado que los p-valores toman, respectivamente, los valores 0,881; 0,509 y 0,600 que
son mayores que 0,05, que es el nivel de significacin con el que estamos
trabajando. 2
Al elegir esta opcin, junto a una serie de grficos denominados Grficos Q-Q normales, PASW
Statistics nos ofrece una tabla donde se recogen los resultados analticos de las pruebas de normalidad.
Dado que esta tabla es la que fundamentalmente nos interesa, es lo nico que mostramos en la Figura 4,
obviando los referidos grficos.
2
Obsrvese en la Figura 4 que al efectuar el contraste con PASW Statistics, tambin obtenemos el
resultado del test de Kolmogorov-Smirnov, que se aplica para tamaos muestrales superiores a 50.
1
11
Figura 5
Una vez comprobadas las hiptesis necesarias para llevar a cabo el ANOVA, podemos
aplicarlo. La Figura 6 nos muestra el resultado. Para un nivel de significacin del 5%,
el p-valor resultante (0,000) nos lleva a rechazar la hiptesis nula de igualdad de
medias. Concluimos, por tanto, que el tipo de campaa publicitaria utilizado repercute
en las ventas medias.
Figura 6
Para saber entre qu tipos de campaas publicitarias se encuentran las diferencias,
llevamos a cabo un contraste de comparaciones mltiples, pulsando Analizar /
Comparar medias / ANOVA de un factor / Post hoc y eligiendo la opcin Scheff en el
cuadro Asumiendo varianzas iguales.
El resultado obtenido se muestra en la Figura 7, donde se ofrecen las distintas
combinaciones de pares de tipos de campaas publicitarias, con el p-valor asociado al
contraste que plantea, como hiptesis nula, la nulidad de diferencia de las medias
correspondientes. Se observa que existen diferencias significativas de medias entre las
campaas de radio y prensa y las de radio y vallas publicitarias; en ambos
casos, el p-valor es de 0,000, esto es, menor que el nivel de significacin del 5%
(adems, las diferencias significativas aparecen marcadas con * por PASW Statistics).
Ntese, sin embargo, que no sucede as en el caso de la prensa y las vallas
publicitarias.
12
Figura 7
Otro modo alternativo de llegar a esta conclusin es comprobar si el intervalo de
confianza para la diferencia de medias contiene o no al cero. Si es as, se acepta la
hiptesis nula y consecuentemente no hay diferencias significativas; por el contrario, si
no, se rechaza la hiptesis nula y s se evidencian diferencias significativas.
Adems, el programa PASW Statistics tambin proporciona una clasificacin de los
grupos considerados en subconjuntos homogneos en cuanto a la media de la variable
dependiente (Figura 8). As, en nuestro ejemplo se observa que las campaas de
prensa y vallas publicitarias pertenecen al mismo subconjunto (sus medias pueden
considerarse iguales al nivel de significacin del 5%), mientras que la campaa de
radio forma un segundo subconjunto.
Figura 8
1.4. Anlisis de Varianza Factorial.El Anlisis de Varianza Factorial permite estudiar la influencia de dos o ms factores
sobre la variable dependiente. En estos experimentos factoriales se pueden considerar
por separado los efectos individuales de los factores y adems se puede estudiar su
interaccin, que se introduce en el modelo de forma multiplicativa. La existencia de
13
interaccin indica por tanto que el efecto de los factores sobre la variable respuesta no
es totalmente aditivo.
En un anlisis de varianza factorial existe una hiptesis nula por cada factor y por cada
posible combinacin de factores. La hiptesis nula referida a un factor individual afirma
que las medias de las poblaciones definidas por los niveles del factor son iguales; la
referida al efecto de una interaccin entre factores afirma que tal efecto es nulo.
Para contrastar cada una de estas hiptesis, el ANOVA factorial se sirve de estadsticos
basados en la lgica ya expuesta para el ANOVA de un factor, y que siguen
distribuciones de probabilidad F de Snedecor.
En un ANOVA factorial se trabaja con tantas poblaciones (que se suponen normales y
homoscedsticas) como combinaciones haya de todos los niveles de los factores
involucrados. Tambin se asume que las observaciones han sido aleatoriamente
seleccionadas (una muestra en cada poblacin) y que, por tanto, son independientes
entre s.
Ejemplo:
Una subdelegacin del Ministerio de Educacin y Ciencia est interesada en estudiar la
cantidad anual pagada por los padres de alumnos de Enseanza Primaria en los colegios
privados pertenecientes al territorio de su mbito de competencia. Para realizar el
estudio se clasificaron los colegios privados de este territorio por bloques, segn su
localizacin geogrfica y segn el nmero de alumnos por aula que los colegios
afirmaban tener (considerando sta ltima variable como categrica: 25 alumnos o ms,
o bien, menos de 25 alumnos). En cada una de las combinaciones obtenidas se
seleccion una muestra aleatoria de 3 colegios y se recogi informacin correspondiente
a la cantidad anual (en cientos de euros) que el colegio reciba por cada alumno de
Enseanza Primaria. Los datos obtenidos se muestran en la tabla siguiente:
Alumnos \ Zona
Zona Norte
Zona Centro
Zona Sur
Menos de 25
alumnos por
aula
32
25,4
50
45,5
37,2
20,9
28,95
23
27
21,6
26,5
15
25
17,2
24
19
22
18
25 ms
alumnos por
aula
14
Solucin:
En este caso, se trata de un modelo con 2 factores: localizacin y nmero de alumnos
por aula (por tramos). El primero de estos factores tiene 3 niveles: zona norte, zona
centro y zona sur; mientras que el segundo tiene 2 niveles: menos de 25 alumnos por
aula y 25 ms alumnos por aula. De la combinacin de los niveles, se obtienen 6
poblaciones que vamos a suponer normales, independientes y homoscedsticas, con las
que se trabajar.
Para llevar a cabo un ANOVA factorial con PASW Statistics se utilizarn las
especificaciones del procedimiento Univariante al que se llega a travs de: Analizar /
Modelo Lineal General / Univariante.
La primera de las tablas (Figura 9) ofrece datos generales del problema: nombre de las
variables independientes (factores), sus niveles y el tamao de cada grupo resultante.
Figura 9
La tabla resumen del ANOVA (Figura 10) contiene informacin similar a la que
proporcionaba la tabla del modelo de un nico factor: las fuentes de variacin, las
sumas de cuadrados, los grados de libertad, las medias cuadrticas, los estadsticos de
prueba y los p-valores asociados a cada uno de estos estadsticos, que nos permite
finalmente obtener la conclusin del contraste llevado a cabo.
Las filas correspondientes a Numalumnos (nmero de alumnos) y Zona recogen los
efectos principales, es decir, los efectos individuales de los dos factores incluidos en el
modelo: nmero de alumnos por aula y zona en la que se encuentra el colegio. Los
p-valores indican que, mientras los grupos definidos por la variable nmero de alumnos
pagan unas cantidades medias significativamente diferentes (el p-valor = 0,014 < 0,05
que aparece nos lleva a rechazar la hiptesis nula de igualdad de medias), las cantidades
medias pagadas en los grupos definidos por la variable zona no parecen diferir (el pvalor = 0,753 > 0,05, por lo que se acepta la hiptesis nula de igualdad de medias).
La siguiente fila (Numalumnos*zona) contiene informacin sobre el efecto interaccin
entre ambas variables. El estadstico F correspondiente a este efecto tiene asociado un
15
nivel crtico de 0,714 > 0,05, lo que indica que el efecto de la interaccin no es
significativo.
Figura 10
Finalmente, es interesante observar el coeficiente que se ofrece en una nota al pie de la
tabla: R 2 0,44 . Dicho coeficiente se obtiene dividiendo la suma de cuadrados del
Modelo corregido entre la suma de cuadrados Total corregida, e indica que los tres
efectos incluidos en el modelo (nmero de alumnos, zona y su interaccin, el producto
de ambos: nmero de alumnos*zona) son capaces de predecir el 44% de la cantidad
pagada.
16
1.5.
Anlisis discriminante.-
Hay autores que consideran que las tres ltimas hiptesis se deben contemplar de forma
laxa; si no se verifican, los resultados pueden estar condicionados, pero no se invalida
su calidad. Es decir, es preferible su verificacin, pero no imposibilitan la aplicacin del
Anlisis discriminante.
Existen varios procedimientos para calcular las funciones discriminantes y, a partir de
ellas, asignar a los elementos entre los distintos grupos. Uno de los ms utilizados es el
mtodo de Fisher, que describiremos brevemente para el caso de 2 grupos y m variables
clasificadoras. Para el caso general, la idea subyacente es similar.
Como ya se ha indicado, se trata de crear, a partir de m variables clasificadoras que
denotaremos por X 1 , X 2 , , X m , una funcin D , que ser combinacin lineal de
dichas variables:
D a1 X 1 a 2 X 2 a m X m
El objetivo que se persigue es que los valores de esta funcin se diferencien lo ms
posibles de un grupo a otro y sean muy parecidas para los elementos de un mismo
grupo. Habr que encontrar entonces los valores de los coeficientes a1 , a 2 , , a m para
que esto se cumpla. De este modo, se pretende reducir la dimensionalidad de las m
variables independientes a una nica dimensin, la de la combinacin lineal D . Una
vez creada esta funcin discriminante, se calcular su valor para los nuevos elementos
(puntuacin discriminante) y stos se clasificarn en el grupo que corresponda segn la
puntuacin obtenida.
El planteamiento del mtodo de Fisher para hallar los coeficientes de la funcin
discriminante consiste en maximizar la variacin de la funcin D entre grupos y, al
mismo tiempo, para evitar errores, se deber tratar de que la variacin dentro de cada
18
D2 a1 X 1( 2 ) a 2 X 2( 2 ) a m X m( 2) .
19
Patrimoni
o neto
7,80
22,20
30,00
35,40
42,60
24,00
47,40
30,60
No fallidos
Deuda
pendiente
24,60
41,40
18,00
39,00
32,40
16,20
45,60
22,80
Cliente
9
10
11
12
13
14
15
16
Patrimoni
o neto
31,20
58,80
54,00
72,00
37,80
52,20
66,60
59,40
Deuda
pendiente
6,00
25,20
28,80
12,00
31,20
6,60
24,60
9,60
En la mesa del director del banco hay ahora dos nuevas solicitudes de prstamo
instantneo. El primer solicitante dispone de un patrimonio neto de 60,6 (miles de
euros), con deudas pendientes por valor de 40,8 (miles de euros). Para el segundo
solicitante estos valores son de 58,2 y 13,2 (miles de euros) respectivamente
Se pide, mediante la aplicacin del Anlisis discriminante, construir una funcin
discriminante a partir de las variables patrimonio neto y deuda pendiente, que
permita clasificar, con el menor error posible, a los nuevos clientes en el grupo de
fallidos, o bien en el de no fallidos.
Solucin:
Partiendo de las variables clasificadoras patrimonio neto y deuda pendiente, se
estimar 1 funcin discriminante.
Junto a las dos variables citadas, en PASW Statistics se debe crear una variable ms que
indique el grupo al que pertenece cada elemento. Esta variable la vamos a denominar
20
aqu Grupo y le asignaremos el valor 1 para los clientes fallidos y el 2 para los no
fallidos. Una vez introducidos todos los datos, si se pulsa Analizar / Clasificar /
Discriminante, se obtendr el siguiente cuadro de dilogo, en el que se ha elegido como
variable de agrupacin la variable Grupo, que es la que indica a qu grupo pertenece
cada individuo:
Figura 1
Como puede verse en la Figura 1, tras el nombre de la variable de agrupacin aparecen,
entre parntesis, dos signos de interrogacin. Se deber pulsar en Definir rango e
indicar los valores mnimo y mximo de los grupos que deseamos analizar, que son 1 y
2, respectivamente. A continuacin, deberemos seleccionar las dos variables
independientes e introducirlas en el cuadro en blanco habilitado para ellas
(Independientes).
Seguidamente pulsaremos Aceptar, dejando las opciones que vienen predeterminadas
por PASW Statistics. 3
Las Figuras 2 a 5 muestran algunos de los cuadros que se obtienen en el visor de
resultados y que resultan de inters para nuestro propsito.
En primer lugar, se presentan algunos datos puramente descriptivos. En concreto, la
Figura 2 contiene un resumen de los casos, clasificndolos en vlidos y perdidos. Por su
parte, la Figura 3 recoge el nmero de casos existentes en cada grupo. Es importante
observar si existe mucha diferencia en el tamao de los grupos, porque esto podra
En particular, se ha seleccionado Introducir independientes juntas, lo que significa que todas las
variables independientes sern consideradas en el proceso discriminante. Si se hubiera elegido Usar
mtodo de inclusin por pasos, se iran seleccionando las variables independientes de mayor a menor
poder discriminante y siempre que tuvieran un mnimo de poder discriminante. En lo que respecta a las
opciones que pueden elegirse en Estadsticos, Mtodo, Clasificar y Guardar, ms adelante se explorarn
algunas de ellas.
21
Figura 2
Figura 3
La tabla Coeficientes estandarizados de las funciones discriminantes cannicas (Figura
4) contiene la versin tipificada de los coeficientes de las funciones cannicas
discriminantes. No se trata de la funcin discriminante que se utiliza para clasificar a los
individuos en un grupo u otro (sta se conoce como funcin discriminante cannica no
tipificada). Estos coeficientes, al estar tipificados, son independientes de la mtrica
original de las variables independientes y permiten determinar el peso relativo de cada
variable en la funcin discriminante (fijndonos en su valor absoluto), as como el
sentido de su efecto (observando su signo).
As, en este ejemplo puede concluirse que la variable patrimonio neto tiene mayor
relevancia que la deuda pendiente a la hora de predecir el grupo de pertenencia de los
individuos, puesto que su coeficiente en valor absoluto es ms elevado (0,922 frente a
0,686). Y en cuanto a la interpretacin exacta de los signos, es preciso conocer el signo
de las puntuaciones de los centroides de cada grupo, es decir el signo de la funcin
discriminante correspondiente a los valores medios de cada variable clasificadora
22
(Figura 5). Segn esto, en el presente ejemplo los signos indican que el grupo de los
clientes fallidos se encuentra localizado, en promedio, en las puntuaciones negativas
de la funcin, mientras que los clientes no fallidos se hallan en las positivas.
Figura 4
Figura 5
En general, se dir que si la variable clasificadora toma un valor por encima de la
media, el individuo se clasificar en el grupo en el que el signo de la puntuacin del
centroide coincida con el signo del coeficiente de la variable. De este modo, se puede
afirmar que un patrimonio neto por encima de la media 4 hace ms probable la obtencin
de una puntuacin discriminante positiva (al ser positivo el coeficiente) y, de esta
manera, se ajustar ms al patrn de los clientes no fallidos (ya que para stos la
puntuacin del centroide es positiva). Por el contrario, una deuda pendiente por encima
de la media propiciar una puntuacin discriminante negativa (puesto que el coeficiente
asociado a esta variable es negativo) y esto llevar a clasificar al individuo entre los
fallidos (cuyo centroide tiene puntuacin negativa).
Seguidamente se van a mostrar algunas opciones de PASW Statistics que se pueden
elegir dentro del Anlisis discriminante y que nos aportarn informacin determinante
para clasificar nuevos individuos en los grupos existentes, as como para estudiar la
fiabilidad de los resultados.
Los valores medios de las variables pueden fcilmente conocerse en PASW Statistics llevando a cabo un
anlisis descriptivo de las mismas.
23
Figura 6
En cuanto a la prueba M de Box, se utiliza para contrastar la hiptesis nula de igualdad
de las matrices de varianzas-covarianzas de los grupos que, como ya se coment, es uno
de los requisitos para la aplicacin del Anlisis discriminante. Dicho contraste se lleva a
cabo utilizando el estadstico M de Box (0,951) que muestra la Figura 7. Su p-valor
asociado vale 0,849, lo que lleva a aceptar la hiptesis nula de que las matrices de
varianzas-covarianzas son iguales.
Figura 7
24
Figura 8
De acuerdo con todo lo expuesto hasta ahora, procedamos a clasificar a los nuevos
solicitantes de prstamo. Recordemos que el primero dispona de un patrimonio neto de
60,6 (miles de euros) y tena deudas pendientes por valor de 40,8 (miles de euros); por
su parte, para el segundo solicitante estos valores eran de 58,2 y 13,2 respectivamente.
La funcin de clasificacin para el grupo de fallidos sera:
25
Figura 9
Figura 10
Los Resultados para cada caso se recogen en la Figura 11. Para cada cliente de la
muestra inicial, se seala el grupo real al que pertenece, el pronosticado, si ha habido
error en la prediccin (se indica con **) y la probabilidad de que cada caso pertenezca a
cada grupo condicionada a la distancia existente al centroide de cada grupo. Como se
puede observar, ha habido nicamente un cliente mal clasificado: el nmero 13.
Marcamos esta opcin porque as es en nuestro ejemplo. Si las muestras tuvieran tamaos distintos,
habra que elegir Calcular segn tamaos de grupos.
26
Figura 11
Figura 12
27
- Salfij: variable dicotmica que toma el valor 1 si el cliente es asalariado con contrato
fijo; 0 en caso contrario.
- Categ: grado de cumplimiento del cliente en el reintegro del prstamo. Toma el valor 1
si el cliente es cumplidor; 2 si el cliente es moroso; 3 si el cliente es fallido.
Client
e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Categor
a
1
1
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
3
3
3
3
3
Ingreso
s
32,7
18,6
24,6
37,2
23,7
7,5
29,4
53,4
20,1
31,2
17,1
39
45,6
26,1
8,1
12,6
8,7
38,4
22,8
14,7
19,8
5,1
7,2
11,1
15,9
Patneto
336
204
138
270
114
132
90
228
324
480
108
132
216
234
48
114
150
24
114
60
42
72
30
36
150
Provi
v
1
1
0
1
1
1
0
1
0
1
1
1
1
1
0
0
1
0
1
0
0
0
1
1
0
Casad
o
1
0
1
0
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1
1
1
0
0
Salfij
0
1
1
1
1
1
1
1
1
0
1
1
1
0
1
1
1
1
0
1
0
0
1
0
0
Solucin:
En este caso, se trata de aplicar el Anlisis discriminante mltiple, ya que el banco ha
clasificado a sus clientes en tres grupos.
Habr que construir funciones de clasificacin que permitan clasificar, con los menores
errores posibles, a los clientes en los diferentes grupos. Si se obtienen buenos
28
Figura 13
En este punto, podemos dar respuesta ya a la peticin del banco calculando las
funciones de clasificacin para cada grupo. La Figura 14 muestra los coeficientes de
cada una de ellas, para el grupo de clientes cumplidores, para los morosos y para
los fallidos.
Figura 14
- Clientes cumplidores:
0,201 * Ingresos 0,076 * Patrneto 5,074 * Proviv 9,363 * Casado 19,210 * Salfij - 25,768
- Clientes morosos:
0,131 * Ingresos 0,050 * Patrneto 3,347 * Proviv 7,054 * Casado 13,563 * Salfij - 13,229
- Clientes fallidos:
0,071 * Ingresos 0,025 * Patrneto 2,562 * Proviv 4,873 * Casado 6,357 * Salfij - 5,467
Cuando el banco reciba una nueva solicitud de prstamo, podr determinar a qu grupo
puede pertenecer el cliente evaluando las tres funciones y asignndolo al grupo para el
que se haya obtenido una mayor puntuacin.
El poder predictivo de estas funciones de clasificacin se puede valorar a travs de la
Tabla de resumen (Figura 15) que ofrece PASW Statistics. Como puede observarse, se
han clasificado correctamente 12 + 6 + 4 clientes, o sea 22 de los 25 que conformaban
la muestra inicial. Esto representa un 88,0% de aciertos, lo que nos lleva a afirmar que
nuestro modelo es bastante bueno.
Figura 15
1.6. Anlisis cluster o de conglomerados.A diferencia del Anlisis discriminante, el Anlisis cluster o de conglomerados es una
tcnica de Anlisis multivariante de interdependencia. No distingue por tanto entre
variables dependientes e independientes, sino que, dado un conjunto de variables (las
variables de decisin), analizar la informacin contenida en ellas para clasificar a los
elementos segn su similitud en conglomerados, los cuales deben ser entre s lo ms
distintos posible. Aqu no se parte de grupos previamente establecidos para la muestra,
como se hace en el Anlisis discriminante. Se trata de un anlisis meramente
descriptivo, que no tiene bases estadsticas sobre las que se puedan deducir inferencias
para la poblacin a partir de una muestra.
30
31
medida que adoptan dichas variables. Si los datos estn estandarizados, en general una
de las medidas ms utilizada es la distancia eucldea al cuadrado.
Las medidas de distancia se recogern en la denominada matriz de semejanzas,
proximidades o distancias. Se trata de una matriz simtrica en la que cada elemento
determina la distancia entre los pares de individuos correspondientes a la fila y columna
donde se ubica dicho elemento.
3) Criterio para agrupar elementos en conglomerados.
El siguiente paso consiste en elegir las reglas que determinan el modo de agrupar los
individuos en conglomerados. Las posibilidades que se pueden plantear son muy
diversas y ninguna es manifiestamente mejor que las dems, por lo que el analista se
ver obligado a emplear distintos mtodos con el objeto de contrastar los resultados. En
general, los mtodos de agrupamiento se suelen dividir en dos grandes grupos: mtodos
jerrquicos y mtodos no-jerrquicos.
Mtodos jerrquicos: contemplan todas las agrupaciones posibles, incluyendo las ms
extremas de un solo conglomerado formado por todos los individuos y la de n
conglomerados diferentes formados cada uno por un nico individuo.
Existen dos tipos de tcnicas jerrquicas: las aglomerativas y las divisivas. Las primeras
parten de la existencia de un conglomerado distinto para cada observacin, para
posteriormente irlos fusionando hasta alcanzar a lo sumo un nico grupo. Por su parte,
en las tcnicas divisivas la situacin de partida es un nico conglomerado que engloba a
todas las observaciones y que progresivamente se va subdividiendo hasta que, a lo
sumo, cada observacin pertenece a un cluster diferente. Los mtodos divisivos
requieren demasiados clculos, lo que motiva que los autores se inclinen habitualmente
por los mtodos aglomerativos. De hecho, el programa PASW Statistics incluye
nicamente mtodos de este tipo.
Mtodos no-jerrquicos: la caracterstica fundamental que los distingue de los mtodos
jerrquicos es que solamente llevan a cabo agrupaciones de los individuos en un nmero
concreto de conglomerados, que debe ser fijado de antemano con coherencia.
Una posibilidad para esto es realizar en primer lugar un Anlisis cluster mediante
procedimientos jerrquicos, que nos permite no slo determinar el nmero de grupos o
conglomerados K ms adecuado, sino tambin la configuracin de stos que se tomarn
como punto de partida.
A partir de aqu, la mayora de los mtodos no-jerrquicos establecen K entidades
(estadsticos que representan, de alguna forma, a los elementos que conforman dichos
conglomerados de partida), que servirn para ir definiendo la clasificacin final de los
elementos entre los distintos conglomerados fijados.
Cada tipo de mtodo no-jerrquico proceder de un modo diferente para asignar los
elementos a algn grupo. As, por ejemplo, el mtodo de K-medias implementado en
32
PASW Statistics selecciona como entidades iniciales los centroides de cada uno de los K
conglomerados conformados por el mtodo jerrquico aplicado. Posteriormente, va
asignando el resto de elementos al grupo cuyo centroide se encuentre ms prximo. Se
puede hacer una nueva estimacin de los centroides a medida que se van incorporando
nuevos elementos, o bien, cuando todos hayan sido asignados a los distintos grupos.
Tras esta clasificacin inicial, el mtodo o algoritmo utilizado busca reasignaciones de
los elementos entre los grupos que den lugar a una mejora en el criterio de agrupacin
considerado. De no poder realizar ningn cambio que mejore el resultado, el proceso se
dar por concluido.
Ejemplo:
La Fundacin La Caixa ha llevado a cabo un estudio6 en el que caracteriza a las 50
provincias espaolas mediante los siguientes ndices sintticos, expresados en una
escala del 1 al 10:
ndice de renta
ndice de salud
ndice de servicios sanitarios
ndice de nivel educativo y cultural
ndice de oferta educativa, cultural y de ocio
ndice de empleo
ndice de condiciones de trabajo
ndice de vivienda y equipamiento del hogar
ndice de accesibilidad econmica y seguridad vial
ndice de convivencia y participacin social
ndice de seguridad ciudadana
ndice de entorno natural y clima
Datos del Anuario Social de Espaa 2004. Coleccin Estudios Sociales. Fundacin La Caixa.
33
Figura 16
A continuacin, se debe indicar la medida de proximidad entre casos con la que se desea
trabajar, as como el mtodo elegido para la formacin de conglomerados. Esto se har a
travs del botn Mtodo. Nos hemos decantado por las opciones ms habituales: la
vinculacin inter-grupos 7 , como mtodo para clasificar a los elementos en
conglomerados, y la distancia eucldea al cuadrado, como medida de proximidad. En
ese mismo cuadro, se nos da la opcin de estandarizar las variables, pero en este caso no
es necesario porque se trata de ndices sintticos que estn todos expresados en una
escala del 1 al 10.
Este mtodo se basa en valores medios. La distancia entre dos conglomerados se calcula tomando la
media de las distancias entre cada elemento de uno y otro conglomerado. Los dos grupos que se
encuentren a una menor distancia se fusionan para formar un nuevo cluster o conglomerado.
34
En cuanto a los resultados que queremos que nos devuelva PASW Statistics, hemos
seleccionado en el botn Estadsticos: el Historial de conglomeracin, la Matriz de
distancias y un rango de soluciones de entre 3 y 5 conglomerados para el
Conglomerado de pertenencia (con ello, le pedimos al programa que nos muestre el
resultado que se obtendra si tuvisemos 3 conglomerados, 4 5, para a partir de ah
decidir qu nos parece mejor; esto es ya decisin del investigador 8 ).
Asimismo, escogemos la opcin Dendograma en el botn Grficos.
Adems, en Guardar tenemos la posibilidad de crear nuevas variables en las que se
incluir el conglomerado asignado a cada provincia, para el nmero de conglomerados
que fijemos. Para ello, se deber proceder como muestra la Figura 17. Al haber
decidido formar entre 3 y 5 conglomerados, se crearn tres variables con los nombres
CLU3_1, CLU4_1 y CLU5_1, donde se guardarn los resultados en cada caso.
Figura 17
Una vez seleccionadas todas las opciones anteriores, se obtienen los resultados que
comentaremos a continuacin.
En primer lugar, se muestra un resumen de los casos, distinguiendo entre vlidos y
perdidos (Figura 18).
Seguidamente, aparece la Matriz de distancias, que no reproduciremos por su tamao.
Se trata de una tabla con 50 filas y 50 columnas (una por provincia), simtrica, en la que
cada elemento indica la distancia (medida como el cuadrado de la distancia eucldea)
entre las provincias correspondientes a la fila y la columna en la que se encuentra el
elemento. Con esta medida de proximidad calculada a partir de los ndices sintticos, las
provincias ms cercanas son A Corua y Pontevedra, cuya distancia es de 12.
Igualmente, tambin es decisin del investigador decidir dichos nmeros de conglomerados iniciales, de
3 a 5, que desea tener a priori.
35
Figura 18
36
conglomerados que aparecen determinados por la lnea roja discontinua que hemos
dibujado, aunque otras opciones podran ser igualmente aceptables.
Figura 19
37
Figura 20
38
Figura 21
39
Una vez que se ha definido el nmero de grupos, el siguiente paso para poder aplicar el
mtodo no-jerrquico de K-medias consiste en calcular los centroides de los 5 grupos
definidos. Estos centroides se tomarn como valores iniciales del proceso de iteracin
en el mtodo de K-medias. Recordemos que el centroide de un grupo o conglomerado
ser un vector cuyas componentes son los valores medios de cada una de las variables
independientes, para las provincias pertenecientes a ese grupo.
Para calcular estas medias, se pulsa Analizar / Comparar medias / Medias y, en el
cuadro de dilogo resultante, se introducen todas las variables de las que se quiere
calcular la media (en Lista de dependientes) y se indican asimismo los conglomerados
que nos interesan (en Lista de independientes): los 5 con los que hemos decidido
quedarnos. Estos conglomerados estn incluidos en una variable cuya etiqueta es
Average Linkage (Between Groups). Pero debemos tener cuidado, porque hay tres
variables con esa misma etiqueta, las correspondientes a los casos de 3, 4 y 5
conglomerados que queramos analizar. Movindonos sobre ellas, aparece el nombre de
la variable correspondiente. Nos interesa CLU5_1, que es la que guardaba los resultados
para 5 conglomerados.
El informe resultante es el que se muestra en la Figura 22. Las 12 medias que aparecen
en cada fila son las componentes del centroide de cada grupo. Estos valores se deben
copiar en un archivo de PASW Statistics, del que el programa los importar luego para
tomarlos como valores iniciales del proceso de iteracin del mtodo no-jerrquico de Kmedias. Dicho archivo lo hemos nombrado en este ejemplo centroides.sav. Se deben
cumplir dos requisitos: la variable que identifica a los conglomerados debe denominarse
cluster_ y el resto de variables debe conservar el nombre del archivo inicial.
Una vez creado el archivo que contiene a los centroides, estamos en condiciones de
ejecutar el anlisis de conglomerados de K-medias. Para ello, en el archivo inicial
pulsamos Analizar / Clasificar / Conglomerado de K medias, resultando el cuadro de la
Figura 23. Deberemos introducir tanto las variables de decisin como la que usamos de
etiqueta de las provincias. Indicaremos que el nmero de conglomerados es 5 y la ruta
en la que se encuentra el archivo donde hemos guardado los centroides. Este se hace en
Centros de los conglomerados / Leer iniciales / Archivo de datos externo / Archivo.
En Iterar... se pueden modificar opciones de clculo, como el nmero mximo de
iteraciones o el criterio de convergencia para detener el proceso iterativo en que se basa
el mtodo de K-medias o la posibilidad de actualizar los centroides cada vez que se
asigne una provincia a un conglomerado. Dejaremos las opciones que aparecen por
defecto (10 iteraciones y que no se actualicen las medias (centroides)).
Guardar permite crear dos variables que PASW Statistics denomina por defecto
QCL_1 y QCL_2, en las que se almacenarn, respectivamente, el conglomerado al que
estar asignada cada provincia una vez terminado el proceso de agrupacin y la
distancia de cada provincia al centroide de su conglomerado. Marcaremos ambas
opciones.
40
Figura 22
41
Figura 23
Figura 24
43
Figura 25
Figura 26
44
Por su parte, la Figura 27 seala la distancia entre los centros de los conglomerados, lo
que puede servir para determinar la heterogeneidad entre grupos, aunque no para
estudiar la homogeneidad interna de cada conglomerado. Recordemos que el objetivo
del Anlisis cluster es establecer grupos lo ms homogneos posible internamente pero
los ms heterogneos posible entre s.
Figura 27
Una forma de analizar si la variabilidad entre conglomerados es mayor que dentro de los
conglomerados es a travs de la tabla ANOVA que se proporciona en la Figura 28.
Figura 28
45
46
TEMA 2
El modelo clsico de regresin lineal:
especificacin y estimacin
La Econometra no es Estadstica econmica. Tampoco es lo que llamamos Teora
Econmica (...). La Econometra tampoco debe ser considerada como sinnimo de
aplicacin de las Matemticas a la Economa. La experiencia ha demostrado que cada
uno de estos tres puntos de vista, el de la Estadstica, la Teora Econmica y las
Matemticas, es necesario, pero por s mismo no son condicin suficiente para una
comprensin real de las relaciones cuantitativas en la vida econmica moderna. Es la
unin de los tres aspectos lo que constituye una herramienta de anlisis potente. Es esta
unin lo que constituye la Econometra. 9
Comienza con este tema el anlisis del modelo economtrico, el eje central en torno al
que se desarrollan los mtodos economtricos.
En concreto, en el presente tema empezaremos viendo qu se entiende por un modelo
economtrico. Despus, iremos desarrollando las principales etapas que lo configuran:
especificacin, estimacin, inferencia y prediccin. Las dos primeras se vern en este
mismo Tema, en tanto que las dos ltimas se analizarn en el Tema 4. Todo este estudio
se har basndonos en el modelo clsico de regresin, caracterizado por cumplir una
serie de supuestos y disfrutar con ello de un conjunto bien definido de propiedades.
Una vez conocido este modelo perfecto, proseguiremos con el anlisis del modelo
cuando no se cumplen todos los requisitos o propiedades descritas previamente, viendo
cules son las consecuencias principales de ello y tomando las medidas ms oportunas
para afrontarlas. ste es el objetivo que nos plantearemos en el Tema 5.
Finalmente, en el Tema 6 abordaremos el estudio de un tipo de modelo muy importante
en el mundo de la Empresa: los modelos de eleccin discreta. Estos modelos se
caracterizan por ser su variable dependiente de tipo discreto y una de sus principales
utilidades es su consideracin en procesos de toma de decisiones.
3.1.
el aleatorio.
variables
cuyas
relaciones
Especificacin
Estimacin
Prediccin / Explicacin /
Toma de decisiones
Figura 1
48
Datos,
informacin
previa
3.2.
j 1, 2, ..., k
i 1, 2, ..., N ,
i 1, 2, ..., N ,
que, como podemos apreciar, no es sino un caso particular del modelo de regresin
lineal en el que k = 2. (Por mayor simplicidad incluso, X 2i se podra escribir como X i ,
ya que por ser la nica variable X visible, se podra prescindir de su subndice 2).
En la mayora de las ocasiones, nosotros nos referiremos al modelo de regresin
mltiple, que es el caso general. Sin embargo, en otras, por simplicidad en las
explicaciones (y sobre todo a nivel grfico), haremos referencia al modelo de regresin
simple.
Precisamente, la siguiente argumentacin la haremos basndonos en un modelo de
regresin lineal simple.
Pensemos que queremos estudiar una variable econmica (variable dependiente) cuyo
comportamiento creemos que depende, segn una relacin lineal, del de otra variable
que acta como independiente o explicativa de la primera. Si dispusisemos de los
valores de las N observaciones que conforman la poblacin de tales variables,
tericamente podramos representar una nube de puntos en la que podramos cruzar,
en unos ejes cartesianos, los valores observados para ambas variables.
A cada valor de la variable explicativa X le podran corresponder varios valores de la
variable dependiente o explicada Y (si nos fijamos en la Figura 2, para un valor
particular de X, por ejemplo, X 0 , le podran corresponder distintos valores de Y:
Y0 , Y ' 0 , Y ' ' 0 ). Si quisiramos asociar a cada valor de la variable explicativa un nico
valor de la variable explicada, nos surgira entonces la pregunta de cul tomar. En este
punto, parece que lo lgico sera elegir un valor representativo de todos los posibles
valores de Y que aparecen ligados a cada uno de los valores de X; este valor elegido
sera el valor esperado o esperanza matemtica de la variable Y, dado el valor de X:
E Y | X 0 .
50
Grficamente (Figura 2), nuestro objeto de estudio son, por tanto, del conjunto de datos
poblacionales, los puntos que conforman la RRP. Sobre esta recta se representan los
valores medios de la variable Y para cada valor de la variable dependiente X.
Yi
Y0
Y0
E(Y| X0)
u 0 Y0 E Y | X 0
Y0
RRP
E Y | X i 1 2 X i
X0
Xi
Figura 2
51
Este supuesto 10 se ve adems reforzado por el hecho de que parece razonable pensar
que lo deseable es que las desviaciones ms frecuentes entre los valores observados de Y
y sus promedios (que no es ms que la definicin de u) sean pequeas. Si estamos ante
una distribucin normal, recurdese que la moda y la media (adems de la mediana)
coinciden en esta distribucin, por lo que esta media tendera a ser cero.
Volviendo a la RRP, con ella lo que intentamos es analizar la nube de puntos
poblacional, que lo habitual es que no sea conocida pues no se suele disponer de la
totalidad de los valores poblacionales. En la prctica, slo se tiene al alcance una
muestra de valores de Y que se corresponden con valores fijos de X. En esta situacin,
nuestro objetivo final consiste en ajustar o estimar la RRP, esto es, obtener una
Si bien el modo correcto de escribir esta expresin es: E (u i | X i ) 0 , en la notacin economtrica
resulta habitual obviar que cuando estudiamos las variables estocsticas, stas estn condicionadas a los
valores de las variables explicativas; de este modo, se suele escribir simplemente: E (u i ) 0 .
10
52
estimacin numrica de los valores de los parmetros desconocidos, usando para ello
la informacin proporcionada por observaciones muestrales de las variables del modelo.
Se obtiene de este modo la denominada Recta de Regresin Muestral, (RRM), que no es
sino una estimacin de la RRP, una aproximacin de la verdadera RRP, puesto que sta
no se puede estimar de manera precisa debido a las fluctuaciones muestrales.
RRM
Yi 1 2 X i
Yi
Y0
Y0
E(Y| X0)
RRP
E Y | X i 1 2 X i
e0
u0
X0
Xi
Figura 3
11
Obsrvese, sin embargo, cmo la notacin parece estar mal escrita, pues se indica Yi , en lugar de
53
Para llevar a cabo la explicacin de conceptos que hemos desarrollado hasta este punto,
hemos recurrido en buena parte de nuestra exposicin al caso del modelo de regresin
simple (fundamentalmente en el aspecto grfico), pero como bien podr apreciarse, todo
ello se puede extender fcilmente al caso general. 12 En lugar de Recta de Regresin
Poblacional (RRP) y de Recta de Regresin Muestral (RRM), podramos hablar de
forma generalizada de Funcin de Regresin Poblacional (FRP) y de Funcin de
Regresin Muestral (FRM).
j 1, 2, ..., k
i 1, 2, ..., n .
Yn 1 2 X 2 n 3 X 3n ... k X kn u n
Y 1 X
2n
n
X k1 1 u1
X k 2 2 u2
, o abreviadamente: Y X u ,
X kn k u n
donde la matriz Y es una matriz columna, de orden n x 1, cuyos elementos son los n
valores de la variable dependiente Y; X es una matriz de orden n x k, estando
conformadas sus columnas por los n valores de cada una de las k variables
independientes del modelo; es una matriz de orden k x 1, siendo sus elementos cada
uno de los k parmetros que acompaan a cada una de las variables independientes del
modelo; y u es una matriz de orden n x 1, referida las perturbaciones de cada una de las
n observaciones del modelo.
12
En el caso del modelo lineal simple, geomtricamente hemos trabajado con una recta. Si el modelo
tuviese dos variables explicativas, estaramos ante un plano de regresin; y si tuvisemos ms de dos,
hablaramos, en general, de un hiperplano de regresin.
54
En el anlisis de regresin, nuestro objetivo no va a ser slo estimar los parmetros del
modelo considerado, sino tambin hacer un ejercicio de inferencia sobre los verdaderos
valores de tales parmetros o coeficientes. Para ello deben hacerse ciertos supuestos
sobre los distintos componentes que conforman el modelo (algunos de los cuales ya se
han referido). El cumplimiento de estos supuestos da lugar al llamado modelo clsico de
regresin lineal.
Vamos a distinguir 3 tipos de supuestos: no estocsticos, estocsticos y los referidos a la
distribucin de probabilidad.
Supuestos no estocsticos
Supuestos estocsticos
55
u E u 0
n
n
Var u i Eu i E u i E u i2 E u i E u i2 u2
2
i 1,2,...n
i j
Esto significa que, dados los valores de X, las desviaciones de dos valores
cualesquiera de Y en relacin a su media no muestran patrones sistemticos.
Expresado en forma sencilla, este supuesto implica que el trmino de perturbacin
relacionado con una observacin no est influenciado por el trmino de perturbacin
de otra observacin diferente.
Estos dos ltimos supuestos sobre la perturbacin aleatoria, homoscedasticidad y no
autocorrelacin, pueden expresarse matricialmente mediante su matriz (simtrica)
de varianzas-covarianzas de la siguiente forma:
Varu1 Covu1, u2 Covu1, u3
Varu2 Covu2 , u3
Var Covu
Covu1, un u2 0 0 0
Covu2 , un
u2 0 0
2
u Inn
Varun
u2
56
Covu i , X ji E u i E u i X ji E X ji E u i X ji E u i E X ji E u i X ji 0
j 1, 2, ..., k
i 1, 2, ..., n
Este supuesto implica asumir que X y u tienen una influencia separada y aditiva
sobre Y, y por tanto es posible determinar por separado sus efectos sobre la variable
dependiente.
u i N 0, u2 , i 1, 2,, n .
u N n n1 ; u2 I nn .
Cov Yi , Y j E Yi E Yi Y j E Y j E u i u j 0, i j .
Y N n X , u2 I nn .
57
3.3.
Estimacin
por
mnimos
cuadrados
ordinarios
(MCO).
Interpretacin de los coeficientes de regresin. Efecto marginal.Estimacin por mnimos cuadrados ordinarios (MCO)
j 1, 2, ..., k
i 1, 2, ..., n ,
j 1, 2, ..., k
i 1, 2, ..., n .
Si nos fijamos, partiendo de una nube de puntos, nuestro objetivo final sera encontrar
aquella funcin lineal concreta, de entre las infinitas posibilidades existentes, que fuese
lo ms representativa posible de dicha nube de puntos; esto es, aqulla que diese lugar
a valores estimados de Y ( Y ) que hiciera que los residuos fuesen los ms pequeos
i
posibles en su conjunto.
De este modo, nuestro objetivo se puede alcanzar mediante un problema de
optimizacin matemtica; en particular, de minimizacin de una funcin que sera la
suma de los residuos al cuadrado 13 (SCR):
13
Al considerar la suma, estaramos teniendo en cuenta el conjunto de todos los residuos. El hecho de
tomar la suma del cuadrado de los residuos, en lugar de la suma de dichos residuos directamente, radica
fundamentalmente en que, si se observa, los valores de los residuos sern en unos casos positivos y en
otros negativos. Al tomar la suma de todos ellos, las desviaciones de un signo se podran compensar con
las del otro signo y acabar finalmente anulndose, desvirtundose entonces nuestro objetivo. Esto, sin
embargo, no ocurrir si tomamos el cuadrado de los residuos.
58
1 , 2 ,..., k
Min
Yi Yi
ei2 Min
1 , 2 ,..., k i 1
1 , 2 ,..., k i 1
Yi 1 2 X 2i ... j X ji ... k X ki
n
1 , 2 ,..., k i 1
1
SCR
2
SCR .
SCR
j
SCR
k
Donde:
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki 1
i 1
1
2 Yi 1 2 X 2i ... j X ji ... k X ki 0 ;
i 1
Y
n
es decir:
i 1
1 2 X 2 i ... j X ji ... k X ki Yi Yi
i 1
i 1
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki X 2i
i 1
2
2 Yi 1 2 X 2i ... j X ji ... k X ki X 2i 0 ;
i 1
esto es:
Y
n
i 1
1 2 X 2i ... j X ji ... k X ki X 2i Yi Yi X 2i
59
i 1
e
i 1
X 2i 0
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki X ji
i 1
j
2 Yi 1 2 X 2i ... j X ji ... k X ki X ji 0 ;
i 1
por tanto:
Y
n
i 1
1 2 X 2 i ... j X ji ... k X ki X ji Yi Yi X ji
i 1
e
i 1
X ji 0
n
SCR
2 Yi 1 2 X 2i ... j X ji ... k X ki X ki
i 1
k
2 Yi 1 2 X 2i ... j X ji ... k X ki X ki 0 ;
i 1
por consiguiente:
Y
n
i 1
1 2 X 2 i ... j X ji ... k X ki X ki Yi Yi X ki
i 1
e
i 1
X ki 0
14
de la funcin SCR. Para poder asegurar que, en efecto, minimizan la SCR, habra
luego que aplicar la condicin suficiente, como ya se indic anteriormente. Al llevar a
cabo el estudio del signo de la matriz Hessiana, comprobaramos que al ser sta definida
14
En el caso de que estuvisemos considerando un modelo de regresin lineal simple, obtendramos los
valores de y ya conocidos de las materias de Estadstica:
1
1 Y 2 X
2
60
Cov ( X , Y ) S XY
2 .
Var ( X )
SX
positiva 15 , podemos asegurar que nuestros valores j obtenidos como solucin del
sistema de ecuaciones normales constituyen efectivamente un mnimo para la SCR.
De este modo, habramos obtenido la estimacin por MCO de nuestro modelo:
Yi 1 2 X 2i ... j X ji ... k X ki
j 1, 2, ..., k
i 1, 2, ..., n .
e Y Y
n n n
Si desarrollamos la expresin de la SCR en el caso matricial 16 , obtenemos:
n
Este paso se obviar por motivos de simplificacin de nuestra exposicin, pudiendo encontrarse en
cualquier manual de Econometra.
16
A la hora de trabajar con el anlisis matricial, deben tenerse en cuenta las propiedades de las
operaciones con matrices; en particular, las ms importantes son:
1. ( A B ) ' A ' B ' .
2. ( A B) ' B ' A '
3. ( A B ) 1 B 1 A 1
4. ( A ' )
( A 1 ) '
Para poder realizar estas operaciones, las matrices deben cumplir los requisitos exigibles en lo que a sus
rdenes respectivos se refiere.
61
Por tanto, el desarrollo del mtodo de estimacin por MCO de manera matricial, podra
escribirse como sigue:
Min
SCR Min
e
i 1
2
i
Min
e ' e Min
Y ' Y 2 ' X ' Y ' X ' X
X ' X 1 X ' Y .
La aplicacin de la condicin suficiente de segundo orden nos demostrara
posteriormente que esta solucin (punto crtico) representa efectivamente un mnimo de
la funcin objetivo SCR.
La utilizacin del anlisis matricial a la obtencin de los estimadores del modelo por el
mtodo de MCO presenta como ventaja que se obtienen de una vez los valores de
todos los parmetros del vector : , , ..., , ..., .
62
X 21
X 'X
X
k1
X
X ' Y 21
X
k1
1
X 22
X k2
1
X 22
X k2
1 1 X 21
X 2 n 1 X 22
X kn 1 X 2 n
X 31
X 32
X 3n
X k1
X k2
X kn
2i
2
2i
i 1
n
i 1
i 1
X 2i X ki
i 1
n
X ki2
i 1
X
n
i 1
X
i 1
2i
3i
X 3i
ki
n
Yi
1 Y1 i 1
n
X 2 n Y2 X Y .
2i i
i 1
n
X kn Yn
X ki Yi
i 1
Los estimadores MCO poseen una serie de propiedades, que podemos diferenciar en dos
tipos. Por un lado, las propiedades numricas, y por otro, las propiedades estadsticas o
probabilsticas.
Las propiedades numricas de los estimadores MCO son aqullas que se mantienen
como consecuencia de la aplicacin del mtodo de MCO sobre el modelo de regresin,
sin considerar la forma en la que se generaron los datos. Son:
1. Los estimadores por MCO estn expresados en trminos de cantidades
observables muestrales. Por consiguiente, pueden ser fcilmente calculados.
2. Los estimadores por MCO son estimadores puntuales; es decir, dada la muestra,
cada estimador proporciona un solo valor (puntual) del parmetro poblacional
correspondiente.
3. Una vez determinada por MCO la FRM (recta, o hiperplano de regresin en el caso
mltiple), se cumplir que:
a) La FRM pasa necesariamente por las medias muestrales de la variable explicada
Y y de todas las variables explicativas X.
n
e
i 1
0 , siempre
e
i 1
X ji 0 .
1
X ' e X ' Y X X ' Y X ' X X ' Y X ' X X ' X X ' Y X ' Y X ' Y .
e
i 1
Yi 0 , i 1, 2, ..., n .
i 1
i 1
i 1
64
1
As pues: X ' X X ' u . Dado que, de acuerdo con esta expresin,
1
1
E E X ' X X ' u X ' X X ' E u .
1
3. Si Var Covu u2 I , entonces Var Cov u2 X ' X .
Demostracin:
'
'
Var Cov E E E E ;
1
1
teniendo en cuenta que: X ' X X ' u , entonces: X ' X X ' u .
Var Cov E
X ' X
'
u2 X ' X
N k ; u2 X ' X 1 .
4. Teorema de Gauss-Markov 17 : El estimador MCO es un estimador lineal, insesgado
y ptimo (ELIO), entendiendo por ptimo que tiene mnima varianza.
Por su propia definicin, el mtodo de estimacin por MCO nos proporciona los
estimadores ptimos a nivel muestral. El Teorema de Gauss-Markov es
fundamental, ya que nos garantiza, adems, que este mtodo de estimacin nos
proporciona los mejores resultados posibles tambin a nivel inferencial, ya que los
17
M X u M X M u M u M u
Var Cov e u2 M .
66
E e E M u M E u M
e N n ; u2 M .
e
i 1
2
i
nk
e 'e
SCR
.
nk nk
u2 .
u2
n k n2k .
2
u
18
la matriz Var Cov e u2 M no es diagonal, por lo que las covarianzas entre distintas observaciones
son distintas de 0.
No vamos a demostrar ni deducir matemticamente ninguna de las propiedades referidas a u2 . stas
pueden ser consultadas por el alumno en cualquier manual de Econometra.
19
67
j 1, 2, ..., k
i 1, 2, ..., n .
j 1, 2, ..., k
i 1, 2, ..., n .
Efecto marginal
Efecto marginal
Y
.
X j
3.4.
22
En este punto, cabe resaltar la diferencia entre los conceptos de buen ajuste y mejor ajuste. Ya
hemos visto que el mtodo de estimacin por MCO nos proporciona el mejor ajuste posible a los datos de
la muestra disponible (nube de puntos); sin embargo, ello no significa necesariamente que dicho ajuste
sea bueno. Puede que el mejor ajuste posible sea malo. As pues, lo que estudiaremos ahora es si
nuestro ajuste obtenido, aun siendo el mejor posible, es bueno o no.
23
Cuando hablemos de bondad del ajuste, nos referiremos a la obtenida en relacin a una muestra
considerada. Tericamente tambin podramos referirnos a la poblacin, pero no es lo que solemos tener
en la realidad, dada la habitual imposibilidad de disponer de toda la informacin poblacional.
69
Y
n
i 1
Yi
Y0
Y0 Y
Y0
Y
Yi 1 2 X i
Y Y e
0
RRM
Y
0
Xi
X0
Figura 4
Y0 Y Y0 Y Y0 Y0 Y0 Y e0 .
70
Y
n
i 1
Y Y e
Y 2 Yi Y ei
n
i 1
i 1
i 1
2
i
2 Yi Y ei
i 1
Utilizando las propiedades numricas 3-b) y 3-d) de los estimadores MCO (ya vistas),
tenemos que 24 :
Yi Y ei Yi ei Y ei
n
i 1
i 1
i 1
0.
Y
n
i 1
Y 2 Yi Y
n
i 1
e
n
i 1
2
i
De acuerdo con esta igualdad 25 , resulta evidente que a la hora de llevar a cabo un ajuste
de regresin, lo deseable es que el valor de la SCE sea lo mayor posible y,
consecuentemente, el de la SCR lo menor posible. Es decir, el ajuste del modelo ser
tanto mejor, en tanto ms alto sea la SCE en relacin con la SCT. De este modo, se
define un indicador para medir la bondad del ajuste: el coeficiente de determinacin,
que se denota por R 2 .
24
25
Esta igualdad tambin se mantendra si dividisemos todas las sumas de cuadrados por el tamao de la
muestra considerada (n); en este caso, nos encontraramos con la conocida expresin estadstica:
SCT SCE SCR
VT VE VNE ;
n
n
n
esto es, la varianza total de Y (VT) es igual a la varianza explicada (VE) ms la varianza no explicada o
residual (VNE).
71
El coeficiente de determinacin
SCE
.
SCT
R 2 mide la proporcin (en tanto por uno) o el porcentaje (si se multiplica por cien) de la
variacin total de la variable dependiente que es explicada por el conjunto de las
variables explicativas que conforman el modelo de regresin. 26
El coeficiente de determinacin puede expresarse tambin como: R 2 1
SCR
.
SCT
1 R2
R2 1
.
STC SCT SCT
SCT
SCT
De estas expresiones puede deducirse, igualmente, que el rango de valores de R 2 es:
0 R2 1 .
Si R 2 1 , esto significara un ajuste perfecto del modelo estimado, es decir:
SCE SCT , y lgicamente: SCR 0 .
Por el contrario, si R 2 0 , ello supondra que no habra relacin alguna entre la
variable explicada y las variables explicativas: SCE 0 y SCR SCT . En este caso,
Yi 1 Y , es decir, la mejor prediccin de cualquier valor de Y sera simplemente el
valor de su media.
Por tanto, cuanto ms cerca de 1 se halle el valor de R 2 , tanto mejor ser la bondad del
ajuste analizado. En trminos generales, la literatura estadstico-economtrica considera
que un ajuste de regresin puede considerarse bueno si el coeficiente de determinacin
presenta un valor que se sita a partir, aproximadamente, de 0,75.
En este punto vamos a mostrar distintas expresiones que pueden adoptar las sumas de
cuadrados que hemos visto. 27
SCT Yi Y Yi 2 n Y 2 Y ' Y n Y 2
n
i 1
i 1
26
SCE Yi Y
i 1
i 1
i 1
i 1
SCR ei2 Yi Yi
28
En el caso particular de que consideremos un modelo de regresin lineal simple, las expresiones ms
habituales (y de sobra conocidas por las materias de Estadstica) del coeficiente de determinacin son:
R2
2
2
S XY
S XY 2 S X .
2
2
S X2 S Y2
S Y2
S Y2
73
Yi
Yi 1 2 X i
Y2
R2 = 1
Y1
X1
X2
Xi
Figura 5
Si considersemos en lugar de 2 observaciones muestrales, 3, el ajuste ya no sera
perfecto y, consiguientemente, el valor de R 2 disminuira. Si fuesen 4 las
observaciones, R 2 sera todava menor y as podramos ir actuando sucesivamente. Es
decir, con un mayor tamao muestral en relacin al nmero de variables explicativas, el
valor de R 2 ira decreciendo y la conclusin a la que se llegara sera ms realista.
Volviendo a nuestro ejemplo, si el tamao de la muestra fuese grande, con toda
seguridad acabaramos teniendo un coeficiente de determinacin con un valor bajo,
siendo as coherente el resultado obtenido.
Por tanto, hay que tomar con precaucin las conclusiones que se extraen sobre la
bondad de ajuste de un modelo al interpretar el valor de R 2 . Debemos tener presente el
tamao muestral con el que se trabaja en comparacin con el nmero de variables
explicativas del modelo. La diferencia entre ambos, n k , es lo que se conoce como
grados de libertad. Cuanto ms elevado sea el valor de los grados de libertad de un
ajuste, ms realista, y por consiguiente fiable, ser la explicacin proporcionada por el
coeficiente de determinacin de un modelo. El modelo captar mejor la relacin entre
las variables cuanta ms informacin muestral (considerada a travs de sus
observaciones) incorporemos en el estudio, es decir, cuantos ms grados de libertad
existan.
En definitiva, el fallo en nuestro ejemplo era que nuestro ajuste no tena grados de
libertad: n k 0 .
74
n 1
Rc2 1 1 R 2
.
n k
Ntese, segn esta expresin, que si se produce un incremento del nmero de variables
explicativas en el modelo, tendremos que:
k n k
75
n 1
Rc2 .
nk
Obsrvese tambin que este coeficiente nos sirve para ver si el nmero de observaciones
muestrales que estamos considerando es suficiente o no, pues manteniendo fijo el
nmero de variables explicativas k, cuando n tiende a infinito se tiene que:
n 1
n 1
2
2
Rc2 lim 1 1 R 2
1 1 R lim
1 1 R 1
n
n n k
n k
1 1 R 2 1 1 R 2 R 2 .
1. El valor del coeficiente de determinacin hay que tomarlo con precaucin, puesto
que en funcin del tamao muestral, puede estar mostrando resultados engaosos y
no del todo fiables.
2. En el caso de un modelo sin ordenada en el origen, segn las razones matemticas
que se expusieron en su momento, no se tiene por qu cumplir la igualdad
SCT SCE SCR . Este hecho tiene como consecuencia que el rango de valores de
76
3.5.
Hasta este momento, hemos estado asumiendo que todas las variables de nuestro
modelo economtrico eran de tipo cuantitativo, esto es, variables que toman de forma
continua valores reales.
Sin embargo, la realidad est tambin plagada de factores de tipo cualitativo cuya
inclusin en los modelos se puede hacer igualmente necesaria: sexo, estado civil, nivel
de estudios, localizacin geogrfica; es decir, los modelos pueden tener entre sus
variables explicativas, tanto variables cuantitativas como variables cualitativas.
Aparecen entonces las denominadas variables ficticias, tambin conocidas como
binarias o dicotmicas, o dummy (en terminologa anglosajona), que reflejan la
presencia o no de un determinado atributo.
Las variables ficticias se caracterizan porque:
29
Los modelos anidados son aqullos que tienen en comn una serie de variables explicativas, a las
cuales se les suman adems otras variables explicativas diferentes. Por ejemplo:
Consumo i 1 2 Precio i u i
Consumo i 1 2 Precio i 3 Renta i u i
77
Yi 1 2 X i u i ,
donde:
E Yi | X i 1 1 2 1
E Yi | X i 0 1 0
1 0
2 1 0
H0 : 2 0 .
30
En el siguiente tema, trataremos los contrastes de hiptesis. No obstante, el alumno conoce ya estos
conceptos, por anteriores materias de Estadstica que ha estudiado previamente.
78
( X ' X ) 1 X ' Y , siendo las matrices de datos de las variables del modelo:
Y1
1 1
Y2
1 0
Y Y3 y X 1 0 ,
1 1
Yn
n
X'X n
X i
i 1
Xi
i 1
n
n
n
2
1
X
i
i 1
n
n
Yi Yi
i 1 nY .
X ' Y n i 1
n1 n1Y1
X
Y
2i i Yi
i 1
i 1
n1
n1
,
Y Y
0
1
Y0
79
Yi 1 2 D2 i 3 D3 i u i
E Yi | D2i 1, D3i 0 1 2 SEC
1 PRI
2 SEC PRI
3 SUP PRI
De nuevo se observa que las comparaciones de los salarios para las distintas
modalidades de la variable nivel de estudios se hacen con respecto a la categora base.
A la hora de construir un modelo con variables ficticias, puede optarse por una de las
dos especificaciones siguientes:
31
Aditiva: Yi 1 2 Di 3 Z i u i
Multiplicativa 31 : 1 2 Di 3 Z i 4 Di Z i u i
1 2 Di 3 Di Z i u i .
80
Especificacin aditiva:
En el caso de considerar la especificacin aditiva, el modelo es:
Yi 1 2 Di 3 Z i u i .
Si se toman los valores esperados del salario para las distintas combinaciones de valores
que pueden adoptar las dos variables ficticias introducidas en el modelo, se deduce de
manera inmediata que:
E Yi | Di 1, Z i 1 1 2 3 M , R
E Yi | Di 1, Z i 0 1 2 M , U
E Yi | Di 0, Z i 1 1 3 V , R
E Yi | Di 0, Z i 0 1 V , U
81
1 V , U
2 M , U V , U M , R V , R
3 V , R V , U M , R M , U
Una vez ms puede observarse cmo las comparaciones se hacen sobre las categoras
base: varn y zona urbana.
Especificacin multiplicativa:
En este caso, el modelo que se especifica resulta ser:
Yi 1 2 Di 3 Z i 4 Di Z i u i ,
Los valores esperados del salario, teniendo en cuenta los posibles valores de las
variables ficticias consideradas, son en este modelo:
E Yi | Di 1, Z i 1 1 2 3 4 M , R
E Yi | Di 1, Z i 0 1 2 M , U
E Yi | Di 0, Z i 1 1 3 V , R
E Yi | Di 0, Z i 0 1 V , U
1 V , U
2 M , U V , U
3 V , R V , U
82
Obsrvese, por su parte, que las otras dos diferencias posibles, distinguiendo sexo y
zona geogrfica de residencia, vienen dadas por combinaciones de coeficientes de
regresin y no por coeficientes aislados:
2 4 M , R V , R
3 4 M , R M ,U
La principal aportacin del esquema multiplicativo frente al aditivo es que permite tener
en cuenta la interaccin entre variables. En concreto, en el ejemplo que nos ocupa, se
pueden apreciar distintas diferencias de salario entre mujeres y varones segn cual sea
su zona de residencia, mientras que con el esquema aditivo la diferencia salarial entre
varones y mujeres resulta ser la misma tanto en la zona rural como en la zona urbana.
Del mismo modo, la especificacin multiplicativa hace posible la percepcin de
distintas diferencias de salario entre zona rural y zona urbana segn se trate de mujeres
o varones, hecho que no ocurre con el esquema aditivo.
A lo largo de todos los ejemplos que se han ido exponiendo en este tema, obsrvese que
cuando las variables cualitativas incluidas en los modelos tenan m modalidades, se han
utilizado m-1 variables ficticias para su consideracin. La razn de ello, en lugar de
utilizar m variables ficticias, no slo reside en el hecho de que no resulta necesario, sino
en evitar la presencia de multicolinealidad perfecta entre los trminos independientes y
las variables ficticias en los correspondientes modelos.
Si, por ejemplo, tuvisemos una variable con tres modalidades y emplesemos tres
variables ficticias ( D1 , D2 , D3 ) en el modelo:
83
Por qu valores 0 y 1?
E Yi | Z i 0 1 A
E Yi | Z i 1 1 2 B
E Yi | Z i 2 1 2 2 C
C B B A 2
C A 2 2 .
Es decir, que la diferencia en los salarios entre los individuos con un nivel de
cualificacin A respecto de los de B es igual que la diferencia de los de un nivel
B respecto de los de C y que, por tanto, entre A y C esta diferencia es el doble.
Todo ello, evidentemente, no tiene por qu ser as. sta es la razn, pues, por la que no
deben darse a las variables ficticias valores distintos a 0 y 1.
Ejemplos
Consideremos un modelo de regresin lineal que explica los ingresos netos familiares
en funcin de diversas caractersticas de la persona principal del hogar: edad, estado
civil y nivel mximo de estudios alcanzado. En concreto, las variables del modelo son:
ING = Ingresos netos familiares (en )
EDAD = Edad de la persona principal del hogar (en aos)
84
Especificacin aditiva:
De acuerdo con la definicin de las variables realizada, el modelo a estimar es:
ING 1 2 EDAD 3 CASADO 4 SECUNDAR 5SUPERIOR u
El resultado de la estimacin por MCO de este modelo resulta ser:
ING = 6.030,49 + 199,90*EDAD + 1.205,63*CASADO + 2.897,10*SECUNDAR +
13.181,26*SUPERIOR
85
3 - Este parmetro recoge el efecto del estado civil en nuestro modelo. En este
caso viene a significar que estar casado supone, por trmino medio, unos ingresos
netos adicionales en el hogar de 1.205,63 , frente a otros estados civiles.
Si se quisiera comparar la diferencia, en sus efectos sobre los ingresos netos familiares,
entre los hogares cuya personal principal tiene estudios superiores y los de estudios
secundarios, bastara con ver la diferencia entre los valores de los respectivos
coeficientes de regresin; es decir: 13.181,26 2.897,10 = 10.284,16 .
Obsrvese que, aplicando el significado de las variables ficticias, llegamos a distintas
ecuaciones segn sea el perfil de la persona principal del hogar:
-
86
Especificacin multiplicativa:
Planteamos ahora un modelo alternativo que permitir distinguir posibles diferencias en
el efecto marginal medio de la edad sobre los ingresos netos familiares, dependiendo del
nivel mximo de estudios alcanzado por la persona principal del hogar:
ING 1 2 EDAD 3 CASADO 4 SECUNDAR 5SUPERIOR
3 - Los ingresos netos familiares de los hogares cuya persona principal est casada
superan en 1.000,14 , por trmino medio, a los ingresos netos familiares de los
hogares en los que el estado civil de la persona principal es otro (estando en
igualdad de condiciones para el resto de variables).
4 - Los ingresos netos familiares mnimos de los hogares cuya persona principal
tiene estudios secundarios sern, en promedio y sin tener en cuenta el efecto de la
edad, de 4.398,71 ms que los correspondientes cuando la persona principal tiene
estudios primarios.
5 - Los ingresos netos familiares mnimos de los hogares cuya persona principal
tiene estudios superiores sern, en promedio y sin tener en cuenta el efecto de la
edad, de 7.333,88 ms que los correspondientes cuando la persona principal tiene
estudios primarios.
Para comparar los efectos marginales medios de la edad sobre los ingresos netos de los
hogares cuyas personas principales tienen estudios superiores respecto a las que tienen
estudios secundarios, de nuevo sera suficiente con calcular la diferencia entre los
valores de los respectivos coeficientes de regresin; es decir: 478,99 170,00 = 308,99 .
Igualmente se podran comparar los ingresos mnimos de los hogares, en trmino medio
y sin tener en cuenta el efecto de la edad, cuando la personal principal tiene estudios
superiores frente a estudios secundarios. En este caso, dichos ingresos se diferenciaran
en 7.333,88 4.398,71 = 2.935,17 , esto es, seran 2.935,17 ms cuando se tienen
estudios superiores.
Los distintos perfiles de las personas principales de los hogares dan lugar a las
siguientes ecuaciones para la estimacin de los ingresos netos familiares:
-
En las ecuaciones anteriores, puede observarse que el efecto marginal de la edad sobre
los ingresos netos familiares vara dependiendo del nivel de estudios de la persona
principal del hogar. Esto no ocurra con la especificacin aditiva, sino que dicho efecto
marginal era entonces el mismo en todos los casos.
88
3.6. Formas funcionales linealizables. Elasticidad vs. efecto marginal.En este apartado, se van a considerar diversas formas funcionales alternativas a la lineal.
Todas ellas se caracterizan por el hecho de que, pese a no ser lineales, a partir de
sencillas transformaciones matemticas se convierten en tales; por esta razn, reciben el
nombre de formas funcionales linealizables.
Vamos a ver, para cada uno de los modelos que consideramos, cul es el significado de
sus coeficientes de regresin, as como la forma en que se obtienen el efecto marginal y
la elasticidad. Por ltimo, nos fijaremos en el modo en el que debemos actuar para
poder establecer comparaciones entre los distintos modelos, a fin de elegir el mejor.
Por simplicidad en la explicacin, se van a considerar en todos los casos modelos de
regresin simple (con ordenada en el origen), donde Y es la variable cuyo
comportamiento se trata de explicar segn los valores de la variable explicativa X .
Efecto marginal
Elasticidad
dY
. Expresa la relacin entre variaciones absolutas de Y y de X .
dX
dY Y
dY X
y de X .
Modelo lineal
Yi 1 2 X i u i , donde i 1,, n .
-
dY
.
dX
Efecto marginal 2 .
Elasticidad
dY Y
dY X
X
2 .
dX X dX Y
Y
ste:
Yi 1 X i 2 e ui ,
tomando
logaritmos
podemos
llegar
a:
1
dY
d ln Y
Y dY Y .
Elasticidad 2 .
Efecto marginal
dY Y Y
dY
Y
2 .
dX dX X X
X
90
Modelos semi-logartmicos
Modelo log-lin.
Xi
1
d ln Y dY Y dY Y
Efecto marginal
dY dY Y
Y 2 Y .
dX
dX
El valor del efecto marginal en este modelo depende del valor concreto de Y
que se considere. Por ello, suele hablarse del efecto marginal medio, que es el
que corresponde con el valor medio de dicha variable.
-
Elasticidad
dY Y
dY Y
X 2 X .
dX X
dX
Modelo lin-log.
dY
d ln X
dY
dX
1
X
dY
.
dX X
Efecto marginal
dY
dY
1
1
2 .
dX dX X X
X
El valor del efecto marginal en este modelo depende del valor concreto de X
que se tome. Debido a esto, suele hablarse del efecto marginal medio, que es el
que corresponde con el valor medio de X .
-
Elasticidad
dY Y
dY
1
1
2 .
dX X dX X Y
Y
Modelo recproco
u i , donde i 1,, n .
dY
dY
.
1 dX X 2
d
X
Efecto marginal
dY
dY
1
1
2 2 .
2
2
dX dX X X
X
El valor del efecto marginal en este caso depende del valor concreto que adopte
X . Por ello, suele considerarse el efecto marginal medio, que es el relativo al
valor medio de dicha variable.
-
Elasticidad
dY Y
dY
dX X dX X 2
1
1
2
.
XY
XY
92
Para poder comparar modelos alternativos y elegir qu opcin resulta mejor, debemos
fijarnos en dos aspectos esenciales:
93
Ejemplo
La siguiente tabla muestra los valores de los indicadores comentados para la relacin
entre las variables CONSUMO y RENTA, segn las distintas formas funcionales
consideradas:
Modelo
Rc2
R2
AIC
Lineal
0,458367 0,444113
5,2374
Log-log
0,518989 0,506331
0,2364
Lin-log
0,456735 0,442439
5,2404
Log-lin
0,497778 0,484561
0,2794
5,2918
32
Al igual que los coeficientes mostrados en la tabla de este ejemplo, este valor ha sido calculado de
forma externa a partir de los datos originales que se han empleado para el mismo.
94
Introduccin al uso de EViews (I).En este apartado comenzamos nuestro aprendizaje del programa informtico
Econometric Views (ms conocido abreviadamente como EViews). En concreto, nos
vamos a centrar en su versin 3.1.
Nuestra primera aproximacin a este software de extendido uso en el mbito
economtrico, se va a estructurar en los siguientes puntos:
Acerca de EViews
Acerca de EViews
Al iniciar una sesin de EViews, la primera imagen que aparece es la pantalla que se
muestra en la Figura 1, donde se recogen diversas informaciones.
Ventana
de
Barra
principal de
rea de
Lnea de
Figura 1
95
En la parte superior se nos muestra una barra de color azul con el ttulo del programa y a
continuacin la barra principal de mens. La franja blanca que aparece bajo la barra
principal de mens se denomina ventana de comandos y permite trabajar en EViews
introduciendo directamente los comandos necesarios, ejecutndolos posteriormente con
la tecla Enter.
En la parte inferior de la pantalla, se encuentra la llamada lnea de estado donde se
especifica, por ejemplo, el directorio donde por defecto se guardar el archivo en curso
o en el caso de haber iniciado la sesin, si tenemos o no un fichero de trabajo en
memoria (WF = none).
La zona amplia de color gris es el rea de trabajo donde EViews ir desplegando las
ventanas que vayamos utilizando a medida que sea necesario en el transcurso de la
sesin.
File; Incluye las operaciones usuales relacionadas con ficheros, datos y programas
dentro de un entorno Windows: abrir y cerrar ficheros de trabajo nuevos y ya
guardados anteriormente, guardar ficheros de trabajo, imprimirlos, importar ficheros
desde una hoja de clculo o base de datos o exportarlos hacia una hoja de clculo o
base de datos, salir del programa EViews, etc.
Edit; Contiene las operaciones bsicas (cortar, copiar, pegar, deshacer, buscar,
reemplazar, etc.) de cualquier programa en entorno Windows.
Objects; Contiene las funciones para manejar los distintos objetos que se almacenan
en un fichero de trabajo: borrar, nombrar, imprimir, importar, etc.
View; Para habilitar este men desplegable es necesario antes abrir un fichero de
trabajo (o Workfile). En funcin del tipo de ventana activa en cada caso, se
obtendrn diferentes aspectos relacionados con la visualizacin en pantalla.
Procs; Contiene las operaciones relacionadas con series de datos principalmente. De
nuevo en este caso y al igual que en la opcin VIEW es necesario tener un fichero
de trabajo abierto para habilitar el men desplegable, el cual ser distinto segn la
ventana activa que utilicemos. En este men podremos seleccionar una muestra de
los datos, ordenarlos, generar nuevas series a partir de otras ya existentes, importar y
exportar series de datos, as como cambiar el rango poblacional de las series.
Quick; Proporciona acceso directo a los comandos que se utilizan con mayor
frecuencia: generar series a partir de otras ya existentes, seleccionar una muestra,
representar grficamente las series de datos, editar las series, estimar modelos de
regresin por MCO, representar las series a travs de histogramas y sus estadsticos
ms representativos (media, mediana, curtosis, etc.), hallar las matrices de
covarianzas y de correlaciones en un modelo de regresin, aplicar diversos mtodos
de tratamiento de series temporales (alisado exponencial, test de races unitarias,
96
97
Figura 2
El problema que vamos a plantear en esta sesin de trabajo es el Ejercicio n 10 del
Boletn del Tema 3, que nos ofrece datos de 20 valores contables y de mercado de las
acciones correspondientes a otros tantos bancos espaoles en un da determinado de
agosto de 1995 (es decir, se trata de datos de corte transversal o no temporales). Nuestro
objetivo ser tratar de establecer una relacin economtrica entre el valor de mercado de
las acciones de los bancos y sus respectivos valores contables.
Por tanto, en la opcin del men que se nos ha abierto elegiremos Undated or irregular
y, seguidamente, escribiremos: 1 en Start observation; y 20 en End observation, tal y
como se indica en la Figura 3. Tras esto, nos aparecer la VENTANA DEL FICHERO
DE TRABAJO (Workfile: UNTITLED). Esto se puede ver en la Figura 4.
En esta ventana, RANGE mostrar el rango en el que toda la serie de datos debe
moverse; en cambio SAMPLE sealar el periodo o muestra concreta que se utiliza en el
estudio. Aunque inicialmente ambos se igualan, es muy habitual que la muestra se
cambie durante la sesin de trabajo para adecuarla a cada clculo que se desee realizar.
El espacio en blanco en la ventana es el DIRECTORIO DE OBJETOS en el que irn
apareciendo todos los objetos del fichero de trabajo con su nombre correspondiente y un
icono que indica de qu tipo de objeto se trata: vector de coeficientes de regresin,
ecuacin, grfico, grupo de series, matrices, modelos, series, datos de panel, tablas, etc.
Por defecto, aqu siempre aparecern dos elementos: un vector de coeficientes de
regresin denominado c y representado por , que incluir los coeficientes estimados de
98
la ltima ecuacin activa; y una serie llamada resid que, como su propio nombre
sugiere, est destinada a guardar los residuos de la ltima ecuacin estimada.
Figura 3
Figura 4
99
La ventana del Fichero de Trabajo contiene, adems, una barra de mens propia cuyos
elementos describiremos brevemente:
View, Procs y Objects; Nos proporcionan los mismos mens desplegables que
vimos en la barra de mens principal de EViews.
Save; Permite guardar el fichero de trabajo en uso en el disco duro o en una unidad
externa de almacenamiento (disquete, CD, pen-drive).
Label +/-; Permite visualizar el detalle de los objetos que se presentan en la ventana
de trabajo, as como fecha y hora de creacin.
Show; Permite visualizar una serie de datos, una lista de series y grficos en una
misma ventana o una serie generada a travs de una frmula apropiada.
Fetch; Permite importar objetos tales como ecuaciones estimadas, series de datos o
grficos de otro fichero de trabajo distinto de EViews, que hayamos almacenado
previamente.
Store; Permite exportar objetos tales como ecuaciones estimadas, series de datos o
grficos a otro fichero de trabajo distinto de EViews, que hayamos almacenado
previamente.
Delete; Permite borrar cualquier objeto que est en la ventana del fichero de trabajo.
Genr; Permite generar cualquier serie de datos a partir de una operacin con otras
ya establecidas.
Sample; Permite seleccionar la amplitud de la muestra dentro del rango que se ha
especificado para el fichero de trabajo.
Una vez creada la serie CONSUMO, introduciremos los datos; por ejemplo:
CONSUMO
125
205
333
214
512
Para ello, podemos hacer doble clic sobre la nueva serie CONSUMO que aparece
junto a c y resid en el Directorio de Objetos de Workfile. Tras abrirse la ventana
correspondiente, pulsaremos en EDIT +/- para poder comenzar a introducir los
datos. La pantalla deber quedar finalmente como aparece en la Figura 6.
Obsrvese cmo antes de introducir los datos, la serie no tiene todava valores,
como lo indica su referencia NA (Not Available).
Un ltimo aspecto que debemos resear aqu es que en EViews los decimales estn
en notacin anglosajona, es decir, precedidos de un punto.
Figura 5
101
Figura 6
Despus de haber visto este breve ejemplo de introduccin directa de datos en EViews,
pasamos ya a resolver nuestro ejercicio. Cerramos entonces la ventana de trabajo de la
serie CONSUMO (e incluso, si queremos, podemos eliminarla situndonos sobre ella y
pulsando la opcin DELETE en el men de Workfile).
Los datos relativos al problema sobre los valores bancarios que queremos analizar se
encuentran en un fichero de Excel, del que deberemos importarlos. Para ello, desde el
men principal del fichero de trabajo deberemos seleccionar la opcin: FILE / IMPORT
/ READ TEXT-LOTUS-EXCEL.
De este modo, se obtendr la pantalla que vemos en la Figura 7, donde se debe
especificar la ruta por la que se accede al fichero Agosto95.xls, que es la siguiente:
Escritorio \ Agosto95.xls
Tras haber seleccionado este fichero y pulsado la opcin ABRIR, obtendremos el men
desplegable correspondiente a la importacin de ficheros Excel (Excel Spreadsheet
Import).
En este men debemos atender a varias cuestiones importantes:
-
En la opcin Order of Data, el programa EViews nos permite especificar si los datos
que vamos a insertar de Excel estn ordenados por columnas (columns) o por filas
(rows). En este caso, seleccionamos la primera opcin.
En tercer lugar, hemos de especificar el nombre de las series que vamos a utilizar o,
en su defecto, si el fichero Excel ya trae en su primera fila los nombres, slo el
nmero de series que vamos a importar. Como este ltimo es nuestro caso, slo
escribiremos en Names for series or Number of series if names in file un 2.
Figura 7
103
Figura 8
La Figura 9 representa el estado final de la ventana del fichero de trabajo despus de
importar los datos.
Figura 9
104
Figura 10
En esta ventana surge una nueva barra de mens, cuyos componentes son: View,
Procs, Objects, Print, Name, Freeze, Edit+/-, Smpl+/-, Label+/-, Wide+-, InsDel,
Title, Sample y Genr. Cada uno de ellos, a su vez, contiene numerosas posibilidades.
La opcin VIEW resulta muy interesante. Permite, entre otras acciones (Figura 11):
105
Tras realizar cualquiera de las acciones indicadas en VIEW, puede que queramos
volver al listado de datos de la variable. En este caso, bastar con elegir
SPREADSHEET.
Figura 11
Figura 12
106
Figura 13
107
Figura 14
Figura 15
A continuacin, para obtener la recta estimada de regresin, seleccionamos la opcin
QUICK / ESTIMATE EQUATION en la barra principal de mens (Figura 16).
108
Figura 16
Como resultado, se obtiene la pantalla de Especificacin de la Ecuacin (Equation
Specification), donde deberemos atender a dos aspectos importantes:
Equation Specification; en este apartado debemos especificar la regresin lineal
que vamos a realizar. En primer lugar hay que escribir el nombre de la serie
que actuar como variable dependiente. Tras ello deberemos escribir,
separados por espacios, la relacin de variables independientes o explicativas
del modelo, comenzando por la constante u ordenada en el origen (que se
denota por la letra C) si deseamos que est presente en nuestro modelo.
As pues, dado que en este caso el modelo que planteamos es:
VACC 1 2VCON u ,
109
Figura 17
Figura 18
110
111
dependiente presenta diferentes formas funcionales, o bien tambin para elegir entre
distintas especificaciones de modelos de eleccin discreta (Akaike info criterion).
El valor del estadstico del criterio de Schwarz, como alternativa al criterio de
informacin de Akaike (Schwarz criterion).
El valor del estadstico F de Fisher-Snedecor bajo la hiptesis nula de no
significatividad del modelo.
Nivel de significacin mnimo al que se puede rechazar la hiptesis nula de no
significativad del modelo bajo el supuesto de que fuera cierta (Prob.(F-statistic)). Es
el p-valor asociado a la significatividad global del modelo. Permite estudiar este
aspecto sin usar las tablas estadsticas de distribucin de probabilidades.
Esta ventana nos da una completa visin inicial del modelo especificado. En nuestro
ejemplo, si atendemos al signo del coeficiente de regresin estimado de VCON,
deducimos que la relacin entre las variables del modelo es directa (como cabra
esperar, segn la Teora Econmica), concretndose en que cuando el valor contable
se incrementa en 1 milln de pesetas, el de las acciones se incrementa por trmino
medio en casi 1,22 millones de pesetas (ntese que en el modelo lineal, el significado
de los coeficientes de regresin coincide con el concepto econmico de efecto
marginal). En cuanto a la bondad del ajuste muestral, tanto el valor del coeficiente de
determinacin (0,836480), como el del coeficiente de determinacin corregido
(0,827396), son bastante aceptables. Y en el terreno inferencial, que veremos en
breve, la variable explicativa resulta significativa, como evidencia el p-valor
asociado a su estadstico t-Student, o bien el estadstico F de significatividad global
del modelo (que en este caso, al tratarse de un modelo de regresin lineal simple,
coinciden en su significado).
Resulta conveniente guardar esta ventana como objeto para que a lo largo de la
sesin, cuando se desee, podamos recuperarla en la ventana del fichero de trabajo y
no haya que volver a realizar la estimacin. As, en la Ventana de Ecuacin
seleccionamos la opcin NAME y le damos un nombre; por ejemplo: VACC_VCON.
EViews, adems, nos permite conocer la serie de los residuos, la de los valores
estimados de la variable dependiente y la de los valores reales, comparndolas a su
vez en un grfico. Para ello, debemos seleccionar desde el men de la Ventana de
Ecuacin, la opcin VIEW, en la que aparecern a su vez varias opciones tales como
REPRESENTATIONS, que nos indica el modelo estimado o, entre otras: ACTUAL,
FITTED, RESIDUAL (Figura 19), donde podemos elegir entre cuatro ms detalladas:
Actual, Fitted, Residual Table; representa los valores reales (actual), estimados
(fitted) y los residuales (residual) en una tabla, junto con un grfico a su derecha.
Actual, Fitted, Residual Graph; representa grficamente los valores anteriores.
Residual Graph; representa grficamente slo la serie residual.
112
Figura 19
113
Figura 20
Figura 21
Otro resultado interesante es el clculo de la matriz de varianzas-covarianzas estimada
de los estimadores de los coeficientes de regresin (Figura 22).
114
Figura 22
Este resultado, muy til en los procesos de inferencia, se obtiene tambin a partir del
men VIEW; en concreto, pulsando dentro de l la opcin COVARIANCE MATRIX.
En ocasiones, puede resultar que el modelo lineal no sea el ms adecuado para explicar
la relacin entre distintas variables. Modelos como el potencial, el exponencial u otros
no lineales, pero linealizables, pueden ser entonces opciones ms apropiadas. El carcter
linealizable de stos permite que a travs de determinadas transformaciones de las
variables originales se pueda llegar a una sencilla especificacin lineal. De este modo,
se obtienen modelos como el log-log, el log-lin o el lin-log.
Para poder estimar por MCO un modelo de estas caractersticas, debemos en primer
lugar definir las nuevas variables. EViews habilita la opcin GENR para generar
series a partir de otras ya existentes. Esta opcin se encuentra tanto en la ventana
principal del fichero de trabajo, como en la barra principal de mens: QUICK /
GENERATE SERIES.
En este punto vamos a plantear como ejemplo un modelo log-log para las variables
de nuestro ejercicio; es decir:
ln VACC 1 2 ln VCON u
115
incrementa un 1%, el valor de las acciones se incrementa por trmino medio casi un
0,94%.
Figura 23
Figura 24
116
Figura 25
117
TEMA 3
El modelo clsico de regresin lineal:
inferencia y prediccin
4.1.
H 0 : u Normal
H 1 : u No normal
Una vez definidas las hiptesis nula y alternativa, en un contraste es preciso tambin
establecer un estadstico de prueba, que tendr carcter aleatorio (tomando diferentes
valores segn la muestra que se considere) y seguir una determinada distribucin de
probabilidad. En este caso, el estadstico de Jarque-Bera sigue una distribucin chicuadrado con 2 grados de libertad, siendo su expresin:
2
JB
12 2 32
n
24
6
22 ,
H 0 : u Normal
2
( JB
0)
H 1 : u No normal
2
( JB
0)
En este punto debemos de hacer una observacin importante. Nuestra variable objeto de
estudio es la perturbacin aleatoria; sin embargo, sta resulta inobservable, por lo que
no podremos analizarla directamente. Por ello, a la hora de estudiar u, tendremos que
recurrir a una estimacin de la misma: al residuo o error muestral. Recordemos que
ei u i . As pues, a la hora de la verdad nosotros estudiaremos la normalidad de los
residuos, en tanto que stos constituyen una estimacin muestral de las perturbaciones.
2
2
Si denotamos por JB
exp el valor que toma el estadstico JB para la serie de los
residuos de la muestra que estamos considerando; y por 22,1 el valor terico del
mismo para un nivel de significacin , entonces tendremos que:
2
2
Si JB
exp 2 ,1 , nos situaramos en la regin de aceptacin (RA) y, por tanto, no
2
2
Si JB
exp 2 ,1 , nos encontraramos en la regin crtica (RC) y rechazaramos la
2
JB
exp
RA
RC
22,1
Figura 1
119
4.2.
Intervalos de confianza.-
Una vez obtenida, mediante MCO, la estimacin del vector de parmetros del modelo
de regresin , y para valorar si sta resulta ser una aproximacin adecuada de los
parmetros poblacionales , podramos en primera instancia atender a las propiedades
que posee este estimador calculado por el citado mtodo: es ELIO (esto es, resulta ser
lineal, insesgado y de mnima varianza, como ya se ha estudiado).
Una forma adicional de valorar la precisin de la estimacin consiste en establecer un
intervalo de confianza: un intervalo de valores dentro del cual consideramos que se
encuentran los parmetros poblacionales con un determinado nivel de confianza 33 .
Recordemos que el vector de estimadores es un vector aleatorio que sigue una
1
distribucin normal multivariante. En particular: N k ; u2 X ' X .
2
Var Cov ( ) u ( X ' X ) 1
Var ( 2 )
Cov( 2 , 3 )
Var ( j )
a11
a12
a 22
a13
a 23
Cov( 1 , k )
Cov( 2 , k )
Var ( k )
a1k
a 2k
.
a jj
a kk
33
Si nos fijamos, la estimacin es el centro o pivote del intervalo y es un nmero positivo, es el radio de
dicho intervalo, que sumado y restado al valor central configura finalmente la amplitud del intervalo. El
valor de va a depender del nivel de confianza.
120
j N j ; u2 . a jj , siendo a jj
el elemento j
j N j ; u2 . a jj .
Tipificando esta variable aleatoria, tendramos que:
j j
u 2 . a jj
j j
Var ( j )
j j
ES ( j )
N (0,1) ,
u2
(n k ) n2 k .
2
u
A partir de los dos ltimos estadsticos podemos generar un nuevo estadstico que
seguira una distribucin de probabilidad t-Student, con n k grados de libertad 34 ; en
concreto, dividiendo el estadstico normal entre la raz del cociente del estadstico chicuadrado entre sus grados de libertad:
Si atendemos a la definicin de una variable aleatoria que sigue una distribucin t-Student, tenemos:
que si se toman dos variables aleatorias independientes, Z y V , de modo que Z N (0,1) y V s2 ;
34
Z
V
s
Se representa por: T t s .
121
j j
j j
u 2 . a jj
u 2 . a jj
u2
(n k )
u2
u2
u2
j j
u 2 . a jj
j j
ES ( j )
nk
La expresin final de este estadstico la vamos a denotar por t j , de modo pues que:
t j
j j
tnk .
ES ( j )
t j
/2
/2
a t n k , / 2
b t n k ,1 / 2
Figura 2
A partir de aqu, podemos deducir un intervalo de confianza para j , j 1,2,..., k .
122
P a t j b 1 P b t j b 1
j j
P t n k ,1 / 2
t n k ,1 / 2 1
ES ( j )
P t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1
P j t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1
P j t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1
P j t n k ,1 / 2 ES ( j ) j j t n k ,1 / 2 ES ( j ) 1 .
j t n k ,1 / 2 ES ( j ) ; es decir:
j t n k ,1 / 2 ES ( j ), j t n k ,1 / 2 ES ( j )
35
Obsrvese cmo el centro o pivote del intervalo es la estimacin j del parmetro poblacional. Por su
t n k , 1 / 2 ES ( j ) ,
que al sumarse y restarse a j , determinan finalmente el intervalo de confianza.
123
2
2
u
u2
2 (n k ) n2k .
u
2
u
/2
/2
a n2k , / 2
b n2 k , 1 / 2
Figura 3
P a 2 2 b 1
u
P n2 k , / 2 2 2 n2 k ,1 / 2
u
2
P n2 k , / 2 u2 (n k ) n2 k ,1 / 2 1
u
n2 k , / 2
n2 k ,1 / 2
1
P 2
2 2
1
u .(n k ) u u .(n k )
2 .(n k )
u2 .(n k )
2 .(n k )
2 .(n k )
P u 2
u2 u2
u2 u 2
P 2
1 .
n k ,1 / 2
n k , / 2
n k , / 2
n k ,1 / 2
124
u2 .(n k ) u2 .(n k )
.
,
n2 k ,1 / 2 n2 k , / 2
SCR
nk
SCR
SCR
, 2
2
n k ,1 / 2 n k , / 2
4.3.
Yi 1 2 X 2 i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
125
t j
j j
tnk .
ES ( j )
Si asumimos como cierta la hiptesis nula ( j 0 ), y con los datos de la muestra que
estemos considerando, obtendremos un valor concreto para dicho estadstico: el
estadstico experimental, que adoptara la forma 36 :
exp
t nk .
ES ( j )
En la Figura 4 se puede ver la distribucin de este estadstico, mostrndose asimismo la
regin de aceptacin (RA) y la regin crtica (RC) (que en este caso estara conformada
por dos reas simtricas separadas, dado que estamos ante una distribucin t-Student),
que vendran delimitadas por los valores crticos t n*k , 1 / 2 y t n* k ,1 / 2 . stos ltimos
se estableceran a partir de los grados de libertad del modelo estudiado ( n k ) y del
nivel de significacin considerado.
t exp t n k
RA
1
RC
RC
/2
/2
t n* k ,1 / 2
t n*k ,1 / 2
Figura 4
36
Ntese que el estadstico de prueba podra igualmente utilizarse para cualquier otra hiptesis nula que
quisisemos contrastar en relacin a un valor concreto 0 del parmetro j ; esto es: H 0 : j 0 .
Tenida en cuenta la informacin muestral del caso concreto analizado, el estadstico experimental sera:
j 0
.
ES ( )
j
126
j 1, 2, ..., k
i 1, 2, ..., n .
3 0
......
k 0
H 1 : algn j 0,
j 2, ..., k
SCE / SCT
R2
k 1 F
k 1
k 1
k 1, n k .
SCR
SCR / SCT (1 R 2 )
nk
nk
nk
SCE
F exp
127
F exp Fk 1, n k
RA
RC
Fk*11,n k
Figura 5
De acuerdo con esto:
Los dos contrastes que hasta el momento se han visto en este apartado sobre los
coeficientes de regresin del modelo, el de significatividad individual de los parmetros
y el de significatividad global del modelo, no dejan de ser dos contrastes particulares de
la generalidad de contrastes que pueden plantearse para dichos coeficientes.
En efecto, nuestro inters puede centrarse en comprobar si se cumplen una serie de
relaciones (siempre lineales) entre los coeficientes, que pueden venir dadas por 1
ecuacin, o por ms de 1.
Sea el modelo economtrico clsico de regresin lineal mltiple:
128
Yi 1 2 X 2 i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n .
F exp
SCR
Fq ,n k .
nk
Como sabemos, n k son los grados de libertad del modelo y q hace referencia al
nmero de ecuaciones o restricciones que forman la hiptesis nula a contrastar (nmero
de filas de R ), debiendo ser linealmente independientes y verificar que: q k .
Obsrvese que, si desarrollamos este estadstico de prueba, ste puede expresarse de
forma alternativa como sigue:
F exp
SCR
R r ' R
2
u
nk
X ' X 1 R '
2
u
En este punto merece tambin hacer alusin al denominado estadstico de Wald (que es
utilizado por el programa EViews para llevar a cabo este tipo de contrastes). El
estadstico Fq , n k se construye a partir del cociente de dos variables aleatorias
independientes, cuyas distribuciones son del tipo chi-cuadrado con q y n k grados de
libertad, respectivamente. As:
R r
2
q
SCR
2
u
n2 k ,
la distribucin lmite del estadstico de Wald. sta se puede definir de igual modo, slo
que utilizando la estimacin insesgada de la varianza de las perturbaciones por MCO,
esto es:
R r
1
W R r ' R u2 X ' X R '
2
q
entonces: F exp
exp
R r ' R
2
u
X ' X 1 R '
R r F
q , nk
W
; o lo que es lo mismo: W q F exp .
q
Los siguientes ejemplos pueden ayudarnos a entender bien quines son los distintos
elementos que intervienen en el estadstico de prueba de este contraste:
a) Supongamos el siguiente modelo: Yi 1 2 X 2i 3 X 3i u i .
La hiptesis nula 37 a contrastar podra ser: H 0 : 2 3 , que si la rehacemos para
que queden despejados los parmetros j , quedara: H 0 : 2 3 0 .
En este ejemplo, tenemos que q 1 y H 0 se podra expresar matricialmente de la
forma:
1
1 2 0 ,
3
R 0 1 1
siendo:
r 0
1 2 5 3
Si despejamos los parmetros j hacia el miembro de la izquierda de las
ecuaciones, tenemos:
H 0 : 2 3 3 4 0
1 2 5 3
37
3 ,
0
0 2 3
1 0
4
5
donde:
0
0 1 3 1
R
0
0 2
1 0
0
r
3
F exp Fq , n k
RA
RC
Fq*, n1k
Figura 6
Para finalizar este punto, debemos resaltar que este estadstico que aqu hemos expuesto
sirve para contrastar cualquier hiptesis lineal que podamos plantearnos, incluidos los
131
El modelo restringido
En este punto abordamos el estudio de los contrastes de hiptesis sobre los coeficientes
de regresin del modelo desde otra perspectiva. En particular, comparamos dos
modelos: uno, el original; y otro, que llamamos modelo restringido, que es aqul que
asume como cierta la hiptesis nula y la incorpora en su propia definicin.
Por ejemplo, sea el siguiente modelo: Yi 1 2 X 2i 3 X 3i 4 X 4i 5 X 5i u i .
Supongamos que nos planteamos contrastar para el mismo esta hiptesis nula:
H0 : 4 0
5 0
En este caso, el modelo: Yi 1 2 X 2i 3 X 3i u i , sera el modelo restringido, ya
que, si nos fijamos ha incluido en su definicin las 2 restricciones indicadas por la
hiptesis nula.
Por su parte, el modelo original lo podramos denominar modelo no restringido.
Si abordsemos el anlisis de ambos modelos a partir de este punto, podramos obtener
en cada uno de ellos toda su informacin caracterstica; en particular: sus coeficientes
estimados ( y ), sus sumas de cuadrados residuales (SCR y SCRr) o sus
r
exp
SCR
SCRr SCR
nk
SCR
Rr2
(1 R )
nk
Fq , n k
nk
2j
F1, n k , el cual,
Var ( j )
si nos fijamos, coincide con el cuadrado del estadstico de prueba t; esto es: F
132
exp
t exp .
2
F exp Fq , n k
RA
RC
Fq*, n1k
Figura 7
A la vista de esto:
4.4.
analizar cmo puede verse afectado un modelo de consumo en Espaa entre los aos
1990 y 2010 ante la entrada del euro en 2002; es decir, si este hecho supuso un cambio
en la estructura de consumo.
Este contraste se utiliza tambin frecuentemente con datos de corte transversal; en esta
ocasin, para comparar dos o ms grupos de la muestra. Por ejemplo, si se est
analizando un modelo que explique el salario y se quiere estudiar si su comportamiento
es el mismo para hombres y mujeres o si, por el contrario, el modelo debe ser diferente
para uno y otro caso. O, por poner otro ejemplo, en el caso de un modelo de consumo, si
se quisiera comparar si su estructura es la misma para residentes en zona urbana o no
urbana, etc.
As pues, el planteamiento de este tipo de contraste sera el siguiente:
H 0 : Ausencia de cambio estructural
H 1 : Existencia de cambio estructural
Si nos fijamos, la hiptesis nula contempla el caso en que un mismo modelo subyace
bajo el total de los datos de la muestra. Por el contrario, la hiptesis alternativa asumira
que seran precisas distintas estimaciones del modelo para cada uno de los periodos
temporales o divisiones transversales (segn el tipo de datos) considerados de la
muestra.
Es decir, supongamos el siguiente modelo general:
Yi 1 2 X 2i ... j X ji ... k X ki u i
j 1, 2, ..., k
i 1, ..., n
Subperiodo 1
Yi 1* 2* X 2i ... *j X ji ... k* X ki u i*
j 1, 2, ..., k
i 1, ..., n1
j 1, 2, ..., k
i n1 1,..., n
Subperiodo 2
134
exp
SCR1 SCR2
k F
k , n2 k ,
n 2k
(h 1)k
F( h 1) k , n hk .
n hk
39
Obsrvese que en este contraste la hiptesis nula contiene una ecuacin por cada igualdad entre los
coeficientes de regresin asociados a una misma variable en cada subperiodo; esto es: q k . Igualmente,
los grados de libertad asociados al denominador de este estadstico son: n1 k para el caso del modelo
del primer subperiodo y n2 k , para el segundo; por tanto, la suma de ambos hace que sea: n 2k .
135
F exp F( h 1) k , n hk
RA
RC
F(*h 11)k , n hk
Figura 8
4.5.
Prediccin.-
j 1, 2, ..., k
i 1, 2, ..., n .
j 1, 2, ..., k
i 1, 2, ..., n .
O bien, matricialmente: Y X .
A partir del modelo estimado, si dispusisemos de una serie de valores concretos para
todas y cada una de las variables explicativas X j que conforman la matriz X,
podramos obtener una estimacin del valor de la variable dependiente Y.
Si tales valores de las variables independientes fuesen extra-muestrales, es decir, valores
distintos a los que integran la muestra objeto de estudio (que denotaremos de forma
general X ), entonces dicha estimacin de Y (que denotaremos por Y ) sera en
j 0
realidad una prediccin. sta podra plantearse tanto para series temporales (pensando
en la obtencin de un valor futuro de Y), como para datos transversales.
As, si nos facilitan la serie de valores extra-muestrales de las variables independientes
X 0 , tendramos:
136
X1 0 1
X2 0 X2 0
X0
Y0 X 0' .
Xk 0 Xk 0
de la cual podemos deducir cules son las fuentes del error de prediccin, esto es, de
dnde pueden provenir los errores o desviaciones que se produzcan a la hora de
contrastar la realidad con la estimacin. Tales fuentes son:
-
Errores en la estimacin de : .
Asimismo, tambin se puede ver que, puesto que e0 depende de u 0 y sta tiene
naturaleza aleatoria, entonces e0 es una variable aleatoria; adems, dado que u 0 es
normal, entonces e0 sigue igualmente una distribucin normal de probabilidad y, como
tal, nos interesa conocer tanto su valor esperado como su varianza. stos resultan ser:
E e0 0
e0
u2 1 X 0' ( X ' X ) 1 X 0
137
e0
N 0,1 .
ES (e0 )
u2
(n k ) n2 k ,
2
u
podramos generar un nuevo estadstico que seguira una distribucin de probabilidad tStudent, con n k grados de libertad:
e0
u2 1 X 0' ( X ' X ) 1 X 0
u2
(n k )
u2
e0
1 X 0 ( X ' X ) X 0
2
u
'
e0
t nk .
ES (e0 )
nk
Este estadstico resultante vamos a denotarlo por t e0 . En la Figura 9 se representa la
funcin de densidad que seguira.
t e0
/2
/2
b t n k ,1 / 2
b t n k ,1 / 2
Figura 9
Partiendo de aqu, podemos deducir un intervalo de confianza para la prediccin puntual
Y0 :
P b t e0 b 1
e0
P t n k ,1 / 2
t n k ,1 / 2 1
ES (e0 )
Y0 Y0
P t n k ,1 / 2
t n k ,1 / 2 1
ES (e0 )
138
P t n k ,1 / 2 ES (e0 ) Y0 Y0 t n k ,1 / 2 ES (e0 ) 1
P Y0 t n k ,1 / 2 ES (e0 ) Y0 Y0 t n k ,1 / 2 ES (e0 ) 1 .
Como sabemos, esto quiere decir que el valor real Y0 que se corresponda con la
observacin de nuestra prediccin se encuentra contenido en este intervalo con un nivel
de confianza cifrado en el (1 ).100 %.
Para concluir, podemos sealar las condiciones que deben cumplirse para que las
predicciones que llevemos a cabo sean fiables; seran:
-
Que los coeficientes de regresin sean suficientemente estables como para que sus
estimaciones actuales muestrales sean una buena aproximacin a los valores
obtenidos tras incorporar observaciones futuras o extra-muestrales.
139
Introduccin al uso de EViews (II).Continuamos en este apartado profundizando en nuestro conocimiento del manejo de
EViews. En particular, veremos cmo se llevan a cabo los distintos contrastes de
hiptesis ms comnmente aplicados en el proceso de validacin de un modelo
economtrico y aprenderemos, asimismo, a realizar predicciones. Como primer paso
para desarrollar esta tarea, procederemos a establecer un modelo economtrico que nos
servir as de ejemplo.
Nuestra explicacin se va a estructurar siguiendo estos puntos:
141
Figura 1
Figura 2
La Figura 3 muestra los resultados obtenidos del modelo estimado. Podemos guardar
ste dndole un nombre; por ejemplo: REG. Lo haremos pulsando el botn NAME.
142
Figura 3
De estos resultados, lo primero que podemos resear es el signo de los coeficientes de
regresin estimados, el significado de tales coeficientes, as como la bondad del ajuste:
-
En cuanto a los parmetros estimados, dado como estn definidas las variables, en
este caso stos reflejan una aproximacin al concepto de elasticidad. As, el
coeficiente asociado a la renta familiar disponible representa la elasticidad renta del
consumo privado de productos no alimenticios; para nuestro caso, un crecimiento de
un 1% en la renta se traduce en un incremento de un 0,324123% en el consumo de
productos no alimenticios. El significado para el resto de variables es anlogo.
Como bien sabemos, uno de los pilares fundamentales sobre los que se sustenta la
construccin del modelo clsico de regresin lineal es el hecho de que la perturbacin
aleatoria siga una distribucin de probabilidad normal, puesto que en ello se basa todo
el desarrollo de la teora inferencial del modelo (contrastes e intervalos de confianza).
As pues, antes de seguir adelante debera contrastarse si, en efecto, la perturbacin de
nuestro modelo se comporta como una normal. Pero dado que la perturbacin es
aleatoria e inobservable por definicin, el estudio de su normalidad debe hacerse a partir
de una estimacin de la misma; la serie de los residuos o errores muestrales del modelo
constituye dicha estimacin.
Por tanto, nuestro objetivo en este punto ser analizar la normalidad de los residuos.
Este anlisis se realiza situndonos en la ventana de la ecuacin estimada, donde
seleccionaremos VIEW. De este modo se despliega un men en el que, entre otras,
tenemos las opciones siguientes para elegir:
Coefficient Tests; nos facilitar los instrumentos para realizar cualquier tipo de
contrastes de hiptesis nulas lineales sobre los coeficientes de regresin bien a
travs del estadstico de Wald o el de Fisher-Snedecor.
Residual Tests; presenta diversas opciones destinadas a realizar un anlisis
exhaustivo de los residuos y con ello de la perturbacin aleatoria del modelo:
normalidad, heteroscedasticidad, autocorrelacin
Stability Tests; ofrece la oportunidad de identificar cambios estructurales a travs
del Test de Chow, errores de especificacin general con el Test RESET de Ramsey y
analizar la inestabilidad de los parmetros utilizando los residuos recursivos.
144
Figura 4
Figura 5
145
De esta salida, el aspecto que ms nos interesa en este punto es el relativo al contraste
de Jarque-Bera. Como ya sabemos, este contraste plantea como hiptesis nula la
normalidad de la serie de datos analizada, que en este caso es la de los residuos. De
acuerdo con el p-valor asociado al estadstico de Jarque-Bera, el nivel de confianza
mximo para rechazar la hiptesis nula es del 78,19%, por lo que incluso para un 90%
aceptaremos la hiptesis nula.
En definitiva, acabamos de contrastar que la serie de los residuos de la estimacin, y
con ello la perturbacin aleatoria del modelo, sigue una distribucin normal de
probabilidad.
146
Figura 6
Figura 7
147
Figura 8
Para aplicar este test en el caso en que se considere ms de una restriccin en la
hiptesis nula a contrastar, debemos separar stas entre comas al indicarlas en el cuadro
de dilogo del test.
Por ejemplo, podemos contrastar ahora que la suma de las elasticidades de la renta y el
empleo sea igual a 1, a la vez que el valor de la primera sea el doble que el de la
segunda; esto es:
H 0 : 3 4 1
3 2 4
H 1 : No se verifican a la vez
ambas restricciones
En la Figura 9 aparece el resultado de este contraste: el valor del estadstico de Wald en
este caso es el doble que el del estadstico F (pues ahora hay 2 restricciones en la
hiptesis nula) y la hiptesis nula se puede rechazar, atendiendo a cualquiera de los dos
estadsticos de prueba, para todos los niveles de significacin estndar en el mbito de
la Estadstica (incluso del 1%).
148
Figura 9
Para comprobar si la estructura estimada, definida por los coeficientes de regresin del
modelo, es constante en el tiempo, podemos aplicar el contraste de cambio estructural
de Chow.
Este tipo de contraste se recoge en el tercer grupo de contrastes definidos al inicio de
este ejercicio, de forma que accederemos a l a partir del men contenido en la ventana
de la ecuacin estimada, con VIEW / STABILITY TESTS / CHOW BREAKPOINT TEST.
Para realizar este contraste, es necesario definir un punto de corte de la muestra total, de
forma que ste la divida en dos submuestras. Este punto es escogido a priori por el
investigador, dependiendo de las circunstancias particulares de espacio y tiempo en que
se muevan las variables (crisis del petrleo, etc.), as como del objetivo del anlisis.
En el ejercicio que estamos desarrollando como ejemplo, vamos a comprobar si los
grandes eventos del ao 1992 en Espaa (Juegos Olmpicos de Barcelona y Exposicin
Universal de Sevilla) tuvieron algn efecto sobre el consumo de productos no
alimenticios. As pues, seleccionamos el Test de Chow e indicamos como punto de
corte: 1992 (Figura 10).
En este test, la hiptesis nula establece la ausencia de cambio estructural. El resultado
final aparece en la Figura 11.
149
Figura 10
Figura 11
150
Aunque EViews nos calcule de nuevo dos estadsticos, vamos a centrarnos esta vez
exclusivamente en el estadstico F de Fisher-Snedecor. Este estadstico se basa en la
comparacin entre la suma de los residuos al cuadrado de la regresin total (1980-2007)
y las correspondientes a las regresiones de las dos submuestras (1980-1991 y 19922007). El elevado p-valor obtenido nos conduce a aceptar la hiptesis nula de ausencia
de cambio estructural a un nivel mximo de significacin del 43,06%; es decir, el
consumo no alimenticio no presenta un comportamiento diferenciado en el transcurso
de todo el periodo.
En este ltimo punto vamos a llevar a cabo una prediccin para el ao 2008 de la tasa de
variacin del consumo en productos no alimenticios, con base 1992, a partir de nuestra
especificacin del modelo. Para ello, se dispone de los datos correspondientes a 2008 de
las variables explicativas de dicho modelo:
PRECIO
RENTA
EMPLEO
PRECA
TIR
3,2348
2,8722
2,1521
35,0152
4,2807
Lo primero que deber hacerse es introducir las cifras indicadas para 2008 en todas y
cada una de las series correspondientes. Con este fin, deber irse abriendo cada serie y
pulsar EDIT +/- entre sus opciones, escribindose entonces la cifra en la posicin
sealada, tal y como se refleja en la Figura 12 para el caso de la variable PRECIO. (No
debe olvidarse que los decimales en EViews deben escribirse en notacin anglosajona,
es decir, tras un punto.) Despus de introducir cada cifra, pulsaremos nuevamente EDIT
+/- para bloquear la escritura y evitar modificar alguna otra cifra por error.
A continuacin se realiza la prediccin del valor de la cifra de consumo utilizando la
especificacin lineal del modelo; para ello habr de seleccionarse la ecuacin estimada
REG. Una vez abierta, se elige la opcin FORECAST, obteniendo una ventana en la que
deberemos dar un nombre a la nueva serie de los valores estimados de la variable
dependiente. Por defecto, EViews nombra a esta serie igual que a la serie original pero
aadindole al final una F (del ingls, forecast). En este caso, CONSUMOF.
Podemos dejar este nombre, pero puede cambiarse a gusto del investigador. Asimismo
deberemos elegir el rango de datos de la salida estimada. Aqu deber elegirse 1980
2008. Con ello, las cifras de 1980 a 2007 de la serie CONSUMOF sern datos
estimados, en tanto que la correspondiente a 2008 ser una verdadera prediccin extramuestral. Adems de ello, EViews permite crear la serie de errores estndar estimados
de los errores de prediccin puntual, que puede nombrarse como se desee (por ejemplo,
ESERRORF). Por lo dems, vamos a dejar las opciones sealadas por defecto. La
pantalla quedara tal como se indica en la Figura 13.
151
Figura 12
Figura 13
La Figura 14 muestra el resultado obtenido. En ella se ofrecen algunos estadsticos de
referencia para evaluar la estimacin-prediccin realizada (raz cuadrada del error
152
Figura 14
Igualmente, resulta interesante ver la Figura 15, donde se representan grficamente para
el periodo 1980-2007 la serie de datos reales de las tasas de variaciones del consumo
con base 1992, conjuntamente con la de sus valores estimados a partir del modelo lineal
establecido (CONSUMO y CONSUMOF, respectivamente), as como la de los residuos
MCO resultantes tras el ajuste. Con ello podemos ver que dicho ajuste resulta bastante
bueno y tambin qu observaciones son las que presentan mayores desviaciones entre el
dato real y el estimado; esto es, dnde se registran los mayores residuos, siendo en este
caso los correspondientes a los aos 2003, 1981 y 1985. Esto se hace a travs de: VIEW
/ ACTUAL, FITTED, RESIDUAL / ACTUAL, FITTED, RESIDUAL GRAPH.
Por ltimo, podemos resear cmo en la ventana de trabajo puede observarse que
aparecen las nuevas series de datos CONSUMOF y ESERRORF generadas. Adems, si
se abre la primera de ellas (CONSUMOF), se podr comprobar que, junto con las
estimaciones de los datos que van de 1980 a 2007, para 2008 aparece un nuevo dato:
2,8033, que resulta ser en este caso una prediccin extra-muestral. Todo esto puede
apreciarse en la Figura 16.
Para finalizar, podemos guardar este fichero para su uso en una sesin de trabajo
posterior. Esto lo haremos yndonos a FILE / EXIT en la barra principal de mens. De
153
este modo, podremos aprovechar este mismo modelo para analizar ms adelante
posibles problemas que pudiese presentar.
Figura 15
Figura 16
154
TEMA 4
El modelo clsico de regresin lineal:
incumplimiento de supuestos
Hasta este momento hemos estado trabajando con un modelo de regresin lineal
perfecto, que posee toda una serie de propiedades sustentadas en un amplio conjunto
de supuestos de distinta naturaleza, estocsticos y no estocsticos. En este Tema vamos
a estudiar qu sucede en nuestro modelo clsico de regresin lineal cuando no se
cumplen todos los requisitos o supuestos descritos previamente. Analizaremos distintas
situaciones: problemas de errores de especificacin en el modelo (que pueden provenir
de diferentes causas), presencia de multicolinealidad entre las variables explicativas del
modelo y existencia de heteroscedasticidad y/o autocorrelacin en la perturbacin
aleatoria de ste.
5.1.
Los coeficientes estimados por MCO ( ) pueden ser estimaciones sesgadas de los
parmetros poblacionales del modelo que resultara ms adecuado en la realidad.
Errores de medicin
Sus varianzas son tambin insesgadas, aunque mayores que en el caso en que no
hubiera este error. As pues, los estimadores no son ELIO, pues no son eficientes.
ste es, por tanto, un problema ms grave que el caso anterior. Se podra trabajar
entonces, en lugar de con las variables verdaderas, con variables que fuesen
aproximaciones de stas (variables instrumentales o proxy).
156
exp
SCRr SCR / m
SCR / n k
Rr2 / m
1 R 2 /(n k ) Fm,nk ,
2
donde:
Este test es un test general de mala especificacin de un modelo, aplicable para detectar
la omisin de variables relevantes y la eleccin de una forma funcional inadecuada. La
hiptesis nula es que el modelo de partida est bien especificado.
Los pasos que se siguen en este test son:
1. A partir del modelo inicialmente elegido, se obtienen los valores estimados de la
variable dependiente: Y .
i
1 R
2
exp
R 2 ANTIGUO / l
Fl ,n m ,
2
NUEVO /( n m)
NUEVO
donde:
l = n de nuevos regresores
m = n de parmetros del nuevo modelo
El objetivo es comprobar si el nuevo modelo supone una aportacin significativa
(vista a travs de su R 2 ) respecto al original.
157
5.2.
Definicin de multicolinealidad
En este caso, es posible obtener una estimacin de una combinacin lineal de los
parmetros del modelo, pero no calcular
de forma nica.
MCO
Cuando no hay relacin lineal alguna entre las distintas variables explicativas (es decir,
el coeficiente de correlacin lineal entre X j y X m vale 0, X j X m ), la estimacin
por MCO de los parmetros poblacionales del modelo puede llevarse a cabo tanto de
1
manera conjunta a travs de la expresin X ' X X ' Y , como efectuando por
separado las regresiones simples de la variable explicada con cada una de las variables
explicativas; los resultados coincidiran exactamente. Esto es, se podra plantear:
Yi 1 2 X 2i i , de donde se obtendra 2 ,
Los MCO son estimadores lineales, insesgados y ptimos (en el sentido de mnima
varianza); es decir, siguen siendo ELIO.
Altos valores de los elementos de la matriz de var cov ( MCO ) ; esto conlleva:
o Amplios intervalos de confianza para los parmetros poblacionales j ,
sus estimadores.
Deteccin de la multicolinealidad
40
Obsrvese que al aumentar ES( j ) , disminuye el valor del estadstico t j , con lo que aumenta la
1. Observar un valor del X ' X prximo a cero. No obstante, este mtodo no resulta
definitivo, ya que puede deberse a los valores concretos de la muestra escogida. Su
principal limitacin es que no tiene cota superior.
2. Estar ante un R 2 elevado (y, por tanto, ante una F que indica que el modelo es
globalmente significativo) y pocos estadsticos t-Student significativos asociados a
las variables explicativas. Se trata de un rasgo habitual en situaciones de
multicolinealidad, si bien no es del todo concluyente.
3. Constatar altos valores de los coeficientes de correlacin lineal simple ( R 0,8 )
entre las variables explicativas. Es una condicin suficiente.
4. Prueba de eliminacin de variables. Este mtodo comienza calculando R 2 para el
modelo completo; si se elimina luego aquella variable que se considere ms
correlacionada, y resulta que el nuevo valor de R 2 apenas vara, entonces es signo
evidente de que la relacin de colinealidad exista.
5. Mtodo de las regresiones auxiliares de Farrar-Glauber. Este mtodo consiste en
efectuar las regresiones de cada variable explicativa X j en funcin de las restantes
(denominadas regresiones auxiliares), calculando sus correspondientes coeficientes
de determinacin R 2j . Para cada una de estas regresiones auxiliares se lleva entonces
a cabo el siguiente contraste mediante el estadstico F de Fisher-Snedecor:
H 0 : R 2j 0
Fj
R 2j (k 1) 1
(1 R 2j ) n (k 1)
Fk 2, n ( k 1) .
var ( j )
1
.
2
var ( j ) 0 1 R j
Cuanto mayor sea el valor de FAV ( j ) , mayor ser la relacin lineal entre las
variables explicativas del modelo.
160
n ( x)
donde
mx
mn
mx
,
mn
merecer su consideracin.
Tratamiento de la multicolinealidad
Una vez detectada la presencia de multicolinealidad, existen diversas formas de
acometer su correccin. Entre ellas, pueden destacarse las siguientes:
161
5.3.
En este apartado vamos a ver cmo analizar con EViews algunos de los errores de
especificacin que puede presentar un modelo, as como la posible existencia de
multicolinealidad entre las variables explicativas del mismo. Para ello resolveremos, a
modo de ejemplo, el Ejercicio n 40 del Boletn del Tema 5, donde el modelo
considerado ya se especific en una sesin anterior de trabajo con EViews a partir del
archivo tests.wf1, disponible en el espacio reservado a la Asignatura en WebCT.
Al abrir este fichero (FILE / OPEN / WORKFILE), veremos que este fichero contena
los datos de las variables siguientes, correspondientes al periodo 1980-2007 (Figura 1):
CONSUMO: Tasas de variacin anuales del consumo privado no alimenticio en
trminos reales de 1992
PRECIO: Tasas de variacin anuales de los precios del consumo privado no
alimenticio con base 1992
RENTA: Tasas de variacin anuales de la renta familiar disponible en trminos
reales de 1992
EMPLEO: Tasas de variacin anuales del empleo total
PRECA: Precariedad en el mercado de trabajo (porcentaje de contratos temporales
sobre total de contratos)
TIR: Tipos de inters reales en base 1992
Podemos guardarlo, pulsando el botn NAME, con el nombre REG, por ejemplo. 41
Figura 1
Figura 2
Si guardamos el fichero en la sesin anterior de trabajo con EViews que hemos referido, podemos
entonces recuperarlo directamente y comenzar en este punto en la presente sesin.
41
163
El anlisis inicial de los resultados obtenidos nos llev a comprobar cmo los signos de
todos los coeficientes de regresin parecan correctos.
Asimismo, del estudio de la significatividad individual de las variables explicativas, a
travs de los p-valores asociados a los correspondientes estadsticos t-Student, poda
deducirse que, con la excepcin de la variable TIR, todas ellas eran estadsticamente
significativas a un nivel de confianza incluso del 99%. En el caso de TIR, sta no lo
resulta siquiera para un 10% .
Respecto a la significatividad global del modelo, el p-valor (0,000000) asociado al
estadstico F de este contraste (37,02546) evidenciaba que as era, para un nivel de
confianza prcticamente del 100%.
En cuanto a la bondad del ajuste, el valor del coeficiente de determinacin (0,893785)
reflejaba que el ajuste resultaba muy aceptable. Por su parte, el valor del coeficiente de
determinacin corregido (0,869645), no slo reflejaba este hecho, sino tambin que no
existan problemas importantes de grados de libertad, dado que su valor no haba
sufrido un gran descenso en relacin al original.
Junto a todo esto, el contraste que se hizo posteriormente sobre la normalidad de la
perturbacin aleatoria del modelo, a travs del test de Jarque-Bera, vino a confirmar que
efectivamente u resultaba normal.
Llegados a este punto, y antes de dar definitivamente por bueno nuestro modelo,
podemos plantearnos si el modelo presenta algn tipo de error de especificacin.
Segn se ha podido comprobar al analizar la significatividad individual de cada una de
las variables del modelo, quizs no se debera considerar la de tipos de inters (TIR).
Para analizar si esta variable, incluida en la especificacin inicial, es necesaria o no,
podemos aplicar el test de variables irrelevantes o redundantes. Para llevar a cabo este
test en EViews, dentro de nuestro modelo estimado, debemos seleccionar la opcin
VIEW / COEFFICIENT TESTS / REDUNDANT VARIABLES y escribir el nombre de la
variable (TIR) en el cuadro de dilogo que surge (Figura 3).
La salida de EViews de la Figura 4 nos ofrece el resultado del test, bajo la hiptesis nula
de que el coeficiente de la variable seleccionada es cero, a travs del estadstico F (y el
ratio de verosimilitud o LR (Log likelihood ratio), que no consideraremos), adems del
resultado de realizar la regresin del modelo restringido, es decir, sin incluir la variable
seleccionada. Como sabemos, el estadstico F compara la suma de cuadrados residuales
calculada con y sin restricciones impuestas; si las restricciones planteadas son vlidas,
la diferencia entre los dos valores ser mnima y, por tanto, el valor de F ser pequeo
(conduciendo ello a aceptar la hiptesis nula). Este estadstico tiene como grados de
libertad del numerador el nmero de restricciones de coeficientes establecido en la
hiptesis nula (en este caso, 1) y en el denominador, los grados de libertad de la
regresin total (en este caso, 22).
164
Figura 3
Figura 4
En este caso, los resultados obtenidos nos conducen a aceptar la hiptesis nula, pues el
p-valor asociado al estadstico F nos indica que el nivel de significacin mnimo al que
165
se puede rechazar la hiptesis nula es del 14,58%, o bien el nivel de confianza mximo
para rechazar dicha hiptesis es del 85,42%. Por tanto, la variable TIR no es necesaria
en nuestro modelo. Si bien la nueva especificacin perdera algo de bondad de ajuste
(evidenciada por la comparacin de los correspondientes valores del coeficiente de
determinacin corregido: 0,869645 frente a 0,862429), dicha prdida no sera relevante.
As pues, podemos eliminarla de nuestra estimacin. Ello lo haremos editando el
modelo en el botn ESTIMATE de nuestra ecuacin REG y borrando simplemente la
variable en cuestin.
Tras llevar a cabo esta depuracin de nuestro modelo, resulta que nos facilitan los
datos de una nueva variable que consideramos que podra ser relevante en el mismo:
TIPIMP: Tipo medio impositivo en trminos reales con base 1992
Figura 5
166
Una vez importada TIPIMP, vamos a comprobar si esta nueva variable debe estar
presente en el modelo; es decir, si es una variable relevante que hasta el momento
hemos omitido en su especificacin. Para verlo, aplicaremos el test de variables
omitidas, que establece como hiptesis nula que la variable o variables a considerar en
el nuevo modelo no son significativas. El estadstico F de este contraste se calcula a
partir de la diferencia de la suma de cuadrados residuales de la regresin inicial (que
sera la restringida) y de la regresin con las variables que se omitieron en principio.
Sus grados de libertad son en este caso 1, 22.
Para la realizacin de este contraste, dentro de nuestro modelo REG, deberemos
seleccionar VIEW / COEFFICIENT TESTS / OMITTED VARIABLES y seguidamente
introduciremos la variable TIPIMP (Figura 6). 42
Figura 6
Los resultados se pueden ver en la Figura 7. Aparte de los estadsticos y p-valores
asociados a F y LR (aunque ste ltimo lo obviaremos), la aplicacin de este test
incluye la regresin realizada aadiendo esta nueva variable en la estimacin. De este
modo, podemos comprobar que:
-
42
En este test debemos tener presente que la nueva variable que introduzcamos en el modelo ha de tener
el mismo nmero de observaciones que las de la especificacin inicial (en este caso, datos de 1980 a
2007).
167
El signo que presenta TIPIMP es correcto (negativo), tal como era de esperar.
Figura 7
En definitiva, hemos visto cmo nuestro modelo debe incluir la variable TIPIMP. Para
llevar a cabo de manera definitiva el nuevo ajuste, dentro de nuestro modelo REG,
pulsaremos una vez ms la opcin ESTIMATE y aadiremos la variable TIPIMP. El
resultado de la estimacin puede apreciarse en la Figura 8.
Otro tipo de test destinado a detectar problemas en la especificacin del modelo es el
denominado Test RESET de Ramsey. Este test permite detectar la omisin de variables y
la eleccin de una forma funcional inadecuada.
La realizacin del Test de Ramsey en EViews se hace, tambin dentro de la Ventana de
Ecuacin, a travs de VIEW / STABILITY TESTS / RAMSEY RESET TEST (Figura 9).
La base de este test reside en la comparacin de la especificacin inicial del modelo con
una nueva que se plantea como alternativa y que aade, a las variables explicativas
originales, potencias de la estimacin de la variable endgena; de este modo, se
pretenden capturar posibles relaciones sistemticas existentes entre los residuos y las
estimaciones de Y y que no son recogidas por el modelo inicial. En este contraste se
emplea un estadstico F cuyo clculo se basa en la diferencia entre los coeficientes de
determinacin del nuevo modelo y el del original. La aceptacin de la hiptesis nula
supone asumir que el modelo inicial resulta aceptable; por el contrario, su rechazo
implica pensar que el modelo est mal especificado.
168
Figura 8
Figura 9
En este caso, hemos aadido a nuestra especificacin 2 potencias de Y : Y 2 e Y 3 .
Normalmente con este nmero ya resulta suficiente para tener conclusiones (Figura 10).
169
Figura 10
En la Figura 11 aparece el resultado de este contraste, aprecindose que la hiptesis
nula se acepta para un nivel mximo de significacin del 56,50%. As pues, se acepta la
hiptesis nula: nuestra ltima especificacin del modelo resulta correcta.
Figura 11
170
Figura 12
Una vez aqu (Figura 13), en VIEW, podremos escoger realizar la matriz de
correlaciones (CORRELATIONS). Al analizar los resultados de sta (Figura 14), no
171
parece que haya problemas de multicolinealidad, pues no hay ningn valor absoluto que
se site por encima de 0,8. Con esto, finaliza as el presente ejercicio.
Figura 13
Figura 14
172
5.4.
ji
... k X ki u i
j 1, 2, ..., k
i 1, 2, ..., n ,
0
Var Cov (u )
2
u
0
1
0
0
2
u2 u
0
u2
0 0
1 0 0
0 1 u2 I .
0 1
Var Cov (u )
u2
u2
u2n
problema sera preciso establecer algn tipo de supuesto que permitiese, de algn modo,
reducir el nmero de parmetros a estimar, de forma que finalmente fuese menor que n .
Ante la presencia de heteroscedasticidad, la matriz de Var Cov (u ) es una matriz
diagonal, que podra expresarse de la forma:
u21
2
0
Var Cov (u ) 2
u2
u2
0
2
2
un
2
0
matriz de Var Cov (u ) no tendran por qu ser todos cero, por lo que sta ya no sera
diagonal 43 :
u2
12
Var Cov (u )
1n
12
u2
23
u2
2n
43
1n
2n
.
u2
n2 n
2
parmetros, que evidentemente es un nmero mayor que el de observaciones muestrales
n2 n
n : 1 , 2 , k , ms los
elementos diferentes que se hallan por encima de la
2
diagonal principal de la matriz 44 . Por tanto, al igual que suceda con la
heteroscedasticidad, se deber establecer algn tipo de supuesto que conduzca a reducir
dicho nmero de incgnitas hasta que sea menor que n .
2
u
12 2
u
Var Cov (u ) u2
1n 2
12
2
u
2n
u2
23
u2
1n
2n
u2
u2
2
u
La matriz tendra aqu tambin una forma caracterstica, si bien distinta a la del caso
de heteroscedasticidad.
En definitiva, ante la presencia de heteroscedasticiad o de autocorrelacin en la
perturbacin aleatoria u del modelo, tendramos que su matriz de varianzas-covarianzas
se podra escribir de forma general:
Var Cov (u ) 2 , siendo I .
Los elementos que hay por debajo de la diagonal principal de la matriz son los mismos que hay por
encima de la misma, dado que la matriz es simtrica: ij ji , i j .
45
Obsrvese que, de acuerdo con las hiptesis establecidas, esto ltimo tambin sera cierto aun
presentando autocorrelacin la perturbacin aleatoria.
175
Cuando la perturbacin aleatoria cumple estos supuestos, se dice que es esfrica. En los
casos en que incumple al menos alguno de ellos, es decir, que presenta
heteroscedasticidad y/o autocorrelacin, se habla de perturbacin no esfrica.
Llegados a este punto, nos planteamos qu sucede con la estimacin de los parmetros
del modelo por el mtodo de MCO si la perturbacin aleatoria resulta ser no esfrica;
esto es, nos planteamos el modelo de regresin lineal Y X u , donde
Var Cov (u ) 2 , con I .
En esta situacin, el estimador MCO de sigue siendo una solucin del sistema de
ecuaciones normales: X ' X X ' Y , por lo que si la matriz ( X ' X ) es invertible, la
solucin nica a dicho sistema es: MCO X ' X 1 X ' Y . As pues, podemos seguir
estimando el modelo por MCO.
El siguiente paso ser comprobar si el estimador MCO sigue conservando sus
propiedades ideales; es decir, si en este escenario sigue siendo ELIO: insesgado y
ptimo (de mnima varianza). Para ello, vamos a analizar qu sucede con el valor
esperado y la matriz de varianzas-covarianzas de
.
MCO
1
Como ya sabemos, MCO puede expresarse como: MCO X ' X X ' u .
1
1
E MCO E X ' X X ' u X ' X X ' E u .
'
'
1
1
E X ' X X ' u X ' X X ' u
'
1
1
1
1
X ' X X ' 2 X X ' X 2 X ' X X ' X X ' X .
1
Var Cov MCO u2 X ' X .
176
1
1
En definitiva, tenemos que: MCO N k ; 2 X ' X X ' X X ' X .
El problema que nos encontramos sin embargo con el mtodo de estimacin de MCO es
aun siendo correcta, no resulta la menor posible,
que esta matriz de Var Cov
MCO
MCO
Segn acabamos de mostrar, la estimacin por MCO de los parmetros del modelo ya
no resulta de mnima varianza ante la presencia de heteroscedasticidad y/o
autocorrelacin en la perturbacin aleatoria. Esto, unido a que adems la matriz de
que estemos utilizando pueda no ser la correcta, lo que invalidara
Var Cov
MCO
E u * E Pu PE u P
Puesto que lo que perseguimos es que Var Cov u * sea escalar, nuestro objetivo final
ser ver qu matriz P debemos elegir para transformar el modelo, de tal manera que
verifique que: P P ' I .
Sabiendo que es una matriz simtrica y definida positiva, matemticamente se puede
llegar a demostrar que existe una matriz cuadrada no singular V , de tal modo que:
V V ' . Pues bien, la matriz P que buscamos resulta ser:
P V 1 .
Como se puede ver, esta matriz efectivamente verifica:
'
1
Var Cov u * 2 P P ' 2 V 1 V V ' V 1 2 V 1 V V ' V ' 2 I .
Ntese que los elementos de la matriz P son simplemente los coeficientes de dichas combinaciones
lineales.
46
178
ya que:
MCG
X 'X
*
* 1
'
'
X ' V 1 V 1 X X ' V 1 V 1Y X ' 1 X
'
'
X ' Y V 1 X V 1 X V 1 X V 1Y
X ' 1 Y .
X '
X MCG X ' 1 Y .
47
Obsrvese que, en el caso de que se trabajase con los datos originales, habra que calcular la matriz
1 , la cual es cuadrada de orden n x n. En cambio, si se trabaja con los datos de las variables
transformadas, el orden de las matrices cuya inversa debera calcularse sera slo de orden k x k.
179
MCG N k ; 2 X * ' X *
, o bien:
N k ; 2 X ' 1 X
MCG
positiva.
1. La estimacin por MCG del otro parmetro relevante del modelo, 2 , se obtiene a
partir de la expresin:
2
MCG
u2*
e * ' e * SCR *
,
nk
nk
MCG
donde:
*
e * Y * YMCG
Y * X * MCG V 1 Y (V 1 X ) MCG V 1 Y X MCG V 1 eMCG .
2
2. Este estimador es insesgado; es decir: E MCG
180
2.
Coeficiente de determinacin
Inferencia estadstica
Como hemos podido apreciar, el nuevo modelo transformado, obtenido tras premultiplicar las observaciones de las variables originales por la matriz de coeficientes
lineales apropiada, no slo tiene los mismos coeficientes de regresin que el modelo
original, sino que tambin cumple los supuestos propios de la modelizacin
economtrica clsica, para la cual se ha desarrollado en temas anteriores toda la teora
inferencial referida a dichos coeficientes. Por consiguiente, todos los estadsticos
entonces establecidos podrn seguir siendo vlidos, con la nica salvedad de que en
lugar de referirnos a las variables originales X e Y , deberemos hacerlo ahora a las
variables transformadas X * e Y * , respectivamente. O de forma alternativa, si se
desease seguir trabajando con las variables originales, siempre que aparezca un
producto entre las matrices de datos de dichas variables, deber considerarse en medio
de ellas la matriz 1 , de manera anloga a lo que ya se ha mostrado en expresiones
anteriores de este mismo Tema.
0
2
Var Cov (u )
u2
u2
181
0
.
u2n
2
0
Mtodos grficos
Mtodos analticos
o
en
las
hiptesis
estadsticas
VAB 1 2 EMPLEO u .
182
Figura 15
A continuacin, seleccionamos la opcin NAME de la Ventana de Ecuacin para
guardar dicha estimacin con el nombre, por ejemplo, de AJUSTEMCO, cerrando
seguidamente dicha ventana.
La observacin de los parmetros, coeficientes y estadsticos conocidos obtenidos
podra hacernos pensar inicialmente que el modelo resulta aceptable; sin embargo por la
naturaleza de los datos, de tipo transversal, sospechamos que puede presentar problemas
de heteroscedasticidad. En particular, pensamos que el comportamiento de la varianza
de la perturbacin aleatoria depende directamente de la variable explicativa del modelo,
esto es, del EMPLEO, o bien de una transformacin de sta. Por este motivo, vamos a
estudiar por distintos mtodos la existencia de este posible problema.
El primer tipo de mtodos que pueden utilizarse para estudiar la posible presencia de
heteroscedasticidad en un modelo consiste en la realizacin de determinados grficos.
En concreto, se trata de representar, de forma terica, la varianza de la perturbacin
aleatoria en funcin de alguna variable explicativa X j , j 2, , k del modelo (o bien
183
Sin embargo, dado que la variable aleatoria u no es observable (y por tanto, tampoco su
varianza), una opcin es tomar los cuadrados de los residuos ( ei2 ) como aproximacin
de la varianza de ui ; es decir, plantear 48 :
ei2 f X ji , i 1, 2, , n .
Para realizar estos grficos, habra que definir primero la serie de los residuos al cuadrado.
La serie de residuos del modelo es calculada de forma automtica cuando ste se estima.
Sus valores se hallan en resid. No obstante, hay que tener presente que resid es un
objeto donde se van guardando los valores de los residuos de la ltima estimacin que
se lleve a cabo. Dado que vamos a trabajar con la serie concreta de residuos MCO
recin creada, deberemos crear sta como una variable especfica a partir de lo que hay
en este instante almacenado en resid. Para hacer esto, seleccionaremos GENR en la
Ventana de Trabajo y escribiremos en el cuadro de dilogo que surge (Enter equation):
RS = RESID, segn se muestra en la Figura 16. Tras ello, aceptaremos pulsando OK.
Figura 16
Una vez hecho esto, puesto que nuestra intencin es trabajar ahora con los residuos al
cuadrado, seguidamente generaremos dicha serie a partir de RS. Esto es, nuevamente
elegiremos GENR y en el correspondiente cuadro de dilogo que se abre, escribiremos
esta vez: RS2 = RS^2. Despus pulsaremos OK.
48
Junta a esta opcin, existen otras posibilidades consistentes en plantear funciones para los residuos
directamente, o bien, para sus valores absolutos.
184
A partir de aqu, podemos proceder a realizar los grficos entre los cuadrados de los
residuos y una funcin de la variable explicativa que consideramos que puede ser la
principal generadora del problema de la heteroscedasticidad en el modelo.
En el presente ejercicio, la seleccin de la variable explicativa que puede causar la
heteroscedasticidad no presenta problemas, pues slo estamos considerando una: el
EMPLEO. Sin embargo, si tuvisemos ms, deberamos hacer previamente esta
seleccin, bien gracias al conocimiento econmico de las variables en cuestin que
estuvisemos considerando, o bien a travs de la aplicacin de este mtodo a todas ellas.
La siguiente cuestin que se planteara sera la seleccin de la funcin de X j que habra
que tomar; es decir, la variabilidad de la perturbacin aleatoria sigue el patrn de
comportamiento de la variable X j de forma directa, de forma inversa, de su
cuadrado? En este caso, vamos a representar grficamente el cuadrado de los residuos
nicamente en funcin del EMPLEO. Pero, de forma anloga, se podra hacer con otras
formas funcionales: su inversa, cuadrado, etc.
Para obtener dicho grfico, debemos elegir en la barra principal de mens: QUICK /
GRAPH. Se crear de este modo una nueva ventana donde escribiremos en primer lugar
la variable independiente (a representar en el eje horizontal) y luego la dependiente (a
representar en el eje vertical): EMPLEO y RS2, respectivamente. Despus de aceptar
(OK), en el nuevo cuadro de dilogo que se abre elegiremos Scatter Diagram como tipo
de grfico. Para concluir, aceptaremos (OK). La Figura 17 muestra el grfico indicado.
Figura 17
185
A la vista de ello, se puede comprobar cmo la variabilidad del cuadrado de los residuos
es mayor conforme crecen las cifras de EMPLEO, no siendo por lo tanto constante. Por
tanto, parece evidente que existe una relacin directa entre la varianza de los residuos
(y, por consiguiente, de la perturbacin aleatoria) y la variable EMPLEO, lo que parece
apuntar a la existencia de heteroscedasticidad en el modelo.
Podemos guardar este grfico llamndolo, por ejemplo, METGRAF al pulsar NAME.
Contrastes paramtricos
Junto con los mtodos grficos (ms intuitivos que precisos), se han desarrollado un
buen nmero de estadsticos para contrastar la hiptesis nula de igualdad de varianza u
homoscedasticidad de la perturbacin aleatoria correspondiente a cada observacin de la
muestra estudiada. Esta gran variedad se debe a que la especificacin de la hiptesis
alternativa de heteroscedasticidad no suele ser conocida y puede ser ms o menos
general. A continuacin, vamos a revisar algunos de estos contrastes. En concreto, nos
vamos a centrar en tres contrastes de tipo paramtrico: Park, Glesjer y White, que se
caracterizan por estar basados en las hiptesis y supuestos estadsticos establecidos en el
modelo.
El contraste de Park parte del establecimiento de una relacin funcional entre los
valores de la varianza de la perturbacin aleatoria correspondiente a las distintas
observaciones, u2i , y los de la variable explicativa X ji , para algn j 2, , k , del
tipo:
u2 2 X ji e v
i 1, , n ,
o de forma equivalente:
ln u2i ln 2 ln X ji vi
i 1,, n .
Dado que u2i se desconoce, Park propone utilizar como aproximacin los residuos al
cuadrado: ei2 . De esta forma, finalmente considera la expresin:
ln ei ln X ji vi
2
i 1,, n ,
187
Figura 18
Figura 19
El contraste de Glesjer constituye un test de deteccin de la heteroscedasticidad
similar en concepcin al de Park. En concreto, este contraste se basa en la regresin del
188
i 1,..., n ,
189
Para hacerlo con EViews, deberemos llevar a cabo los cuatro ajustes indicados y fijarnos
en la significatividad estadstica de cada uno de ellos. As pues, deberemos seleccionar
QUICK / ESTIMATE EQUATION y escribir en la Ventana de Especificacin de la
Ecuacin 49 :
-
Cabe decir que para llevar a cabo cada una de las especificaciones del modelo, no es
necesario realizar cada vez el proceso QUICK / ESTIMATE EQUATION, sino que una
vez estimado el primer ajuste, basta con seleccionar la opcin ESTIMATE de la Ventana
de Ecuacin e ir cambiando la variable explicativa en cuestin.
Como se ha indicado, en cada caso hay que realizar un contraste de significatividad
individual del coeficiente asociado a la variable explicativa en cuestin (o de
significatividad global del modelo, ya que se trata de modelos de regresin simple).
Figura 20
Ha de tenerse en cuenta que la funcin valor absoluto de una variable se escribe en EViews de la
forma: ABS(nombre de la variable). Por su parte, la raz cuadrada se escribe: SQR(nombre de la
variable).
49
190
Figura 21
Figura 22
191
Figura 23
A la vista de los resultados obtenidos, se puede observar que, para un nivel de
significacin 5% , en las regresiones primera (respecto a EMPLEO) y, en mayor
medida, tercera (respecto a su raz, SQR(EMPLEO)), los estadsticos tStudent se
sitan en la regin crtica, y, por tanto, se considera que las correspondientes variables
explican el comportamiento de los residuos; es decir, se puede concluir que la varianza
de la perturbacin aleatoria no permanece constante a lo largo de la muestra. Y, adems,
vemos que stas son las pautas de comportamiento que la heteroscedasticidad puede
seguir. As pues, vamos a guardar la regresin ms significativa, la relativa a la raz
cuadrada del EMPLEO: SQR(EMPLEO), dndole en NAME el nombre de GLESJER.
El contraste de White es un contraste paramtrico ms general y robusto, ya que no
precisa de la eleccin inicial de una variable concreta del modelo de la que dependa la
heteroscedasticidad bajo la hiptesis alternativa.
Este contraste se basa en la regresin de los cuadrados de los errores MCO, que se
toman como aproximacin de las varianzas de las perturbaciones, en funcin de: un
trmino independiente, las variables independientes del modelo, los cuadrados de stas
y, de forma optativa, sus productos cruzados dos a dos. De acuerdo con esto ltimo,
EViews incorpora dos versiones de este contraste: una en la que se incluyen en la
regresin los productos cruzados dos a dos y otra en la que stos no se incorporan. En
ambos casos, el estadstico del test de White es el producto del nmero de
observaciones por el coeficiente de determinacin de la regresin propuesta, el cual se
distribuye asintticamente, bajo la hiptesis nula, como una 2 con m grados de libertad
192
W2 n R 2 m2 .
La interpretacin del contraste reside en que si las perturbaciones fueran
homoscedsticas, las variables incluidas en la regresin auxiliar no deberan tener
ningn poder explicativo sobre los residuos al cuadrado y, por tanto, el valor del
coeficiente de determinacin debera ser muy pequeo y con ello el valor del
estadstico. Por esta razn, en el caso contrario, si el valor muestral del estadstico es
suficientemente alto como para que la probabilidad de rechazar la hiptesis nula, siendo
cierta, sea menor que el nivel de significacin que nos fijemos (por ejemplo, el 5%),
rechazaremos la hiptesis nula y admitiremos la existencia de heteroscedasticidad.
Este test es el nico de los contrates considerados que viene programado en EViews.
Para realizarlo, abriremos la ecuacin AJUSTEMCO haciendo doble clic sobre ella en
el Directorio de Objetos. Una vez aqu, se sigue la secuencia VIEW / RESIDUAL
TESTS. Se abrir entonces un submen donde se nos presentar la opcin de realizar el
contraste de White con o sin trminos cruzados. Vamos a elegir la opcin con trminos
cruzados: WHITE HETEROSKEDASTICITY (CROSS TERMS), como se puede ver en
la Figura 24 (aunque en nuestro ejemplo, de cualquier forma, los resultados del
contraste de White van a ser iguales con o sin trminos cruzados, pues el modelo slo
tiene una variable explicativa distinta del trmino independiente).
Figura 24
193
Figura 25
A la vista del p-valor (0,051177) que aparece asociado al estadstico de prueba de White
(Obs*R-Squared), podemos sealar que para un nivel de significacin estrictamente del
5% no se podra rechazar la hiptesis nula de homoscedasticidad. No obstante, este
valor es muy prximo al 5%, con lo que dado el reducido tamao de la muestra y el
carcter asinttico de este contraste, as como por lo apuntado por todas las pruebas
anteriores realizadas (grficos y contrastes paramtricos), como conclusin final lo ms
prudente es asumir que pueden existir problemas de heteroscedasticidad en nuestro
modelo. Por tanto, lo ms apropiado es proceder a su estimacin por el mtodo de
MCG, que, como bien sabemos, proporciona estimadores lineales insesgados y ptimos
(ELIO) en estos casos. 50
50
En caso de duda, siempre ser preferible optar por pensar que hay un problema de heteroscedasticidad
en el modelo y proceder a su estimacin por el mtodo de MCG, cuyo estimador ser ELIO. Ntese que,
si finalmente el modelo fuese homoscedstico el estimador MCG coincidir con el obtenido por MCO. En
caso contrario, habremos cometido un error, pues el estimador MCO no sera ELIO.
194
Var Cov (u )
2
u2
0
2
u3
0
2
u2n
donde:
u21
0
2
2
u2
0
2
0
0
2
u3
0
.
2
un
2
0
2
2
u1
u2
u2
u2
u1
, V 1
u
0
V 1Y V 1 X V 1u .
u
i
Yi 1
X 2i j
X ji k
195
X ki
u
i
u i , i 1, 2, , n
Obsrvese que todas las variables del modelo, tanto la explicada, como las explicativas
y la perturbacin aleatoria, simplemente estn multiplicadas por un factor de
ponderacin, que podramos denominar i :
u
.
u
i
En este caso, V 1
1
X j1
X j2
X j3
0
1
.
; esto es: i
X ji
1
X jn
0
51
Ntese que si todas las ui fuesen iguales a (es decir, si estuvisemos ante homoscedasticidad),
todas las ponderaciones adoptaran el mismo valor, siendo ste igual a 1. As pues, el mtodo de MCO no
es ms que un caso particular de MCP donde las ponderaciones valen 1.
196
Aqu, V 1
X j1
0
1
X j2
X j3
X jn
; y: i
1
.
X ji
En este supuesto, V 1
Y1
0
Y2
0
Y3
1
; esto es: i .
Yi
1
Yn
u2 2 EMPLEOi .
i
197
Por tanto, se tratar de transformar el modelo original dividiendo cada uno de sus
miembros por la raz cuadrada de esa variable, o lo que es lo mismo ponderndolos por:
i 1
EMPLEOi
Para llevar a cabo con EViews la estimacin por MCG en este caso, en primer lugar
haremos doble clic sobre la ecuacin ajustada por MCO (AJUSTEMCO) y
seleccionaremos ESTIMATE (Figura 26).
Despus, en el cuadro de dilogo que aparece (que ya nos resulta familiar), pulsaremos
Options. Seguidamente, marcaremos la opcin Weighted LS/TSLS (Unavailable with
ARMA) y escribiremos en Weight la ponderacin concreta que vamos a utilizar 52 :
1/SQR(EMPLEO) tal y como se muestra en la Figura 27.
Tras pulsar OK, obtendremos finalmente la salida de resultados, que podremos guardar
seguidamente con el nombre AJUSTEMCG, que se observa en la Figura 28, donde se
nos ofrecen los coeficientes estimados por MCG y los valores de los estadsticos ms
relevantes del modelo transformado obtenido tras aplicar la ponderacin
correspondiente segn el mtodo de MCG (Weighted Statistics). Junto a ello, en la parte
inferior se muestran los estadsticos derivados del ajuste MCG considerando las
variables originales del modelo (no transformadas o ponderadas) (Unweighted
Statistics).
Figura 26
52
Figura 27
Figura 28
199
1
1
Var Cov MCO 2 X ' X X ' X X ' X .
200
Figura 29
Figura 30
201
Para finalizar, cabe resear que otra tcnica muy empleada en Econometra para abordar
los problemas de heteroscedasticidad detectados en un modelo, consiste en realizar una
transformacin logartmica de sus variables. Es decir, trabajar con un modelo log-log:
ln Yi 1 ' 2 ' ln X 2i j ' ln X ji k ' ln X ki vi , i 1, 2,, n .
La razn de este proceder reside en que las transformaciones logartmicas comprimen
las escalas en que se miden las variables, reduciendo as la magnitud de la variabilidad
del modelo; de este modo, al menos se atena, si no se elimina completamente, el
problema de la heteroscedasticidad. Adems, la interpretacin de los parmetros resulta
sencilla y usual en el mbito de la Economa, ya que se tratara de elasticidades. 53
En el caso que nos ocupa, para especificar un modelo de estas caractersticas
procederamos de la manera habitual seleccionando QUICK / ESTIMATE EQUATION y
escribiendo despus en la ventana que se nos abre:
LOG(VAB) C LOG(EMPLEO)
El resultado sera el que se muestra en la Figura 31.
Figura 31
Con ello, daramos por finalizado este ejercicio. Si lo deseamos, podemos guardar
nuestro fichero de trabajo a travs de FILE / SAVE AS.
53
Este mtodo, sin embargo, no sera vlido si alguna de las variables del modelo presentase valores
negativos. Asimismo, debe researse que resulta ms eficaz cuanto mayor es el tamao muestral.
202
12
Var Cov (u )
1n
12
u2
2n
23
u2
1n
1
2n
12
2
u
u2
1n
12
23
2n
ij
u2
1n
2n
u2
cov (u i , u j )
u2
, i j , es el
n2 n
es mayor que el nmero de
estimar en el modelo: su nmero k 1
2
observaciones ( n ), por lo que resulta imposible estimarlos. Por esta razn, se hace
necesario adoptar algn tipo de supuesto que contribuya a disminuir dicho nmero. Se
imponen as dos tipos de restricciones. Por un lado, restricciones sobre la propia
hiptesis de autocorrelacin y, por otro, restricciones sobre la estructura de
comportamiento de la perturbacin aleatoria.
1
2
2
Var Cov (u ) u u
n 1
1
1
2 n 1
1 n 2
1
1
1
1
s
es el coeficiente de
u2
AR(p): u i 1 u i 1 2 u i 2 p u i p i , i p 1, , n .
La componente aleatoria i se dice que es ruido blanco; esto significa que es una
variable aleatoria que satisface las siguientes condiciones 54 :
E ( i ) 0, i 1, , n
var ( i ) 2 , i 1,, n
cov ( i , j ) 0, i j , i, j 1, 2, , n .
Obsrvese que la perturbacin aleatoria u que cumple las hiptesis establecidas en el modelo de
regresin lineal clsico es ruido blanco.
54
204
2
, debiendo ser 1 .
1 2
2
u
cov (u i , u i 1 ) u2 , i 1, 2,, n 1
cov (u i , u i 2 ) 2 u2 , i 1, 2,, n 2
cov (u1 , u n ) n1 u2
de donde se deduce que los coeficientes de correlacin lineal s entre perturbaciones
que distan s retardos, vienen dados por:
cov (u i , u i s )
u2
s u2
s , s 1, 2, , n 1 .
2
u
n 2
2
2
Var Cov (u ) u
,
2
1
1
n 1
1
MA(q): u i 1 i 1 2 i 2 q i q i , i q 1, , n
Centrndonos en un modelo de medias mviles de orden 1, es decir: MA(1), se puede
ver que la varianza de u adquiere como expresin:
cov (u i , ui 1 ) 2 , i 1, 2,, n 1
cov (u i , u i s ) 0, s 2, , n 1, i 1, 2,, n s .
Se dice de este modelo que no tiene memoria, en el sentido de que cuando la distancia
en la perturbacin de dos observaciones es mayor que 1, la covarianza entre ellas es
nula. Los coeficientes de correlacin correspondientes sern entonces, nulos:
s 0, s 2, , n 1 .
Por otro lado, para observaciones consecutivas se tiene que:
cov (u i , u i 1 )
u2
2
2
.
2
2
u
(1 ) 1 2
1 0 0
1 0
1 2
Var Cov (u ) u2 u2
(1 2 ) 2
206
1 2
1
1 2
1 2
1 2
CP 1 2 PIB u .
Con este propsito, en el usual cuadro de dilogo resultante deberemos escribir:
CP C PIB
Tras pulsar OK, se obtienen los resultados que muestra la Figura 32.
La observacin de todos los coeficientes, expresiones y estadsticos obtenidos podra
hacernos pensar que el modelo resulta aceptable; sin embargo, por la naturaleza de los
datos, de corte temporal, sospechamos que puede haber problemas de autocorrelacin
en la perturbacin aleatoria.
Vamos a guardar este ajuste con el nombre AJUSTEMCO, por ejemplo, seleccionando
la opcin NAME de la Ventana de Ecuacin. De este modo, podremos tener as acceso a
la estimacin cuando lo deseemos.
207
Figura 32
Figura 33
Otro procedimiento grfico interesante consiste en la representacin de los residuos
frente a los del periodo anterior. Este mtodo es til para detectar, al menos, la
existencia de autocorrelacin que sigue un esquema AR(1). ste ser el caso si se
observa una relacin lineal clara entre ambas variables, ya que indicara que la
perturbacin aleatoria u i es una funcin lineal de la perturbacin aleatoria u i 1 , tal
209
Figura 34
Otro mtodo grfico habitual para evidenciar la posible existencia de autocorrelacin es
la realizacin del correlograma de los residuos.
Aqu podemos encontrar dos variantes. La primera se refiere a la representacin grfica
de la llamada funcin de autocorrelacin (FAC), es decir, de los coeficientes de
correlacin ( s ) entre distintas observaciones de la serie de los residuos en funcin de
la distancia o retardo s que hay entre ellas. La otra posibilidad consiste en trabajar con
los coeficientes de correlacin parcial ( s ), que miden la correlacin entre dos
observaciones de dicha serie en funcin de los retardos, sin tener en cuenta la influencia
de las dems observaciones, obtenindose as la representacin de la denominada
funcin de autocorrelacin parcial (FACP).
210
Funcin de Autocorrelacin
Parcial (FACP)
AR(p)
MA(q)
La identificacin del proceso se lleva a cabo con la FAC para los AR y la FACP
para los MA. Si la FAC presenta un mayor nmero de coeficientes significativos en
los primeros retardos, estaramos ante un proceso AR; en cambio, si esto ocurre en
la FACP, sera un proceso MA.
La identificacin del orden del modelo se realiza en los AR con la FACP y en los
MA con la FAC, y vendr dado por el nmero de coeficientes que se muestren
significativos en la funcin correspondiente.
Para llevar a cabo los correlogramas, el modo de proceder con EViews es seleccionar, en
la Ventana de Ecuacin de nuestro modelo AJUSTEMCO, la opcin VIEW /
RESIDUAL TESTS / CORRELOGRAM Q-STATISTICS, indicando el nmero de
retardos que se quieren incluir (Lags to include). Por defecto, EViews nos plantea 11
retardos (Figura 35). Generalmente este nmero es suficiente, por lo que nos
quedaremos con esta propuesta.
El resultado se muestra en la Figura 36, donde podemos apreciar que hay un mayor
nmero de coeficientes significativos (o prximos a serlo para un 5 % ) en la FAC
que en la FACP, lo que nos indica que estamos antes un modelo AR para la
perturbacin aleatoria. Para determinar el orden, nos fijamos entonces en los
coeficientes de la FACP que se salen del intervalo de confianza sealado con lneas
verticales de trazo discontinuo (para un 95% de nivel de confianza). Vemos que
nicamente el primero de ellos est fuera de dicho intervalo, lo que nos permite pensar
211
que estamos ante un modelo AR de orden 1, al igual que nos sugeran los otros grficos
representados anteriormente.
Figura 35
Figura 36
212
Contrastes analticos
Adems de los mtodos grficos, existen diversas posibilidades de tipo analtico para
contrastar la existencia de autocorrelacin. La hiptesis nula que se establece en todos
los casos es la ausencia de autocorrelacin y la diferencia entre unos contrastes y otros
radica en la hiptesis alternativa que se formula. A veces, stas son muy generales y
nicamente nos indican la existencia de autocorrelacin, mientras que en otros casos, no
slo plantean la existencia de autocorrelacin, sino tambin el esquema concreto de la
misma que est presente en el modelo.
A continuacin, vamos a revisar dos de estos contrastes.
El contraste de Durbin-Watson permite comprobar la existencia de autocorrelacin de
tipo AR(1). Recordemos que sta responde al siguiente esquema: u i u i 1 i ,
i 2, , n , donde i es ruido blanco.
DW
e
i 2
ei 1
e
i 2
2
i
e
i 2
ei 1
ei2
i 2
55
En el caso de que el estadstico DW caiga en alguna de las zonas de duda, una forma
conservadora de proceder sera actuar como si existiese autocorrelacin aunque no la
hubiese, en lugar de lo contrario.
214
Figura 37
Cuando trabajamos con EViews, el estadstico de Durbin-Watson aparece directamente
entre los estadsticos de la salida de resultados bsicos (Estimation Output) que se
muestran al hacer la estimacin.
As, en la salida de la regresin AJUSTEMCO (Figura 32) se puede encontrar el valor
del estadstico Durbin-Watson (Durbin-Watson stat): 0,343122. Para un nivel de
significacin del 5% las cotas inferior y superior con un tamao muestral igual a 13 son
1,01 y 1,34, respectivamente (estas cotas se buscan en las tablas correspondientes).
Estamos entonces en el caso en que DW d L , con lo que, adems de rechazar la
hiptesis nula de no autocorrelacin, podemos decir que la autocorrelacin presente es
positiva y de tipo autorregresivo de orden 1.
El contraste de Breusch-Godfrey permite contrastar la existencia de autocorrelacin
de forma ms general que el contraste de Durbin-Watson, puesto que es vlido tanto
para procesos AR como MA y para cualquier orden de autocorrelacin. Tiene adems la
ventaja, con respecto al contraste de Durbin-Watson, de que se puede aplicar incluso
cuando entre las variables explicativas est presente la variable endgena retardada.
Las hiptesis nula y alternativa que se plantean en este contraste son:
H 0 : Ausencia de autocorrelacin de orden p
H 1 : Autocorrelacin de orden p (AR(p) MA(p)).
215
Este contraste parte de la estimacin por MCO del modelo analizado en cuestin.
Seguidamente se estima una regresin auxiliar de sus residuos en funcin de p retardos
de stos y de las variables explicativas del modelo (pudiendo, incluso, introducirse
variables endgenas retardadas):
ei 1 2 X 2i k X ki 1ei 1 p ei p vi .
216
Figura 38
Figura 39
Seguidamente se puede operar de manera anloga con 2 retardos en los residuos de la
regresin auxiliar (Figura 40).
217
Figura 40
El estadstico experimental del contraste de Breusch-Godfrey, cuyo valor es 8,997396,
tiene ahora una probabilidad asociada de 0,011123 y si trabajsemos con un nivel de
significacin del 5%, el estadstico se situara, como en el caso anterior, en la regin de
rechazo de la hiptesis nula de no autocorrelacin (en cambio, no sucedera as para un
1%). Si atendisemos a la regresin auxiliar, el contraste de significacin individual del
segundo retardo de los residuos RESID(-2) llevara a no rechazar la hiptesis nula, dado
que el p-valor de su estadstico t experimental es 0,3058. As pues, este segundo retardo
parece que ya no es significativo en el comportamiento de los residuos MCO.
La conclusin del contraste de Breusch-Godfrey es, por tanto, que existe
autocorrelacin en la perturbacin aleatoria y que sta es de orden 1.
Como bien sabemos, el mtodo de MCG es el mtodo alternativo a MCO que debe
aplicarse para obtener estimadores ELIO cuando el modelo presenta autocorrelacin.
El modo de operar con EViews es bien sencillo, una vez que se ha identificado la
estructura de comportamiento de la perturbacin aleatoria del modelo. En el presente
ejemplo, hemos visto que parece que se trata de un modelo autorregresivo de orden 1.
Bastar entonces con aadir al ajuste de regresin el trmino AR(1).
Para ello, seleccionamos QUICK / ESTIMATE EQUATION y escribimos en el cuadro
de dilogo resultante:
CP C PIB AR(1)
218
Figura 41
El coeficiente asociado a AR(1) es la estimacin del coeficiente de correlacin
correspondiente al esquema que sigue la perturbacin. Puede observarse que dicho
coeficiente es estadsticamente significativo a un nivel de confianza mximo de ms del
99% y que su valor (0,860219) est bastante prximo a 1, lo que reafirma la existencia
de autocorrelacin positiva (y adems muy elevada) de orden 1.
Los coeficientes asociados a C y PIB son los estimadores MCG del modelo, que
resultan ser ELIO.
Para concluir, cabe resear que si la autocorrelacin siguiera un esquema AR(p), se
aadiran a la estimacin los trminos AR(1), AR(2), , AR(p), siendo sus parmetros
de la regresin:
asociados las estimaciones de los coeficientes i
u i 1 u i 1 p u i p i . En el caso de que se tratase de un modelo de medias
219
TEMA 5
Modelos con variables dependientes discretas
Con la introduccin de variables ficticias en el modelo ya vimos que las variables de
tipo cualitativo podan estar presentes en el mismo, actuando en tal caso como
explicativas.
Pero la presencia de una variable cualitativa en un modelo tambin puede darse en el
papel de variable dependiente. Quizs nuestro objetivo sea estudiar los factores que
influyen en la ocurrencia o no de un determinado suceso o fenmeno econmico, como
la disponibilidad de vivienda, la compra de un determinado bien o el disfrute de un
servicio. De esta forma, surgen los modelos con variables dependientes discretas.
3.7.
La base econmica sobre la que se fundamentan estos modelos es la Teora de la Utilidad de Von
Neumann-Morgenstern, establecida en 1944. De acuerdo con sta, los sujetos se comportan ante una
disyuntiva, de tal modo que tratan de maximizar la utilidad esperada que les reporta cada una de las
alternativas posibles sobre las que han de decidirse.
220
Yi F ( X i ) u i ,
donde X i X 1i , X 2i , , X ki hace referencia a las observaciones de todas las variables
explicativas del modelo, entonces se tiene que:
E Yi | X i E F ( X i ) E u i F ( X i ) ,
manteniendo el supuesto de que E u i 0 .
Por otra parte, si se calcula la esperanza condicionada de Y en trminos probabilsticos,
entonces:
E Yi | X i Yi P (Yi | X i ) 1 P (Yi 1 | X i ) 0 P (Yi 0 | X i ) P (Yi 1 | X i ) .
i
3.8.
221
De este modo:
E Yi | X i F ( X i ) X i 1 Pi 0 (1 Pi ) Pi , por lo que:
E Yi | X i Pi X i .
j.
X ji
X ji
En el caso de que Xj sea una variable ficticia o dummy, entonces el efecto de una
variacin de dicha variable sobre la probabilidad de que Y tome el valor 1 se calcula a
Eleccin
************
Figura 1
Debido al problema de heteroscedasticidad de este modelo, la aplicacin de MCO dara
lugar a estimadores que no seran ELIO, porque si bien seran lineales e insesgados, no
tendran mnima varianza. El mtodo de estimacin ms adecuado sera entonces el de
los mnimos cuadrados generalizados (MCG) 58 .
Pero aunque la estimacin por el mtodo de MCG permite obtener estimadores
eficientes del modelo, los problemas persisten:
57
Si se piensa por ejemplo en la adquisicin de una pliza privada de enfermedad por parte de los hogares
en funcin de su renta, parece evidente que a niveles bajos, la probabilidad ir creciendo lentamente, ya
que se carece de posibilidades; a partir de un cierto momento comenzar a subir ms rpidamente; y, de
nuevo, en niveles de probabilidad cercanos a 1, correspondientes a altos niveles de renta, el efecto
marginal ser de nuevo menor, pues muchos hogares dispondrn ya de dicha cobertura.
58
Como ya sabemos, si bien el modo ms correcto de actuar sera estimar el modelo por el mtodo de
MCG, una opcin intermedia, fcil y ms eficiente que MCO, sera aplicar la estimacin consistente de
White. Recurdese que, mediante este mtodo, la estimacin de los coeficientes de regresin del modelo
es la misma que por MCO, pero sin embargo, la matriz de varianzas-covarianzas de stos se estima
correctamente, lo que repercute en una mayor fiabilidad de los contrastes de hiptesis que se planteen.
223
Pero los principales problemas del MLP permanecen: la adopcin del supuesto
lineal y que no hay nada que asegure que las estimaciones de la probabilidad
estn entre 0 y 1.
Est claro, pues, que la solucin pasa por encontrar algn tipo de funcin F ( X ) que en
lugar de ser lineal, tenga forma de S (vase la Figura 2). Es aqu cuando surgen
entonces modelos como el logit o el probit.
************
Eleccin
************
Figura 2
3.9.
Los modelos logit y probit son modelos de eleccin binaria no lineales muy semejantes.
Presentan una serie de propiedades que justifican su utilizacin:
Cuando X i Pi 0 .
Cuando X i Pi 1 .
1
1 e Xi
y
P Yi 0 | X i 1 Pi 1
1
1
.
Xi
1 e
1 e Xi
1
1 e X i
de donde:
P
X i ln i
1 Pi
Li .
225
Li
.
X ji
Es decir, los parmetros miden el cambio en el logit ocasionado por un cambio unitario
en la variable Xj; esto es, cunto vara el logaritmo de la razn de probabilidades a favor
de la ocurrencia de la opcin 1, ante incrementos unitarios de Xj , no el efecto marginal
de un cambio unitario en Xj sobre la probabilidad de ocurrencia de la opcin 1, Pi.
ste ltimo viene dado por la expresin:
Pi
( X i )
(Xi) j ,
X ji
X ji
por E Yi | X ji 1 y E Yi | X ji 0 .
Como el efecto marginal de un cambio unitario de Xj sobre la probabilidad vara
dependiendo de la observacin donde se realice, para obtener un valor representativo
ste se suele medir en los valores medios de los regresores.
Es importante resear que el signo de j s indica el sentido del cambio en la
probabilidad, aunque no su cuanta.
La estimacin de este modelo se realiza habitualmente a travs del mtodo de mxima
verosimilitud (MV). Los estimadores MV resultan ser consistentes y asintticamente
eficientes, por lo que este mtodo es recomendable que se emplee para muestras
suficientemente grandes.
226
Otro de los modelos de eleccin binaria es el modelo probit. Este modelo se caracteriza
porque la funcin de distribucin que utiliza es la correspondiente a la normal: (.) . De
este modo, se tiene que:
Yi ( X i ) i .
Y consiguientemente:
Xi
E Yi | X i P Yi 1 | X i Pi ( X i ) ( s ) ds ,
s
1
2 es la funcin de densidad de la distribucin normal y s es
donde ( s )
e
(2 )1 / 2
X i
1
e
(2 )1 / 2
s2
2
ds .
(Xi ) j .
X ji
X ji
E Yi | X ji 1 y E Yi | X ji 0 .
De nuevo, para obtener un valor representativo de los efectos marginales stos se suelen
medir en los valores medios de los regresores.
Un aspecto ms que se puede considerar, a la hora de interpretar el significado de estos
modelos, es el relativo a los denominados odds y ratio odds.
227
Pi
.
1 Pi
Al igual que el modelo logit, el modelo probit suele estimarse por el mtodo de MV.
P N / 2
N / 2 1 ,
ES ( j )
Obsrvese cmo lo que se defini como logit, no es ms que el logaritmo del estadstico odds.
228
Su expresin es:
R 2 de McFadden 1
ln( L)
,
ln( LR )
ln( LR )
,
ln( L)
Predicciones correctas
,
n
Normalmente, el valor umbral que se suele adoptar para asignarle un valor a una
prediccin es 0,5; de tal manera que:
2k 2 ln( L)
n
k ln(n) 2 ln( L)
n
2k ln ln(n) 2 ln( L)
n
230
Yi Pi X i
Yi Pi ( X i )
Yi Pi ( X i )
1
1 e X i
X i
1
e
(2 )1 / 2
s2
2
ds
La Figura 3 muestra el cuadro de dilogo de EViews para llevar a cabo la estimacin del
MLP. Obsrvese que en Options se elige la estimacin consistente de White
(Heteroskedasticity Consistent Covariance).
Las Figuras 4 y 5, por su parte, nos ofrecen los pasos necesarios que deben seguirse en
EViews para estimar los modelos logit y probit.
231
Figura 3
Figura 4
232
Figura 5
Figura 6
233
Figura 7
Figura 8
234
Si nos centramos en la salida del MLP, puede comprobarse el bajo valor reflejado por el
coeficiente de determinacin lineal R 2 , ya comentado a nivel terico.
Como ya se ha indicado, conceptualmente los modelos logit y probit resultan ms
apropiados que el MLP. A la hora de elegir entre uno u otro, podemos atender a los
resultados arrojados por medidas como el R 2 de McFadden (McFadden R-squared), el
estadstico LR o razn de verosimilitud (LR-statistic), o los estadsticos de Akaike,
Schwarz y Hannan-Quinn de prdida de informacin. Al observar los valores de todos
estos indicadores en nuestras estimaciones de los modelos logit y probit, puede
comprobarse que, de acuerdo con todos ellos, el modelo logit parece (aunque por muy
poco) ms adecuado.
En el siguiente Cuadro se ofrece, para los tres modelos estimados, los efectos
marginales de cada variable explicativa sobre la probabilidad de tenencia de seguro
privado de enfermedad (junto con los valores medios de cada variable, necesarios para
el clculo de dichos efectos en los modelos logit y probit 60 ).
Variables
Valores
medios
Efectos
marginales
MLP
Efectos
marginales
Logit
Efectos
marginales
Probit
-0,5032
-0,6916
-0,7512
EDAD
42,17733
0,0026
0,0022
0,0023
SECUNDAR
0,331667
0,0707
0,0694
0,0684
SUPERIOR
0,168667
0,1277
0,1087
0,1146
LNING
9,664755
0,0465
0,0390
0,0414
EDAD El efecto marginal de esta variable indica que por cada ao adicional que
tenga la persona principal del hogar, la probabilidad de que se ste disponga de un
seguro privado de enfermedad se incrementa en un 0,22%.
60
Debe indicarse que los efectos marginales de los modelos logit y probit no son proporcionados por
EViews, sino que se han calculado aparte, tomando no obstante la informacin bsica precisa para ello de
los resultados de EViews.
235
236