Sei sulla pagina 1di 51

Variables Dummy (mudas) o Cualitativas

La variable dependiente podra estar influida por variables


cualitativas (regresores binarios) variables dummies
(mudas), ficticias o dicotmicas.
Una variable dummy es una variable artificial construida de
tal forma que toma el valor uno (1) si un determinado
fenmeno cualitativo se cumple, y cero (0) si no
Son muy tiles en la prctica pues permiten capturar ciertos
fenmenos cualitativos, que influencian el comportamiento de
la variable dependiente (Y)
Existen modelos de regresin con solo variables cualitativas,
para ello se emplean los modelos de anlisis de varianzas
(ANOVA)

Variables Dummy (mudas) o Cualitativas


Son muy tiles en la prctica pues permiten capturar
ciertos fenmenos cualitativos, que influencian el
comportamiento de la variable dependiente (Y)
Existen modelos de regresin con solo variables
cualitativas, para ello se emplean los modelos de
anlisis de varianzas (ANOVA)
La variables dicotmicas simplemente sealan
diferencias, pero no sugieren razones por las que
stas se presentan.

Ejemplos de variables dummies:


Gnero
Raza
Color
Religin
Nacionalidad
Zona geogrfica (urbano / rural)
Regin
Rama de actividad econmica
Afiliacin a un partido

Ms ejemplos:
Oficio
Participacin en sindicatos
Analfabetismo
Situacin marital
Jefatura del hogar
Tiene ttulo profesional?
Ha recibido capacitacin?
Utiliza computador en su lugar de trabajo?
Dependencia administrativa del establecimiento educacional

Considere la siguiente variable dummy:


d2i= (1, mujer; 0,hombre)

A modo de ejemplo, piense en una ecuacin de salarios


(ecuacin de Mincer) de la siguiente forma:
Wi 1 2d 2i ui
E (Wi | d 2i 0) 1

E (Wi | d 2i 1) 1 2

Tambin se podra haber escrito:


d2i= (0, mujer; 1,hombre)

Wi 1 2d 2i ui
E (Wi | d 2i 0) 1

E (Wi | d 2i 1) 1 2

Otra forma de escribir el modelo anterior es la siguiente:


Wi 1d1i 2 d 2i ui
E (Wi | d1i 1) 1

E (Wi | d 2i 1) 2

Note que en el ltimo modelo no se incluy una constante...


por qu?
Porque de esta manera, se evita una colinealidad exacta o
perfecta en la matriz X.
De otra forma, la matriz X sera singular, es decir, no invertible
Usualmente las estimaciones con variables dummies contienen
un intercepto.
Los modelos ANOVA se utilizan para evaluar la significancia
estadstica de la relacin entre una regresada cuantitativa y
regresoras cualitativas o dicotmicas. A menudo se emplean
para comparar las diferencias entre los valores medios de dos o
ms grupos o categoras , y por tanto son ms generales que la
prueba t, la cual se utiliza para comparar las medias de solo
dos grupos o categoras.

Ejemplo: Salarios de profesores de escuelas


pblicas por regin geogrfica.
Se definen tres regiones : Norte, Sur, Oeste.
Objetivo: si el promedio de salarios difieren
entre las tres regiones.
Promedio simple da:
R1: 24.424 dlares
R2: 22.894
R3: 26.158
Son estadsticamente distintos? ANOVA es la
respuesta tambin con Regresin.

Veamos el siguiente modelo de determinacin de salarios:

Yi 1 2 D2i 3 D3i ui
La definicin de las variables es la siguiente:
Yi = salario promedio del individuo i
D 2i = toma el valor 1 si la persona i vive en el NORTE y 0 en
otro caso
D3i = toma el valor 1 si la persona i vive en el SUR y 0 en otro
caso

Si la estimacin no incluye intercepto el coeficiente


asociado a la variable dummy representa el valor esperado
de la variable dependiente para la categora
correspondiente. Cada una es el valor medio de la
categora.
Si la estimacin incluye un intercepto, la categora omitida
es la lnea base o de comparacin (su valor medio de la
categora, o sea la regin Oeste). Por lo tanto, el
coeficiente asociado al resto de las categoras representa el
grado en el cual stas difieren de la categora base
Del modelo anterior se obtiene
lo siguiente:

E (Yi | D2i 1, D3i 0) 1 2


E (Yi | D2i 0, D3i 1) 1 3
E (Yi | D2i 0, D3i 0) 1

Cmo se calcula para el Oeste?, si es B1 entonces:


E(Yi/D2i=0; D3i=0)=B1
Resultados de la regresin: R2=0.0901
Yi^=

26.158,62

-1.734,47D2i

-3.264,61D3i

ee

(1.128,5)

(1.435,9)

(1.499,6)

(23.1759

-1.2078

-2.1776

p
value

(0.0000)*

(0.2330)*
(0.0349)*
No significativa Si, significativa

Oeste

Norte

Sur

En grfico: salarios promedios por regin


26158(B^1
24.424(B^1+B^2)
22.894 (B^1+B^3)
Oeste

Norte

Sur

Modelo ANOVA con 2 variables cualitativas


Ejemplo: salario en relacin con estado civil y regin de
residencia. 528 personas, en mayo 1985.
R2= 0.0322
Y=Salario-hora; D2=Estado Civil: 1=casado; 0;
D3=Regin Residencia: 1=Sur; 0

Yi^=

8.8148

+1.0997D2i

-1.62729D3i

ee

0.4015

0.4642

0.4854

21.9528

2.3688

-3.4462

P-value

0.0000

0.0182

0.0006

2 cualitativas regresoras cada una con 2 categoras


Cul es la categora de comparacin?
NO CASADO Y FUERA DEL SUR, SON LAS
OMITIDAS.
Salario w=8.81
wcasados D2i= 8.81+1.1=9.91=B1+B2
wSur D3i = 8.81+1.67=7.14=B1+B3
Los salarios promedio son estadsticamente
distintos en comparacin con la categora base?
SI, porque los p-value son muy bajos.

MODELOS ANCOVA ( ANALISIS DE


COVARIANZAS)
Veamos el mismo ejemplo del salario promedio
profesores de Escuelas pblicas, agregando la
variable gasto en escuelas por las municipalidades.

Yi=B1+B2D2i+B3D3i+B4X4i + ui
Oeste=categora de comparacin
Yi

Salario ao
promedio

X4i

Gasto Esc. Pbl x


alumno

D2i

=1, si Norte; 0 otro

D3i

=1, si Sur; 0 otro

MODELOS ANCOVA ( ANALISIS DE


COVARIANZAS)
Yi^=

13.269

-1.673,5D2i

-1.144,1D3i

+3.288Xi

ee

(1.395)

(801,1)

(861,1)

(0.3176)

9,5*

-2,08*

-1,32**

10,35*

R2=0.7266
* Son p-value <5%; ** Son p-value >5%

Considere ahora un modelo mas general, el cual viene dado por:

Wi 0 1d 2i 2 Ei ui
Donde E denota la escolaridad de la persona (en aos). Es
posible pensar en la siguiente situacin:

Pero es posible adems incluir interacciones entre las variables:

Yi 1 2 D2i 3 D3i X i ui
Donde.
Yi=salario
X=escolaridad
D2=1 mujer; 0 otro
D3=1no blanco no hispano; 0 otro.
Supuesto: el efecto diferencial de la D2 es constante en las dos
categoras de raza y el efecto diferencial de D3 tambin es
constante en los dos sexos. Es decir, si w> para H que para M se
debe a que pertenecen o no a la categora no blanco no hispano. De
igual forma, si los no blanco no hispanos tienen w<, se debe a que
son H o M.

Lo anterior puede representarse grficamente de la siguiente


manera:

Desestacionalizar series de datos


Normalmente escuchamos y leemos a los
economistas, que mencionan el trmino
"variables desestacionalizadas", cuando
hacen referencia a una serie de datos
estadsticos que sirven de base para estimar
o proyectar variables resultado.

Desestacionalizar series de datos


La mayora de las variables utilizadas en
economa, presentan variaciones que impiden ver
con claridad el comportamiento de la tendencia en
el corto plazo. Por ello es conveniente seguir una
trayectoria de datos con estas oscilaciones
reducidas y verificar los puntos de giro.
Esto significa que se debe descomponer la serie
temporal y eliminar aquellas componentes que
dificultan su estudio.
Es til eliminar el factor estacional de las series de
tiempo con el fin de concentrarse, por ejemplo, en
la tendencia

La mayora de las series presentan cuatro tipos de variaciones:


1) Variaciones que presentan cierta tendencia general (tendencia del
desarrollo); son los movimientos de largo plazo de la serie.
2) Fluctuaciones cclicas o de la situacin econmica que
aproximadamente corresponden a los ciclos econmicos generales;
3) Fluctuaciones estacionales, que aparecen en series de datos
trimestrales o mensuales; contienen oscilaciones interanuales
alrededor de la tendencia, que se repiten mensualmente o
trimestralmente en un periodo de un ao. Factores que mueven la
componente estacional: el clima, el calendario (das hbiles y fiestas
mviles, feriados), la toma de decisiones por los agentes y las
expectativas en general del agente econmico; y
4) Fluctuaciones irregulares. son las oscilaciones no sistemticas y
aleatorias. Ejemplo, una huelga o algn otro evento repentino, dentro
de un periodo.

QU ES LA ESTACIONALIDAD?
Son fluctuaciones subanuales (por ejemplo,
mensuales, trimestrales) que se repiten
regularmente de ao en ao.
Por convencin, la estacionalidad se anula cada
ao. Como resultado de ello:
- Las series anuales no pueden contener estacionalidad
(en virtud de la definicin de estacionalidad).
- Las sumas o promedios de 12 meses consecutivos (o de
4 trimestres) no contienen estacionalidad.

Caractersticas del
fenmeno estacional
Las 3 ms importantes:
a) Se repite cada ao con cierta regularidad, pero
puede evolucionar.
b) Es posible medirlo y separarlo de las otras fuerzas
que influyen en el movimiento de la serie.
c) Es causado principalmente por fuerzas no
econmicas, exgenas al sistema econmico, que
los tomadores de decisiones no pueden controlar
o modificar en el corto plazo.

La estacionalidad puede evolucionar, debido


a cambios tecnolgicos o cambios
institucionales que operan en la actividad
econmica

Por qu desestacionalizar
una serie?
Porque las causas que producen la estacionalidad
de una serie se consideran factores exgenos, de
naturaleza no econmica y que influyen en la
variable que se estudia, que oscurecen las
caractersticas de la serie relacionadas con
aspectos meramente econmicos.
(C.W.J. Granger, pags 33-35. En, A. Zellner (ed.), Seasonal Analysis of Economic
Time Series, U. S. Bureau of Census,1978.

Por qu desestacionalizar?
La comparacin entre meses o trimestres de
diferentes aos, necesitan que las series no
contengan distorsiones estacionales, que
pueden inducir a errores en la toma de
decisiones.
Las series desestacionalizadas permiten
analizar la evolucin de la serie ao tras
ao.

Por qu desestacionalizar?
Con el ajuste estacional uno pretende eliminar
al mximo la fluctuacin que oscurece el
componente de tendencia-ciclo de la serie, as
que no slo se debe tratar de extraer el
componente estacional, sino de ser posible
tambin, parte de la irregularidad que se
puede medir, a fin de observar mejor la
tendencia-ciclo.
(S. Koffek, pags. 3-32. En, A. Zellner (ed.), Seasonal
Analysis of Economic Time Series).

Por qu desestacionalizar?
Al contar con series desestacionalizadas el
analista puede realizar comparaciones entre
meses consecutivos o no consecutivos para
evaluar la coyuntura.

METODOS PARA
DESESTACIONALIZAR UNA
SERIE

Existen dos procedimientos generales


para realizar el ajuste estacional de una
serie de tiempo, stos son:
- el mtodo de regresin y
- el mtodo de promedios mviles.

Los mtodos de regresin se aplican por lo


general bajo el supuesto de que la
estacionalidad, y en ocasiones tambin la
tendencia, pueden representarse de manera
determinstica mediante funciones del tiempo.

Los mtodos de promedios mviles


presuponen que tanto la tendencia como la
estacionalidad tienen comportamientos
dinmicos con el paso del tiempo y, por
tanto, la estimacin de los componentes se
realiza localmente, de forma que la
tendencia en un punto determinado del
tiempo se estima como promedio de las
observaciones previas y futuras

Qu mtodo aplicar?
Si la desestacionalizacin es para realizar
un anlisis economtrico donde aparece la
serie ajustada, quizs lo ms conveniente sea
algn mtodo de regresin, ya que as las
fluctuaciones estacionales podran formar
parte explcita del modelo economtrico.

Si el objetivo de la desestacionalizacin es
observar la tendencia de la serie, sin efectos
estacionales que la puedan oscurecer, o si se
pretende desestacionalizar de modo rutinario
una gran cantidad de series, posiblemente los
mtodos ms adecuados sean los de
promedios mviles, debido a que son
relativamente sencillos de aplicar y se dispone
de paquetes de cmputo estadstico para los
clculos.

En la actualidad, existen diversos programas para


desestacionalizar series de tiempo basados en
promedios mviles, entre los de uso ms
frecuente por un gran nmero de pases se
encuentran el X11-ARIMA de la Oficina de
Estadstica de Canad (Statistics Canada)12/ y el
X12-ARIMA13/ del Bureau de Censos de EEUU,
este ltimo utiliza el mtodo X11 detallado en
Shiskin, Young y Musgrave (1967) y Dagum
(1988) para efectuar la desestacionalizacin. Estos
mtodos suponen que la serie est compuesta por
los siguientes componentes no observables:
Tendencia - Ciclo, Estacional e Irregular.
Enlazados a travs de un modelo.

El Modelo Aditivo
Xt = TCt + Et + It
Donde:
Xt = serie original
TCt = componente tendencia-ciclo
Et = componente estacional
It = componente irregular
Este modelo asume que los componentes de la serie son
independientes, es decir, la amplitud de la estacionalidad es
independiente del nivel de la tendencia ciclo. Un aumento en el
nivel de la tendencia-ciclo no ocasiona un aumento en la amplitud
estacional.
En este caso la serie desestacionalizada se obtiene como:

XDt = Xt - Et = TCt + It

El modelo multiplicativo
Xt = TCt * Et * It
-Este modelo asume que los componentes estn
interrelacionados. Un aumento en el nivel de la
tendencia-ciclo ocasiona un aumento en la amplitud
estacional.
-Los componentes estacional e irregular estn
expresados en porcentajes.
En este modelo, la serie desestacionalizada se
obtiene como: XDt = Xt/Et ) = TCt * It

Evolucin del PIB trimestral (log) en Chile: 1996:I- 2006:II


7,08
7,05
7,02
6,99
6,96
6,93
6,90
6,87
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II
1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

Cmo extraemos de esta serie el componente de


estacionalidad? mediante el uso de variables dummies

Considere el siguiente modelo:


Yt = 0 + 1D1t + 2D2t + 3D3t + 4t + et
Donde Dit es una variable dummy que toma el valor 1 si la
observacin corresponde al trimestre i y 0 si no.
En este contexto, se tiene lo siguiente:
E(Yt | primer trimestre) = 0 + 1
E(Yt | segundo trimestre) = 0 + 2
E(Yt | tercer trimestre) = 0 + 3
E(Yt | cuarto trimestre) = 0

En este contexto, la serie desestacionalizada (ajustada) puede


obtenerse de la siguiente manera:

*
Yt

Yt ( 1 D1t 2 D2t 3 D3t )

Los parmetros estimados corresponden a las estimaciones


MCO de los parmetros poblacionales
Hay muchos mtodos alternativos para desestacionalizar
series, siendo el ms popular (utilizado por el Banco Central
de Chile) el X-12-ARIMA.
Este mtodo permite realizar una estimacin no paramtrica
del componente estacional con la ayuda de promedios
mviles (mtodo X-11).

El modelo estimado por MCO es


lgdp = 6.88 - 0,0012739 * Dtrim1 + 0,0020191 * Dtrim2 0,0167853 * Dtrim3 + 0.0038 t
Luego, se construye la serie desestacionalizada:
lYadjust = lgdp + 0,0012739 * Dtrim1 -0,0020191 * Dtrim2
+ 0,0167853 * Dtrim3
7,08
7,05

Serie original

7,02

Serie desestacionalizada

6,99
6,96
6,93
6,90
6,87
I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II III IV I II
1996

1997

1998

1999

2000

2001

2002

2003

2004

2005

2006

Series economicas dessestacionalizadas.pdf

VARIABLES DUMMY PARA


DESESTACIONALIZAR

En general, toda serie econmica contiene cuatro


componentes:
Z = C + T + S +I
donde :
Z es la serie original
C es el ciclo (podra aproximarse por funciones
trigonomtricas)
T es la tendencia (en funcin del tiempo)
S es la estacionalidad o el efecto en la variable originado por
factores asociados al calendario (por ejemplo la actividad
econmica declina en febrero producto de las vacaciones)
I es la parte irregular o ruido blanco que no responde a
ningn patrn determnistico.

DINERO: DISTINTOS
COMPONENTES

Sabemos que el comportamiento de largo plazo del


dinero (componente tendencia-ciclo) depende de una
variable de escala (ingreso) y del costo de mantenerlo
(tasa de inters nominal).
Pero adems la trayectoria del dinero esta afectada por
factores estacionales (por ejemplo aumenta fuertemente
en septiembre por fiestas patrias o en diciembre, etc).
(M/P)d = f(ingreso, tasa de inters, factores
estacionales, componente irregular)
Los efectos estacionales pueden aproximarse a travs
de variables dummy.

Identifiquemos en la serie dinero


real estos componentes.
.

tendencia

original

ciclo

ln (M/P) = 1 + 2 lnYi + 3 ii + 4 D1i + 5 D2i + 6 D3i +


7 D4i + i
Sin embargo, la regresin anterior no puede estimarse porque
la matriz X no es de rango completo por columnas.
D1 + D2 + D3 + D4 = 1 (las cuatro variables dummy son
una combinacin lineal que dan lugar a la columna 1)
r (X) < k XX no es invertible

Posibles soluciones

Eliminar el intercepto
Eliminar una de las variables dummy
Suponer que la suma de los efectos estacionales es cero.
Desestacionalizar las series utilizadas. Por ejemplo en E-Views el
comando SEAS elimina los efectos estacionales. SEAS Y YSA donde
YSA es la series desestacionalizada. Luego se corre la regresin con las
series desestacionalizadas. Por ejemplo:
ln (M/PSAi) = 1 + 2 lnYSAi + 3 iSAi + i

D1=
0 en el resto
1 si el trimestre es el primero
D2=
0 en el resto
1 si el trimestre es el segundo
D3=
0 en el resto
1 si el trimestre es el tercero
D4=
0 en el resto
1 si el trimestre es el cuarto

VARIABLES DUMMY PARA DETECTAR CAMBIO


ESTRUCTURAL
CPi = 1 + 2 Yi + i
Chile 1960 - 1997
Supongamos que intuimos que hubo cambio estructural en 1974
producto del proceso de apertura comercial iniciado por el pas.

H0: I =II
H1: I II

1960-74 , I1 =I2, Podramos definir: Planteamos un modelo


ms general:
Di=0, sin economa cerrada (60-74);
Di=1 si economa abierta (75-97)
1975-97 II1 =II2
Planteamos un modelo mas general:
Ci = 1 + 2Di + 3Yi + 4DiYi + ui
E(Ci / Di = 0, Yi ) = 1 + 3Yi
E(Ci / Di = 1, Yi ) = (1 + 2 ) + (3 + 4) Yi
2 es el intercepto diferencial; 4 es la pendiente diferencial

VARIABLES DUMMY PARA


CORREGIR OUTLIERS.
Un outlier es un error anormal. Su valor absoluto es
largamente superior al desvo estndar de la regresin.
Los parmetros estimados pueden estar fuertemente
distorsionados considerando la presencia del outlier.
Demanda por dinero:
ln (M/P) = 1 + 2 lnYi + 3 ii + 4 D1i + 5 D2i + 6
D3i + 7D4i + 8 D5i + 9 D6i + 9 D7i + 10 D8i + 11
D9i + 12 D10i +13 D11i + i
Aqu utilizamos 11 dummies para captar estacionalidad
por tratarse de datos mensuales.

0.0

87

Residual

Actual ------

98

ln (M/P) = 1 + 2 lnYi + 3 ii + 4 D1i + 5 D2i + 6 D3i + 7 D4i


+ 8 D5i + 9 D6i + 9 D7i+ 10 D8i + 11 D9i + 12 D10i + 13
D11i + 14 D923 + I
D923=1, si i=marzo de 1992
D923=0 en el resto

ECUACIN ESTIMADA PARA LA DEMANDA POR


DINERO (Incluyendo la Variable Dummy D923)

0.0
87

98

Potrebbero piacerti anche