Sei sulla pagina 1di 10

Captulo 14: Mtodos Avanzados para datos de panel

Se estudian dos mtodos que sirven para estimar modelos de datos de panel de
efectos inobservables que son al menos tan comunes como aplicar la primera
diferencia: Estimador de efectos fijos y Estimador de efectos aleatorios (que es
atractivo cuando se piensa que el efecto inobservable no est correlacionado con
ninguna de las variables explicativas).

14.1 Estimacin de efectos fijos.

La transformacin de efectos fijos funciona mejor que primeras diferencias bajo
ciertos supuestos. Para poder entender mejor se hace el ejemplo con una variable
explicativa. As tenemos:




Ahora, para cada i se promedia la ecuacin en el tiempo y se obtiene,



Sabemos que a
i
permanece constante en el tiempo. Entonces, se procede a restar las
ecuaciones anteriores para obtener:






Donde la diferencia representa los datos con el tiempo deducido tanto para y, x y u.
Esta es la transformacin de efectos fijos o transformacin intragrupal (within).
Como podemos observar el efecto no observable a
i
ha desaparecido. As, se tiene que
hacer un estimacin combinada de MCO de la ltima ecuacin y en especial el cual se
basa en las variables con el tiempo deducido se conoce como estimador de efectos
fijos o estimador intragrupal (within). Within proviene de la variacin en el tiempo en
y y x dentro de cada observacin de corte transversal.

El estimador intragrupal (between:variacin entre individuos) se obtiene a partir del
estimador MCO en la ecuacin de corte transversal (la segunda)(se incluye el
intercepto): se utilizan los promedios a lo largo del tiempo de y y x, para luego efectuar
una regresin de corte transversal. Este estimador intragrupal esta sesgado cuando a
i
se correlaciona serialmente con el promedio de x
i
. Si es que a
i
no est correlacionado
con x
it
, es mejor utilizar el estimador de efectos aleatorios. El between ignora
informacin importante sobre el cambio de las variables en el tiempo.


El modelo de efectos inobservables original, con k variables es:


Se aplica la deduccin del tiempo a cada variable explicativa, incluyendo hasta
variables binarias temporales y se realiza una regresin combinada de MCO utilizando
todas las variables con el tiempo deducido. La ecuacin general con el tiempo
deducido para cada i que se estima por MCO combinados es:



Bajo el supuesto de exogeneidad estricta sobre las variables explicativas (x) el
estimador de efectos fijos es insesgado. Adems, el error idiosincrtico u
it
no debe
correlacionarse serialmente con ninguna variable explicativa en todos los periodos
(ver apndice). El estimador de efectos fijos permite la correlacin arbitraria entre a
i
y
las otras variables explicativas en cualquier periodo, al igual que primeras diferencias.
As, cualquier x que sea constante en el tiempo para toda i queda erradicada por la
transformacin de efectos fijos.

Otro supuesto necesario para que un anlisis por MCO directo sea vlido es que los
errores u
it
sean homocedasticos y no estn serialmente correlacionados (en t) (ver
apndice).

Los grados de libertad en esta estimacin es: gl=NT-N-K=N(T-1)-k. Es as porque se
pierde un gl por cada observacin debido al tiempo deducido.

El calculo de la medida de bondad de ajuste no queda claro con los EF. Le R-
cuadrada se interpreta como la cantidad en la variacin temporal en la y
it
que se
explica por la variacin temporal en las variables explicativas.

Aunque las variables constantes en el tiempo n pueden incluirse por s solas en un
modelo de EF, pueden interactuar con variables binarias anuales, que cambian con el
tiempo. Es posible ver como el efecto de una x ha cambiado en el tiempo con
variables binarias. No es posible usar EF para estimar en el periodo base, lo que
significa no poder hacerlo para cualquier periodo, solo la diferencia con el periodo
base.

Cuando se incluye un conjunto completo de variables binarias (para todos los aos
excepto el primero) no es posible estimar el efecto de ninguna variable cuyo cambio
en el tiempo sea constante. Un ejemplo, aos de experiencia, cada ao aumenta en
uno. No hay distincin en el efecto de ao-ao, con el agregado.

Regresin de variables binarias

En un punto de vista tradicional respecto a EF se supone que el efecto inobservable a
i
es un parmetro que debe estimarse para cada i. As, en la ecuacin del modelo a
i
es
el intercepto para la persona i que debe estimarse junto con las betas(Se requiere
T2). La forma en que se estima el intercepto es asignar una variable binaria para
cada observacin de corte tranversal, junto con las variables explicativas. Este mtodo
se conoce como regresin de variables binarias. Este mtodo no es muy prctico
para conjuntos de datos de panel con numerosas observaciones de corte transversal.

Aun as, tiene caractersticas interesantes. Provee exactamente las mismas
estimaciones de las betas que se obtendran de la regresin con datos con el tiempo
deducido, y los mismos estadsticos importantes. El estimador de EF se obtiene por
medio de la regresin de variables binarias.

La R-cuadrada de la regresin de variables binarias tiene un valor muy alto. Esto se
debe a que se esta incluyendo una variables binaria para cada unidad de corte
transversal, lo que explica buena parte de la variacin de los datos.

Son de inters los interceptos estimados
i
. Esto sucede si de desea estudiar su
distribucin a lo largo de i para ver si una observacin esta por encima o debajo del
valor promedio de la muestra.



La barra superior alude a los promedios a lo largo del tiempo y las betas son las
estimaciones de EF.

Los reportes de un intercepto general en la estimacin de EF surgen de considerar las
a
i
como parmetros a estimar. El intercepto general es el promedio de los interceptos
especficos individuales, el cual es un estimador insesgado y consistente de
alfa=E(a
i
).

Las betas estimadas tambin son de inters y se utilizan ecuaciones con variables con
el tiempo deducido para obtener estas estimaciones. Se considera las a
i
como
variables omitidas que se controlan mediante la transformacin intragrupal. La
estimacin de a
i
es debl, aun as cuando sea insegada ( supuestos EF 1-4 del
apndice), no es consistente para un T fijo cuando N tiende a infinito. La razn es que
al agregar una observacin al corte transversal se agrega un a
i
.


Efectos fijos (EF) o primera diferencia(PD)?

Cuando T=2, las estimaciones de efectos fijos y primera diferencia son idnticas. En
PD, es comn incluir un intercepto en la ecuacin, que es en realidad el intercepto
para el segundo periodo en el modelo original escrito en dos periodos. La estimacin
de EF debe incluir una variable binaria para el segundo periodo con el fin de que sea
idntica a la estimacin de PD que incluye el intercepto. Con PD es fcil calcular los
estadsticos robustos a la heterocedasticidad despus de la estimacin de PD.

Cuando T3, los estimadores EF y PD no son los mismos. Ambos son insesgados con
la base de los supuestos EF. 1-4 (ver apndice), no es posible utilizar el
insesgamiento como un criterio. Ambos son cosistentes con T fijo cuando N tiende a
infinito bajo supuestos EF 1-4. Para N grande y T pequeo, la eleccin entre
estimadores de EFy PD depende de su eficiencia relativa y esto se determina por la
correlacin serial de los errores idiosincrticos u
it
(se supone homocedasticidad de las
u ya que las comparaciones de eficiencia lo exigen).

Cuando las u
ij
no se correlacionan serialmente, los estimadores de efectos fijos son
ms edicientes que los de primera diferencia ( y los errores estndar de EF son
vlidos). Dado que en EF casi siempre se establece errores idiosincrticos no
correlacionados serialmente, EF se emplea ms amenudo. Pero este supuesto puede
ser falso. Se puede esperar que los factores inobservables que se modifican en el
tiempo estn correlacionados. Si u
ij
sigue una caminata aleatoria, significa que existe
correlacin serial positiva sustancial, entonces la diferencias de u
ij
no est serialmente
correlacionada y es mejor primera diferencia. En varios caos, no es posible determinar
lo anterior a la perfeccin y no se puede comparar con facilidad EF y PD.

Resulta difcil probar que las u
ij
no se correlacionan serialmente despus de la
estimacin de EF: se pueden estimar los errores con el tiempo deducido
ij
, pero no
las u
ij
. Sin embargo, los errores diferenciado de u
ij
no estn serialmente
correlacionados. Si es as, se emplea primeras diferencias. Si existe correlacin serial
negativa sustancial en los cambios de u
ij
, probablemente sea mejor usar los efectos
fijos. Cuando T es grande y N no lo es, se debe tener precauciones al usar EF, dado
que se pueden violar supuestos.

Al igual que el estimador de primeras, el estimador de efectos fijos puede ser muy
sensible al error de medicin clsico en una o ms variables explicativas. El hecho
teorico importante es que en el estimador de PD el sesgo no depende de T,
mientras que el sesgo en el estimador de EF tiende a cero a razn de 1/T.

Por lo general, resulta difcil elegir entre los estimadores de EF y PD cuando los
resultados son distintos. Entonces, conviene reportar ambos resultados.

Efectos fijos con paneles no balanceados

Si T
i
es el nmero de periodos para la unidad de corte tranversal i, sencillamente se
utilizan las observaciones T
i
al realizar la deduccin del tiempo. Tambin, se pierde un
grado de libertad para cada observacin de corte transversal debido a la deduccin del
tiempo. La regresin de variables binarias tambin se lleva a cabo exactamente de la
misma manera que con un panel balanceado y los gl se obtienen de forma apropiada.

Las unidades para las que se cuenta slo con un periodo no desempean una funcin
alguna en un anlisis de EF. La deduccin del tiempo para tales observaciones genera
slo ceros, que no se emplean en la estimacin.

El problema ms difcil que se presenta con un panel no balanceado es determinar por
qu est fuera de balance. En variables clave como ciudades o estado, mientras no se
correlacione la ausencia de datos de una determinada i con los errores idiosincrticos
el panel no balanceado no genera problemas. Si son personas o familia o empresas,
se complica. Es probable que se tenga una muestra no aleatoria en los periodos
posteriores al original. La pregunta es si se aplica EF al panel no balanceado, cuando
sern insesgados o al menos consistentes los estimadores.
Si la desaparicin de una observacin se correlaciona con el error idiosincrtico, es
decir, aquellos factores inobservables que cambian en el tiempo e influyen en las
ganancias, entonces el problema resultante de la seleccin muestral puede causar
estimadores sesgados. EF permite la desaparicin que se correlacione con a
i
.

14.2 MODELOS DE EFECTOS ALEATORIOS

Se comienza con el mismo modelo de efectos inobservables que antes,

Pero suponga que ai no esta correlacionada con ninguna variable explicativa en todos
los periodos. Entonces, el uso de una transformacin para eliminar ai da como
resultados estimadores ineficientes.
El modelo de efectos aleatorios incluyen todos los supuestos de efectos fijos ms el
requisito adicional de que ai es independiente de todas las variables explicativas en
todos los periodos.

Entonces, Cmo se debe estimar Bj?
-Si se usa un mtodo de corte transversal se ignora mucha informacin til de los
otros periodos, a pesar de que los estimadores sean consistentes.
-Si usamos MCO combinado, es decir realizar un MCO de Yit sobre las variables
explicativas y probablemente las variables binarias temporales, tambin producimos
estimadores consistentes (bajo supuesto de efectos fijos) pero ignoramos una
caracterstica fundamental del modelo, la cual es que si se define el termino de error
compuesto como Vit = ai + uit, suceder que las Vit se correlacionaran seriamente en
cada periodo de tiempo (xq contienen a ait ),entonces los errores estndar de MCO
combinados sern incorrectas y tambin lo sern los estadsticos de prueba usuales.
El modelo con este termino de error compuesto se define de la siguiente manera:

La correlacin serial se defina de la siguiente manera (La correlacin es positiva
siempre):


- Usar MCG, pero teniendo un N grande y un T relativamente pequeo.
La transformacin de MCG que elimina la correlacin serial es:
.
Donde la barra indica los promedios a lo largo del tiempo. Aqu los errores estn
serialmente correlacionados. La transformacin de la ecuacin permite variables
explicativas que son constantes en el tiempo, y esta es una ventaja de los efectos
aleatorios (EA) sobre, ya sea los efectos fijos o las primeras diferencias. Esto es
posible debido a que EA supone que el efecto inobservable no esta correlacionado
con ninguna de las variables explicativas, ya sea que las variables explicativas esten
fijas en el tiempo o no.
El parmetro LAMBDA se estima de la siguiente manera:



Este estimador por lo general es consistente (no insesgado) y tiene distribucin normal
asinttica a medida que N aumenta y T se mantiene constante.

Este estimador de EA, se relaciona con uno de MCO combinado y EF cuando:

-MCO combinado: cuando PARAMETRO=0 (Esto ocurre cuando el efecto
inobservable, ai, tiene relativamente poca importancia)

-EF cuando: PARAMETRO LAMBDA=1 (esto es ms comn)

Se puede entender mejor las ventajas de EA sobre EF escribiendo el error cuasi
deducido como:

Aqu es notoria que se pondera el efecto inobservable ai por (1-). Aunque la
correlacin entre ai y las X produzca correlacin, esta se atenuara a medida que
tienda a 1.


Efectos aleatorios o efectos fijos?
Dado que los efectos fijos permiten una correlacin arbitraria entre ai y las xitj,
mientras que los efectos aleatorios no, se considera ampliamente que los EF
constituyen una herramienta mas convincente para la estimacin de los efectos ceteris
paribus.
Evidentemente, si la variable explicativa clave es constante en el tiempo, no es posible
usar EF para estimar su efecto sobre y.
La idea es utilizar las estimaciones de efectos aleatorios a menos que la prueba de
Hausman lo rechace. En la practica, si no hay rechazo, significa que las estimaciones
de EA y de EF estn lo suficientemente cerca para que no importe cual usar. Un
rechazo mediante la prueba de Hausman significa que el supuesto clave de EA, es
falso y por tanto, se usan las estimaciones de EF.
Recuerde, el uso de EF es mecnicamente el mismo que permitir un intercepto
diferente para cada unidad de corte transversal.

14.3 Aplicacin de mtodos de dato panel a otras estructuras
de datos

Datos de panel tambin pude aplicarse a otras estructuras de datos que no involucran
el tiempo. Es comn por ejemplo en el uso de hermanos gemelos, para poder
considerar caractersticas inobservables relacionadas con la familia y antecedentes.
Por lo general, se desea permitir que el efecto familiar inobservable, que es comn a
todos los gemelos de una familia, se correlacione con las variables explicativas
observadas.
Si dichas variables explicativas cambian entre los hermanos de una familia, tomar la
diferencia entre las parejas de hermanos es preferible como mtodo de estimacin.
Cuando se toma diferencias, se eliminan los efectos inobservables y con ello los
posibles sesgos provocados por confundir las caractersticas de los antecedentes
familiares.
literal:
A manera de ejemplo, Geronimus y Korenman (1992) utilizaron parejas de hermanas
para estudiar los efectos de la maternidad entre adolescentes sobre variables
economicas futuras.
Cuando la variable es el ingreso relacionado con las necesidades, algo que depende
del nmero de hijos, el modelo es


Este procedimiento elimina el efecto familia af ,y la ecuacin resultante se estima por
MCO.
Tener en cuenta que se han permitido diferencias en los interceptos entre las
hermanas en la ecuacin (14.12), lo cual conduce a un intercepto diferente de cero en
la ecuacin diferenciada (14.13). Si al introducirlos datos, el orden de las hermanas en
cada familia es en esencia aleatorio, el intercepto estimado debe estar cerca de cero.
Pero incluso en tales casos no perjudica incluir un intercepto en la ecuacin (14.13) y
hacer que el intercepto permita el hecho de que, por ejemplo, la primera hermana
listada sea siempre la mas necesitada.

Las muestras utilizadas por Geronimus y Korenman (problema de las hermanas
gemelas)(1992) y Ashenfelter y Krueger (ejemplo de gemelos en educacin_medio
prrafo de pag. 495) (1994) son ejemplos de muestras de datos apareados. Por lo
comn, los mtodos de efectos fijos y de efectos aleatorios pueden aplicarse a una
muestra de agrupamientos, los cuales se componen de conjuntos de datos de corte
transversal, pero cada observacin pertenece a un agrupamiento bien definido. En los
ejemplos anteriores, cada familia es un agrupamiento.
Dado que es probable que los resultados dentro de un agrupamiento esten
correlacionados, por lo general, es importante tener en cuenta un efecto inobservable
de los agrupamientos. La estimacin de efectos fijos es preferida cuando se piensa
que un efecto de grupo inobservable se correlaciona con una o ms de las variables
explicativas. Por lo tanto solo debemos incluir variables explicativas que cambien al
menos un poco dentro del agrupamiento. Cabe resalta que cuando las variables
explicativas cambian a nivel de agrupamiento y no dentro de l, el mtodo de EF no
aplica. Un ejemplo es el efecto de la calidad del profesor de un aula sobre el
desempeo de los alumnos, dado que todos los alumnos de un aula tienen el mismo
profesor, la eliminacin del efecto clase elimina el efecto de la calidad del profesor. El
requisito fundamental para que EA produzca estimaciones convincentes es que las
variables explicativas no estn correlacionadas con el efecto de grupo inobservable




17. MODELOS DE VARIABLE DEPENDIENTE
LIMITADA Y CORRECCIONES A LA SELECCIN
MUESTRAL
Variable dependiente limitada (VDL). Es una variable dependiente cuyo
rango de valores est restringido de forma importante. La mayora de las
variables econmicas que se desea explicar son limitas pues deben ser
positivas.
Desventajas del modelo de probabilidad lineal (MPL):
- Las probabilidades resultantes son menores a cero y mayores a uno.
- Los efectos parciales de cualquier variable es constante.
Logit y Probit, que son modelos de respuesta binaria, superan esas
desventajas pero son ms difciles de explicar.
17.1. Modelos logit y probit para respuesta binaria
En un modelo de respuesta binaria el inters radica en la probabilidad de
respuesta.
P(y=1|x)=P(y=1|x1, x2, x3, , xk)
Especificacin de modelos logit y probit

Donde G es una funcin cuyos valores estn entre 0 y 1: 0 < G(z) < 1.
Modelo logit: Cuando G es la funcin logstica.

Modelo probit: Cuando G es
la distribucin acumulada normal estndar.

Donde G asegura que est entre 0 y 1 para cada valor de los parmetros y las
x.
En ambos modelos, G(.) es creciente. Ambos modelos pueden derivarse a
partir de un modelo de variable latente subyacente y*.

donde 1[.] es la funcin de indicador.
Corr(e, x)=0 y e se distribuye simtricamente en torno a cero 1-G(-z)=G(z)
e --- N(.) probit
e --- L(.) Logit.

La principal meta es explicar los efectos de las x sobre la probabilidad de
respuesta P(y=1|x). Pero la variable latente y* rara vez tiene una unidad de
medicin bien definida, por lo tanto, los betas no son tiles. Como se quiere
estimar el efecto de x sobre la probabilidad de xito P(y=1|x) se complica pues
G(.) es no lineal as que ser necesario usar clculo: derivadas parciales.

g es una funcin de densidad de probabilidad pues G(.) es una fda de una
variable aleatoria. Con probit y logit, G(.) es creciente y, por tanto, g(z)>0.
Estimacin de mxima verosimilitud de los modelos logit y probit
Debido a la naturaleza no lineal del problema de maximizacin, no se pueden
escribir frmulas para las estimaciones de mxima verosimilitud logit o probit.
Prueba de hiptesis mltiples
3 maneras de probar las restricciones de exclusin para modelos logit y probit:
1) El multiplicador de Lagrange slo requiere estimar el modelo bajo la
hiptesis nula (Ho: beta=0)
2) La prueba de Wald requiere la estimacin slo del modelo no
restringido. En MPL, el estadstico de Wald es esencialmente el
estadstico F.
3) La prueba de la razn de verosimilitudes (RV). Est basada en la
diferencia en las funciones de log-verosimilitud para los modelos
restringido y no restringido. Si se omita variables, la log-verosimilitud se
reduce. La cuestin radica en si la disminucin de la log-verosimilitud es
lo bastante grande para concluir que las variables omitidas son
importantes. El estadstico es dos veces la diferencia en las dos log-
verosimilitudes, la primera es no restringido y la segunda es restringido.

Interpretacin de las estimaciones logit y probit
La pseudo-R-cuadrado es lo mismo que el R-cuadrado slo que el ltimo es
para MCO, el pseudo-R-cuadrado es para logit y probit.
El efecto parcial en el promedio (EPeP) reemplaza cada variable explicativa,
x, con su promedio muestral. Problemas: (i) si algn x es discreto, no
representa a nadie de la muestra; y (ii) si una variable explicativa continua
aparece como una funcin no lineal, no es claro si se quiere promediar la
funcin no lineal o insertar el promedio en la funcin no lineal.

Potrebbero piacerti anche