Sei sulla pagina 1di 10

Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

IN4402 Aplicaciones de Probabilidades y Estadı́stica en Gestión


Profesor: Andrés Fernández Vergara
Auxiliares: Magdalena Badal - Constanza Balbontı́n - Claudio Mena -
Angelo Muñoz - Valentina Palma
Año: 2019

Auxiliar 6
El Programa Hogares Felices fue aplicado a familias de bajos ingresos en los municipios de Chile. El
objetivo era mejorar la nutrición de las(os) niñas(os) menores de 10 años de bajos ingresos, a través de la
provisión de despensa a las familias seleccionadas.

Las familias se asignaron aleatoriamente a recibir grupo tratamiento y control (variable recepción D). Para
ver el impacto de este programa, investigadores midieron los resultados con la estatura estandarizada de
quienes recibı́an el programa (variable AN), además contaban con información de si el(la) menor era niño(a)
(NIÑO), si era de raza baja (RAZA), si el jefe de hogar trabajaba (OCUP) y sus ingresos (ING), los años
de educación del jefe de hogar (EDUC) y del numero de personas que vivı́a en el hogar de la familia (N).

En lo que sigue usted analizará los resultados que obtuvieron los investigadores usando dos estudios ob-
servacionales: Variables Instrumentales y Dif-in-Dif. Con esto usted puede hacer la comparación del
impacto que entregan estas herramientas respecto del impacto que tuvo el programa en estudios previos
experimentales, los cuales reflejaron que los niños(as) que recibı́an el programa tenı́an una estatura de 0.23
desviaciones estándares por encima de la media mayor que los niños que no participaron en el programa.
P1. [Variables Instrumentales] Para combatir el problema de incumplimiento unilateral de las familias
tratadas, los investigadores tenı́an dos instrumentos para estimar el efecto del programa. El primero
era la distancia de los hogares a las oficinas de inscripción del programa (DIST) y el segundo era el
número de oficinas disponible para inscribirse al programa por municipio (OF).
i) Observe los modelos (4) y (5) de la Tabla 3, ¿Que ocurre con la estimación OLS del efecto del
tratamiento?. Compare esta situación respecto al experimento ideal.
ii) Observe los modelos (1) y (2) de la Tabla 3 y vea si se cumple el supuesto de relevancia para
ambos instrumentos. ¿Por qué es tan importante no tener instrumentos débiles?
iii) Observe ahora los modelos (6) y (7), ¿Qué puede concluir respecto al efecto del programa cuando
se usa 2SLS para cada instrumento por separado?
iv) Observe el modelo (3) de la Tabla 3 y vea si se cumple el supuesto de relevancia para ambos
instrumentos en conjunto. ¿Cambian los supuestos en la estrategia IV en este nuevo escenario?
v) Observe el modelo (8) de la Tabla 3. ¿Mejora la estimación de βIV,D en esta nueva situación?
vi) ¿Son DIST y OF instrumentos válidos para poder estimar el efecto del programa?. Para esto
considere:
• ¿DIST y OF están relacionados con variables variables omitidas que afectan la altura de
niños(as)?
• ¿Qué pasa con las caracterı́sticas de los municipios?
vii) Proponga otro instrumento para estimar el efecto del programa.

1
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

P2. [Dif-in-Dif ] En algunos municipios del paı́s encontraron cobre y esto incrementó las regalı́as e ingresos
de esos municipios. El gobierno de Chile decidió implementar el programa en estos municipios. Por lo
que ahora se comparan los resultados nutricionales de los niñas(os) en municipios en donde encontraron
cobre y donde no encontraron cobre.
i) En la tabla 4 se muestra la comparativa sobre el promedio de estatura estandarizada por grupo
antes y después de la implementación del programa. Compare las estaturas por grupo, antes y
después de la implementación del programa utilizando una perspectiva de Diferencia en Diferencias
(DD). ¿Cuáles son los peligros potenciales de este análisis?

ii) Para testear los resultados anteriores, se quiere realiza un modelo de regresión para evaluar me-
diante diferencias en diferencias (DD) el efecto la implementación del programa.

a) Escriba la especificación que permita


obtener los resultados de la tabla 5.
b) Interprete los resultados de la tabla.
c) ¿Qué conclusión puede obtener a
partir de estos resultados en
comparación con i)?

2
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

P1. Solución:
i) El modelo (4) muestra la estimación del modelo:
ANi = β0 + β1 Di + ui
y el modelo (5):
ANi = β0 + β1 Di + β2 Ni + β3 N I Ñ Oi + β4 OCU Pi + β5 EDU Ci + β6 IN Gi + ui
En ambos modelos se muestra la estimación del efecto de tratamiento del programa hogares felices
sobre los niños(as) de Chile, reunido en β1 . El primer modelo sin variables de control muestra que
la estimación del efecto de tratamiento es de 0.248 desviaciones estándares por encima de la media
mayor, para los niños(as) tratados(as) en comparación a los no tratados(as). Al incluir variables
de control, esta estimación disminuye levemente a 0.247 desviaciones estándares por encima de la
media mayor, para los niños(as) tratados(as) en comparación a los no tratados(as). Si se compara
estas estimaciones con la obtenida en estudios previos experimentales, se puede apreciar un sesgo
debido al incumplimiento unilateral de familias tratadas u otra fuente de endogeneidad, de 0.012
desviaciones estándares. Por lo tanto, la estimación de β̂1 esta sobrestimada en ambos modelos.
ii) Antes de responder la pregunta quisiera hacer un repaso breve de manera general (aún no aplicado
al contexto del problema). Aplicar variables instrumentales tiene sus requisitos. Si se tiene una
variable endógena X, un instrumento Z y una variable resultado Y . Para estimar el efecto de X
sobre Y en el modelo (sin variables de control):
Yi = α0 + α1 Xi + ui
Z debe cumplir:
• Relevancia: Cov(Xi , Zi ) 6= 0
• Exogeneidad: Cov(ui , Zi ) = 0
El supuesto de relevancia indica que Z debe guardar relación (ser relevante) con la variable
endógena X. El supuesto de endogeneidad indica que el instrumento Z no debe relacionarse
con ningún otro factor observable o no observable en u que explique a Y , aparte de la variable
endógena X. Bajo estos supuestos se puede estimar un efecto local de X (solo la parte exógena)
sobre Y mediante 2SLS:
• First Stage:
X̂i = π̂0 + π̂1 Zi + v̂i
• Second Stage:
Yi = α0 + α1 X̂i + ui
Donde el efecto buscado se reunirı́a en α̂1 . Uno de los precios que se paga al estimar el
efecto causal con 2SLS, es que el error estándar de α̂1 , se(α̂1 ), es más grande que
si solo se hubiera estimado el efecto causal con OLS (como se hizo en el apartado
anterior).
Al incluir un conjunto de variables de control exógenas W = {C1 , C2 , ...} que también explican
Y en la estrategia de variables instrumentales, las cosas se modifican:
X
Yi = α0 + α1 Xi + αj Cj,i + ui
j∈W

Los supuestos también se modifican:

3
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

• Relevancia: Cov(Xi , Zi |W ) 6= 0
• Exogeneidad: Cov(ui , Zi |W ) = 0
Ahora ambos supuestos son condicionados en nueva información que explique Y . La razón recae
en que cuando incluimos variables de control a una regresión las estimaciones empiezan a depender
de la variación que todas las variables independientes en conjunto pueden aportar para explicar
la variable Y y de la correlación que tienen estas entre sı́ (compiten por explicar a Y ). Ası́, ¿Que
ocurrirı́a si descubrimos que Cov(X, Z|C1 ) = 0?, la condición de relevancia se desactiva para una
covariable particular, es por esto que se exige el condicionamiento en variables de control (todas).
Una idea similar explica el porque debemos condicionar también en la exogeneidad. Con esto el
procedimiento 2SLS queda en:
• First Stage: X
X̂i = π̂0 + π̂1 Zi + π̂j Cj,i + v̂i
j∈W

• Second Stage: X
Yi = α0 + α1 X̂i + αj Cj,i + ui
j∈W

Donde el efecto buscado se reunirı́a en α̂1 . Al incluir variables de control, la estimación


de α̂1 es más eficiente.
¿Por qué incluimos las variables de control en ambos escenarios?. Las incluimos en el First Stage
porque son exógenas y, por lo tanto, excluirlas conducirı́a a una pérdida de eficiencia o consisten-
cia (muy probablemente ambas) del estimador causal en el Second Stage. En otras palabras, el
propósito del First Stage es dividir X, donde X̂ es la parte de X que puede asociarse únicamente
con movimientos exógenos (es decir, cambios en Z y W ). Si X y W están correlacionadas en
absoluto, no incluir W darı́a como resultado una gran pérdida de información ya que los valores
ajustados resultantes (X̂) no reflejarı́an todo el movimiento exógeno en X.

W se incluye en la segunda etapa para evitar el sesgo variables omitidas en las estimaciones
del coeficiente 2SLS. X̂ está casi seguramente correlacionado con W y, por lo tanto, si W tiene
algún efecto sobre Y , dejarlo fuera de la regresión dará como resultado estimaciones sesgadas del
efecto causal.

Quisiera terminar el repaso agregando la importancia de que las variables contenidas en W sean
exógenas, puesto que de no ser ası́ la endogeneidad latente en ellas se traspasarı́a al Second Stage,
haciendo las estimaciones del efecto causal sesgadas.

Ahora, aterricemos esto al contexto de la pregunta. De acuerdo con el apartado anterior, nuestra
variable endógena es Xi = Di , los instrumentos que tenemos son dos Z1i = DISTi y Z2i = OFi ,
tenemos un conjunto de variables Wi = {Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi } (supondremos
exógenas) y la variable resultado Y = ANi . En este caso debemos pedir que:
• Relevancia: Cov(Di , Zi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) 6= 0
• Exogeneidad: Cov(ui , Zi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) = 0
Los modelos (1) y (2) muestran las estimaciones del First Stage usando los instrumentos por
separado.

4
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

• En el modelo (1) vemos que se cumple el supuesto de relevancia. Una forma de ver esto es
observar que la variable DIST es significativa al 5% para explicar D, notando que por cada
metro de distancia adicional hacia las oficinas de inscripción del programa, la probabilidad
de ser tratado disminuye en 0.004%.
• En el modelo (2) vemos que se cumple el supuesto de relevancia también. Se observa sig-
nificancia en el instrumento OF al explicar D, notando que por cada oficina adicional de
inscripción al programa en el municipio donde vive la familia, la probabilidad de ser tratada
aumenta en un 3.3%.
Ahora bien, anteriormente cuando se habló del supuesto de relevancia, nunca se mencionó que
TAN relevante deberı́a ser el instrumento para explicar la variable endógena en el First Stage.
Esto es un punto muy importante para no caer en el problema de instrumentos
débiles. Un instrumento es débil si:
Cov(D, Z) ≈ 0
Es decir, donde el grado de relación (medido por la covarianza) es casi nulo (el caso extremo es si
es nulo). ¿Cuáles son las consecuencias si esto ocurre?
• El estimador del efecto causal en el Second Stage es sesgado e inconsistente para muestras
pequeñas, incluso podrı́a darse para muestras grandes.
• Si además el instrumentó no es exógeno, el sesgo comentado anteriormente se exacerba.
• La varianza del estimador del efecto causal aumenta en el Second Stage.
Por lo tanto, aterrizando esto al problema deberı́amos evaluar si DIST y OF presentan la sufi-
ciente relevancia para explicar D. Por ahora, notemos que sus coeficientes son bastante distintos,
siendo aparentemente muy relevante OF y no tanto DIST .
iii) Los modelos (6) y (7) presentan el Second Stage de los modelos (1) y (2) estudiados en el apartado
anterior, respectivamente.
• En el modelo (6) la estimación del efecto del programa es de 0.143 desviaciones estándares
por encima de la media mayor, para los niños(as) tratados(as) en comparación a los no
tratados(as). Sin embargo, esta estimación no es significativa al 5%. Esto último es sospe-
choso puesto que la estimación del coeficiente por 2SLS no logra acercarse a la estimación
experimental (0.23), por lo tanto esta sesgada (subestimada). Además existe una inflación
del error estándar en comparación con el modelo OLS (5), que provoca que la estimación
no sea significativa. La causa es justamente que DIST es un instrumento débil, esto pudo
notarse en el primer escenario cuando se estimó su relevancia respecto de D, además de que
posiblemente podrı́a no ser exógeno. La combinación de estas dos cosas produce el gran sesgo
e inflación del error estándar del estimador del efecto causal.
• En el modelo (7) la estimación del efecto del programa es de 0.23 desviaciones estándares
por encima de la media mayor, para los niños(as) tratados(as) en comparación a los no
tratados(as). Esta estimación es significativa al 5%. Ası́ se alcanza la estimación experimental
del efecto causal (0.23), por lo que OF serı́a un buen instrumento. Cabe notar que el precio
que se pagó por esta estimación fue una alza de su error estándar en comparación a la
estimación OLS del modelo (5).
iv) En el repaso anterior y los apartados anteriores, estudiamos la estrategia de variables instru-
mentales que consideraba un instrumento. ¿Qué pasa si utilizamos más de un instrumento para
estimar el efecto causal?. Los supuestos cambian al considerar instrumentos en conjunto:

5
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

• Relevancia: Cov(Di , Zli |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) 6= 0, l ∈ {1, 2}


• Exogeneidad: Cov(ui , Zli |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) = 0, l ∈ {1, 2}
El procedimiento 2SLS serı́a:
• First Stage: X
D̂i = π̂0 + π̂1 DISTi + π̂2 OFi + π̂j Cj,i + v̂i
j∈W

• Second Stage: X
Yi = α0 + α1 D̂i + αj Cj,i + ui
j∈W

Donde el efecto buscado se reunirı́a en α̂1 . Al incluir más instrumentos, si estos


cumplen los requisitos, es posible obtener una mayor variación de la parte exógena
de D, por lo que la estimación de α̂1 es más eficiente.
Ası́ el modelo (3) nos mostrarı́a la relevancia al considerar los dos instrumentos en conjunto.
Una forma simplificada de ver esto es observar la significancia de los coeficientes respectivos del
instrumento por separado. Sin embargo para ver efectivamente si ambos instrumentos en conjunto
son relevantes, se debe aplicar un test de modelo restringido F. Donde se examina la hipótesis:

H0 : π 1 = 0 ∧ π 2 = 0

H1 : π1 6= 0 ∧ π2 6= 0
si el estadı́stico F de este test es mayor a 10, entonces ambos instrumentos son relevantes.
Obs: El test pueden encontrarlo con más detalles en mis apuntes.
v) El modelo (8) muestra el Second Stage de la situación descrita en el apartado anterior. Observamos
que el efecto está sobrestimado. Lo que se observa en esta estimación es un juego de compensación
entre lo que produce el instrumento bueno OF y el instrumento malo DIST . Lo importante de
este apartado es que si se utilizan muchos instrumentos, deben cumplir los requisitos de variables
instrumentales para que la estimación del efecto causal no se distorsione, pues basta que uno de
los instrumentos no los cumpla (como es el caso aparente de DIST) para que las conclusiones sean
erróneas.
vi) Un instrumento es válido si cumple la relevancia y exogeneidad. Aparentemente OF si es un
buen instrumento para estimar el efecto causal del programa, por lo que solo nos centraremos en
decir por qué DIST no lo es. Para esto recordemos que debemos estudiar los supuestos que hemos
aplicado en las preguntas anteriores:
1) Relevancia: Cov(Di , DISTi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) 6= 0
2) Exogeneidad: Cov(ui , DISTi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) = 0
Recuerde además que la covarianza representa:
• Cov(Di , DISTi ) > 0 hay dependencia o relación directa (positiva), es decir, a grandes valores
de X corresponden grandes valores de Y.
• Cov(Di , DISTi ) < 0 hay dependencia o relación directa (negativa), es decir, a grandes valores
de X corresponden pequeños valores de Y.
• Cov(Di , DISTi ) = 0 no hay una relación clara ni directa.

6
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

En el caso de la relevancia (1), la estimación del First Stage estudiada en ii), si bien es cierto
existe significancia estadı́stica, la significancia práctica (la magnitud) es muy baja. Esto indicarı́a
Cov(Di , DISTi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) ≈ 0 y que por lo tanto, estarı́amos en pres-
encia de un instrumento débil. Ahora bien, podrı́amos hacer un análisis (cuestionable o no) más
profundo al analizar el supuesto por covariable (los siguientes son ejemplos):
• ¿Se cumplirı́a Cov(Di , DISTi |Ni ) 6= 0? Podrı́a ser que familias numerosas tengan hogares en
la periferia o en el centro de los municipios, teniendo más o menos distancia hacia las oficinas
gubernamentales de inscripción, puesto que estas se instalan (generalmente) en el centro de
un municipio o donde se aglomera más gente. En este sentido, la relación entre inscribirse
(tratarse) (D) y la distancia del hogar a la oficina (DIST ) no es clara y no apunta en una
dirección especı́fica, por lo que Cov(Di , DISTi |Ni ) ≈ 0.
• ¿Se cumplirı́a Cov(Di , DISTi |Ni , OCU Pi ) 6= 0? Es esperable para familias poco numerosas,
digamos un adulto(a) y un niño(a), donde el primero trabaje, haya menos posibilidades de
que se acerque a las oficinas de inscripción si esta está muy lejana (porque está ocupado
trabajando), sin embargo también puede que para ese tipo de adulto sea muy necesario
inscribirse para recibir despensas aún cuando la oficina este distante (por necesidad), por lo
que nuevamente el supuesto de relevancia se ve afectado (no hay una relación clara entre las
variables), Cov(Di , DISTi |Ni , OCU Pi ) ≈ 0?
• Piense otros casos.
En el caso de la exogeneidad (2) también podemos hacer el mismo análisis:
• ¿Cov(ui , DISTi |IN Gi ) = 0? Es posible que haya factores relacionados entre ui y DISTi al
considerar el ingreso del jefe de hogar, como por ejemplo, las caracterı́sticas del municipio
donde la familia reside. Un municipio más grande (en superficie m2 ) puede producir largos
trayectos entre la residencia y la oficina de inscripción que deben costearse con el ingreso, lo
que determinarı́a si la familia se inscribe al programa o no. De esta manera existe la relación
ui ←→ DISTi que además se relaciona con Di y que finalmente impacta en la estatura de
niños(as). Este simple factor externo (superficie en m2 ) que vive en ui y que no se controló
en los modelos estudiados, puede causar que la exogeneidad del instrumento no se cumpla.
• Intente analizar otros links de relación entre ui y DISTi considerando las variables de control.
Considere factores externos como: las condiciones de movilidad en el municipio, la genética
en los niños(as),etc.
vii) Conversamos en la clase auxiliar que elegir un instrumento válido (que cumple relevancia y exo-
geneidad) es difı́cil, pues basta pensar un poco para desacreditarlo con el supuesto de exogeneidad
(el supuesto de relevancia es más fácil que se cumpla). Entonces, ¿Que haremos? Pensar en vari-
ables que están hechas para cumplir la exogeneidad como por ejemplo una variable asignada
aleatoriamente que sea relevante para la variable endógena D. Dada la información del enun-
ciado, se dice que el tratamiento fue asignado aleatoriamente para la recepción (D) de las
familias. Justamente la variable asignación (llamemos ASIG) es la mejor candidata a ser variable
instrumental puesto que:
• Es relevante: las familias que recepcionaron el tratamiento es porque fueron asignadas para
recibirlo Cov(Di , ASIGi ) 6= 0 (recuerde que esto es un caso de One Sided NonCompliance).
• Es exógeno: al ser una variable asignada aleatoriamente cumple Cov(ui , ASIGi ) = 0 pues
esta balanceada con factores externos observables y no observables.

7
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

P2. Solución:
i) Como se ha visto en clase, la estrategia de Dif-in-Dif puede ser una solución para estimar el efecto
causal si:
• Existe un evento fortuito (como el hallazgo del cobre en los municipios) o arbitrario (el gob-
ierno implementa un ley o mandato) que determina el mecanismo de asignación a tratamiento
y control. Esta asignación no tiene por qué ser completamente aleatoria. En el mejor caso
la asignación del evento es equivalente a una asignación aleatoria estudiada anteriormente
en el curso y las técnicas que se aplican son las mismas. En el caso en que el evento pro-
duce una asignación parcialmente aleatoria, se debe considerar incluir variables de control
a la estimación del efecto causal, de manera de controlar por los posibles desbalances de la
asignación en factores observables y no observables.
• Existe información (datos) antes y después de la aplicación del tratamiento.
El estimador de diferencias en diferencias (DD) del efecto causal del programa es:

DD = (Y T,1 − Y T,0 ) − (Y C,1 − Y C,0 )

donde Y i,t es el promedio del resultado del grupo i ∈ {T ratamiento(T ), Control(C)} en el tiempo
t ∈ {pretratamiento(t = 0), postratamiento(t = 1)}. ¿Parece simple la estimación del efecto
causal? Pues no lo es, detrás del estimador DD está el supuesto de tendencia paralela entre
los grupos tratamiento y control en su evolución antes-después.

¿Qué significa el supuesto? Estipula que la tendencia que se observa en la variable resultado
(Y) para el grupo control es igual a la tendencia que se habrı́a observado en el grupo tratamiento,
si no hubiera recibido el tratamiento. Es decir, que de no haber recibido el tratamiento, la variable
resultado (Y) en el grupo tratamiento cambiarı́a a la misma tasa de crecimiento que la variable
resultado en el grupo control. Gráficamente:

Este supuesto garantiza que los grupos tratamiento y control sean comparables antes y después
para poder estimar el efecto causal. Es decir, no hay factores variantes en el tiempo, ni diferencias

8
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

entre los grupos que afecten la variable resultado (Y) aparte del programa. Cabe notar que este
supuesto es fuerte, puesto que hay un sin numero de factores que podrı́an variar en el tiempo y
que produzcan diferencias entre los grupos. Por lo que este supuesto se hace más admisible si:
• Teniendo datos incluso antes del periodo pretratamiento (digamos un t = −1 o antes de
t = 0), se observa en ellos que las tendencias son paralelas para las variables resultados (Y)
de los grupos. Esto apoya (no garantiza) el supuesto de tendencia paralela, puesto que si
incluso antes del pretratamiento los grupos tratamiento y control son comparables, en el
corto plazo posterior deberı́an serlo.
• Se incluyen variables de control que reúnan diferencias en el tiempo y diferencias entre grupos.
Aterricemos esto al contexto del problema y del apartado. En la tabla 4 se muestra los promedios
de la variable resultado (Y=AN) para los grupos tratamiento y control, antes y después. El
estimador del efecto causal DD es:

DD = (−0.279 − (−0.679)) − (−0.581 − (−0.779)) = (−0.279 + 0.679) − (−0.581 + 0.779) = 0.202

Por lo que el efecto causal del programa estimado es de 0.202 desviaciones estándares por encima
de la media mayor, para los niños(as) tratados(as) en comparación a los no tratados(as). Cabe
recalcar que esta estimación ignora factores variantes en el tiempo que produzcan diferencias en
los grupos (ingreso de las familias, condiciones socioeconomicas de los municipios, etc), por lo
que la estimación podrı́a estar sesgada. Este es el peligro potencial que podrı́a sufrir la simple
estimación DD que se realiza en este apartado.
ii) Para incluir variables de control que reúnan diferencias variantes en el tiempo en la estimación de
DD se plantea un modelo de regresión lineal. Tenemos la variable tratamiento Di (1 tratamiento,
0 control), la variable dummy temporal Tt (1 después, 0 antes), un conjunto de covariables Wit =
{Nit , N I Ñ Oit , OCU Pit , EDU Cit , IN Git } (supondremos exógenas) y la variable resultado ANit
a) El modelo para estimar el efecto causal mediante la estrategia Dif-in-Dif es:
X
ANit = β0 + β1 Di + β2 Tt + β3 Di ∗ Tt + βj Cj,it + ui
j∈W

El efecto causal se reúne en β3 . ¿Por qué?, si tratamos de obtener el estimador DD con este
modelo lineal, entonces:
X
(1) E[AN |D = 1, T = 1, W (constante)] = β0 + β1 + β2 + β3 + βj Cj,it
j∈W
X
(2) E[AN |D = 0, T = 1, W (constante)] = β0 + β2 + βj Cj,it
j∈W
X
(3) E[AN |D = 1, T = 0, W (constante)] = β0 + β1 + βj Cj,it
j∈W
X
(4) E[AN |D = 0, T = 0, W (constante)] = β0 + βj Cj,it
j∈W
Restando (1) y (3), restamos el caso antes-después del grupo tratamiento (primera diferencia
para tratados):

A = E[AN |D = 1, T = 1, W (constante)] − E[AN |D = 1, T = 0, W (constante)] = β2 + β3

9
Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

Restando (2) y (4), restamos el caso antes-después del grupo control (primera diferencia para
controles):

B = E[AN |D = 0, T = 1, W (constante)] − E[AN |D = 0, T = 0, W (constante)] = β2

Luego restando (A)-(B) obtenemos la segunda diferencia (diferencias en diferencias):

A − B = β3

Ası́ se encuentra el mismo estimador DD establecido en la parte i) de la pregunta, pero lo


diferente es que este nuevo estimador es controlado por diferencias variantes en el tiempo y
entre grupos con las covariables en W .
b) Lo que vemos en la tabla es la estimación del modelo planteado anteriormente, cuando se
agregan sucesivamente las variables de control en W . Vemos que la estimación del efecto
causal del programa es de 0.181 desviaciones estándares por encima de la media mayor, para
los niños(as) tratados(as) en comparación a los no tratados(as).
c) Respecto a la comparación con los resultados en i), vemos que la estimación del efecto causal
se reduce al incluir covariables, lo que indicarı́a que, en la estimación de la parte i), habı́an
factores externos que no estaban siendo controlados para estimar DD.
Finalmente, también podemos comparar la estimación de la estrategia de Dif-in-Dif con la esti-
mación del ideal experimental. Podemos notar que estas no son iguales, sin embargo vale destacar
que estas estimaciones se obtienen sobre contextos diferentes:
• Dif-in-Dif comparó familias tratadas y no tratadas de municipios donde se encontró cobre
respecto de los que no. Por otro lado, la estimación experimental comparó familias tratadas
y no tratadas de los municipios de Chile.
• La estimación Dif-in-Dif considera, además del cambio entre grupo tratamiento y control,
un cambio temporal, lo que supone la existencia de datos panel. El estudio de experimentos
realizado en la primera parte del ramo, supone datos de corte transversal (un momento en
el tiempo), por lo que hay una diferencia sistemática en la estimación del efecto causal.
¿Cuál es la mejor estimación? Depende! ¿De qué? Investigue.

10

Potrebbero piacerti anche