Pauta Auxiliar 6

Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile
IN4402 Aplicaciones de Probabilidades y Estadı́stica en Gestión

Profesor: Andrés Fernández Vergara
Auxiliares: Magdalena Badal - Constanza Balbontı́n - Claudio Mena -
Angelo Muñoz - Valentina Palma
Año: 2019
Auxiliar 6
El Programa Hogares Felices fue aplicado a familias de bajos ingresos en los municipios de Chile. El
objetivo era mejorar la nutrición de las(os) niñas(os) menores de 10 años de bajos ingresos, a través de la
provisión de despensa a las familias seleccionadas.
Las familias se asignaron aleatoriamente a recibir grupo tratamiento y control (variable recepción D). Para
ver el impacto de este programa, investigadores midieron los resultados con la estatura estandarizada de
quienes recibı́an el programa (variable AN), además contaban con información de si el(la) menor era niño(a)
(NIÑO), si era de raza baja (RAZA), si el jefe de hogar trabajaba (OCUP) y sus ingresos (ING), los años
de educación del jefe de hogar (EDUC) y del numero de personas que vivı́a en el hogar de la familia (N).
En lo que sigue usted analizará los resultados que obtuvieron los investigadores usando dos estudios ob-
servacionales: Variables Instrumentales y Dif-in-Dif. Con esto usted puede hacer la comparación del
impacto que entregan estas herramientas respecto del impacto que tuvo el programa en estudios previos
experimentales, los cuales reflejaron que los niños(as) que recibı́an el programa tenı́an una estatura de 0.23
desviaciones estándares por encima de la media mayor que los niños que no participaron en el programa.
P1. [Variables Instrumentales] Para combatir el problema de incumplimiento unilateral de las familias
tratadas, los investigadores tenı́an dos instrumentos para estimar el efecto del programa. El primero
era la distancia de los hogares a las oficinas de inscripción del programa (DIST) y el segundo era el
número de oficinas disponible para inscribirse al programa por municipio (OF).
i) Observe los modelos (4) y (5) de la Tabla 3, ¿Que ocurre con la estimación OLS del efecto del
tratamiento?. Compare esta situación respecto al experimento ideal.
ii) Observe los modelos (1) y (2) de la Tabla 3 y vea si se cumple el supuesto de relevancia para
ambos instrumentos. ¿Por qué es tan importante no tener instrumentos débiles?
iii) Observe ahora los modelos (6) y (7), ¿Qué puede concluir respecto al efecto del programa cuando
se usa 2SLS para cada instrumento por separado?
iv) Observe el modelo (3) de la Tabla 3 y vea si se cumple el supuesto de relevancia para ambos
instrumentos en conjunto. ¿Cambian los supuestos en la estrategia IV en este nuevo escenario?
v) Observe el modelo (8) de la Tabla 3. ¿Mejora la estimación de βIV,D en esta nueva situación?
vi) ¿Son DIST y OF instrumentos válidos para poder estimar el efecto del programa?. Para esto
considere:
• ¿DIST y OF están relacionados con variables variables omitidas que afectan la altura de
niños(as)?
• ¿Qué pasa con las caracterı́sticas de los municipios?
vii) Proponga otro instrumento para estimar el efecto del programa.
1
P2. [Dif-in-Dif ] En algunos municipios del paı́s encontraron cobre y esto incrementó las regalı́as e ingresos
de esos municipios. El gobierno de Chile decidió implementar el programa en estos municipios. Por lo
que ahora se comparan los resultados nutricionales de los niñas(os) en municipios en donde encontraron
cobre y donde no encontraron cobre.
i) En la tabla 4 se muestra la comparativa sobre el promedio de estatura estandarizada por grupo
antes y después de la implementación del programa. Compare las estaturas por grupo, antes y
después de la implementación del programa utilizando una perspectiva de Diferencia en Diferencias
(DD). ¿Cuáles son los peligros potenciales de este análisis?
ii) Para testear los resultados anteriores, se quiere realiza un modelo de regresión para evaluar me-
diante diferencias en diferencias (DD) el efecto la implementación del programa.
a) Escriba la especificación que permita

obtener los resultados de la tabla 5.
b) Interprete los resultados de la tabla.
c) ¿Qué conclusión puede obtener a
partir de estos resultados en
comparación con i)?
2
P1. Solución:
i) El modelo (4) muestra la estimación del modelo:
ANi = β0 + β1 Di + ui
y el modelo (5):
ANi = β0 + β1 Di + β2 Ni + β3 N I Ñ Oi + β4 OCU Pi + β5 EDU Ci + β6 IN Gi + ui
En ambos modelos se muestra la estimación del efecto de tratamiento del programa hogares felices
sobre los niños(as) de Chile, reunido en β1 . El primer modelo sin variables de control muestra que
la estimación del efecto de tratamiento es de 0.248 desviaciones estándares por encima de la media
mayor, para los niños(as) tratados(as) en comparación a los no tratados(as). Al incluir variables
de control, esta estimación disminuye levemente a 0.247 desviaciones estándares por encima de la
media mayor, para los niños(as) tratados(as) en comparación a los no tratados(as). Si se compara
estas estimaciones con la obtenida en estudios previos experimentales, se puede apreciar un sesgo
debido al incumplimiento unilateral de familias tratadas u otra fuente de endogeneidad, de 0.012
desviaciones estándares. Por lo tanto, la estimación de β̂1 esta sobrestimada en ambos modelos.
ii) Antes de responder la pregunta quisiera hacer un repaso breve de manera general (aún no aplicado
al contexto del problema). Aplicar variables instrumentales tiene sus requisitos. Si se tiene una
variable endógena X, un instrumento Z y una variable resultado Y . Para estimar el efecto de X
sobre Y en el modelo (sin variables de control):
Yi = α0 + α1 Xi + ui
Z debe cumplir:
• Relevancia: Cov(Xi , Zi ) 6= 0
• Exogeneidad: Cov(ui , Zi ) = 0
El supuesto de relevancia indica que Z debe guardar relación (ser relevante) con la variable
endógena X. El supuesto de endogeneidad indica que el instrumento Z no debe relacionarse
con ningún otro factor observable o no observable en u que explique a Y , aparte de la variable
endógena X. Bajo estos supuestos se puede estimar un efecto local de X (solo la parte exógena)
sobre Y mediante 2SLS:
• First Stage:
X̂i = π̂0 + π̂1 Zi + v̂i
• Second Stage:
Yi = α0 + α1 X̂i + ui
Donde el efecto buscado se reunirı́a en α̂1 . Uno de los precios que se paga al estimar el
efecto causal con 2SLS, es que el error estándar de α̂1 , se(α̂1 ), es más grande que
si solo se hubiera estimado el efecto causal con OLS (como se hizo en el apartado
anterior).
Al incluir un conjunto de variables de control exógenas W = {C1 , C2 , ...} que también explican
Y en la estrategia de variables instrumentales, las cosas se modifican:
X
Yi = α0 + α1 Xi + αj Cj,i + ui
j∈W
Los supuestos también se modifican:
3
• Relevancia: Cov(Xi , Zi |W ) 6= 0
• Exogeneidad: Cov(ui , Zi |W ) = 0
Ahora ambos supuestos son condicionados en nueva información que explique Y . La razón recae
en que cuando incluimos variables de control a una regresión las estimaciones empiezan a depender
de la variación que todas las variables independientes en conjunto pueden aportar para explicar
la variable Y y de la correlación que tienen estas entre sı́ (compiten por explicar a Y ). Ası́, ¿Que
ocurrirı́a si descubrimos que Cov(X, Z|C1 ) = 0?, la condición de relevancia se desactiva para una
covariable particular, es por esto que se exige el condicionamiento en variables de control (todas).
Una idea similar explica el porque debemos condicionar también en la exogeneidad. Con esto el
procedimiento 2SLS queda en:
• First Stage: X
X̂i = π̂0 + π̂1 Zi + π̂j Cj,i + v̂i
j∈W
• Second Stage: X
Yi = α0 + α1 X̂i + αj Cj,i + ui
j∈W
Donde el efecto buscado se reunirı́a en α̂1 . Al incluir variables de control, la estimación

de α̂1 es más eficiente.
¿Por qué incluimos las variables de control en ambos escenarios?. Las incluimos en el First Stage
porque son exógenas y, por lo tanto, excluirlas conducirı́a a una pérdida de eficiencia o consisten-
cia (muy probablemente ambas) del estimador causal en el Second Stage. En otras palabras, el
propósito del First Stage es dividir X, donde X̂ es la parte de X que puede asociarse únicamente
con movimientos exógenos (es decir, cambios en Z y W ). Si X y W están correlacionadas en
absoluto, no incluir W darı́a como resultado una gran pérdida de información ya que los valores
ajustados resultantes (X̂) no reflejarı́an todo el movimiento exógeno en X.
W se incluye en la segunda etapa para evitar el sesgo variables omitidas en las estimaciones
del coeficiente 2SLS. X̂ está casi seguramente correlacionado con W y, por lo tanto, si W tiene
algún efecto sobre Y , dejarlo fuera de la regresión dará como resultado estimaciones sesgadas del
efecto causal.
Quisiera terminar el repaso agregando la importancia de que las variables contenidas en W sean
exógenas, puesto que de no ser ası́ la endogeneidad latente en ellas se traspasarı́a al Second Stage,
haciendo las estimaciones del efecto causal sesgadas.
Ahora, aterricemos esto al contexto de la pregunta. De acuerdo con el apartado anterior, nuestra
variable endógena es Xi = Di , los instrumentos que tenemos son dos Z1i = DISTi y Z2i = OFi ,
tenemos un conjunto de variables Wi = {Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi } (supondremos
exógenas) y la variable resultado Y = ANi . En este caso debemos pedir que:
• Relevancia: Cov(Di , Zi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) 6= 0
• Exogeneidad: Cov(ui , Zi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) = 0
Los modelos (1) y (2) muestran las estimaciones del First Stage usando los instrumentos por
separado.
4
• En el modelo (1) vemos que se cumple el supuesto de relevancia. Una forma de ver esto es
observar que la variable DIST es significativa al 5% para explicar D, notando que por cada
metro de distancia adicional hacia las oficinas de inscripción del programa, la probabilidad
de ser tratado disminuye en 0.004%.
• En el modelo (2) vemos que se cumple el supuesto de relevancia también. Se observa sig-
nificancia en el instrumento OF al explicar D, notando que por cada oficina adicional de
inscripción al programa en el municipio donde vive la familia, la probabilidad de ser tratada
aumenta en un 3.3%.
Ahora bien, anteriormente cuando se habló del supuesto de relevancia, nunca se mencionó que
TAN relevante deberı́a ser el instrumento para explicar la variable endógena en el First Stage.
Esto es un punto muy importante para no caer en el problema de instrumentos
débiles. Un instrumento es débil si:
Cov(D, Z) ≈ 0
Es decir, donde el grado de relación (medido por la covarianza) es casi nulo (el caso extremo es si
es nulo). ¿Cuáles son las consecuencias si esto ocurre?
• El estimador del efecto causal en el Second Stage es sesgado e inconsistente para muestras
pequeñas, incluso podrı́a darse para muestras grandes.
• Si además el instrumentó no es exógeno, el sesgo comentado anteriormente se exacerba.
• La varianza del estimador del efecto causal aumenta en el Second Stage.
Por lo tanto, aterrizando esto al problema deberı́amos evaluar si DIST y OF presentan la sufi-
ciente relevancia para explicar D. Por ahora, notemos que sus coeficientes son bastante distintos,
siendo aparentemente muy relevante OF y no tanto DIST .
iii) Los modelos (6) y (7) presentan el Second Stage de los modelos (1) y (2) estudiados en el apartado
anterior, respectivamente.
• En el modelo (6) la estimación del efecto del programa es de 0.143 desviaciones estándares
por encima de la media mayor, para los niños(as) tratados(as) en comparación a los no
tratados(as). Sin embargo, esta estimación no es significativa al 5%. Esto último es sospe-
choso puesto que la estimación del coeficiente por 2SLS no logra acercarse a la estimación
experimental (0.23), por lo tanto esta sesgada (subestimada). Además existe una inflación
del error estándar en comparación con el modelo OLS (5), que provoca que la estimación
no sea significativa. La causa es justamente que DIST es un instrumento débil, esto pudo
notarse en el primer escenario cuando se estimó su relevancia respecto de D, además de que
posiblemente podrı́a no ser exógeno. La combinación de estas dos cosas produce el gran sesgo
e inflación del error estándar del estimador del efecto causal.
• En el modelo (7) la estimación del efecto del programa es de 0.23 desviaciones estándares
por encima de la media mayor, para los niños(as) tratados(as) en comparación a los no
tratados(as). Esta estimación es significativa al 5%. Ası́ se alcanza la estimación experimental
del efecto causal (0.23), por lo que OF serı́a un buen instrumento. Cabe notar que el precio
que se pagó por esta estimación fue una alza de su error estándar en comparación a la
estimación OLS del modelo (5).
iv) En el repaso anterior y los apartados anteriores, estudiamos la estrategia de variables instru-
mentales que consideraba un instrumento. ¿Qué pasa si utilizamos más de un instrumento para
estimar el efecto causal?. Los supuestos cambian al considerar instrumentos en conjunto:
5
• Relevancia: Cov(Di , Zli |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) 6= 0, l ∈ {1, 2}

• Exogeneidad: Cov(ui , Zli |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) = 0, l ∈ {1, 2}
El procedimiento 2SLS serı́a:
• First Stage: X
D̂i = π̂0 + π̂1 DISTi + π̂2 OFi + π̂j Cj,i + v̂i
j∈W
• Second Stage: X
Yi = α0 + α1 D̂i + αj Cj,i + ui
j∈W
Donde el efecto buscado se reunirı́a en α̂1 . Al incluir más instrumentos, si estos

cumplen los requisitos, es posible obtener una mayor variación de la parte exógena
de D, por lo que la estimación de α̂1 es más eficiente.
Ası́ el modelo (3) nos mostrarı́a la relevancia al considerar los dos instrumentos en conjunto.
Una forma simplificada de ver esto es observar la significancia de los coeficientes respectivos del
instrumento por separado. Sin embargo para ver efectivamente si ambos instrumentos en conjunto
son relevantes, se debe aplicar un test de modelo restringido F. Donde se examina la hipótesis:
H0 : π 1 = 0 ∧ π 2 = 0
H1 : π1 6= 0 ∧ π2 6= 0
si el estadı́stico F de este test es mayor a 10, entonces ambos instrumentos son relevantes.
Obs: El test pueden encontrarlo con más detalles en mis apuntes.
v) El modelo (8) muestra el Second Stage de la situación descrita en el apartado anterior. Observamos
que el efecto está sobrestimado. Lo que se observa en esta estimación es un juego de compensación
entre lo que produce el instrumento bueno OF y el instrumento malo DIST . Lo importante de
este apartado es que si se utilizan muchos instrumentos, deben cumplir los requisitos de variables
instrumentales para que la estimación del efecto causal no se distorsione, pues basta que uno de
los instrumentos no los cumpla (como es el caso aparente de DIST) para que las conclusiones sean
erróneas.
vi) Un instrumento es válido si cumple la relevancia y exogeneidad. Aparentemente OF si es un
buen instrumento para estimar el efecto causal del programa, por lo que solo nos centraremos en
decir por qué DIST no lo es. Para esto recordemos que debemos estudiar los supuestos que hemos
aplicado en las preguntas anteriores:
1) Relevancia: Cov(Di , DISTi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) 6= 0
2) Exogeneidad: Cov(ui , DISTi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) = 0
Recuerde además que la covarianza representa:
• Cov(Di , DISTi ) > 0 hay dependencia o relación directa (positiva), es decir, a grandes valores
de X corresponden grandes valores de Y.
• Cov(Di , DISTi ) < 0 hay dependencia o relación directa (negativa), es decir, a grandes valores
de X corresponden pequeños valores de Y.
• Cov(Di , DISTi ) = 0 no hay una relación clara ni directa.
6
En el caso de la relevancia (1), la estimación del First Stage estudiada en ii), si bien es cierto
existe significancia estadı́stica, la significancia práctica (la magnitud) es muy baja. Esto indicarı́a
Cov(Di , DISTi |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) ≈ 0 y que por lo tanto, estarı́amos en pres-
encia de un instrumento débil. Ahora bien, podrı́amos hacer un análisis (cuestionable o no) más
profundo al analizar el supuesto por covariable (los siguientes son ejemplos):
• ¿Se cumplirı́a Cov(Di , DISTi |Ni ) 6= 0? Podrı́a ser que familias numerosas tengan hogares en
la periferia o en el centro de los municipios, teniendo más o menos distancia hacia las oficinas
gubernamentales de inscripción, puesto que estas se instalan (generalmente) en el centro de
un municipio o donde se aglomera más gente. En este sentido, la relación entre inscribirse
(tratarse) (D) y la distancia del hogar a la oficina (DIST ) no es clara y no apunta en una
dirección especı́fica, por lo que Cov(Di , DISTi |Ni ) ≈ 0.
• ¿Se cumplirı́a Cov(Di , DISTi |Ni , OCU Pi ) 6= 0? Es esperable para familias poco numerosas,
digamos un adulto(a) y un niño(a), donde el primero trabaje, haya menos posibilidades de
que se acerque a las oficinas de inscripción si esta está muy lejana (porque está ocupado
trabajando), sin embargo también puede que para ese tipo de adulto sea muy necesario
inscribirse para recibir despensas aún cuando la oficina este distante (por necesidad), por lo
que nuevamente el supuesto de relevancia se ve afectado (no hay una relación clara entre las
variables), Cov(Di , DISTi |Ni , OCU Pi ) ≈ 0?
• Piense otros casos.
En el caso de la exogeneidad (2) también podemos hacer el mismo análisis:
• ¿Cov(ui , DISTi |IN Gi ) = 0? Es posible que haya factores relacionados entre ui y DISTi al
considerar el ingreso del jefe de hogar, como por ejemplo, las caracterı́sticas del municipio
donde la familia reside. Un municipio más grande (en superficie m2 ) puede producir largos
trayectos entre la residencia y la oficina de inscripción que deben costearse con el ingreso, lo
que determinarı́a si la familia se inscribe al programa o no. De esta manera existe la relación
ui ←→ DISTi que además se relaciona con Di y que finalmente impacta en la estatura de
niños(as). Este simple factor externo (superficie en m2 ) que vive en ui y que no se controló
en los modelos estudiados, puede causar que la exogeneidad del instrumento no se cumpla.
• Intente analizar otros links de relación entre ui y DISTi considerando las variables de control.
Considere factores externos como: las condiciones de movilidad en el municipio, la genética
en los niños(as),etc.
vii) Conversamos en la clase auxiliar que elegir un instrumento válido (que cumple relevancia y exo-
geneidad) es difı́cil, pues basta pensar un poco para desacreditarlo con el supuesto de exogeneidad
(el supuesto de relevancia es más fácil que se cumpla). Entonces, ¿Que haremos? Pensar en vari-
ables que están hechas para cumplir la exogeneidad como por ejemplo una variable asignada
aleatoriamente que sea relevante para la variable endógena D. Dada la información del enun-
ciado, se dice que el tratamiento fue asignado aleatoriamente para la recepción (D) de las
familias. Justamente la variable asignación (llamemos ASIG) es la mejor candidata a ser variable
instrumental puesto que:
• Es relevante: las familias que recepcionaron el tratamiento es porque fueron asignadas para
recibirlo Cov(Di , ASIGi ) 6= 0 (recuerde que esto es un caso de One Sided NonCompliance).
• Es exógeno: al ser una variable asignada aleatoriamente cumple Cov(ui , ASIGi ) = 0 pues
esta balanceada con factores externos observables y no observables.
7
P2. Solución:
i) Como se ha visto en clase, la estrategia de Dif-in-Dif puede ser una solución para estimar el efecto
causal si:
• Existe un evento fortuito (como el hallazgo del cobre en los municipios) o arbitrario (el gob-
ierno implementa un ley o mandato) que determina el mecanismo de asignación a tratamiento
y control. Esta asignación no tiene por qué ser completamente aleatoria. En el mejor caso
la asignación del evento es equivalente a una asignación aleatoria estudiada anteriormente
en el curso y las técnicas que se aplican son las mismas. En el caso en que el evento pro-
duce una asignación parcialmente aleatoria, se debe considerar incluir variables de control
a la estimación del efecto causal, de manera de controlar por los posibles desbalances de la
asignación en factores observables y no observables.
• Existe información (datos) antes y después de la aplicación del tratamiento.
El estimador de diferencias en diferencias (DD) del efecto causal del programa es:
DD = (Y T,1 − Y T,0 ) − (Y C,1 − Y C,0 )
donde Y i,t es el promedio del resultado del grupo i ∈ {T ratamiento(T ), Control(C)} en el tiempo
t ∈ {pretratamiento(t = 0), postratamiento(t = 1)}. ¿Parece simple la estimación del efecto
causal? Pues no lo es, detrás del estimador DD está el supuesto de tendencia paralela entre
los grupos tratamiento y control en su evolución antes-después.
¿Qué significa el supuesto? Estipula que la tendencia que se observa en la variable resultado
(Y) para el grupo control es igual a la tendencia que se habrı́a observado en el grupo tratamiento,
si no hubiera recibido el tratamiento. Es decir, que de no haber recibido el tratamiento, la variable
resultado (Y) en el grupo tratamiento cambiarı́a a la misma tasa de crecimiento que la variable
resultado en el grupo control. Gráficamente:
Este supuesto garantiza que los grupos tratamiento y control sean comparables antes y después
para poder estimar el efecto causal. Es decir, no hay factores variantes en el tiempo, ni diferencias
8
entre los grupos que afecten la variable resultado (Y) aparte del programa. Cabe notar que este
supuesto es fuerte, puesto que hay un sin numero de factores que podrı́an variar en el tiempo y
que produzcan diferencias entre los grupos. Por lo que este supuesto se hace más admisible si:
• Teniendo datos incluso antes del periodo pretratamiento (digamos un t = −1 o antes de
t = 0), se observa en ellos que las tendencias son paralelas para las variables resultados (Y)
de los grupos. Esto apoya (no garantiza) el supuesto de tendencia paralela, puesto que si
incluso antes del pretratamiento los grupos tratamiento y control son comparables, en el
corto plazo posterior deberı́an serlo.
• Se incluyen variables de control que reúnan diferencias en el tiempo y diferencias entre grupos.
Aterricemos esto al contexto del problema y del apartado. En la tabla 4 se muestra los promedios
de la variable resultado (Y=AN) para los grupos tratamiento y control, antes y después. El
estimador del efecto causal DD es:
DD = (−0.279 − (−0.679)) − (−0.581 − (−0.779)) = (−0.279 + 0.679) − (−0.581 + 0.779) = 0.202
Por lo que el efecto causal del programa estimado es de 0.202 desviaciones estándares por encima
de la media mayor, para los niños(as) tratados(as) en comparación a los no tratados(as). Cabe
recalcar que esta estimación ignora factores variantes en el tiempo que produzcan diferencias en
los grupos (ingreso de las familias, condiciones socioeconomicas de los municipios, etc), por lo
que la estimación podrı́a estar sesgada. Este es el peligro potencial que podrı́a sufrir la simple
estimación DD que se realiza en este apartado.
ii) Para incluir variables de control que reúnan diferencias variantes en el tiempo en la estimación de
DD se plantea un modelo de regresión lineal. Tenemos la variable tratamiento Di (1 tratamiento,
0 control), la variable dummy temporal Tt (1 después, 0 antes), un conjunto de covariables Wit =
{Nit , N I Ñ Oit , OCU Pit , EDU Cit , IN Git } (supondremos exógenas) y la variable resultado ANit
a) El modelo para estimar el efecto causal mediante la estrategia Dif-in-Dif es:
X
ANit = β0 + β1 Di + β2 Tt + β3 Di ∗ Tt + βj Cj,it + ui
j∈W
El efecto causal se reúne en β3 . ¿Por qué?, si tratamos de obtener el estimador DD con este
modelo lineal, entonces:
X
(1) E[AN |D = 1, T = 1, W (constante)] = β0 + β1 + β2 + β3 + βj Cj,it
j∈W
X
(2) E[AN |D = 0, T = 1, W (constante)] = β0 + β2 + βj Cj,it
j∈W
X
(3) E[AN |D = 1, T = 0, W (constante)] = β0 + β1 + βj Cj,it
j∈W
X
(4) E[AN |D = 0, T = 0, W (constante)] = β0 + βj Cj,it
j∈W
Restando (1) y (3), restamos el caso antes-después del grupo tratamiento (primera diferencia
para tratados):
A = E[AN |D = 1, T = 1, W (constante)] − E[AN |D = 1, T = 0, W (constante)] = β2 + β3
9
Restando (2) y (4), restamos el caso antes-después del grupo control (primera diferencia para
controles):
B = E[AN |D = 0, T = 1, W (constante)] − E[AN |D = 0, T = 0, W (constante)] = β2
Luego restando (A)-(B) obtenemos la segunda diferencia (diferencias en diferencias):
A − B = β3
Ası́ se encuentra el mismo estimador DD establecido en la parte i) de la pregunta, pero lo

diferente es que este nuevo estimador es controlado por diferencias variantes en el tiempo y
entre grupos con las covariables en W .
b) Lo que vemos en la tabla es la estimación del modelo planteado anteriormente, cuando se
agregan sucesivamente las variables de control en W . Vemos que la estimación del efecto
causal del programa es de 0.181 desviaciones estándares por encima de la media mayor, para
los niños(as) tratados(as) en comparación a los no tratados(as).
c) Respecto a la comparación con los resultados en i), vemos que la estimación del efecto causal
se reduce al incluir covariables, lo que indicarı́a que, en la estimación de la parte i), habı́an
factores externos que no estaban siendo controlados para estimar DD.
Finalmente, también podemos comparar la estimación de la estrategia de Dif-in-Dif con la esti-
mación del ideal experimental. Podemos notar que estas no son iguales, sin embargo vale destacar
que estas estimaciones se obtienen sobre contextos diferentes:
• Dif-in-Dif comparó familias tratadas y no tratadas de municipios donde se encontró cobre
respecto de los que no. Por otro lado, la estimación experimental comparó familias tratadas
y no tratadas de los municipios de Chile.
• La estimación Dif-in-Dif considera, además del cambio entre grupo tratamiento y control,
un cambio temporal, lo que supone la existencia de datos panel. El estudio de experimentos
realizado en la primera parte del ramo, supone datos de corte transversal (un momento en
el tiempo), por lo que hay una diferencia sistemática en la estimación del efecto causal.
¿Cuál es la mejor estimación? Depende! ¿De qué? Investigue.
10

Pauta Auxiliar 6

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Pauta Auxiliar 6

Caricato da

Copyright:

Formati disponibili

Facultad de Ciencias Fı́sicas y Matemáticas Universidad de Chile

IN4402 Aplicaciones de Probabilidades y Estadı́stica en Gestión

a) Escriba la especificación que permita

Los supuestos también se modifican:

Donde el efecto buscado se reunirı́a en α̂1 . Al incluir variables de control, la estimación

• Relevancia: Cov(Di , Zli |Ni , N I Ñ Oi , OCU Pi , EDU Ci , IN Gi ) 6= 0, l ∈ {1, 2}

Donde el efecto buscado se reunirı́a en α̂1 . Al incluir más instrumentos, si estos

DD = (Y T,1 − Y T,0 ) − (Y C,1 − Y C,0 )

DD = (−0.279 − (−0.679)) − (−0.581 − (−0.779)) = (−0.279 + 0.679) − (−0.581 + 0.779) = 0.202

A = E[AN |D = 1, T = 1, W (constante)] − E[AN |D = 1, T = 0, W (constante)] = β2 + β3

B = E[AN |D = 0, T = 1, W (constante)] − E[AN |D = 0, T = 0, W (constante)] = β2

Luego restando (A)-(B) obtenemos la segunda diferencia (diferencias en diferencias):

Ası́ se encuentra el mismo estimador DD establecido en la parte i) de la pregunta, pero lo

Potrebbero piacerti anche