Sei sulla pagina 1di 3

Universidad Carlos III de Madrid

Econometría
Regresión Lineal Múltiple: Estimación II
Hoja de Ejercicios 5

1. (Yi ; X1i ; X2i ) satisfacen los supuestos del modelo de regresión múltiple RLM.1-RLM.4. Se tiene interés en 1 ;
el efecto causal de X1 sobre Y: Supóngase que X1 y X2 no están correlacionadas. Se estima 1 mediante la
regresión de Y sobre X1 (por lo que X2 no está incluida en la regresión). ¿Presenta este estimador un sesgo
por variable omitida? Explique su respuesta.
2. (Yi ; X1i ; X2i ) satisfacen los supuestos del modelo de regresión múltiple RLM.1-RLM.4. Además V ar (Ui jX1i ; X2i ) =
4; y V ar (X1i ) = 6: Se extrae una muestra aleatoria de tamaño n = 400 de la población.

(a) Supóngase que X1 y X2 no están correlacionadas. Calcule la varianza aproximada de ^ 1 :


(b) Supóngase que Corr(X1 ,X2 ) = 0; 5. Calcule la varianza aproximada de ^ : 1

(c) Comente las siguientes a…rmaciones: "Si X1 y X2 están correlacionadas, la varianza de ^ 1 es mayor de lo
que sería si X1 y X2 no estuvieran correlacionadas. Por lo tanto, si interesa 1 ; es mejor dejar fuera de la
regresión a X2 si está correlacionada con X1 :"

3. Considérese el modelo de regresión


Yi = 1 X1i + 2 X2i + Ui ;
para i = 1; : : : ; n: (Téngase en cuenta que NO existe término constante en la regresión).

(a) Especi…que la función de mínimos cuadrados que se minimiza por MCO.


(b) Obtenga las condiciones de primer orden de minimización:
Pn Pn Pn
(c) Supónga que i=1 X1i X2i = 0: Demuestre que ^ 1 = i=1 X1i Yi = i=1 X1i 2
:
Pn
(d) Supónga que i=1 X1i X2i 6= 0: Obtenga una expresión para ^ 1 como función de los datos (Yi ; X1i ; X2i ) ;
i = 1; : : : ; n:
(e) Supónga que el modelo incluye un término constante: Yi = 0 + 1 X1i + 2 X2i + Ui : Demuestre que los
estimadores MCO cumplen que ^ 0 = Y ^ X1 ^ X2 :
1 2
Pn
(f) Supónga que el modelo incluye un término constante como en (e) y que además i=1 X1i X1 X2i X2 =
0: Demuestre que Pn
^ = i=1 X1i X1 Yi Y
1 Pn 2 :
i=1 X1i X1
Compare con el estimador MCO de 1 de la regresión en la que se omite X2 .

4. Con la base de datos CollegeDistance utilizada en la hoja de ejercicios 2, realice los siguientes ejercicios:

(a) Realice una regresión de la variable años de educación completados (ED) sobre la variable de la distancia
a la universidad más cercana (Dist) ¿Cuál es la pendiente estimada?
(b) Realice una regresión de la variable ED sobre la variable Dist; pero incluyendo algunos regresores adi-
cionales de control sobre las características del estudiante, la familia del estudiante y el mercado laboral
local. En concreto, incluyendo como regresores adicionales las variables Bytest; F emale; Black; Hispanic;
Incomehi; Ownhome, DadColl; Cue80; y Stwmf g80: ¿Cuál es el efecto estimado de la variable Dist sobre
la variable ED?
(c) ¿Es sustancialmente distinto el efecto estimado de la variable Dist sobre la variable ED en la regresión
de (b) de la regresión en (a)? En base a esto, ¿parece que la regresión (a) presenta un sesgo de variable
omitida importante?
(d) Compare el ajuste de la regresión de (a) y de (b) utilizando los errores estándar de regresión, R2 y R2 :
¿Por qué R2 y R2 son tan similares en la regresión (b)?
(e) El valor del coe…ciente de la variable DadColl es positivo. ¿Qué mide este coe…ciente?

1
(f) Explique por qué las variables Cue80 y Swmf g80 aparecen en la regresión. ¿Cuáles cree que son los
signos de sus coe…cientes estimados (+ ó -)? Interprete la magnitud de esos coe…cientes.
(g) Bob es un hombre negro. Su escuela secundaria estaba a 20 millas de la universidad más cercana. Su
cali…cación en la prueba (Bytest) fue de 58. Su renta familiar en 1980 fue de 26.000$ y su familia poseía
una casa. Su madre acudió a la universidad, pero su padre no. La tasa de desempleo en su condado era
del 7,5% y el promedio del salario por hora manufacturero en su estado era de 9,74$. Estime el número
de años completados de estudio por Bob utilizando la regresión de (b) :
(h) Jim tiene las mismas características de Bob, salvo que su escuela secundaria estaba a 40 millas de la
universidad más cercana. Estime los años completados de estudio de Jim usando la regresión de (b) :

5. Un investigador planea estudiar el efecto causal de la policía sobre el crimen a partir de los datos de una
muestra aleatoria de condados de los EE.UU. Se plantea realizar una regresión de la tasa de criminalidad del
condado sobre el tamaño (per capita) del cuerpo de policía del condado

(a) Explique por qué esta regresión probablemente presente sesgo de variable omitida. ¿Qué variables añadiría
a la regresión para controlar por las variables omitidas importantes?
(b) Utilice su respuesta en (a) y la expresión del sesgo de variable omitida para determinar si la regresión
probablemente sobre o subestime el efecto de la policía sobre la tasa de criminalidad. (Es decir, ¿piensa
que ^ > 1 o que ^ < ?)
1 1 1

6. Este problema ilustra la diferencia entre una relación causal y una relación lineal (correlación) y el sesgo por
mala especi…cación. Dadas dos variables Y y X; sabemos que

E ( Y j X) = 0 + 1 log X;

donde 0 y 1 son dos parámetros desconocidos. Sabemos que 1 6= 0: Sin embargo ajustamos el siguiente
modelo de regresión por MCO
Y = 0 + 1 X + "; (1)
donde 0 = 0 y 1 son dos parámetros desconocidos y sabemos que el término de error " satisface E (") =
E ("X) = 0:

(a) Establezca la relación entre 1 y 1:


(b) Establezca la relación del estimador de MCO de 1 en el modelo (1) y el estimador MCO de 1 en el
modelo
Y = 0+ 1 log X + U;
donde U es un término de error.

SOLUCIONES:
4. (a) -0,073
(b) -0.032
(c) El coe…ciente se ha reducido en más del 50%. Por lo tanto, parece que el resultado en (a) está afectado por
un sesgo de variable omitida.
(d) La regresión en (b) se ajusta mucho mejor a los datos como lo indican R2 y R2 y SER. R2 y R2 son similares
porque el número de observaciones es grande (n = 3796).
(e) Los estudiantes con "dadcoll = 1" (de modo que el padre del estudiante fue a la universidad) completan
0,696 años más de educación, en promedio, que los estudiantes con "dadcoll = 0" (de modo que el padre del
estudiante no fue a la universidad ).
(f) Estos términos capturan el coste de oportunidad de asistir a la universidad. Según ST W M F G, el salario
por hora estatal de 1980 en la industria manufacturera, aumenta, los salarios perdidos aumentan, de modo
que, en promedio, la asistencia a la universidad disminuye. El signo negativo del coe…ciente concuerda con
esta interpretación. A medida que aumenta CU E80, la tasa de desempleo del condado, es más difícil encontrar
un trabajo, lo que reduce el coste de oportunidad de asistir a la universidad, por lo que la asistencia a la
universidad aumenta. El signo positivo del coe…ciente concuerda con esto.

2
(g) Los años de educación predichos de Bob son 14,79.
(h) Los años de educación esperados de Jim son 0,0630 menos que los de Bob. Por lo tanto, los años de
educación esperados de Jim son 14,69.

Potrebbero piacerti anche