Sei sulla pagina 1di 9

Ingeniería Comercial

Econometría I
COM – 05223

Práctica Nº 2

2.1 Utilizando la base de datos GPA2.WF1 de 4,137 alumnos universitarios, se estimo la


ecuación siguiente de MCO:

Donde, colgpa es el promedio de calificaciones que se mide sobre una escala de cuatro
puntos, hsperc es el percentil en la clase de bachillerato que se gradua (definida de
manera que, por ejemplo, hsperc = 5 significa el 5% superior de la clase), y sat son los
puntajes combinados en matematicas y habilidades verbales en la prueba de logro de los
alumnos.
i) ¿Por qué es lógico que el coeficiente en hsperc sea negativo?
hsperc está definido de tal forma que cuanto menor es, menor será la estadía de los
estudiantes en secundaria. Manteniendo todo lo demás igual cuando peor será la estadía
de los estudiantes en secundaria, menor será su GPA esperado.

ii) ¿Cuál es el promedio de calificaciones universitario predicho cuando hsperc = 20 y sat =


1,050?
Colgpa = 1.392 – 0.0135*20 + 0.00148*1,050
Colgpa = 2,676

iii) Suponga que dos graduados de bachillerato, A y B, se gradúan en el mismo percentil


de bachillerato, pero el puntaje SAT del estudiante A es 140 puntos más alto
(aproximadamente una desviación estándar en la muestra). ¿Cuál es la diferencia
predicha en el promedio de calificaciones universitario para estos dos alumnos? ¿Es
grande la diferencia?
A = colgpa = 1.392 – 0.0135*20 + 0.00148*1190 = 2,28832

B = Colgpa = 1.392 – 0.0135*20 + 0.00148*1050 = 2.676


A-B = 2.28832-2.676 = 0.2072

A tendrá una puntuación más alta en un 0.2072

iv) Manteniendo hsperc constante, ¿que diferencia en las puntuaciones SAT conduce a
una diferencia estimada colgpa de .50, o medio punto de puntuacion? Comente su
respuesta.
0.5 = 1.392 + 0.00148sat
0.5 – 1.392 = 0.00148sat
-0.892/0.00148 = sat
602.70 = -sat
Manteniendo hsperc constante con una diferencia de 602.70 en sat conduce a una
diferencia estimada de medio punto en colgpa.
KENEDY PAZ FARFAN
INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
2.3 El siguiente modelo es una version simplificada del modelo de regresión múltiple
utilizado por Biddle y Hamermesh (1990) para estudiar el intercambio entre tiempo
dedicado al sueño y dedicado al trabajo, asi como ver otros factores que afectan el sueño:
sleep = β0 + β1totwrk + β2educ + β3age + u,
donde sleep y totwrk (trabajo total) se miden en minutos por semana y educ y age se
miden en años.
i) Si los adultos intercambian sueño por trabajo, ¿cuál es el signo de β1?

El signo de β1 en este caso sería negativo.

ii) ¿Qué signos cree que tendran β2 y β3?


β2 tendrá signo negativo
β3 tendrá signo positivo
iii) Utilizando los datos del archivo SLEEP75.WF1, la ecuación estimada es
sleep = 3,638.25 + .148 totwrk + 11.13 educ + 2.20 age
n = 706, R2 = .113.
Dependent Variable: SLEEP
Method: Least Squares
Date: 03/13/16 Time: 16:38
Sample: 1 706
Included observations: 706

Variable Coefficient Std. Error t-Statistic Prob.

C 3638.245 112.2751 32.40474 0.0000


TOTWRK -0.148373 0.016694 -8.888075 0.0000
EDUC -11.13381 5.884575 -1.892034 0.0589
AGE 2.199885 1.445717 1.521657 0.1285

R-squared 0.113364 Mean dependent var 3266.356


Adjusted R-squared 0.109575 S.D. dependent var 444.4134
S.E. of regression 419.3589 Akaike info criterion 14.92098
Sum squared resid 1.23E+08 Schwarz criterion 14.94681
Log likelihood -5263.106 Hannan-Quinn criter. 14.93096
F-statistic 29.91889 Durbin-Watson stat 1.942609
Prob(F-statistic) 0.000000

Si una persona trabaja cinco horas más a la semana, ¿cuántos minutos se predice que
disminuya sleep? ¿Es este un intercambio grande?
Sleep = 0.148*300
Sleep = 44.4 minutos

iv) Analice el signo y la magnitud del coeficiente estimado para educ.


El signo de educ es negativo
v) ¿Diria que totwrk, educ y age explican gran parte de la variación en sleep? ¿Qué otros
factores podrian afectar el tiempo dedicado al sueño? ¿Es probable que esten
correlacionados con totwrk?

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
2.5 En un estudio que relaciona el promedio de puntaje en las calificaciones universitarias
con el tiempo utilizado en diversas actividades, usted distribuye una encuesta entre
varios alumnos. A los alumnos se les pregunta cuantas horas utilizan a la semana en
cuatro actividades: estudiar, dormir, trabajar y diversión. Toda actividad que realicen se
ubica en una de las cuatro categorías, de modo que para cada alumno la suma de horas
en las cuatro actividades debe ser 168.
i) En el modelo
GPA = β0 + β1study + β2sleep + β3work + β4leisure + u,
¿Tiene sentido mantener constantes sleep, work y leisure, y variar study?
No tiene sentido ya que todo su tiempo lo está utilizando en cosas que no le favorece
en sus calificaciones. En vez de estudiar más esta realizando otras actividades

ii) Explique por qué este modelo viola el supuesto de variable independiente constante y
colinealidad perfecta entre variables explicativas.
Porque todas la variables están dependiendo una de otras por el tiempo estimado y
máximo para las cuatro actividades.

iii) ¿Cómo podría reformular el modelo para que sus parámetros tuvieran una
interpretación útil y se satisfaga el supuesto anterior?

2.7 ¿Qué de lo siguiente puede causar que los estimadores MCO sean sesgados?
i) La heterocedasticidad.

ii) La omisión de una variable importante.

iii) Un coeficiente de correlación muestral de .95 entre dos variables independientes


incluidas en el modelo.
R.- la heterocedasticidad

2.9 La siguiente ecuación describe la media del precio de la vivienda en una comunidad
en términos de cantidad de contaminación (nox por oxido nitroso) y del número
promedio de habitaciones en las casas de la comunidad (rooms):
log(price) = β0 + β1log(nox) + β2rooms + u.
i) ¿Cuales son los signos probables de β1 y β2? ¿Cuál es la interpretación de β1? Explique.
B1 es Negativo porque tiene que disminuir la contaminación
B2 es positivo porque aumenta las casas de la comunidad

ii) ¿Por qué podría nox [o con mas precisión, log(nox)] y rooms estar correlacionados de
manera negativa? Si es este el caso, ¿produce la regresión simple de log(price) sobre
log(nox) un estimador de β1 con sesgo hacia arriba o hacia abajo?
porque al disminuir la contaminación de una comunidad aumenta la las casas
en la misma comunidad.

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
iii) Utilizando los datos del archivo HPRICE2.WF1, se estimaron las siguientes ecuaciones:
log(price) = 11.71 + 1.043 log(nox), n = 506, R2 = .264.
log(price) = 9.23 + .718 log(nox) + .306 rooms, n = 506, R2 = .514.

¿Las estimaciones de la elasticidad de price con respecto a nox de las regresiones simple y
múltiple tienen la relación de lo que usted hubiera predicho, dada su respuesta en el
inciso ii)? ¿Quiere esto decir que -.718 está en definitiva más cerca de la verdadera
elasticidad que -.043?

EJERCICIOS EN COMPUTADORA

2.11 Un problema de interes para los funcionarios de salud (y para otros) es determinar
los efectos que el fumar durante el embarazo tiene sobre la salud infantil. Una medida de
la salud infantil es el peso al nacer; un peso demasiado bajo puede ubicar al niño en
riesgo de contraer varias enfermedades. Ya que es probable que otros factores que
afectan el peso al nacer esten correlacionados con fumar, deben considerarse. Por
ejemplo, un nivel de ingresos más alto en general da como resultado el acceso a mejores
cuidados prenatales y a una mejor nutricion de la madre.
Una ecuacion que reconoce estos factores es:

i) ¿Cual es el signo más probable para β2?


Positivo la probabilidad de β2 > 0, significa que cuanto más aumenta el ingreso
aumentará la nutrición de las madres y tendrán acceso a un mejor cuidado prenatal.

ii) ¿Cree que cigs y faminc esten correlacionados? Explique por que la correlacion puede
ser positiva o negativa.
Por un lado, un cumento en el ingreso genrealmente aumenta el cunsumo de un bien, y
cigs y faminc podrían estar positivamente correlacionados. Por otro lado, los ingresos de
las familias son mayores también para las familias con mayor educación, y más eduación y
consumo de cigarrillos tienden a estar negativamente corelacionados. La correlación
muestral entre cigs y faminc es −.173, indicando correlación negativa.

iii) Ahora, calcule la ecuacion con y sin faminc utilizando los datos del archivo BWGHT.
WF1. De los resultados en forma de ecuacion incluyendo el tamano de la muestra y la
Rcuadrada. Explique sus resultados enfocandose en si el anadir faminc modifica de
manera sustancial el efecto esperado de cigs sobre bwght.
Dependent Variable: BWGHT
Method: Least Squares
Date: 03/14/16 Time: 00:14
Sample: 1 1388
Included observations: 1388

Variable Coefficient Std. Error t-Statistic Prob.

C 116.9741 1.048984 111.5118 0.0000


CIGS -0.463408 0.091577 -5.060315 0.0000

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
FAMINC 0.092765 0.029188 3.178195 0.0015

R-squared 0.029805 Mean dependent var 118.6996


Adjusted R-squared 0.028404 S.D. dependent var 20.35396
S.E. of regression 20.06282 Akaike info criterion 8.837772
Sum squared resid 557485.5 Schwarz criterion 8.849089
Log likelihood -6130.414 Hannan-Quinn criter. 8.842005
F-statistic 21.27392 Durbin-Watson stat 1.921690
Prob(F-statistic) 0.000000

bwght = 116.9741 -0.463408cigs + 0.092765faminc


bwght = 116.9741 -0.463408cigs
n=1388 r2=0.029805

2.13 El archivo CEOSAL2.WF1 contiene datos de 177 CEO (directores generales) y puede
utilizarse para examinar los efectos del desempeño de la empresa sobre el sueldo de los
CEO.
i) Estime un modelo que relacione el sueldo anual (salary) con las ventas de la empresa
(sales) y el precio de mercado (mktval). Use el tipo de modelo que tiene elasticidad
constante para ambas variables independientes. Escriba los resultados en forma de
ecuación.
Dependent Variable: LOG(SALARY)
Method: Least Squares
Date: 03/14/16 Time: 00:49
Sample: 1 177
Included observations: 177

Variable Coefficient Std. Error t-Statistic Prob.

C 4.620917 0.254408 18.16339 0.0000


LOG(SALES) 0.162128 0.039670 4.086899 0.0001
LOG(MKTVAL) 0.106708 0.050124 2.128881 0.0347

R-squared 0.299114 Mean dependent var 6.582848


Adjusted R-squared 0.291057 S.D. dependent var 0.606059
S.E. of regression 0.510294 Akaike info criterion 1.509146
Sum squared resid 45.30965 Schwarz criterion 1.562979
Log likelihood -130.5594 Hannan-Quinn criter. 1.530978
F-statistic 37.12853 Durbin-Watson stat 2.092115
Prob(F-statistic) 0.000000

Log(Salary) = 4.620917+0.162128log(sales) + 0.106708log(mktval) n = 177, R2=.299

ii) Añada profits (utilidades de la empresa) al modelo del inciso (i). ¿Por qué esta variable
no puede incluirse en forma logarítmica? ¿Diría usted que estas variables de desempeño
de la empresa explican la mayor parte de la variación en sueldos de los CEO?
Dependent Variable: LOG(SALARY)
Method: Least Squares
Date: 03/14/16 Time: 00:54
Sample: 1 177
Included observations: 177

Variable Coefficient Std. Error t-Statistic Prob.

C 4.686924 0.379729 12.34280 0.0000

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
LOG(SALES) 0.161368 0.039910 4.043299 0.0001
LOG(MKTVAL) 0.097529 0.063689 1.531334 0.1275
PROFITS 3.57E-05 0.000152 0.234668 0.8147

R-squared 0.299337 Mean dependent var 6.582848


Adjusted R-squared 0.287186 S.D. dependent var 0.606059
S.E. of regression 0.511686 Akaike info criterion 1.520127
Sum squared resid 45.29524 Schwarz criterion 1.591904
Log likelihood -130.5312 Hannan-Quinn criter. 1.549237
F-statistic 24.63629 Durbin-Watson stat 2.096546
Prob(F-statistic) 0.000000

log(salary)=4.69+ .161log(sales)+ .098log(mktval).000036profits, n = 177, R2=.299

iii) Añada la variable ceoten (antigüedad del CEO en el puesto) al modelo del inciso (ii).
¿Cuál es el rendimiento porcentual estimado por un año más de permanencia del CEO en
la empresa, manteniendo constantes los otros factores?
Dependent Variable: LOG(SALARY)
Method: Least Squares
Date: 03/14/16 Time: 00:53
Sample: 1 177
Included observations: 177

Variable Coefficient Std. Error t-Statistic Prob.

C 4.557780 0.380255 11.98612 0.0000


LOG(SALES) 0.162234 0.039483 4.109003 0.0001
LOG(MKTVAL) 0.101760 0.063033 1.614389 0.1083
PROFITS 2.91E-05 0.000150 0.193232 0.8470
CEOTEN 0.011685 0.005342 2.187312 0.0301

R-squared 0.318299 Mean dependent var 6.582848


Adjusted R-squared 0.302445 S.D. dependent var 0.606059
S.E. of regression 0.506179 Akaike info criterion 1.503990
Sum squared resid 44.06940 Schwarz criterion 1.593712
Log likelihood -128.1031 Hannan-Quinn criter. 1.540378
F-statistic 20.07749 Durbin-Watson stat 2.047158
Prob(F-statistic) 0.000000

log(salary)=4.56+ .162log(sales)+ .102log(mktval)+ .000029profits+ .012ceoten, n=2177,


R2=.318.
iv) Encuentre el coeficiente de correlación muestral entre las variables log(mktval) y
profits. ¿Estas variables están fuertemente correlacionadas? ¿Qué indica esto sobre los
estimadores de MCO?
correlación muestral entre log(mktval) y profits es 0.78

2.15 Confirme la interpretación de descuento de los efectos parciales de las estimaciones


de MCO, haciendo de manera explícita tal descuento para el ejemplo 3.2. del texto de
Wooldridge. Esto requiere primero regresar educ sobre exper y tenure y guardando los

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
residuales, 𝑟̂ 1. Después, regrese log(wage) sobre 𝑟̂ 1. Compare el coeficiente de 𝑟̂ 1 con el
coeficiente de educ en la regresión de log(wage) sobre educ, exper y tenure.
educ = 13.57 − .074 exper + .048 tenure + 𝑟̂ 1 ; n = 526, R2 = .101.
log(wage)=1.62 + .092 𝑟̂ 1 , n = 526, R2 = .207.

2.17 Utilice los datos del archivo MEAP93.WF1 para responder esta pregunta.
Dependent Variable: MATH10
Method: Least Squares
Date: 03/14/16 Time: 01:36
Sample: 1 408
Included observations: 408

Variable Coefficient Std. Error t-Statistic Prob.

C -20.36081 25.07287 -0.812065 0.4172


LOG(EXPEND) 6.229698 2.972634 2.095683 0.0367
LNCHPRG -0.304585 0.035357 -8.614467 0.0000

R-squared 0.179927 Mean dependent var 24.10686


Adjusted R-squared 0.175877 S.D. dependent var 10.49361
S.E. of regression 9.526228 Akaike info criterion 7.353301
Sum squared resid 36753.36 Schwarz criterion 7.382795
Log likelihood -1497.073 Hannan-Quinn criter. 7.364972
F-statistic 44.42927 Durbin-Watson stat 1.902822
Prob(F-statistic) 0.000000

i) Estime el modelo:

y dé los resultados en la forma usual, incluyendo el tamaño de la muestra y la R-cuadrada.


¿Son los signos de los coeficientes de pendiente los que usted esperaba? Explique.
Math10 = -20.36081 + 6.229698log(expend) – 0.304585lnchprg
N = 408 r2= 0.179927

ii) ¿Qué piensa del intercepto estimado en el inciso i)? en particular, ¿tiene sentido
igualar a cero las dos variables explicativas? [Sugerencia: recuerde que log(1)=0.]

iii) Ahora corra la regresión simple de math10 sobre log(expend) y compare el coeficiente
de pendiente con la estimación obtenida en el inciso i). ¿Es ahora el efecto estimado de
los gastos por estudiante mayor o menor que en el inciso i)?
iv) Determine la correlación entre lexpend = log(expend) y lnchprg. ¿Le parece razonable
el signo?
v) Use el inciso iv) para explicar sus hallazgos del inciso iii).

2.19 Use los datos del archivo CHARITY.WF1 para responder a las preguntas siguientes:
i) Estime la ecuación

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
mediante MCO y dé el resultado en la forma usual, incluyendo el tamaño de la muestra y
la R-cuadrada. Compare la R-cuadrada con la de la regresión simple en la que se omite
giftlast (monto de la donación más reciente) y propresp (tasa de respuesta). (Vea el
ejercicio (1.7).
ii) Interprete el coeficiente de mailsyear. ¿Es mayor o menor que el coeficiente
correspondiente en la regresión simple?
iii) Interprete el coeficiente de propresp. Tenga cuidado con las unidades de medición de
propresp.
iv) Ahora agregue a la ecuacion la variable avggift. ¿Qué pasa con el efecto estimado de
mailsyear?
v) ¿Qué ha pasado con el coeficiente de giftlast en la ecuacion del inciso iv)? ¿Qué cree
que este pasando?

Guías para respuestas.


2.1 (i) hsperc esta definido de tal forma que cuanto menor es, menor será la estadía de
los estudiantes en secundaria. Manteniendo todo lo demás igual cuando peor sera
la estadía de los estudiantes en secundaria, menor será su GPA esperado.
(ii) colgpa=2676
(iii) A tendrá una puntación más alta en un 0.207
2.2 i) Δsibs = 1/.094≈ 10.6.
ii) Si la madre tiene cuatro años más de educación se espera que el hijo tenga medio
año (.524) más de educación. Mantenidendo sibs y feduc constantes.
iii) la diferencia en educación entre A y B se estima en 1.364.
2.3 i) relación negativa
iii) toma en cuenta que totwrk está en minutos. Entonces se espera una disminución
en sleep de 44.4 minutos. Para una semana una reducción en 45 minutos no es
significativa.
2.4 iii) 24.8%
2.11 (i) la probabilidad de β2 > 0, significa que cuanto más aumenta el ingreso aumentará
la nutrición de las madres y tendrán acceso a un mejor cuidado prenatal.
(ii) Por un lado, un cumento en el ingreso genrealmente aumenta el cunsumo de un
bien, y cigs y faminc podrían estar positivamente correlacionados. Por otro lado, los
ingresos de las familias son mayores también para las familias con mayor educación,
y más eduación y consumo de cigarrillos tienden a estar negativamente
corelacionados. La correlación muestral entre cigs y faminc es −.173, indicando
correlación negativa.
(iii) Las regresiones sin y con faminc son:
bwght = 119.77 −.514 cigs, n = 1388, R2=0.023
y bwght= 116.97- .463cigs + .093faminc, n=1388, R2=0.030
El efecto de fumar cigarrillos es estrechamente menor cuando faminc se agrega a la
regresión, pero la diferencia no es muy alta. Esto se debe al hecho de que cigs y famic
no están muy correlacionados y el coeficiente de faminc es muy pequeño. (La
variable faminc está medida en miles, entonces un incremento en el ingreso de
$10,000 más aumentará la predicción del peso al nacer por solo 0.93 onzas.

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018
2.12 (i) price=-19.32+.128sqrft +15.20bdrms, n=88, R2 =0.632
(ii) manteniendo pies cuadrados constante, Δprice= 15.20 Δbdrms, entonces el
precio aumenta 15.20, que significa $15,200.
(iii) Ahora Δprice= .128 Δsqrft + 15.20 Δbdrms = .128(140) + 15.20 = 33.12, o
$33,120. Esto significa ………. Con respecto de (ii).
(iv) 63.2%.
(v) Precio predecido es 353.544, o $353,544.
(vi) Compara los resultados del inciso (v), con los basados solo en pies cúbicos y
número de cuartos, esto nos sugiere ….. también existen otras variables que afectan
el precio sobre los cuales no tenemos control.
2.13 (i) log(salary)=4.62 +.162log(sales)+.107log(mktval), n = 177, R2=.299
(ii) log(salary)=4.69+ .161log(sales)+ .098log(mktval).000036profits, n = 177, R2=.299
(iii) log(salary)=4.56+ .162log(sales)+ .102log(mktval)+ .000029profits+ .012ceoten,
n=2177, R2=.318. esto significa…..
(iv) correlación muestral entre log(mktval) y profits es 0.78, el cual ……

2.14 (i)

Variable Promedio Mínimo Máximos

atndrte 81.71 6.25 100


priGPA 2.59 .86 3.93
ACT 22.51 13 32

(ii) atndrte=75.70 + 17.26priGPA - 1.72ACT, n = 680, R2 = .291.


Signfica ….
(iv) atndrte = 75.70 + 17.267(3.65) – 1.72(20) ≈ 104.3.
(v) = 25.86.

KENEDY PAZ FARFAN


INGENIERIA COMERCIAL
5TO SEMESTRE
AÑO 2018

Potrebbero piacerti anche