Sei sulla pagina 1di 17

Departamento de Economía

Universidad Jaume I

Introducción a la Econometría (A22)

Preguntas de exámenes de cursos


anteriores

Licenciatura en Administración y Dirección de Empresas


Segundo curso, segundo semestre
Curso 2010–2011
1. Considera la siguiente función de regresión múltiple:

precio = β0 + β1 supcasa + β2 supjard + β3 cond + u

donde precio es el precio de venta de una casa medido en miles de dólares, supcasa
es la superficie útil de la casa en m2 , supjard es la superficie en m2 del jardín de la
casa, y cond es una variable que refleja el estado de conservación de la casa, que
toma valores entre 1, para las casas peor conservadas, y 6, para las casas en perfecto
estado de conservación.
Utilizando una muestra de 59 casas se han obtenido los siguientes resultados:

Modelo 14: estimaciones MCO


utilizando las 59 observaciones 1-59
Variable dependiente: precio

VARIABLE COEFICIENTE ERROR TÍP. ESTAD T VALOR P


constante -18,0798 77,2250 -0,234 0,81576
supcasa 0,945841 0,224117 4,220 0,00009
supjard 0,0582952 0,0254824 2,288 0,02603
cond 6,56079 16,0503 0,409 0,68430

Media de la var. dependiente = 228,629


Desviación típica de la var. dependiente. = 112,436
Suma de cuadrados de los residuos = 427260
Desviación típica de los residuos = 88,1383
R-cuadrado = 0,417288
R-cuadrado corregido = 0,385503
Estadístico F (3, 55) = 13,1287 (valor p < 0,00001)

Responde a las siguientes preguntas:

a) ¿Tiene el término constante de esta regresión una interpretación interesante?


¿Por qué?
b) ¿Cuál es la interpretación del parámetro β2 ? ¿Es significativo el efecto de la
variable supjard sobre el precio de venta?
c) ¿Es útil la variable cond a la hora de predecir el precio de venta de una casa?
¿Por qué? Utiliza un contraste t .
d) Utiliza las estimaciones para calcular cuál es la variación predicha en el precio
de venta de una casa si utilizamos 15 m2 de jardín para construir una habitación
adicional.

1
e) Un informe de una agencia inmobiliaria afirmaba que el valor de un m2 de
superficie útil era de 1.200$/m2 . De acuerdo con los resultados de nuestra es-
timación, ¿cuál es el precio del m2 de superficie útil? Construye un intervalo
de confianza para el valor del m2 de superficie útil y utilizalo para contrastar la
afirmación de la agencia inmobiliaria.

2. Considera la siguiente función de regresión múltiple:

log(salario) = β0 + β1 educ + β2 antig + β3 edad + u

que pretende explicar los salarios de un conjunto de trabajadores. salario es el salario


en dolares, educ es el número de años de educación de cada trabajador cuando fue
contratado, antig el número de años de antigüedad en la empresa, y edad es la edad
del trabajador en años.
Utilizando una muestra de 49 trabajadores se han obtenido los siguientes resulta-
dos:

Modelo 1: estimaciones MCO


utilizando las 49 observaciones 1-49
Variable dependiente: log(SALARIO)

VARIABLE COEFICIENTE ERROR TÍP. ESTAD T VALOR P


constante 6,83596 0,203431 33,603 0,00000
EDUC 0,0645527 0,0167498 3,854 0,00037
ANTIG 0,0226995 0,00687276 3,303 0,00188
EDAD 0,000391786 0,00403304 0,097 0,92304

Media de la var. dependiente = 7,45495


Desviación típica de la var. dependiente. = 0,312741
Suma de cuadrados de los residuos = 3,15661
Desviación típica de los residuos = 0,264853
R-cuadrado = 0,327625
R-cuadrado corregido = 0,2828
Estadístico F (3, 45) = 7,30899 (valor p = 0,000429)

Responde a las siguientes preguntas:

a) ¿Tiene el término constante de esta regresión una interpretación interesante?


¿Por qué?

2
b) ¿Cuál es la interpretación del parámetro β2 ? ¿Es significativo el efecto de la
variable antig sobre los salarios?
c) ¿Es útil la variable edad a la hora de predecir los salarios de los trabajadores?
¿Por qué? Utiliza un contraste t .
d) Si un trabajador hubiese retrasado un año su entrada en la empresa y hubiese
continuado estudiando durante ese año, ¿cuál sería la variación predicha en su
salario?
e) Un informe cuantifica el rendimiento de la educación en un incremento salarial
del 8 % por cada año de educación. De acuerdo con los resultados de nuestra
estimación, ¿cuál es el rendimiento de la educación? Construye un intervalo
de confianza para el rendimiento de la educación y utilizalo para contrastar la
afirmación del informe.

3. Considera la siguiente función de regresión múltiple:

log(sueldo) = β0 + β1 log(ventas) + β2 log(valm) + β3 antig + u,

donde sueldo es el sueldo del director general de una empresa en miles de dólares,
ventas y valm las ventas y el valor de mercado de la empresa en millones de dólares,
y antig es el número de años que el director general ocupa ese cargo en la empresa.
Utilizando una muestra de 177 directores generales se han obtenido los siguientes
resultados:

Modelo 3: estimaciones MCO


utilizando las 177 observaciones 1-177
Variable dependiente: log(SUELDO)

VARIABLE COEFICIENTE ERROR TÍP. ESTAD T VALOR P


constante 4,50379 0,257234 17,509 0,00000
log(VENTAS) 0,162854 0,0392421 4,150 0,00005
log(VALM) 0,109243 0,0495947 2,203 0,02894
ANTIG 0,0117054 0,00532606 2,198 0,02929

Media de la var. dependiente = 6,58285


Desviación típica de la var. dependiente. = 0,606059
Suma de cuadrados de los residuos = 44,079
Desviación típica de los residuos = 0,504769
R-cuadrado = 0,318151

3
R-cuadrado corregido = 0,306327
Estadístico F (3, 173) = 26,9073 (valor p < 0,00001)

Responde a las siguientes preguntas:

a) ¿Cuál es la interpretación del término constante en esta regresión?


b) ¿Cuál es la interpretación del parámetro β2 ? ¿Es significativo el efecto de la
variable valm sobre el sueldo del director general?
c) ¿Es útil la variable antig a la hora de predecir el sueldo del director general? ¿Por
qué? Utiliza un contraste t .
d) Utiliza las estimaciones para calcular cuál es la variación predicha en el sueldo
del director general si este consigue incrementar las ventas en un 2 % y elevar la
valoración de mercado de la empresa en un 1 %.
e) Una revista empresarial estimaba que los sueldos de los directores generales se
incrementan en un 2 % por cada año de permanecia en el cargo. De acuerdo
con los resultados de nuestra estimación, ¿en cuánto aumenta el sueldo del di-
rector general cada año que permanece en el cargo? Construye un intervalo de
confianza para el aumento del sueldo por cada año de permanecia en el cargo
de director general y utilizalo para contrastar la afirmación de la revista.

4. Razona brevemente la veracidad o falsedad de las siguientes afirmaciones:

a) El estimador de MCO es sesgado en presencia de multicolinealidad perfecta, ya


que en ese caso existen relaciones lineales exactas entre las variables explicativas
y el término de error.
b) El estimador de MCO es óptimo porque se obtiene minimizando la suma del
cuadrado de los residuos.
c) El estimador de MCO es sesgado siempre que se omita una variable relevante.
d) Añadir una variable irrelevante normalmente produce un aumento de las va-
rianzas del resto de los estimadores MCO debido a la multicolinealidad.
e) El estadístico F para la significación conjunta de la regresión contrasta la hipó-
tesis nula de que todos los parámetros son iguales a cero frente a la alternativa
de que todos los parámetros son distintos de cero.
f ) No es posible utilizar el R2 para comparar la bondad del ajuste de dos modelos
de regresión si la variable dependiente no es la misma en los dos modelos. En
una situación como esa, es necesario utilizar el R2 ajustado (R̄2 ).

4
5. Con el objeto de estudiar los determinantes de los gastos en I+D de las empresas,
se planteó el siguiente modelo de regresión múltiple:

log(id) = β0 + β1 log(ventas) + β2 benefpct + u,

donde id son los gastos en I+D en millones de dólares, ventas son las ventas en mi-
llones de dólares y benefpct los beneficios expresados como porcentaje de las ventas.
Aplicando MCO a una muestra de 32 empresas del sector químico se obtuvieron
los siguientes resultados (los números entre paréntesis son los errores típicos de los
estimadores MCO):

log(ı̂d) = −4,378 + 1,084 log(ventas) + 0,022 benefpct,


(0,468) (0,060) (0,013)
n = 32, σ̂ = 0,5136, R = 0,9180
2

a) ¿Qué fracción de la variación en los gastos de I+D puede explicarse a través de


variaciones en ventas y en benefpct?
b) ¿Cuál es la variación predicha en los gastos de I+D si las ventas disminuyen en
un 2 % manteniendo constante benefpct?
c) ¿Cuál es la variación predicha en los gastos de I+D si benefpct aumenta en 5
puntos porcentuales manteniendo constante el volumen de ventas?
d) Contrasta para un nivel de significación del 5 % la hipótesis de que, ceteris pari-
bus, los gastos en I+D no se ven afectados por las ventas frente a la alternativa
de que existe una relación positiva entre los gastos en I+D y las ventas.
e) Construye un intervalo a un nivel de confianza del 90 % para el parámetro β2 .
De acuerdo con este intervalo de confianza, ¿es estadísticamente significativo el
efecto parcial de benefpct sobre los gastos en I+D?

6. El modelo de regresión múltiple

(Modelo A) log(salario) = β0 + β1 educ + β2 exper + β3 antig + u,

explica los salarios de los trabajadores medidos en dólares (salario) en función de los
años de educación de cada trabajador (educ), los años de experiencia laboral (exper)
y los años de antigüedad en el puesto de trabajo actual (antig).
El modelo anterior se amplió para poder estudiar la existencia de discriminación
salarial en contra de las mujeres incluyendo una variable ficticia mujer que toma el
valor 1 en las observaciones que corresponden a mujeres y 0 en las observaciones

5
correspondientes a hombres. Además, se incluyó un término de interacción entre
mujer y educ. El modelo ampliado es:

(Modelo B) log(salario) = β0 + β1 educ + β2 exper + β3 antig


+ β4 mujer + β5 mujer · educ + u.

La siguiente tabla presenta las estimaciones MCO de los dos modelos de regresión
utilizando una muestra de 526 trabajadores (los números entre paréntesis son los
errores típicos de los estimadores MCO).

Variable dependiente: log(salario)


Variables independientes Modelo A Modelo B
constante 0,2844 0,4647
(0,1042) (0,1229)
educ 0,0920 0,0903
(0,0073) (0,0087)
exper 0,0041 0,0046
(0,0017) (0,0016)
antig 0,0221 0,0174
(0,0031) (0,0030)
mujer −0,2104
(0,1740)
mujer · educ −0,0072
(0,0136)

Observaciones 526 526


σ̂ 0,4409 0,4162
R2 0,3160 0,3926
R̄2 0,3121 0,3868

a) Contrasta a un nivel de significación del 5 % la hipótesis de que la rentabilidad


de la educación (la variación del salario por cada año adicional de educación) es
la misma para los hombres que para las mujeres.
b) Contrasta a un nivel de significación del 5 % la hipótesis de que los salarios me-
dios son idénticos para hombres y mujeres con los mismos niveles de educación,
experiencia y antigüedad.

6
7. Considera la siguiente regresión de los precios de venta (en miles de dólares) de
un conjunto de casas con respecto a rooms, el número de habitaciones de cada casa
[errores típicos entre paréntesis]:

(Modelo 1) prı̂ce = 71,30 + 24,87 rooms


(75,44) (11,02)
n = 40, R2 = 0,118213 R̄2 = 0,0950085

a) Calcula la predicción del precio medio de una casa con 5 habitaciones.


b) Al añadir la variable sqft, que recoge la superficie habitable de cada una de las
casas medida en pies cuadrados, se obtienen los siguientes resultados:

(Modelo 2) prı̂ce = 68,75 − 26,02 rooms + 0,166 sqft


(64,15) (15,94) (0,042)
n = 40, R2 = 0,379274 R̄2 = 0,345721

¿Por qué son tan diferentes las dos estimaciones del parámetro de rooms? Sa-
biendo que la correlación entre rooms y sqft es 0,81, ¿es posible que la primera
estimación esté sesgada? ¿En qué dirección?
c) ¿Cuál de las dos regresiones es preferible en términos de la bondad del ajuste?
d) Calcula un intervalo de confianza para el parámetro de sqft para un nivel de
confianza del 95 %. Utiliza este intervalo para contrastar la hipótesis de que
un incremento de la superficie habitable igual a 1 pie cuadrado eleva el precio
medio en 200 dólares.
e) Reescribe los resultados de la segunda regresión cambiando a metros cuadrados
las unidades en que se mide la superficie habitable. [Un pie cuadrado equivale
aproximadamente a 0,10 metros cuadrados.]

8. La siguiente ecuación describe el precio mediano de la vivienda en una comunidad


en función del nivel de contaminación (nox por concentración óxido nitroso en el
aire) y el número medio de habitaciones en las viviendas de la comunidad (rooms):

log(price) = β0 + β1 log(nox) + β2 rooms + u.

a) ¿Cuál es la interpretación de β1 ?
b) Si log(nox) y rooms están negativamente correlacionados, la regresión simple de
log(price) sobre log(nox) ¿produce un estimador de β1 con sesgo al alza o a la
baja?

7
9. Con el objeto de contrastar la efectividad de un programa de formación laboral, se
especificó el modelo:

log(wage) = β0 + β1 prog + β2 educ + β3 exper + u,

donde wage son los salarios por hora en dólares de los trabajadores, educ y exper son,
respectivamente, los años de educación y de experiencia laboral de cada trabajador y
prog es una variable binaria con valor 1 si el trabajador participó en el programa de
formación y valor 0 en caso contrario. El término de error contiene características
de los trabajadores, como la habilidad, que no son observables.

a) ¿Cual es la interpretación del parámetro β1 ?


b) Si los trabajadores menos hábiles tienen mayor probabilidad de ser selecciona-
dos para participar en el programa de formación, ¿cuál es el sesgo probable en
el estimador MCO de β1 ?

10. Utilizando una muestra de trabajadores de los Estados Unidos, se ha estimado la


siguiente ecuación de salarios:

Variable dependiente: log(wage)


β̂ j se(β̂ j ) t valor p
constante 5,592 0,111 50,53 < 0,001
educ 0,072 0,006 11,13 < 0,001
exper 0,015 0,003 4,56 < 0,001
tenure 0,013 0,003 4,92 < 0,001
south −0,135 0,027 −5,09 < 0,001
Número de observaciones: 935
Suma de cuadrados de los residuos: 136,163
R2 = 0,178037
R̄2 = 0, 174501
Estadístico F = 50,36 (valor p < 0,001)

donde la variable dependiente, log(wage), es el logaritmo de los salarios por hora (en
dólares), educ son los años de educación, exper son los años de experiencia laboral,
tenure son los años de antigüedad en el puesto de trabajo actual, y south es una
variable ficticia que toma el valor 1 para los trabajadores que viven en los estados
del sur y el valor 0 para los trabajadores de los estados del norte.

8
a) ¿Cuál es el efecto de un año adicional de educación sobre los salarios? Contraste
la significación de este efecto para un nivel de significación del 5 %.
b) Contraste la significación conjunta de la regresión anterior para un nivel de
significación del 5 %.

Con objeto de estudiar la existencia de discriminación racial se ha añadido a la lista


de variables explicativas la variable ficticia black que toma valor 1 para los trabaja-
dores negros y 0 para los trabajadores blancos, y la interacción de las variables black
y south:

Variable dependiente: log(wage)


β̂ j se(β̂ j ) t valor p
constante 5,653 0,112 50,97 < 0,001
educ 0,068 0,006 10,56 < 0,001
exper 0,015 0,003 4,59 < 0,001
tenure 0,012 0,003 4,67 < 0,001
south −0,084 0,029 −2,88 0,004
black −0,068 0,060 −1,13 0,258
black · south −0,179 0,077 −2,31 0,021
Número de observaciones: 935
Suma de cuadrados de los residuos: 132,538
R2 = 0,199925
R̄2 = 0,194752
Estadístico F = 36,65 (valor p < 0,001)

Contesta a las siguientes preguntas :

c) ¿Cuál es la diferencia entre los salarios medios de los trabajadores blancos que
viven en los estados del norte y de trabajadores blancos que viven en los estados
del sur, ceteris paribus? ¿Es significativa al 5 % esta diferencia?
d) En los estados del norte, ¿cuál es la diferencia entre los salarios medios de los
trabajadores blancos y de los trabajadores negros, ceteris paribus? ¿Es significa-
tiva al 5 % esta diferencia?
e) En los estados del sur, ¿cuál es la diferencia entre los salarios medios de los tra-
bajadores blancos y de los trabajadores negros, ceteris paribus? ¿Es significativa
al 5 % esta diferencia?

9
11. Un problema que interesa a las autoridades sanitarias (entre otros) es el de determi-
nar los efectos que tiene el hábito de fumar durante el embarazo sobre la salud del
recién nacido. Considera la siguiente estimación:
log(bwĝht) = 4,69 − 0,0042 cigs + 0,0084 log(faminc)
(0,019) (0,0009) (0,0059)
+ 0,026 male + 0,053 white,
(0,010) (0,013)
n = 1388, R = 0,0472,
2

donde bwght es el peso al nacer del bebé en onzas, cigs mide el consumo de cigarri-
llos por día de la madre, faminc es la renta familiar en miles de dólares, male es una
variable ficticia que toma el valor 1 si el recién nacido es hombre y 0 si es mujer, y
white es una variable ficticia que toma el valor 1 para los bebés blancos.
a) Evalúa la bondad del ajuste de la regresión anterior.
b) Contrasta la significación conjunta de las variables explicativas de la regresión
anterior.
c) ¿Cuál es el efecto de fumar 10 cigarrillos más por día sobre el peso al nacer?
d) Contrasta la hipótesis de que el consumo de cigarrillos no afecta al peso del
recién nacido frente a la alternativa de que influye negativamente.

12. Se ha estimado la siguiente ecuación:


sât = 1028,10 + 19,30 hsize − 2,19 hsize2 − 45,09 female
(6,29) (3,83) (0,53) (4,29)
− 169,81 black + 62,31 female · black,
(12,71) (18,15)
n = 4137, R = 0,0858.
2

La variable sat es la puntuación en el examen SAT de aptitud escolar, hsize es el


tamaño de la clase a la que pertenece el alumno (medido en cientos de alumnos),
female es una ficticia de sexo, y black es una ficticia racial con valor 1 para los negros,
y 0 para los demás.
a) De acuerdo con esta estimación, ¿cuál sería el tamaño óptimo de la clase?
b) Manteniendo fijo hsize, ¿cuál es la diferencia estimada en la puntuación de la
prueba SAT entre las mujeres no negras y los hombres no negros? Contrasta
la hipótesis nula de que no hay diferencia entre sus puntuaciones, contra la
alternativa de que sí la hay.

10
c) ¿Cuál es la diferencia estimada de puntuación SAT entre hombres negros y
hombres que no son negros? Contrasta la hipótesis nula de que no hay diferen-
cia entre sus puntuaciones, contra la alternativa de que sí la hay.
d) ¿Cuál es la diferencia estimada de puntuación SAT entre mujeres negras y mu-
jeres que no son negras? ¿Qué se necesitaría hacer para contrastar la hipótesis
de que la diferencia es estadísticamente significativa?

13. Utilizando información sobre los precios de venta y las características de 88 casas,
se ha estimado el modelo de regresión (errores típicos entre paréntesis):

log(pr̂ice) = 3,849 + 0,00354 area + 0,155 log(lot) + 0,0303 bdrms,


(0,241) (0,00045) (0,038) (0,0272)
n = 88, R2 = 0,6568, R̄2 = 0,6446,

donde price es el precio de venta de las casas en miles de dólares, area es la superficie
habitable de la casa en metros cuadrados, lot es el tamaño en metros cuadrados de
la parcela donde está construida la casa y bdrms es el número de dormitorios.

a) Construye un intervalo de confianza para el efecto de lot sobre los precios de


venta. ¿Cuál es la interpretación de este intervalo?
b) De acuerdo con las estimaciones anteriores, ¿cuál es el efecto sobre el precio
de venta de construir un nuevo dormitorio que añada 12 m2 a la superficie
habitable?
c) Un especificación alternativa es:

pr̂ice = −269,666 + 1,183 area + 55,226 log(lot)


(108,061) (0,139) (11,813)
− 23,917 bdrms + 4,959 bdrms2 ,
(38,952) (4,756)
n = 88, R2 = 0,7140, R̄2 = 0,7002.

Con la información que se ha proporcionado, ¿es posible seleccionar uno de los


dos modelos en base a la bondad del ajuste? En caso de responder afirmativa-
mente, ¿cuál de las dos especificaciones es preferible?

14. Se han estimado los siguientes modelos de determinación del salario de los directo-
res generales de un conjunto de empresas:

11
Modelo 1: Estimaciones MCO utilizando 177 observaciones
Variable dependiente: salary
estimación error típico estadístico t valor p
Constante 638,132 64,160 9,946 < 0,0001 ∗∗∗
ceoten 11,886 5,641 2,107 0,0365 ∗∗
mktval 23,699 15,797 1,500 0,1354
profits 230,249 251,670 0,915 0,3615
Suma de cuadrados de los residuos = 49300329
R2 = 0,188685; R̄2 = 0,174616
Estadístico F (3, 173) = 13,41137 (valor p < 0,0001)

Modelo 2: Estimaciones MCO utilizando 177 observaciones


Variable dependiente: salary
estimación error típico estadístico t valor p
Constante 772,426 65,676 11,760 < 0,0001 ∗∗∗
ceoten 11,746 6,148 1,911 0,0577 ∗
Suma de cuadrados de los residuos = 59524271
R2 = 0,020434; R̄2 = 0,014837
Estadístico F (1, 175) = 3,650552 (valor p = 0,0577)

La variable dependiente en los dos modelos, salary, son los salarios de los directo-
res generales en miles de dólares. Las variables explicativas son mktval, el valor de
mercado de las empresas en miles de millones de dólares; profits, los beneficios de
las empresas en miles de millones de dólares; y ceoten, los años de antigüedad en el
cargo de director general.
a) Contrasta la significación individual de los efectos de las variables mktval y
profits.
b) Contrasta la significación conjunta de estas dos variables.
c) ¿Cómo afecta a los resultados de los apartados anteriores el hecho de que la
correlación entre mktval y profits es 0,92?

15. Un posible modelo para medir la relación entre el precio de los alquileres y la pre-
sencia de población estudiantil en una ciudad universitaria es el siguiente:
log(rent) = β0 + β1 log(pop) + β2 log(avginc) + β3 pctstu + u.

12
donde rent es el alquiler mensual medio pagado por alojamiento en una ciudad
universitaria de los Estados Unidos, pop es la población total de la ciudad, avginc es
la renta media de los habitantes de la ciudad y pctstu es el porcentaje que representa
la población estudiantil sobre el total de la población. La ecuación estimada con los
datos para 1990 para 64 ciudades universitarias es

Estimaciones MCO utilizando 64 observaciones


Variable dependiente: log(rent)
estimación error típico estadístico t valor p
Constante 0,042781 0,843875 0,050 0,9597
log(pop) 0,065867 0,038826 1,696 0,0950 ∗
log(avginc) 0,507015 0,080835 6,272 < 0,0001 ∗∗∗
pctstu 0,005629 0,001742 3,232 0,0020 ∗∗∗
Suma de cuadrados de los residuos = 1,372042
R2 = 0,457905; R̄2 = 0,430800
Estadístico F (3, 60) = 16,89390 (valor p < 0,0001)

a) De acuerdo con la estimación anterior ¿cuál es el valor de la elasticidad de los


alquileres con respecto de la población total de las ciudades? Construya un in-
tervalo de confianza para esta elasticidad.
b) Contraste la hipótesis nula de que el tamaño de la población estudiantil en por-
centaje sobre la población total no tiene efecto, ceteris paribus, sobre los alqui-
leres mensuales frente a la hipótesis alternativa de que dicho efecto es positivo.
c) ¿Cómo cambiarían las estimaciones anteriores si se utilizara la variable popth,
la población total medida en miles de personas, en lugar de la variable pop?
Indique qué estadísticos de la tabla anterior cambiarían y el nuevo valor que
tomarían.

16. La información obtenida en una encuesta a trabajadores se utilizó para estimar la


siguiente ecuación:

edûc = 10,36 − 0,094 sibs + 0,131 meduc + 0,210 feduc,


n = 722, R2 = 0,214,

donde educ son los años de educación de cada trabajador, sibs es el número de her-
manos, meduc es el número de años de educación de la madre y feduc es el número
de años de educación del padre.

13
a) Dos trabajadores, A y B, tienen el mismo número de hermanos, pero la educa-
ción de sus padres es diferente. En el caso de A tanto su padre como su madre
tienen 12 años de educación. En el caso de B tanto su padre como su madre
tienen 16 años de educación. ¿Cuál es la diferencia estimada en los años de edu-
cación de B y A?
b) Describa paso a paso, cómo contrastar la hipótesis de que el efecto de los años de
educación de la madre es igual al efecto de los años de educación del padre. En
concreto: ¿Qué regresiones adicionales habría que estimar? ¿Qué estadísticos
de contraste habría que calcular?

17. Se han estimado los siguientes modelos de determinación del la nota media de un
conjunto de estudiantes universitarios:

Modelo 1: Estimaciones MCO utilizando 141 observaciones


Variable dependiente: colGPA
estimación error típico estadístico t valor p
Constante 1,579 0,303 5,205 < 0,0001 ∗∗∗∗
hsGPA 0,459 0,088 5,232 < 0,0001 ∗∗∗
skipped −0,077 0,026 −3,005 0,0032 ∗∗∗∗
Suma de cuadrados de los residuos = 15,08372
R2 = 0,222733; R̄2 = 0,211468
Estadístico F (2, 138) = 19,77258 (valor p < 0,0001)

Modelo 2: Estimaciones MCO utilizando 141 observaciones


Variable dependiente: colGPA
estimación error típico estadístico t valor p
Constante 1,297 0,525 2,470 0,0148 ∗∗∗
hsGPA 0,547 0,146 3,736 0,0003 ∗∗∗
skipped −0,128 0,053 −2,426 0,0166 ∗∗
male 0,524 0,654 0,802 0,4241
male · hsGPA −0,162 0,187 −0,868 0,3871
male · skipped 0,069 0,061 1,137 0,2574
Suma de cuadrados de los residuos = 14,75805
R2 = 0,239515; R̄2 = 0,211349
Estadístico F (5, 135) = 8,503653 (valor p =< 0,0001)

14
La variable dependiente, colGPA, es la nota media obtenida en la universidad (en
una escala de 0 a 4). Como variables explicativas se han utilizado: hsGPA, la nota
media en el instituto (usando una escala de 0 a 4); skipped, la media semanal de
clases a las que no asistió el alumno; male, variable ficticia que toma el valor 1 para
los hombres y 0 para las mujeres.

a) Contraste la significación individual de male · hsGPA?


b) ¿Cuál es la interpretación del parámetro de male · skipped?
c) Contraste la hipótesis de que las funciones de regresión para hombres y mujeres
son idénticas.

15

Potrebbero piacerti anche