Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Universidad Jaume I
donde precio es el precio de venta de una casa medido en miles de dólares, supcasa
es la superficie útil de la casa en m2 , supjard es la superficie en m2 del jardín de la
casa, y cond es una variable que refleja el estado de conservación de la casa, que
toma valores entre 1, para las casas peor conservadas, y 6, para las casas en perfecto
estado de conservación.
Utilizando una muestra de 59 casas se han obtenido los siguientes resultados:
1
e) Un informe de una agencia inmobiliaria afirmaba que el valor de un m2 de
superficie útil era de 1.200$/m2 . De acuerdo con los resultados de nuestra es-
timación, ¿cuál es el precio del m2 de superficie útil? Construye un intervalo
de confianza para el valor del m2 de superficie útil y utilizalo para contrastar la
afirmación de la agencia inmobiliaria.
2
b) ¿Cuál es la interpretación del parámetro β2 ? ¿Es significativo el efecto de la
variable antig sobre los salarios?
c) ¿Es útil la variable edad a la hora de predecir los salarios de los trabajadores?
¿Por qué? Utiliza un contraste t .
d) Si un trabajador hubiese retrasado un año su entrada en la empresa y hubiese
continuado estudiando durante ese año, ¿cuál sería la variación predicha en su
salario?
e) Un informe cuantifica el rendimiento de la educación en un incremento salarial
del 8 % por cada año de educación. De acuerdo con los resultados de nuestra
estimación, ¿cuál es el rendimiento de la educación? Construye un intervalo
de confianza para el rendimiento de la educación y utilizalo para contrastar la
afirmación del informe.
donde sueldo es el sueldo del director general de una empresa en miles de dólares,
ventas y valm las ventas y el valor de mercado de la empresa en millones de dólares,
y antig es el número de años que el director general ocupa ese cargo en la empresa.
Utilizando una muestra de 177 directores generales se han obtenido los siguientes
resultados:
3
R-cuadrado corregido = 0,306327
Estadístico F (3, 173) = 26,9073 (valor p < 0,00001)
4
5. Con el objeto de estudiar los determinantes de los gastos en I+D de las empresas,
se planteó el siguiente modelo de regresión múltiple:
donde id son los gastos en I+D en millones de dólares, ventas son las ventas en mi-
llones de dólares y benefpct los beneficios expresados como porcentaje de las ventas.
Aplicando MCO a una muestra de 32 empresas del sector químico se obtuvieron
los siguientes resultados (los números entre paréntesis son los errores típicos de los
estimadores MCO):
explica los salarios de los trabajadores medidos en dólares (salario) en función de los
años de educación de cada trabajador (educ), los años de experiencia laboral (exper)
y los años de antigüedad en el puesto de trabajo actual (antig).
El modelo anterior se amplió para poder estudiar la existencia de discriminación
salarial en contra de las mujeres incluyendo una variable ficticia mujer que toma el
valor 1 en las observaciones que corresponden a mujeres y 0 en las observaciones
5
correspondientes a hombres. Además, se incluyó un término de interacción entre
mujer y educ. El modelo ampliado es:
La siguiente tabla presenta las estimaciones MCO de los dos modelos de regresión
utilizando una muestra de 526 trabajadores (los números entre paréntesis son los
errores típicos de los estimadores MCO).
6
7. Considera la siguiente regresión de los precios de venta (en miles de dólares) de
un conjunto de casas con respecto a rooms, el número de habitaciones de cada casa
[errores típicos entre paréntesis]:
¿Por qué son tan diferentes las dos estimaciones del parámetro de rooms? Sa-
biendo que la correlación entre rooms y sqft es 0,81, ¿es posible que la primera
estimación esté sesgada? ¿En qué dirección?
c) ¿Cuál de las dos regresiones es preferible en términos de la bondad del ajuste?
d) Calcula un intervalo de confianza para el parámetro de sqft para un nivel de
confianza del 95 %. Utiliza este intervalo para contrastar la hipótesis de que
un incremento de la superficie habitable igual a 1 pie cuadrado eleva el precio
medio en 200 dólares.
e) Reescribe los resultados de la segunda regresión cambiando a metros cuadrados
las unidades en que se mide la superficie habitable. [Un pie cuadrado equivale
aproximadamente a 0,10 metros cuadrados.]
a) ¿Cuál es la interpretación de β1 ?
b) Si log(nox) y rooms están negativamente correlacionados, la regresión simple de
log(price) sobre log(nox) ¿produce un estimador de β1 con sesgo al alza o a la
baja?
7
9. Con el objeto de contrastar la efectividad de un programa de formación laboral, se
especificó el modelo:
donde wage son los salarios por hora en dólares de los trabajadores, educ y exper son,
respectivamente, los años de educación y de experiencia laboral de cada trabajador y
prog es una variable binaria con valor 1 si el trabajador participó en el programa de
formación y valor 0 en caso contrario. El término de error contiene características
de los trabajadores, como la habilidad, que no son observables.
donde la variable dependiente, log(wage), es el logaritmo de los salarios por hora (en
dólares), educ son los años de educación, exper son los años de experiencia laboral,
tenure son los años de antigüedad en el puesto de trabajo actual, y south es una
variable ficticia que toma el valor 1 para los trabajadores que viven en los estados
del sur y el valor 0 para los trabajadores de los estados del norte.
8
a) ¿Cuál es el efecto de un año adicional de educación sobre los salarios? Contraste
la significación de este efecto para un nivel de significación del 5 %.
b) Contraste la significación conjunta de la regresión anterior para un nivel de
significación del 5 %.
c) ¿Cuál es la diferencia entre los salarios medios de los trabajadores blancos que
viven en los estados del norte y de trabajadores blancos que viven en los estados
del sur, ceteris paribus? ¿Es significativa al 5 % esta diferencia?
d) En los estados del norte, ¿cuál es la diferencia entre los salarios medios de los
trabajadores blancos y de los trabajadores negros, ceteris paribus? ¿Es significa-
tiva al 5 % esta diferencia?
e) En los estados del sur, ¿cuál es la diferencia entre los salarios medios de los tra-
bajadores blancos y de los trabajadores negros, ceteris paribus? ¿Es significativa
al 5 % esta diferencia?
9
11. Un problema que interesa a las autoridades sanitarias (entre otros) es el de determi-
nar los efectos que tiene el hábito de fumar durante el embarazo sobre la salud del
recién nacido. Considera la siguiente estimación:
log(bwĝht) = 4,69 − 0,0042 cigs + 0,0084 log(faminc)
(0,019) (0,0009) (0,0059)
+ 0,026 male + 0,053 white,
(0,010) (0,013)
n = 1388, R = 0,0472,
2
donde bwght es el peso al nacer del bebé en onzas, cigs mide el consumo de cigarri-
llos por día de la madre, faminc es la renta familiar en miles de dólares, male es una
variable ficticia que toma el valor 1 si el recién nacido es hombre y 0 si es mujer, y
white es una variable ficticia que toma el valor 1 para los bebés blancos.
a) Evalúa la bondad del ajuste de la regresión anterior.
b) Contrasta la significación conjunta de las variables explicativas de la regresión
anterior.
c) ¿Cuál es el efecto de fumar 10 cigarrillos más por día sobre el peso al nacer?
d) Contrasta la hipótesis de que el consumo de cigarrillos no afecta al peso del
recién nacido frente a la alternativa de que influye negativamente.
10
c) ¿Cuál es la diferencia estimada de puntuación SAT entre hombres negros y
hombres que no son negros? Contrasta la hipótesis nula de que no hay diferen-
cia entre sus puntuaciones, contra la alternativa de que sí la hay.
d) ¿Cuál es la diferencia estimada de puntuación SAT entre mujeres negras y mu-
jeres que no son negras? ¿Qué se necesitaría hacer para contrastar la hipótesis
de que la diferencia es estadísticamente significativa?
13. Utilizando información sobre los precios de venta y las características de 88 casas,
se ha estimado el modelo de regresión (errores típicos entre paréntesis):
donde price es el precio de venta de las casas en miles de dólares, area es la superficie
habitable de la casa en metros cuadrados, lot es el tamaño en metros cuadrados de
la parcela donde está construida la casa y bdrms es el número de dormitorios.
14. Se han estimado los siguientes modelos de determinación del salario de los directo-
res generales de un conjunto de empresas:
11
Modelo 1: Estimaciones MCO utilizando 177 observaciones
Variable dependiente: salary
estimación error típico estadístico t valor p
Constante 638,132 64,160 9,946 < 0,0001 ∗∗∗
ceoten 11,886 5,641 2,107 0,0365 ∗∗
mktval 23,699 15,797 1,500 0,1354
profits 230,249 251,670 0,915 0,3615
Suma de cuadrados de los residuos = 49300329
R2 = 0,188685; R̄2 = 0,174616
Estadístico F (3, 173) = 13,41137 (valor p < 0,0001)
La variable dependiente en los dos modelos, salary, son los salarios de los directo-
res generales en miles de dólares. Las variables explicativas son mktval, el valor de
mercado de las empresas en miles de millones de dólares; profits, los beneficios de
las empresas en miles de millones de dólares; y ceoten, los años de antigüedad en el
cargo de director general.
a) Contrasta la significación individual de los efectos de las variables mktval y
profits.
b) Contrasta la significación conjunta de estas dos variables.
c) ¿Cómo afecta a los resultados de los apartados anteriores el hecho de que la
correlación entre mktval y profits es 0,92?
15. Un posible modelo para medir la relación entre el precio de los alquileres y la pre-
sencia de población estudiantil en una ciudad universitaria es el siguiente:
log(rent) = β0 + β1 log(pop) + β2 log(avginc) + β3 pctstu + u.
12
donde rent es el alquiler mensual medio pagado por alojamiento en una ciudad
universitaria de los Estados Unidos, pop es la población total de la ciudad, avginc es
la renta media de los habitantes de la ciudad y pctstu es el porcentaje que representa
la población estudiantil sobre el total de la población. La ecuación estimada con los
datos para 1990 para 64 ciudades universitarias es
donde educ son los años de educación de cada trabajador, sibs es el número de her-
manos, meduc es el número de años de educación de la madre y feduc es el número
de años de educación del padre.
13
a) Dos trabajadores, A y B, tienen el mismo número de hermanos, pero la educa-
ción de sus padres es diferente. En el caso de A tanto su padre como su madre
tienen 12 años de educación. En el caso de B tanto su padre como su madre
tienen 16 años de educación. ¿Cuál es la diferencia estimada en los años de edu-
cación de B y A?
b) Describa paso a paso, cómo contrastar la hipótesis de que el efecto de los años de
educación de la madre es igual al efecto de los años de educación del padre. En
concreto: ¿Qué regresiones adicionales habría que estimar? ¿Qué estadísticos
de contraste habría que calcular?
17. Se han estimado los siguientes modelos de determinación del la nota media de un
conjunto de estudiantes universitarios:
14
La variable dependiente, colGPA, es la nota media obtenida en la universidad (en
una escala de 0 a 4). Como variables explicativas se han utilizado: hsGPA, la nota
media en el instituto (usando una escala de 0 a 4); skipped, la media semanal de
clases a las que no asistió el alumno; male, variable ficticia que toma el valor 1 para
los hombres y 0 para las mujeres.
15