Sei sulla pagina 1di 5

Problemas propuestos Bloque II: Modelos de Regresión Simple 1

PROBLEMAS PROPUESTOS
BLOQUE II: MODELOS DE REGRESIÓN SIMPLE

Ejercicio 1.- Se obtuvieron los siguientes datos para X, latitud del espacio natural de crı́a,
e Y , duración del perı́odo de crı́a en dı́as, de 11 especies de patos buceadores:

X 29 42 45 45 50 50 53 54 55 60 65
Y 112 98 58 68 28 46 42 50 18 51 49

1. Dibujar la nube de puntos. ¿ Se intuye una relación lineal entre X e Y ?


2. Ajustar la recta de regresión por mı́nimos cuadrados.
3. Obtener un intervalo de confianza para la pendiente al 95%.
4. Utilizar el método de análisis de la varianza para comprobar la idoneidad del
modelo lineal.
5. Estimar la duración media del perı́odo de crı́a para aves cuyo espacio natural de
crı́a está a una latitud de 35 grados. Construir un intervalo de confianza al 95%
para este parámetro.
6. Predecir la longitud del perı́odo de crı́a para un pato cuyo espacio natural de crı́a
está a una latitud de 35 grados. Construir un intervalo de confianza al 95% para
el valor predicho.

Ejercicio 2.- La variable Y representa, en miles, el número de asnos en España y la X el


tanto por ciento del presupuesto del Estado dedicado a Educación en distintos años.
Se tiene:
Año 1920 1925 1930 1935 1940 1945 1950 1955 1960 1965 1970 1975 1980
Y 1006 1162 1479 805 795 747 732 683 686 493 476 386 368
X 5.5 4.8 7.8 8.2 8.6 9.7 9.6 8.9 11.4 10.6 12.7 11.5 11.4

1. Estudiar la aleatoriedad de ambas muestras mediante los gráficos de secuencia y


autocorrelaciones ası́ como los métodos analı́ticos que sea posible aplicar.
2. Construir una recta de regresión, representarla gráficamente e interpretar los re-
sultados.

Ejercicio 3.- Considérese el siguiente conjunto de datos:

x 20 20 20 25 25 25 31 31 31
y 11.45 10.42 11.14 10.84 11.70 10.54 9.47 9.19 9.54
Problemas propuestos Bloque II: Modelos de Regresión Simple 2

1. Calcular la ecuación estimada de la recta de regresión de y sobre x.


2. Un modelo teórico sugiere que la disminución esperada en y para un aumento de
una unidad en x es, a lo sumo, 0.10. ¿Contradicen los datos esta afirmación?
3. Con el fin de estimar la pendiente de la recta de regresión real con la mayor
precisión posible, ¿hubiese sido preferible realizar una única observación en los
valores de x iguales a 20, 21, 22, . . . , 29, 30 y 31? Razonar la respuesta.
4. Predecir el valor de y para un valor de x igual a 28. La predicción debe acompañarse
de su error tı́pico.

Ejercicio 4.- Los siguientes datos recogen los valores de las variables X = “Edad (en años)”
e Y = “Incremento anual de crecimiento del diámetro del tronco (mm)” para una
muestra de árboles de cierta región:

x 17 23 30 37.5 40 46.5 50 54 55 93
y 2.20 1.25 0.85 1.30 1.70 0.75 0.75 0.50 1.00 0.70

Calcular la ecuación estimada de la recta de regresión de y sobre x y chequear los


residuos.

Ejercicio 5.- Los siguientes datos provienen del artı́culo “Changes in Growth Hormone
Status Related to Body Weight of Growing Cattle”, (Growth, 1977, pp. 241-247),
siendo x =“peso corporal” e y =“rapidez de eliminación metabólica/peso corporal”.

x 110 110 110 230 230 230 360 360 360 360 505 505 505 505
y 235 198 173 174 149 124 115 130 102 95 122 112 98 96

1. Calcular la ecuación estimada de la recta de regresión de y sobre x.


2. Realizar el contraste de linealidad a un 5% de significación para comprobar si el
modelo lineal es adecuado o no. Construir un gráfico de dispersión al objeto de
verificar si el resultado de la prueba es intuitivamente coherente.
3. Sugerir un modelo no lineal en base al cuadro de diálogo de estimación curvilı́nea
del SPSS.

Ejercicio 6.- Para determinar la tasa de crecimiento de células de algas en un cultivo se


hicieron varias observaciones. Como muchos procesos naturales de crecimiento son
exponenciales, parece conveniente relacionar el logaritmo del volumen con el tiempo,
Problemas propuestos Bloque II: Modelos de Regresión Simple 3

en lugar de relacionar el volumen con el tiempo. Se anotó el logaritmo del volumen de


células en el cultivo en cada uno de ocho dı́as consecutivos, con los siguientes resultados:

X (dı́a) 1 2 3 4 5 6 7 8
Y (log(vol)) 3.538 3.828 4.349 4.833 4.911 5.297 5.566 6.036

1. Ajustar una recta a estos datos.


2. ¿Es satisfactorio el ajuste a un nivel de significación del 5%?
3. Obtener un intervalo de confianza al 95% para la tasa de crecimiento.
4. En regresión, cuando la variable explicativa o independiente es el tiempo suele
peligrar la verificación de una de las hipótesis de partida de un modelo de regresión
lineal. ¿Cuál? Contrastar si en este caso se verifica o no.
5. ¿Es posible contrastar la hipótesis de linealidad? Si la respuesta es afirmativa
contrastarla con un nivel de significación α = 0.05.

Ejercicio 7.- A partir de una muestra bivariante {(x1 , y1 ), . . . , (xn , yn )} se calculó la recta
de regresión mı́nimo-cuadrática de Y sobre X y se realizó el análisis de la varianza,
resultando:

Fuente de Variación Suma de Cuadrados Grados de Libertad


Explicada por la linea de regresión
Falta de Ajuste 227.30
Error Puro 24
No Explicada o Residual 1820.00
Total 6278.72 27

1. Completar el cuadro.
2. ¿Cuántas observaciones x distintas hay en la muestra?
3. Contrastar la linealidad de los datos al 5%
4. ¿Es significativo el contraste de la regresión a un 5%?

Ejercicio 8.- Considerar las siguientes cuestiones:

1. Explica brevemente y con precisión lo que entiendes en un contexto de regresión


lineal simple por:
Problemas propuestos Bloque II: Modelos de Regresión Simple 4

Coeficiente de determinación Contraste de regresión


Falta de ajuste Varianza residual
Int. confianza para una predicción Observación atı́pica con influencia

2. ¿De qué depende la varianza del estimador mı́nimo cuadrático de la pendiente de


una recta de regresión?
3. ¿Qué relación existe entre el test F y el test t para realizar el contraste de re-
gresión?
4. Enumera las hipótesis básicas para un modelo de regresión simple y explica algún
procedimiento para contrastar cada una de ellas.

Ejercicio 9.- En silvicultura, el diámetro de un árbol a la altura del pecho (que se mide
con mucha facilidad) sirve para predecir la altura del árbol (medición muy difı́cil de
realizar). Los datos del archivo Ej B2 9.sav son los diámetros a la altura del pecho
(en centı́metros) y las alturas de 36 abetos blancos del norte.

1. Elaborar un diagrama de dispersión con los datos. ¿Existe algún tipo de relación
funcional entre ambas variables?
2. Supuesto un modelo lineal, obtener la recta estimada por mı́nimos cuadrados e
interpretar sus parámetros.
3. Obtener un intervalo de confianza al 95% para la varianza del modelo de regresión.
4. ¿Cuánto vale el coreficiente de correlación lineal? ¿Es significativamente distinto
de cero?
5. Obtener el cuadro de análisis de la varianza e interpretarlo.
6. Obtener un gráfico de residuos y evaluar su comportamiento.
7. Predecir la altura de un árbol cuyo diámetro a la altura de pecho es 25. Obtener
también un intervalo de confianza al 95% para esa predicción.
8. Considerar otros modelos fácilmente linealizables (ver estimación curvilı́nea en el
SPSS) y evaluar si alguno de ellos parece proporcionar mejor ajuste que el modelo
lineal.

Ejercicio 10.- Varios estudios han demostrado que los lı́quenes son excelentes indicadores
biológicos de la contaminación del aire. Considerar el archivo de datos Ej B2 10.sav,
donde se facilita información de depósitos de: x = N O3− en húmedo (gN/m2 ) y
y =liquen N (% de peso en seco).
Se pregunta:

1. Utilizar un modelo de regresión lineal simple para analizar la información.


Problemas propuestos Bloque II: Modelos de Regresión Simple 5

2. Obtener estimaciones puntuales del modelo e intervalos de confianza al 95% para


las mismas.
3. Calcular el valor de N en lı́quen para un depósito de N O3− de 0.5.
4. Resolver el contraste de regresión empleando el contraste t y el ANOVA.
5. ¿Cuánto vale el coeficiente de determinación?
6. Analizar los residuos.

Potrebbero piacerti anche