Tarea 5-3

Tarea 5:
Ejercicio 1
1. Realice TRES modelos de regresión lineal simple utilizando en todos ellos como
variable respuesta la variable sabor y como variable explicativa cada una de las
concentraciones de los tres ácidos. Indique para cada modelo: a) el valor del
coeficiente de regresión, b) si el regresor es significativo (con el p-valor del contraste
correspondiente), c) interprete el coeficiente del modelo que utiliza el ácido acético
como regresor.
El modelo 1 será el acido acético, el modelo 2 el de H2S y el modelo 3 el de ácido
láctico:
MODELO 1:
Call:
lm(formula = sabor ~ acetico, data = dat)
Residuals:
Min 1Q Median 3Q Max
-29.4340 -10.6740 0.5875 8.8995 28.7073
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.65407 5.59632 1.725 0.09595 .
acético 0.05255 0.01708 3.076 0.00477 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 14.46 on 27 degrees of freedom

Multiple R-squared: 0.2595, Adjusted R-squared: 0.2321
F-statistic: 9.461 on 1 and 27 DF, p-value: 0.004766
MODELO 2:
Call:
lm(formula = sabor ~ H2S, data = dat)
Residuals:
-19.759 -8.116 -3.019 4.912 33.172
Coefficients:
(Intercept) 2.038e+01 2.876e+00 7.087 1.28e-07 ***
H2S 1.575e-03 4.508e-04 3.494 0.00166 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

MODELO 3:
Call:
lm(formula = sabor ~ lactico, data = dat)
Residuals:
-20.4685 -9.2754 0.2982 8.6393 26.8697
Coefficients:
(Intercept) -30.833 10.533 -2.927 0.00686 **
lactico 38.726 7.181 5.393 1.06e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

F-statistic: 29.08 on 1 and 27 DF, p-value: 1.061e-05
a) El valor valor del coeficiente de regresión en cada modelo es:
Modelo 1: β1=0.05255
Modelo 2: β1=1.575e-03
Modelo 3: β1=38.726
b) Modelo 1: es significativo debido a que el p-valor=0.00477<α=0.05.
Modelo 2: : es significativo debido a que el p-valor=0.00166<α=0.05.
Model0 3: : es muy significativo debido a que el p-valor=1.06e-05<α=0.05.
c) Podemos observar que por cada 0.05255 unidades de concentración de ácido
acético tenemos 1 tono de sabor más.
2. Realice TRES modelos de regresión lineal múltiple utilizando en todos ellos como
variable respuesta la variable sabor y como regresores dos de los ácidos. Indique
para cada uno de los modelos: a) los valores de los coeficientes, b) si los regresores
son significativos (con su p-valor), c) indique las diferencias encontradas en los
coeficientes del acético entre el modelo de regresión lineal del apartado 1 y los
modelos del apartado 2 en los que el acético aparece como regresor.
MODELO 1: ácido acético y H2S.
Call:
lm(formula = sabor ~ acetico + H2S, data = dat)
Residuals:
-23.5465 -9.9548 -0.2527 5.2678 25.3864
Coefficients:
(Intercept) 9.8157510 4.9247137 1.993 0.0568 .
acetico 0.0396575 0.0156438 2.535 0.0176 *
H2S 0.0012750 0.0004281 2.978 0.0062 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

MODELO 2: ácido acético y ácido láctico.

Call:
lm(formula = sabor ~ acetico + lactico, data = dat)
Residuals:
-19.2145 -7.1292 0.7287 9.9050 24.3869
Coefficients:
(Intercept) -28.73165 10.78299 -2.665 0.013067 *
acetico 0.01581 0.01668 0.948 0.351895
lactico 34.09596 8.69552 3.921 0.000574 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

MODELO 3: H2S y ácido láctico.

Call:
lm(formula = sabor ~ H2S + lactico, data = dat)
Residuals:
-18.194 -6.415 -1.875 7.307 28.827
Coefficients:
(Intercept) -2.271e+01 1.133e+01 -2.005 0.055519 .
H2S 7.085e-04 4.280e-04 1.655 0.109917
lactico 3.169e+01 8.154e+00 3.887 0.000627 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

a) MODELO 1:β0= 9.8157510, β1= 0.0396575 y β2=0.0012750
MODELO 2:β0=-28.73165 , β1=0.01581 y β2=34.09596
MODELO 3:β0=-2.271e+01 , β1= 7.085e-04y β2=3.169e+01
b) MODELO 1:
Ambos regresores son significativos el p-valor del primer regresor es 0.0176 y
el del segundo es 0.0062.
MODELO 2:
El primer regresor no sería significativo ya su p-valor es 0.351895, mientras el
del segundo regresor si es significativo dado que su p-valor es 0.000574 .
MODELO 3:
El primer regresor no sería significativo ya su p-valor es 0.109917, mientras el
del segundo regresor si es significativo dado que su p-valor es 0.000627.
c) La diferencia entre el coeficiente de ambos modelos no es muy grande, pero si

podemos observar que cuando el modelo es múltiple el regresor crece.
3. Realice UN modelo de regresión lineal múltiple utilizando como variable respuesta la

variable sabor y como regresores los tres ácidos. Interprete los coeficientes de todos
los regresores indicando si son significativos o no (con su p-valor).
Call:
lm(formula = sabor ~ acetico + H2S + lactico, data = dat)
Residuals:
-16.860 -5.321 -1.422 8.116 26.275
Coefficients:
(Intercept) -2.041e+01 1.154e+01 -1.769 0.08917 .
acetico 1.642e-02 1.613e-02 1.018 0.31836
H2S 7.183e-04 4.278e-04 1.679 0.10564
lactico 2.679e+01 9.467e+00 2.830 0.00905 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

El primer coeficiente estimado seria β0=-2.041e+01 pero no seria significativo ya que

su p-valor=0.08917. Los coeficientes que dados sus p-valores tampoco son
significativos serían: β1=1.642e-02 y β2=7.183e-04 y sus p-valores serán
respectivamente: 0.31836 y 0.10564.
Interpretación de los coeficientes:

El β0 no tiene una interpretación física, mientras que por cada unidad de
concentración de ácido acético aumentamos 1.642e-02 el tipo de sabor, por cada
unidad de concentración H2S aumentamos 7.183e-04 el sabor y por último, por cada
unidad de ácido láctico aumentamos 2.679e+01 el tipo de sabor.
4. Entre los 7 modelos estimados:

• Elija el más adecuado para explicar el efecto del regresor acético en el sabor. ¿Se
puede concluir que el ácido acético tiene un efecto significativo en el sabor con una
confianza del 95%?
El efecto del regresor más adecuado seria el del modelo de regresión simple ya que su
p-valor=0.00477 es el que hace que sea más significativo que los demás. Si tiene un
efecto significativo debido a que el p-valor del regresor es menor que α=0.05.
• Elija el más adecuado para predecir el sabor de un queso cheddar.

Debido al valor del coeficiente de determinación de todos los modelos podemos decir
que el mejor de todos sería el modelo:
sabor=β0+β1*acetico+ β2*H2S+β3*láctico +errori.
ya que su R2 es el mayor de todos y es igual a 0.5818.
5. Calcule la matriz de correlación entre los tres ácidos. Utilícela para explicar los
resultados obtenidos en el modelo del apartado 3 y sus diferencias con los modelos
del apartado 1. Calcule el coeficiente de correlación entre los coeficientes del acético
y el láctico en el modelo del apartado 3.
cor(dat)
sabor acetico H2S lactico
sabor 1.0000000 0.5094020 0.5580302 0.7201267
acetico 0.5094020 1.0000000 0.2767023 0.5616802
H2S 0.5580302 0.2767023 1.0000000 0.5209933
lactico 0.7201267 0.5616802 0.5209933 1.0000000
Ejercicio 2
1. Realizar la regresión simple de la anchura del pétalo en función de la anchura del

sépalo. Obtener las estimaciones de los parámetros del modelo.
Call:
lm(formula = Petal.Width ~ Sepal.Width, data = dat)
Residuals:
-1.38424 -0.60889 -0.03208 0.52691 1.64812
Coefficients:
(Intercept) 3.1569 0.4131 7.642 2.47e-12 ***
Sepal.Width -0.6403 0.1338 -4.786 4.07e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7117 on 148 degrees of creedor
Las estimaciones de los parámetros del modelo serán: β0=3.1569, β1=-0.6403,

SR2=0.5065.
2. ¿Cuáles son los estadísticos y p-valores de los contrastes individuales (sobre los
coeficientes) y el contraste general? Cuantificar la bondad del ajuste del modelo.
Los estadísticos de los coeficientes estimados del modelo serían un contraste t-student
con grados de libertad 148, y que serían de los respectivamente: 0.4131 y 0.1338. Del
mismo modo, los p-valores serían 7.642 2.47e-12 y 4.786 4.07e-06 en valor absoluto.
Por otro lado el estadístico del contraste general es 22.91, y su p-valor=4.073e-06. Por
último, la bondad de ajuste del modelo es: R2=0.134.
3. Realizar la regresión múltiple de la anchura del pétalo en función de la anchura del

sépalo y la variable cualitativa “especie”. Obtener e interpretar los parámetros del
modelo.
Tomaremos como referencia las flores de la especie setosa.
Call:
lm(formula = Petal.Width ~ Sepal.Width + S2 + S3, data = dat)
Residuals:
-0.51998 -0.09476 -0.01406 0.10161 0.42333
Coefficients:
(Intercept) -0.72577 0.15298 -4.744 4.94e-06 ***
Sepal.Width 0.28348 0.04400 6.443 1.59e-09 ***
S2TRUE 1.26653 0.04638 27.306 < 2e-16 ***
S3TRUE 1.90870 0.04138 46.127 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

F-statistic: 830.2 on 3 and 146 DF, p-value: < 2.2e-16
Las estimaciones de los parámetros del modelo serán: β0=-0.72577, β1=0.28348,

αS2=1.26653, αS3=1.90870 y SR2=0.032.
Interpretación de los parámetros:

Por cada unidad de la anchura del sépalo disminuye 0.72577 la anchura del pétalo. Por
otro lado por ser de la especie versicolor aumenta 1.26653 la anchura y por ser
virginica 1.90870.
4. ¿Cuáles son los estadísticos y p-valores de los contrastes individuales (sobre los
coeficientes) y el contraste general? Calcular un intervalo de confianza para la
varianza del error experimental.
Los estadísticos de los coeficientes estimados del modelo serían un contraste t-student
con grados de libertad 148, y que serían de los respectivamente: -4.744, 6.443, 27.306
y 46.127 . Del mismo modo, los p-valores serían 4.94e-06, 1.59e-09, < 2e-16 y < 2e-16.
Por otro lado el estadístico del contraste general es 830.2, y su p-valor=< 2.2e-16. Por
último, el intervalo pedido será:
chia=qchisq(0.025, 148, lower.tail=T)
chib=qchisq(0.975, 148, lower.tail=T)
LInferior=148*0.1812^2/chib
LSuperior=148*0.1812^2/chia
[0.0264,0.0418].
5. Comparar la bondad del ajuste y los coeficientes de regresión de la anchura del

sépalo de las regresiones simple y múltiple. ¿A qué pueden deberse las diferencias?
Apoyarse en gráficos tipo plot y en la matriz de correlación de los regresores.
La bondad de ajuste del modelo simple es 0.134 y la del modelo múltiple 0.9446, con
esto nos damos cuenta de que el primer modelo es mucho peor que el modelo 2. En
cuanto a la diferencia de los regresores de la anchura del sépalo son -0.6403 para el
primer modelo y 0.28348 para el segundo modelo siendo una negativa y otra positiva.
Se deben a que el modelo estaba incompleto y era necesario añadir las variables
cualitativas del tipo de especie que es la flor.

Tarea 5-3

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Tarea 5-3

Caricato da

Copyright:

Formati disponibili

Tarea 5:

Residual standard error: 14.46 on 27 degrees of freedom

Residual standard error: 13.94 on 27 degrees of freedom

Residual standard error: 11.66 on 27 degrees of freedom

Residual standard error: 12.72 on 26 degrees of freedom

MODELO 2: ácido acético y ácido láctico.

Residual standard error: 11.68 on 26 degrees of freedom

MODELO 3: H2S y ácido láctico.

Residual standard error: 11.3 on 26 degrees of freedom

c) La diferencia entre el coeficiente de ambos modelos no es muy grande, pero si

3. Realice UN modelo de regresión lineal múltiple utilizando como variable respuesta la

Residual standard error: 11.29 on 25 degrees of freedom

El primer coeficiente estimado seria β0=-2.041e+01 pero no seria significativo ya que

Interpretación de los coeficientes:

4. Entre los 7 modelos estimados:

• Elija el más adecuado para predecir el sabor de un queso cheddar.

1. Realizar la regresión simple de la anchura del pétalo en función de la anchura del

Las estimaciones de los parámetros del modelo serán: β0=3.1569, β1=-0.6403,

3. Realizar la regresión múltiple de la anchura del pétalo en función de la anchura del

Residual standard error: 0.1812 on 146 degrees of freedom

Las estimaciones de los parámetros del modelo serán: β0=-0.72577, β1=0.28348,

Interpretación de los parámetros:

5. Comparar la bondad del ajuste y los coeficientes de regresión de la anchura del

Potrebbero piacerti anche