Sei sulla pagina 1di 7

Tarea 5:

Ejercicio 1

1. Realice TRES modelos de regresión lineal simple utilizando en todos ellos como
variable respuesta la variable sabor y como variable explicativa cada una de las
concentraciones de los tres ácidos. Indique para cada modelo: a) el valor del
coeficiente de regresión, b) si el regresor es significativo (con el p-valor del contraste
correspondiente), c) interprete el coeficiente del modelo que utiliza el ácido acético
como regresor.
El modelo 1 será el acido acético, el modelo 2 el de H2S y el modelo 3 el de ácido
láctico:
MODELO 1:
Call:
lm(formula = sabor ~ acetico, data = dat)

Residuals:
Min 1Q Median 3Q Max
-29.4340 -10.6740 0.5875 8.8995 28.7073

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.65407 5.59632 1.725 0.09595 .
acético 0.05255 0.01708 3.076 0.00477 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 14.46 on 27 degrees of freedom


Multiple R-squared: 0.2595, Adjusted R-squared: 0.2321
F-statistic: 9.461 on 1 and 27 DF, p-value: 0.004766

MODELO 2:
Call:
lm(formula = sabor ~ H2S, data = dat)

Residuals:
Min 1Q Median 3Q Max
-19.759 -8.116 -3.019 4.912 33.172

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.038e+01 2.876e+00 7.087 1.28e-07 ***
H2S 1.575e-03 4.508e-04 3.494 0.00166 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 13.94 on 27 degrees of freedom


Multiple R-squared: 0.3114, Adjusted R-squared: 0.2859
F-statistic: 12.21 on 1 and 27 DF, p-value: 0.001658

MODELO 3:
Call:
lm(formula = sabor ~ lactico, data = dat)

Residuals:
Min 1Q Median 3Q Max
-20.4685 -9.2754 0.2982 8.6393 26.8697

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -30.833 10.533 -2.927 0.00686 **
lactico 38.726 7.181 5.393 1.06e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11.66 on 27 degrees of freedom


Multiple R-squared: 0.5186, Adjusted R-squared: 0.5008
F-statistic: 29.08 on 1 and 27 DF, p-value: 1.061e-05
a) El valor valor del coeficiente de regresión en cada modelo es:
Modelo 1: β1=0.05255
Modelo 2: β1=1.575e-03
Modelo 3: β1=38.726
b) Modelo 1: es significativo debido a que el p-valor=0.00477<α=0.05.
Modelo 2: : es significativo debido a que el p-valor=0.00166<α=0.05.
Model0 3: : es muy significativo debido a que el p-valor=1.06e-05<α=0.05.
c) Podemos observar que por cada 0.05255 unidades de concentración de ácido
acético tenemos 1 tono de sabor más.

2. Realice TRES modelos de regresión lineal múltiple utilizando en todos ellos como
variable respuesta la variable sabor y como regresores dos de los ácidos. Indique
para cada uno de los modelos: a) los valores de los coeficientes, b) si los regresores
son significativos (con su p-valor), c) indique las diferencias encontradas en los
coeficientes del acético entre el modelo de regresión lineal del apartado 1 y los
modelos del apartado 2 en los que el acético aparece como regresor.
MODELO 1: ácido acético y H2S.
Call:
lm(formula = sabor ~ acetico + H2S, data = dat)

Residuals:
Min 1Q Median 3Q Max
-23.5465 -9.9548 -0.2527 5.2678 25.3864

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.8157510 4.9247137 1.993 0.0568 .
acetico 0.0396575 0.0156438 2.535 0.0176 *
H2S 0.0012750 0.0004281 2.978 0.0062 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 12.72 on 26 degrees of freedom


Multiple R-squared: 0.4479, Adjusted R-squared: 0.4054
F-statistic: 10.55 on 2 and 26 DF, p-value: 0.0004432

MODELO 2: ácido acético y ácido láctico.


Call:
lm(formula = sabor ~ acetico + lactico, data = dat)

Residuals:
Min 1Q Median 3Q Max
-19.2145 -7.1292 0.7287 9.9050 24.3869

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -28.73165 10.78299 -2.665 0.013067 *
acetico 0.01581 0.01668 0.948 0.351895
lactico 34.09596 8.69552 3.921 0.000574 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11.68 on 26 degrees of freedom


Multiple R-squared: 0.5347, Adjusted R-squared: 0.4989
F-statistic: 14.94 on 2 and 26 DF, p-value: 4.797e-05

MODELO 3: H2S y ácido láctico.


Call:
lm(formula = sabor ~ H2S + lactico, data = dat)

Residuals:
Min 1Q Median 3Q Max
-18.194 -6.415 -1.875 7.307 28.827

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.271e+01 1.133e+01 -2.005 0.055519 .
H2S 7.085e-04 4.280e-04 1.655 0.109917
lactico 3.169e+01 8.154e+00 3.887 0.000627 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11.3 on 26 degrees of freedom


Multiple R-squared: 0.5645, Adjusted R-squared: 0.531
F-statistic: 16.85 on 2 and 26 DF, p-value: 2.029e-05
a) MODELO 1:β0= 9.8157510, β1= 0.0396575 y β2=0.0012750
MODELO 2:β0=-28.73165 , β1=0.01581 y β2=34.09596
MODELO 3:β0=-2.271e+01 , β1= 7.085e-04y β2=3.169e+01

b) MODELO 1:
Ambos regresores son significativos el p-valor del primer regresor es 0.0176 y
el del segundo es 0.0062.
MODELO 2:
El primer regresor no sería significativo ya su p-valor es 0.351895, mientras el
del segundo regresor si es significativo dado que su p-valor es 0.000574 .
MODELO 3:
El primer regresor no sería significativo ya su p-valor es 0.109917, mientras el
del segundo regresor si es significativo dado que su p-valor es 0.000627.

c) La diferencia entre el coeficiente de ambos modelos no es muy grande, pero si


podemos observar que cuando el modelo es múltiple el regresor crece.

3. Realice UN modelo de regresión lineal múltiple utilizando como variable respuesta la


variable sabor y como regresores los tres ácidos. Interprete los coeficientes de todos
los regresores indicando si son significativos o no (con su p-valor).
Call:
lm(formula = sabor ~ acetico + H2S + lactico, data = dat)

Residuals:
Min 1Q Median 3Q Max
-16.860 -5.321 -1.422 8.116 26.275

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.041e+01 1.154e+01 -1.769 0.08917 .
acetico 1.642e-02 1.613e-02 1.018 0.31836
H2S 7.183e-04 4.278e-04 1.679 0.10564
lactico 2.679e+01 9.467e+00 2.830 0.00905 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 11.29 on 25 degrees of freedom


Multiple R-squared: 0.5818, Adjusted R-squared: 0.5316
F-statistic: 11.59 on 3 and 25 DF, p-value: 5.947e-05

El primer coeficiente estimado seria β0=-2.041e+01 pero no seria significativo ya que


su p-valor=0.08917. Los coeficientes que dados sus p-valores tampoco son
significativos serían: β1=1.642e-02 y β2=7.183e-04 y sus p-valores serán
respectivamente: 0.31836 y 0.10564.

Interpretación de los coeficientes:


El β0 no tiene una interpretación física, mientras que por cada unidad de
concentración de ácido acético aumentamos 1.642e-02 el tipo de sabor, por cada
unidad de concentración H2S aumentamos 7.183e-04 el sabor y por último, por cada
unidad de ácido láctico aumentamos 2.679e+01 el tipo de sabor.

4. Entre los 7 modelos estimados:


• Elija el más adecuado para explicar el efecto del regresor acético en el sabor. ¿Se
puede concluir que el ácido acético tiene un efecto significativo en el sabor con una
confianza del 95%?
El efecto del regresor más adecuado seria el del modelo de regresión simple ya que su
p-valor=0.00477 es el que hace que sea más significativo que los demás. Si tiene un
efecto significativo debido a que el p-valor del regresor es menor que α=0.05.

• Elija el más adecuado para predecir el sabor de un queso cheddar.


Debido al valor del coeficiente de determinación de todos los modelos podemos decir
que el mejor de todos sería el modelo:
sabor=β0+β1*acetico+ β2*H2S+β3*láctico +errori.
ya que su R2 es el mayor de todos y es igual a 0.5818.

5. Calcule la matriz de correlación entre los tres ácidos. Utilícela para explicar los
resultados obtenidos en el modelo del apartado 3 y sus diferencias con los modelos
del apartado 1. Calcule el coeficiente de correlación entre los coeficientes del acético
y el láctico en el modelo del apartado 3.
cor(dat)
sabor acetico H2S lactico
sabor 1.0000000 0.5094020 0.5580302 0.7201267
acetico 0.5094020 1.0000000 0.2767023 0.5616802
H2S 0.5580302 0.2767023 1.0000000 0.5209933
lactico 0.7201267 0.5616802 0.5209933 1.0000000

Ejercicio 2

1. Realizar la regresión simple de la anchura del pétalo en función de la anchura del


sépalo. Obtener las estimaciones de los parámetros del modelo.
Call:
lm(formula = Petal.Width ~ Sepal.Width, data = dat)

Residuals:
Min 1Q Median 3Q Max
-1.38424 -0.60889 -0.03208 0.52691 1.64812

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.1569 0.4131 7.642 2.47e-12 ***
Sepal.Width -0.6403 0.1338 -4.786 4.07e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7117 on 148 degrees of creedor
Multiple R-squared: 0.134, Adjusted R-squared: 0.1282
F-statistic: 22.91 on 1 and 148 DF, p-value: 4.073e-06

Las estimaciones de los parámetros del modelo serán: β0=3.1569, β1=-0.6403,


SR2=0.5065.
2. ¿Cuáles son los estadísticos y p-valores de los contrastes individuales (sobre los
coeficientes) y el contraste general? Cuantificar la bondad del ajuste del modelo.
Los estadísticos de los coeficientes estimados del modelo serían un contraste t-student
con grados de libertad 148, y que serían de los respectivamente: 0.4131 y 0.1338. Del
mismo modo, los p-valores serían 7.642 2.47e-12 y 4.786 4.07e-06 en valor absoluto.
Por otro lado el estadístico del contraste general es 22.91, y su p-valor=4.073e-06. Por
último, la bondad de ajuste del modelo es: R2=0.134.

3. Realizar la regresión múltiple de la anchura del pétalo en función de la anchura del


sépalo y la variable cualitativa “especie”. Obtener e interpretar los parámetros del
modelo.
Tomaremos como referencia las flores de la especie setosa.
Call:
lm(formula = Petal.Width ~ Sepal.Width + S2 + S3, data = dat)

Residuals:
Min 1Q Median 3Q Max
-0.51998 -0.09476 -0.01406 0.10161 0.42333

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.72577 0.15298 -4.744 4.94e-06 ***
Sepal.Width 0.28348 0.04400 6.443 1.59e-09 ***
S2TRUE 1.26653 0.04638 27.306 < 2e-16 ***
S3TRUE 1.90870 0.04138 46.127 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.1812 on 146 degrees of freedom


Multiple R-squared: 0.9446, Adjusted R-squared: 0.9435
F-statistic: 830.2 on 3 and 146 DF, p-value: < 2.2e-16

Las estimaciones de los parámetros del modelo serán: β0=-0.72577, β1=0.28348,


αS2=1.26653, αS3=1.90870 y SR2=0.032.

Interpretación de los parámetros:


Por cada unidad de la anchura del sépalo disminuye 0.72577 la anchura del pétalo. Por
otro lado por ser de la especie versicolor aumenta 1.26653 la anchura y por ser
virginica 1.90870.
4. ¿Cuáles son los estadísticos y p-valores de los contrastes individuales (sobre los
coeficientes) y el contraste general? Calcular un intervalo de confianza para la
varianza del error experimental.
Los estadísticos de los coeficientes estimados del modelo serían un contraste t-student
con grados de libertad 148, y que serían de los respectivamente: -4.744, 6.443, 27.306
y 46.127 . Del mismo modo, los p-valores serían 4.94e-06, 1.59e-09, < 2e-16 y < 2e-16.
Por otro lado el estadístico del contraste general es 830.2, y su p-valor=< 2.2e-16. Por
último, el intervalo pedido será:
chia=qchisq(0.025, 148, lower.tail=T)
chib=qchisq(0.975, 148, lower.tail=T)
LInferior=148*0.1812^2/chib
LSuperior=148*0.1812^2/chia

[0.0264,0.0418].

5. Comparar la bondad del ajuste y los coeficientes de regresión de la anchura del


sépalo de las regresiones simple y múltiple. ¿A qué pueden deberse las diferencias?
Apoyarse en gráficos tipo plot y en la matriz de correlación de los regresores.

La bondad de ajuste del modelo simple es 0.134 y la del modelo múltiple 0.9446, con
esto nos damos cuenta de que el primer modelo es mucho peor que el modelo 2. En
cuanto a la diferencia de los regresores de la anchura del sépalo son -0.6403 para el
primer modelo y 0.28348 para el segundo modelo siendo una negativa y otra positiva.
Se deben a que el modelo estaba incompleto y era necesario añadir las variables
cualitativas del tipo de especie que es la flor.

Potrebbero piacerti anche