Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ejercicio 1
1. Realice TRES modelos de regresión lineal simple utilizando en todos ellos como
variable respuesta la variable sabor y como variable explicativa cada una de las
concentraciones de los tres ácidos. Indique para cada modelo: a) el valor del
coeficiente de regresión, b) si el regresor es significativo (con el p-valor del contraste
correspondiente), c) interprete el coeficiente del modelo que utiliza el ácido acético
como regresor.
El modelo 1 será el acido acético, el modelo 2 el de H2S y el modelo 3 el de ácido
láctico:
MODELO 1:
Call:
lm(formula = sabor ~ acetico, data = dat)
Residuals:
Min 1Q Median 3Q Max
-29.4340 -10.6740 0.5875 8.8995 28.7073
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.65407 5.59632 1.725 0.09595 .
acético 0.05255 0.01708 3.076 0.00477 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
MODELO 2:
Call:
lm(formula = sabor ~ H2S, data = dat)
Residuals:
Min 1Q Median 3Q Max
-19.759 -8.116 -3.019 4.912 33.172
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.038e+01 2.876e+00 7.087 1.28e-07 ***
H2S 1.575e-03 4.508e-04 3.494 0.00166 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
MODELO 3:
Call:
lm(formula = sabor ~ lactico, data = dat)
Residuals:
Min 1Q Median 3Q Max
-20.4685 -9.2754 0.2982 8.6393 26.8697
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -30.833 10.533 -2.927 0.00686 **
lactico 38.726 7.181 5.393 1.06e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
2. Realice TRES modelos de regresión lineal múltiple utilizando en todos ellos como
variable respuesta la variable sabor y como regresores dos de los ácidos. Indique
para cada uno de los modelos: a) los valores de los coeficientes, b) si los regresores
son significativos (con su p-valor), c) indique las diferencias encontradas en los
coeficientes del acético entre el modelo de regresión lineal del apartado 1 y los
modelos del apartado 2 en los que el acético aparece como regresor.
MODELO 1: ácido acético y H2S.
Call:
lm(formula = sabor ~ acetico + H2S, data = dat)
Residuals:
Min 1Q Median 3Q Max
-23.5465 -9.9548 -0.2527 5.2678 25.3864
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 9.8157510 4.9247137 1.993 0.0568 .
acetico 0.0396575 0.0156438 2.535 0.0176 *
H2S 0.0012750 0.0004281 2.978 0.0062 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residuals:
Min 1Q Median 3Q Max
-19.2145 -7.1292 0.7287 9.9050 24.3869
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -28.73165 10.78299 -2.665 0.013067 *
acetico 0.01581 0.01668 0.948 0.351895
lactico 34.09596 8.69552 3.921 0.000574 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residuals:
Min 1Q Median 3Q Max
-18.194 -6.415 -1.875 7.307 28.827
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.271e+01 1.133e+01 -2.005 0.055519 .
H2S 7.085e-04 4.280e-04 1.655 0.109917
lactico 3.169e+01 8.154e+00 3.887 0.000627 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
b) MODELO 1:
Ambos regresores son significativos el p-valor del primer regresor es 0.0176 y
el del segundo es 0.0062.
MODELO 2:
El primer regresor no sería significativo ya su p-valor es 0.351895, mientras el
del segundo regresor si es significativo dado que su p-valor es 0.000574 .
MODELO 3:
El primer regresor no sería significativo ya su p-valor es 0.109917, mientras el
del segundo regresor si es significativo dado que su p-valor es 0.000627.
Residuals:
Min 1Q Median 3Q Max
-16.860 -5.321 -1.422 8.116 26.275
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.041e+01 1.154e+01 -1.769 0.08917 .
acetico 1.642e-02 1.613e-02 1.018 0.31836
H2S 7.183e-04 4.278e-04 1.679 0.10564
lactico 2.679e+01 9.467e+00 2.830 0.00905 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
5. Calcule la matriz de correlación entre los tres ácidos. Utilícela para explicar los
resultados obtenidos en el modelo del apartado 3 y sus diferencias con los modelos
del apartado 1. Calcule el coeficiente de correlación entre los coeficientes del acético
y el láctico en el modelo del apartado 3.
cor(dat)
sabor acetico H2S lactico
sabor 1.0000000 0.5094020 0.5580302 0.7201267
acetico 0.5094020 1.0000000 0.2767023 0.5616802
H2S 0.5580302 0.2767023 1.0000000 0.5209933
lactico 0.7201267 0.5616802 0.5209933 1.0000000
Ejercicio 2
Residuals:
Min 1Q Median 3Q Max
-1.38424 -0.60889 -0.03208 0.52691 1.64812
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.1569 0.4131 7.642 2.47e-12 ***
Sepal.Width -0.6403 0.1338 -4.786 4.07e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 0.7117 on 148 degrees of creedor
Multiple R-squared: 0.134, Adjusted R-squared: 0.1282
F-statistic: 22.91 on 1 and 148 DF, p-value: 4.073e-06
Residuals:
Min 1Q Median 3Q Max
-0.51998 -0.09476 -0.01406 0.10161 0.42333
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.72577 0.15298 -4.744 4.94e-06 ***
Sepal.Width 0.28348 0.04400 6.443 1.59e-09 ***
S2TRUE 1.26653 0.04638 27.306 < 2e-16 ***
S3TRUE 1.90870 0.04138 46.127 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
[0.0264,0.0418].
La bondad de ajuste del modelo simple es 0.134 y la del modelo múltiple 0.9446, con
esto nos damos cuenta de que el primer modelo es mucho peor que el modelo 2. En
cuanto a la diferencia de los regresores de la anchura del sépalo son -0.6403 para el
primer modelo y 0.28348 para el segundo modelo siendo una negativa y otra positiva.
Se deben a que el modelo estaba incompleto y era necesario añadir las variables
cualitativas del tipo de especie que es la flor.