Sei sulla pagina 1di 7

UNIVERSIDAD NACIONAL DE INGENIERÍA

FACULTAD DE INGENIERÍA GEOLÓGICA, MINERA Y METALÚRGICA

SOLUCIÓN DEL ORAL #4

1. En el laboratorio de metalurgia se han medido las diferentes composiciones de cobre (x 1) en


%, que afectan a la dureza de las planchas de acero (y) en kg /mm 2. Los datos son:

Dureza(Y) (Kg/mm2) 72.9 75.1 87.9 90.4 93.7


Contenido de Cu (X1) % 75 80 87 90 95

a) Realice el diagrama de dispersión.

Diagrama de dispersión
100

95 y = 1.1544x - 14.588

90

85

80

75

70
70 75 80 85 90 95 100

b) Halle el modelo de regresión lineal simple: 𝒚 ̂𝒐 + 𝑩


̂𝒊 = 𝑩 ̂ 𝟏𝒙
• Realizamos las siguientes derivadas parciales:

𝜕 ∑𝑛𝑖=1 ∈2𝑖
=0
𝜕𝐵̂𝑜
2
𝜕 ∑𝑛𝑖=1(𝑦𝑖 − 𝐵̂𝑜 − 𝐵̂1 𝑥𝑖 )
=0
𝜕𝐵̂𝑜
𝑛

∑ 2(𝑦𝑖 − 𝐵̂𝑜 − 𝐵̂1 𝑥𝑖 ) (−1) = 0


𝑖=1
𝑛 𝑛

∑ 𝑦𝑖 − 𝑛𝐵̂𝑜 − 𝐵̂1 ∑ 𝑥𝑖 = 0
𝑖=1 𝑖=1
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA GEOLÓGICA, MINERA Y METALÚRGICA

𝒏 𝒏

∑ 𝒚𝒊 = 𝒏𝐵̂𝑜 + 𝐵̂1 ∑ 𝒙𝒊 … … … … … … … (𝑰)


𝒊=𝟏 𝒊=𝟏

𝜕 ∑𝑛𝑖=1 ∈2𝑖
=0
𝜕𝐵̂1
2
𝜕 ∑𝑛𝑖=1(𝑦𝑖 − 𝐵̂𝑜 − 𝐵̂1 𝑥𝑖 )
=0
𝜕𝐵̂1
𝑛

∑ 2(𝑦𝑖 − 𝐵̂𝑜 − 𝐵̂1 𝑥𝑖 ) (−𝑥𝑖 ) = 0


𝑖=1
𝑛 𝑛 𝑛

∑ 𝑥𝑖 𝑦𝑖 − 𝐵̂𝑜 ∑ 𝑥𝑖 − 𝐵̂1 ∑ 𝑥𝑖 2 = 0
𝑖=1 𝑖=1 𝑖=1
𝒏 𝒏 𝒏

∑ 𝒙𝒊 𝒚𝒊 = 𝐵̂𝑜 ∑ 𝒙𝒊 + 𝐵̂1 ∑ 𝒙𝒊 𝟐 … … … … … … … (𝑰𝑰)


𝒊=𝟏 𝒊=𝟏 𝒊=𝟏

• Usamos Lo obtenido en (I) y (II) para hallar la ecuación:

420 = 5𝐵̂𝑜 + 427𝐵̂1


36160,3 = 427𝐵̂𝑜 + 36719𝐵̂1

• Se obtiene los siguientes valores:

𝐵̂𝑜 = −14,58775671
𝐵̂1 = 1.154423381

• La ecuación será:

𝒚 = −𝟏𝟒, 𝟓𝟖𝟕𝟕𝟓𝟔𝟕𝟏 + 𝟏, 𝟏𝟓𝟒𝟒𝟐𝟑𝟑𝟖𝟏𝒙

• Usando “Análisis de datos” se obtuvo el mismo resultado:


Inferior Superior
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% 95.0% 95.0%
Intercepción -14.58775671 12.13918622 -1.20170796 0.315689447 -53.22006505 24.04455162 -53.22006505 24.04455162
Variable X1 1.154423381 0.141654101 8.149593762 0.003863754 0.703616809 1.605229952 0.703616809 1.605229952

c) Interprete B 1, ¿Cuál es el objetivo de plantear el modelo de regresión?

𝑦1 = −14,58775671 + 1,154423381𝑥
𝑦2 = −14,58775671 + 1,154423381(𝒙 + 𝟏)
𝑦2 = −14,58775671 + 1,154423381𝑥 + 1,154423381
𝒚𝟐 = 𝒚𝟏 + 𝟏, 𝟏𝟓𝟒𝟒𝟐𝟑𝟑𝟖𝟏
Al incrementar en una unidad la variable “x” la variable “y” aumenta en promedio en 1,15.
El objetivo del modelo de regresión es poder estimar valores con el mínimo error posible.
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA GEOLÓGICA, MINERA Y METALÚRGICA

d) Interprete y halle r2 (Coeficiente de Determinación)


• Completamos la siguiente tabla:
yi ŷi yi -y yi - ŷi ŷi -y (yi -y)2 (yi - ŷi)2 (ŷi -y)2
72.9 71.9939968 -11.1 0.90600316 -12.0060032 123.21 0.82084173 144.144112
75.1 77.7661137 -8.9 -2.66611374 -6.23388626 79.21 7.1081625 38.8613379
87.9 85.8470774 3.9 2.05292259 1.84707741 15.21 4.21449116 3.41169496
90.4 89.3103476 6.4 1.08965245 5.31034755 40.96 1.18734246 28.1997911
93.7 95.0824645 9.7 -1.38246445 11.0824645 94.09 1.91120797 122.821018
420 420 0.00 0.00 0.00 352.68 15.2420458 337.437954

𝟑𝟑𝟕. 𝟒𝟑𝟕𝟗𝟓𝟒
𝑹𝟐 = = 𝟎. 𝟗𝟓𝟔𝟕𝟖𝟐𝟐𝟐𝟐
𝟑𝟓𝟐. 𝟔𝟖
• Observamos lo obtenido con “Análisis de datos” en Excel:

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.978152454
Coeficiente de determinación R2 0.956782222
R2 ajustado 0.942376296
Error típico 2.254036809
Observaciones 5

𝑹𝟐 = 𝟎. 𝟗𝟓𝟔𝟖
A la vista del resultado analítica podemos afirmar que el ajuste del modelo es bueno, ya que el valor
de R2 = 0,9568 es cercano a 1, en concreto, el 95,68% de la variabilidad de la variable Y a su
promedio es explicado por el modelo de regresión ajustado.

e) Según su modelo de regresión cuanto seria la dureza de la plancha de acero si el contenido de


Cu es del 97%

𝑦 = −14,58775671 + 1,154423381𝑥
𝑦 = −14,58775671 + 1,154423381(97)
𝑦 = 97.391311247
La dureza del Cu sería aproximadamente de 97.39 Kg/mm2
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA GEOLÓGICA, MINERA Y METALÚRGICA

2. En el laboratorio de metalurgia se han medido las diferentes composiciones de cobre (x 1) en


%, temperatura de templado (x2) en ºC que afectan a la dureza de las planchas de acero (y)
en kg /mm2. Los datos son:

Dureza Contenido Temperatura de


(kg/mm2) de Cu % Templado °C
72.9 75 100
75.1 80 120
80.9 87 125
87.4 90 130
90.7 95 140

a) Realice el diagrama de dispersión


• Utilizamos Minitab para realizar el gráfico:

b) Halle las ecuaciones normales (Aplicando derivadas) para determinar el modelo de


̂𝟎 + 𝑩
regresión lineal múltiple Ŷi = 𝑩 ̂𝟏 𝑿𝟏 + 𝑩
̂𝟐 𝑿𝟐
𝑛 𝑛
𝑑𝜀 2
𝐼) = ∑(𝑌 − 𝑌̂ )2 = ∑(𝑌 − 𝐵
̂0 − 𝐵
̂1 𝑋1 − 𝐵
̂2 𝑋2 )2 = 0
𝑑𝐵0
𝑖=1 𝑖=1
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA GEOLÓGICA, MINERA Y METALÚRGICA

𝑛
̂0 − 𝐵
0 = 2 ∑(𝑌 − 𝐵 ̂1 𝑋1 − 𝐵
̂2 𝑋2 )(−1)
𝑖=1

𝑛 𝑛 𝑛 𝑛

∑ 𝑌𝑖 = 𝐵𝑜 ∑ 1 + 𝐵1 ∑ 𝑋1 + 𝐵2 ∑ 𝑋2
𝑖=1 𝑖=1 𝑖=1 𝑖=1

407 = 5𝐵𝑜 + 427𝐵1 + 615𝐵2 … (∝)


𝑛 𝑛
𝑑𝜀 2
𝐼𝐼) = ∑(𝑌 − 𝑌̂ )2 = ∑(𝑌 − 𝐵
̂0 − 𝐵
̂1 𝑋1 − 𝐵
̂2 𝑋2 )2 = 0
𝑑𝐵1
𝑖=1 𝑖=1
𝑛
̂0 − 𝐵
0 = 2 ∑(𝑌 − 𝐵 ̂1 𝑋1 − 𝐵
̂2 𝑋2 )(−𝑋1 )
𝑖=1
𝑛 𝑛 𝑛 𝑛
2
∑ 𝑌𝑖 × 𝑋1 = 𝐵𝑜 ∑ 𝑋1 + 𝐵1 ∑ 𝑋1 + 𝐵2 ∑ 𝑋2 × 𝑋1
𝑖=1 𝑖=1 𝑖=1 𝑖=1

34996.3 = 427𝐵𝑜 + 36719𝐵1 + 52975𝐵2 … (𝛽)


𝑛 𝑛
𝑑𝜀 2
𝐼𝐼𝐼) = ∑(𝑌 − 𝑌̂ )2 = ∑(𝑌 − 𝐵
̂0 − 𝐵
̂1 𝑋1 − 𝐵
̂2 𝑋2 )2 = 0
𝑑𝐵2
𝑖=1 𝑖=1
𝑛
̂0 − 𝐵
0 = 2 ∑(𝑌 − 𝐵 ̂1 𝑋1 − 𝐵
̂2 𝑋2 )(−𝑋2 )
𝑖=1

𝑛 𝑛 𝑛 𝑛

∑ 𝑌𝑖 × 𝑋2 = 𝐵𝑜 ∑ 𝑋2 + 𝐵1 ∑ 𝑋1 × 𝑋2 + 𝐵2 ∑ 𝑋2 2
𝑖=1 𝑖=1 𝑖=1 𝑖=1

50474.5 = 615𝐵𝑜 + 52975𝐵1 + 76525𝐵2 … (𝜃)

𝐷𝑒 (𝛼), (𝛽) 𝑦 (𝜃): 𝐵𝑜 = −5.5, 𝐵1 = 1.33, 𝐵2 = −0.2

𝒀𝒊 = −𝟓. 𝟓 + 𝟏. 𝟑𝟑𝑿𝟏 − 𝟎. 𝟐𝑿𝟐

c) Plantee matricialmente el Modelo de Regresión Poblacional.


72.9 1 75 100 ∈1
75.1 1 80 120 𝐵0 ∈2
80.9 = 1 87 125 × [𝐵1 ] + ∈3
87.4 1 90 130 𝐵2 ∈4
[90.7 ] [1 95 140] [ ∈ 5]
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA GEOLÓGICA, MINERA Y METALÚRGICA

d) Determine el vector de coeficientes de regresión. 𝑩 = (𝒙′ 𝒙)−𝟏 (𝒙′ 𝒚)

Como el sistema de matrices es un "Sistema compatible indeterminado", necesitamos hallar soluciones


que hagan que los errores (e) sean mínimos.

𝑀𝑖𝑛ൣ(𝑒1)2⬚ + (𝑒2)2⬚ + … + (𝑒5)2⬚ ൧ = 𝑀𝑖𝑛(𝑒 𝑇 𝑒)

𝑒 𝑇 𝑒 = [𝑦 − 𝑥𝐵]𝑇 [𝑦 − 𝑥𝐵] = 𝑦 𝑇 𝑦 − 𝑦 𝑇 𝑥𝐵 − 𝐵𝑇 𝑥 𝑇 𝑦 + 𝐵𝑇 𝑥 𝑇 xB

𝑒 𝑇 𝑒 = 𝑓(𝐵) = 𝑦 𝑇 𝑦 − 2𝑦 𝑇 𝑥𝐵 + 𝐵𝑇 𝑥 𝑇 xB
Hallamos un valor optimo, en este caso el minimo:

𝑑𝑓
= −2𝑦 𝑇 𝑥 + 2𝑥 𝑇 𝑥𝐵 = 0
𝑑𝐵
(𝑥 𝑇 𝑥)𝐵 = 𝑦 𝑇 𝑥

𝐵 = 𝐵̂ = (𝑥 𝑇 𝑥)−1 (𝑥 𝑇 𝑦)

̂= 𝑒 = 𝑦 − 𝑥𝐵 = 𝑦 − 𝑥𝐵̂, vector de error.


∈: ∈

e) Interprete 𝑩𝟏 y 𝑩𝟐 .
𝐵1 : 𝑃𝑜𝑟 𝑐𝑎𝑑𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑞𝑢𝑒 𝑎𝑢𝑚𝑒𝑛𝑡𝑒 𝑒𝑛 𝑐𝑜𝑛𝑡𝑒𝑛𝑖𝑑𝑜 𝑑𝑒 𝑐𝑜𝑏𝑟𝑒 𝑠𝑢 𝑑𝑢𝑟𝑒𝑧𝑎 𝑎𝑢𝑚𝑒𝑛𝑡𝑎 𝑒𝑛 1.33%
𝐵2 : 𝑃𝑜𝑟 𝑐𝑎𝑑𝑎 𝑢𝑛𝑖𝑑𝑎𝑑 𝑑𝑒 𝑝𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑞𝑢𝑒 𝑎𝑢𝑚𝑒𝑛𝑡𝑒 𝑙𝑎 𝑡𝑒𝑚𝑝𝑒𝑟𝑎𝑡𝑢𝑟𝑎 𝑑𝑒 𝑡𝑒𝑚𝑝𝑙𝑎𝑑𝑜 𝑠𝑢 𝑑𝑢𝑟𝑒𝑧𝑎 𝑑𝑖𝑠𝑚𝑖𝑛𝑢𝑦𝑒 𝑒𝑛 0.2%

f)
f.1) Interprete y halle 𝒓𝒚.𝟏𝟐 𝟐 (Coeficiente de Determinación)

∑𝑇𝑡=1(𝑦⏞𝑡 − 𝑦̀ )2
𝑅2 =
∑𝑇𝑡=1(𝑦𝑡 − 𝑦̇ )2

Aplicando los cálculos: 𝑅 2 = 1.156612451 → 𝑅 = 1.075459182


La interpretación del Coeficiente de Determinación es el porcentaje en que varía la dureza cuando
varía el porcentaje de cobre y la Temperatura de Templado.
f.2) Interprete Coeficiente de no determinación (𝟏 − 𝒓𝟐 ).
Como 𝑅2 = 1.156612451 → 1 − 𝑅 2 = −0.156612451
La interpretación del Coeficiente de no determinación indica la proporción de la variación total de
la variable Y que no es explicada por la variable X.
UNIVERSIDAD NACIONAL DE INGENIERÍA
FACULTAD DE INGENIERÍA GEOLÓGICA, MINERA Y METALÚRGICA

f.3) Explique e interprete el Coeficiente de Correlación. (𝒓)


Es una medida estadística que cuantifica la dependencia lineal entre dos variables es decir, si se
representa en un diagrama de dispersión los valores que toman dos variables, el coeficiente de
correlación lineal señalará lo bien o lo mal que el conjunto de puntos representados se aproxima a
una recta.
g) ¿Cuál es el criterio matemática-estadístico para los modelos de regresión?, mencione
2 objetivos de los modelos de regresión ¿Cuál de las 2 variables tiene mayor efecto
sobre la variable dependiente?
• El coeficiente de determinación, este criterio aumenta al ir introduciendo nuevas variables
en el modelo. Este criterio tiene un inconveniente de no tener en cuenta el número de
variables regresoras. Tiende a sobre ajustar y utilizar demasiadas variables regresoras.
• Varianza Residual, 𝑠𝑅 2 . Un buen criterio de selección del subconjunto de variables es
elegir el subconjunto de j variables que minimiza el valor scmR, siento esta la varianza
residual obtenida con el modelo de j variables.
La variable independiente que tiene mayor efecto sobre la variable independiente es El contenido
de cobre en % ya que es mayor sobre la Temperatura de Templado
h) Realice la predicción 𝒚 = 𝟐 (𝒔𝒊 𝒙𝟏 = 𝟗𝟖 𝒚 𝒙𝟐 = 𝟏𝟑𝟓)
𝑦 = −5.5 + 1.33𝑥1 − 0.2𝑥2
Reemplazando valores:
𝑦 = −5.5 + 1.33𝑥1 − 0.2𝑥2 = 74.25
i) Halle el vector error 𝝐𝟏 = 𝒚𝟏 − 𝒚𝟏̇
Si 𝑦1 = 72.9 y 𝑦̇ 1 = −5.5 + 1.33(75) − 0.2(100) = 72
Entonces:
𝜖1 = 𝑦1 − 𝑦1̇ = 0.9

Potrebbero piacerti anche