Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1
En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta
sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para
predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro
promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una
herramienta se muestran a continuación:
Horas de uso Diámetro (mm)
16 26.2
32 25.7
48 26.0
64 27.7
80 28.3
96 29.5
112 30.1
128 31.8
144 31.4
160 33.4
176 33.6
192 32.7
208 35.0
224 36.1
240 35.7
256 36.2
272 36.8
288 39.1
304 38.7
320 39.2
a) ¿En este problema cuál variable se considera independiente y cuál dependiente?
R: La variable dependiente serán las horas de trabajo mientras que la independiente será el
diámetro de la pieza.
b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo
de relación observa y cuáles son algunos hechos especiales? Relación positiva fuerte
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de
hipótesis y verifique residuos)
d) ¿La calidad de ajuste es satisfactoria? Argumente
e) Si el diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa
herramienta?
f) Señale el valor de la pendiente de la recta e interprételo en términos prácticos
g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad de
ajuste.
y = 0.0464x + 24.863
R² = 0.9768
grafica de dispersion
45
40
35
30
horas de trabajo
25
20
15
10
0
0 50 100 150 200 250 300 350
diametro de la pieza
y = 0.0464x + 24.863
Columna 1 Columna 2
R² = 0.9768 grafica de dispersion
Columna 1 1 45
Columna 2 0.988325658 1
40
35
30
horas de trabajo
25
Resumen 20
15
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.988325658 10
Coeficiente de determinación R^2 0.976787606
5
R^2 ajustado 0.975498029
Error típico 14.81680342 0
Observaciones 20 0 50 100 150 200 250 300 350
diametro de la pieza
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 166288.3221 166288.3221 757.447808 3.66724E-16
Residuos 18 3951.677944 219.5376635
Total 19 170240
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción -519.3957825 25.19522479 -20.61485011 5.7073E-14 -572.3289856 -466.462579 -572.328986 -466.462579
Variable X 1 21.04702335 0.764740915 27.52176971 3.6672E-16 19.4403623 22.6536844 19.4403623 22.6536844
a) La variable independiente son las horas de uso y la variable dependiente es el diámetro de las
piezas.
b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las
horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro.
40
37
Diámetro
34
31
28
25
0 100 200 300 400
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
las horas de uso y el diámetro está dada por:
Diámetro = 24.8632 + 0.0464098*Horas de uso
La cual se puede observar en el grafico del modelo ajustado:
40
37
Diámetro
34
31
28
25
0 100 200 300 400
Horas de uso
Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables horas de uso y diámetro si existe una relación.
Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 24.8632 0.323206 76.9267 0.0000
Pendiente 0.0464098 0.00168629 27.5218 0.0000
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 366.674 1 366.674 757.45 0.0000
Residuo 8.71365 18 0.484092
Total (Corr.) 375.388 19
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel
de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la
hipótesis nula.
Verificación de supuestos:
El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los predichos,
los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón definido.
Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso
1.2
0.8
0.4
residuo
-0.4
-0.8
-1.2
25 28 31 34 37 40
El supuesto de independencia si se cumple ya que
predicho los puntos o residuos se encuentran dispersos
Diámetro
de forma arbitraria dentro del grafico de residuos vs número de corrida, sin cumplir ninguna tendencia.
Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso
1.2
0.8
0.4
residuo
-0.4
-0.8
-1.2
0 4 8 12 16 20
d) el coeficiente de determinación R2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene
una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro.
e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la
cual está más allá de la región que contiene a las observaciones originales está mal ya que
probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región
de estudio va de 25.7 a 39.2 mm de diámetro.
f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y) con
respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se varíen
las horas de uso.
g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de nuestro
modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste será mayor.
Problema No. 2
Se piensa que el número de libras de vapor consumidas mensualmente por una planta química se
relaciona con la temperatura ambiente promedio (en °F) de ese mes. En la tabla siguiente se muestra
la temperatura y el consumo anual:
R= Si, con la finalidad de saber cómo la temperatura afecta el consumo y así poder predecir a que
temperatura es conveniente tratar el consumo.
B) Suponiendo que un modelo de regresión lineal simple es apropiado, ajuste el modelo de
regresión que relacione el consumo de vapor (𝑦) con la temperatura promedio ( 𝑥).
¿Cuál es la estimación del consumo esperado de vapor cuando la temperatura promedio es 55°F?
R= 497.3545
700
Resumen 600
500
Estadísticas de la regresión
400
Coeficiente de correlación múltiple 0.999518769
Coeficiente de determinación R^2 0.99903777 300
Columna 1 1 45
Columna 2 -0.93776177 1 40
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción 234.0707398 13.74839579 17.02531287 5.9137E-07 201.5609497 266.5805299 201.5609497 266.5805299
Variable X 1 -3.508556273 0.491095226 -7.144350198 0.00018628 -4.669811953 -2.347300592 -4.669811953 -2.347300592
Problema No. 4
En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos
obtenidos se muestran en la siguiente tabla.
Tiempo (minutos) Rendimiento (%)
10 64
15 81.7
20 76.2
8 68.5
12 77.9
13 82.2
15 74.2
12 70
14 76
20 83.2
19 85.3
88
84
Rendimiento
80
76
72
68
64
8 10 12 14 16 18 20
Tiempo
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
el tiempo y el porcentaje de rendimiento está dada por:
Rendimiento = 57.9578 + 1.19492*Tiempo
88
84
Rendimiento
80
76
72
68
64
8 10 12 14 16 18 20
Tiempo
Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables tiempo y porcentaje de rendimiento si existe una relación.
Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 57.9578 6.28403 9.22303 0.0000
Pendiente 1.19492 0.414959 2.87962 0.0164
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:
Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 243.684 1 243.684 8.29 0.0164
Residuo 293.872 10 29.3872
Total (Corr.) 537.557 11
Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel
de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la
hipótesis nula.
Verificación de supuestos:
El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de forma
aleatoria por toda la gráfica a lo largo de la banda horizontal.
Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo
7.5
4.5
1.5
residuo
-1.5
-4.5
-7.5
67 70 73 76 79 82
predicho Rendimiento
Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo
7.5
4.5
1.5
residuo
-1.5
d) el coeficiente de determinación R2ajustado es de .3986 lo cual indica que nuestro modelo no tiene una
buena calidad de ajuste, ya que solo nos explica el 39.865% de la variabilidad en Rendimiento.
Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de
explicación del modelo.
e) el valor de la pendiente es de 1.19492, esto nos indica la razón de cambio en el %Rendimiento (y)
con respecto al cambio de Tiempo(x), es decir cuánto va a variar el Rendimiento cuando se varíe el
tiempo.
f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una extrapolación
la cual está más allá de la región que contiene a las observaciones originales está mal ya que
probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región
de estudio va de 8 a 20 min de Tiempo.
Problema No. 5
En un artículo de Journal of Environmental Energineering se reportan los resultados
de un estudio sobre la presencia de sodio y cloruros en corrientes superficiales de
la parte central de Rhode Island. Los datos que se presentan a continuación
corresponden a la concentración de cloruros y (en mg/l) y al área de carretera de la
vertiente x (en %).
x y
0.19 4.4
0.15 6.6
0.57 9.7
0.70 10.6
0.67 10.8
0.63 10.9
0.47 11.8
0.70 12.1
0.60 14.3
0.78 14.7
0.81 15.0
0.78 17.3
0.69 19.2
1.30 23.1
1.05 27.4
1.06 27.7
1.74 31.8
1.62 39.5
R= 20.567