Sei sulla pagina 1di 19

Problema No.

1
En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta
sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para
predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro
promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una
herramienta se muestran a continuación:
Horas de uso Diámetro (mm)
16 26.2
32 25.7
48 26.0
64 27.7
80 28.3
96 29.5
112 30.1
128 31.8
144 31.4
160 33.4
176 33.6
192 32.7
208 35.0
224 36.1
240 35.7
256 36.2
272 36.8
288 39.1
304 38.7
320 39.2
a) ¿En este problema cuál variable se considera independiente y cuál dependiente?
R: La variable dependiente serán las horas de trabajo mientras que la independiente será el
diámetro de la pieza.
b) Mediante un diagrama de dispersión analice la relación entre estas dos variables. ¿Qué tipo
de relación observa y cuáles son algunos hechos especiales? Relación positiva fuerte
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de
hipótesis y verifique residuos)
d) ¿La calidad de ajuste es satisfactoria? Argumente
e) Si el diámetro máximo tolerado es de 45, ¿Cuántas horas de uso estima que tiene esa
herramienta?
f) Señale el valor de la pendiente de la recta e interprételo en términos prácticos
g) Obtenga el error estándar de estimación y comente qué relación tiene éste con la calidad de
ajuste.

y = 0.0464x + 24.863
R² = 0.9768
grafica de dispersion
45

40

35

30
horas de trabajo

25

20

15

10

0
0 50 100 150 200 250 300 350
diametro de la pieza
y = 0.0464x + 24.863
Columna 1 Columna 2
R² = 0.9768 grafica de dispersion
Columna 1 1 45
Columna 2 0.988325658 1
40

35

30

horas de trabajo
25

Resumen 20

15
Estadísticas de la regresión
Coeficiente de correlación múltiple 0.988325658 10
Coeficiente de determinación R^2 0.976787606
5
R^2 ajustado 0.975498029
Error típico 14.81680342 0
Observaciones 20 0 50 100 150 200 250 300 350
diametro de la pieza
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 166288.3221 166288.3221 757.447808 3.66724E-16
Residuos 18 3951.677944 219.5376635
Total 19 170240

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95.0%Superior 95.0%
Intercepción -519.3957825 25.19522479 -20.61485011 5.7073E-14 -572.3289856 -466.462579 -572.328986 -466.462579
Variable X 1 21.04702335 0.764740915 27.52176971 3.6672E-16 19.4403623 22.6536844 19.4403623 22.6536844

a) La variable independiente son las horas de uso y la variable dependiente es el diámetro de las
piezas.

b) Diagrama de dispersión: se puede observar que existe una correlación lineal positiva entre las
horas de uso y el diámetro, ya que conforme aumentan las horas de uso aumenta el diámetro.

Gráfico de Diámetro vs Horas de uso

40

37
Diámetro

34

31

28

25
0 100 200 300 400
c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
las horas de uso y el diámetro está dada por:
Diámetro = 24.8632 + 0.0464098*Horas de uso
La cual se puede observar en el grafico del modelo ajustado:

Gráfico del Modelo Ajustado


Diámetro = 24.8632 + 0.0464098*Horas de uso

40

37
Diámetro

34

31

28

25
0 100 200 300 400
Horas de uso

Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables horas de uso y diámetro si existe una relación.

Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 24.8632 0.323206 76.9267 0.0000
Pendiente 0.0464098 0.00168629 27.5218 0.0000
Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:

Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 366.674 1 366.674 757.45 0.0000
Residuo 8.71365 18 0.484092
Total (Corr.) 375.388 19

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel
de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la
hipótesis nula.

Verificación de supuestos:

El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los predichos,
los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algún patrón definido.

Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso

1.2

0.8

0.4
residuo

-0.4

-0.8

-1.2
25 28 31 34 37 40
El supuesto de independencia si se cumple ya que
predicho los puntos o residuos se encuentran dispersos
Diámetro

de forma arbitraria dentro del grafico de residuos vs número de corrida, sin cumplir ninguna tendencia.

Gráfico de Residuos
Diámetro = 24.8632 + 0.0464098*Horas de uso

1.2

0.8

0.4
residuo

-0.4

-0.8

-1.2
0 4 8 12 16 20
d) el coeficiente de determinación R2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene
una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Diámetro.

e) El valor sería de 433.89 horas a un diámetro de 45 mm, sin embargo realizar una extrapolación la
cual está más allá de la región que contiene a las observaciones originales está mal ya que
probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región
de estudio va de 25.7 a 39.2 mm de diámetro.

f) el valor de la pendiente es de 0.0464098, esto nos indica la razón de cambio en el diámetro (y) con
respecto al cambio de las horas de uso (x), es decir cuánto va a variar el diámetro cuando se varíen
las horas de uso.

g) El error estándar de la estimación fue de 0.695767, lo cual indica que la calidad de ajuste de nuestro
modelo es buena, ya que si el error estándar de estimación es menor la calidad del ajuste será mayor.
Problema No. 2
Se piensa que el número de libras de vapor consumidas mensualmente por una planta química se
relaciona con la temperatura ambiente promedio (en °F) de ese mes. En la tabla siguiente se muestra
la temperatura y el consumo anual:

Mes Temperatura Consumo/1000


Enero 21 185.79
Febrero 24 214.47
Marzo 32 288.03
Abril 47 424.84
Mayo 50 454.58
Junio 59 539.03
Julio 68 621.55
Agosto 74 657.06
Septiembre 62 562.03
Octubre 50 452.93
Noviembre 41 369.95
Diciembre 30 273.98
A) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un modelo de regresión
lineal simple en este caso?

R= Si, con la finalidad de saber cómo la temperatura afecta el consumo y así poder predecir a que
temperatura es conveniente tratar el consumo.
B) Suponiendo que un modelo de regresión lineal simple es apropiado, ajuste el modelo de
regresión que relacione el consumo de vapor (𝑦) con la temperatura promedio ( 𝑥).
¿Cuál es la estimación del consumo esperado de vapor cuando la temperatura promedio es 55°F?
R= 497.3545

C) ¿Qué cambio se espera en el consumo de vapor promedio cuando la temperatura mensual


promedio cambia 1°F?
R= 2.15%
R= 108.7056 consumo/1000

D) Suponga que la temperatura mensual promedio es de 47°F. Calcule el vapor ajustado y el


residual correspondiente.
VAPOR= 424.84
RESIDUAL= -0.042718344
Columna 1 Columna 2
Columna 1 1
Columna 2 0.999518769 1
y = 9.0588x - 0.8795 Título del gráfico
R² = 0.999
800

700
Resumen 600

500
Estadísticas de la regresión
400
Coeficiente de correlación múltiple 0.999518769
Coeficiente de determinación R^2 0.99903777 300

R^2 ajustado 0.998941547 200


Error típico 5.114063557 100
Observaciones 12
0
0 10 20 30 40 50 60 70 80
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 271540.889 271540.889 10382.5252 2.03081E-16
Residuos 10 261.5364607 26.15364607
Total 11 271802.4255
Problema No. 3
En un artículo de Wear se presentan los datos del desgaste por rozamiento del acero dulce y la
viscosidad del aceite. Los datos representativos, con 𝑥 = 𝑣𝑖𝑠𝑐𝑜𝑠𝑖𝑑𝑎𝑑 𝑑𝑒𝑙 𝑎𝑐𝑒𝑖𝑡𝑒 y 𝑦 =
𝑣𝑜𝑙𝑢𝑚𝑒𝑛 𝑑𝑒𝑙 𝑑𝑒𝑠𝑔𝑎𝑠𝑡𝑒 (10−4 𝑚𝑚 ), son:
Y x
240 1.6
181 9.4
193 15.5
155 20.0
172 22.0
110 35.5
113 43.0
75 40.5
94 33.0

a) Construya un diagrama de dispersión de los datos. ¿Parecería plausible un modelo de


regresión lineal simple?
R= Si, parece correcto usar el diagrama
b) Ajuste el modelo de regresión lineal simple usando mínimos cuadrados.

c) Estime el desgaste por rozamiento cuando la viscosidad es 𝑥 = 30.


R= 62.3768
d) Obtenga el valor ajustado de 𝑦 cuando 𝑥 = 22.0 y calcule el residual correspondiente.
Y=172
Residual= 15.11749821
y = -0.2506x + 61.623
R² = 0.8794 Título del gráfico
Columna 1 Columna 2 50

Columna 1 1 45
Columna 2 -0.93776177 1 40

volumen del desgaste


35
30
Resumen 25
20
Estadísticas de la regresión
15
Coeficiente de correlación
0.93776177
múltiple
Coeficiente de determinación
0.879397137
R^2 10

R^2 ajustado 0.862168156 5


Error típico 19.95696437 0
Observaciones 9 0 50 100 150 200 250 300
viscosidad del aceite
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 20328.9259 20328.9259 51.0417397 0.000186278
Residuos 7 2787.962989 398.280427
Total 8 23116.88889

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95.0% Superior 95.0%
Intercepción 234.0707398 13.74839579 17.02531287 5.9137E-07 201.5609497 266.5805299 201.5609497 266.5805299
Variable X 1 -3.508556273 0.491095226 -7.144350198 0.00018628 -4.669811953 -2.347300592 -4.669811953 -2.347300592

Análisis de los residuales

Observación Pronóstico para Y Residuos


1 228.4570498 11.54295024
2 201.0903108 -20.09031083
3 179.6881176 13.31188243
4 163.8996143 -8.899614339
5 156.8825018 15.11749821
6 109.5169921 0.48300789
7 83.20282006 29.79717994
8 91.97421075 -16.97421075
9 118.2883828 -24.28838279

Problema No. 4
En un proceso de extracción se estudia la relación entre tiempo de extracción y rendimiento. Los datos
obtenidos se muestran en la siguiente tabla.
Tiempo (minutos) Rendimiento (%)
10 64
15 81.7
20 76.2
8 68.5
12 77.9
13 82.2
15 74.2
12 70
14 76
20 83.2
19 85.3

a) ¿En este problema cuál variable se considera independiente y cuál dependiente?


b) Mediante un diagrama de dispersión analice la relación entre estas dos variables.
c) Haga un análisis de regresión (ajuste una línea recta a estos datos, aplique pruebas de
hipótesis y verifique residuos).
d) ¿La calidad del ajuste es satisfactoria? Argumente
e) Destaque el valor de la pendiente de la recta e interprételo en términos prácticos.
f) Estime el rendimiento promedio que se espera a un tiempo de extracción de 25 minutos y
obtenga un intervalo de confianza para esta estimación.

a) La variable dependiente es el % rendimiento y la variable independiente es el tiempo dado en


minutos.
b) Diagrama de dispersión: se puede visualizar que no existe una relación ya que los puntos son
muy dispersos, algunos incrementan y otros decrecen sin importar el tiempo, sin embargo se tendría
que verificar los supuestos y comprobar si en verdad existe una relación entre el rendimiento y el
tiempo, si no es asi los datos que miden la calidad de ajuste nos lo indicaran.
Gráfico de Rendimiento vs Tiempo

88

84

Rendimiento
80

76

72

68

64
8 10 12 14 16 18 20
Tiempo

c) Análisis de regresión, como podemos observar la línea recta que mejor explica la relación entre
el tiempo y el porcentaje de rendimiento está dada por:
Rendimiento = 57.9578 + 1.19492*Tiempo

La cual se puede observar en el grafico del modelo ajustado:

Gráfico del Modelo Ajustado


Rendimiento = 57.9578 + 1.19492*Tiempo

88

84
Rendimiento

80

76

72

68

64
8 10 12 14 16 18 20
Tiempo

Prueba de Hipótesis:
H0: β1= 0 o H0: El modelo no se ajusta
H0: β1≠ 0 o H0: El modelo si se ajusta
De acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que
entre las variables tiempo y porcentaje de rendimiento si existe una relación.

Coeficientes
Mínimos Estándar Estadístico
Cuadrados
Parámetro Estimado Error T Valor-P
Intercepto 57.9578 6.28403 9.22303 0.0000
Pendiente 1.19492 0.414959 2.87962 0.0164

Para poder rechazar o aceptar la hipótesis nula tenemos que tomar en cuenta el análisis de varianza
del modelo, el cual se presenta a continuación:

Análisis de Varianza
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 243.684 1 243.684 8.29 0.0164
Residuo 293.872 10 29.3872
Total (Corr.) 537.557 11

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel
de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la
hipótesis nula.

Verificación de supuestos:

El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de forma
aleatoria por toda la gráfica a lo largo de la banda horizontal.

Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo

7.5

4.5

1.5
residuo

-1.5

-4.5

-7.5
67 70 73 76 79 82
predicho Rendimiento

El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos


de forma arbitraria dentro del gráfico de residuos vs número de corrida, sin cumplir ninguna tendencia.

Gráfico de Residuos
Rendimiento = 57.9578 + 1.19492*Tiempo

7.5

4.5

1.5
residuo

-1.5
d) el coeficiente de determinación R2ajustado es de .3986 lo cual indica que nuestro modelo no tiene una
buena calidad de ajuste, ya que solo nos explica el 39.865% de la variabilidad en Rendimiento.
Además en general, para fines de predicción se recomienda un R 2ajustado de al menos 0.7 o 70% de
explicación del modelo.

e) el valor de la pendiente es de 1.19492, esto nos indica la razón de cambio en el %Rendimiento (y)
con respecto al cambio de Tiempo(x), es decir cuánto va a variar el Rendimiento cuando se varíe el
tiempo.

f) Se podría calcular el valor que piden con respecto a los 2 min, sin embargo realizar una extrapolación
la cual está más allá de la región que contiene a las observaciones originales está mal ya que
probablemente el modelo ya no se ajuste adecuadamente fuera de la región, ya que nuestra región
de estudio va de 8 a 20 min de Tiempo.
Problema No. 5
En un artículo de Journal of Environmental Energineering se reportan los resultados
de un estudio sobre la presencia de sodio y cloruros en corrientes superficiales de
la parte central de Rhode Island. Los datos que se presentan a continuación
corresponden a la concentración de cloruros y (en mg/l) y al área de carretera de la
vertiente x (en %).

x y
0.19 4.4
0.15 6.6
0.57 9.7
0.70 10.6
0.67 10.8
0.63 10.9
0.47 11.8
0.70 12.1
0.60 14.3
0.78 14.7
0.81 15.0
0.78 17.3
0.69 19.2
1.30 23.1
1.05 27.4
1.06 27.7
1.74 31.8
1.62 39.5

a) Trace un diagrama de dispersión de los datos. ¿Parecería apropiado un


modelo de regresión lineal simple en este caso?
R= Si, para ver la relación aunque presentan un índice de error alto
B) Ajuste el modelo de regresión lineal simple usando el método de mínimos
cuadrados.
b) Estime la concentración de cloruros media de una vertiente que tiene 1%
del área de carretera.

R= 20.567

Encuentre el valor ajustado que corresponde a 𝑥 = 0.47


R= 10.13

Potrebbero piacerti anche