Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Unidad 2.
Regresión Lineal múltiple y correlación.
Ejercicios.
Alumnos:
Alarcón Villegas Pamela Alejandra.
Sandoval Rendón Javier Antonio.
1. Datos anteriores
1. Datos anteriores
F=3.14
7. Conclusión:
Como 3.14< 5.86 con un nivel de significancia del 95% se rechaza la hipótesis nula y se
concluye que al menos una de las variables predictoras en el modelo es importante para
predecir la eficiencia térmica. Como p es menor que 0.05 se acepta la hipótesis alternativa.
PRUEBA DE HIPÓTESIS PARA UN
SUBCONJUNTO DE COEFICIENTES DE
REGRESIÓN
1. Datos anteriores
(𝑆𝑆𝑅𝑐 − 𝑆𝑆𝑅𝑟)ൗ
𝐹𝑝 = 𝐾
𝑆𝑆𝐸𝑐 / (n − (K) − 1
F(tabla)= 5.86
7. Conclusiones:
Como el valor de fp es igual a 5.5 y este valor es menor que el de las tablas
5.86 no se rechaza la hipótesis nula y se concluye que el modelo reducido no
sirve.
PRUEBA DE HIPÓTESIS PARA UN
SUBCONJUNTO DE COEFICIENTES DE
REGRESIÓN
1. Datos anteriores
(𝑆𝑆𝑅𝑐 − 𝑆𝑆𝑅𝑟)ൗ
𝐹𝑝 = 𝐾
𝑆𝑆𝐸𝑐 / (n − (K) − 1
F(tabla)= 5.86
7. Conclusiones:
Como el valor de fp es igual a 5.5 y este valor es menor que el de
las tablas 5.86 no se rechaza la hipótesis nula y se concluye que el
modelo reducido no sirve.
INTERPRETACIÓN DE LAS GRÁFICAS
ANÁLISIS DE GRÁFICO RESIDUAL
La dispersión de los
puntos en la grafica
de residuos vs la ta
sa de flujo de gas
fluidizante respecto
a la media residual
presenta normalidad,
sin embargo el dato
7 presenta un error
residual muy grande
que lo aleja de la
media residual
INTERPRETACIÓN DE LAS GRÁFICAS
ANÁLISIS DE GRÁFICO RESIDUAL
La dispersión de los
puntos en la grafica
de residuos vs
abertura de la
entrada de gas
respecto a la media
residual presenta
normalidad, sin
embargo el dato 7
presenta un error
residual muy grande
que lo aleja de la
media residual
INTERPRETACIÓN DE LAS GRÁFICAS
ANÁLISIS DE GRÁFICO RESIDUAL
La dispersión de los
puntos en la grafica
de residuos vs la ta
da de flujo de gas
flotante respecto a
la media residual
presenta normalidad,
sin embargo el dato
7 presenta un error
residual muy grande
que lo aleja de la
media residual
INTERPRETACIÓN DE LAS GRÁFICAS
ANÁLISIS DE GRÁFICO RESIDUAL
GRÁFICA DE NORMALIDAD:
Presenta normalidad ya que todos los puntos están cerca de la línea
recta.
HISTOGRAMA DE RESIDUALES:
La forma de la grafica es anormal debido a que la distribución de el
histograma no es simétrico.
RESIDUALES VS VALORES PREDICHOS:
La distribución de los datos presenta una pequeña anormalidad ya
que en el sentido vertical se encuentras varios puntos alejados de la
media residual y en el sentido horizontal se encuentra la misma
dispersión.
GRÁFICA DE RESIDUALES VS ÍNDICE DE LA OBSERVACIÓN:
A pesar a que existen dos datos muy alejados de la media residual
estos solo se considera un dato anormal el de la fila numero 7 los
demás datos se encuentran dentro de la zona de validez.
SELECCIÓN DE VARIABLES EN REGRESIÓN MÚLTIPLE.
MÉTODOS STEPWISE.
MÉTODO DE ELIMINACIÓN HACIA ATRÁS
“BACKWARD”
No se puede realizar este método a pesar de buscar la forma de realizar el método con la
variación de l alfa; por lo que no se toma en cuenta este modelo
MÉTODO DE PASO A PASO “STEPWISE”.
INTERPRETACION:
El aumento promedio en el consumo diario de petróleo es de 10.3 por cada punto adicional
en la parte de numero de horas- maquina, asumiendo que las otras dos variables
permanecen constantes, asimismo el aumento promedio en el consumo de petróleo es de
0.284 por cada punto adicional en la parte de distancia de transportes asumiendo que las
otras variables permanezcan constantes y hay un aumento promedio de 17.5 en el
consumo diario de petróleo por cada punto adicional en la parte del rendimiento promedio
de motores asumiendo que las otras variables permanecen constantes.
COEFICIENTE DE DETERMINACIÓN. 𝑅 2
INTERPRETACIÓN:
El coeficiente de determinación es de 99.9%, indica una buena
asociación lineal entre las variables, por lo cual se pude usar el numero
de horas-maquina el rendimiento de los motores y la distancia de los
transportes para predecir el consumo diario de gasolina.
INTERVALO DE CONFIANZA PARA𝑀𝑦 Τ𝑥0
Con una confianza del 95% se asume que el valor medio del consumo promedio de petróleo es
caerá en el intervalo de (4355.9, 4985)
INTERVALO DE CONFIANZA PARA 𝑌0
Con una confianza del 95% se asume que el valor futuro del consumo promedio de petróleo
caerá en el intervalo de (4311.9, 5029.7), sin embargo se denota un punto que es un valor
atípico en extremo de los predictores
PRUEBA DE HIPOTESIS DE CADA COEFICIENTE DE
REGRESION ES CERO:
1. Datos anteriores
1. Datos anteriores
F=3484.23
7. Conclusión:
Como 3484.23> 4.28 con un nivel de significancia del 95% se rechaza la hipótesis nula y se
concluye que al menos una de las variables productoras en el modelo es importante para
predecir el consumo diario de petróleo.
PRUEBA DE HIPÓTESIS PARA UN
SUBCONJUNTO DE COEFICIENTES DE
REGRESIÓN
1. Datos anteriores
Fuente GL SC MC F P
Regresión 3 47613072 15871024 3484.23 0.000
Error residual 5 22776 4555
Total 8 47635848
Fuente GL SC MC F P
Regresión 2 47550086 23775043 1663.32 0.000
Error residual 6 85762 14294
Total 8 47635848
FORMULA:
(𝑆𝑆𝑅𝑐 − 𝑆𝑆𝑅𝑟)ൗ
𝐹𝑝 = 𝐾
𝑆𝑆𝐸𝑐 / (n − (K) − 1
F(tabla)= 9.01
7. Conclusiones:
Como el valor de fp es igual a 6.91 y este valor es menor que el de las tablas 9.01 no se
rechaza la hipótesis nula y se concluye que el modelo reducido no sirve.
INTERPRETACIÓN DE LAS GRÁFICAS
ANÁLISIS DE GRÁFICO RESIDUAL
Interpretaciones:
A= 102, significa que
El coeficiente de una variable predictora indica el cambio promedio en el consumo de oxígeno (y),
cuando se incrementa en una unidad la variable predictora x, asumiendo que las demás
permanecen constantes. Por lo tanto; la disminución del consumo de oxígeno es de -0.21166 por
cada año de edad; la disminución del consumo de oxígeno es de -0.07014 por cada unidad de peso
en kg ,la disminución del consumo de oxígeno es de -2.6829 por cada segundo adicional del
tiempo para correr 1 y 1/2 milla; el consumo de oxígeno aumenta en 0.00445 por cada unidad
adicional en el pulso de descanso; el consumo de oxígeno disminuye -0.3835 por cada unidad que
aumenta el pulso al final de la carrera;
el consumo de oxígeno aumenta en 0.3132 por cada unidad aumentada en el ritmo máximo del
pulso durante la carrera.
Asumiendo que las otras variables permanecen constantes.
COEFICIENTE DE DETERMINACIÓN.
Solo el 80.9% de la variación del consumo de oxígeno, está explicada por su relación con las
variables predictoras.
PRUEBA DE HIPÓTESIS DE QUE CADA COEFICIENTE
DE REGRESIÓN ES CERO.
𝐻0 : 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 𝛽6 = 0 El modelo no sirve.
𝐻1 : 𝐴𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑠 𝑐𝑒𝑟𝑜. ,
𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑠𝑖𝑟𝑣𝑒.
∝= 0.05
• ∝= 0.05
• Como 𝐹𝑝 > 𝑓∝ , 4.25 > 3.01; se rechaza la
hipótesis nula y se concluye con un nivel de
significancia de 0.05 que al menos una de
las tres variables influye en el consumo de
oxígeno.
ANÁLISIS RESIDUAL.