Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
JOHN S. LOUCKS
St. Edward’s University
Adaptadas por
José Luis Martínez Pichardo
Instituto Tecnológico de Celaya
Slide 2
Modelo de Regresión Múltiple
Slide 3
Método de Mínimos Cuadrados
∑Y = na + b1 ∑X1 + b2 ∑X2
∑X1Y = a∑X1 + b1∑X²1 + b2 ∑X1 X2
∑X2Y = a∑X2 + b1∑X1 X2 + b2 ∑X²2
Slide 5
Ejemplo
Slide 6
Ejemplo
Slide 7
Estimación de los Coeficientes de Regresión
Slide 8
Ejemplo
y X1 X2 X3 X4
0.5514 1.1240 0.8980 0.8219 0.9906
0.4426 0.9285 0.8872 0.9308 0.9944
0.5631 1.1214 0.8030 0.7668 1.1221
0.5624 1.1635 0.7806 0.9272 0.9832
0.4505 0.9415 0.8064 0.9026 1.1127
0.5290 1.0712 0.8404 0.8662 1.0836
0.4702 09561 0.8731 0.8206 1.0290
0.5001 1.0186 0.8431 0.8346 1.0591
0.4425 0.9039 0.8314 0.7596 1.0994
Slide 10
Ejemplo
y = 0.5366.
Slide 14
Estimación de los Coeficientes de Regresión
Slide 15
Estimación de los Coeficientes de Regresión
β0 ε1
β1 ε2
β= . , ε= .
. .
. .
βk εn
donde
Xᵀ es la matriz transpuesta de la matriz X
(Xᵀ X)ˉ¹ es la matriz inversa del producto de Xᵀ X
Slide 17
Ejemplo
Se midió la supervivencia porcentual de un tipo de
semen animal después de almacenado en varias
combinaciones de concentraciones de los tres
materiales usados para aumentar la posibilidad de
sobrevivencia. Con los datos son los siguientes,
estimar el modelo de regresión múltiple.
y (% X1 X2 X3
sobrevivencia (peso %) (peso %) (peso %)
1 1 1 1 1 1 1 1 1 1 1 1 1
1.74 6.32 6.22 10.52 1.19 1.22 4.1 6.32 4.08 4.15 10.15 1.72 1.7
Xᵀ =
5.3 5.42 8.41 4.63 11.6 5.85 6.62 8.72 4.42 7.6 4.83 3.12 5.3
10.8 9.4 7.2 8.5 9.4 9.9 8 9.1 8.7 9.2 9.4 7.6 8.2
Slide 19
Estimación de los Coeficientes de Regresión
Matriz (Xᵀ X)
Slide 20
Estimación de los Coeficientes de Regresión
(Xᵀ y) = 25.5
31.2
25.9
38.4
18.4
1 1 1 1 1 1 1 1 1 1 1 1 1 26.7
1.74 6.32 6.22 10.52 1.19 1.22 4.1 6.32 4.08 4.15 10.15 1.72 1.7 26.4
5.3 5.42 8.41 4.63 11.6 5.85 6.62 8.72 4.42 7.6 4.83 3.12 5.3 25.9
10.8 9.4 7.2 8.5 9.4 9.9 8 9.1 8.7 9.2 9.4 7.6 8.2 32
25.2
39.7
35.7
377.50 26.5
(Xᵀ y) = 1877.57
2246.66
3337.78
Slide 21
Estimación de los Coeficientes de Regresión
39.22
β = 0.95
- 2.08 Entonces, la ecuación estimada es
- 0.46 y’ = 39.22 + 0.95 X1 – 2.08 X2 – 0.46 X3
Slide 22
Coeficiente de Determinación Múltiple, R²
( y i y ) ( ^y i y ) ( y i y^i )
2 2 2
R 2 = SSR/SST
Slide 23
Error Estándar de la Estimación, Se
Slide 24
Suposiciones del Modelo
Slide 25
Prueba de Significancia de la Regresión:
Prueba F
Hipótesis
H 0 : 1 = 2 = . . . = p = 0
Ha: Uno o más de los parámetros ≠ 0
Estadístico de Prueba
F = MSR/MSE
Regla de Rechazo
Rechazar H0 si F > F,p , n-p-1
donde F está basado en una distribución F con p
grados de libertad en el numerador y n - p - 1 grados
de libertad en el denominador.
Slide 26
Tabla de Análisis de Varianza de la Regresión
Slide 27
Prueba de Significancia Acerca de una
Pendiente Individual Bi
Hipótesis
H 0 : i = 0
H a : i = 0
Estadístico de Prueba
bi
t
sbi
Regla de Rechazo
Rechazar H0 si t < t, v p 1 o t > t , v p 1
Slide 29
Uso de la Ecuación de Regresión Estimada para
Estimar y Predecir
Los procedimientos para estimar el valor medio de y
y predecir un valor individual de y en regresión
múltiple son similares a los de regresión simple.
Se substituyen los valores dados de x1, x2, . . . , xp en la
ecuación de regresión estimada y se usa el valor
correspondiente de y^ como el punto estimado.
Las fórmulas requeridas para desarrollar
estimaciones de intervalo para el valor medio de y y
para un valor individual de y están más allá del
alcance del tema.
Los paquetes de software para regresión múltiple
comúnmente proporcionan esas estimaciones de
intervalo.
Slide 30
Ejemplo: Investigación de Salarios de
Programadores
Una empresa de software recopiló datos de una
muestra de 20 programadores de computadora. Se
hizo la sugerencia de que el análisis de regresión
podría usarse para determinar si el salario estaba
relacionado con los años de experiencia y la
calificación en la prueba de aptitud de la empresa.
Los años de experiencia, la calificación en el examen
de aptitud, y el salario anual correspondiente
($1000s) para una muestra de 20 programadores se
muestra a continuación.
Slide 31
Ejemplo: Investigación de Salarios de
Programadores
Exper. Calif. Salario Exper. Calif. Salario
4 78 24 9 88 38
7 100 43 2 73 26.6
1 86 23.7 10 75 36.2
5 82 34.3 5 81 31.6
8 86 35.8 6 74 29
10 84 38 8 87 34
0 75 22.2 4 79 30.1
1 80 23.1 6 94 33.9
6 83 30 3 70 28.2
6 91 33 3 89 30
Slide 32
Ejemplo: Investigación de Salarios de Programadores
Modelo de Regresión Múltiple
Supóngase que se cree que el salario (y) está
relacionado con los años de experiencia (x1) y la
calificación en la prueba de aptitud del programador
(x2) mediante el modelo de regresión siguiente:
y = 0 + 1x1 + 2x2 +
donde
y = salario anual ($000)
x1 = años de experiencia
x2 = calificación en una prueba de aptitud del
programador
Slide 33
Ejemplo: Investigación de Salarios de Programadores
Slide 34
Ejemplo: Investigación de Salarios de Programadores
Datos Salida
x1 x2 y Paquete
b0 =
Computari-
b1 =
4 78 24 zado
b2 =
7 100 43 para Resolver
R2 =
. . . Problemas de
. . . Regresión
etc.
3 89 30 Múltiple
Slide 35
Ejemplo: Investigación de Salarios de Programadores
La ecuación de regresion es
Salario = 3.17 + 1.40 Experiencia + 0.251 Calificación
Predictor Coef Stdev t-ratio p
Constant 3.174 6.156 .52 .613
Exper 1.4039 .1986 7.07 .000
Score .25089 .07735 3.24 .005
s = 2.419 R-sq = 83.4% R-sq(adj) = 81.5%
Slide 36
Ejemplo: Investigación de Salarios de Programadores
Analysis of Variance
SOURCE DF SS MS F P
Regression 2 500.33 250.16 42.76 0.000
Error 17 99.46 5.85
Total 19 599.79
Slide 37
Ejemplo: Investigación de Salarios de Programadores
b1 1. 4039 b2 . 25089
7 . 07 3. 24
sb1 . 1986 sb2 . 07735
• Conclusiones
Rechazar H0: 1 = 0 Rechazar H0: 2 = 0
Slide 39
Variables Independientes Cualitativas
Slide 40
Ejemplo: Investigación de Salarios de
Programadores (B)
Slide 41
Ejemplo: Investigación de Salarios de
Programadores (B)
Exp. Calif. Grado Salario Exp. Calif. Grado Salario
4 78 No 24 9 88 Yes 38
7 100 Yes 43 2 73 No 26.6
1 86 No 23.7 10 75 Yes 36.2
5 82 Yes 34.3 5 81 No 31.6
8 86 Yes 35.8 6 74 No 29
10 84 Yes 38 8 87 Yes 34
0 75 No 22.2 4 79 No 30.1
1 80 No 23.1 6 94 Yes 33.9
6 83 No 30 3 70 No 28.2
6 91 Yes 33 3 89 No 30
Slide 42
Ejemplo: Investigación de Salarios de
Programadores (B)
Ecuación de Regresión Múltiple
E(y ) = 0 + 1x1 + 2x2 + 3x3
Ecuación de Regresión Estimada
y^ = b0 + b1x1 + b2x2 + b3x3
donde
y = salario anual ($000)
x1 = años de experiencia
x2 = calificación del programador en la prueba de
aptitud
x3 = 0 si el individuo no tiene un grado de lic.
1 si el individuo si tiene un grado de lic.
Nota: x3 es referida como una variable fantasma
(dummy). Slide 43
Ejemplo: Investigación de Salarios de
Programadores (B)
Salida de Computadora de Minitab
La ecuación de regresión es
Salario = 7.95 + 1.15 Exp. + 0.197 Calif. + 2.28 Grado
Predictor Coef Stdev t-ratio p
Constant 7.945 7.381 1.08 .298
Exp 1.1476 .2976 3.86 .001
Score .19694 .0899 2.19 .044
Deg 2.280 1.987 1.15 .268
s = 2.396 R-sq = 84.7% R-sq(adj) = 81.8%
Slide 44
Ejemplo: Investigación de Salarios de
Programadores (B)
Salida de Computadora de Minitab (continuación)
Analysis of Variance
SOURCE DF SS MS F P
Regression 3 507.90 169.30 29.48 0.000
Error 16 91.89 5.74
Total 19 599.79
Slide 45
Análisis Residual
Slide 46
Análisis Residual
Slide 48