Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
“ESCUELA DE AGROINDUSTRIAS”
Estudiantes:
Tumbes – 2018
INTRODUCCIÓN
Con frecuencia hemos observado la relación que existe entre una variable y otra
(correlación bivarible) lo cual nos permite, en algunos casos, predecir los valores
de una variable a partir de los valores observados en la otra. Por ejemplo: se ha
encontrado que las calificaciones que un estudiante obtiene en una prueba de
ingreso a la universidad se correlacionan con las calificaciones que el alumno
obtiene en su programa académico; siendo así se podría intentar predecir la
calificación final del estudiante. Pero el mundo de la educación es muy complejo
y difícilmente podemos atribuir a una sola variable los resultados en otra; la
realidad nos obliga a reconocer que para predecir con mayor precisión las
calificaciones finales del estudiante, es necesario observar e integrar en la
predicción otras variables que también puedan estar relacionadas. Un esfuerzo
de este tipo implica la observación de más de dos variables al mismo tiempo y
en el caso de una observación correlacional, requiere de un procedimiento que
permita pesar el grado de impacto que cada una de las variables observadas
puede tener sobre los resultados de la predicción. Por ejemplo, sabemos que el
precio de la colegiatura en una institución está determinado por varias variables:
costo de los servicios públicos, renta del local, gastos indirectos, tamaño y
características del personal que labora en la institución, etc. También sabemos
que estas variables antes mencionadas no tienen la misma importancia al
momento de determinar el costo de la colegiatura, por lo que diríamos que hay
que ponderar el impacto que cada una tendría sobre el costo de la colegiatura.
El procedimiento analítico que nos permite determinar cuánto de la variación en
la variable observada está asociado con la variación del conjunto de variables
que pretenden predecirla se denomina: Correlación Múltiple.
REGRESIÓN MÚLTIPLE
𝒚 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐
Donde:
a, b1, b2,…, bk. : Son Coeficientes de Correlación Muestral
Para b1:
̅ 𝟏 )(𝒀
[∑ 𝒙𝟐𝟐 − 𝒏(𝑿̅𝟐 )𝟐 ][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿 ̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿
̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿
̅ 𝟐 )(𝒀
̅ )]
𝒃𝟏 = 𝟐 𝟐 𝟐 𝟐
[∑ 𝒙𝟏 − 𝒏(𝑿̅𝟏 ) ][∑ 𝒙𝟐 − 𝒏(𝑿̅𝟐 ) ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐
Para b2:
Para a:
̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐
Coeficiente de Correlación Múltiple
Formula:
𝑎 ∑ 𝑌 + 𝑏1 ∑ 𝑋1 𝑌 + 𝑏2 ∑ 𝑋2 𝑌 − 𝑛𝑌̅ 2
𝑟=√
∑ 𝑌 2 − 𝑛𝑌̅ 2
Ejercicios
Ejemplo 1.
𝒀 𝑿𝟏 𝑿𝟐 𝑿𝟐𝟏 𝑿𝟐𝟐 𝑿𝟏 ∗ 𝑿𝟐 𝑿𝟏 ∗ 𝒀 𝑿𝟐 ∗ 𝒀 𝒀𝟐
45 10 9 100 81 90 450 405 2025
40 9 8 81 64 72 360 320 1600
38 8 6 64 36 48 304 228 1444
35 7 6 49 36 42 245 210 1225
32 7 5 49 25 35 224 160 1024
30 6 4 36 16 24 180 120 900
28 6 3 36 9 18 168 84 784
27 4 2 16 4 8 108 54 729
25 3 2 9 4 6 75 50 625
22 2 1 4 1 2 44 22 484
∑ 𝒀 = 𝟑𝟐𝟐 ∑ 𝑿𝟏 = 𝟔𝟐 ∑ 𝑿𝟐 = 𝟒𝟔
∑ 𝑿𝟐𝟏 ∑ 𝑿𝟐𝟐 ∑ 𝑿𝟏 𝑿𝟐 ∑ 𝑿𝟏 𝒀 ∑ 𝑿𝟐 𝒀 ∑ 𝒀𝟐
̅ = 𝟑𝟐. 𝟐
𝒀 ̅ 𝟏 = 𝟔. 𝟐
𝑿 ̅ 𝟐 = 𝟒. 𝟔
𝑿 = 𝟒𝟒𝟒 = 𝟐𝟕𝟔 = 𝟑𝟒𝟓 = 𝟐𝟏𝟓𝟖 = 𝟏𝟔𝟓𝟑 = 𝟏𝟎𝟖𝟒𝟎
Determinar:
Solución:
𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐
̅ = 54.5; 𝑿
∑ 𝑿𝟏 𝒀 = 2158; ∑ 𝑿𝟐 𝒀 = 1653; ∑ 𝒀𝟐 = 10840; 𝒀 ̅ 𝟏 = 49; 𝑿
̅ 𝟐 = 14.83
𝒃𝟏 = 𝟎. 𝟓𝟎𝟗
𝒃𝟐 = 𝟐. 𝟏𝟗𝟓
̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐
𝒂 = 𝟏𝟖. 𝟗𝟒𝟕
̅𝟐
𝒂 ∑ 𝒀 + 𝒃𝟏 ∑ 𝑿𝟏 𝒀 + 𝒃𝟐 ∑ 𝑿𝟐 𝒀 − 𝒏𝒀
𝒓=√
∑ 𝒀𝟐 − 𝒏𝒀̅𝟐
Formulas:
𝒏 ∗ 𝒂 + ∑ 𝑿𝟏 𝒃𝟏 + ∑ 𝑿𝟐 𝒃𝟐 = ∑ 𝒀
∑ 𝑿𝟏 𝒂 + ∑ 𝑿𝟐𝟏 𝒃𝟏 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟐 = ∑ 𝑿𝟏 𝒀
∑ 𝑿𝟐 𝒂 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟏 + ∑ 𝑿𝟐𝟐 𝒃𝟐 = ∑ 𝑿𝟐 𝒀
Formulas:
∑ 𝑋12 𝒃𝟏 + ∑ 𝑋1 𝑋2 𝒃𝟐 = ∑ 𝑿𝟏 𝒀
∑ 𝑋2 𝑋1 𝒃𝟏 + ∑ 𝑋22 𝒃𝟐 = ∑ 𝑿𝟐 𝒀
Donde:
̅ 𝟏 )𝟐
𝐒𝒙𝟐𝟏 = ∑ 𝑿𝟐𝟏 − 𝒏(𝑿
̅ 𝟐 )𝟐
𝐒𝑿𝟐𝟐 = ∑ 𝑿𝟐𝟐 − 𝒏(𝑿
𝐒𝑿𝟏 𝑿𝟐 = ∑ 𝑿𝟏 𝑿𝟐 − 𝒏( 𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐)
𝐒𝑿𝟏 𝒀 = ∑ 𝑿𝟏 𝒀 − 𝒏( 𝑿 ̅ 𝟏 )(𝒀
̅)
𝐒𝑿𝟐 𝒀 = ∑ 𝑿𝟐 𝒀 − 𝒏( 𝑿 ̅ 𝟐 )(𝒀
̅)
Sistema de 2 ecuaciones:
𝟒. 𝟑𝟗𝟗𝒃𝟐 = 𝟗. 𝟔𝟔
𝒃𝟐 = 𝟐. 𝟏𝟗𝟓
Reemplazando en (1)
𝒃𝟏 = 𝟎. 𝟓𝟎𝟗
̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐
Ejemplo 2
Solución:
𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐
̅ = 54.5; 𝑿
∑ 𝑿𝟏 𝑿𝟐 = 4591 ; ∑ 𝑿𝟏 𝒀 = 17056; ∑ 𝑿𝟐 𝒀 = 5158; ∑ 𝒀𝟐 = 19179; 𝒀 ̅ 𝟏 = 49; 𝑿
̅ 𝟐 = 14.83
𝒃𝟏 = 𝟎. 𝟗
𝒃𝟐 = 𝟏. 𝟑𝟎
̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐
𝒂 = 𝟓𝟒. 𝟓 − 𝟎. 𝟗 ∗ 𝟒𝟗 − 𝟏. 𝟑𝟎 ∗ 𝟏𝟒𝟗𝟖
𝒂 = −𝟖. 𝟖𝟕𝟗
̅𝟐
𝒂 ∑ 𝒀 + 𝒃𝟏 ∑ 𝑿𝟏 𝒀 + 𝒃𝟐 ∑ 𝑿𝟐 𝒀 − 𝒏𝒀
𝒓=√
∑ 𝒀𝟐 − 𝒏𝒀̅𝟐
1330.87
𝑟= √ ⟹ 𝒓 = √𝟎. 𝟗𝟖 = 𝟎. 𝟗𝟗
1357.5
𝒏 ∗ 𝒂 + ∑ 𝑿 𝟏 𝒃𝟏 + ∑ 𝑿 𝟐 𝒃𝟐 = ∑ 𝒀
∑ 𝑿𝟏 𝒂 + ∑ 𝑿𝟐𝟏 𝒃𝟏 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟐 = ∑ 𝑿𝟏 𝒀
∑ 𝑿𝟐 𝒂 + ∑ 𝑿𝟏 𝑿𝟐 𝒃𝟏 + ∑ 𝑿𝟐𝟐 𝒃𝟐 = ∑ 𝑿𝟐 𝒀
𝟔𝒂 + 𝟐𝟗𝟒𝒃𝟏 + 𝟖𝟗𝒃𝟐 = 𝟑𝟐𝟕
𝟐𝟗𝟒𝒂 + 𝟏𝟓𝟐𝟏𝟎𝒃𝟏 + 𝟒𝟓𝟗𝟏𝒃𝟐 = 𝟏𝟕𝟎𝟓𝟔
𝟖𝟗𝒂 + 𝟒𝟓𝟗𝟏𝒃𝟏 + 𝟏𝟑𝟗𝟓𝒃𝟐 = 𝟓𝟏𝟓𝟖
∑ 𝑋12 𝒃𝟏 + ∑ 𝑋1 𝑋2 𝒃𝟐 = ∑ 𝑿𝟏 𝒀
∑ 𝑋2 𝑋1 𝒃𝟏 + ∑ 𝑋22 𝒃𝟐 = ∑ 𝑿𝟐 𝒀
Donde:
̅ 𝟏 )𝟐
𝐒𝒙𝟐𝟏 = ∑ 𝑿𝟐𝟏 − 𝒏(𝑿
𝟐
𝐒𝑿𝟐𝟐 = ∑ 𝑿𝟐𝟐 − 𝒏(𝑿
̅ 𝟐)
𝐒𝑿𝟏 𝑿𝟐 = ∑ 𝑿𝟏 𝑿𝟐 − 𝒏( 𝑿̅ 𝟏 )(𝑿
̅ 𝟐)
̅ 𝟏 )(𝒀
𝐒𝑿𝟏 𝒀 = ∑ 𝑿𝟏 𝒀 − 𝒏( 𝑿 ̅)
̅ 𝟐 )(𝒀
𝐒𝑿𝟐 𝒀 = ∑ 𝑿𝟐 𝒀 − 𝒏( 𝑿 ̅)
Reemplazando Los valores:
𝟏𝟓𝟐𝟏𝟎 − 𝟔 ∗ 𝟒𝟗𝟐 = 𝟖𝟎𝟒
𝟏𝟑𝟗𝟓 − 𝟔 ∗ 𝟏𝟒. 𝟖𝟑𝟐 = 𝟕𝟓. 𝟒𝟐𝟔
𝟒𝟓𝟗𝟏 − 𝟔 ∗ 𝟒𝟗 ∗ 𝟏𝟒. 𝟖𝟑 = 𝟐𝟑𝟎. 𝟗𝟖
𝟏𝟕𝟎𝟓𝟔 − 𝟔 ∗ 𝟒𝟗 ∗ 𝟓𝟒. 𝟓 = 𝟏𝟎𝟑𝟑
𝟓𝟏𝟓𝟖 − 𝟔 ∗ 𝟏𝟒. 𝟖𝟑 ∗ 𝟓𝟒. 𝟓 = 𝟑𝟎𝟖. 𝟓𝟗
Sistema de 2 ecuaciones:
𝒃𝟐 = 𝟏. 𝟑𝟎
Reemplazando en (1)
𝒃𝟏 = 𝟎. 𝟗
Ejemplo 3
El gerente de ventas de las llantas “GOOD BYE” que se venden en todo el país realiza
un estudio para determinar la relación entre el numero de llantas vendidas por mes (Y
en cientos) y los gastos de publicidad mensuales (en cientos de dólares), X1: Radio,
X2: Periódicos. Los datos obtenidos en una muestra de 5 provincias se dan en la tabla
que sigue:
𝒀 𝑿𝟏 𝑿𝟐 𝑿𝟐𝟏 𝑿𝟐𝟐 𝑿𝟏 𝑿𝟐 𝑿𝟏 𝒀 𝑿𝟐 𝒀 𝒀𝟐
4 13 15 169 225 195 52 60 16
5 12 16 144 256 192 60 80 25
5 15 18 225 324 270 75 90 25
6 14 17 196 289 238 84 102 36
7 16 17 256 289 272 112 119 49
∑ 𝒀 = 𝟐𝟕 ∑ 𝑿𝟏 = 𝟕𝟎 ∑ 𝑿𝟐 = 𝟖𝟑 ∑ 𝑿𝟐𝟏 ∑ 𝑿𝟐𝟐 ∑ 𝑿𝟏 𝑿𝟐 ∑ 𝑿𝟏 𝒀 ∑ 𝑿𝟐 𝒀 ∑ 𝒀𝟐
̅ = 𝟓. 𝟒
𝒀 ̅ 𝟏 = 𝟏𝟒
𝑿 ̅ 𝟐 = 𝟏𝟔. 𝟔
𝑿 = 𝟗𝟗𝟎 = 𝟏𝟑𝟖𝟑 = 𝟏𝟏𝟔𝟕 = 𝟑𝟖𝟑 = 𝟒𝟓𝟏 = 𝟏𝟓𝟏
a) Determinar la ecuación de regresión muestral de Y en X1, X2.
b) Hallar el coeficiente de Correlación
Solución:
𝒀 = 𝒂 + 𝒃𝟏 𝑿𝟏 + 𝒃𝟐 𝑿𝟐
̅ = 5.4; 𝑿
∑ 𝑿𝟏 𝑿𝟐 = 1167 ; ∑ 𝑿𝟏 𝒀 = 383; ∑ 𝑿𝟐 𝒀 = 451; ∑ 𝒀𝟐 = 151; 𝒀 ̅ 𝟏 = 𝟏4; 𝑿
̅ 𝟐 = 16.6
𝟓. 𝟐 ∗ 𝟓 − 𝟓 ∗ 𝟐. 𝟖 𝟐𝟔 − 𝟏𝟒
𝒃𝟏 = = = 𝒃𝟏 = 𝟎. 𝟒𝟒
𝟏𝟎 ∗ 𝟓. 𝟐 − 𝟐𝟓 𝟐𝟕
̅ 𝟐 )(𝒀
[∑ 𝒙𝟐𝟏 − 𝒏(𝑿̅𝟏 )𝟐 ][∑ 𝑿𝟐 𝒀 − 𝒏(𝑿 ̅ )] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿
̅ 𝟏 )(𝑿
̅ 𝟐 )][∑ 𝑿𝟏 𝒀 − 𝒏(𝑿
̅ 𝟏 )(𝒀
̅ )]
𝒃𝟐 = 𝟐 𝟐 𝟐 𝟐
[∑ 𝒙𝟏 − 𝒏(𝑿̅𝟏 ) ][∑ 𝒙𝟐 − 𝒏(𝑿̅𝟐 ) ] − [∑ 𝑿𝟏 𝑿𝟐 − 𝒏(𝑿 ̅ 𝟏 )(𝑿
̅ 𝟐 )]𝟐
[𝟏𝟎 ∗ 𝟐. 𝟖] − [𝟓 ∗ 𝟓] 𝟐𝟖 − 𝟐𝟓
𝒃𝟐 = ⟹ 𝒃𝟐 =
𝟏𝟎 ∗ 𝟓. 𝟐 − 𝟐𝟓 𝟐𝟕
𝒃𝟐 = 𝟎. 𝟏𝟏
̅ − 𝒃𝟏 𝑿
𝒂=𝒀 ̅ 𝟏 − 𝒃𝟐 𝑿
̅𝟐
𝒂 = 𝟓. 𝟒 − 𝟎. 𝟒𝟒 ∗ 𝟏𝟒 − 𝟎. 𝟏𝟏 ∗ 𝟏𝟔. 𝟔
𝒂 = −𝟐. 𝟓𝟖𝟔
̅𝟐
𝒂 ∑ 𝒀 + 𝒃𝟏 ∑ 𝑿𝟏 𝒀 + 𝒃𝟐 ∑ 𝑿𝟐 𝒀 − 𝒏𝒀
𝒓=√
∑ 𝒀𝟐 − 𝒏𝒀̅𝟐
2.508
𝑟= √
5.2
⟹ 𝒓 = 𝟎. 𝟔𝟗
Referencias bibliográficas