Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Cuantitativos y
Optimización
Sesión 6
• Donde:
• 𝑆𝑇𝐶 = σ𝑛𝑖=1 𝑦𝑖 − 𝑦ത 2 se la suma de cuadrados total. Refleja la variabilidad de los valores
de Y con respecto a la media 𝑦.
ത
• 𝑆𝐶𝐸 = σ𝑛𝑖=1 𝑦𝑖 − 𝑦ො𝑖 2
es la suma de cuadrados de los errores o residuales ( varianza no
explicada).
• 𝑆𝐶𝑅 = σ𝑛𝑖=1 𝑦ො𝑖 − 𝑦ത 2
es la suma de cuadrados de la regresión (varianza explicada por la
regresión).
• Los grados de libertad respectivos de las sumas de cuadrados son:
• 𝑆𝑇𝐶 = 𝑆𝐶𝐸 + 𝑆𝐶𝑅
• 𝑛−1= 𝑛−𝑘−1 +𝑘
• La distribución F con grados de libertad k y (n-k-1), esto es,
𝑆𝐶𝑅/𝑘 𝐶𝑀𝑅
• 𝐹= = tiene distribución F(k,n-k-1)
𝑆𝐶𝐸/(𝑛−𝑘−1) 𝐶𝑀𝐸
• En donde:
𝑆𝐶𝑅
• 𝐶𝑀𝑅 = 𝑦 𝐶𝑀𝐸 = 𝑆𝐶𝐸/(𝑛 − 𝑘 − 1)
𝑘
• Son los cuadrados medios de regresión y de error respectivamente.
• Dado el nivel de significación 𝛼, y los grados de libertad k y (n-k-1), en la tabla F
se encuentra el valor critico 𝑐 = 𝐹1−𝛼,𝑘,𝑛−𝑘−1 .
• La regla de decisión consiste en rechazar la hipótesis nula:𝐻0 : 𝛽1 =
𝛽2 = ⋯ = 𝛽𝑘 = 0, si el valor calculado de F es mayor que el valor
critico c. No rechazar 𝐻0 en caso contrario.
• La prueba de hipótesis de análisis global se resume en la siguiente
taba de análisis de varianza (ANOVA):
Fuente de variación Suma de cuadrados Grados de libertad Cuadrados medios F calculada
1 10 9 45 12.8 163.84
2 9 8 40 7.8 60.84
3 8 6 38 5.8 33.64
4 7 6 35 2.8 7.84
5 7 5 32 -0.2 0.04
6 6 4 30 -2.2 4.84
7 6 3 28 -4.2 17.64
8 4 2 27 -5.2 27.04
9 3 2 25 -7.2 51.84
10 2 1 22 -10.2 104.04
TOTAL 62 46 322 471.6
• Del ejemplo de la muestra de 10 familias determine la suma total de cuadrados (SCE).
𝑋1 𝑋𝟐 𝑦ො = 18.947 + 0.509𝑥1 + 2.195𝑥2 𝑦𝑖 − 𝑦ො𝑖 2
Familias i Y 𝑦𝑖 − 𝑦ො𝑖
1 10 9 45 43.792 1.208 1.459264
2 9 8 40 41.088 -1.088 1.183744
3 8 6 38 36.189 1.811 3.279721
4 7 6 35 35.68 -0.68 0.4624
5 7 5 32 33.485 -1.485 2.205225
6 6 4 30 30.781 -0.781 0.609961
7 6 3 28 28.586 -0.586 0.343396
8 4 2 27 25.373 1.627 2.647127
9 3 2 25 24.864 0.136 0.018496
10 2 1 22 22.16 -0.16 0.0256
TOTAL 62 46 322 12.234934
• Cuando el tamaño de la muestra es pequeño (n), el índice de
determinación multiple 𝑅2 tiende a estar positivamente sesgada.
• Para corregir este sesgo se utiliza el coeficiente e índice de
determinación multiple corregido (o ajustado) que se denota por 𝑅2 y
se define por:
𝐶𝑀𝐸
• 𝑅2 =1−
𝐶𝑀𝑇
• Donde:
• CME: cuadrados medios por el error
• CMT: cuadrados medios por el total
Ejemplo 3:
• Aplicando a los datos del ejemplo de las 10 familias el coeficiente
multiple corregido es:
𝐸𝐶𝑀 1.748
• 𝑅2 =1− =1− = 0.967
𝐶𝑀𝑇 52.4
• Donde:
• K=2
𝑆𝐶𝐸 12.235
• 𝐸𝐶𝑀 = = = 1.748
𝑛−𝑘−1 7
𝑆𝐶𝑇 471.6
• 𝐶𝑀𝑇 = = = 52.4
𝑛−1 10−1
COEFICIENTE DE CORRELACIÓN MULTIPLE
• La raíz cuadrada positiva del coeficiente de determinación multiple se
denomina coeficiente de correlación multiple que denotamos por R.
• Este número mide la relación entre las variables independientes
consideradas como grupo y la variables dependiente Y.
• El coeficiente de correlación muestral es:
• 𝑅 = 𝑅2 (6)
Ejemplo 4:
• Para el ejemplo de la muestra de las 10 familias , el coeficiente de
correlación multiple de Y con 𝑋1 y 𝑋2 es:
• 𝑅 = 0.974 = 0.987
• Dado que en el análisis de varianza se encuentra que es significativa la
regresión global de Y con 𝑋1 𝑦 𝑋2 se concluye que existe correlación
lineal múltiple.