Sei sulla pagina 1di 16

Modelos

Cuantitativos y
Optimización
Sesión 3

Mg. Noelia Delgadillo Rodríguez


RESIDUALES
• En el ejemplo de las pizzerías Arnold obtuvimos la ecuación de regresión
𝑦ො = 60 + 5𝑥 para aproximar la relación lineal entre el tamaño de la
población de estudiantes (x) y las ventas trimestrales (y). Para la i-ésima
observación, la diferencia entre el valor observado de 𝑦𝑖 y el valor
estimado de la variable dependiente 𝑦ො𝑖 se definen por:
• 𝑒𝑖 = 𝑦𝑖 − 𝑦ො𝑖 .
• La suma de cuadrados de esos residuales o errores es la cantidad que se
mínimiza con el método de mínimos cuadrados; entonces definimos la
Suma de Cuadrados debido al Error (SCE), como:
• 𝑆𝐶𝐸 = σ 𝑦𝑖 − 𝑦ො𝑖 2 (1)
• El valor de la Suma de cuadrados debido al Error (SCE) es una medida del
error que se comete al usar la ecuación de regresión para calcular los
valores de la variable dependiente en la muestra.
• El conjunto de residuales sirve para calcular el error estándar de
estimación.
Ejemplo 1:
• Del ejemplo de la cadena de Pizzerias Arnold determine la suma de cuadrados de debido al error
(SCE). 2
Restaurante i 𝑥𝑖 𝒚𝑖 𝑦ො𝑖 = 60 + 5𝑥𝑖 𝒚𝒊 − 𝑦ො𝑖 𝑦𝑖 − 𝑦ො𝑖
1 2 58 70 -12 144
2 6 105 90 15 225
3 8 88 100 -12 144
4 8 118 100 18 324
5 12 117 120 -3 9
6 16 137 140 -3 9
7 20 157 160 -3 9
8 20 169 160 9 81
9 22 149 170 -21 441
10 26 202 190 12 144
TOTAL 1530
• Así la suma de cuadrados debido al error (SCE) mide el error cometido al usar la
ecuación de regresión, 𝑦ො = 60 + 5𝑥 para predecir las ventas.
• Ahora supongamos que queremos determinar un estimado de las ventas
trimestrales sin conocer el tamaño de la población de estudiantes, entonces
usamos la media de las muestras como estimado de las ventas trimestrales en
cualquier local de las pizzerías, entonces consideramos el valor medio de las
𝑦𝑖
σ
ventas para la muestra de 10 locales de la pizzerías: 𝑦ത = 𝑛 = 130 así podemos
hallar la suma de las desviaciones elevadas al cuadrado, para el i-ésimo local, la
diferencia 𝑦𝑖 − 𝑦ത suministra una medida del error incurrido al usar 𝑦ത para estimar
las ventas; a la suma de estas diferencias se les llama Suma Total de Cuadrados
(STC). Se denota por:
• 𝑆𝑇𝐶 = σ 𝑦𝑖 − 𝑦ത 2 (2)
Ejemplo 2:
• Del ejemplo de la Pizzerias Arnold determine la suma total de cuadrados (STC).
2
Restaurante i 𝑥𝑖 𝒚𝑖 𝑦𝑖 − 𝑦ത 𝑦𝑖 − 𝑦ത
1 2 58 -72 5184
2 6 105 -25 625
3 8 88 -42 1764
4 8 118 -12 144
5 12 117 -13 169
6 16 137 7 49
7 20 157 27 729
8 20 169 39 1521
9 22 149 19 361
10 26 202 72 5184
TOTAL 15730
• Se puede entender que Suma Total de Cuadrados (STC) como una
medida de cuanto se agrupan las observaciones en torno a la línea 𝑦ത ,
y la suma de Cuadrados debido al Error (SCE) como una medida de
cuanto se agrupan las observaciones en torno a la recta 𝑦.

• Para medir cuanto se desvían de 𝑦ത los valores 𝑦ො en la recta de
regresión, se calcula otra suma de cuadrados, la cual se llama Suma
de Cuadrados debido a la Regresión (SCR).
• 𝑆𝐶𝑅 = σ 𝑦ො𝑖 − 𝑦ത 2 (3)
Ejemplo 3:
• Del ejemplo de la Pizzerias Arnold determine la suma de cuadrados debido a la regresión (SCR)

2
Restaurante i 𝑥𝑖 𝒚𝑖 𝑦ො𝑖 𝑦ො𝑖 − 𝑦ത 𝑦ො𝑖 − 𝑦ത
1 2 58 70 -60 3600
2 6 105 90 -40 1600
3 8 88 100 -30 900
4 8 118 100 -30 900
5 12 117 120 -10 100
6 16 137 140 10 100
7 20 157 160 30 900
8 20 169 160 30 900
9 22 149 170 40 1600
10 26 202 190 60 3600
TOTAL 14200
RELACIÓN ENTRE STC, SCR Y SCE
• La relación entre STC, SCR Y SCE es uno de los resultados mas
importantes de la estadística.
• 𝑆𝑇𝐶 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸 (4)
• Donde:
• STC: suma total de cuadrados
• SCR: suma de los cuadrados debido a la regresión
• SCE: suma de los cuadrados debido al error.
Ejemplo 4:
• Para el ejemplo de la Pizzerias Arnolds hallamos:
• SCE=1530
• STC= 15730
• de tal forma que podemos hallar el valor de SCR haciendo el despeje
correspondiente en la ecuación (4),
• 𝑆𝑇𝐶 = 𝑆𝐶𝑅 + 𝑆𝐶𝐸
• 15730=SCR+1530
• 15730-1530=SCR
• 14200=SCR
COEFICIENTE DE DETERMINACIÓN
• La correlación lineal mide el grado de ajuste o de relación entre las
variables consideradas x, y.
• El coeficiente de determinación mide el grado de ajuste de los datos
con respecto a la recta de regresión. Se expresa en forma porcentual.

2 𝑆𝐶𝑅 σ 𝑦ො 𝑖 −𝑦ത 2
•𝑟 = 𝑆𝑇𝐶
= σ 𝑦𝑖 −𝑦ത 2
(5)
• Donde:
• STC: suma total de cuadrados
• SCR: suma de los cuadrados debido a la regresión
Observaciones:
• 1) 𝑟 2 es único
• 2)SI 𝑟 2 = 1 el ajuste es perfecto, entonces SCR=STC.
• 3)Si 𝑟 2 = 0 no existe ajuste de los datos con respecto a la recta.
• 4)Si 𝑟 2 ⟶ 0 el ajuste de los datos a la recta es muy débil (casi malo),
entonces los valores de SCE son altos.
• 5)Si 𝑟 2 → 1 el ajuste de los datos hacia la recta es muy buena.
Ejemplo 5:
• Para el ejemplo de la cadena de Pizzerias Arnold, el valor del
coeficiente de variación es:
2 𝑆𝐶𝑅 14200
•𝑟 = = = 0,9027
𝑆𝑇𝐶 15730
• Entonces podemos decir que el 90.27% de la variabilidad en las
ventas se explica por la relación lineal que existe entre estas y el
tamaño de la población de estudiantes.
COEFICIENTE DE CORRELACIÓN
• Mide el grado de asociación o relación entre las variables
consideradas. Solo se hallara la raíz cuadrada del coeficiente de
determinación.
• Es una medida descriptiva de la intensidad de la relación lineal entre
las variables x e y.
• El coeficiente de correlación muestral es:
• 𝑟𝑥𝑦 = ±𝑏1 𝑟2 (6)
• Donde:
• 𝑏1 :pendiente de la ecuación de regresión estimada, 𝑦ො = 𝑏0 + 𝑏1 𝑥
Observaciones:
• 1)Si r = ±1, la asociación de las variables es perfecta.
• 2)Si r → 1 la realcion de las variables es muy buena (en forma
positiva).
• 3)Si r → −1 la relación entre las variables es muy buena pero
negativa (es decir, las variables son inversamente proporcionales).
• 4)Si r → 0 la relación entre las variables es muy débil o no existe
relación entre ellas.
Ejemplo 6:
• Para el ejemplo de la cadena de Pizzerias Arnold, el valor del
coeficiente de determinación correspondiente a la ecuación de
regresión estimada 𝑦ො = 60 + 5𝑥 es 0.9027. Como la pendiente de la
ecuación es positiva , la ecuación (3) indica que el coeficiente de
correlación muestral es + 0,9025 = +0,9501. Con este coeficiente
𝑟𝑥𝑦 = +0,9501, concluimos que existe una fuerte relación lineal
positiva entre las variables x e y.

Potrebbero piacerti anche