Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Página 151
Una función y = f(x) se dice que es lineal en X si la variable X aparece con potencia unitaria (por
tanto, se excluyen términos como x2, x3, 1/x, √x, por ejemplo) y no está multiplicada ni dividida por
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 24/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
otra variable. Por ejemplo, yj = a + bxi + cxi2 no es una función lineal en las variables puesto que la
variable X aparece elevada al cuadrado.
Se dice que una función es lineal en los parámetros si éstos aparecen con frecuencia unitaria y no
están multiplicados ni divididos por cualquier otro parámetro. A modo de ejemplo, yj = a + √bxi no
es una función lineal en los parámetros. Sin embargo, yj = a + bxi + cxi2 sí lo es.
Gráfico 5.4.
Página 152
representando el valor de Y que se estima a través de tal función lineal para X = xi en base a la
información disponible, obviamente las estimaciones de dichos parámetros, â y
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 25/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
y operando:
de donde
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 26/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
Página 153
A los valores â y
regresión. El coeficiente
es menor o igual que la unidad en valor absoluto, el valor estimado de Y para un valor de X
determinado es menos «raro» en la distribución de Y que tal valor de X en la distribución de X (en
el sentido de que, en términos relativos a su desviación típica, está más cercano a la media), ya
que
La expresión
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 28/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
Página 154
entonces
y como el tercer término del lado derecho de la ecuación se anula (véase nota a pie de página
134), se tiene que
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 29/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
Obsérvese el segundo término del lado derecho de la anterior ecuación. Por la segunda propiedad
de la media aritmética, para cada valor xi la diferencia cuadrática se minimiza cuando el
sustraendo de yj es precisamente
/xi. Como esto ocurre cualquiera que sea el valor xi, resultará que la suma para todo i de dichas
diferencias cuadráticas será la mínima posible y, en consecuencia:
, como el segundo término de la derecha no los incluye, no influye para nada en los resultados
que se obtengan, pues su derivada respecto de cualquiera de ellos es nula.
Evidentemente, lo expuesto es válido para cualquier función que se ajuste a los datos (o medias),
no teniendo por qué ser exclusivo del caso lineal.
, con
Página 155
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 30/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
Suponiendo que se ha optado por una recta como la mejor función que puede ajustar la nube de
puntos del Ejemplo 5.1, obténgase la estimación de los coeficientes de la recta de regresión e
interprétense. Utilice dicha recta para estimar las ventas de un comercial con 17 años de
antigüedad en el sector.
Solución:
Para el cálculo de los coeficientes de regresión, se construye la siguiente tabla, en la que se
incorporan las marcas de clase de los intervalos de antigüedad:
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 31/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
Página 156
Gráfico 5.5.
su varianza
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 32/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
Página 157
y la covarianza entre la antigüedad como comerciales en el sector y las ventas de los mismos,
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 33/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
Una vez elegida la función rectilínea para representar la relación de dependencia de Y sobre X y
estimados sus parámetros a y b, a continuación se procede al cómputo del coeficiente de
determinación lineal con objeto de medir el grado de dependencia de Y sobre X bajo la función de
regresión lineal estimada.
En el caso lineal,
Página 158
Dicha expresión se denomina, lógicamente, coeficiente de determinación lineal simple, r2, por ser
una particularización de la razón de correlación, y más concretamente del coeficiente de
determinación14 .
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 34/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple
r2 = 0 significa que la relación lineal entre Y y X no reduce en absoluta la SCE que tiene lugar
a la hora de proceder a la estimación de los valores de Y sin conocimiento de los valores de X
(ŷi =
) y, por consiguiente, la regresión lineal no aporta nada a la hora de mejorar las estimaciones
de Y (seguirá siendo la recta ŷi =
).
r2 = 1 indica que la estimación de los valores de Y a través de la recta de regresión es
perfecta, por cuanto es capaz de hacer nula SCE. En otros términos: Y depende
funcionalmente de X a través de la recta estimada.
Cuanto más se acerque a cero r2, menor será la capacidad de la recta estimada a la hora de
explicar la relación de dependencia de Y sobre X. Lógicamente, cuanto más se acerque a la
unidad, mayor será su capacidad de explicar tal relación.
Página 159
sea la misma que en la regresión de Y sobre X, lo cual únicamente ocurriría en el caso de que ésta
fuese nula. Lo que sí coincide es la razón entre la varianza de los errores de estimación en la
regresión de Y sobre X y la varianza de Y con la razón de los errores de estimación en la regresión
de X sobre Y y la varianza de X. Efectivamente,
https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 35/75