Sei sulla pagina 1di 12

20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

La «eficiencia relativa» de la regresión de Y sobre X, es decir, el porcentaje de la dependencia


estadística de Y respecto de X (νY/X) que recoge la función de regresión de tipo II elegida, viene
dada por la expresión

interpretándose como lo efectiva que es la curva o función ajustada a la hora de recoger la


dependencia estadística de Y respecto de X. En definitiva, como ya se indicó anteriormente,
representa el porcentaje de ηY/X que recoge la función de regresión de tipo II elegida.

En el caso de la regresión de X sobre Y se tiene

La función de regresión de tipo II más comúnmente utilizada para relacionar estadísticamente Y


con X es la recta, ya que es de fácil manejo y, con cierta frecuencia, se ajusta bastante bien a la
realidad. Por esta razón, el siguiente apartado está dedicado a la regresión lineal.

Página 151 

5.4. Regresión lineal


Antes de comenzar con este apartado resulta esencial entender qué se entiende por lineal, ya que
hay dos posibles interpretaciones: linealidad en las variables y linealidad en los parámetros.

Una función y = f(x) se dice que es lineal en X si la variable X aparece con potencia unitaria (por
tanto, se excluyen términos como x2, x3, 1/x, √x, por ejemplo) y no está multiplicada ni dividida por

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 24/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

otra variable. Por ejemplo, yj = a + bxi + cxi2 no es una función lineal en las variables puesto que la
variable X aparece elevada al cuadrado.

Se dice que una función es lineal en los parámetros si éstos aparecen con frecuencia unitaria y no
están multiplicados ni divididos por cualquier otro parámetro. A modo de ejemplo, yj = a + √bxi no
es una función lineal en los parámetros. Sin embargo, yj = a + bxi + cxi2 sí lo es.

De las dos interpretaciones de linealidad, la linealidad en los parámetros es la más relevante en el


contexto de la teoría de la regresión y de la correlación. Sin embargo, en lo que sigue, se exigirá
tanto la linealidad en los parámetros como en las variables para que la regresión sea calificada de
lineal12 .

5.4.1. ESTIMACIÓN DE LOS PARÁMETROS DE LA REGRESIÓN LINEAL

En el caso en que se presuma que la relación de dependencia de Y sobre X es de carácter lineal, yj


= a + bxi + eij, donde eij representa el error que se comete como consecuencia de que pudiera
haber otras variables que influyesen en el comportamiento de la variable Y, la cuestión es: ¿Cómo
estimar los parámetros a y b de la misma?

Gráfico 5.4.

Página 152 

Como en esta tesitura la función de regresión de tipo II elegida sería

representando el valor de Y que se estima a través de tal función lineal para X = xi en base a la
información disponible, obviamente las estimaciones de dichos parámetros, â y

, serán aquellas que minimicen SCE:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 25/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

Derivando parcialmente respecto a â y

e igualando a cero, se tiene que

y operando:

sistema denominado de ecuaciones normales.

Dividiendo ambas ecuaciones por N se obtiene

y restando de la segunda la primera multiplicada por a10 se llega a

de donde

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 26/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

y despejando de la primera de las ecuaciones del sistema se tiene que

con lo que la recta de regresión se puede escribir en forma explícita como

o bien, en forma punto-pendiente, como

Página 153 

Obviamente, a y b son dos parámetros (no varían), mientras que â y

son estimaciones obtenidas a partir de un conjunto finito de observaciones. Si en lugar de las


observaciones disponibles se tuviesen otras, los valores de â y

diferirían de los estimados previamente.

A los valores â y

se les denomina coeficientes de la regresión lineal de Y sobre X o, simplemente, coeficientes de


https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 27/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

regresión. El coeficiente

, cuyo signo es el de la covarianza entre las variables, es la pendiente de la recta de regresión de Y


sobre

, e indica la variación de Y ante un incremento unitario de X. El término independiente u ordenada


en el origen, desde un enfoque geométrico, es el punto de corte entre la recta de regresión y el eje
de ordenadas. Analíticamente puede interpretarse como el valor estimado para Y cuando X = 0,
aunque esta interpretatión analítica puede no tener sentido alguno en la realidad.

Dividiendo por SY en ambos lados de la ecuación de regresión lineal se obtiene

es decir, en la regresión lineal, dado que

es menor o igual que la unidad en valor absoluto, el valor estimado de Y para un valor de X
determinado es menos «raro» en la distribución de Y que tal valor de X en la distribución de X (en
el sentido de que, en términos relativos a su desviación típica, está más cercano a la media), ya
que

La expresión

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 28/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

puede denominarse, de forma introductoria, «covarianza relativa». No obstante, en el apartado


5.4.2 recibirá el nombre de coeficiente de correlación lineal entre X e Y, denominación por la que
es conocida, y se denotará por r.

En la estimación de los coeficientes a y b (o de la recta de regresión) es indiferente trabajar con los


valores observados de la variable Y o con sus medias condicionadas repetidas ni. veces13 puesto
que como

Página 154 

entonces

y sumando para todas las observaciones

y como el tercer término del lado derecho de la ecuación se anula (véase nota a pie de página
134), se tiene que

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 29/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

Obsérvese el segundo término del lado derecho de la anterior ecuación. Por la segunda propiedad
de la media aritmética, para cada valor xi la diferencia cuadrática se minimiza cuando el
sustraendo de yj es precisamente

/xi. Como esto ocurre cualquiera que sea el valor xi, resultará que la suma para todo i de dichas
diferencias cuadráticas será la mínima posible y, en consecuencia:

Además, analíticamente, al derivar SCE respecto de â y

, como el segundo término de la derecha no los incluye, no influye para nada en los resultados
que se obtengan, pues su derivada respecto de cualquiera de ellos es nula.

Evidentemente, lo expuesto es válido para cualquier función que se ajuste a los datos (o medias),
no teniendo por qué ser exclusivo del caso lineal.

De forma análoga a como se ha realizado la regresión lineal de Y sobre X se llevaría a cabo la


regresión de X sobre Y,

, con

Página 155 

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 30/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

Ambas regresiones lineales, la de Y sobre X y la de X sobre Y, pasan por el punto (

), que se denomina centro de gravedad de la distribución de frecuencias.


EJEMPLO 5.5

Suponiendo que se ha optado por una recta como la mejor función que puede ajustar la nube de
puntos del Ejemplo 5.1, obténgase la estimación de los coeficientes de la recta de regresión e
interprétense. Utilice dicha recta para estimar las ventas de un comercial con 17 años de
antigüedad en el sector.

Solución:
Para el cálculo de los coeficientes de regresión, se construye la siguiente tabla, en la que se
incorporan las marcas de clase de los intervalos de antigüedad:

De ella se deducen el valor medio de la antigüedad de los comerciales en el sector:

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 31/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

Página 156 

Gráfico 5.5.

su varianza

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 32/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

Página 157 

y la covarianza entre la antigüedad como comerciales en el sector y las ventas de los mismos,

necesarias para el cálculo de los coeficientes de regresión:

Finalmente, la recta de regresión de la variable Y sobre la variable X viene dada por

En cuanto a la interpretación de los coeficientes de regresión, de dicha recta se deduce que,


cuando la antigüedad de un comercial en el sector aumenta un año, sus ventas se incrementan en
46.488,89 €. Sin embargo, respecto a la interpretación del coeficiente â, éste sería uno de los casos
en los que carece de sentido tal interpretación, ya que resulta que las ventas generadas por un
comercial sin antigüedad en el sector serían de – 62.508,57 €, lo cual es absurdo ya que las ventas
no pueden ser negativas.

Esta recta de regresión, a diferencia de la regresión de tipo I, permite estimar valores de Y


correspondientes a valores de X que no se encuentran en la distribución. Por ejemplo, se pueden
estimar las ventas que le corresponderían a un comercial con 17 años de antigüedad en el sector
como

5.4.2. COEFICIENTE DE DETERMINACIÓN LINEAL

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 33/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

Una vez elegida la función rectilínea para representar la relación de dependencia de Y sobre X y
estimados sus parámetros a y b, a continuación se procede al cómputo del coeficiente de
determinación lineal con objeto de medir el grado de dependencia de Y sobre X bajo la función de
regresión lineal estimada.

En el caso lineal,

, el coeficiente de determinación adopta la siguiente expresión:

Página 158 

Dicha expresión se denomina, lógicamente, coeficiente de determinación lineal simple, r2, por ser
una particularización de la razón de correlación, y más concretamente del coeficiente de
determinación14 .

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 34/75
20/4/2020 Gale eBooks - Documento - Regresión y Correlación Simple

Su campo de variación es [0; 1], interpretándose como sigue:

r2 = 0 significa que la relación lineal entre Y y X no reduce en absoluta la SCE que tiene lugar
a la hora de proceder a la estimación de los valores de Y sin conocimiento de los valores de X
(ŷi =

) y, por consiguiente, la regresión lineal no aporta nada a la hora de mejorar las estimaciones
de Y (seguirá siendo la recta ŷi =

).
r2 = 1 indica que la estimación de los valores de Y a través de la recta de regresión es
perfecta, por cuanto es capaz de hacer nula SCE. En otros términos: Y depende
funcionalmente de X a través de la recta estimada.
Cuanto más se acerque a cero r2, menor será la capacidad de la recta estimada a la hora de
explicar la relación de dependencia de Y sobre X. Lógicamente, cuanto más se acerque a la
unidad, mayor será su capacidad de explicar tal relación.

En el caso de la regresión lineal de X sobre Y el coeficiente de determinación sería el mismo, sin


que ello implique que la varianza de los errores de estimación

Página 159 

sea la misma que en la regresión de Y sobre X, lo cual únicamente ocurriría en el caso de que ésta
fuese nula. Lo que sí coincide es la razón entre la varianza de los errores de estimación en la
regresión de Y sobre X y la varianza de Y con la razón de los errores de estimación en la regresión
de X sobre Y y la varianza de X. Efectivamente,

de donde se deduce que

https://go.gale.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 35/75

Potrebbero piacerti anche