Sei sulla pagina 1di 10

Análisis de regresión Lineal

El concepto de análisis de regresión se refiere a encontrar la mejor relación entre Y y x

cuantificando la fuerza de esa relación, y empleando métodos que permitan predecir los valores

de la respuesta dados los valores del regresorx.

Una forma razonable de relación entre la respuesta Y y el regresor x es la relación lineal es:

Y = βo+ β 1 x

En la anterior ecuación tenemos cuatro parámetros:

1. Y es la variable que se va a estimar en función de otra variable ( x) supuestamente

conocida. Se le denomina también variable dependiente.

2. x es la variable cuyo valor se conoce. Se le denomina variable independiente.

3. β 1 es la pendiente, la que nos denomina el ángulo de inclinación de la recta.

Denominada también coeficiente angular, que nos permite cuantificar la cantidad que

aumenta o decrece Y .

9
B0>0 B0<0 B0=k
88

77 7 7 7

6 6

4 4 4

3 3

2 2 2

11

0
4. Β o es un símbolo que se utiliza para indicar el coeficiente de posicionu origen en la

ordenada.

Método de mínimos cuadrados

Debemos calcular los estimados de βo y β 1, de manera que la suma de los cuadrados de los

residuales sea mínima. La suma residual de los cuadrados con frecuencia se denomina suma de

los cuadrados del error respecto de la recta de regresión .Este procedimiento de minimización

para estimar los parámetros se denomina método de mínimos cuadrados. Por lo tanto, debemos

calcular βo y β 1 para minimizar.

Estimación de los coeficientes de la regresión

Dada la muestra { ( xi , yi ) ; i=1,2 ,.. , n }los coeficientes βo y β 1de regresión se calculan mediante

las formulas:

n n n

β 1=
n ∑ xi∗yi−
i =1
( )( )
∑ xi ∗ ∑ yi
i=1 i=1
n
2
n ∑ xi −¿ ¿
i=1

n n

∑ yi−β 1 ∑ x i
β 0= i=1 i=1
n
Ejemplos

1. Una aplicación del modelo de regresión lineal En un trabajo de investigación en el área

de salud (Ducuara Mora, 2012), acerca de las condiciones de crecimiento y desarrollo de

los niños y niñas de la localidad de Ciudad Bolívar (Bogotá); se extrajo la siguiente tabla

que muestra las variables edad y talla de niños entre 6 y 60 meses de edad.

Edad y talla en niños de 6 a 60 meses Edad (meses) Talla (cms) Edad (meses) Talla

Edad (meses) Talla (cms) Edad (meses) Talla (cms)


6 65 34 87.4590
8 72.25 36 89.6215
10 78 38 90.7149
12 71.4166 40 94.8675
14 72.08 42 93.70961
16 74.6736 44 95.31021
18 77.8125 46 96.3507
20 77.9958 48 97.1337
22 81.9057 50 99.1140
24 81.5162 52 99.7460
26 82.7729 54 100.55179
28 85.5116 56 101.55179
30 85.5852 58 103.88048
32 85,7066 60 107,5592

Para decidir qué clase de función podría ajustarse a la curva, de acuerdo con las posibilidades

debe hacerse una gráfica de dispersión de los datos observados. Si en dicha gráfica se aprecia

que los puntos se distribuyen alrededor de una recta, se procede a realizar un análisis de

regresión lineal.
La gráfica de dispersión nos sugiere que existe una relación lineal entre la variable independiente

edad y la variable dependiente talla (Figura 2) El modelo de regresión lineal simple es:

Y = βo+ β 1 x (1)

Los valores de los parámetros βo y β 1 no se conocen y deben estimarse a partir de los datos de

la muestra. Para calcular los regresores se emplea el método de los mínimos cuadrados el cual es

un procedimiento que se remonta al inicio del siglo XIX por el trabajo del matemático francés

Adrien Legendre.

Con el fin de evitar desarrollos algebráicos y aritméticos engorrosos se utilizará la hoja de

cálculo EXCEL®. Al ingresar los datos de la tabla 1 y empleando la herramienta ANÁLISIS DE

DATOS en la opción REGRESIÓN, se obtiene la siguiente información:


En esta tabla los valores de intercepción y variable X1 hacen referencia a los coeficientes βo y

β 1respectivamente. Remplazando estos datos en la ecuación (1), se tiene que la ecuación de

regresión para las variables talla y edad es

y=65.159+ 0.6569 x.

2. Una aplicación del modelo de regresión lineal Con el fin de estudiar este modelo, se

emplearán los datos tomados de una muestra real, extraídos de un comunicado de prensa

que revela el porcentaje de pobreza, pobreza extrema y el coeficiente de Gini (indicador

de la desigualdad económica en una población) en los años 2010 y 2011 de las trece

principales ciudades de Colombia


Para decidir qué clase de función podría ajustarse a la curva, de acuerdo con las posibilidades de

la figura 1, debe hacerse una gráfica de dispersión de los datos observados. Si en dicha gráfica se

aprecia que los puntos se distribuyen alrededor de una recta, se procede a realizar un análisis de

regresión lineal.
El modelo de regresión lineal simple es: Y = βo+ β 1 x (1)

Los valores de los parámetrosβo y β 1 no se conocen y deben estimarse a partir de los datos de la

muestra.

Con el fin de evitar desarrollos algebraicos y aritméticos engorrosos se utilizará la hoja de

cálculo EXCEL®. Al ingresar los datos de la tabla 1 y empleando la herramienta ANÁLISIS DE

DATOS en la opción REGRESIÓN, se obtiene la siguiente información:

y=−1.3148+ 0.94126 x

Coeficiente de correlación o de Pearson

EL coeficiente de correlación es una medida de interdependencia de dos variables aleatorias. En

primer lugar cuando nos referimos al cálculo del coeficiente de correlación al cuadrado

denominado también como coeficiente de determinación, simbolizado por. Las fórmulas para el

cálculo de este coeficiente son variadas, obteniéndose un resultado igual por cualquiera de los

métodos que se utilice. Veámoslo:


El coeficiente de correlación al cuadrado debe ser un valor tal que, cumpla con la siguiente

condición: 0 ≤ R 2 ≤ 1. Cuando el coeficiente de correlación al cuadrado es igual a 1, decimos que

hay una correlación perfecta, ya que los valores observados son exactamente iguales a los

estimados, en otras palabras los puntos en la gráfica (nube de puntos) se confunden con los de la

recta. A medida que el coeficiente de correlación disminuye, se aleja uno, se dice que la recta

representa cada vez menos a ese conjunto de observaciones.

De acuerdo con la formula presentada anteriormente podemos decir, que el coeficiente de

correlación de determinación mide la proporción de la varianza que queda explicada por la

ecuación de regresión, que describe la relación establecida entre las dos variables. En otras

palabras indica el porcentaje de las variaciones de la variable dependiente, atribuible de la

variable independiente.

Nos podemos referir simplemente al coeficiente de correlación, en este caso de una recta, el cual

simboliza por R o r. Se define como la raíz cuadrada del coeficiente de determinación. El signo

del coeficiente de correlación dependerá del signo que tenga la covarianza o los coeficientes

angulares.
Bibliografía
1. Martínez C. (2012). Estadística y muestreo, Editorial mexicana 13° edición. Recuperado

de: https://eodelgadorcursos.files.wordpress.com/2019/02/book_estadc3adstica-y-

muestreo-13va-edicic3b3n-ciro-martc3adnez-bencardino.pdf

2. Wallpole R. & Myers R. (2012). Probabilidad y estadística para ingeniería y ciencias,

Cámara Nacional de la Industria Editorial Mexicana, 8° edición. Recuperado de:

https://vereniciafunez94hotmail.files.wordpress.com/2014/08/8va-probabilidad-y-

estadistica-para-ingenier-walpole_8.pdf

3. Cardona D. & Gonzales J. (2013). Artículo: Aplicación de la regresión

lineal en un problema de pobreza. Recuperado de:

http://www.unilibre.edu.co/revistainteraccion/volumen12/art4.pdf

4. Cardona D. & Gonzales J. (2013). Artículo: Aplicación de la regresión

lineal en un problema de nutrición. Recuperado de:

http://www.unilibre.edu.co/revistaingeniolibre/revista-12/ar3.pdf.

Potrebbero piacerti anche