Regresion y Correlación

Análisis de regresión Lineal
El concepto de análisis de regresión se refiere a encontrar la mejor relación entre Y y x
cuantificando la fuerza de esa relación, y empleando métodos que permitan predecir los valores
de la respuesta dados los valores del regresorx.
Una forma razonable de relación entre la respuesta Y y el regresor x es la relación lineal es:
Y = βo+ β 1 x
En la anterior ecuación tenemos cuatro parámetros:
1. Y es la variable que se va a estimar en función de otra variable ( x) supuestamente
conocida. Se le denomina también variable dependiente.
2. x es la variable cuyo valor se conoce. Se le denomina variable independiente.
3. β 1 es la pendiente, la que nos denomina el ángulo de inclinación de la recta.
Denominada también coeficiente angular, que nos permite cuantificar la cantidad que
aumenta o decrece Y .
9
B0>0 B0<0 B0=k
88
77 7 7 7
6 6
4 4 4
3 3
2 2 2
11
0
4. Β o es un símbolo que se utiliza para indicar el coeficiente de posicionu origen en la
ordenada.
Método de mínimos cuadrados
Debemos calcular los estimados de βo y β 1, de manera que la suma de los cuadrados de los
residuales sea mínima. La suma residual de los cuadrados con frecuencia se denomina suma de
los cuadrados del error respecto de la recta de regresión .Este procedimiento de minimización
para estimar los parámetros se denomina método de mínimos cuadrados. Por lo tanto, debemos
calcular βo y β 1 para minimizar.
Estimación de los coeficientes de la regresión
Dada la muestra { ( xi , yi ) ; i=1,2 ,.. , n }los coeficientes βo y β 1de regresión se calculan mediante
las formulas:
n n n
β 1=
n ∑ xi∗yi−
i =1
( )( )
∑ xi ∗ ∑ yi
i=1 i=1
n
2
n ∑ xi −¿ ¿
i=1
n n
∑ yi−β 1 ∑ x i
β 0= i=1 i=1
n
Ejemplos
1. Una aplicación del modelo de regresión lineal En un trabajo de investigación en el área
de salud (Ducuara Mora, 2012), acerca de las condiciones de crecimiento y desarrollo de
los niños y niñas de la localidad de Ciudad Bolívar (Bogotá); se extrajo la siguiente tabla
que muestra las variables edad y talla de niños entre 6 y 60 meses de edad.
Edad y talla en niños de 6 a 60 meses Edad (meses) Talla (cms) Edad (meses) Talla
Edad (meses) Talla (cms) Edad (meses) Talla (cms)

6 65 34 87.4590
8 72.25 36 89.6215
10 78 38 90.7149
12 71.4166 40 94.8675
14 72.08 42 93.70961
16 74.6736 44 95.31021
18 77.8125 46 96.3507
20 77.9958 48 97.1337
22 81.9057 50 99.1140
24 81.5162 52 99.7460
26 82.7729 54 100.55179
28 85.5116 56 101.55179
30 85.5852 58 103.88048
32 85,7066 60 107,5592
Para decidir qué clase de función podría ajustarse a la curva, de acuerdo con las posibilidades
debe hacerse una gráfica de dispersión de los datos observados. Si en dicha gráfica se aprecia
que los puntos se distribuyen alrededor de una recta, se procede a realizar un análisis de
regresión lineal.
La gráfica de dispersión nos sugiere que existe una relación lineal entre la variable independiente
edad y la variable dependiente talla (Figura 2) El modelo de regresión lineal simple es:
Y = βo+ β 1 x (1)
Los valores de los parámetros βo y β 1 no se conocen y deben estimarse a partir de los datos de
la muestra. Para calcular los regresores se emplea el método de los mínimos cuadrados el cual es
un procedimiento que se remonta al inicio del siglo XIX por el trabajo del matemático francés
Adrien Legendre.
Con el fin de evitar desarrollos algebráicos y aritméticos engorrosos se utilizará la hoja de
cálculo EXCEL®. Al ingresar los datos de la tabla 1 y empleando la herramienta ANÁLISIS DE
DATOS en la opción REGRESIÓN, se obtiene la siguiente información:

En esta tabla los valores de intercepción y variable X1 hacen referencia a los coeficientes βo y
β 1respectivamente. Remplazando estos datos en la ecuación (1), se tiene que la ecuación de
regresión para las variables talla y edad es
y=65.159+ 0.6569 x.
2. Una aplicación del modelo de regresión lineal Con el fin de estudiar este modelo, se
emplearán los datos tomados de una muestra real, extraídos de un comunicado de prensa
que revela el porcentaje de pobreza, pobreza extrema y el coeficiente de Gini (indicador
de la desigualdad económica en una población) en los años 2010 y 2011 de las trece
principales ciudades de Colombia

Para decidir qué clase de función podría ajustarse a la curva, de acuerdo con las posibilidades de
la figura 1, debe hacerse una gráfica de dispersión de los datos observados. Si en dicha gráfica se
aprecia que los puntos se distribuyen alrededor de una recta, se procede a realizar un análisis de
regresión lineal.
El modelo de regresión lineal simple es: Y = βo+ β 1 x (1)
Los valores de los parámetrosβo y β 1 no se conocen y deben estimarse a partir de los datos de la
muestra.
Con el fin de evitar desarrollos algebraicos y aritméticos engorrosos se utilizará la hoja de
cálculo EXCEL®. Al ingresar los datos de la tabla 1 y empleando la herramienta ANÁLISIS DE
DATOS en la opción REGRESIÓN, se obtiene la siguiente información:
y=−1.3148+ 0.94126 x
Coeficiente de correlación o de Pearson
EL coeficiente de correlación es una medida de interdependencia de dos variables aleatorias. En
primer lugar cuando nos referimos al cálculo del coeficiente de correlación al cuadrado
denominado también como coeficiente de determinación, simbolizado por. Las fórmulas para el
cálculo de este coeficiente son variadas, obteniéndose un resultado igual por cualquiera de los
métodos que se utilice. Veámoslo:

El coeficiente de correlación al cuadrado debe ser un valor tal que, cumpla con la siguiente
condición: 0 ≤ R 2 ≤ 1. Cuando el coeficiente de correlación al cuadrado es igual a 1, decimos que
hay una correlación perfecta, ya que los valores observados son exactamente iguales a los
estimados, en otras palabras los puntos en la gráfica (nube de puntos) se confunden con los de la
recta. A medida que el coeficiente de correlación disminuye, se aleja uno, se dice que la recta
representa cada vez menos a ese conjunto de observaciones.
De acuerdo con la formula presentada anteriormente podemos decir, que el coeficiente de
correlación de determinación mide la proporción de la varianza que queda explicada por la
ecuación de regresión, que describe la relación establecida entre las dos variables. En otras
palabras indica el porcentaje de las variaciones de la variable dependiente, atribuible de la
variable independiente.
Nos podemos referir simplemente al coeficiente de correlación, en este caso de una recta, el cual
simboliza por R o r. Se define como la raíz cuadrada del coeficiente de determinación. El signo
del coeficiente de correlación dependerá del signo que tenga la covarianza o los coeficientes
angulares.
Bibliografía
1. Martínez C. (2012). Estadística y muestreo, Editorial mexicana 13° edición. Recuperado
de: https://eodelgadorcursos.files.wordpress.com/2019/02/book_estadc3adstica-y-
muestreo-13va-edicic3b3n-ciro-martc3adnez-bencardino.pdf
2. Wallpole R. & Myers R. (2012). Probabilidad y estadística para ingeniería y ciencias,
Cámara Nacional de la Industria Editorial Mexicana, 8° edición. Recuperado de:
https://vereniciafunez94hotmail.files.wordpress.com/2014/08/8va-probabilidad-y-
estadistica-para-ingenier-walpole_8.pdf
3. Cardona D. & Gonzales J. (2013). Artículo: Aplicación de la regresión
lineal en un problema de pobreza. Recuperado de:
http://www.unilibre.edu.co/revistainteraccion/volumen12/art4.pdf
4. Cardona D. & Gonzales J. (2013). Artículo: Aplicación de la regresión
lineal en un problema de nutrición. Recuperado de:
http://www.unilibre.edu.co/revistaingeniolibre/revista-12/ar3.pdf.

Regresion y Correlación

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Regresion y Correlación

Caricato da

Copyright:

Formati disponibili

Análisis de regresión Lineal

El concepto de análisis de regresión se refiere a encontrar la mejor relación entre Y y x

de la respuesta dados los valores del regresorx.

En la anterior ecuación tenemos cuatro parámetros:

1. Y es la variable que se va a estimar en función de otra variable ( x) supuestamente

conocida. Se le denomina también variable dependiente.

2. x es la variable cuyo valor se conoce. Se le denomina variable independiente.

3. β 1 es la pendiente, la que nos denomina el ángulo de inclinación de la recta.

Método de mínimos cuadrados

calcular βo y β 1 para minimizar.

Estimación de los coeficientes de la regresión

1. Una aplicación del modelo de regresión lineal En un trabajo de investigación en el área

de salud (Ducuara Mora, 2012), acerca de las condiciones de crecimiento y desarrollo de

Edad (meses) Talla (cms) Edad (meses) Talla (cms)

Con el fin de evitar desarrollos algebráicos y aritméticos engorrosos se utilizará la hoja de

cálculo EXCEL®. Al ingresar los datos de la tabla 1 y empleando la herramienta ANÁLISIS DE

DATOS en la opción REGRESIÓN, se obtiene la siguiente información:

β 1respectivamente. Remplazando estos datos en la ecuación (1), se tiene que la ecuación de

regresión para las variables talla y edad es

que revela el porcentaje de pobreza, pobreza extrema y el coeficiente de Gini (indicador

principales ciudades de Colombia

Con el fin de evitar desarrollos algebraicos y aritméticos engorrosos se utilizará la hoja de

cálculo EXCEL®. Al ingresar los datos de la tabla 1 y empleando la herramienta ANÁLISIS DE

DATOS en la opción REGRESIÓN, se obtiene la siguiente información:

Coeficiente de correlación o de Pearson

EL coeficiente de correlación es una medida de interdependencia de dos variables aleatorias. En

métodos que se utilice. Veámoslo:

condición: 0 ≤ R 2 ≤ 1. Cuando el coeficiente de correlación al cuadrado es igual a 1, decimos que

representa cada vez menos a ese conjunto de observaciones.

De acuerdo con la formula presentada anteriormente podemos decir, que el coeficiente de

correlación de determinación mide la proporción de la varianza que queda explicada por la

palabras indica el porcentaje de las variaciones de la variable dependiente, atribuible de la

2. Wallpole R. & Myers R. (2012). Probabilidad y estadística para ingeniería y ciencias,

Cámara Nacional de la Industria Editorial Mexicana, 8° edición. Recuperado de:

3. Cardona D. & Gonzales J. (2013). Artículo: Aplicación de la regresión

lineal en un problema de pobreza. Recuperado de:

4. Cardona D. & Gonzales J. (2013). Artículo: Aplicación de la regresión

lineal en un problema de nutrición. Recuperado de:

Potrebbero piacerti anche