Sei sulla pagina 1di 17

CORRELACION Y REGRESION

PRESENTADOPOR:

Ms.C . juan Car los Or una Lara

INTRODUCCIN
Cuando observamos dos caracteres X e Y en un individuo, se nos presenta el problema de determinar la existencia de algn tipo de relacionamiento entere ellos. El anlisis de este relacionamiento presenta dos aspectos diferentes. Unas veces nuestro inters est en conocer si las dos variables estn asociadas y medir hasta qu punto los cambios en una pueden explicarse por los cambios que ocurren en la otra. En tal caso tenemos un problema de correlacin y la medida que cuantifica es el llamado Coeficiente de Correlacin. Otras veces, cuando estamos seguros que existe un alto grado de asociacin entre las dos variables, el anlisis se encamina a cuantificar la relacin existente con el fin de predecir cules sern los valores de la variable respuesta, en este caso tenemos un problema de Regresin.

1. ANALISIS DE CORRELACION
DEFINICIN. La correlacin es el mtodo empleado para determinar el grado de asociacin o relacionamiento entre las variables que se estudian, para as determinar en qu medida una relacin funcional describe o explica en una forma adecuada la relacin entre estas variables. TIPOS DE CORRELACIN. Atendiendo al relacionamiento entre las variables X e Y podemos tener: Correlacin Directa o Positiva. Cuando las variables X e Y presentan variaciones en un mismo sentido, esto es, para mayores valores de X corresponde mayores valores de Y. Correlacin Inversa o Negativa. Cuando las variaciones de X e Y son en sentidos contrarios, esto es, para mayores valores de X corresponden menores valores de Y. Sin correlacin. Cuando no existe ningn tipo de relacionamiento entre las variables.

1.1 DIAGRAMA DE DISPERSION


Se utiliza para graficar la relacin entre dos variables X e Y, consiste en una nube de puntos que indicar si existe o no correlacin dependiendo de la tendencia de la tendencia de los puntos.

Correlacin Positiva (Directa)

Correlacin Negativa (Inversa)

Sin Correlacin

1.2 EJEMPLO DE CORRELACION


Ejemplo1: Si tenemos los datos que se presentan en la tabla y consideramos que la edad determina el peso de las personas entonces podremos observar la siguiente grfica:
EDAD(X) 54 10 8 15 30 18 42 28 19 31 PESO(Y) 74 48 45 52 60 54 65 58 55 62

Observando el grfico podemos decir que la edad y el peso tienen una correlacin Directa o Positiva.

1.3 COEFICIENTE DE CORRELACION


Es un nmero que indica el grado de asociacin entre las variables y se define del siguiente modo:
n

r=

xi yi nxy i =1
i =1

xi2 nx 2 yi2 ny 2
i =1

S xy Sx Sy

C aractersticas :
r> 0 r< 0 r = +1 r = 1 r= 0

i)

E l coefic iente r es un nm

1 r 1 +

1.4 EJEMPLO DE CORRELACION


Ejemplo2: Del ejemplo1 hallar el coeficiente de correlacin
N 1 2 3 4 5 6 7 8 9 10 EDAD(X) 54 10 8 15 30 18 42 28 19 31 X=255 PESO(Y) 74 48 45 52 60 54 65 58 55 62 Y=573

XY 3996 480 360 780 1800 972 2730 1624 1045 1922 XY=15709

X2 2916 100 64 225 900 324 1764 784 361 961 X2=8399

Y2 5476 2304 2025 2704 3600 2916 4225 3364 3025 3844 Y2=33483

n = 10

x=

x = 255 = 25.5
n 10

y=

573 = 57.3 10

r=

xi yi nxy i =1
xi2 i =1
n

;
2

nx

i= 1

y i2 ny 2

15709 10(25.5)(57.3) 8399 10(25.5)


2

Entonces:

33483 10(57.3)

= 0.988

1.5 LA COVARIANZA
DEFINICIN. La Covarianza es la varianza de una variable en relacin a otra, tambin se le llama Varianza Conjunta. En el estudio conjunto de dos variables, lo que nos interesa principalmente es saber si existe algn tipo de relacin entre ellas. Esto se ve grficamente con el diagrama de dispersin. Veremos ahora una medida descriptiva que sirve para medir o cuantificar esta relacin:

Sxy =

n k

i= 1 j = 1

(xi x)(y j y)nij n

rxy =

Sxy SxSy

2. ANALISIS DE REGRESION
REGRESIN. Es un mtodo que se emplea para encontrar una funcin que se ajusta a una nube de puntos o diagrama de dispersin, con la finalidad de obtener una prediccin aproximada de una de las variables a partir de la otra.
Y = f(X )

3. REGRESION LINEAL SIMPLE


Este tipo de regresin se utiliza cuando existe solo una variable independiente X para una variable dependiente Y. Est definida por la siguiente ecuacin lineal en su forma general:
Y = b + b X +e 0 1

Y
b0 b1

Donde: Es la variable respuesta o valo

X
e

3.1 METODO DE MINIMOS CUADRADOS PARA ESTIMAR LOS COEFICIENTES DE REGRESIN.


Es un mtodo para obtener la recta que se ajuste mejor a los datos, al graficar los datos sabemos que podemos trazar infinidad de rectas pero este mtodo nos proporciona la de mejor ajuste.

ei

se le llam a desviacin o
2 e12 + e2 + e 32 +..... e n +2

desviaciones al cuadrado ob , para

3.2 ESTIMACION DE LOS COEFICIENTES

RECTA DE MINIMOS CUADRADO


0 1

Y = +b X utilizaremos la bsiguiente ecuacin de


b0 b1

xi yi nxy i =1
x
i =1 n 2 i

b = yb x
0 1

nx 2

Donde los valores de b


0

b1

en la e

3.3 EJEMPLO APLICATIVO


Ejemplo3: Una empresa tiene 7 vendedores, y se quiere analizar las ventas mensuales (en miles de soles) frente a los aos de experiencia. Los datos estn en la siguiente tabla. Se trata de una relacin lineal? (analizar el diagrama de dispersin) Si es una ecuacin lineal hallar la ecuacin de regresin determinando los coeficientes de regresin. Predecir la venta de un empleado con 40 aos de experiencia (Estimar Y para un valor X=40) Solucin: a)Segn el diagrama de dispersin existe aproximadamente lineal. b)Hallando la ecuacin de la recta de regresin: una relacin

3.3 EJEMPLO APLICATIVO


N 1 2 3 4 5 6 7 Experiencia(X) Ventas(miles) (Y) XY X2 Y2

13 16 30 2 8 6 31
X=106

26 33 36 16 26 19 38
Y=194

338 528 1080 32 208 114 1178


XY=3478

169 256 900 4 64 36 961


X2=2390

676 1089 1296 256 676 361 1444


Y2=5798

n=7
n

x=

x
n

106 = 15.14 7

y=

194 = 27.71 7

1 xi yi nxy i=
x
i =1 n 2 i

3478 7(15.14)(27.71)
2 2390 7(15.14)

0.688 =

nx

b0 = y b1 x = 27.71 ( 0.688 )15.14 =17.29

3.3 EJEMPLO APLICATIVO

Entonces la ecuacin de regresin


Y = 17.29 + 0.688 X

b0 = 17.29

b1 = 0.688

Interpretacin:

, Son las ventas de u


Y = 17.29 + 0.688( 40 ) = 44.826

aos de experiencia. En otras pala

17290 si no tiene aos de experie

4. COEFICIENTE DE DETERMINACION

Mide el porcentaje de variabilidad en


2

la variable independiente X. Se calcu ( x x )( y y )


R2 =

(x

2 i

nx 2 ) ( yi2 ny 2 )

= r2

0 R2 1

r = 0.939

R 2 = ( 0.939 ) = 0.883
2

Caractersticas:

5. ERROR ESTNDAR DE ESTIMACIN

En el anterior diagrama de dispersi

Si todos los puntos estuvieran sobre la

Y basndose en la variable independ

La prediccin perfecta es prcticam


2 n

x a b y ( Y Y )que y tan y precisa es una pred indique = s y. x = n 2


i =1 2 i i 1 = i

n 2

i 1=