Sei sulla pagina 1di 37

REGRESIN

Y CORRELACIN SIMPLE
El diagrama de dispersin
Es un grfico que permite detectar la
existencia de una relacin entre dos
variables.
Visualmente se puede buscar patrones que
indiquen el tipo de relacin que se da entre
las variables.

Las ecuaciones lineales simples
Si dos variables, como X e Y, estn
relacionadas, se puede expresar como una
relacin, por ejemplo:
Y = 3 + 1,5X
Al conocer la ecuacin se puede:
a) Calcular el valor de Y para cualquier valor
dado de X
b) Conocer el cambio en Y, cuando X vara en 1

El aumento en Y, cuando X vara en una unidad,
est dado por el coeficiente de X.

Ejemplo:

En Y = 10 + 2X
cuando X aumenta en 1, Y aumenta en 2

En Y = 5 - 0,8X
cuando X aumenta en 1, Y disminuye en 0,8
A) Tipos de Variables
En una ecuacin como Y = 30 + 3X, el valor de
Y depende del valor que toma X, por eso a Y
se le llama variable dependiente, y a X se le
llama variable independiente.

Y = b
0
+ b
1
X

Variable
Dependiente
Variable
Independiente
B) Tipo de Relaciones
Cuando cambios en X provoca cambios en Y
en igual sentido (aumentos o disminuciones),
las variables estn directamente
relacionadas. Se observa el signo +

Ejemplo:
Y = 30 + 5X
X
o
o
o
o
o
o
o
o
o
Y
Cuando cambios en X, provoca variaciones en
Y en sentido inverso (X aumenta, Y disminuye
o viceversa), las variables estn inversamente
relacionadas. Se observa en la ecuacin el
signo

Ejemplo:
Y = 20 - 3X
o
o
o
o
o
o
o
o
Y
X
C) Grado de la ecuacin
La ecuacin es de primer grado si la variable
independiente est elevada al exponente 1. Su
grfica genera una lnea recta (por lo que
tambin se le llama ecuacin lineal)

Ejemplo: Y = 30 + 4 X

Si la variable independiente est elevada a un
exponente diferente a 1, la ecuacin toma el valor
del exponente. Su grfica no es una lnea recta.
Ejemplo:

Y = 10 + 3 X + 4 X
2
: ecuacin de segundo grado

Y = 3 + 7X + 5 X
3
: ecuacin de tercer grado

D) Ecuaciones simples y mltiples:
Simples: Muestra la relacin entre dos
variables
Y = 30 + 2X
Y = 10 - 3X
2

Mltiple: Muestra la relacin entre tres o ms
variables
Y = 3X + 8 Z
Y = 5 + 2X
2
+ 4W
D) Grfica de una ecuacin de primer grado:
Ejemplo: Y = 3 + 1,5X


Los cinco pares de valores se diagraman de la
forma siguiente:


X 1 2 3 4 5
Y 4 , 5 6 , 0 7 , 5 9 , 0 1 0 , 5
12
11
10
9
8
7
6
5
4
3
2
1
1 2 3 4 5
Y
.
X
.
.
.
.
(1,4.5)
(4,9)
(3,7.5)
(2,6)
(5,10.5)
E) Forma general:
La ecuacin simple de primer grado tiene la siguiente
forma general
Y = b
0
+ b
1
X
Donde:
b
1
: pendiente, o sea, el cambio en Y cuando AX = 1.
b
0
: el valor autnomo, es decir, Y = b
0
cuando X = 0. En
la grfica es la interseccin con el eje Y
Ejemplo:
Y = 3 + 1.5X
.
b
0
= 3
Y
X
Regresin lineal simple
Es una tcnica estadstica que permite determinar
la mejor ecuacin que represente la relacin entre
dos variables relacionadas.

Para poder establecer la relacin cuantitativa entre
X e Y es necesario disponer de pares de
observaciones. Cada par ha sido registrado a la
misma unidad elemental.

A) Suposiciones de regresin y correlacin
a) Normalidad: los valores de Y estarn
distribuidos normalmente a cada valor de X.
b) Homoscedasticidad: la variacin alrededor de la
lnea de regresin sea constante para todos los
valores de X.
c) Independencia de error: el error (diferencia
residual entre un valor observado y uno
estimado de Y) sea independientemente
de cada valor de X.
d) Linealidad: la relacin entre las variables es
lineal.

B) El mtodo de Mnimos Cuadrados
Es el procedimiento matemtico utilizado para
determinar los valores numricos de los
coeficientes de regresin: b
0
y b
1
La ecuacin general = b
0
+ b
1
X se llama
ecuacin de regresin y permite estimar o predecir
los valores de Y.

El mtodo consiste en determinar una ecuacin
que la suma de los errores al cuadrado sea
mnima.

Y - Y = error
i
( )
2
i

Min Y - Y

X
Y
Error= 2
2 4 6 8 10 12 14
10
8
6
4
2

Error= -6

Lnea de
estimacin
.
.
Y

El mtodo utiliza un sistema de ecuacin llamado


ecuaciones normales, que tienen la siguiente
forma:



+ =
=
2
1 0
1 0
X b X b XY
X b + nb Y
Para aplicar las frmulas,
tenemos que confeccionar
un cuadro como el
siguiente:
X Y X
2
XY
1.0 8.0 1.0 8.0
1.5 10.0 2.3 15.0
2.0 9.0 4.0 18.0
2.5 12.0 6.3 30.0
3.0 14.0 9.0 42.0
3.5 13.0 12.3 45.5
4.0 15.0 16.0 60.0
4.5 17.0 20.3 76.5
5.0 14.0 25.0 70.0
5.5 14.0 30.3 77.0
32.5 126.0 126.3 442.0

Sustituyendo los valores , n = 5,
y ,en las ecuaciones
normales, obtenemos el siguiente sistema de
ecuaciones.
126 = 10b
0
+ 32,5b
1
442 = 32,5b0 + 126,3b1
Resolviendo el sistema tenemos: b
0
= 7,479
b
1
= 1,576 ,por lo tanto, se tiene:


0 , 26 1 Y=

42 4 XY=

3 , 126
2
X =

1,576X 7,479 Y

+ =
c) Interpretacin

b
0
= 7,478 : Es probable que un paciente
desnutrido que no sea considerado
dentro del Programa de Alimentacin
Complementaria tenga un peso de
7,478 Kg.

b
1
= 1,576:Por cada Kg. del alimento
complementario, se espera que
probablemente el nio aumento su
peso en 1,576 Kg.

D) Valor observado y valor estimado de Y
El valor observado (Y
i
) se refiere al nivel efectivo u
observado de la variable Y (peso del nio),
mientras que el valor estimado ( ), es el nivel
estimado de la variable (peso esperado), obtenido
utilizando la ecuacin de regresin.

i
Y

X
Y
Valor
estimado
Valor
observado

Y
i
Y
.
.
x
o

X Y
1.0 8.0 9.055
1.5 10.0 9.843
2.0 9.0 10.630
2.5 12.0 11.418
3.0 14.0 12.206
3.5 13.0 12.994
4.0 15.0 13.782
4.5 17.0 14.570
5.0 14.0 15.358
5.5 14.0 16.146
Y

Error estndar de estimacin (S


yx
)
Mide la disparidad promedio entre los valores
observados y estimados de la variable Y. Se
calcula por la siguiente relacin

2
2 n
Y

- Y ) (
=
yx
S

( ) Y

Y
( )
2
Y

Y
Reemplazando en la formula

65 , 2
8
20 , 21
2 0 1
20 , 21
=
yx
S = =

,628 1 =
yx
S
El S
yx
es un indicador del grado de precisin
con que la ecuacin de regresin describe la
relacin entre las dos variables: cuanto ms
pequeo, los valores observado y estimado de
Y son razonablemente cercanos y, la ecuacin
de regresin es una buena descripcin esa la
relacin.
El anlisis de correlacin
El anlisis de correlacin es la tcnica estadstica
que permite describir el grado hasta el cual una
variable est linealmente relacionada con otra.
Hay dos medidas que se usan para describir la
correlacin
El coeficiente de determinacin
El coeficiente de correlacin


A) El coeficiente de determinacin
Al construir un modelo de regresin, se define que
el valor Y depende de X.
Y = f (X)
Si la relacin es lineal: Y = b
0
+ b
1
X
Pero en la prctica Y depende tambin de otros
factores diferentes a X:
Y = b
0
+ b
1
X + c
Parte de los cambios en Y pueden explicarse por
X, a esto se llama variacin explicada.
Pero hay cambios en Y que no pueden explicarse
por X, a lo que se llama variacin no explicada.
i
Y
Y
X
y
Variacin
no explicada
Variacin
Explicada
Variacin
Total
( )
Y - Y
i
( )

Y - Y
( )
Y - Y
i

VARIACION VARIACION VARIACION
TOTAL = EXPLICADA + NO EXPLICADA
El coeficiente de determinacin se puede calcular
del modo siguiente:

=
variacion explicada
variacion total
r
2
( )
( )

2
2
Y -
i
Y
Y - Y

=
r
2
Se elevan al cuadrado, para evitar que
obtenindose un nmero positivo.
( )
Y - Y = 0
1er Paso: Clculo de la venta media por vendedor
son ( )

Y
Y =
Y
n
i
n
i=

1
Y =
Y Y Y Y Y
5
1 2 3 4 5
+ + + +
Y =
5
9 5 7 14 10 45
5
+ + + +
=
Y= unidades 9
2do Paso: Se calcula la variacin total, es decir, la
sumatoria de las desviaciones de las ventas
observadas (Y
i
) con respecto a la media:

( )

2
Y -
i
Y
Y
( ) Y Y
( ) Y Y
3er Paso: Se calcula la variacin explicada, es
decir, la sumatoria de las desviaciones cuadrticas
entre las ventas esperadas y la venta media de la
muestra:

( )

Y- Y
2

Y
( ) Y Y


( )
2
Y Y


4to Paso: Se compara la variacin explicada y la
variacin total.

=
variacion explicada
variacion total
r
2
707 , 0
4 , 72
2 , 51
= =
r
2
( )
( )

2
2
Y - Y
Y - Y

=
i
r
2
5to Paso: Interpretacin: 70,7% de las
variaciones en el incremento de peso,
pueden explicarse por el consumo del
complemento nutricional.
Valores posibles de r
2
Si r
2
= 1 : Correlacin perfecta, es decir, toda
variacin de Y puede explicarse por X
Si r
2
= 0 : no existe correlacin entre X e Y. La
variacin explicada es 0. La variable X
no explica nada de los cambios en Y
Resumen
1 r 0
2
s s
Cuanto ms cerca a uno,
las variables tendrn mayor
correlacin.
B) El coeficiente de correlacin
Es la raz cuadrada del coeficiente de
determinacin.


Sus valores oscilan entre -1 y 1
Cuando r es positivo, indica que X e Y
estn directamente relacionados.

r =
r
2
Cuando r es negativo, indica que X e Y
estn inversamente relacionados.
El coeficiente r tiene el mismo signo que el
coeficiente b
1
en la ecuacin de regresin

Interpretacin del coeficiente de correlacin de
Pearson

-1 -0,9 -0,5 0 0,5 0,9 1
Perfecta
Negativa
Perfecta
Positiva
No existe
correlacin
Fuerte
Negativa
Moderada
Negativa
Dbil
Negativa
Dbil
Positiva
Moderada
Positiva
Fuerte
Positiva
Ejemplo:
r
2
= 0,707
0,707 = r
r

= 0,84
el signo es positivo ya que X e Y
estn relacionados directamente
como lo indica el signo del
coeficiente b
1
en la ecuacin de
regresin
1,576X 7,479 Y

+ =
Interpretacin: El incremento de peso (Y) y el
consumo del complemento nutricional (X) se
encuentran directamente asociados.

Potrebbero piacerti anche