Sei sulla pagina 1di 5

LECTURA CUATRO ANLISIS DE REGRESIN

En la administracin actual el anlisis de regresin es una herramienta


fundamental. Tienen dos propsitos principales: por un lado, entender la
relacin entre las variables como gastos, por ejemplo. Por otra parte, el
objetivo es predecir el valor de una variable basndose en el valor de otra.
Veremos a continuacin entonces el desarrollo del modelo lineal simple. En
cualquiera de los modelos de regresin la variable que trata de predecirse
se llama variable dependiente o de respuesta. Se dice que el valor de la
variable dependiente depende del valor de una variable independiente,
la cual tambin se conoce como variable explicativa o predictoria.

Diagramas de dispersin

Los diagramas de dispersin nos permiten observar la relacin que hay


entre variables, donde la variable independiente se ubica en el eje
horizontal y la variable dependiente en el eje vertical. Para estudiar este
caso acudiremos al siguiente ejemplo.
La compaa Casa Moderna remodela casas viejas. Un dato histrico de la
compaa ha revelado que el precio por la cantidad de volumen de
trabajos de remodelacin depende de la nmina del rea donde est
establecida la compaa. La relacin de ventas y nmina de Casa
Moderna se puede ver a continuacin:

Ventas de Casa Moderna (cientos Nmina local (millones)


de miles)
6 3
8 4
9 6
5 4
4.5 2
9.5 5

Los expertos en economa predicen que el ao entrante la nomina local


ser de 600 millones y Casa Moderna quiere hacer una planeacin de
acuerdo con estos datos.
En la siguiente grfica se puede apreciar un diagrama de dispersin
correspondiente a los datos de la tabla anterior. Los valores ms altos de la
nmina parecen producir mayores ventas. Aunque no existe una relacin
absoluta ya que no todos los puntos se encuentran sobre una lnea recta,
hay una relacin. En el grfico se dibuja una lnea entre todos estos puntos
para ayudar a comprender la conexin que existe entre la nmina y las
ventas. Como no todos los puntos estn sobre la recta, es fcil errar si se
intenta predecir las ventas con base en la nmina utilizando esta lnea o
cualquier otra. Se podran dibujar mltiples segmentos de lnea a lo largo
de los puntos pero no se sabra cual representa la relacin verdadera; con
el anlisis de regresin podemos saber esta relacin.

10
9
8
Ventas ($100.000)

7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7
Nomina ($100 millones)

Regresin lineal simple

En general en los modelos de regresin existe un supuesto implcito de que


hay una relacin entre las variables. Tambin est presente cierto error
aleatorio que no es posible predecir. El modelo de regresin lineal simple es

Y = 0 + 1 X +
Donde:
Y = variable dependiente (variable de respuesta)
X = variable independiente (variable predictora o explicativa)
0 = ordenada al origen (valor de Y cuando X = 0)
1 = pendiente de la recta de regresin
= error aleatorio

Los valores verdaderos de la ordenada al origen y de la pendiente no se


conocen con anticipacin, por lo cual se estiman usando datos de
muestra. La ecuacin de regresin basada en datos de muestra est dada
por:
= b0 + b1 X
Donde:
= valor pronosticado de Y
En el ejemplo de Casa Moderna se trata de predecir las ventas, por esto la
variable dependiente es representada por Y. Para ayudar a que este
objetivo se cumpla la variable independiente (X) ser la nmina. La lnea
que est dibujada en la grfica anterior representa la minimizacin de los
errores. Entonces el error est definido como

Error = (valor real) (valor pronosticado)


=Y

La ecuacin de la regresin lineal simple es:

= b0 + b1 X
Adems, por medio de las siguientes ecuaciones se puede calcular el
origen y la pendiente:

X =
X = Promedio (media) de valores de X
n

Y=
Y = Promedio (media) de valores de Y
n

b1 =
( X X )(Y Y )
(X X ) 2

b0 = Y b1 X

Coeficiente de correlacin

El coeficiente de correlacin tambin se relaciona con el coeficiente de


determinacin. Con el coeficiente de correlacin podemos medir el grado
de solidez de la relacin lineal. Generalmente se expresa con la letra r y
toma valores entre 1 y -1. A continuacin presentaremos algunos
diagramas de dispersin para diferentes valores de r, la cual est definida
como
r = r2

Tipo 1: Correlacin positiva perfecta:


r = +1
7

0
0 2 4 6 8

Tipo 2: Correlacin positiva:


0<r<1
7

0
0 2 4 6 8 10

Tipo 3: Sin correlacin:


r=0
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8

Tipo 4: Correlacin negativa perfecta:


r = -1
7

0
0 2 4 6 8

Potrebbero piacerti anche