Sei sulla pagina 1di 5

Estadstica II

Unidad III Anlisis de regresin, correlacin lineal simple y mltiple

UNIDAD 3. ANLISIS DE REGRESIN, CORRELACIN LINEAL


SIMPLE Y MULTIPLE.
3.1 ESTIMACIN MEDIANTE LA LINEA DE REGRESIN.
Muchas veces las decisiones gerenciales se basan en la relacin entre dos o ms
variables. Por ejemplo, despus de revisar la relacin entre los gastos de publicidad y las
ventas, un gerente de mercadotecnia podra tratar de predecir las ventas para determinado
nivel de gastos de publicidad. En otro caso, una empresa de electricidad podra usar la relacin
entre la temperatura mxima diaria y la demanda de electricidad para predecir el consumo de
energa con base en las temperaturas mximas pronosticadas para el mes siguiente. A veces,
un administrador confa en su intuicin para juzgar como se relacionan dos variables. Sin
embargo, si se pueden obtener datos, y si se puede emplear un procedimiento estadstico
llamado anlisis de regresin para plantear una ecuacin que muestre cmo dependen las
variables entre s, sera mejor.

En la terminologa de la regresin, la variable que se va a predecir se llama variable


dependiente. La o las variables que se usan para predecir el valor de la variable dependiente
se llaman variables independientes. Por ejemplo, para analizar el efecto de gastos de
publicidad sobre las ventas, el deseo de un gerente de mercadotecnia, de predecir las ventas,
nos sugiere que ventas sea la variable dependiente. Los gastos de publicidad seran la
variable independiente que se usa para poder predecir las ventas. En notacin estadstica, y
representa la variable dependiente y x la variable independiente.

El principal objetivo del anlisis de regresin es estimar el valor de una variable aleatoria. En
esta unidad se describirn el tipo ms sencillo de anlisis de regresin, donde intervienen una
variable independiente y una variable dependiente, y la relacin entre ellas se aproxima
mediante una lnea recta. A esto se le llama regresin lineal simple. El anlisis de regresin
donde intervienen dos o ms variables independientes se llama anlisis de regresin mltiple.

3.1.1 DIAGRAMA DE DISPERSIN.

El diagrama de dispersin permite observar grficamente los datos y hacer conclusiones


preliminares acerca de la relacin posible entre las variables.

Un diagrama de dispersin es una grfica en la que se traza cada uno de los puntos que
representan un par de valores observados para las variables dependiente e independiente. El
valor de la variable independiente se grafica con respecto al eje horizontal, y el valor de la
variable dependiente se traza con respecto al eje vertical.

Los diagramas de dispersin o grficos de correlacin permiten estudiar la relacin entre 2


variables. Dadas 2 variables X e Y, se dice que existe una correlacin entre ambas si cada vez
que aumenta el valor de X aumenta proporcionalmente el valor de Y (Correlacin positiva) o si
cada vez que aumenta el valor de X disminuye en igual proporcin el valor de Y (Correlacin
negativa).

En un grfico de correlacin representamos cada par X, Y como un punto donde se cortan las
coordenadas de X e Y.

ITESCO
Estadstica II
Unidad III Anlisis de regresin, correlacin lineal simple y mltiple

a) Relacin lineal directa (fuerte) b) Relacin lineal inversa (fuerte)

c) Relacin lineal directa (dbil) d) Relacin nula (sin relacin)

d) Relacin exponencial e) Relacin compleja

3.1.2 MTODO DE MNIMOS CUADRADOS.

El mtodo de mnimos cuadrados es un procedimiento para encontrar la ecuacin de


regresin estimada usando datos de una muestra. En el mtodo de los mnimos cuadrados se
emplean los datos de la muestra para determinar los valores de b 0 y b1 que minimizan la suma
de los cuadrados de las desviaciones entre los valores observados de la variable independiente
xi, y los valores estimados de la variable dependiente yi.

b1=
XY n X Y
x 2n X 2

b0 =Y b 1 X

ITESCO
Estadstica II
Unidad III Anlisis de regresin, correlacin lineal simple y mltiple

Y^ =b 0 +b1 X
Donde:
b1= Pendiente de la lnea de regresin estimada
b0= Ordenada al origen de la lnea de regresin estimada
Y^ = Ecuacin de regresin
X= Valor de la variable independiente
Y= Valor de la variable dependiente
n= Nmero total de observaciones
X = Valor medio de la variable independiente

Y = Valor medio de la variable dependiente

3.1.3 INTERPRETACIN DEL ERROR ESTNDAR DE LA ESTIMACIN.

El error estndar del estimador es la desviacin estndar condicional de la variable


dependiente Y, dado un valor de la variable independiente X. Para datos poblacionales, el
error estndar del estimador se representa mediante el smbolo Y,X. la formula de desviaciones
que permite estimar este valor con base en datos mustrales es:

SY , X=
( Y Y^ )
n2
=
Y 2b0 Y b1 XY
n2

3.1.4 INTERVALOS DE PREDICCIN APROXIMADOS.

Encontraste con los intervalos de confianza, que son estimaciones de parmetros de


poblaciones, en un intervalo de prediccin se estima un valor individual y es, por lo tanto, un
intervalo de probabilidad. Podra parecer posible construir un intervalo de prediccin utilizando
el error estndar del estimador que se defini en el tema anterior. Sin embargo, ese intervalo
estara incompleto, porque el error estndar del estimador no incluye la incertidumbre asociada
con el hecho de que la lnea de regresin basada en datos mustrales incluye tambin error
muestral y, por lo general no es idntica a la lnea de regresin para la poblacin. El error
estndar completo para un intervalo de prediccin se denomina error estndar del pronstico, e
incluye la incertidumbre asociado con la dispersin vertical con respecto a la lnea de regresin
y adems la incertidumbre asociada con la posicin del valor mismo en la lnea de regresin.
La formula bsica para el error estndar del pronstico es.


1 ( x x )2
S Y (siguiente) = S 2Y . X +S 2Y . X =S Y , X 1+ +
n
[ ]
2
( x)
X 2

n

Finalmente, el intervalo de prediccin para un valor individual de la variable dependiente,


^ tS Y (siguiente)
Y
utilizando n-2 grados de libertad, es

3.1.5 ANLISIS DE CORRELACIN.

Es el conjunto de tcnicas estadsticas empleado para medir la intensidad de la asociacin


entre dos variables. El principal objetivo del anlisis de correlacin consiste en determinar que
tan intensa es la relacin entre dos variables.
ITESCO
Estadstica II
Unidad III Anlisis de regresin, correlacin lineal simple y mltiple

El coeficiente de Correlacin, describe la intensidad de la relacin entre dos conjuntos de


variables de nivel de intervalo. El valor del coeficiente de correlacin puede tomar valores
desde menos uno hasta uno, indicando que mientras ms cercano a uno sea el valor del
coeficiente de correlacin, en cualquier direccin, ms fuerte ser la asociacin lineal entre las
dos variables. Mientras ms cercano a cero sea el coeficiente de correlacin indicar que ms
dbil es la asociacin entre ambas variables. Si es igual a cero se concluir que no existe
relacin lineal alguna entre ambas variables.

Para propsitos de clculo resulta conveniente la siguiente frmula para el coeficiente de


determinacin muestral.
2b0 Y +b 1 XY n Y 2
r=
Y 2n Y 2

El coeficiente de correlacin muestral es: r= r 2

O bien

n
XY X Y
n X 2( X )2 n Y 2 ( Y )2
r=

3.1.7 REGRESIN MLTIPLE Y ANLISIS DE CORRELACIN.

Es una extensin del anlisis de regresin simple para aplicaciones en las que se usan dos o
ms variables independientes (predictores) para estimar el valor de la variable dependiente
(variable de respuesta). El uso de ms variables permite aumentar la precisin de la
estimacin.

La principal ventaja de la regresin mltiple es que nos permite utilizar ms informacin


disponible para estimar la variable dependiente. En algunas ocasiones, la correlacin entre dos
variables puede resultar insuficiente para determinar una ecuacin de estimacin confiable, sin
embargo, si agregamos los datos de mas variables independientes, podemos determinar una
ecuacin de estimacin que describa la relacin con mayor precisin.

La regresin mltiple y el anlisis de correlacin implican un proceso de tres pasos como el que
usamos en la regresin simple. En este proceso:
1. Describimos la ecuacin de regresin mltiple;
2. Examinamos el error estndar de regresin mltiple de la estimacin; y
3. Utilizamos el anlisis de correlacin mltiple para determinar qu tambin la ecuacin de
regresin describe los datos observados.

La regresin mltiple nos permitir tambin ajustar tanto curvas como rectas. Usando las
tcnicas de variables ficticias. Las variables ficticias y las curvas de ajuste son solamente dos
de las muchas tcnicas de modelado que se pueden utilizar en la regresin mltiple para
aumentar la precisin de nuestras ecuaciones de estimacin.

Ecuacin de estimacin que describe la relacin entre tres variables


Y^ =a+b1 X 1 +b2 X 2

Donde:
ITESCO
Estadstica II
Unidad III Anlisis de regresin, correlacin lineal simple y mltiple

Y^ = Valor estimado correspondiente a la variable dependiente.


a= Ordenada Y
X1, X2= Valores de las dos variables independientes.
b1 y b2= Pendientes asociadas con X1 y X2 respectivamente.

Ecuaciones normales:

na b1 X 1 b2 X 2 Y
a X 1 b1 X 12 b2 X 1 X 2 X 1Y
a X 2 b1 X 1 X 2 b2 X 22 X 2Y

ITESCO

Potrebbero piacerti anche