Sei sulla pagina 1di 15

REGRESION

Es una forma de estudiar la asociacin o relacin, entre


una variable dependiente (Y) y la variable que es la base de
la prediccin a la que se le denomina variable
independiente (X)

El propsito del anlisis de regresin es usar los datos


o valores observados de las variables, para realizar
estimaciones, en base a una relacin funcional.

Cuando en el anlisis de regresin, se utiliza


slo una variable independiente, se trata de una
Regresin Simple, y cuando se considera dos o
ms variables independientes se trata de una
Regresin Mltiple. Tambin se clasifica en lineal
y no lineal, segn el comportamiento de las
variables.
Utilizando simbologa , la relacin funcional se
representa:
y = f(x) y = f (x1, x2, . . . , xk).
Donde:
y es la variable dependiente,
x, x1, x2, . . . , xk, son variables independientes.

Qu vamos a estudiar

En esta unidad estudiaremos la Regresin Lineal


simple, es decir, vamos a tratar diferentes formas de
describir la relacin entre dos variables cuando
estas son numricas. Ejemplo:
Estudiar si hay relacin entre la altura (X ) y el
peso (Y ).
El tiempo de estudio dedicado a un curso (X) ,
esta relacionado con la calificacin obtenida (Y)

El estudio del conjunto de dos variables cualitativas


lo aplazamos hasta que veamos contrastes de
hiptesis (X2).Por ejemplo :
Hay relacin entre fumar y padecer enfermedad
de pulmn?

Modelo de Regresin Lineal


Simple

El modelo de regresin lineal simple, esta determinado por


dos variables
Y (dependiente)
X (independiente, explicativa, predictora)

Buscamos encontrar una funcin de X muy simple (lineal)


que nos permita aproximar Y mediante la siguiente formula:
Y = B 0 + B1 X
B0 (ordenada en el origen, constante)
B1 (pendiente de la recta)

Y e Y rara vez coincidirn por muy bueno que sea el modelo


de regresin. A la cantidad
e=Y-Y se le denomina residuo o error residual.

Qu hacer para realizar una


regresin?

El paso inicial que generalmente se realiza,


es la construccin del Diagrama De
Dispersin.
El 2 paso es, a travs del Mtodo de los
Mnimos Cuadrados, estimar los
Coeficientes de Regresin( B0 y B1).
Para establecer la recta de regresin.

Finalmente, cuando se realiza una prediccin estadstica,


siempre ser til calcular una medida que indique que tan
preciso es el pronstico de Y sobre X. A esta medida se le
llama Error Estndar de Estimacin.
5

Diagrama de Dispersin
Es la representacin de los puntos o datos de cada
una de las variables en el plano cartesiano.

Es recomendable en todo estudio de regresin pues


permite tener una idea, sobre la existencia o no de la
regresin.

MODELOS DE DIAGRAMA DE
DISPERSION

Estadstica General

Ejemplo: Estudio del conjunto de dos


variables

A la derecha tenemos una posible manera de recoger los


datos obtenidos, observando dos variables en varios
individuos de una muestra.
En cada fila tenemos los datos de un individuo
Cada columna representa los valores que toma una
variable sobre los mismos.
Las individuos no se muestran en ningn orden
particular.

Dichas observaciones pueden ser representadas en un


diagrama de dispersin . En ellos, cada individuos es un
punto cuyas coordenadas son los valores de las variables.
Nuestro objetivo ser intentar reconocer a partir del mismo
si hay relacin entre las variables, de qu tipo, y si es
posible predecir el valor de una de ellas en funcin de la
otra.

Altura Peso
en cm. en Kg.
161

50

187

76

197

85

179

65

171

66

169

60

166

54

176

84

163

68

...

...

Diagramas de dispersin o nube de


puntos
Tenemos las alturas y los pesos de 30 individuos representados en un
diagrama de dispersin. Observar datos del cuadro anterior)

Pesa 85 kg.

Pesa 50 kg.
Mide
161 cm.

Mide 187 cm.

Pesa 76 kg.
Mide
197cm

Relacin entre las variables altura (X) y peso (Y) de los


30 individuos vistos en el ejemplo anterior.

Pa

ue
q
e
c
e
r

s
e
p
el

um
a
o

a
t
n
e

la
n
co

,
a
r
altu

Por lo tanto existe una relacin lineal positiva

METODO DE LOS MINIMOS CUADRADOS


SC xy

B1
, donde :
Este mtodo consiste en
SC x
hallar los valores de B0 Y
B1, haciendo mnima la
( Xi )( Yi
)
suma de los cuadrados de SC xy X iYi
n
los errores. Siendo la tarea
2
principal en el anlisis de
(
Xi
)

SC x X i2
regresin lineal simple.
n
Una vez obtenidos estos
valores nos permitir
establecer la recta de
regresin que mejor se
ajuste a los datos o la
recta de mnimos
cuadrados :

B 0 y B 1 x, donde :
Xi
Yi

x
,y
_

Y = B0+B1(X)

El coeficiente B0 es la ordenada en el origen y el


coeficiente B1 es la pendiente de la recta

EJEMPLO:
En un estudio de la relacin entre la publicidad por
radio y las ventas de un producto, durante 10
semanas se han recopilado, los tiempos de duracin
en minutos de la publicidad por semana (X), y el
nmero de artculos vendidos (Y).
Semana

10

Publicidad
X

20

30

30

40

50

60

60

60

70

80

Ventas Y

50

73

69

87

108

128

135

132

148

170

Estadstica General

Solucin

XY

X2

Y2

20
30
30
40
50
60
60
60
70
80

50
73
69
87
108
128
135
132
148
170

1000
2190
2070
3480
5400
7680
8100
7920
10360
13600

400
900
900
1600
2500
3600
3600
3600
4900
6400

2500
5329
4761
7569
11664
16384
18225
17424
21904
28900

500

1100

61800

28400

134660

Y X Y
i

i i

2
i

Tambin se utilizara los promedios de las variables

X Xi / n ,

Y Yi / n

Reemplazando en la formula de los coeficientes de regresin, se


tiene lo siguiente:
( Xi )( Yi
500 x 1100
X
Y

)
61800

ii
n
10
B1

2
2
2
( Xi )
(500)
2
28400

i
10
n
_

B 0 y b x 110 2 (50) 10
Por lo tanto la recta de regresin Y =B0+B1x , estar determinada de la
siguiente manera Y = 10+ 2x.
Interpretacin
B0: El Nmero real de artculos vendidos es de 10 unidades.
B1: El nmero promedio de artculos vendidos aumenta en 2 unidades
a medida que aumenta cada minuto de duracin, de la publicidad en la
semana.

Error Estndar y Error de Estimacin


Cuando se realiza una prediccin, es importante determinar el
error estndar, el cual se representa por Sy.x y mide la
dispersin de los datos observados con respecto a la lnea de
regresin.

Error de
prediccin

Sy.x

2
y
B0 y B1 xy

n2

134660 10(1100 ) 2(61800)


Sy.x
2.74
10 2
El error de estimacin, que esta representado
e=yy

Potrebbero piacerti anche