Sei sulla pagina 1di 13

ESTADISTICA

Regresión y Correlación
Lineal Simple
Independencia - Dependencia
Cuando se estudian dos características simultáneamente sobre una muestra,
se puede considerar que una de ellas influye sobre la otra de alguna
manera.
Por ejemplo:
La altura y el peso
Las horas de estudio y la calificación en un examen.
El objetivo principal de la regresión es descubrir el modo en que se relacionan.

Dos variables pueden considerarse:

• Variables independientes  No tienen relación (una de ellas no sirve para


explicar los movimientos de la otra)
• Dependencia funcional  Y=f(x)
• Dependencia estadística

Dependencia
Independencia estadística Dependencia funcional
estadística

- +
Grado de asociación entre dos variables
GRÁFICOS DE DISPERSIÓN: Permite ver si hay asociación
Dadas dos variables X y Y tomadas sobre el mismo elemento de la
población, el diagrama de dispersión es simplemente un gráfico de
dos dimensiones, donde en un eje (la abscisa) se sitúa una
variable, y en el otro eje (la ordenada) se sitúa la otra variable. Si
las variables están correlacionadas, el gráfico mostraría algún nivel
de correlación (tendencia) entre las dos variables. Si no hay
ninguna correlación, el gráfico presentaría una figura sin forma,
una nube de puntos dispersos en el gráfico.

Asociación
positiva. Si
aumenta X
aumenta Y

Estadística Económica
2007-2008. Sara Mateo.
GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN
La relación entre dos variables métricas puede ser
representada mediante la línea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresión, que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.
r  1 1  r  0 r 0 0  r 1 r 1

Positiva
Negativa Nula
Pendiente
APLICACIÓN
Un gerente de ventas reunió los datos
siguientes relacionados con las ventas
anuales en miles de soles y los años de
experiencia de diez vendedores.
Determine el diagrama de dispersión de los
datos.
Determine la ecuación que mejor se ajuste
Determine el coeficiente de correlación
VARIABLES:
X: Años de experiencia
Y: Ventas anuales en miles de soles.

VENDEDOR X Y
1 1 80
2 3 97
3 4 92
4 4 102
5 6 103
6 8 111
7 10 119
8 10 123
9 11 117
10 13 136
VENTAS Y AÑOS DE EXPERIENCIA
160

140

120
VENTA ANUALES EN MILES DE SOLES

100

80

60

40

20

0
0 2 4 6 8 10 12 14
AÑOS DE EXPERIENCIA
DETREMINANDO LA ECUACION QUE MEJOR SE AJUSTE

VENDEDOR X Y X*Y X*X Y*Y


1 1 80 80 1 6400
2 3 97 291 9 9409
3 4 92 368 16 8464
4 4 102 408 16 10404
5 6 103 618 36 10609
6 8 111 888 64 12321
7 10 119 1190 100 14161
8 10 123 1230 100 15129
9 11 117 1287 121 13689
10 13 136 1768 169 18496
SUMATORIA 70 1080 8128 632 119082

PROMEDIO X = 7
PROMEDIO Y 108
METODO DE MINIMOS CUADRADOS

y = a + bx

a  Y  bX

b= 4 REEMPLAZANDO: y= 4x + 80
a= 80
EL ERROR ESTANDAR = 21.25 4,61

COEFICIENTE DE DETERMINACION
0.93038493 EL 93% DE LAS VEBNTAS ANUALES SE DEBE A LA EXPERIENCIA DE LOS VENDEDORES Y EL 7% SE DEBE A OTROS FACTORES

COEFICIENTE DE CORRELACION
0.964564632 AMBAS VARIABLES TIENEN UNA CORRELACION POSITIVA INTENSA

Potrebbero piacerti anche