Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introduccin
Muchas veces las decisiones se basan en la relacin entre
dos o ms variables. Ejemplos
Dosis de fertilizantes aplicadas y rendimiento del cultivo.
ESTADSTICA GENERAL
Anlisis de Regresin y Correlacin
Figura 1
Y=f(X)
Ejemplo 1
300
250
Rendimiento
200
Rend.
150
100
50
0
0
20
40
60
80
100
120
140
Parcela
Dosis
Rend.(kg/h)
Dosis
1
2
3
75
25
130
150
50
260
Figura 2
Ejemplo 2
1 60
Horas hombre
1 40
1 20
1 00
80
Horas hombre
60
40
20
Lote de prod.
1
2
3
4
5
Horas hombre
73
50
128
170
87
10
20
30
40
50
60
70
80
90
09/11/2016
Conceptos bsicos
Anlisis de Regresin: Es un procedimiento
estadstico que estudia la relacin funcional
entre variables. Con el objeto de predecir una
en funcin de la/s otra/s.
Variables
independientes
(predictoras,
explicativas exgenas). Son las variables que
proveen las bases para estimar.
Regresin simple: interviene una sola variable
independiente.
Coeficiente de correlacin
lineal
Grfico de dispersin
Los diagramas de dispersin no slo muestran la
relacin existente entre variables, sino tambin resaltan
las observaciones individuales que se desvan de la
relacin general. Estas observaciones son conocidas
como outliers o valores inusitados, que son puntos de
los datos que aparecen separados del resto.
10
9
8
7
6
5
4
3
2
1
0
10
10
9
8
7
6
5
4
3
2
1
0
0
10
09/11/2016
Ausencia de Correlacin
10
9
8
7
6
5
4
3
2
1
0
10
10
Modelos de Regresin
Un modelo de regresin, es una manera
de expresar dos ingredientes esenciales
de una relacin estadstica:
Una tendencia de la variable dependiente
Y a variar conjuntamente con la variacin
de la o las X de una manera sistemtica.
Una dispersin de las observaciones
alrededor de la curva de relacin
estadstica.
n(X
n(XY ) (X )(Y )
2
) (X ) 2 n Y 2 Y
Modelos de Regresin
Estas dos caractersticas estn implcitas en un
modelo de regresin, postulando que:
En la poblacin de observaciones asociadas
con el proceso que fue muestreado, hay una
distribucin de probabilidades de Y para cada
nivel de X.
09/11/2016
Anlisis de Regresin
Modelo de regresin
Datos de la muestra
y= 0+ 1x+
E(y)= 0+ 1x
Parmetros desconocidos
0. 1
Seccin B
Relacin lineal negativa
Ey
Ey
Lnea de regresin
b0.b1
La pendiente 1
es 0
y=b0+b1x
Ey
Lnea de regresin
Estadsticos de la muestra
Y= a + bX, donde:
b es
Y
X (b es el coeficiente de
regresin poblacional (pendiente de la lnea recta)) .
el principio de mnimos cuadrados es usado para obtener a
y b:
la pendiente de la lnea, o el cambio promedio de
La pendiente 1
es positiva
proporcionan estimados
Lnea de regresin
* Ordenada al origen 0
Ejemplo:
La relacin entre el nmero
de aos (x) laborando para
la empresa y el nmero de
ventas logradas (y) por cada
vendedor es la mostrada en
la siguiente tabla.
a) Cuntas ventas pueden
esperarse
en
un
trabajador con 16 aos
de servicio?;
b) b)
Cuntos
aos,
aproximadamente,
se
requieren para lograr 14
ventas?
Solucin:
Lo primero que debe encontrarse es la ecuacin de regresin, es
decir, la ecuacin de la recta que con mayor fidelidad une a
todos los puntos de la tabla anterior.
Para darse una idea visual del trabajo que se va a realizar,
conviene graficar los puntos con un diagrama de dispersin:
Nmero de ventas
Ecuacin estimada de
regresin
Estimacin de la ecuacin de
Regresin Simple
Seccin C
No hay relacin
La pendiente 1
es negativa
y
y1
y2
.
.
.
yn
b0 y b1
0 y 1
x
x1
x2
.
.
.
xn
Ecuacin de regresin
Nmero de aos
09/11/2016
Y = 0.430 + 0.698 X
Esta ecuacin sirve para poder contestar las dos preguntas formuladas en
el enunciado del problema: Cuntas ventas pueden esperarse en un
trabajador con 16 aos de servicio? Cuntos aos, aproximadamente, se
requieren para lograr 14 ventas?
y = a + bx
y = 0.430 + 0.698 (16) = 11.59
Coeficiente de Regresin o
Determinacin
Coeficiente de Regresin, R2 - es la
proporcin de la variacin total en la
variable dependiente Y que es explicada o
contabilizada por la variacin en la variable
independiente X.
( y y )
R
( y y)
2
El coeficiente de determinacin es el
cuadrado del coeficiente de correlacin, y
varia entre 0 y 1.
09/11/2016
Sensor 4
0,3083
0,3083
0,3327
0,3327
0,3297
0,3205
0,3114
0,2901
0,3449
0,3480
0,3480
0,3419
0,2840
0,3053
0,3266
0,2840
0,3358
0,3419
Sensor 5
0,1212
0,1212
0,1328
0,1251
0,1251
0,1193
0,1193
0,1193
0,1328
0,1193
0,1193
0,1135
0,1135
0,1193
0,1232
0,1135
0,1232
0,1251
PRED_Rendimiento
Ejemplo
Rendimiento
42,5846
43,8576
44,0082
43,4989
41,3327
41,0313
40,4802
36,6735
43,3535
43,3180
43,3143
41,0042
36,4908
37,5931
40,4556
35,5595
41,6400
43,5951
38,41
30,87
23,33
15,79
0,078
0,092
0,107
0,121
0,135
B5
Rendimiento
PRED_Rendimiento
Y = 338.71*X - 4.87
R2 = 0.32
Ttulo
Ttulo
45,95
38,41
PRED_Rendimiento
PRED_Rendimiento
45,95
30,87
23,33
15,79
0,22
0,26
0,30
0,34
0,37
B4
38,41
30,87
23,33
15,79
0,071
0,076
0,081
0,087
0,092
B1
Rendimiento
PRED_Rendimiento
Rendimiento
PRED_Rendimiento
Y = -1004.34*X +112.24
Y = 155.37*X 13.25
R2 = 0.57
R2 = 0.44
Regresin:
Ecuacin matemtica que describe el comportamiento de
dos medidas.
Es decir, con la regresin podemos construir una formula
que nos d el nmero de enfermos de cncer de pulmn en
funcin de los fumadores o el numero de cursos aprobados
en funcin de la universidad o del estatus social del
estudiante.