Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
PROYECTO DE INVESTIGACIN
CORRELACIN LINEAL
Cdigo:
GM36
Seccin:
GM71
Fecha:
19 - Septiembre
Profesor:
Yvn
Guerrero
INTEGRANTES:
2016-02
Hurtado
Correlacin lineal
1. Introduccin.............................................................................................. 3
2.1. Definicin:.......................................................................................... 5
2.2. Frmulas:........................................................................................... 8
3. Regresin lineal...................................................................................... 13
4. Coeficiente de determinacin.................................................................15
5. Conclusiones........................................................................................... 19
6. Bibliografa.............................................................................................. 20
1.
Introduccin
La correlacin es un
tema cuyo principal
inters se centra en la
magnitud
y
la
direccin
de
las
relaciones. Para un mejor entendimiento, se tocarn temas claves tal como:
Relaciones Lineales:
Para empezar la discusin acerca de las relaciones, ilustraremos una relacin
lineal entre dos variables: La tabla muestra salario por mes de cinco
vendedores y el valor en dlares de la mercanca que cada uno de ellos vendi
ese mes.
Como se muestra, observamos que todos los puntos conforman una lnea recta.
Cuando sta describe la relacin entre dos variables, la relacin es llamada
lineal.
NOTA: No todas las relaciones son
lineales; algunas son curvilneas.
En estos casos, cuando se traza un
diagrama de dispersin para las
variables X y Y, una lnea curva es
ms adecuada para unir los puntos
que una lnea recta.
Relaciones
negativas:
positivas
Relaciones
imperfectas:
En
perfectas
Coeficiente de correlacin
de Karl Pearson
Definicin:
El coeficiente de correlacin de
Pearson, tambin llamado coeficiente
de correlacin del producto-momento,
es un ndice que mide el grado de
covariacin entre distintas variables
relacionadas linealmente.
Se necesita recordar que al describir la relacin entre dos variables, se necesita
responder al menos tres preguntas:
1. Estn relacionadas las variables entre s? Si los cambios en el valor de una
de las variables van acompaados de cambios en el valor de la otra, las
variables parecen estar relacionadas.
2. Si las variables parecen estar relacionadas, qu tan fuerte es la relacin
entre las variables? En otras palabras, estn estrechamente o slo levemente
relacionadas?
3. La relacin entre las variables es positiva o negativa?
El coeficiente de Pearson nos entrega respuestas
1. indica si dos variables parecen estar correlacionadas o no
2. indica la fuerza de la aparente relacin
5
Valor del
Coeficiente de Pearson
Grado de Correlacin
entre las Variables
r=0
Ninguna correlacin
r=1
0<r<1
Correlacin positiva
r = -1
-1 < r < 0
Correlacin negativa
Ejemplo:
En la siguiente tabla se tiene los sondajes con resultados geoqumicos de un
yacimiento de Cobre y Molibdeno:
Hold
01M01
01M01
01M01
01M01
01M01
01M02
01M02
01M02
01M02
01M02
01M03
01M03
01M03
01M03
01M03
01M03
No.Muestr
a
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
6
Desde_m
Hasta_m
Cu_ppm
Mo_ppm
0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
10
2
4
6
8
10
2
4
6
8
10
2
4
6
8
10
12
0.12
0.468
0.495
1.56
1
1.1
1.48
0.958
1.43
0.647
1.08
0.708
0.83
1.71
2.1
1.04
12.4
51.3
12
42.2
41.7
17.55
23.2
13.35
10.05
10.25
21
46.5
59
129.5
36.7
89.6
HOLD 01M01
60
50
40
Molibdeno_ppm
30
20
10
0
0.2
0.4
0.6
0.8
1.2
1.4
1.6
1.8
Cobre_ppm
HOLD 01m02
25
20
15
Molibdeno_ppm
10
5
0
0.6
0.7
0.8
0.9
1.1
1.2
1.3
1.4
1.5
1.6
2.2
Cobe_ppm
HOLD01M03
140
120
100
80
Molibdeno_ppm
60
40
20
0
0.6
0.8
1.2
1.4
Cobre_ppm
1.6
1.8
Dentro del anlisis, con ayuda del coeficiente de relacin de Karl Pearson, se
logra entender que la informacin que comparten ambas variables, en este
caso el Cobre y Molibdeno, se deduce que dentro de las 3 reas analizadas: en
el rea #2 es donde se encontrar el Cobre y el Molibdeno con mayor
proporcin en el yacimiento, a comparacin de las reas 1 y 3, con ello ya se
obtiene una idea de una posible estrategia y ver qu mtodo emplear para
comenzar alguna operacin en mina.
Frmulas:
Dentro de las formulas a usar se tienen estas 3 para puntuaciones diferentes:
-
Puntuaciones Directas
rXY
N
S X SY
Puntuaciones Diferenciales
rXY
XY X Y
xy
x y
2
Puntuaciones Estandarizadas
rXY
ZY
Ejemplo:
En la siguiente tabla se tiene los valores de Cobre y Zinc extrados dentro de un
yacimiento de tajo abierto, calcular el rxy con los 3 tipos de puntuaciones:
Cu_pct
2
4
6
8
10
12
14
16
18
8
Zn_pct
1
6
8
10
12
10
12
13
10
20
22
Diagrama de dispersin Cu vs Zn
25
20
15
10
5
0
10
15
20
25
XY
X2
Y2
24
16
36
48
36
64
10
80
64
100
10
12
120
100
144
12
10
120
144
100
14
12
168
196
144
16
13
208
256
169
18
10
180
324
100
20
22
440
400
484
110
104
1390
1540
1342
110
11
10
Sx
Y 104
Y
10,4
Sy
X
N
rXY
10
XY X Y
1540
112 5,745
10
1342
10,4 2 5,103
10
1390
11*10,4
10
0,839
5,745 * 5,103
N
S X SY
x=X X ; y=Y Y
XY
X2
Y2
-9
-9,4
84,6
81
88,36
-7
-4,4
30,8
49
19,36
-5
-2,4
12
25
5,76
10
-3
-0,4
1,2
0,16
10
12
-1
1,6
-1,6
2,56
12
10
-0,4
-0,4
0,16
14
12
1,6
4,8
2,56
16
13
2,6
13
25
6,76
18
10
-0,4
-2,8
49
0,16
20
22
11,6
104,4
81
134,56
110
104
246
330
260,4
rXY
10
xy
x y
2
246
0,839
330 * 260,4
ZX
rXY
ZY
Y Y
SY
Zx
Zy
ZxZy
-1,567
-1,842
2,886
-1,218
-0,862
1,051
-0,870
-0,470
0,409
10
-0,522
-0,078
0,041
10
12
-0,174
0,314
-0,055
12
10
0,174
-0,078
-0,014
14
12
0,522
0,314
0,164
16
13
0,870
0,510
0,443
18
10
1,218
-0,078
-0,096
20
22
1,567
2,273
3,561
110
104
8,391
11
X X
SX
ZY
8,391
0,839
10
Indices de R y Rh0
0.00 0.20
0.20 0.40
0.40 0.60
0.60 0.80
Interpretacin
Mala correlacin
Escasa correlacin
Moderada correlacin
Buena correlacin
Regresin lineal
Expresndolo en forma simple,
la regresin lineal es una tcnica que
permite cuantificar la relacin que puede ser observada cuando se grafica un
diagrama de puntos dispersos correspondientes a dos variables, cuya
tendencia general es rectilnea; relacin que cabe compendiar mediante una
ecuacin del mejor ajuste de la forma: Y= a+bX
12
13
Mina
Tiempo de exposicin
anual
A
B
C
D
E
F
G
H
I
J
25
22
19
24
19
18
20
15
20
21
Pronstico de
empleados
enfermos
121
123
108
118
111
109
114
103
110
115
14
Y 0 1 X
Y 74,147 1,924 X
Para determinar el nmero de posibles empleados enfermos en un tiempo de
exposicin de X horas por ao solo se debe sustituir X con el valor deseado, por
ejemplo en 30 horas:
Coeficiente de determinacin
El coeficiente de determinacin ( R ), es un estadstico usado en el contexto
de un modelo estadstico cuyo principal propsito es predecir futuros
resultados o probar una hiptesis. El coeficiente determina la calidad del
modelo para replicar los resultados, y la proporcin de variacin de los
resultados que puede explicarse por el modelo.
Las ms comunes se refieren a la regresin lineal. En este caso, el R es
simplemente el cuadrado del coeficiente de correlacin de Pearson, lo cual es
slo cierto para la regresin lineal simple. Si existen varios resultados para una
nica variable, es decir, para una X existe una Y, Z... el coeficiente de
determinacin resulta del cuadrado del coeficiente de determinacin mltiple.
En ambos casos el R adquiere valores entre 0 y 1.
El coeficiente de determinacin no slo mide la capacidad explicativa de un
modelo, sino que adems permite elegir entre varios modelos cual es el ms
adecuado. As los modelos tienen la misma variable dependiente y el mismo
15
16
17
18
,954**
,000
9968,667
2612,00
0
906,242
12
237,455
12
,954**
,000
Suma de cuadrados
y
productos 2612,000 752,000
vectoriales
Covarianza
237,455 68,364
N
12
12
**. La correlacin es significativa en el nivel 0,01
(bilateral).
Entonces, el coeficiente de determinacin es 0,910.
Conclusiones
-
Bibliografa
-
19