Sei sulla pagina 1di 19

FACULTAD DE INGENIERA

CARRERA DE INGENIERA DE GESTIN MINERA

PROYECTO DE INVESTIGACIN
CORRELACIN LINEAL

Evaluacin de Recursos minerales a travs de Mtodos


Geoestadsticos

Cdigo:

GM36

Seccin:

GM71

Fecha:

19 - Septiembre

Profesor:

Yvn
Guerrero

INTEGRANTES:

Domnguez Marn, Natalie


Flores Ziga, Elmer
Gonzles Vilca, Darvin
Rojas Or, Kevin

2016-02

Hurtado

Correlacin lineal

1. Introduccin.............................................................................................. 3

2. Coeficiente de correlacin de Karl Pearson...............................................5

2.1. Definicin:.......................................................................................... 5
2.2. Frmulas:........................................................................................... 8

3. Regresin lineal...................................................................................... 13

4. Coeficiente de determinacin.................................................................15

5. Conclusiones........................................................................................... 19

6. Bibliografa.............................................................................................. 20

1.

Introduccin
La correlacin es un
tema cuyo principal
inters se centra en la
magnitud
y
la
direccin
de
las
relaciones. Para un mejor entendimiento, se tocarn temas claves tal como:
Relaciones Lineales:
Para empezar la discusin acerca de las relaciones, ilustraremos una relacin
lineal entre dos variables: La tabla muestra salario por mes de cinco
vendedores y el valor en dlares de la mercanca que cada uno de ellos vendi
ese mes.

La relacin entre estas variables


puede
observarse
mejor
si
trazamos una grfica empleando
los valores X y Y para cada
vendedor como los puntos en la
grfica. Esto se llama diagrama de dispersin.

Como se muestra, observamos que todos los puntos conforman una lnea recta.
Cuando sta describe la relacin entre dos variables, la relacin es llamada
lineal.
NOTA: No todas las relaciones son
lineales; algunas son curvilneas.
En estos casos, cuando se traza un
diagrama de dispersin para las
variables X y Y, una lnea curva es
ms adecuada para unir los puntos
que una lnea recta.

Relaciones
negativas:

positivas

La pendiente de la lnea nos indica


si la relacin es positiva o
negativa. Es decir, cuando la
pendiente es positiva, la relacin
es positiva.
El ejemplo previo muestra pendiente positiva, es decir, los valores ms altos en
X se asociaron con valores ms altos en Y, y viceversa.
La lnea indica que existe una relacin directa entre ambas variables, pues a
medida que X incrementa, Y tambin lo hace.

Relaciones
imperfectas:
En

perfectas

los anteriores ejemplos, todos los


puntos coinciden en una lnea
recta, cuando este es el caso, la
relacin es perfecta pero, no
siempre va a darse de esta forma,
continuacin un ejemplo:

Para describir esta relacin con


una lnea recta, lo mejor que se
puede hacer es trazar la lnea que se
ajuste mejor a los datos.

Coeficiente de correlacin
de Karl Pearson
Definicin:
El coeficiente de correlacin de
Pearson, tambin llamado coeficiente
de correlacin del producto-momento,
es un ndice que mide el grado de
covariacin entre distintas variables
relacionadas linealmente.
Se necesita recordar que al describir la relacin entre dos variables, se necesita
responder al menos tres preguntas:
1. Estn relacionadas las variables entre s? Si los cambios en el valor de una
de las variables van acompaados de cambios en el valor de la otra, las
variables parecen estar relacionadas.
2. Si las variables parecen estar relacionadas, qu tan fuerte es la relacin
entre las variables? En otras palabras, estn estrechamente o slo levemente
relacionadas?
3. La relacin entre las variables es positiva o negativa?
El coeficiente de Pearson nos entrega respuestas
1. indica si dos variables parecen estar correlacionadas o no
2. indica la fuerza de la aparente relacin
5

3. indica si la aparente relacin es positiva o negativa.


El coeficiente de correlacin de Pearson (r) se mide en una escala de 0 a 1,
tanto en direccin positiva como negativa.

Valor del
Coeficiente de Pearson

Grado de Correlacin
entre las Variables

r=0

Ninguna correlacin

r=1

Correlacin positiva perfecta

0<r<1

Correlacin positiva

r = -1

Correlacin negativa perfecta

-1 < r < 0

Correlacin negativa

Ejemplo:
En la siguiente tabla se tiene los sondajes con resultados geoqumicos de un
yacimiento de Cobre y Molibdeno:
Hold
01M01
01M01
01M01
01M01
01M01
01M02
01M02
01M02
01M02
01M02
01M03
01M03
01M03
01M03
01M03
01M03

No.Muestr
a
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
6

Desde_m

Hasta_m

Cu_ppm

Mo_ppm

0
2
4
6
8
0
2
4
6
8
0
2
4
6
8
10

2
4
6
8
10
2
4
6
8
10
2
4
6
8
10
12

0.12
0.468
0.495
1.56
1
1.1
1.48
0.958
1.43
0.647
1.08
0.708
0.83
1.71
2.1
1.04

12.4
51.3
12
42.2
41.7
17.55
23.2
13.35
10.05
10.25
21
46.5
59
129.5
36.7
89.6

HOLD 01M01
60
50
40
Molibdeno_ppm

30
20
10
0

0.2

0.4

0.6

0.8

1.2

1.4

1.6

1.8

Cobre_ppm

HOLD 01m02
25
20
15
Molibdeno_ppm

10
5
0
0.6

0.7

0.8

0.9

1.1

1.2

1.3

1.4

1.5

1.6

2.2

Cobe_ppm

HOLD01M03
140
120
100
80
Molibdeno_ppm

60
40
20
0
0.6

0.8

1.2

1.4

Cobre_ppm

1.6

1.8

Dentro del anlisis, con ayuda del coeficiente de relacin de Karl Pearson, se
logra entender que la informacin que comparten ambas variables, en este
caso el Cobre y Molibdeno, se deduce que dentro de las 3 reas analizadas: en
el rea #2 es donde se encontrar el Cobre y el Molibdeno con mayor
proporcin en el yacimiento, a comparacin de las reas 1 y 3, con ello ya se
obtiene una idea de una posible estrategia y ver qu mtodo emplear para
comenzar alguna operacin en mina.

Frmulas:
Dentro de las formulas a usar se tienen estas 3 para puntuaciones diferentes:
-

Puntuaciones Directas

rXY

N
S X SY

Puntuaciones Diferenciales

rXY

XY X Y

xy
x y
2

Puntuaciones Estandarizadas

rXY

ZY

Ejemplo:
En la siguiente tabla se tiene los valores de Cobre y Zinc extrados dentro de un
yacimiento de tajo abierto, calcular el rxy con los 3 tipos de puntuaciones:
Cu_pct
2
4
6
8
10
12
14
16
18
8

Zn_pct
1
6
8
10
12
10
12
13
10

20

22

Diagrama de dispersin Cu vs Zn
25
20
15
10
5
0

10

15

20

25

Calculo de rxy con puntuaciones directas:

XY

X2

Y2

24

16

36

48

36

64

10

80

64

100

10

12

120

100

144

12

10

120

144

100

14

12

168

196

144

16

13

208

256

169

18

10

180

324

100

20

22

440

400

484

110

104

1390

1540

1342

110
11
10

Sx

Y 104
Y
10,4

Sy

X
N

rXY

10

XY X Y

1540
112 5,745
10

1342
10,4 2 5,103
10

1390
11*10,4
10
0,839
5,745 * 5,103

N
S X SY

Calculo de rxy con puntuaciones diferenciales:

x=X X ; y=Y Y

XY

X2

Y2

-9

-9,4

84,6

81

88,36

-7

-4,4

30,8

49

19,36

-5

-2,4

12

25

5,76

10

-3

-0,4

1,2

0,16

10

12

-1

1,6

-1,6

2,56

12

10

-0,4

-0,4

0,16

14

12

1,6

4,8

2,56

16

13

2,6

13

25

6,76

18

10

-0,4

-2,8

49

0,16

20

22

11,6

104,4

81

134,56

110

104

246

330

260,4

rXY

10

xy
x y
2

246
0,839
330 * 260,4

Calculo de rxy con puntuaciones estandarizadas:

ZX

rXY

ZY

Y Y
SY

Zx

Zy

ZxZy

-1,567

-1,842

2,886

-1,218

-0,862

1,051

-0,870

-0,470

0,409

10

-0,522

-0,078

0,041

10

12

-0,174

0,314

-0,055

12

10

0,174

-0,078

-0,014

14

12

0,522

0,314

0,164

16

13

0,870

0,510

0,443

18

10

1,218

-0,078

-0,096

20

22

1,567

2,273

3,561

110

104

8,391

11

X X
SX

ZY

8,391
0,839
10

Con ayuda del SPSS, se puede verificar:

Indices de R y Rh0
0.00 0.20
0.20 0.40
0.40 0.60
0.60 0.80

Interpretacin
Mala correlacin
Escasa correlacin
Moderada correlacin
Buena correlacin

Regresin lineal
Expresndolo en forma simple,
la regresin lineal es una tcnica que
permite cuantificar la relacin que puede ser observada cuando se grafica un
diagrama de puntos dispersos correspondientes a dos variables, cuya
tendencia general es rectilnea; relacin que cabe compendiar mediante una
ecuacin del mejor ajuste de la forma: Y= a+bX
12

En esta ecuacin, y representa los valores de la coordenada a lo largo del eje


vertical en el grfico; en tanto que x indica la magnitud de la coordenada
sobre el eje horizontal. El valor de a (que puede ser negativo, positivo o igual
a cero) es llamado el intercepto; en tanto que el valor de b (el cual puede ser
negativo o positivo) se denomina la pendiente o coeficiente de regresin.
Ejemplo:
Una empresa minera quiere predecir en varias minas del pas el impacto de la
neumoconiosis, una enfermedad laboral causada por la inhalacin del polvo
inorgnico mineral, en un tiempo de exposicin (horas) al ao. Esto lo realiza
con el propsito de establecer un programa de prevencin, que puede
fortalecerse mediante la labor del mdico de atencin primaria, del mdico de
empresa y con las medidas legales de prevencin de riesgos laborales en las
empresas. Para esto se analiza de informacin obtenida:

13

Mina

Tiempo de exposicin
anual

A
B
C
D
E
F
G
H
I
J

25
22
19
24
19
18
20
15
20
21

Pronstico de
empleados
enfermos
121
123
108
118
111
109
114
103
110
115

14

Y 0 1 X
Y 74,147 1,924 X
Para determinar el nmero de posibles empleados enfermos en un tiempo de
exposicin de X horas por ao solo se debe sustituir X con el valor deseado, por
ejemplo en 30 horas:

Y 74,147 1,924(30) 132


Esto nos dice que en las minas se pueden enfermar 132 mineros con
neumoconiosis, por una inhalacin de polvo inorgnico en un lapso de 30 horas
al ao.

Coeficiente de determinacin
El coeficiente de determinacin ( R ), es un estadstico usado en el contexto
de un modelo estadstico cuyo principal propsito es predecir futuros
resultados o probar una hiptesis. El coeficiente determina la calidad del
modelo para replicar los resultados, y la proporcin de variacin de los
resultados que puede explicarse por el modelo.
Las ms comunes se refieren a la regresin lineal. En este caso, el R es
simplemente el cuadrado del coeficiente de correlacin de Pearson, lo cual es
slo cierto para la regresin lineal simple. Si existen varios resultados para una
nica variable, es decir, para una X existe una Y, Z... el coeficiente de
determinacin resulta del cuadrado del coeficiente de determinacin mltiple.
En ambos casos el R adquiere valores entre 0 y 1.
El coeficiente de determinacin no slo mide la capacidad explicativa de un
modelo, sino que adems permite elegir entre varios modelos cual es el ms
adecuado. As los modelos tienen la misma variable dependiente y el mismo
15

nmero de variables explicativas, ser ms adecuado el que tenga un


coeficiente de determinacin mayor.
Si la proporcin es igual a 0, significa que la variable predictora no tiene NULA
capacidad predictiva de la variable a predecir (Y). Cuanto mayor sea la
proporcin, mejor ser la prediccin. Si llegara a ser igual a 1 la variable
predictora explicara TODA la variacin de Y, y las predicciones NO tendran
error.
Correlacin simple:
La correlacin entre dos variables cuantitativas para verificar su relacin se
llama, correlacin simple.
El coeficiente de correlacin (r) es un nmero que indica el grado o intensidad
de asociacin entre las variables X e Y. Su valor vara entre -1 y +1; esto es:
-1 r 1
Si r=-1, la asociacin es perfecta pero inversa; es decir, a valores altos de una
variable le corresponde valores bajos a la otra variable, y viceversa.
Si r=+1, tambin la asociacin es perfecta pero directa.
Si r=0, no existe asociacin entre las dos variables. Luego puede verse que a
medida que r se aproxime a -1 +1 la asociacin es mayor, y cuando se
aproxima a cero la asociacin disminuye o desaparece.
Ejemplo:

A partir de los siguientes datos referentes a horas trabajadas en un mina (X), y


a unidades producidas (Y), determinar la recta de regresin de Y sobre X,
el coeficiente de correlacin lineal e interpretarlo.

16

17

Resumen del modelo


R
R cuadrado
Error
Model
cuadrado
ajustado
estndar de
o
R
la estimacin
a
1
,954
,910
,901
9,46644
a. Predictores: (Constante), hora
Correlaciones
produccio
n
hora
produccio Correlacin
de
n
Pearson
Sig. (bilateral)
Suma de cuadrados
y
productos
vectoriales
Covarianza
N
hora
Correlacin
de
Pearson
Sig. (bilateral)

18

,954**
,000

9968,667

2612,00
0

906,242
12

237,455
12

,954**

,000

Suma de cuadrados
y
productos 2612,000 752,000
vectoriales
Covarianza
237,455 68,364
N
12
12
**. La correlacin es significativa en el nivel 0,01
(bilateral).
Entonces, el coeficiente de determinacin es 0,910.

Conclusiones
-

Para poder entender la Correlacin lineal, primero se deben de tener en


cuenta los conceptos bsicos de relaciones, tales como: r. lineal, r. positiva o
negativa, r. perfecta o imperfecta, entre otros.
Los valores de coeficiente de Pearson y Coeficiente de Determinacin
pueden ser obtenidos a travs del Microsoft Excel y pueden ser verificados
en el Statistical Product and Service Solutions (SPPS).
El coeficiente de Pearson es recomendable cuando se quiere trabajar con
dos variables cuantitativas, nos ayuda a comprender la relacin entre stas
y finalmente, contribuye con la toma de decisiones del estudio que se est
realizando.
Se puede decir que de acuerdo al valor de coeficiente de determinacin, el
modelo de regresin lineal es adecuado. Tambin, los valores que se
obtendrn en funcin de este modelo, tendrn una gran capacidad
predictiva.

Bibliografa
-

Pagano,R.,(2006),Estadsticas para la ciencia del comportamiento, Mxico


DF, Mxico, Cengage Learning Latin America.
http://www.fao.org/docrep/003/x6845s/x6845s02.htm
http://www.cca.org.mx/cca/cursos/estadistica/html/m14/coef_pearson.htm
http://personales.us.es//vararey/adatos2/correlacion.pdf
http://dm.udc.es/asignaturas/estadistica2/sec6_8.html
http://www.uv.es/webgid/Descriptiva/6_coeficiente_de_determinacin.html

19

Potrebbero piacerti anche