Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Facultad de Ingeniería
Departamento de Ingeniería en Minas
Laboratorio de Evaluación de Yacimientos
Informe – 1
Análisis Exploratorio de Datos
Para la toma de decisiones del proyecto, debe existir un estudio previo que
entregue información fidedigna acerca de las características, tanto espaciales como
de sus cualidades económicas, es decir, la calidad del mineral que se encuentra en
el yacimiento. Esto se enfoca típicamente a lo que es la Ley de Cobre Total (CUT)
en los yacimientos de Cobre.
En una campaña de exploración, generalmente ocurre lo que se denomina
un Muestreo Preferencial, el cual es una distribución en una malla de sondaje
concentrada en las zonas donde se sabe anticipadamente una tendencia a leyes
más altas. Una herramienta utilizada para corregir esta irregularidad en las mallas
de sondajes es el Desagrupamiento, ya que otorga un peso estadístico en menor
medida a aquellos datos espacialmente agrupados, en comparación de los que se
encuentran aislados, los cuales representan una porción más extensa de la zona de
estudio. Para realizar un Desagrupamiento se determina la variable de ponderación
de éste, en el cual se puede utilizar un método llamado Método de las Celda, la cual
consiste en dividir la zona de estudio en celdas rectangulares y atribuir un
ponderador inversamente proporcional al número de datos presentes en la muestra
a la que éste pertenece.
Realizar un Análisis Estadístico de Datos es importante para poder
determinar la Estacionaridad de las Unidades Geológicas mediante esta
herramienta. En un Análisis Exploratorio de Datos se visualizan y despliegan los
datos, utilizando distintos tipos de gráficos y estadística básica con el interés es
analizar la distribución estadística y espacial del elemento de interés económico, es
decir, la ley de cobre total.
A continuación, se adjunta una tabla resumen, con los valores agrupados y
desagrupados.
Tabla I: Tabla Resumen de las Variables Agrupadas y Desagrupadas en los Primarios.
Fuente: Propia
Índice de Tablas
Tabla 1: Información Entregada en el Archivo BD_2 Yacimiento - 2. Fuente: Ayudantes. ...............12
Tabla 2: Datos Entregados por la Base de Datos. Fuente: Propia. ..................................................12
Tabla 3: Información de UG 400 correspondiente al Yacimiento - 2. Fuente: Ayudantes. ...............13
Tabla 4: Datos Entregados por la Base de Datos correspondiente a la UG 400. Fuente: Propia. ...13
Tabla 5: Medidas de Dispersión del CuT con y sin Desagrupamiento. Fuente: Propia. ...................19
Tabla 6: Resumen de los Tipos de Contactos en las Unidades Geológicas. Fuente: Propia. ..........23
Tabla 7: Ley Máxima y Mínima para Muestras y Bloques en la Deriva X. Fuente: Propia. ..............25
Tabla 8: Ley Máxima y Mínima para Muestras y Bloques en la Deriva Y. Fuente: Propia. ..............25
Tabla 9: Ley Máxima y Mínima para Muestras y Bloques en la Deriva Z. Fuente: Propia. ..............25
Índice de Ilustraciones
Ilustración 1: Flujograma del Procedimiento Realizado en el Informe. Fuente: Propia ....................11
Ilustración 2: Visualización del CuT en los Sondajes en Vista XZ & YZ. Fuente: Propia. ................12
Ilustración 3: Visualización del CuT en los Sondajes en Vista XY. Fuente: Propia. .........................13
Ilustración 4: Visualización del CuT en los Sondajes UG-400 en Vista XZ & YZ. Fuente: Propia. ...14
Ilustración 5: Visualización del CuT en los Sondajes UG-400 en Vista XY. Fuente: Propia.............14
Ilustración 6: Tamaño de Celda v/s Ley Media de Cobre Total - Iteración 1. Fuente: Propia. ..........15
Ilustración 7: Tamaño de Celda v/s Ley Media de Cobre Total - Iteración 2. Fuente: Propia. ..........16
Ilustración 8: Histograma con los valores Desagrupados. Fuente: Propia. ......................................17
Ilustración 9: Histogramas sin Desagrupamiento y con Desagrupamiento. Fuente: Propia. ............18
Ilustración 10: Visualización de las UGs en los Sondajes en Vista XZ & YZ. Fuente: Propia. .........19
Ilustración 11: Análisis de Contacto entre la Zona de Óxidos y Primarios. Fuente: Propia. .............20
Ilustración 12: Análisis de Contacto entre la Zona de Primarios y Sulfuros. Fuente: Propia. ...........21
Ilustración 13: Análisis de Contacto entre la Zona de Primarios y Mixtos. Fuente: Propia. ..............21
Ilustración 14: Análisis de Contacto entre la Zona de Óxidos y Sulfuros. Fuente: Propia. ...............22
Ilustración 15: Análisis de Contacto entre la Zona de Mixtos y Sulfuros. Fuente: Propia. ................22
Ilustración 16: Análisis de Contacto entre la Zona de Óxidos y Mixtos. Fuente: Propia. ..................23
Ilustración 17: Derivas en la Zona de Primarios. Fuente: Propia......................................................24
Ilustración 18: Scatter de CuT en el eje X. Fuente: Propia ...............................................................26
Ilustración 19 Scatter de CuT en el eje Y. Fuente: Propia ................................................................26
Ilustración 20: Scatter de CuT en el eje Z. Fuente: Propia ...............................................................27
Introducción
El negocio minero se compone de varias etapas, donde cada una tiene un rol
fundamental para éste. Una vez encontrado un nuevo yacimiento para poder
convertirse en un proyecto minero, las alternativas de posibles inversiones deben
evaluarse a la hora de poner en marcha el proyecto, en caso de realizarse. Es por
esto que se deben considerar tanto la rentabilidad, disponibilidad de capital, riesgo,
entre otros factores, de manera que exista un beneficio económico al realizar dicho
proyecto.
Para la toma de decisiones del proyecto, debe existir un estudio previo que
entregue información fidedigna acerca de las características, tanto espaciales como
de sus cualidades económicas, es decir, la calidad del mineral que se encuentra en
el yacimiento. Esto se enfoca típicamente a lo que es la Ley de Cobre Total (CUT)
en los yacimientos de Cobre.
La Geoestadística se define como el estudio de fenómenos regionalizados,
es decir que se extienden en el espacio y presentan una cierta continuidad. Las
aplicaciones de esta ciencia de la Tierra van desde la evaluación de recursos
naturales (mineros en este caso) hasta topografía u oceanografía.
La Geoestadística busca mediante una toma de muestra, estudiar una o
varias variables regionalizadas. Una de las herramientas utilizadas en la
Geoestadística es lo que se denomina Análisis Exploratorio de Datos, el cual tiene
principalmente tres objetivos. El primero es analizar la cantidad, calidad y ubicación
de los datos disponibles mediante herramientas de estadística simple. En segundo
lugar, es definir la zona de estudio, ya que es importante al momento de observar
cambios abruptos en la distribución espacial de valores. Por último, como objetivo
principal está el anticiparse a dificultades o problemas que puedan surgir en la fase
de estimación, como por ejemplo la presencia de valores atípicos (outliers) respecto
a la vecindad que lo acompaña en la muestra de datos.
En un Análisis Exploratorio de Datos se visualizan y despliegan los datos,
utilizando distintos tipos de gráficos y estadística básica con el interés es analizar la
distribución estadística y espacial del elemento de interés económico, es decir, la
ley de cobre total.
En una campaña de exploración, generalmente ocurre lo que se denomina
un Muestreo Preferencial, el cual es una distribución en una malla de sondaje
concentrada en las zonas donde se sabe anticipadamente una tendencia a leyes
más altas. Una herramienta utilizada para corregir esta irregularidad en las mallas
de sondajes es el Desagrupamiento, ya que otorga un peso estadístico en menor
medida a aquellos datos espacialmente agrupados, en comparación de los que se
5
encuentran aislados, los cuales representan una porción más extensa de la zona de
estudio.
Para realizar un Desagrupamiento se determina la variable de ponderación
de éste, en el cual se puede utilizar un método llamado Método de las Celda, la cual
consiste en dividir la zona de estudio en celdas rectangulares y atribuir un
ponderador inversamente proporcional al número de datos presentes en la muestra
a la que éste pertenece. Una vez realizado el Desagrupamiento, se tiene una mejor
representatividad de los datos respecto a la variable de interés, la Ley de Cobre
Total, respecto a su comportamiento espacialmente.
Es importante tener un buen Análisis Exploratorio de Datos, ya que, al tener
esta información, permitirá observar el comportamiento de la Ley de Cobre Total,
particularmente en la o las unidades geológicas de interés, como también concluir
respecto al supuesto de estacionaridad en los datos trabajados del estudio.
6
Objetivos
Objetivo Principal
Determinar la Estacionaridad de las Unidades Geológicas mediante el
Análisis Exploratorio de Datos (EDA).
Objetivos Secundarios
Realizar un Desagrupamiento a los datos.
7
Alcances
Este estudio fue solicitado por los ayudantes del laboratorio de Evaluación
de Yacimientos del Departamento de Ingeniería en Minas, Universidad de
Santiago de Chile, con el objetivo de a través de un Análisis Exploratorio de
Datos (EDA) determinar la Estacionaridad de las unidades Geológicas
respecto al comportamiento de la variable Ley de Cobre Total (CuT).
8
Metodología
Variable Regionalizada
La Geoestadística se define como el estudio de fenómenos regionalizados,
que se extienden en el espacio y presentan una cierta continuidad. Por lo cual la
Variable Regionalizada es una función que representa el desplazamiento en el
espacio de un atributo asociado a un fenómeno natural, como, por ejemplo: Ley de
un mineral, potencia de una veta, recuperación metalúrgica.
Soporte
Una variable regionalizada puede definirse, no sólo en cada punto del
espacio, sino que también en una superficie (2D) o en un volumen (3D). Es por esto
que el Soporte puede definirse como la superficie o el volumen sobre el cual se
considera la variable regionalizada.
Estacionaridad
El concepto de Estacionaridad, consiste en que la distribución espacial de los
atributos es invariante por traslación, es decir, que las propiedades de un conjunto
de datos no dependen de su posición absoluta en el espacio. A partir de esto, los
datos pueden ser agrupados en dominios de estimación.
Compositación
Procedimiento mediante el cual se selecciona un tamaño representativo del
soporte, a partir de la moda del tamaño de las muestras extraídas. Mientras mayor
sea el tamaño de la compositación, la variabilidad de los datos disminuye.
9
Desagrupamiento “Declustering”
Procedimiento empleado para corregir los efectos provocados por las
irregularidades de la malla de muestreo. El objetivo esencial es asignar a los datos
espacialmente agrupados, en parte redundantes, un ponderador más pequeño
(Variable Peso) que, a los datos aislados, los cuales son representativos de una
porción más extensa del campo, mediante esto se aumenta la representatividad de
las muestras.
Análisis de Contacto
Corresponde al cálculo de las leyes medias de una variable en torno al
contacto o cambio entre dos unidades de cierto atributo geológico, esto permite
identificar diferencias entre las unidades definidas, y a su vez observar si existen
tendencias similares en el contacto de estas o en sus cercanías (Tolerancia).
Existen 5 tipos de contacto, los cuales son: Blando - Duro - Transicional Duro -
Transicional Blando - Errático.
A continuación, se adjunta un flujograma, el cual permite entender de mejor
manera los pasos a seguir en el siguiente informe.
10
Ilustración 1: Flujograma del Procedimiento Realizado en el Informe. Fuente: Propia
11
Presentación de los Datos
Número de Sondajes 54
Ley mínima de CuT [%CuT] 0.0
Ley máxima de CuT [%CuT] 6.9
Mineralización Presente CuT
Unidades Geológicas Óxidos, Mixtos, Primarios, Sulfuros y Estéril
Ilustración 2: Visualización del CuT en los Sondajes en Vista XZ & YZ. Fuente: Propia.
12
Ilustración 3: Visualización del CuT en los Sondajes en Vista XY. Fuente: Propia.
Número de Sondajes 36
Ley mínima de CuT [%CuT] 0.002
Ley máxima de CuT [%CuT] 5.310
Mineralización Presente CuT
Unidad Geológica Primarios
13
Ilustración 4: Visualización del CuT en los Sondajes UG-400 en Vista XZ & YZ. Fuente:
Propia.
Ilustración 5: Visualización del CuT en los Sondajes UG-400 en Vista XY. Fuente: Propia
14
Desarrollo y Resultados
Desagrupamiento
Para realizar el Desagrupamiento se utiliza el Método de las Celda, el cual
como ya se mencionó, atribuye un ponderador inversamente proporcional al número
de muestras ubicadas en la celda generada para dividir la zona de estudio, es
necesario encontrar el tamaño óptimo que minimice la Ley de Cobre Total. Esto es
importante ya que, al no realizar este ajuste se sobreestimará la Ley de Cobre Total
Media.
Al Aumentar el tamaño de la celda, disminuirá la Ley de Cobre Media hasta
el punto en que comience a aumentar nuevamente. En primera instancia se propone
un intervalo máximo del tamaño de celda de 800 [m] para la coordenada X e Y. Para
la coordenada Z se propone un intervalo máximo de 500 [m] en donde se obtiene el
siguiente gráfico, el cual muestra la Curva de Ley de Cobre Total Media respecto al
tamaño de celda.
Ilustración 6: Tamaño de Celda v/s Ley Media de Cobre Total - Iteración 1. Fuente: Propia.
15
Se observa el punto más bajo de la curva, el cual entrega en el paso 13 que,
al usar un tamaño de celda de 226,12m en la coordenada ‘X’, 226,12m en la
coordenada ‘Y’ y 137,55m para la coordenada ‘Z’ se minimiza la Ley de Cobre Total
Media. Posteriormente se utilizan estos datos como iteración para buscar un punto
que minimice la Ley de Cobre Total Media aún más. Por lo que se toma el doble del
valor de tamaño de celda utilizado de manera que el mínimo se encuentre en el
centro del gráfico. Los valores usados para las coordenadas X e Y es 450m y para
la coordenada Z es de 300m. El gráfico obtenido es:
Ilustración 7: Tamaño de Celda v/s Ley Media de Cobre Total - Iteración 2. Fuente: Propia.
Distribución Estadística
Para el análisis de distribución estadística del CuT en las muestras
trabajadas, se realiza un desagrupamiento a partir del Método de las Celdas, estos
valores se comparan con la distribución que se tiene sin desagrupar.
16
Comparación entre las Variables Agrupadas y Desagrupadas
Se comparan los 2 casos en estudio, en lo cual se observa una diferencia
ínfima en las medias de cada uno, la cual es 0.0003. La ley más alta se presenta
cuando no se desagrupan los datos, esto se debe a que, al no tener la existencia
de las celdas, los sondajes presentan el mismo “peso” y como la mayor cantidad de
los sondajes se realizan en las zonas de más altas leyes, existe una mayor cantidad
de datos con estos valores, lo cual genera una sobreestimación de la ley media, es
por esto que se utiliza el método de las celdas, las cuales otorgan una importancia
mayor a los sondajes más aislados.
El grafico de histograma representa gráficamente las frecuencias de
ocurrencia del fenómeno en función del valor. En el caso de este estudio se utiliza
para observar la frecuencia de la variable de interés, en este caso la Ley de Cobre
total.
En primera instancia se realiza un histograma sin realizar un
Desagrupamiento y utilizando todo el rango de datos.
17
Si analizamos la muestra de datos, se tiene que hay un total de 3125
muestras correspondientes a la unidad geológica PRI, de los cuales un 99,7440%
no superan el 2% de CUT y un 99,2960% no superan el 1% de CUT.
Por lo anterior se entrega un histograma adecuando el rango a un valor
máximo de 1%, ya que la mayoría de los datos se encuentran en este rango.
18
Tabla 5: Medidas de Dispersión del CuT con y sin Desagrupamiento. Fuente: Propia.
Agrupados Desagrupados
Media 0.1380 0.1377
Desviación Estándar 0.2308 0.2004
Coeficiente de Variación 1.673% 1.455%
Distribución Espacial
Para poder realizar un análisis de la distribución espacial del CuT en la
campaña de sondajes estudiados, se utilizan distintas herramientas que ayudan a
comprobar los contactos que se originan entre las distintas unidades geológicas que
se presentan en las muestras, luego de esto se analiza las tendencias que podría
presentar el CuT, en las distintas unidades.
Unidades Geológicas.
A partir del Software ISATIS, se crea una nueva leyenda para poder visualizar
las unidades geológicas presentes en la malla de sondajes, para así poder obtener
una representación gráfica de cómo están distribuidas estas zonas en el terreno y
además la profundidad a la que se encuentran.
Ilustración 10: Visualización de las UGs en los Sondajes en Vista XZ & YZ. Fuente: Propia.
19
De la imagen anterior se puede observar que la unidad geológica Primaria se
encuentra al final de los sondajes, es decir, en la cota menor (3100 – 2900). El
contacto entre las unidades geológicas se aprecia con bastante claridad, puesto que
se observa que en las cotas superiores está el Estéril, luego se encuentran los
Óxidos, posterior a esto dependiendo del sondaje se encuentran los Súlfuros y
Primarios; esto no ocurre con los Mixtos, debido a que estos se encuentran sólo en
sectores puntuales de la malla de sondaje.
Análisis de Contacto
A continuación, se realiza un análisis en relación a cómo se comportan las
Leyes de Cobre Total de la unidad geológica “PRI” a medida que ésta se acerca al
contacto con otra unidad geológica (OXI, MIX & S), la finalidad de esto es poder
definir el tipo de contacto que se origina en función de los valores de la Ley que
presentan las distintas unidades.
Ilustración 11: Análisis de Contacto entre la Zona de Óxidos y Primarios. Fuente: Propia.
20
Ilustración 12: Análisis de Contacto entre la Zona de Primarios y Sulfuros. Fuente: Propia.
Por otro lado, de la gráfica anterior se desprende que no existe una tendencia
en ninguno de los casos en estudio respecto al aumento o disminución de la ley en
relación a la distancia de contacto; lo que si se observa es una clara diferencia entre
sus leyes, la cual es ∆ = 0,3247. En relación al contacto que se observa entre estas
unidades geológicas, este se puede clasificar como Contacto Errático.
Ilustración 13: Análisis de Contacto entre la Zona de Primarios y Mixtos. Fuente: Propia.
21
existente entre estas dos unidades es un Contacto Duro, pero al tener tan poca
información, ya que como se dijo anteriormente sólo un sondaje presenta este
contacto, no se puede hacer un análisis más exhaustivo de este.
Ilustración 14: Análisis de Contacto entre la Zona de Óxidos y Sulfuros. Fuente: Propia.
Ilustración 15: Análisis de Contacto entre la Zona de Mixtos y Sulfuros. Fuente: Propia.
22
Se observa en la gráfica superior que, desde los 50 metros al contacto, la
zona de Súlfuros tiene una clara tendencia a la disminución de sus leyes, caso
contrario ocurre con la zona de Mixtos, puestos que estos desde los 50 metro al
contacto, muestran una tendencia al aumento de sus leyes. En relación al contacto
existente entre estas dos unidades geológicas, este se considera cómo Contacto
Blando
Ilustración 16: Análisis de Contacto entre la Zona de Óxidos y Mixtos. Fuente: Propia.
23
Derivas
Las derivas se utilizan con la intención de evaluar el comportamiento en el
espacio del CuT, a partir de este análisis, se pueden detectar tendencias en el
incremento o disminución de la ley con respectos a las diferentes direcciones, a su
vez las derivas, permiten analizar la variabilidad que se presenta entre los datos
agrupados y los desagrupados. Con lo expuesto anteriormente y a partir de un
análisis se puede visualizar la estacionaridad de las unidades geológicas, es por
esto que a continuación, se adjuntan las derivas de la unidad geológica de interés
(Primarios).
Muestras Bloques
Ley Máxima [%] 0.275 0.350
Ley Mínima [%] 0.075 0.075
En cuanto a la deriva en el eje Y, las leyes más altas para las muestras y
bloques se encuentran entorno a la coordenada 700 y 850, las cuales poseen un
valor entre 0,16% a 0,17%. De esta manera se puede proponer que si existe
estacionaridad, debido a que ocurre lo mismo que en el caso X, puesto que la
variación de las leyes es baja, siendo ésta 0,07% aproximadamente. Por otro lado,
es importante destacar que la variable peso creada en esta deriva, no genera una
gran influencia, debido a que ambas gráficas poseen un comportamiento parecido.
Tabla 8: Ley Máxima y Mínima para Muestras y Bloques en la Deriva Y. Fuente: Propia.
Muestras Bloques
Ley Máxima [%] 0.160 0.170
Ley Mínima [%] 0.095 0. 095
Muestras Bloques
Ley Máxima [%] 0.190 0.190
Ley Mínima [%] 0.110 0. 090
25
Scatter
El Scatter o Nube de Datos, también permite visualizar el comportamiento de
las leyes en las distintas direcciones (X, Y & Z), pero la particularidad de este análisis
es que permite visualizar de forma sencilla los valores escapados “Outliers”. A
continuación, se adjuntan los scatters para cada eje en función del CuT, todo esto
respecto a la unidad geológica Primarios.
26
Ilustración 20: Scatter de CuT en el eje Z. Fuente: Propia
27
Conclusiones y Recomendaciones
28
Por otro lado, se puede concluir que, del análisis de distribución estadística
de la Ley de Cobre Total con respecto a la unidad geológica de los Primarios, las
medidas de dispersión de datos y posición de estos en el espacio, son los
parámetros más importantes a la hora de discernir sobre cual método de
desagrupación de datos es mejor y en que rango, cabe mencionar que en este
práctico sólo se utilizó el método de las celdas. Este análisis consta de distintos
gráficos y herramientas que permiten visualizar y entender de mejor manera la
forma en que los datos se agrupan. En este estudio se realizó un desagrupamiento
con tamaños de celdas de 224 [m] en los ejes X e Y; y 145 [m] en el eje Z, este
tamaño minimiza la Ley de Cobre Total, desviación estándar, coeficiente de
variación, entre otros parámetros. Por lo expuesto anteriormente se puede concluir
que el análisis realizado, permite cuantificar la disminución de la variabilidad en la
distribución estadística de las unidades geológicas.
En cuanto al análisis de distribución espacial, se puede concluir que el
software Geoinnova entrega las herramientas óptimas para poder verificar los
contactos existentes entre las distintas unidades geológicas, también a partir de este
software se pueden identificar los sectores con mayor concentración de sondajes,
además de la distribución de la ley con respecto a los ejes coordenados (Scatter),
pudiéndose visualizar de forma rápida y clara los valores escapados. En relación a
los Crossgam, este grafico es un cálculo de las leyes de la variable de cobre total
en torno al contacto que existe entre las unidades geológicas, por lo que al no haber
un comportamiento constante entre las unidades geológicas se puede concluir que
no existe una tendencia clara del tipo de contacto predominante entre estas, puesto
que se tienen diversos tipos de contactos siendo algunos erráticos incluso. Por otro
lado, es importante mencionar que a partir del contacto entre los Primarios y los
Mixtos no se puede concluir con total certeza el comportamiento de la ley de cobre
total media en torno a este caso, ya que la distribución espacial de estas unidades
geológicas en el yacimiento corresponde a distancias cercanas a 100 metros para
formar los pares de muestras a comparar.
Sobre el análisis de las derivas y los Scatters se puede concluir que es
posible validar el supuesto de estacionaridad en los datos con respecto a los ejes
coordenados, puesto que en el análisis las leyes de CuT presentaron tendencias al
aumento o decrecimiento respecto a la posición de estas en el espacio.
Por último, se ha logrado demostrar el supuesto de estacionaridad asumido
en nuestra unidad geológica (Primarios), mediante un análisis de distribución
estadística como uno de distribución espacial. Cabe mencionar que, a partir del
estudio espacial, se ha logrado visualizar la zona que presenta las mayores leyes
en el yacimiento.
29
Referencias
30
Anexos
Tabla A: Base de Datos del Yacimiento – 2 con la Unidad Geológica Primarios. Fuente:
Ayudantes.
31