Sei sulla pagina 1di 45

MÓDULO 1.1 - EXACTITUD Y PRECISIÓN EN EL LABORATORIO...................................................

2
INTRODUCCIÓN.................................................................................................................................................2
TEORÍA / ANTECEDENTES..................................................................................................................................2
CUANTIFICACIÓN DE ERRORES...............................................................................................................4
Un Breve Ejemplo de Promedio y Varianza.................................................................................................4
COMPARACIÓN DE DATOS DE DOS LABORATORIOS..........................................................................................6
EXACTITUD, PRECISIÓN Y CORRELACIÓN.........................................................................................................8
Sesgo Condicional......................................................................................................................................10
OBSERVACIONES..............................................................................................................................................12
MÓDULO 1.2 - ¿SON LOS DATOS REPRESENTATIVOS?.....................................................................13
INTRODUCCIÓN...............................................................................................................................................13
ANTECEDENTES / TEORÍA...............................................................................................................................13
Tamaño de Muestra....................................................................................................................................13
Ubicación de las Muestras.........................................................................................................................15
Manejando Datos Agrupados....................................................................................................................16
Polígonos de Influencia.............................................................................................................................16
El Método de Malla....................................................................................................................................18
Desagrupamiento de Celdas......................................................................................................................18
COMENTARIOS.................................................................................................................................................22
MÓDULO 1.3 - DISTRIBUCIONES ESTADÍSTICAS................................................................................25
INTRODUCCIÓN...............................................................................................................................................25
ANTECEDENTES / TEORÍA...............................................................................................................................25
Un Ejemplo Simple.....................................................................................................................................25
Un Ejemplo Más Complicado....................................................................................................................26
Un ejemplo considerando la disponibilidad del equipo............................................................................27
Datos Continuos.........................................................................................................................................28
La Distribución Normal.............................................................................................................................29
La Distribución Log-normal......................................................................................................................32
Ejemplos.....................................................................................................................................................34
COMENTARIOS.................................................................................................................................................35
MODULO 1.4 - ANÁLISIS DE DATOS.........................................................................................................36
INTRODUCCIÓN...............................................................................................................................................36
TEORÍA / ANTECEDENTES................................................................................................................................36
Gráficos Rectangulares..............................................................................................................................37
Gráficos Interactivos..................................................................................................................................39
Gráficos de Efecto Proporcional...............................................................................................................40
Gráficos de Probabilidad...........................................................................................................................42
COMENTARIOS.................................................................................................................................................43
___________________________________________Curso de Geoestadística para Minería

Módulo 1.1 - Exactitud y Precisión en el Laboratorio

Introducción

La geoestadística considera el estudio de la información distribuida en el aspecto espacial.


Para permitir una introducción a algunos conceptos básicos subyacentes a la geoestadística
sin la complejidad de la componente espacial, este primer módulo examinará los conceptos
estadísticos clásicos para la información no espacial. Como una ayuda para la introducción
de estos conceptos, se examinará una situación hipotética de someter una muestra a un
laboratorio y definir la calidad de los datos de ensayo resultantes. Los resultados
proporcionadas por un laboratorio siempre contienen algún elemento aleatorio. Esto es, en
incluso el material más cuidadosamente homogeneizado que es sub-muestreado y enviado
al laboratorio, existen siempre diferencias dentro de las muestras mismas, o en la
preparación de la muestra, o los procedimientos que hacen que cada sub-muestra tenga
diferentes leyes informadas. Las técnicas estadísticas básicas utilizadas para medir esta
aleatoriedad serán discutidas en este capitulo. En los siguientes módulos, las mediciones de
incertidumbre descritas aquí serán aplicadas a la información distribuida en el aspecto
espacial.

Teoría / Antecedentes

Como punto de partida, vamos a suponer que una muestra normal de ley conocida ha sido
preparada y será sub-muestreada. A través de una evaluación de los resultados de ensayo
de la sub-muestra se obtendrá alguna idea acerca de la calidad de los ensayos.
Específicamente, supongamos que 100 sub-muestras son entregadas y se requiere una
cuantificación de la ley de un elemento de interés específico. Este marco hipotético es, de
alguna forma, similar a un arquero apuntando a un blanco. La mayor diferencia es que el
arquero generalmente puede ver el centro del blanco. El arquero en nuestro caso, el
laboratorio, debe establecer correctamente la ubicación del centro del blanco y luego debe
alcanzarlo repetidas veces. Muchas cosas pueden suceder. En el mejor de los casos el
laboratorio establecerá su mira justo en el centro del blanco y lo alcanzará en todas las
oportunidades. Este laboratorio sería considerado perfecto ya que la ley conocida se
reproduciría en todos los intentos. Pero ya que nadie (y ciertamente ningún laboratorio) es
perfecto, este marco hipotético es muy poco probable.
¿Cómo pueden salir mal las cosas? Hay algunas formas. El arquero puede perder
consistentemente el centro del blanco por exactamente la misma cantidad. Esto sería
equivalente a un laboratorio informando exactamente la misma ley para cada una de las 100
sub-muestras entregadas; pero, desafortunadamente informando una ley diferente de la ley
conocida. Este tipo de diferencia es conocido como un error sistemático y puede ser
comparado con el caso de un arquero (debido quizás a un equipamiento deficiente o
anteojos poco apropiados) que consistentemente está fuera del blanco. Puede acertar en el
mismo lugar todo el tiempo, pero desafortunadamente el punto acertado no es el centro del
blanco.

Consideremos un segundo arquero (con el equipo apropiado - incluyendo los anteojos), este
arquero sabe donde se encuentra el centro del blanco, pero (debido a una mano temblorosa)

______________________________________________________________________ 2
___________________________________________Curso de Geoestadística para Minería

no parece acertarle. Como resultado, las flechas están a lo largo de todo el blanco en un
patrón al azar. Debido a que este arquero estaba apuntando al centro correcto del blanco y
sólo no pudo alcanzarlo debido a los movimientos al azar provenientes de su mano, el error
sistemático es mínimo. El tipo de error observado aquí es conocido como error aleatorio.
Un laboratorio con errores aleatorios (pero no sistemáticos) retornaría, en promedio,
valores centrados en el valor conocido. En muchos casos, los valores informados por un
laboratorio contienen tanto errores sistemáticos como errores aleatorios. Esto es
equivalente a un arquero con una ubicación deficiente y una mano temblorosa.

Exacto y Preciso Preciso pero no Exacto

Exacto pero no Preciso ni Exacto ni Preciso

Ejemplos de posibles tipos de errores

Típicamente, un laboratorio que proporciona resultados que contienen errores sistemáticos


mínimos o ningún error es considerado exacto. Un laboratorio que proporciona resultados
con un margen escaso de error aleatorio es considerado preciso. En todos los aspectos de
estimación de recursos, comenzando por los resultados de laboratorio y continuando hasta
la estimación de ley de bloques, queremos esforzarnos por lograr cero errores sistemáticos
(exactitud perfecta) y errores aleatorios que sean lo más pequeños posible (alta precisión).

______________________________________________________________________ 3
___________________________________________Curso de Geoestadística para Minería

Cuantificación de Errores

Cada resultado proporcionado por un laboratorio, o la ubicación de cada flecha en un


blanco, o el número que aparece después de tirar un par de dados, son todos ejemplos de
realizaciones de variables aleatorias. La propiedad más importante de definir es la
tendencia central de la variable aleatoria. Algunos términos que son utilizados a menudo
para describir la tendencia central son un valor promedio o medio, el valor más probable y
más común. El valor medio de la variable aleatoria es la medida más común de la
tendencia central. El valor medio es inferido de un promedio aritmético de las
realizaciones.

Una segunda propiedad a definir es la extensión de la variable aleatoria. La extensión


describe el grado de diferencia entre las diferentes realizaciones individuales y la medida de
tendencia central. Alternativamente, las medidas de extensión describen lo variables o
erráticas que pueden ser las realizaciones individuales. La medida de extensión más
común es la varianza.

Considerando nuevamente el ejemplo del tiro al blanco, podemos ver que la exactitud está
relacionada al valor medio y la precisión está relacionada a la varianza. El centro de un
patrón de flechas es el valor medio estimado y la diferencia entre la media estimada y la
media real o el centro del blanco es la exactitud. La varianza de las flechas individuales
alrededor de la media describe la extensión. La varianza es por lo tanto una medida de
precisión.

Si el valor promedio de los datos es diferente del valor medio de la variable aleatoria, los
datos son inexactos o SESGADOS y la magnitud de la diferencia describe la cantidad de
SESGO. Basándonos en estos términos, otra forma de describir las propiedades ideales de
un estimador de recursos es sin sesgo y con un mínimo de varianza.

Un Breve Ejemplo de Promedio y Varianza.


El cálculo del promedio y la varianza de un conjunto de realizaciones de una variable
aleatoria (en forma simplificada un conjunto de datos), se lleva a cabo de la siguiente
manera:

n
Promedio: z  z / n
i 1
i

En palabras esta fórmula se traduce cómo: tome todos los valores de los datos,
súmelos y divídalos por el número de datos.

n n
Varianza: s2   ( zi  z ) / n (o más fácil, cálculo) s   zi2 / n  z
2 2 2

i 1 i 1

______________________________________________________________________ 4
___________________________________________Curso de Geoestadística para Minería

En palabras esta fórmula se traduce cómo: tome cada valor de datos,


encuentre la diferencia entre el valor y el promedio, elevar al cuadrado la
diferencia, sumar las diferencias cuadradas y dividir por el número de datos.

Las cantidades relacionadas con el promedio y la varianza son la desviación estándar (raíz
cuadrada de la varianza) y el coeficiente de variación o desviación estándar relativa
(desviación estándar dividida por el promedio). La desviación estándar y el promedio
tienen las mismas unidades de medición (por ejemplo % o g/t) mientras que el coeficiente
de variación no tiene unidad.

Como un ejemplo del cálculo del promedio y la varianza, supongamos que una muestra fue
homogeneizada y dividida en 10 sub-muestras representativas y que todas son entregadas al
mismo laboratorio. Los valores informados por el laboratorio hipotético son los siguientes:
3, 5, 4, 5, 7, 6, 5, 6, 4, 5. Para obtener una mejor idea de la información entregada por los
datos, estos puede ser escritos nuevamente.
5
5
456
34567

Al inspeccionar esto, se puede notar que la tendencia central de este pequeño conjunto de
datos es 5 y, en realidad, el promedio de estos datos es 5. Observando nuevamente los
datos, podemos ver nuevamente el concepto de extensión de los datos. Los valores iguales
a 5 no tienen ninguna contribución a la extensión ya que ellos son iguales al promedio (sí
todos los 10 valores fuesen igual a 5, la extensión sería igual a cero). El par de valores 4 y
6 contribuyen a la extensión y también lo hacen los valores 3 y 7. Al encontrarse más
alejados del centro, la contribución de 3 y 7 es mayor. Por lo tanto una medida razonable
de extensión debe considerar la distancia absoluta desde el centro de los datos y debe
aumentar al aumentar la distancia desde el centro.

Este es el tipo de lógica que se encuentra en el cálculo de la varianza. Cada valor de dato
es restado del promedio y esta desviación es elevada al cuadrado. Las desviaciones al
cuadrado son entonces promediadas para formar la varianza. Las muestras individuales
pueden tener contribuciones significativas a la varianza. Al aumentar la magnitud de la
desviación, la contribución a la varianza aumenta rápidamente porque la desviación es
cuadratica. Como resultado, los valores extremos (por ejemplo, si el laboratorio devolvió 0
para una muestra, o lo más probable, si uno de los resultados fue ingresado erróneamente
como 0) pueden tener irracionalmente grandes impactos en la varianza. El manejo de
valores extremos o aislados es por lo tanto muy importante al evaluar correctamente la
varianza de un conjunto de datos.

Para el pequeño conjunto de datos considerado aquí, la varianza es la siguiente:

______________________________________________________________________ 5
___________________________________________Curso de Geoestadística para Minería

_______________________________________________________________________

Valor de Desviación Desviación


los Datos ( zi  z ) al Cuadrado
(z i )
3 -2 4
5 0 0
4 -1 1
5 0 0
7 2 4
6 1 1
5 0 0
6 1 1
4 -1 1
5 0 0
Suma 0 12

Varianza = s2 = (12)/10 = 1.2


Desviación Estándar = s  1.2 = 1.1
Coeficiente de Variación = s / z = 1.1/5 = 0.22 ó 22 % (esto es muy alto e indica una
preparación de muestra deficiente o un desempeño deficiente en el laboratorio)

Comparación de Datos de Dos Laboratorios


A menudo los estándares específicos del depósito no se encuentran disponibles. En tales
casos, un procedimiento de control de calidad común es el de homogeneizar y dividir una
muestra y luego enviar las partes divididas a diferentes laboratorios. Si la división es
preparada en la forma apropiada, cada par de laboratorios debería esencialmente estar
midiendo el mismo material. Una comparación de los ensayos obtenidos por ambos
laboratorios puede ser utilizada para determinar si pudiese existir algún sesgo entre los dos
laboratorios. No es posible determinar que laboratorio se encuentra en lo correcto, pero tal
comparación puede ser utilizada para determinar la existencia de algún problema con la
calidad del ensayo. Ya que los valores correctos son desconocidos, el sesgo real no puede
ser determinado, pero una idea del sesgo puede ser obtenida a través de una campaña
“Round Robin” en donde las pulpas son enviadas a varios laboratorios de mucho prestigio y
la ley promedio obtenida por todos los laboratorios es considerada como la “verdadera” ley
de la muestra.

En un caso en donde una división es enviada a dos laboratorios, se obtienen dos resultados
por cada muestra. Si se prepara un plano bidimensional en donde las resultados
proporcionadas por el laboratorio 1 están trazadas sobre el eje X y las resultados
proporcionadas por el laboratorio 2 se encuentran presentadas sobre el eje Y, emerge un
patrón de puntos conocido como un diagrama de dispersión. El diagrama de dispersión
proporciona una representación ilustrada de una distribución bi-variada de las dos variables
aleatorias (valores de ensayo del laboratorio 1 y laboratorio 2). La distribución bi-

______________________________________________________________________ 6
___________________________________________Curso de Geoestadística para Minería

variada describe la relación entre dos variables. En el caso de que las dos variables estén
relacionadas, conociendo el valor de una de las variables se reduce el margen de los
posibles valores para la segunda variable. Cuando dos variables se encuentran relacionadas
en esta manera, se dice que están correlacionadas.

Al aumentar la potencia de la correlación entre las dos variables, la información sobre el


valor de una variable proporciona más información sobre el valor de la segunda variable.
La potencia de la correlación es generalmente medida por el coeficiente de la correlación
lineal. El coeficiente de la correlación fluctúa desde 0, en el caso en que no existe una
relación lineal entre las dos variables, 1.0, en el caso en que existe una correlación lineal
perfecta entre las variables (conociendo el valor de una variable se define el valor de la
otra).

El coeficiente de correlación lineal es calculado de acuerdo a lo siguiente:

n
r(  ( x  m )( y  m )) / (n  s
i 1
i x i y x  sy )

donde: xi e yi son los dos valores para la muestra ith


mx es el promedio de los valores x
my es el promedio de los valores y
sx es la desviación estándar de los valores x
sy es la desviación estándar de los valores y
n es el número de valores

Los ejemplos de los diagramas de dispersión para los diferentes valores del coeficiente de
correlación se muestran en la siguiente figura. Los valores de los datos trazados sobre cada
eje tiene una varianza y promedio idénticos. Solamente el coeficiente de correlación
cambia. Fíjense que la línea más adecuada mostrada para cada gráfico (la línea de
regresión lineal) se comienza a aplanar a medida que el coeficiente disminuye. Ya que el
promedio y la varianza de estos conjuntos de datos son idénticos, la pendiente de la línea de
regresión es igual a r. Si la correlación fuese perfecta la pendiente sería 1 y todos los
puntos caerían sobre la línea Y=X. Cuando la correlación es 0, la línea de regresión es
perfectamente horizontal indicando que el valor observado de X no nos dice nada acerca de
los posibles valores de Y. En este caso siempre hay una completa falta de correlación entre
las variables y la mejor conjetura del valor de Y que podemos obtener es el promedio de
todos los valores X. En los próximos modelos, esta falta de correlación (en espacio) será
descrita como un efecto de pepita puro y se demostrará que la mejor estimación de una ley
(bajo estas circunstancias) es un simple promedio de los datos sin considerar la ubicación
de los datos.

______________________________________________________________________ 7
___________________________________________Curso de Geoestadística para Minería

Correlation Coefficient (r) = 0.9 Correlation Coefficient (r) = 0.5


2.0 2.0

1.5 1.5

1.0 1.0
Y

Y
0.5 0.5

0.0 0.0
0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0
X X

Correlation Coefficient (r) = 0.7 Correlation Coefficient (r) = 0.3


2.0 2.0

1.5 1.5

1.0 1.0
Y

Y
0.5 0.5

0.0 0.0
0.0 0.5 1.0 1.5 2.0 0.0 0.5 1.0 1.5 2.0
X X

Exactitud, Precisión y Correlación


El diagrama de dispersión proporciona una representación ilustrada tanto de las relaciones
entre dos datos y, en algunos casos donde una estimación es comparada con un valor
conocido, el diagrama de dispersión proporciona información tanto de la exactitud como de
la precisión. Consideremos un caso en donde los estándares se encuentren disponibles en
cierto margen de leyes o, lo más probable, una comparación de la ley de bloque estimada
con la ley conocida según lo definido por el muestreo de pozos de tiro. Una línea de 45°
(equivalente a Y=X) puede ser dibujada en el diagrama de dispersión para demostrar el
lugar en donde caerían los puntos de los datos si el estimador o el laboratorio fuesen
perfectos y siempre entregasen el valor correcto. Asumiendo que las cosas no son
perfectas, se pueden ver dos tipos de errores. Si los puntos caen a lo largo de una línea
diferente a la línea de 45°, entonces existe un sesgo o equivalentemente un problema de
exactitud. El ancho de la dispersión de los puntos representa la variabilidad de los datos y
va unido a la precisión del estimador o el laboratorio.

Existe un número de métodos para calcular la precisión representada por los datos bi-
variados. Todos estos métodos tienen una fuerte asociación con la correlación ya que
cuando la correlación aumenta, la dispersión disminuye y la precisión mejora. Un método
de medición de correlación o precisión análogo a la varianza descrito para un dato
dimensional puede ser creado suponiendo primero que el diagrama de dispersión estuviese
centrado a alrededor de la línea de 45° representando al estimador perfecto. La distancia
perpendicular desde cada punto del diagrama de dispersión hasta la línea desde cada punto
del diagrama de dispersión hasta la línea de 45° representa entonces la desviación desde la
tendencia central. La varianza de los puntos cerca de la línea pueden ser calculados
utilizando el mismo método utilizado para los datos uni-variables. En la trigonometría
(véase ilustración), la desviación para un punto específico sobre el gráfico desde la línea

______________________________________________________________________ 8
___________________________________________Curso de Geoestadística para Minería

Y=X es igual a 2 (yi - xi)/2; en donde yi y xi son los valores


de los datos para el punto. Al aplicar la definición de la varianza, las desviaciones son
elevadas al cuadrado y promediadas. La medida de incertidumbre derivada en esta forma
es expresada como:

 = ( (yi - xi)2)/2n

donde () es la medida de precisión o correlación


yi y xi son un par de datos específicos
n es el número total de datos

En las próximas secciones esta medida de correlación () será introducida nuevamente
como la función de variograma y será utilizada para medir la correlación espacial de
medición.

EJEMPLO DE DESVIACION DE Y = X
8

6
(x i ,y i )
5 De
vi a
tio
n
4 Length = x i -y i
Y

3 45°

0
0 1 2 3 4 5 6 7 8
X

Los pares de valores del gráfico anterior pueden ser utilizados para ilustrar los métodos de
estimación de correlación. Los datos y sus estadísticas de resumen son los siguientes:

______________________________________________________________________ 9
___________________________________________Curso de Geoestadística para Minería

x Y x-mx y-my (x-mx)• (x-y)2


(y-my)

1 2 -2.9 -1.9 5.51 1


3 2 -0.9 -1.9 1.71 1
5 7 1.1 3.1 3.41 4
7 5 3.1 1.1 3.41 4
4 2 0.1 -1.9 -0.19 4
3 5 -0.9 1.1 -0.99 4
2 5 -1.9 1.1 -2.09 9
6 3 2.1 -0.9 -1.89 9
3 2 -0.9 -1.9 1.71 1
5 6 1.1 2.1 2.31 1
Suma 12.9 40

mx = 3.9
my= 3.9
sx = 1.75
sy = 1.81
n = 10

De acuerdo a esta información el coeficiente de correlación y el valor del variograma puede


ser calculado como:
r = 12.9/(10)(1.75)(1.81) = 0.41
 = 40/(2)(10) = 2.0
Nótese que al disminuir la correlación el coeficiente de correlación también disminuye. El
valor del variograma, sin embargo, aumenta. El coeficiente de correlación no tiene unidad.
Una medida de correlación que es similar al coeficiente de correlación pero expresada en
las mismas unidades de la varianza o variograma es conocida como la co-varianza. La co-
varianza (esencialmente el numerador en la expresión para el coeficiente de correlación)
será analizada en más detalle en la sección sobre correlación espacial.

Sesgo Condicional
A menudo, los puntos dentro de un diagrama de dispersión muestran un patrón que es una
función de la ley. Esto se ve comúnmente en los estimadores. Al comparar las
estimaciones de ley de bloque con los valores conocidos de los bloques, las leyes reales de
los bloques de menor ley son a menudo subestimados (la ley real del bloque es mayor que
la ley estimada) y los bloques de alta ley son a menudo sobrestimados (la ley real del
bloque es menor que la ley estimada). Este tipo de patrón es conocido como SESGO
CONDICIONAL; lo que significa que el sesgo no es consistente o constante. En este
caso, el sesgo es una función de la (o condicional a la) ley. Debido a que el sesgo
condicional es una función de la ley y puede ser positivo o negativo, no es inusual para un
estimador no sesgado global (sin sesgo sobre el margen de ley completo), encontrarse
condicionalmente sesgado.

______________________________________________________________________ 10
___________________________________________Curso de Geoestadística para Minería

Para estimar la cantidad de sesgo condicional, el valor promedio de la variable trazada


sobre el eje Y puede ser determinado para varios intervalos consecutivos de ley del eje X.
Al conectar los puntos representando las leyes promedio de intervalos de ley y al comparar
la línea resultante con la línea de 45 grados que define a un estimador perfecto se muestra
la magnitud del sesgo condicional. La siguiente figura representa los resultados de
estimación de ley de bloque para dos técnicas diferentes de “kriging”. Por lo general
ambos estimadores determinarán esencialmente la misma ley. Debido a que cada
estimador se encuentra globalmente no sesgado, este resultado es esperado. A pesar de la
falta de sesgo global, existe un sesgo condicional significativo entre los estimadores. La
importancia del sesgo condicional es que siempre que se imponga una ley de corte el
margen de ley completo no es ponderado. Una vez que la ley de corte se aplica, el sesgo
condicional se convierte en algo muy importante. Un estimador sesgado condicionalmente
no puede estimar correctamente la ley o tonelaje real que será extraída. En las próximas
secciones, los asuntos asociados con estimadores sesgados condicionalmente serán
discutidos con más detalle.

Comparación de Estimadores
24

20 Average Std. Dev.


OK 2.7 1.9
IK 2.8 2.2

16
Ordinary Kriging (g/t)

Magnitude of Conditional Bias

12

8
Conditional Average Curve

0
0 4 8 12 16 20 24
Conditional Kriging Estimate (g/t)

Observaciones

El asunto de la incertidumbre debido al muestreo o ensayo es un campo mucho más


extendido y un tema más amplio de lo que se pueda discutir aquí. Existe un cierto número
de factores que

______________________________________________________________________ 11
___________________________________________Curso de Geoestadística para Minería

contribuyen a la variabilidad observada en un conjunto de datos. Además del error de


ensayo que fue discutido aquí, existe también un error de preparación de muestras, error de
muestreo y, algo muy importante, la variabilidad de las leyes que se encuentran siendo
estudiadas. En los depósitos donde el elemento de interés es encontrado en la ley muy alta
pero en grupos volumétricamente pequeños (por ejemplo las pepitas de oro) las diferencias
encontradas en las leyes de cada mitad de testigo dividido pueden ser significativamente
diferentes. Este tipo de variabilidad en conjunto con todos los otros tipos de variabilidad
discutidos aquí es capturado por la geoestatística dentro del “efecto de pepita ” que será
descrito en secciones posteriores.

______________________________________________________________________ 12
___________________________________________Curso de Geoestadística para Minería

Módulo 1.2 - ¿Son los Datos Representativos?

Introducción

La mayoría de las decisiones realizadas al determinar si se invierte en un proyecto minero o


no, están basadas en interpretaciones hechas a partir de un conjunto de datos. En este
módulo, se considerarán asuntos como “¿Qué significan estos datos y en que se basan las
decisiones de inversiones?”. Cada muestra adquirida representa un volumen específico del
depósito. De los pequeños volúmenes de muestras recolectadas, se infiere con respecto a
las toneladas y la ley que podrían ser extraídas y las potenciales ganancias de la extracción.
Debido a las extrapolaciones que se harán y las subsecuentes consecuencias económicas de
las decisiones basadas en estas extrapolaciones, es de extrema importancia que los datos
sean representativos del depósito y que las incertidumbres controlables, causadas por
diferentes volúmenes de muestreo o sesgos de la perforación preferencial, no impacten la
estimación del recurso.

En este módulo, los impactos de los diferentes volúmenes de muestras y de las


perforaciones espaciadas en forma irregular sobre la estadística (promedio y varianza)
presentados en el primer módulo serán discutidos y se presentarán métodos para corregir
los efectos de una escasa representatividad de muestras.

Antecedentes / Teoría

Tamaño de Muestra
Una vez que una muestra es preparada en la forma apropiada, homogeneizada y reducida y
el laboratorio ejecuta correctamente un ensayo, el valor del ensayo representa la ley
promedio del volumen de la muestra. El mismo volumen de muestra podría haber sido sub-
muestreado y ensayado para determinar las leyes representativas de las sub-muestras.
Debido a una variedad de razones incluyendo la variabilidad inherente dentro del volumen
de muestras original, las variaciones en el tamaño de partícula, los procedimientos de sub-
muestreo y los ensayos, los valores de ensayo de las sub-muestras no serán idénticos y la
varianza de los ensayos de sub-muestras será mayor que cero. Esta varianza vista en los
ensayos de las sub-muestras se pierde completamente al examinar solamente la ley de
muestra que representa al volumen completo. Sin embargo, la ley informada de la muestra
debe ser idéntica a la ley promedio de las sub-muestras. Dentro del volumen de muestra
original, las leyes de sub-muestras contribuyen a la ley promedio pero debido a que sólo
una sola muestra homogeneizada es enviada para ensayo, las sub-muestras homogeneizadas
no pueden contribuir a la variabilidad.

Como un resultado de la promediación de la ley que ocurre dentro de un volumen es muy


razonable que la variabilidad disminuya al aumentar el volumen de la muestra. Como un

______________________________________________________________________ 13
___________________________________________Curso de Geoestadística para Minería

ejemplo, considere los siguientes ensayos hipotéticos de un testigo con una perforación de 1
metro desde un solo sondaje. Primero, la varianza de los ensayos es calculada sobre los
largos de muestra de 1 metro. Luego las muestras son combinadas en largos de 2, 4 y 8
metros y la varianza es calculada nuevamente. Nótese que no importa cómo estén
combinados los datos, la ley promedio no cambia.
_
1.0 0.9 0.7 1.3 1.2 0.6 2.0 0.8 1.4 1.1 0.3 1.2 1.3 0.5 1.1 0.9 :1 m largo, s 2 = 0.166, x = 1.02
\ / \ / \ / \ / \ / \ / \ / \ /
_
0.95 1.0 0.9 1.4 1.25 0.75 0.9 1.0 :2 m largo, s2 = 0.043, x = 1.02
\ / \ / \ / \ /
_
0.975 1.15 1.0 0.95 :4 m largo, s2 = 0.008, x = 1.02
\ / \ /
_
1.06 0.975 :8 m largo, s2 = 0.004, x = 1.02

El cambio en varianza con el tamaño de muestra que se ilustra aquí es comúnmente


denominado el efecto de soporte. Según se muestra por medio del cambio en la varianza
con tamaño de muestra, las muestras definidas sobre diferentes soportes no son
comparables. Cada vez que las estadísticas son calculadas, las muestras deben tener ya sea
el mismo soporte o/tamaño de muestra en caso contrario, se deben tomar medidas para
corregir diferencia en soporte. Sin una corrección para el soporte de las muestras, las
estadísticas resultarán sesgadas.

Existen dos métodos para tomar en cuenta del efecto de soporte al calcular las estadísticas.
Las muestras pueden ser ponderadas por el largo de la muestra en todos los cálculos o las
muestras pueden ser puestas todas bajo las mismas condiciones de largo compositando
sobre largos iguales. La compositacion es la práctica más común ya que es muy tedioso
considerar el factor de pesaje a través de todos los cálculos, además, la forma de “kriging”
encontrada en paquetes de software comúnmente disponibles supone muestras de soporte
constante. Por estas razones, se recomienda muy especialmente que los ensayos sean
compositados sobre largos iguales antes de cualquier estudio estadístico sobre la estimación
de recursos.

El efecto de soporte visto con las muestras también se aplica a la calidad de las
estimaciones de recursos. Como se ha demostrado, al aumentar el volumen la variabilidad
disminuye. Por lo tanto la variabilidad de las leyes mensuales en una operación es mucho
menor que la variabilidad de las leyes diarias en la misma operación; por lo tanto, de ello se
deriva que la estimación de las leyes mensuales es mucho más fácil que la estimación de las
leyes diarias. El concepto de una relación entre el volumen y la varianza es uno de los más
importantes en geoestadística por lo tanto este tema será revisado nuevamente en los
futuros módulos.

Ubicación de las Muestras

______________________________________________________________________ 14
___________________________________________Curso de Geoestadística para Minería

Al calcular la ley promedio de un conjunto de datos, existe un peso igual aplicado a cada uno de los datos. Al
calcular el promedio, los datos son meramente sumados y luego divididos por el número de datos. Esto
equivale a multiplicar cada ley de muestra por un peso igual a 1 dividido por el número de datos (1/n) y luego
sumar el peso por el producto de la ley. Al calcular este tipo de promedio simple, se supone implícitamente
que cada muestra representa un volumen igual del depósito. Cuando esta suposición es incorrecta, las
estadísticas calculadas estarán sesgadas y no representarán correctamente el depósito.

Siguiendo la mayoría de los programas de perforación, las muestras no representan volúmenes iguales. Un
ejemplo claro de esto es un depósito perforado en dos mallas diferentes. Una malla podría, por ejemplo, ser la
malla de exploración inicial. En una segunda fase de la perforación, siguiendo a una evaluación de los datos,
una malla más densa podría ser perforada sobre una porción de ley más alta del depósito en un esfuerzo para
mejorar la calidad del deposito. El perforar en una malla más densa dispone más perforaciones en una
porción particular del depósito. Debido a que hay mas perforaciones en esta área, cada perforación en el área
densamente perforada representa un volumen menor que las perforaciones sobre la malla inicial. Si se lleva a
cabo un promedio simple de igual peso, las muestras de la porción de alta ley densamente perforada del
depósito recibirá un peso mayor que su volumen de influencia. Como resultado, la ley promedio de la
porción densamente perforada del depósito se encontrará sobre-representada en el cálculo de la ley promedio
del depósito completo y la ley estimada del depósito será mayor que la ley promedio real del depósito. Para
ilustrar el problema consideremos el siguiente programa simple de perforación en dos etapas.

Resultados de Perforación - Etapa 1


900
L o c a l G r id N o r th in g ( m )

.82 .38 .49 .95


800

700
.62 .13 .87 .16
600

500
.50 1.36 .35 .21
400

300
.11 .18 .44 .37
200

100
100 200 300 400 500 600 700 800 900
Local Grid Easting (m)

Resultados de Perforación - Etapa 2


900
L o c a l G r id N o r th in g ( m )

.82 .38 .49 .95


800

700
.62 .13 .87 .16
600

500 .92 1.07


.50 1.36 .35 .21
400 .84 1.61
300
.11 .18 .44 .37
200

100
100 200 300 400 500 600 700 800 900
Local Grid Easting (m)

Como se muestra en las dos ilustraciones, el primer programa de perforación identificó una ley irregularmente
alta en la ubicación 400 E; 400 N. Para confirmar los resultados del primer programa y para definir mejor el
área anómala, se completó una segunda fase limitada de perforación consistente en 4 perforaciones agrupadas
alrededor del valor anómalo. Según se muestra, la segunda fase de la perforación también encontró leyes
elevadas.

Las leyes promedio sin ponderar, para todas las perforaciones, en la completación del primer y segundo
programa de perforación son 0,50% y 0,62% respectivamente. Aparentemente, el hacer 4 perforaciones
adicionales ha elevado la ley promedio de todo el depósito en 25%. En la realidad, la porción densamente
perforada ( y de ley superior) del depósito se encuentra sobre-representada en el cálculo de la ley promedio y
proporciona una impresión excesivamente optimista de la ley general del depósito. Un promedio apropiado,
ponderado espacialmente, de estos datos proporciona un promedio estimado de 0,50% (véase los siguientes

______________________________________________________________________ 15
___________________________________________Curso de Geoestadística para Minería

párrafos) que es idéntico a la ley promedio estimada del primer programa de perforación. Como lo demuestra
este pequeño ejemplo, un ascenso artificial de la ley de un depósito puede ocurrir fácilmente debido al
agrupamiento de muestras en áreas de alta ley. Para evitar las consecuencias económicas de una
tergiversación de la ley del depósito, se requiere de una ponderación espacial para considerar la influencia de
un dato en la ley promedio general de acuerdo con el volumen de influencia de cada muestra. Existen muchos
métodos para calcular los ponderadores apropiados y representativos de las muestras.

Manejando Datos Agrupados


Hay una forma muy simple de manejar datos agrupados en los casos tales como el que
acaba de ser discutido. Cuando las muestras son recolectadas primitivamente sobre una
malla regular con sólo unas pocas agrupaciones adicionales, las agrupaciones pueden ser
extraídas y se puede calcular un promedio utilizando sólo los datos regulares de la malla.
En el ejemplo anterior, este procedimiento significa utilizar solamente los datos de la Etapa
1 para el cálculo de la estadística. Este procedimiento simple tiene la desventaja obvia de
los datos descartados. También, muchos conjuntos de datos no incluyen una malla regular
fácilmente identificable. Por esta razón, este método es utilizado solamente en los casos
más simples. En los casos más difíciles, se requiere uno de los siguientes métodos.

Polígonos de Influencia
En dos dimensiones, la técnica de los polígonos de influencia ha sido utilizada por muchos
años para definir el peso espacial de las muestras. Para aplicar esta técnica, las líneas son
dibujadas conectando una perforación con todas las perforaciones vecinas. Los bisectores
perpendiculares son trazados a través de cada línea de conexión. Las líneas bisectoras
forman polígonos alrededor de cada perforación (véase la siguiente ilustración). Los
bordes de los polígonos se encuentran ubicados a medio camino entre cada par de muestras
vecinas para que el polígono defina su extensión de influencia de la muestra. El área del
polígono de influencia dividido por el área total del depósito determina el peso aplicado a
cada muestra. Las muestras al borde del depósito o del patrón de perforación requieren
un tratamiento especial. Debido a que no hay datos vecinos al borde del depósito, los
polígonos de influencia no pueden ser definidos siguiendo el método anteriormente
descrito. Para las perforaciones fronterizas el polígono es típicamente cerrado utilizando un
círculo con un radio igual a un medio hasta tres cuartos del espaciamiento de perforación
promedio.

______________________________________________________________________ 16
___________________________________________Curso de Geoestadística para Minería

Construcción de un Polígono de Influencia

Sample Locations Step 1

Line Segments
Dril hole Collars Connecting
Dril hole Collars

Step 2 Step 3
Perpendic ular Bis ectors of
the Line Segments

Polygon of
Influence

Una vez que los polígonos son definidos para cada muestra, la ley de depósito promedio es
calculada utilizando el área de cada polígono para definir el peso a aplicar para cada dato
utilizando la siguiente fórmula.

n
z   ( Ai / At )  zi
i 1

donde: Ai está el área de influencia asociada con el dato ith


At es el área total del depósito
zi es la ley del dato ith

El enfoque del polígono de influencia funciona bastante bien en tres dimensiones cuando
todas las perforaciones son verticales; sin embargo, cuando se utilizan las perforaciones en
ángulo o la deflexión es significativa, los polígonos de influencia (para cada perforación)
cambian de nivel a nivel del depósito. El método por lo tanto se vuelve algo tedioso y
difícil de implementar en tres dimensiones.

El Método de Malla
El método de malla es un método que alcanza la misma meta que los polígonos de
influencia pero que puede ser fácilmente aplicado en tres dimensiones. En este enfoque, se
crea una malla de puntos tridimensional del tamaño adecuado (típicamente de un cuarto a
un octavo de espaciado de perforación primario) que cubre el depósito. Para cada punto de
la malla, se encuentra la muestra más cercana y la ley de la muestra es asignada al punto de

______________________________________________________________________ 17
___________________________________________Curso de Geoestadística para Minería

la malla. Debido a que los puntos de la malla están, por definición, regularmente
espaciados, ellos representan volúmenes iguales del depósito. El promedio o cualquier otra
estadística calculada sobre los puntos de la malla es por lo tanto espacialmente
representativo del depósito y las estadísticas calculadas sobre esos datos no son sesgadas.
Para los grandes depósitos este enfoque puede ser computacionalmente intensivo, sin
embargo los PCs disponibles hoy en día pueden fácilmente manejar este problema.

El método de malla puede también ser utilizado para distribuir variables categóricas (por
ejemplo la litología, la alteración, la mineralogía, etc.) a través del depósito sin sesgo
mientras se le es fiel a los datos. La alteración o litología específica para un punto de la
malla es simplemente tomada de la muestra más cercana. El método de búsqueda utilizado
para asignar los valores a los puntos de la malla no necesita ser círcular. Si se sabe que las
unidades geológicas siguen una orientación particular o las unidades tienden a seguir una
forma en particular entonces la dirección y la orientación de búsqueda pueden ser
cambiadas para acoger esta información. A pesar de estas mejoras en el procedimiento,
generalmente se prefiere utilizar la interpretación espacial del geólogo para estas variables.
Por esta razón, este enfoque es utilizado solamente cuando las interpretaciones geológicas
no se encuentran disponibles o cuando sólo se requiere un primer examen visual rápido al
depósito.

Desagrupamiento de Celdas
Otro enfoque al cálculo de pesos que definirán un promedio representativo espacialmente
es la técnica de “desagrupamiento” de celdas. Con esta técnica, una red de celdas
regulares es localizada sobre el depósito y se cuenta el número de muestras ubicado dentro
de cada celda. Ya que las celdas en áreas densamente muestreadas contendrán más
muestras, el número de muestras contadas por celdas se encontrará inversamente
relacionado a la densidad de las muestras. Un factor de ponderación de uno dividido por el
número de conteos por celdas, es por lo tanto, una simple manera de eliminar los efectos de
densidades de datos desiguales. Debido a que los ponderadores deben sumar uno para
evitar el sesgo de las estadísticas, el inverso de los conteos por celdas debe ser
estandarizado para obtener el peso real. La formula de ponderación es:

n
wi  (1 / nci ) / ( 1 / nci )
i 1
donde: nci representa el número de datos ubicados en las celdas
conteniendo los datos ith

______________________________________________________________________ 18
___________________________________________Curso de Geoestadística para Minería

wi es el peso aplicado al dato ith al calcular el promedio


n
ponderado nótese que  1 / nc
i 1
i es igual al número total de celdas
que contienen datos

Las celdas desagrupadoras pueden tener cualquier tamaño, pueden ser rectangulares o
cuadradas, y pueden ser bidimensionales o tridimensionales. Es difícil establecer reglas
especificando el tamaño de celdas óptimo, pero es muy cierto que la eficiencia del
desagrupamiento es una función del tamaño de las celdas. A menudo se utiliza un
procedimiento de tanteo para encontrar el mejor tamaño y forma. Al seleccionar el margen
de los posibles tamaños existen unas pocas reglas que pueden ayudar. Primero, si el
tamaño de las celdas es demasiado grande o demasiado pequeño no habrá ningún
desagrupamiento. Por ejemplo, si el tamaño de las celdas fuese del mismo tamaño del
depósito, todas las muestras caerían dentro de las celdas y todos los datos recibirían pesos
iguales. En forma similar, si el tamaño de celdas fuese más pequeño que el espaciamiento
de las perforaciones, la mayoría de las celdas estarían vacías y las celdas restantes
contendrían una sola muestra. Nuevamente todos los datos recibirían pesos iguales y no
habría ningún desagrupamiento.

El mejor tamaño de celdas para el desagrupamiento es claramente algo entre estos dos
extremos. Si se sabe que los datos están agrupados en porciones de alta ley del depósito,
entonces es razonable suponer que el tamaño de celdas de desagrupamiento más eficiente
proporcionaría la ley promedio más baja para el depósito. La lógica que subyace a esta
afirmación es que el agrupamiento en las zonas de leyes altas llevan a una sobre-
representación de estas zonas al calcular la ley promedio lo cual hace que la ley promedio
calculada exceda la verdadera ley promedio del depósito. Como se ha descrito
anteriormente, cuando las celdas son demasiado pequeñas o grandes el desagrupamiento es
mínimo y el promedio será sobre estimado. Para los tamaños de celdas entre los dos
extremos, el desagrupamiento disminuye el impacto de las diferentes densidades de
muestras en las estadísticas y las leyes promedios decaerán. Un gráfico de ley promedio
versus el tamaño de celdas puede identificar el tamaño de celdas que proporciona la ley
mínima. Este procedimiento de tanteo define un tamaño de celdas “óptimo”. Un ejemplo
de un gráfico de ley promedio vs el tamaño de celdas es presentado en la siguiente
aplicación. La práctica ha demostrado que el mejor tamaño de celdas tiende a ser igual al
tamaño de los agrupamientos (si se encuentran agrupaciones discretas) o el tamaño del
programa de perforación original en el caso de que se haya desarrollado un programa de
perforación de relleno simple.

Aplicaciones

______________________________________________________________________ 19
___________________________________________Curso de Geoestadística para Minería

Cómo un ejemplo de aplicación de las variadas técnicas para calcular la ley


promedio no sesgada de un conjunto de datos considere el siguiente ejemplo de
resultados de perforaciones. Cada uno de los puntos en la figura representa el
collar de una perforación. La ley promedio simple de todos los datos de la
campaña es de 0.70%. Los símbolos cuadrados son utilizados para apuntar a las
perforaciones que se encuentran ubicadas sobre una malla regular de 200 metros.
A pesar de que este es un pequeño conjunto de datos, se encuentran espaciados
regularmente y por lo Ubicaciones de Datos
tanto no hay sesgo. 1000
El tomar la ley
promedio de
muestras de 800

solamente las
perforaciones sobre 600
la malla de 200
metros, proporciona
400
una ley promedio
estimado de 0.52%.
Ignorando el 200

agrupamiento de los Drillhole Collar


datos y tomando un 0
Drillhole on Grid
Grade Above 1%
promedio directo de
0 200 400 600 800 1000
los datos, por lo
tanto, aumenta artificialmente la ley promedio del depósito en 35%. La razón de
la diferencia en ley es que la porción de ley alta del depósito (mostrada en la
ilustración como sondajes conteniendo más de 1%) ha sido sobre muestreada por
un agrupamiento de perforaciones en la vecindad de 400E, 400N. Una
promediación igual de leyes sobre este patrón de muestreo proporciona una
estimación irrealmente alta de la ley promedio.

Para eliminar los efectos de las perforaciones agrupadas, se utilizará primero el


método de Average Grade By Cell Size
desagrupamiento de 0.75
celdas. Como se ha
0.70
discutido, el tamaño de
celdas más apropiado es a 0.65
Average Grade (%)

menudo difícil de
0.60
determinar sólo con mirar el
patrón de perforación. 0.55

Según lo descrito 0.50


anteriormente, cuando el
tamaño de celdas es 0.45

demasiado pequeño o 0.40


demasiado grande ocurre 50 100 150 200 250 300 350 400 450
Cell Size (m)
un desagrupamiento
mínimo y la ley promedio se convierte en algo muy similar al promedio directo
de los datos. Si existen agrupamientos en las áreas de alta ley (cómo lo hacen en

______________________________________________________________________ 20
___________________________________________Curso de Geoestadística para Minería

este ejemplo), el desagrupamiento más efectivo ocurre para el tamaño de celdas


que minimiza la ley. Para este ejemplo, se utilizaron celdas cuadradas variando
en tamaño desde 100 a 400 metros. Para cada tamaño de celdas, el número de
muestras por celdas fue contado y los pesos fueron determinados por medio de la
aplicación de la formula de desagrupamiento de celdas presentada anteriormente.
Las leyes promedio resultantes para el depósito fueron entonces dibujadas vs el
tamaño de celdas. La ley promedio estimada para el depósito se minimiza para un
tamaño de celdas de 300 metros por lo tanto se selecciona este como el tamaño
más eficiente de celdas de desagrupamiento. La ley promedio del depósito
definido por desagrupamiento de celdas es de 0,52%.

El polígono de influencia y los métodos de malla son muy similares. La mayor diferencia
entre los métodos es el tratamiento de los datos ubicados a lo largo de los márgenes del
depósito. Para este ejemplo, los polígonos fueron completados utilizando un círculo de
radio de 125 metros cada vez que el polígono no podía ser cerrado por los datos vecinos
(véase ilustración). Para el método de malla, una malla de 5 metros fue ubicada dentro de
un rectángulo definido por las esquinas (-25, 100) y (1100, 920). Se le asignó la ley del
vecino más próximo a cada nodo de
malla. Los márgenes del depósito podrían haber sido definidos en forma más exacta
utilizando un borde ubicado a una distancia fija desde los puntos extremos, pero esta
sofisticación adicional no cambiará los resultados en forma significativa. Las leyes
promedio del depósito determinados por el polígono y los métodos de malla son 0,54% y
0,51% respectivamente.

______________________________________________________________________ 21
___________________________________________Curso de Geoestadística para Minería

Los cuatro métodos utilizados aquí para eliminar el sesgo introducido por el patrón de
perforación agrupado arrojan todos resultados entre 0,51% y 0,54%. Todas estas
estimaciones son de alrededor de 35% más bajos que el promedio simple no ponderado de
los datos (0,70%). La conclusión obtenida es que cualquier procedimiento sensato puede
ser utilizado para extraer los efectos de los agrupamientos desde los estimados de ley
promedio. Sólo debemos asegurarnos de que uno de estos procedimientos sea utilizado y
de que las leyes promedio establecidas no sean sesgadas por la densidad de la muestra.

Comentarios
La ponderación de las muestras que da cuenta de las agrupaciones es sólo un asunto de
importancia al calcular estadísticas en una forma que no considere específicamente el
componente espacial de los datos (por ejemplo el promedio no ponderado y la varianza del
depósito completo). Los métodos geoestadísticos de la estimación de recursos, como por
ejemplo el kriging, incorpora específicamente las características espaciales de los datos; por
lo tanto, no se requiere ponderar para dar cuenta de las irregularidades del espaciamiento.

En el desagrupamiento de celdas, no hay ninguna razón por la cual la celda deba ser un
cuadrado. Un ejemplo gráfico de la definición del tamaño óptimo de la celdas de
desagrupamiento en dos dimensiones es presentado en Isaaks y Shrivastava. En este
ejemplo, la ley desagrupada promedio se contornea para varios tamaños de celdas
desagrupantes (los ejes X e Y son los tamaños de celdas en esas direcciones, la ley
promedio de depósito es situado en las coordenadas X, Y las que corresponden al tamaño
de la celdas, luego se interpola). Ya que este ejemplo supone un muestreo agrupado de las
porciones de alta ley del depósito, el mínimo en este conjunto de isovalores de ley media
es considerado como el tamaño de celdas óptimo. En este ejemplo específico, el tamaño de
celdas óptimo es rectangular en lugar de cuadrado.

Antes de aplicar ninguna de las técnicas de desagrupamiento descritas aquí, se debe


efectuar una detallada evaluación de la distribución espacial de los datos. Se deben utilizar
ubicaciones de los datos (exhibiendo la ley compuesto por perforación en el mapa de
ubicación 2D) para reconocer sectores de alta y baja ley del depósito. En el mapa de
ubicación pueden ser sobrepuestas la litología o mapas de la distribución de otras variables
de control para investigar y evaluar tendencias espaciales y asociaciones o recoger
cualitativamente relaciones entre leyes y las variables de control. La información contenida
en una ubicación de datos puede ser aumentada a través del uso del color (para mostrar
diferentes márgenes de ley, por ejemplo) o diferentes símbolos para mostrar diferentes
litologías o tipos de alteración.

Los mapas de isovalores de leyes también pueden resultar ser muy útiles al definir las
tendencias de ley. Los isovalores pueden ser generados automáticamente a través de un
programa computacional o en forma manual. El uso principal de los isovalores es el de
indicar tendencias espaciales en las leyes u orientaciones preferidas. Ya que las tendencias
son a menudo asociadas con los controles geológicos, es generalmente preferible dejar que
el geólogo de proyecto confeccione el mapa de isovalores.

______________________________________________________________________ 22
___________________________________________Curso de Geoestadística para Minería

El software para desagrupar se encuentra disponible desde varias fuentes. Una rutina de
desagrupamiento es incluida en el paquete de software de GSLIB de dominio público
(Deutsch y Journel). El polígono de las rutinas de influencia puede ser difícil de encontrar.
Una posibilidad es el paquete de software comercial Techbase que contiene una rutina de
polígono. Cualquier paquete de software que contenga un módulo de modelación de
bloques puede ser utilizado para implementar la rutina de malla. Simplemente convierta los
bloques en puntos y defina que sólo una muestra sea utilizada en la estimación.

La siguiente tabla nos muestra los datos utilizados en la aplicación de desagrupamiento en


conjunto con los pesos asignados por la celdas, polígono y métodos de malla. Al examinar
los pesos, el peso del polígono y la malla son muy similares. El ponderador del método de
celdas es a menudo bastante diferente. Al concentrarse en las leyes más altas (en la parte
inferior de la tabla) aparece que todos los valores mayores que 1.25% están ubicados en la
misma celdas y reciben el mismo peso al aplicar el método de celdas. Los métodos de
malla y polígono proporcionan diferentes pesos para estos datos ya que estos métodos
tienen un nivel más alto de resolución. El método de celdas simplemente cuenta el número
de datos dentro de un gran volumen y asigna el mismo peso mientras que los otros métodos
proporcionan resultados superiores; sin embargo, este ejemplo (y otros ejemplos prácticos)
demuestran que todos los métodos tienden a proporcionar los mismos resultados.

______________________________________________________________________ 23
___________________________________________Curso de Geoestadística para Minería

Datos Utilizados para Ilustrar el Desagrupamiento y Pesos Asignados por varios


Enfoques.

Coordina Grados Esquemas


X Y de
300m Polígonos Malla
Ponderació
Celdas
200 200 0.11 n
0.050 0.041 0.037
102 345 0.11 0.025 0.024 0.024
400 600 0.13 0.025 0.023 0.020
326 654 0.14 0.025 0.016 0.014
800 600 0.16 0.017 0.042 0.046
937 748 0.16 0.100 0.050 0.086
400 200 0.18 0.033 0.031 0.024
291 278 0.19 0.050 0.020 0.017
800 400 0.21 0.025 0.038 0.052
739 465 0.21 0.025 0.021 0.018
600 400 0.35 0.025 0.030 0.025
475 486 0.35 0.010 0.009 0.008
895 230 0.36 0.033 0.043 0.078
400 800 0.38 0.025 0.039 0.035
800 200 0.38 0.033 0.041 0.033
317 772 0.38 0.025 0.021 0.019
600 200 0.44 0.033 0.039 0.033
508 215 0.45 0.033 0.020 0.017
608 746 0.47 0.017 0.026 0.023
600 800 0.49 0.017 0.029 0.026
200 400 0.5 0.025 0.024 0.021
66 300 0.51 0.025 0.035 0.034
200 600 0.62 0.033 0.026 0.025
158 544 0.62 0.025 0.032 0.043
200 800 0.82 0.033 0.031 0.028
111 853 0.85 0.033 0.046 0.043
651 551 0.86 0.025 0.018 0.015
600 600 0.87 0.017 0.024 0.020
740 833 0.92 0.017 0.031 0.022
800 800 1.1 0.017 0.029 0.027
350 450 1.11 0.010 0.006 0.005
460 285 1.2 0.033 0.013 0.011
450 450 1.26 0.010 0.007 0.006
339 458 1.34 0.010 0.015 0.012
350 350 1.4 0.010 0.013 0.011
339 599 1.5 0.010 0.012 0.010
400 400 1.56 0.010 0.006 0.006
459 466 1.6 0.010 0.004 0.003
541 484 1.7 0.010 0.014 0.012
450 350 1.88 0.010 0.012 0.009
Suma de 1.000 1.000 1.000
Pesos
Módulo 1.3 - Distribuciones Estadísticas
Introducción

______________________________________________________________________ 24
___________________________________________Curso de Geoestadística para Minería

En el módulo 1.1, se definió una variable aleatoria como una variable que toma valores al
azar, con frecuencias especificadas por una función de probabilidad. Los métodos para
resumir el margen de los valores tomados por una variable aleatoria han sido descritos, así
como también los métodos de asegurar que las mediciones individuales sean
representativas. En este módulo, los métodos para representar y analizar toda la
distribución de leyes serán evaluados. Además, algunos modelos de distribución comunes
serán discutidos. Utilizando los modelos de distribución, métodos para evaluar un
conjunto de datos para determinar si se encuentran presentes mezclas de datos siguiendo las
diferentes distribuciones o datos de una ley alta anormal (“outliers”)
Antecedentes / Teoría
Para ilustrar el concepto de variable aleatoria se proporcionan unos pocos ejemplos. Para
cada ejemplo, se describe la variable y su función de probabilidad. Siguiendo a los
ejemplos, se proporcionan los métodos que describen como utilizar los datos para inferir las
propiedades de la función de probabilidad subyacente.

Un Ejemplo Simple
Un ejemplo de una variable aleatoria es el número que aparece después de tirar un sólo
dado. Si el dado no está cargado, todos los seis números tienen una oportunidad igual de
aparecer en cualquier jugada. Esto significa que la oportunidad de observar, digamos el
número 3 en cualquier oportunidad en que se arroja el dado es 1 en 6, o lo que es lo mismo,
la probabilidad de observar 3 es 1/6 (0,167). Debido a que todos los otros números posibles
son igualmente probables, la función de probabilidad que describe esta variable aleatoria es
bastante simple y puede ser expresada de la siguiente forma:

Pr( Z  zi )  1 / 6; zi  1,2 ,3,4 ,5,6 .

Gráfico de Barra de Probabilidades


Outcomes From Throwing 1 Die

1/6
Probability

1 2 3 4 5 6

Outcomes

Este tipo de distribución es conocido como uniforme. Un gráfico de barra de las


probabilidades versus los resultados ayuda a explicar este nombre.

______________________________________________________________________ 25
___________________________________________Curso de Geoestadística para Minería

Un Ejemplo Más Complicado


Supongamos que dos dados son arrojados en lugar de uno y la variable aleatoria de interés
es la suma de los dos números observados. Antes de definir los posibles resultados, es
importante notar que los valores tomados por cada uno de los dados no están
correlacionados. Esto quiere decir que el saber el valor de uno de los dados no proporciona
absolutamente ninguna información acerca del valor que pudiese aparecer en el otro dado.
Debido a que cada dado toma los valores independientemente de 1 a 6 existen 6 veces 6 o
36 formas posibles en las que el dado puede caer y cada uno de los 36 resultados son
igualmente probables. La función de probabilidad puede ser definida simplemente
haciendo un listado de todos los 36 resultados, sumando los dos valores de cada dado y
contando las probabilidades para cada resultado. Los posibles resultados son los siguientes:

Dado Dado Dado Dado Dado Dado Dado Dado Dado Dado Dado Dado
1 2 1 2 1 2 1 2 1 2 1 2
1 1 2 1 3 1 4 1 5 1 6 1
1 2 2 2 3 2 4 2 5 2 6 2
1 3 2 3 3 3 4 3 5 3 6 3
1 4 2 4 3 4 4 4 5 4 6 4
1 5 2 5 3 5 4 5 5 5 6 5
1 6 2 6 3 6 4 6 5 6 6 6

Siguiendo la suma de los valores en el dado, la función de probabilidad puede ser definida
y graficada según lo siguiente:

Resultado (xi) Pr( X  xi ) Gráfico de Barra de Probabilidades


Resultados al lanzar dos dados
2 1/36
3 2/36
4 3/36 6/36

5 4/36 5/36

6 5/36
4/36
Probability

7 6/36
8 5/36 3/36

9 4/36 2/36
10 3/36
1/36
11 2/36
12 1/36
2 3 4 5 6 7 8 9 10 11 12

Outcome

El valor medio o promedio para esta distribución de probabilidades es la suma de las


probabilidades de un resultado multiplicado por el valor del resultado. En otras palabras, la
función de la probabilidad proporciona el ponderador para definir el promedio ponderado.

______________________________________________________________________ 26
___________________________________________Curso de Geoestadística para Minería

12
z  z  Pr( Z  z )
i2
i i

 (2)(1 / 36)  ( 3)(2 / 36)  ( 4)( 3 / 36)  (5)( 4 / 36)  ( 6)(5 / 36)  ( 7)( 6 / 36)
 (8)(5 / 36)  ( 9)( 4 / 36)  (10)( 3 / 36)  (11)(2 / 36)  (12)(1 / 36)
7
En forma similar la varianza puede ser definida como:

n
s2   ( z  z)
i 1
i
2
 Pr( Z  zi)

 (25)(1 / 36)  (16)(2 / 36)  ( 9)( 3 / 36)  ( 4)( 4 / 36)  (1)( 5 / 36)  ( 0)( 6 / 36)
 (1)(5 / 36)  ( 4)( 4 / 36)  ( 9)( 3 / 36)  (16)( 2 / 36)  ( 25)(1 / 36)
 5.83

Un ejemplo considerando la disponibilidad del equipo

Una aplicación práctica del concepto de una función de probabilidad se encuentra en el área
de la disponibilidad de equipo. Supongamos que una pequeña operación tiene una flota de
2 excavadoras de 10m3 y que cada excavadora tiene una disponibilidad de 85%. Dada esta
disponibilidad y la suposición de que la disponibilidad no está correlacionada entre las
máquinas, el número de días en que ninguna, una o ambas excavadoras estarán funcionando
puede ser calculado.

Ya que la disponibilidad de una excavadora no está relacionada a la disponibilidad de la


otra, esta situación puede ser vista en la misma forma que el ejemplo del dado. Siguiendo
esta analogía, las excavadoras pueden ser representadas como dos dados, cada uno teniendo
sólo dos valores posibles: 1 (la excavadora está funcionando) y 0 (la excavadora no está
funcionando). Estos dados sin embargo están cargados. El valor 1 sale 85% de las veces
mientras que el valor 0 sólo aparece 15% de las veces. Las probabilidades de todos los tres
posibles resultados (0, 1, o 2 excavadoras funcionando) pueden entonces ser determinadas
multiplicando las probabilidades asociadas con los posibles resultados para cada máquina
(funcionando o no funcionando).

Número de Probabilidad Método de Calcular la Probabilidad


Funcionamiento
2 0.722 Igual a la probabilidad de que la excavadora 1 esté disponible y la
excavadora 2 esté disponible o (0,85) (0,85)
1 0.255 Igual a la probabilidad de que la excavadora 1 esté disponible y la
excavadora 2 no lo esté (.85) (.15) además de la probabilidad de que
la excavadora 1 no esté disponible y la excavadora 2 sí lo esté (.15)
(.85)

0 0.023 Igual a la probabilidad de que las excavadoras 1 y 2 no estén


disponibles (.15) (.15)

______________________________________________________________________ 27
___________________________________________Curso de Geoestadística para Minería

De este análisis se espera que no haya ninguna excavación en 2.3% de los días en que la
mina esté operando (alrededor de 8 días al año). Este tipo de información generalmente
probará ser muy útil al planificar las operaciones de la mina y para desarrollar el programa
minero.

Para cantidades mayores de equipos, la tabulación de todas las posibles probabilidades


rápidamente se convierte en tediosa. Afortunadamente este tipo de problema ha sido muy
bien estudiado y se sabe que la probabilidad de que cualquier número dado o piezas de
equipo se encontrarán disponibles sigue una distribución binómial. La expresión para este
tipo de distribución es la siguiente:

 n!  k
Pr( X  k )    p (1  p ) n  k
 k ! ( n  k )! 

donde p = la disponibilidad de una pieza de equipo (fracción entre 0 y 1)


k = el número de piezas del equipo en funcionamiento
n = el tamaño total de flota
el signo de exclamación es el operador factorial.. Ejemplo 4! = (4)(3)(2)(1)

Datos Continuos
En cada uno de los ejemplos anteriores, los datos considerados tomaron valores enteros
exclusivamente. Las funciones de probabilidad derivadas de este tipo de datos son
conocidos como discretas. Los datos de leyes generalmente no son discretos ya que los
valores de ensayo no son enteros. En tales casos, los datos y el modelo de probabilidad son
llamados continuos. Al discutir las probabilidades para datos continuos, se debe discutir la
probabilidad sobre un margen en lugar de la probabilidad de un número exacto ya que la
probabilidad de un resultado exactamente igualando a cualquier valor individual es
extremadamente pequeña.

Se discuten dos tipos de probabilidades. La función de densidad de probabilidad (PDF) que


define la probabilidad que la variable tomará sobre un valor específico. Esta función puede
ser integrada sobre cualquier margen de ley de interés para definir la probabilidad que la
variable aleatoria tomará sobre valores entre los dos puntos extremos. La función de
densidad acumulativa (CDF) define la probabilidad de que la variable aleatoria tome un
valor menor que un número específico. Si el número específico elegido es un ley de corte,
entonces el CDF (o su estimación) define directamente el tonelaje bajo (y por lo tanto
sobre) la ley de corte.

Para obtener una representación ilustrada de un conjunto de datos y para obtener una idea
de la forma de PDF o CDF, se utiliza una herramienta conocida como un histograma o
histograma acumulado. Para crear un histograma, se define un número de rangos de
ley o clases y se cuenta el número de los ensayos que caen dentro de cada clase (o

______________________________________________________________________ 28
___________________________________________Curso de Geoestadística para Minería

porcentaje de ensayos).
Este gráfico de barra es llamado histograma.
Como un ejemplo de la metodología de construcción de un histograma, considere el
siguiente conjunto de datos de leyes.

0.86, 3.25, 3.18, 5.73, 3.03, 2.72, 2.02, 2.07, 3.91, 2.41, 3.34, 4.85, 4.97, 2.77, 3.04, 1.31, 2.23, 2.77, 2.18, 0.62

Las clases para este conjunto de datos pueden ser establecidos en valores enteros y el
número de ensayos contados por clase. Los resultados son los siguientes:

Ejemplo de Histograma
Intervalos de Conteos Conteos
Clase por Clase Acumulativos
0 a 1.0 2 2
1.0 a 2.0 1 3
2.0 a 3.0 8 11
3.0 a 4.0 6 17
4.0 a 5.0 2 19
5.0 a 6.0 1 20
Ejemplo de Histograma Ejemplo de Histograma Acumulativo
9 22

20
8

18
7

16
Number of Samples

Number of Samples

6
14

5 12

4 10

8
3

6
2
4

1
2

0 0
<= 1 (1,2] (2,3] (3,4] (4,5] >5 <= 1 (1,2] (2,3] (3,4] (4,5] >5

Bin Intervals Bin Intervals

Un examen de la forma representada por el histograma proporciona información sobre la


posibilidad de que los datos sigan una de varias distribuciones bien conocidas. Los
modelos de distribución continua más comúnmente encontrados en la minería y la geología
son los modelos normal y log-normal.

La Distribución Normal
Los datos tienden a seguir una distribución normal o de Gauss siempre que el fenómeno
considerado involucre suma/promedio de otras variables aleatorias o cuando se consideren
errores. En la minería, esta distribución aparece al considerar los errores de ensayo en un
laboratorio o los errores de estimación. Los datos de ensayo de los yacimientos de metales
raramente siguen esta distribución. El CDF para la distribución normal es de acuerdo a lo

______________________________________________________________________ 29
___________________________________________Curso de Geoestadística para Minería

siguiente:
z
Pr( Z  z )  Fz ( z )   f ( z )dZ

z : o el integral de PDF iguala al CDF

1  ( z  z) 2 
fz ( z )  exp   : este es el PDF para la distribución normal
2s 2  2s 2 
z es el medio y s 2 es la variancia

Afortunadamente no es necesario resolver esta integración (ni siquiera mirar a estas


ecuaciones nuevamente) para evaluar la distribución normal. La distribución normal ha
sido bien estudiada y sus valores han sido tabulados. Para utilizar las tablas, se requiere
una conversión simple a la variable normal estándar. Esta conversión es como sigue:

( z  z}
Zn 
s
La variable normal es por lo tanto el valor observado menos el medio dividido por la
desviación estándar. Dada esta variable, es fácil definir la probabilidad de un evento
siempre y cuando los datos sigan una distribución normal.

A modo de ejemplo, consideremos nuevamente el método de análisis de laboratorio


discutido en el primer módulo. Supongamos que se ha determinado que el laboratorio es no
sesgado y que la desviación estándar relativa de las mediciones para este laboratorio al estar
desempeñándose correctamente es 10%. Para una ley normal de 0,8% de cobre, la tabla de
la distribución normal puede ser utilizada para determinar un margen aceptable de valores
para el laboratorio. Los valores de ensayo fuera de este margen son indicaciones de que el
laboratorio no esta cuantificando las leyes correctamente. Este tipo de análisis es calificado
como una determinación de límite de control. Cuando los ensayos se encuentran dentro de
los límites entonces el proceso (en este caso el laboratorio) se encuentra en control.
Cuando los ensayos se desvían fuera de los límites, el proceso puede estar fuera de control
(los valores de ensayo no son confiables). Típicamente los límites de control son
establecidos en los niveles de 95% y 99%. El nivel de probabilidad asociados con los
límites de control describe el porcentaje esperado de ensayos que caen dentro de los límites.
Por lo tanto para los límites de control de 95%, se espera que 5% de los datos caiga fuera
de los límites, mientras que se espera que sólo 1% de los datos caiga fuera de los límites de
99%. Al examinar un gráfico de control, uno busca secuencias de valores que se
encuentran fuera de los límites. Excursiones aleatorias fuera del territorio son esperadas,
sin embargo las tendencias o patrones de excursiones fuera del territorio indican un proceso
que se encuentra fuera de control y un laboratorio que proporciona valores inaceptables.

Para desarrollar una carta de control como la del siguiente ejemplo, es necesario saber unos
pocos detalles con respecto a los datos. Primero, las cartas de control pueden ser
desarrollados solamente para estándares u otros materiales que son analizados múltiples
veces.

Una carta de control creada sobre diferentes muestras no tendría mucho sentido debido a

______________________________________________________________________ 30
___________________________________________Curso de Geoestadística para Minería

que la variabilidad de la ley de las muestras es muy superior al error introducido en el


laboratorio. Suponiendo que se ha preparado una muestra que se sabe que contiene 0,8%
de cobre. Después de numerosos ensayos de la muestra, se ha determinado que la
desviación estándar relativa (desviación estándar/media) de las mediciones cuando el
laboratorio está funcionando apropiadamente es 10%, por lo tanto la desviación estándar es
0,08% de cobre. Utilizando esta información y la tabla de distribución normal estándar, es
posible determinar los límites de control. Para demostrar como se realiza esto, se considera
el 95% de confianza para los límites de control.

En el límite de 95%, 95% de los valores caen dentro de los límites y 5% caen fuera. El 5%
de los valores que se encuentran fuera de los límites caen en uno de los dos extremos de la
distribución. Al dividir el 5% en 2, se consulta la tabla normal para determinar los valores
normales correspondientes a los valores CDF de 2,5% y 97,5%. Los valores apropiados
son -1,96 y 1,96. Dados estos valores estándares el valor apropiado para la carta de control
puede ser definida.

( z  z}
Zn 
s

En este caso: -1,96= (x-.8)/.08 y 1,96= (x-.8)/.08


En otras palabras los valores Z de la tabla son 1,96 y -1,96, la media
es 0,8 y la desviación estándar es 0,08
El despejar la x proporciona los límites de control de 0,64 y 0,96%
de cobre al 95 % de confianza.

Los límites de 99% son definidos en la misma forma. Sólo el valor Zn cambia, según se
define en la tabla normal.

______________________________________________________________________ 31
___________________________________________Curso de Geoestadística para Minería

Ejemplo de Cuadro de Control además de Distribución de Ensayo


1.2

1.1 99% Control Limit

1.0 95% Control Limit


Copper (%)

0.9

0.8

0.7

0.6

0.5
0 100 200 300 400

Analysis Number

La carta de control anterior construida indica que el laboratorio tiene la metodología de


ensayo bien bajo control. Aproximadamente 400 muestras estándares fueron ensayadas. Se
esperaba que uno en veinte (5%) de los ensayos cayera fuera de los límites de 95%. Sólo
14 muestras cayeron fuera de los límites en lugar de las 20 muestras esperadas. En un nivel
de 99%, se esperaba que 1 en 100 o 4 muestras cayeran fuera de los límites. En la
actualidad sólo 1 muestra cae fuera. Sobre esta base, el laboratorio aparece como operando
dentro de los límites aceptables. El gráfico de barras a la derecha de cuadro de control
muestra las frecuencias de las leyes por rango de ley mientras que la línea roja muestra la
distribución normal teórica para los datos con la misma media y varianza. Según se
muestra, los datos de ensayo se ajustan muy cercanamente a una distribución normal.

La Distribución Log-normal
A diferencia de la distribución normal que se centra principalmente alrededor de la ley
media, la distribución log-normal es asimétrica con una extremo (cola) extendiéndose hacia
los valores de ley más altos. Este tipo de distribución es común al examinar los leyes de
ensayo de los yacimientos minerales en donde los leyes de ensayo generalmente no se
encuentran cerca de los normalmente distribuidos. Tiende a haber muchas leyes bajas pero
relativamente pocas leyes altos. Un ejemplo de un histograma de datos log-normales es
presentado a continuación

______________________________________________________________________ 32
___________________________________________Curso de Geoestadística para Minería

Ejemplo de Histograma para un Conjunto de Datos log-normal


105
98
91
84
77
Number of Samples

70
63
56
49
42
35
28
21
14
7
0
.15 .25 .35 .45 .55 .65 .75 .85 .95 1.05 1.15 > 1.2

Copper (%)

El ley promedio de estos datos es 0,45% de cobre. A pesar de que 0,45% es el centro de la
clase que contiene la mayoría de las muestras, el histograma muestra definitivamente que la
mayoría de los ensayos son menores que 0,45% en lugar de ser mayores que este valor. La
ley promedio es influenciada por las muestras con leyes mayores que 1%. Estas muestras
de alta ley crean el extremo de alta ley para esta distribución y ejercen mayor influencia
sobre el ley promedio. El impacto de tales muestras sobre la varianza es incluso mayor
debido a que la varianza es medida en unidades cuadradas. A menudo los valores de ley
muy grande ocurren e influencian fuerte e inapropiadamente las estadísticas calculadas
basándose en los datos. Tales valores de leyes son denominados aislados y deben ser
manejados en forma separada para evitar el sesgo de las estadísticas y cualquier estimación
calculada a partir de los datos. Los métodos para tratar los valores aislados serán discutidos
en la siguiente sección.

La distribución log-normal recibe su nombre debido a que los logaritmos de los datos se
distribuyen normalmente. Esto significa que si una variable Z es log-normal, la variable
In(Z) estará normalmente distribuida. Debido a que esta transformación se encuentra
disponible, las tablas específicas para la distribución log-normal no son necesarias. Sólo es
necesario definir la media apropiada y la varianza de los logaritmos de los datos para poder
definir la probabilidad de cualquier corte de interés (véase la sección de los comentarios
para cualquier información adicional sobre este método). Debido a que muchos conjuntos
de datos de los yacimientos de minerales parecen seguir las distribuciones log-normal y las
probabilidades de la distribución de encuentran disponibles desde las tablas normales, esta
distribución es frecuentemente utilizada.

Una herramienta útil para evaluar, si los datos siguen una distribución específica es el papel
de probabilidades. Cuando las frecuencias acumulativas son trazadas en papel de
probabilidades, se genera un trazado de línea recta si los datos siguen la distribución de
interés. El papel de probabilidades puede ser derivado de alguna distribución, pero el papel
de probabilidades normal es el más utilizado. Si las probabilidades acumulativas son
trazadas en contra del logaritmo de ley, entonces el papel de probabilidades normal se

______________________________________________________________________ 33
___________________________________________Curso de Geoestadística para Minería

convierte en papel de probabilidades log-normal. A continuación se entregan ejemplos de


datos trazados sobre papel de probabilidades normal y papel de probabilidades log-normal.

Los datos trazados en el papel normal fueron utilizados en el cuadro de control del ejemplo
anterior mientras que los datos trazados en el papel log-normal fueron utilizados para
generar el histograma de los datos log-normales mostrados arriba.

Example Normal Probability Plot Example Lognormal Probability Plot


3.5 3.5

2.5 2.5

1.5 1.5
Expected Normal Value

Expected Normal Value


0.5 0.5

-0.5
-0.5

-1.5
-1.5

-2.5
-2.5

-3.5
-3.5 0.1 0.3 0.5 0.7 0.9 2.0
0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 0.2 0.4 0.6 0.8 1.0

Copper (%) Copper (%)

Los puntos sobre cada trazado representan los datos mientras que la línea representa la línea
más adecuada para los datos. En cada caso los datos cayeron cerca de la línea indicando
que los datos realmente siguen las distribuciones normal y log-normal, respectivamente.
Nótese que el eje Y en los trazados anteriores se encuentra en unidades de desviación
estándar o lo que es equivalente la variable Zn normal estándar. El eje Y puede también
estar en unidades de porcentaje o probabilidad.

Ejemplos

La función de distribución acumulativa proporciona un método conveniente para convertir


entre las diferentes distribuciones o hacer una transformación de los datos. Una aplicación
de una transformación para corregir un sesgo en los valores de ensayo introducidos por las
perforaciones viene de un yacimiento de oro. El depósito fue perforado primariamente
utilizando circulación inversa
(RC). Debido a que había Example of Drilling Pattern
algunas preocupaciones Diamond Hole
250
acerca de la validez de la RC Hole

técnica y los valores de


ensayo obtenidos, la 200

perforación de diamante fue


utilizada para confirmar los 150

resultados.
El depósito fue perforado en 100

50

______________________________________________________________________
25 75 125 175 225
34
___________________________________________Curso de Geoestadística para Minería

una malla de 50 metros con circulación inversa. En lugar de utilizar la perforación de


diamante gemelos (“twin holes”) para reproducir los sondajes RC , la decisión fue tomada
para obtener la mayor cantidad posible de información con respecto al yacimiento y
perforar con diamante en una malla de 50 metros desplaza con respecto de la malla de
circulación inversa (véase ilustración). Debido a que los dos programas de perforación
cubren la misma área en la misma densidad, las distribuciones de datos de ensayo obtenidas
de los dos programas de perforación deberían ser idénticas. Para determinar si esto es
verdadero, se prepararon distribuciones experimentales acumulativas en forma separada
para ensayos en zona de mineral de cada tipo de perforación. Una comparación de los dos
CDFs experimentales demuestra que los resultados de perforaciones RC muestran
consistentemente leyes más altas que los resultados de la perforación con diamante. De
esta comparación (e información sobre las técnicas de perforación RC utilizadas), se
concluyó que los datos RC estaban sesgados y requerían corrección.

La corrección fue Corrección de Grados utilizando el trazado de probabilidad


hecha basándose en 3.5

cada ensayo en Grade Dis tribution From


2.5 Diamond Dril ing Program
particular. Desde el
CDF de los datos RC, 1.5
Expected Normal Value

el porcentaje de
0.5
muestras con leyes Grade Distribution From
menores que la ley de -0.5 RC Dril ing Program
cualquier muestra
-1.5
conocida. Para el
porcentaje específico, -2.5
el CDF de los datos de Example Grade Correction
-3.5
la perforación de
0.60

6.00
0.04

0.06
0.08
0.10

0.20

0.40

0.80
1.00

2.00

4.00

8.00
10.00

20.00

40.00

60.00
diamante define otra
ley. En esta forma Gold Grade (g/t)

todos los ensayos RC


sesgados son transformados en ensayos de perforaciones de diamante no sesgadas
equivalentes. Esta transformación es mostrada gráficamente en la figura anterior.

Nótese que incluso siguiendo esta corrección los datos establecidos no pueden ser
utilizados para nada más que definir un recurso inferido. La definición de clases de
recursos medidos o indicados o cualquier tipo de reserva no son posibles al utilizar datos
corregidos .

Comentarios

Los métodos geoestadísticos estándar no hacen suposiciones con respecto a la forma de la


distribución estadística. Los métodos de estimación tales como el método kriging pueden
ser aplicados ya sea que los datos sigan una distribución normal, una distribución log-
normal o cualquier otra distribución. Se debe notar, sin embargo, que las estimaciones
kriging tenderán a ser más precisas si los datos siguen una distribución de buen

______________________________________________________________________ 35
___________________________________________Curso de Geoestadística para Minería

comportamiento centrado (tal como la distribución normal) en lugar de una distribución con
un extremo largo (como es el caso de la distribución log-normal).

Los gráficos de probabilidad son también muy útiles para determinar si el conjunto de datos
es una mezcla de dos poblaciones estadísticas (una mezcla de las mineralogía de calcopirita
y calcosina por ejemplo) y para evaluar y manejar valores aislados o extremos. Cada uno
de estos usos de gráficos de probabilidad serán discutidos en el próximo módulo.

______________________________________________________________________ 36
___________________________________________Curso de Geoestadística para Minería

Modulo 1.4 - Análisis de Datos

Introducción

La etapa de análisis de datos es crucial en el desarrollo de las estimaciones de recursos


exactas. Durante esta etapa, algunas veces llamada análisis de datos exploratorios o EDA,
los datos de leyes son estudiados y analizados en detalle. Este análisis utiliza varias
herramientas estadísticas- algunas de las cuales fueron previamente presentadas y otras que
serán presentadas aquí - para entender la distribución de los datos y sus importantes
parámetros de resumen. Al aplicar las diferentes herramientas, tanto el conjunto completo
de datos como los varios sub-conjuntos de datos son considerados. Algunos ejemplos de
los sub-conjuntos de datos son las leyes para diferentes litologías, tipos de alteraciones,
mineralogía del cobre o la ubicación espacial. Los datos son estudiados en sub-poblaciones
o grupos, ambos para desarrollar un entendimiento cuantitativo de los controles más
importantes o significativos de la mineralización y para definir cuales grupos pueden ser
combinados (debido a que sus propiedades son tan similares) y cuales grupos deben ser
estudiados por separado. Típicamente en esta etapa del estudio de recursos, las decisiones
importantes son tomadas con relación a cómo será estimado el depósito y que tipos de
límites serán establecidos entre los grupos.. A menudo, existen diferentes zonas dentro de
un depósito y no es deseable utilizar datos de una zona para estimar leyes en otras zonas.
Por ejemplo, sí una litología específica (ej.:skarn) o mineralogía (ej.: la presencia de
calcosita) está asociada con leyes altas entonces es esencial que solamente datos de estas
zonas sean utilizados al estimar las leyes de material dentro de esta zona. Generalmente se
requerirá de un límite duro en los modelos. Sin este límite, las leyes altas de la zona serán
utilizadas para estimar las leyes de material que se encuentra fuera de la zona y se sabe
(geológicamente) que posee una ley más baja. Esto nos llevará a una sobre estimación de
los leyes de ciertas litologías. Lo contrario también ocurre en el caso en que se utilicen
muestras de grupos de leyes bajas en la estimación de zonas de ley alta. En resumen, es
esencial definir y utilizar grupos de datos en cualquier estimación de recursos. Se le debe
consultar al geólogo de proyecto en forma extensiva durante esta parte de la estimación de
recursos ya que el conocimiento geológico y la familiaridad con el depósito son esenciales
para ganar una penetración dentro de las características específicas del depósito que
pudieran impactar la ley.

Teoría / Antecedentes
Existe un número de herramientas que pueden ser utilizadas para leer mejor los mensajes
ocultos dentro del conjunto de datos. En los siguientes párrafos varias herramientas serán
introducidas y se proporcionarán ejemplos de sus usos. Cada herramienta proporciona un
tipo diferente de información relacionada con el conjunto de datos. En combinación, las
herramientas de análisis de datos proporcionarán una idea bastante completa de las
características de los datos y apuntarán a las técnicas más apropiadas para la estimación de
leyes en el depósito.

La primera tarea es determinar si hay una o más poblaciones de leyes presentes. Una
población puede ser definida como un conjunto de valores que siguen la misma distribución

______________________________________________________________________ 37
___________________________________________Curso de Geoestadística para Minería

estadística. Debido a que una evaluación de una distribución completa de las leyes puede
ser difícil, generalmente sólo las dos estadísticas de resumen más importantes, la media y la
varianza, son utilizadas al evaluar el hecho de sí los datos pertenecen a una población dada.
Idealmente, se sabe lo suficiente acerca de geología, mineralogía y las opciones
metalúrgicas para un depósito específico que clases o categorías similares de datos puedan
ser definidas incluso antes de ni siquiera considerar las estadísticas. En estos casos es
necesario determinar cuando ciertas clases deben o pueden ser combinados.

Al presentar las herramientas estadísticas, se supondrá que las clases de significado físico,
lógicas pueden ser definidas, así es que la primera tarea es la de agrupar las clases de
acuerdo a lo apropiado. Una vez que los datos están agrupados, un análisis adicional es
desempeñado para determinar sí acaso las diferentes poblaciones permanecen dentro de los
datos. Las herramientas que serán utilizadas son gráficos rectangulares múltiples, gráficos
interactivos, gráficos de efecto proporcional u gráficos de probabilidad.

Gráficos Rectangulares

Los gráficos rectangulares son


Ejemplo de trazado rectangular
similares a los histogramas en cuanto
2.0
que el gráfico permite una visión de
todo el conjunto de datos. El Outliers
enfoque de los gráficos es sin
embargo algo diferente. 1.5

Históricamente los histogramas


habían sido utilizados como una Whisker
herramienta para determinar que tipo
Copper Grade (%)

1.0
de distribución estadística podría
adecuarse al conjunto de datos. Los Mean
gráficos rectangulares son más Box
0.5 Median
utilizados para ver las estadísticas
más importantes de los datos además
de examinar los valores escapados.
Existen 5 componentes importantes 0.0

en un gráfico rectangular. Primero


se encuentra el rectángulo mismo que define el 50% central de los valores de leyes
observados. Esto es 50% de los leyes pertenecen al rectángulo; 25% son más pequeños que
el límite inferior del rectángulo y 25% son más grandes que el límite superior del
rectángulo. Anexos a y extendiéndose fuera del rectángulo existen dos líneas verticales
conocidas como contacto por punta. El largo de los contactos es seleccionado por la
persona que realiza el análisis. Típicamente los contactos son 1 a 1,5 veces el ancho del
rectángulo. Si el valor de datos máximo o mínimo es menor que el largo máximo de los
contactos, entonces los contactos se detienen en el valor mínimo o máximo. Los valores
que caen fuera del margen de los contactos son denominados aislados. Para mostrar el
posible centro de la distribución, los valores media (promedio) y mediana son mostrados
como puntos.

______________________________________________________________________ 38
___________________________________________Curso de Geoestadística para Minería

En esta ilustración se muestra la tendencia central (media y mediana), extensión (ancho de


rectángulo) y el margen de datos. La medición de la extensión ilustrada por el ancho del
rectángulo es conocida como la amplitud intercuartil.. La amplitud intercuartil captura el
50% central de los datos y se encuentra generalmente especificada en conjunción con la
mediana (50% de los datos son mayores y 50% son menores que el valor de la mediana).
Tanto la mediana como la amplitud intercuartil son estadísticas que son resistentes a los
valores escapados; esto es, la magnitud de los valores escapados no impacta estas
estadísticas. Por ejemplo, en el gráfico rectangular del ejemplo anterior aunque el valor
mayor fuese 1,9% o 19% la mediana y la amplitud intercuartil permanecen sin cambio. Las
estadísticas típicas utilizadas para medir la tendencia central y la extensión (media y
varianza) son ciertamente impactadas por la magnitud de los valores escapados siendo la
varianza más afectada que la media.

Al comparar la media y la mediana en el gráfico de rectángulo del ejemplo se demuestra el


efecto de los valores escapados ya que la media es significativamente mayor que la
mediana. Los datos definitivamente tienen una cola hacia los valores de ley alta (una
distribución de “tipo lognormal”). Este tipo de distribución (media > mediana) se llama
una distribución asimétrica positiva. Cuando los datos son positivamente asimétricos, los
valores escapados de alta ley son comunes. En el gráfico de ejemplo se muestran dos de
tales valores. Antes de la estimación, se le debe dar una consideración a la investigación de
los ensayos para estos datos, revisando la ubicación de los ensayos o cortando estos valores.
Se proporciona más discusión sobre este tema en las secciones posteriores.

Los gráficos rectangulares pueden ser Ejemplo de Trazado Rectangular Múltiple


superimpuestos para exhibir el margen de leyes 2.5

y las estadísticas para varios grupos de datos.


El gráfico superimpuesto es llamado gráfico
rectangular múltiple y aquí se entrega un 2.0

ejemplo de él. Los ensayos de cobre han sido


agrupados por litologías observadas. Las leyes
de la mediana se encuentran unidas por una 1.5

línea para mostrar una tendencia de ley


Copper (%)

creciente al comenzar a moverse de la litología


1.0
1 a la litología 3. Basándose en la diferencia de
ley de la mediana entre los tres grupos cada
uno de ellos probablemente será tratado por
0.5
separado durante la estimación de recursos. Al
existir una diferencia, como la mostrada aquí,
se encuentra de extrema importancia el 0.0
confirmar con el geólogo del proyecto que Lithology 1 Lithology 2 Lithology 3

la diferencia en los leyes observadas sea


razonable y coherente con el modelo geológico para el depósito. Esta información puede
ser utilizada para mejorar tanto el conocimiento geológico del depósito como para
proporcionar ideas para otros métodos de investigación de datos.

______________________________________________________________________ 39
___________________________________________Curso de Geoestadística para Minería

Gráficos Interactivos

En contraste con los gráficos previamente descritos que permiten una investigación
detallada de los leyes para un elemento único, los gráficos interactivos permiten una
investigación de las interrelaciones entre varios elementos. Por esta razón, el gráfico
interactivo es muy útil al determinar si las varias agrupaciones de datos son similares o
diferentes en los depósitos polimetálicos. El gráfico interactivo es muy simple de construir.
La ley promedio de cada elemento se gráfica a lo largo de la línea vertical y existen tantas
líneas verticales como el número de grupos, En los casos en que hay variables de
agrupación múltiple (por ejemplo la litología y la mineralogía), el gráfico de interacción
puede también apuntar a la variable de agrupación más importante. Por ejemplo, si las
leyes de cobre son consistentes a través de todas las litologías para una mineralogía de
cobre específica, pero hay saltos de leyes importantes entre las diferentes mineralogías.
Entonces la mineralogía es el control más importante sobre la ley y la litología puede ser
ignorada para los propósitos de estimación de recursos.

Un ejemplo de un Ejemplo de Trazado de Interacción


gráfico interactivo 1.25
explica mucho acerca de Copper
Gold
la utilidad de esta 1.00 Moly
herramienta. Los datos
Copper (%), Moly (%), Gold (g/t)

de este depósito 0.75


polimetálico del ejemplo
se encuentran agrupados 0.50
por la litología y el tipo
de alteración. Las leyes 0.25
de Moli, oro y cobre
promedio, fueron 0.00
calculadas por grupo y
Type 2

Type 3

Type 4

Type 5
Type 1

Type 4

Type 5

Type 1

Type 2

Type 3

Type 1

Type 2

Type 3

Type 4

Type 5
Alteration

Alteration

Alteration

exhibidos en el gráfico
interactivo. El gráfico Lithology 1 Lithology 2 Lithology 3
muestra rápidamente
que la litología no tiene un impacto significativo sobre la ley. Las líneas representando
las leyes promedio de cada elemento por el tipo de alteración son casi idénticas entre las
tres litologías. Por ejemplo, sin importar la litología, el cobre es alto y el oro es bajo para la
alteración tipo 1 y lo opuesto es verdadero para alteración tipo 2. Además, el gráfico
muestra que los tipos de alteración 1 y 3 (cobre alto, Moli y oro baja) son muy similares
y los datos de estos grupos podrían probablemente ser combinados. El resto de los
tipos de alteración parecen ser lo suficientemente diferentes por lo que no deben ser
combinados para los propósitos de estimación. Una vez más, existen probablemente
razones muy entendibles para los patrones mostrados entre los varios elementos y el
geólogo del proyecto debe ser consultado.
Un comentario final sobre el gráfico interactivo, debido a que solamente la ley promedio es
presentada, dicha ley debe ser representativa del grupo. Habrá algunos grupos que se
encuentran sub-muestreados. En estos casos, la ley promedio estimada puede no ser una

______________________________________________________________________ 40
___________________________________________Curso de Geoestadística para Minería

buena estimación de la ley promedio real, por lo tanto el número de datos por grupo debe
ser considerado antes de la construcción del gráfico. Los datos aislados son también una
preocupación, por lo tanto un gráfico rectangular múltiple debe ser también construido por
cada elemento antes de preparar un gráfico interactivo y los valores escapados deben ser
validados.

Gráficos de Efecto Proporcional

El efecto proporcional se refiere a la presencia de una relación lineal entre la ley promedio
y la desviación estándar de los sub-conjuntos de datos. Por ejemplo, si un depósito fue
dividido en un número de zonas y la desviación estándar y el promedio fueron calculados
para los datos dentro de cada zona, un efecto proporcional produciría una relación lineal
entre la desviación estándar y el promedio. En otras palabras, se presenta un efecto
proporcional cuando la variabilidad es una función creciente de ley.

Un ejemplo simple ayudará a explicar las posibles relaciones entre la variabilidad y la ley.
En la ilustración de la derecha, se muestran los tres perfiles de ley a través de un depósito.
En el perfil superior, la ley promedio es constante a lo largo del perfil (como lo muestra la
línea horizontal sólida) al igual que la variabilidad
(mostrada por las fluctuaciones de las puntas Ley constante y variabilidad Constante

alrededor de la línea de ley promedio). En el perfil


intermedio, la ley promedio aumenta a lo largo del
perfil; sin embargo, la variabilidad permanece
constante a pesar de ley creciente. En el último, la
ley promedio del perfil también aumenta a lo largo
del perfil al igual que aumenta la variabilidad. Si los
datos del último perfil fuesen estudiados en detalle, Variancia Constante, Ley en aumento

se determinaría que la desviación estándar de los


datos es una función lineal de la ley promedio. Un
efecto proporcional se encuentra presente en los
datos del perfil inferior.

Ley en aumento y variabilidad en aumento

Por lo tanto, ¿De dónde viene el efecto proporcional y porqué es tan importante? Cuando
los datos vienen de una distribución normal (ver comentarios), el efecto proporcional no es

______________________________________________________________________ 41
___________________________________________Curso de Geoestadística para Minería

observado y la varianza no es una función de la ley local. El perfil de la ley media, en la


ilustración anterior, sería el característico de los datos de una distribución normal. Cuando
los datos provienen de una distribución (multi-) lognormal, el efecto proporcional es
siempre observado. La desviación estándar de los datos es una función lineal directa de la
ley promedio. Mientras la presencia de una distribución lognormal garantiza un efecto
proporcional, se observa en la práctica que los datos de cualquier distribución asimétrica
positiva exhibiría generalmente un efecto proporcional. Por esta razón, virtualmente todos
los datos de los depósitos de minerales exhiben un efecto proporcional.

La presencia de un efecto proporcional no


impacta mayormente las estimaciones, sin
Trazado de dispersión para Variables Normales Bivariadas
embargo impacta seriamente la 7

incertidumbre asociada con las 6

estimaciones (véase comentarios).

Grade 20 Meters From Location X


5

Considere los dos diagramas de dispersión 4

mostrados aquí. En ambos casos, se 3


consideran los leyes en los puntos
2
separados por 20 metros. En el diagrama
de dispersión, los datos son normales
1

bivariados y la dispersión de los puntos es 0


0 1 2 3 4 5 6 7

una función constante de ley, por lo tanto Grade at Location X

al estimar los leyes en este caso, la Trazado de dispersión para Variables Log-Normales Bivariadas
1.5

incertidumbre será independiente de la ley.


En el diagrama inferior, los datos son log-
Grade 20 Meters From Location X

normales bivariados. En este caso, la 1.0

dispersión, y por lo tanto la incertidumbre,


son claramente funciones de ley en 0.5

aumento y la técnica de estimación debería


dar cuenta de esto al especificar la
incertidumbre. 0.0
0.0 0.5 1.0 1.5

Grade at Location X
Ejemplo de un Trazado de Efecto Proporcional
1.3

1.1

0.9
Standard Deviation (%)

0.7

0.5
Leached Zone
Prim ary Zone
0.3 Enric hed Zone

0.1
0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6

Average Copper Grade (%)

El gráfico de efecto proporcional es fácil de construir. Primero los datos son agrupados en
clases significativas. Luego el promedio y la desviación estándar son calculadas para cada
clase. Los puntos son dibujados sobre un gráfico con la ley media en el eje X y la

______________________________________________________________________ 42
___________________________________________Curso de Geoestadística para Minería

desviación estándar sobre el eje Y. El gráfico es utilizado para buscar patrones o


agrupaciones de datos. A menudo, emergen claras agrupaciones de datos que se pueden
relacionar nuevamente con la geología.

En el siguiente ejemplo de gráfico de efecto proporcional, algunas leyes de cobre para


diferentes litologías dentro de diferentes zonas del depósito son dibujadas vs la desviación
estándar. La línea pasando a través del gráfico es el mejor ajuste lineal para los datos.
Generalmente, la desviación estándar se encuentra relacionada en forma lineal con la ley
promedio y los datos de este depósito realmente exhiben un efecto proporcional. Como es
de esperar, las leyes dentro de la zona enriquecida son más altas que en la zona primaria los
cuales, en cambio, son más altas que los leyes en la capa lixiviada. Las litologías
individuales dentro de cada una de las zonas de diferente carácter primario-supergeno
también impactan las leyes observados. Lo más probable es que las litologías dentro de la
zona primaria estarán combinadas para propósitos de la estimación de recursos.
Dependiendo del número de muestras dentro de las tres litologías encontradas dentro de la
zona enriquecida, estas litologías serán tratadas en forma separada o combinadas. La zona
lixiviada sería tratada en forma separada y, posiblemente, los leyes no serían estimados por
bloques dentro de esta zona ya que es aparentemente poco lucrativo.

Gráficos de Probabilidad

Los gráficos de probabilidad son presentados nuevamente aquí para hacer mención de dos
otros usos de los gráficos. Como se discutió previamente, estos gráficos pueden ser
utilizados para determinar sí acaso un conjunto de datos sigue o no una distribución
lognormal. Una vez que el modelo lognormal es aceptado, los gráficos pueden ser
utilizados para Ejemplo de Poblaciones Múltiples y Corte de Grado
determinar si el 3.5
conjunto de datos
contiene múltiples 2.5

poblaciones y para 1.5


ayudar a cortar los
valores escapados. El
Standard Deviations

0.5

siguiente gráfico de -0.5


probabilidades es de un
depósito de oro que -1.5

contiene tanto datos -2.5


aislados como
poblaciones múltiples. -3.5
0.01

0.02

0.06
0.08
0.10

0.20

0.40
0.60
0.80
1.00

2.00

6.00
8.00

La distribución
0.04

4.00

10.00

20.00

60.00
80.00
40.00

lognormal proporciona Gold Grade (g/t)


un ajuste razonable a
estos datos por lo tanto este modelo será utilizado. El gráfico de los puntos sobre el papel
de probabilidades
lognormal muestra dos porciones de líneas directas. Las líneas son ajustadas a cada una de
estas porciones de la distribución de leyes. Las líneas cruzan a alrededor de 0,08 g/t. Este
valor es poco económico por lo que la población de leyes de baja ley (Au<0,08)

______________________________________________________________________ 43
___________________________________________Curso de Geoestadística para Minería

probablemente no será tratada en forma diferente durante la interpolación de leyes. Esta


población de leyes corresponde probablemente al tonelaje de dilución (requerido para
forzar al cuerpo mineral a cumplir los anchos mínimos de la minería en este tipo de
depósito de veta) y la inclusión de estos leyes es necesaria para evaluar correctamente el
recurso.

En este caso, la razón para las poblaciones múltiples era conocida y no era una
preocupación. En otros casos, la razón para las poblaciones múltiples puede ser
desconocida, en tales casos, se requiere una mayor investigación con el geólogo del
proyecto para entender el porqué las poblaciones múltiples están apareciendo en el gráfico
de probabilidades y para determinar cómo trabajar en mejor forma con las poblaciones.
Ocasionalmente, hay alguna variable que no ha sido considerada en el análisis de datos y
esta variable puede ser utilizada para separar las poblaciones, otras veces puede haber
alguna deficiencia en el registro lo cual hizo que las poblaciones se mezclaran de forma
inapropiada, finalmente, puede haber verdaderamente una mezcla de poblaciones de ley
debido, por ejemplo, a múltiples pulsos de mineralización. Sólo a través de una
investigación minuciosa se puede determinar la razón de las poblaciones múltiples. Sin
embargo, este trabajo es crítico cada vez que las poblaciones múltiples son aparentes ya que
la calidad del estimador puede ser impactada en forma adversa.

En el ejemplo del gráfico de probabilidades lognormal se determinó que la población de


baja ley no era de suficiente interés como para considerar la división de las poblaciones.
Por lo tanto en este caso el mismo gráfico es utilizado para considerar leyes escapadas
(véase comentarios). Dos valores de datos caen bien fuera de la línea correspondiente a la
distribución lognormal. Si la distribución lognormal es aceptada como el modelo
apropiado para estos datos entonces estos valores no encajan en el modelo. Al aceptar el
modelo en preferencia a los datos, estos datos pueden ser cortados proyectando los valores
en forma horizontal de nuevo en la línea representando la distribución y dejándolos caer en
forma vertical para definir los leyes de corte. En el ejemplo, los valores escapados son 76 y
45 g/t. Estos son cortados a 22 y 38 g/t respectivamente.

Comentarios

Al discutir el efecto proporcional se establece que los datos que siguen una distribución
normal no exhiben un efecto proporcional. En realidad los datos deben seguir una
distribución multi-normal. Eso significa que todas las variables (en geoestadística una
variable es la ley en una ubicación específica) siguen distribuciones normales, todos los
pares de variables siguen distribuciones normales bivariadas, todas las variables triples
siguen distribuciones estándares trivariadas, etc. Es difícil probar si los datos siguen una
distribución multinormal; sin embargo, hay formas de determinar si los datos son
bivariados normales (Deutsh y Journel, 1998). Estas

formas se convierten en puntos importantes al aplicar técnicas avanzadas que dependen de


las suposiciones de normalidad múltiple.

El estimador “kriging” no hace suposiciones con respecto a la forma de la distribución que

______________________________________________________________________ 44
___________________________________________Curso de Geoestadística para Minería

siguen los datos. Las estimaciones están basadas en sólo la correlación presente en los
datos. Para el modelo de correlación específico, kriging es el mejor estimador no sesgado y
lineal. Esto no quiere decir que sea el mejor estimador posible. Por ejemplo, si se sabe que
los datos siguen verdaderamente una distribución multilognormal, entonces se puede
construir un mejor estimador que sea condicionalmente no sesgado (sin sesgo sobre ningún
margen de ley). Donde el estimador kriging es inadecuado es en la especificación de la
incertidumbre que rodea las estimaciones. La estimación de incertidumbre de kriging (la
varianza de kriging) no considera los leyes de los datos en forma alguna, así es que para la
gran mayoría de los yacimientos de minerales la varianza kriging proporciona poca
información útil con respecto a la incertidumbre.

Antes de desempeñar cualquiera de los análisis presentados en esta sección, los datos deben
ser ponderados según lo descrito en el Módulo 2 para asegurarse de que el largo de la
muestra o el agrupamiento de las perforaciones no sesgan artificialmente los resultados.

El manejo de los valores escapados es un tema muy delicado. Los valores de alta ley son
exactamente lo que todos los involucrados con el proyecto están buscando (en realidad es
probable que lo único que los geólogos, ingenieros, metalúrgicos y contadores siempre
estarán de acuerdo: las leyes altas son buenas para el proyecto). Ahora la pregunta es: ¿Son
ciertos ensayos o valores compuestos “demasiado altos”? Existen dos asuntos. El primero
es si los leyes de ensayo son creíbles. ¿Pueden deberse los valores a errores de ingreso de
datos o algún otro error introducido durante el muestreo, manejo de muestras o ensayo?
Habiéndonos asegurado de los valores son reales, la próxima pregunta es que tan
representativa es la muestra. En otras palabras: si otra muestra fuese tomada unos pocos
metros más lejos, ¿Reproduciría la ley aislada. Si es razonable creer que la ley aislada no
se extiende sobre una distancia considerable entonces la ley debería ser cortada. Las ideas
relacionadas con la distancia de extensión de los leyes aisladas pueden ser probadas
realizando una doble perforación o una de espaciado muy cercano (sí, esto es caro de hacer,
pero el costo puede ser fácilmente justificado). En algunos casos simplemente ensayando
la otra mitad del testigo puede demostrar que la distancia de extensión de las leyes aisladas
es tan pequeña como el diámetro del testigo. En un ejemplo de una mina de oro con alto
efecto pepita, las leyes más altas que 90 g/t en una de las mitades del testigo no calzaban
con la ley de la otra mitad mientras que las leyes menores que 90 g/t se correspondían bien
en ambas mitades del testigo. En este caso las leyes fueron cortadas a 90 g/t. El corte no
fue realizado porque las leyes no fuesen creíbles, sino más bien fue hecho porque dichas
leyes no podían ser extendidas. En esta forma, el corte es un método conservador para
restringir la influencia de leyes aisladas en donde la distancia de extensión permitida es
desconocida.

______________________________________________________________________ 45

Potrebbero piacerti anche