Sei sulla pagina 1di 27

FACULTAD DE INGENIERÍA.

DEPARTAMENTO DE INGENIERÍA CIVIL


INDUSTRIAL EN MINAS.

Estudio Exploratorio de Datos


Análisis Estadístico

Asignatura: Evaluación de Yacimiento


Alumno: Matías Arenas Peñailillo
Profesor: Daniel Pinto

Antofagasta, 24 de octubre de 2018


Introducción

La finalidad del Análisis Exploratorio de Datos (AED) es examinar los datos


previamente a la aplicación de cualquier técnica estadística. De esta forma el
analista consigue un entendimiento básico de sus datos y de las relaciones
existentes entre las variables analizadas.
El AED proporciona métodos sencillos para organizar y preparar los datos, detectar
fallos en el diseño y recogida de datos, tratamiento y evaluación de datos ausentes,
identificación de casos atípicos y comprobación de los supuestos subyacentes en
la mayor parte de las técnicas multivariantes.
Conceptos básicos de estadística

Medidas De Tendencia Central: Intentan identificar el dato más representativo de


la distribución del conjunto.
- La media: Resultado que se obtiene al dividir la suma de varias cantidades
por el número de sumandos.

- Mediana: divide al conjunto de datos en dos partes iguales.

- Moda: es el dato que más veces se repite, aquel rango que presenta mayor
frecuencia absoluta.
Estadística descriptiva: se dedica a los métodos de recolección, descripción,
visualización y resumen de datos originados a partir de los fenómenos de estudio.
Para analizar los datos usualmente se construye las tablas de frecuencia y se
utilizan:
Medidas de Dispersión: Nos dan una idea sobre la homogeneidad o que tan
agrupado están los datos.

- Desviación estándar: indica cuanto tienden a alejarse los valores puntuales


de la media.

- Varianza: describe la variabilidad de la distribución, es la medida de la


desviación o dispersión de la distribución.

Coeficiente de variación:

En estadística, cuando se desea hacer referencia a la relación entre el tamaño de la media y la


variabilidad de la variable, se utiliza el coeficiente de variación.

Su fórmula expresa la desviación estándar como porcentaje de la media aritmética, mostrando


una mejor interpretación porcentual del grado de variabilidad que la desviación típica o estándar.
Por otro lado presenta problemas ya que a diferencia de la desviación típica este coeficiente es
variable ante cambios de origen.
-
Medidas De Forma: Miden el grado de deformación respecto a una curva
patrón (Distribución Normal).

- Coeficiente de curtosis: mide el grado de aplastamiento o apuntamiento de


la gráfica de la distribución de la variable estadística.

- Coeficiente de sesgo o asimetría: evalúa el grado de distorsión o


inclinación que adopta la distribución de los datos respecto a su valor
promedio tomando como centro de gravedad.
COLLAR:
Esta planilla representa lo puntos de superficie donde se encuentra los sondajes de
exploración, en nuestro caso de estudio son 230 sondajes, en esta planilla
encontramos puntos de ubicación espacial, coordenadas sobre la topografía.

A partir de los datos entregados se puede obtener la elevación mínima y máximos,


así como también las coordenadas Este y Norte con sus respectivos máximos y
mínimos, los cuales se muestran a continuación:

Distribución Espacial de Los Datos

Mínimo Este 76087.289


Máximo Este 78957.766
Mínimo Norte 3514.17
Máximo Norte 5072.413
Mínimo Cota 92.75
Máxima Cota 303.24

La distribución espacial de los sondeos de exploración se puede representar gráficamente


utilizando como variable independiente y dependiente a las coordenadas este y norte
respectivamente:
Gráfico de Distribución Espacial
5100

4900

4700

4500
Norte

4300

4100

3900

3700

3500
76000 76500 77000 77500 78000 78500 79000
Este

Es en este archivo donde se completa la base de datos con las siguientes variables
involucradas:

Dhid: Nombre del sondaje.


Este: Coordenadas Este.
Norte: Coordenadas Norte
Cota: Elevación altura.

A partir de este archivo, se aplica un análisis a sus variables respectivas y de esta


manera se puede obtener los limites de las dimensiones del proyecto en sí.

La Distribución espacial de los datos se encuentra de la siguiente forma:


Vista en planta de los sondajes

Vista de perfil de los sondajes

Estos mapas corresponden a una campaña de sondajes diamantinos, se puede


observar que la disposición de los datos se concentra en la zona central del
yacimiento, además de algunos sondajes que se encuentran hacia los limites o más
aislados del resto de estos.
SURVEY

La planilla SURVEY hace referencia a los datos topográficos, azimut e inclinaciones


(Dip) dentro de la zona de estudio.
Las variables involucradas dentro de este archivo se presentan a continuación:

Donde:
Dhid: Nombre del sondaje (no es necesario colocar esta variable debido a que se
realiza un Primary key (¨anclaje¨) al momento de realizar el archivo COLLAR)
Profundidad: Profundidad de la muestra
Azimut: azimut
Dip.: Inclinación
No se realizó un análisis en particular.

ASSAYS O LEYES

En esta carpeta se almacena la información de las leyes de los minerales para el desarrollo
del proyecto junto con la data de localización de los sondajes.
De este archivo se obtuvieron 12122 datos, de los cuales 1529 se obviaron por tener leyes
negativas o ser iguales a cero por lo que se consideraron como material estéril, el cual
representa un 13% de este.
Es con esta información que se puede obtener un análisis estadístico de la distribución de
las leyes de cobre total.

Mineral 1529 87%


Estéril 10593 13%
Total de datos 12122 100%
Tabla 2. %Mineral y Estéril presente
Mineral v/s Esteril
14000

12000

10000

8000

6000

4000

2000

0
Mineral Esteril Total de datos

Como se muestra en la tabla adjunta el mineral representa el 87% del total de datos,
siendo 10593 el número exacto de muestras y un total de 1529 para las muestras
estériles.

Resumen Estadístico para CUT


Recuento 10593
Promedio 0.537163
Desviación Estándar 0.834602
Coeficiente de Variación 155.372%
Mínimo 0.008
Máximo 11.58
Rango 11.572
Sesgo Estandarizado 123.852
Curtosis Estandarizada 298.839

Esta tabla muestra los estadísticos de resumen para CUT. Incluye medidas de tendencia
central, medidas de variabilidad y medidas de forma. De particular interés aquí son el sesgo
estandarizado y la curtosis estandarizada, las cuales pueden utilizarse para determinar si
la muestra proviene de una distribución normal. Valores de estos estadísticos fuera del
rango de -2 a +2 indican desviaciones significativas de la normalidad, lo que tendería a
invalidar cualquier prueba estadística con referencia a la desviación estándar. En este
caso, el valor de sesgo estandarizado no se encuentra dentro del rango esperado para
datos provenientes de una distribución normal. El valor de curtosis estandarizada no se
encuentra dentro del rango esperado para datos provenientes de una distribución normal.

Como el coeficiente de variación es 1.55 podemos revisar la tabla anteriormente


descrita en el capítulo de estadística, según el enunciado podemos decir que
tenemos una distribución altamente sesgadas con un gran rango de leyes, que
pueden dificultar a la hora de estimar los recursos locales.

A través del software Statgraphic se realizaron los histogramas de frecuencia y


acumuladas para modelar de mejor manera la variable Cut% contenida en nuestra
base de datos.

Histograma de %CuT
Frecuencia de los Datos Según Intervalos
10000

8000

6000 Frecuencia de los Datos

4000 Polinómica (Frecuencia de


los Datos)
2000

0
1 2 3 4 5 6 7 8 9 10

El grafico presenta asimetría positiva y curtosis leptocúrtica (debido a que


presenta una forma puntiaguda) positiva, al aumentar la frecuencia, disminuye la
ley de Cu.
En este caso se aprecia los intervalos de leyes en los que están las muestras, y la
cantidad de datos que hay en cada ley, y la frecuencia que alcanza cada intervalo con su
marca de clase respectiva

Este histograma acumulado presenta una distribución Log Normal.


Geología
Esta planilla contiene la información del tipo de roca de la zona, en este trabajo este
archivo contribuye con la caracterización del cuerpo mineralizado, como podemos
ver en la siguiente tabla, que es un extracto del archivo original.

Este archivo presenta los siguientes datos:

From: Desde donde comienza la muestra.


To: ubicación de finalización de la muestra.
Geol: Tipo de roca.

Los tipos de rocas son los siguientes: TQz, TQ2, TQ3, TQ4, TQ5, TQ6, TQ7, TQ8,
TQ 9, TQ10, TQ11, TQ12, TQ13 y TQ1a
Para poder realizar un análisis estadístico según las leyes y el tipo de roca se tuvo
que realizar una compositación a través del software VULCAN.
El compósito de los sondajes nos permitió regularizar los sondajes a intervalos de
igual medida, en este caso compositamos a 1 metro.

Donde:
Dhid: Nombre del sondaje
Midx, Midy, Midz: Son coordenadas de los sondajes en los 3 ejes
Length: Soporte del compósito
From: Donde comienza el tipo de roca o muestra
To: Donde finaliza el tipo de roca o la compositación
Cut: Ley de cobre %

Tipo de Roca TQ1

Resumen Estadístico para TQ1


Recuento 1562
Promedio 1.11823
Desviación Estándar 1.0029
Coeficiente de Variación 89.6868%
Mínimo 0.007
Máximo 10.19
Rango 10.183
Sesgo Estandarizado 39.9436
Curtosis Estandarizada 94.3835
Tipo de Roca TQ1a

Resumen Estadístico para TQ1a


Recuento 683
Promedio 1.03309
Desviación Estándar 0.891625
Coeficiente de Variación 86.3066%
Mínimo 0.005
Máximo 6.71
Rango 6.705
Sesgo Estandarizado 17.374
Curtosis Estandarizada 19.0738
Tipo Roca TQ2

Resumen Estadístico para TQ2


Recuento 522
Promedio 1.00683
Desviación Estándar 0.930759
Coeficiente de Variación 92.4446%
Mínimo 0.011
Máximo 4.748
Rango 4.737
Sesgo Estandarizado 12.9767
Curtosis Estandarizada 7.97034
Tipo Roca TQ3

Resumen Estadístico para TQ3


Recuento 1010
Promedio 0.996245
Desviación Estándar 0.781717
Coeficiente de Variación 78.4663%
Mínimo 0.011
Máximo 4.321
Rango 4.31
Sesgo Estandarizado 14.8528
Curtosis Estandarizada 7.43229
Tipo Roca TQ4

Resumen Estadístico para TQ4


Recuento 296
Promedio 0.755753

Desviación Estándar 0.613471


Coeficiente de Variación 81.1734%
Mínimo 0.01
Máximo 3.59

Rango 3.58
Sesgo Estandarizado 13.0935
Curtosis Estandarizada 18.0536
Tipo Roca TQ5

Resumen Estadístico para TQ5


Recuento 214
Promedio 0.574505
Desviación Estándar 0.478557
Coeficiente de Variación 83.299%
Mínimo 0.004
Máximo 2.71
Rango 2.706
Sesgo Estandarizado 10.0982
Curtosis Estandarizada 10.871
Tipo de Roca TQ6

Resumen Estadístico para TQ6


Recuento 129
Promedio 0.443876

Desviación Estándar 0.452371


Coeficiente de Variación 101.914%
Mínimo 0.03
Máximo 2.81

Rango 2.78
Sesgo Estandarizado 14.7595
Curtosis Estandarizada 28.8218

Intervalos de Confianza para TQ6


Intervalos de confianza del 95.0% para la media: 0.443876 +/- 0.0788088 [0.365067, 0.522685]
Intervalos de confianza del 95.0% para la desviación estándar: [0.40309, 0.515497]
Tipo de Roca TQ7

Resumen Estadístico para TQ7


Recuento 218
Promedio 0.789486
Desviación Estándar 0.788986
Coeficiente de Variación 99.9367%
Mínimo 0.044
Máximo 4.64
Rango 4.596
Sesgo Estandarizado 14.3919
Curtosis Estandarizada 19.4451

Intervalos de Confianza para TQ7


Intervalos de confianza del 95.0% para la media: 0.789486 +/- 0.105322 [0.684164, 0.894808]
Intervalos de confianza del 95.0% para la desviación estándar: [0.721222, 0.87092]
Tipo de Roca TQ8

Resumen Estadístico para TQ8


Recuento 91
Promedio 0.435
Desviación Estándar 0.447959
Coeficiente de Variación 102.979%
Mínimo 0.015
Máximo 3.24
Rango 3.225
Sesgo Estandarizado 13.5658
Curtosis Estandarizada 33.0033

Intervalos de Confianza para TQ8


Intervalos de confianza del 95.0% para la media: 0.435 +/- 0.0932921 [0.341708, 0.528292]
Intervalos de confianza del 95.0% para la desviación estándar: [0.390993, 0.524509]
Tipo de Roca TQ9

Resumen Estadístico para TQ9


Recuento 136
Promedio 0.384493
Desviación Estándar 0.373011
Coeficiente de Variación 97.0138%
Mínimo 0.056
Máximo 3.036
Rango 2.98
Sesgo Estandarizado 22.5587
Curtosis Estandarizada 64.1139

Intervalos de Confianza para TQ9


Intervalos de confianza del 95.0% para la media: 0.384493 +/- 0.0632574 [0.321235, 0.44775]
Intervalos de confianza del 95.0% para la desviación estándar: [0.333326, 0.423512]
Tipo de Roca TQ10

Resumen Estadístico para TQ10


Recuento 41
Promedio 0.832805

Desviación Estándar 0.429739


Coeficiente de Variación 51.6014%
Mínimo 0.17
Máximo 1.988

Rango 1.818
Sesgo Estandarizado 1.44137
Curtosis Estandarizada -0.0420867

Intervalos de Confianza para TQ10


Intervalos de confianza del 95.0% para la media: 0.832805 +/- 0.135643 [0.697162, 0.968447]
Intervalos de confianza del 95.0% para la desviación estándar: [0.352821, 0.549852]
Tipo de Roca TQ11

Resumen Estadístico para TQ11


Recuento 99
Promedio 0.628899
Desviación Estándar 0.632063
Coeficiente de Variación 100.503%
Mínimo 0.03
Máximo 3.408
Rango 3.378
Sesgo Estandarizado 9.29686
Curtosis Estandarizada 12.3277

Intervalos de Confianza para TQ11


Intervalos de confianza del 95.0% para la media: 0.628899 +/- 0.126063 [0.502836, 0.754962]
Intervalos de confianza del 95.0% para la desviación estándar: [0.554613, 0.734855]
Tipo de Roca TQ12

Resumen Estadístico para TQ12


Recuento 43
Promedio 0.607744
Desviación Estándar 0.97621
Coeficiente de Variación 160.628%
Mínimo 0.012
Máximo 4.78
Rango 4.768
Sesgo Estandarizado 8.56984
Curtosis Estandarizada 13.5342

Intervalos de Confianza para TQ12


Intervalos de confianza del 95.0% para la media: 0.607744 +/- 0.300434 [0.30731, 0.908178]
Intervalos de confianza del 95.0% para la desviación estándar: [0.804925, 1.24077]
Tipo de Roca TQ13

Resumen Estadístico para TQ13


Recuento 20
Promedio 0.31135

Desviación Estándar 0.0554942


Coeficiente de Variación 17.8237%
Mínimo 0.21
Máximo 0.39

Rango 0.18
Sesgo Estandarizado -0.16264
Curtosis Estandarizada -1.30966

Intervalos de Confianza para TQ13


Intervalos de confianza del 95.0% para la media: 0.31135 +/- 0.0259721 [0.285378, 0.337322]
Intervalos de confianza del 95.0% para la desviación estándar: [0.0422028, 0.0810533]

Potrebbero piacerti anche