Sei sulla pagina 1di 32

UNIVERSIDAD NACIONAL DE CAJAMARCA

FACULTAD DE INGENIERIA

ESCUELA ACADEMICA PROFESIONAL DE INGENIERIA GEOLOGICA

GEOESTADISTICA

INTEGRANTES: HERNÁNDEZ VALENCIA, ERICK


MARCHENA CHAVEZ, GABRIEL

Cajamarca, Septiembre del 2018

AÑO : Tercero

CICLO : Sexto.

Cajamarca, Octubre de 2015.


1
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

INDICE

RESUMEN ...............................................................................................................................3
CAPITULO I. ASPECTOS GENERALES ................................................................................4
1.1. INTRODUCCION ............................................................................................ 4

1.2. OBJETIVOS ............................................................................................................. 4

1.2.1. OBJETIVO GENERAL .......................................................................................... 4


1.2.2. OBJETIVOS ESPECIFICOS ................................................................................. 5
CAPITULO II. MARCO TEÓRICO ...........................................................................................5
2.1. ANALISIS DE DATOS MEDIANTE HISTOGRAMAS ................................................... 5

2.2. CONSTRUCCION DE HISTOGRAMAS EXPERIMENTALES ................................... 10

2.3. MODELADO DE HISTOGRAMAS: ............................................................................ 16

2.3.1. DISTRIBUCION NORMAL ...................................................................................... 16

2.3.2. DISTRIBUCION LOG-NORMAL .............................................................................19

2.3.3. DISTRIBUCION EXPONENCIAL ............................................................................19

2.3.4. DISTRIBUCION BINOMIAL ........................................................................... 23

2.3.5. DISTRIBUCION DE POISSON ................................................................................25

2.3.6. DISTRIBUCION DE BERNOULLI ...........................................................................28

CONCLUSIONES ..................................................................................................................30

BIBLIOGRAFÍA Y LINKOGRAFÍA........................................................................................31

2
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

RESUMEN

En el presente trabajo monográfico presentamos el tema de análisis de datos


mediante histogramas en el cual tenemos como objetivos conocer la importancia
del estudio de los histogramas así como también explicar los diferentes tipos de
distribuciones y sus aplicaciones con algunos ejemplos.

En el marco teórico abarcaremos subtemas como la construcción de histogramas


experimentales de acuerdo a ciertos pasos ya establecidos. También
hablaremos sobre los distintos tipos de distribuciones como son la distribución
normal, lognormal, exponencial, binomial, de Poisson y binomial negativa de las
cuales hablaremos en el transcurso del presente tema.

3
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

CAPITULO I. ASPECTOS GENERALES

1.1. INTRODUCCION

Un histograma es una representación gráfica de una variable en forma de


barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados, ya sea en forma diferencial o acumulada.
Sirven para obtener una "primera vista" general, o panorama, de la
distribución de la población, o la muestra, respecto a una característica,
cuantitativa y continua, de la misma y que es de interés para el observador
(como la longitud o la masa). De esta manera ofrece una visión en grupo
permitiendo observar una preferencia, o tendencia, por parte de la muestra
o población por ubicarse hacia una determinada región de valores dentro
del espectro de valores posibles (sean infinitos o no) que pueda adquirir la
característica. Así pues, podemos evidenciar comportamientos, observar
el grado de homogeneidad, acuerdo o concisión entre los valores de todas
las partes que componen la población o la muestra, o, en contraposición,
poder observar el grado de variabilidad, y por ende, la dispersión de todos
los valores que toman las partes, también es posible no evidenciar ninguna
tendencia y obtener que cada miembro de la población toma por su lado y
adquiere un valor de la característica aleatoriamente sin mostrar ninguna
preferencia o tendencia, entre otras cosas.

1.2. OBJETIVOS

1.2.1. OBJETIVO GENERAL

 Dar a conocer el porque es importante el estudio y la


realización de un histograma.

4
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

1.2.2. OBJETIVOS ESPECIFICOS

 Determinar las diferentes distribuciones geoestadísticas y sus


diferencias de acuerdo a los parámetros de cada una.
 Explicar mediante pasos como se elabora un histograma
experimental.

CAPITULO II. MARCO TEÓRICO

2.1. ANALISIS DE DATOS MEDIANTE HISTOGRAMAS

Es la presentación en un resumen gráfico de una serie de medidas


clasificadas y ordenadas. Los histogramas de frecuencias
son diagramas de barras empleados para resumir e ilustrar la variación
que se presenta en un conjunto de datos. Sirven para investigar cómo se
puede solucionar un problema o mejorar un proceso.

5
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

CARACTERÍSTICAS:

 Síntesis

Permite resumir grandes cantidades de datos.

 Análisis

Permite el análisis de los datos evidenciando esquemas


de comportamiento y pautas de variación que son difíciles de
captar en una tabla numérica.

 Capacidad de comunicación

Permite comunicar información de forma clara y sencilla sobre


situaciones complejas.

6
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

USOS

 Mostrar el resultado de un cambio en el sistema


 Identificar anormalidades examinando la forma
 Comparar la variabilidad con los límites de especificación.

PROCEDIMIENTO:

 Reunir datos para localizar por lo menos 50 puntos de referencia.

 Calcular la variación de los puntos de referencia, restando el dato


del mínimo valor del dato del máximo valor.

7
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

𝑁𝑁𝑁𝑁𝑁 = 𝑁𝑁𝑁𝑁𝑁 𝑁á𝑁. −𝑁𝑁𝑁𝑁𝑁 𝑁í𝑁. = 1.44 − 1.27 =


0.17

 Calcular el número de barras que se usaran en el histograma


(un método consiste en extraer la raíz cuadrada del número de
puntos de referencia).

𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁 (𝑁𝑁) = √𝑁 ⟹𝑁𝑁 = √100 = 10

 Determinar el ancho de cada barra, dividiendo la variación entre


el número de barras por dibujar

𝑁 0.17
𝑁𝑁𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁 (𝑁𝑁) = = = 0.017 ≅ 0.02
𝑁𝑁 10

𝑁
𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 = 𝑁𝑁 = =
0.17/0.02 ≅ 9 𝑁
𝑁

 Calcule el intervalo o sea la localización sobre el eje X de las dos


líneas verticales que sirven de fronteras para cada barrera. Los
intervalos resultan de dividir el rango de los datos en relación al
resultado del PASO 3 en intervalos iguales.

8
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

 Construya una tabla de frecuencias que organice los puntos de


referencia desde el más bajo hasta el más alto de acuerdo con las
fronteras establecidas por cada barra.

9
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

 Elabore el histograma respectivo.

2.2. CONSTRUCCION DE HISTOGRAMAS EXPERIMENTALES

10
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Paso 1: Preparación de los datos

Como en todas las herramientas de análisis de datos, el primer paso


consiste en recoger estos de forma correcta o asegurarse de la
adecuación de los existentes.

Los datos deben ser:

- Objetivo: Basados en hechos, no en opiniones.

- Exactos: Debemos asegurarnos que la variabilidad en el proceso


de recogida de datos (variabilidad de la medida) no desvirtúa la
variabilidad del proceso en estudio.

- Completos: Se debe registrar toda la información relevante


asociada a cada toma de datos (máquina, hora del día, empleado,
etc.) en previsión de los diferentes análisis que pueden ser
necesarios.

- Representativos: Deben reflejar todos los diferentes hechos y


circunstancias que se producen en la realidad.

Paso 2: Determinar los valores extremos de los datos y el recorrido

Identificar en la tabla de datos originales el valor máximo, el valor


mínimo y el recorrido (R = Vmax - Vmin).

Paso 3: Definir las "clases" que contendrá el Histograma

Clases: Son los intervalos en que se divide la característica sobre la que


se han tomado los datos. El número de clases es igual al de barras del
Histograma.

11
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

a) Dependiendo del número de clases en que agrupemos los datos


perderemos más o menos información tratando de identificar la
pauta de comportamiento.

b) Obtener la amplitud del intervalo de cada clase.

Todas las clases tendrán el mismo intervalo. No habrá solapamiento entre


distintas clases.

La amplitud aproximada del intervalo se halla dividiendo el recorrido por el


número de clases.

Esta amplitud se redondea posteriormente a un número o cifra decimal


conveniente para el manejo de las clases y la graduación del eje horizontal
del Histograma (1, 2, 5, 10, etc.).

Paso 4: Construir las clases anotando los límites de cada una de ellas

Los límites de la primera clase incluirán el valor mínimo de los


datos.

12
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Paso 5: Calcular la frecuencia de clase

Determinar el número de datos que están incluidos en cada una de


las clases (frecuencia de clase).

Comprobar que el número total de datos es igual a la suma de las


frecuencias de cada clase.

Paso 6: Dibujar y rotular los ejes

El eje vertical representa las frecuencias, por tanto en él se rotularán


números naturales, dependiendo su valor y escala del número de
datos que se han tomado.

El eje horizontal representa la magnitud de la característica medida


por los datos. Este eje se divide en tantos segmentos iguales como
clases se hayan definido. Rotular los límites de los intervalos de
clase. Rotular el eje con la característica representada y las
unidades de medida empleadas.

13
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Paso 7: Dibujar el Histograma

Dibujar las barras verticales correspondientes a cada clase. Su base


está situada en el eje horizontal y su altura corresponderá a la
frecuencia de la clase representada.

Paso 8: Rotular el Gráfico

Cuando proceda, poner el título, las condiciones en que se han


recogido los datos, los límites de tolerancia nominales, etc. Estas
notas ayudan a los demás a interpretar el gráfico y sirven de
recordatorio de la fuente de los datos.

Por ejemplo: se tomaron 68 porciones de roca para estudiar la


distribución del cobre en una mina. Los resultados (en g/tn) son:

423,07; 452,23;...…; 561,34.

Es necesario dividir a la variable en distintos intervalos de clase. Cada


intervalo a su vez posee una amplitud determinada. No hay un número
de intervalos exactos, pero una aproximación a éste fue propuesta por
Sturges en 1936 que se obtiene mediante la fórmula:

k= 1+3,33 Log10(n)

14
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Donde k es el número óptimo de intervalos.

Tabla de distribución de frecuencias de la variable ley de Cobre

Dónde:

 X: variable ley de Cobre (en g/tn)


 MC: Marca de clase (se obtiene promediando los extremos del
intervalo)
 𝑁𝑁: Frecuencia Absoluta: número de elementos que se
encuentran en un determinado intervalo de valores de la variable.
 ℎ 𝑁 : Frecuencia Relativa: proporción de elementos que se
encuentran en un determinado intervalo de valores de la variable.
 𝑁𝑁 ↓ Frecuencia Absoluta Acumulada ascendente: número de
elementos acumulados que poseen un valor determinado de la
variable y sus valores inferiores.
 𝑁𝑁↓ Frecuencia Relativa Acumulada ascendente: proporción
de elementos acumulados que poseen un valor determinado
de la variable y sus valores inferiores.
 𝑁𝑁 ↑ Frecuencia Absoluta Acumulada descendente: número de
elementos acumulados que poseen un valor determinado de la
variable y sus valores superiores.
 𝑁𝑁↑ Frecuencia Relativa Acumulada descendente: proporción
de elementos acumulados que poseen un valor determinado de
la variable y sus valores superiores

15
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

A partir de la tabla se pueden construir dos tipos de gráficos: histogramas


de frecuencias y su respectivo gráfico acumulado.

Representación gráfica de una distribución. Se presenta un histograma de


frecuencias (izquierda) y de frecuencias acumuladas (derecha).

Se observa en la primera grafica la presencia de un polígono de


frecuencias que pasa por el valor central de cada intervalo y en la segunda
grafica una ojiva de frecuencias que pasa por el mayor valor del intervalo.

2.3. MODELADO DE HISTOGRAMAS:

2.3.1. DISTRIBUCION NORMAL

Muchas variables geológicas siguen una distribución de tipo normal


o gaussiano. Son algunos ejemplos: el relieve topográfico, la
esfericidad y redondez para un tamaño de grano determinado, el
nivel de agua en acuíferos a través del tiempo, la densidad de
drenaje, la densidad de empaquetamiento de granos de arena,
ciertas dimensiones de especímenes de invertebrados fósiles, la
humedad en sedimentos y los errores de medición casuales.

Por otra parte, el modelo normal es el más importante en el análisis


estadístico pues, las distribuciones de muchas estadísticas de
muestra se aproximan a la distribución normal como un límite
cuando el tamaño de la muestra es grande.

16
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Una variable aleatoria X, tiene una distribución normal general,


también se dice está normalmente distribuida, si:

Es continua.

Existen las constantes 𝑁 (promedio poblacional) y 𝑁 (desvío


estándar poblacional), con 𝑁 entre +∞ y -∞, (−∞ < 𝑁 < +∞) y el
desvío estándar mayor que cero (𝑁 > 0).

La función de densidad se puede calcular de la siguiente manera:

(𝑁− 𝑁)2
1 − ⁄ 2
𝑁(𝑁; 𝑁; 𝑁) = 2𝑁 (−∞ < 𝑁 < +∞)
𝑁
𝑁√2𝑁

donde 𝑁 = 2,718 y 𝑁 = 3,142. Los dos parámetros que definen la


distribución normal son 𝑁 𝑁 𝑁.

(𝑁 − 𝑁)2
El exponente − ⁄ 2 tiene 𝑁, un valor particular de la
2𝑁
variable, y a los parámetros 𝑁 y 𝑁. Cuanto mayor es la desviación
de un valor 𝑁 con relación a la media 𝑁, tanto menor (más
negativo) es el numerador de este exponente. La desviación,𝑁,
está elevada al cuadrado, por lo que dos valores de 𝑁 que
muestren la misma desviación respecto a 𝑁 tienen la misma
probabilidad lo que implica que se una distribución simétrica (Fig.
6).

El signo negativo del exponente indica que cuanto más alejado se


encuentra 𝑁 de 𝑁, menor es el área bajo la curva de densidad de
probabilidad. Por otra parte, cuando 𝑁 = 𝑁 , el exponente es cero y
la densidad es 1 , el valor más grande de la densidad normal.
𝑁√𝑁

Además la distribución tiene una sola moda con valor 𝑁 = 𝑁.

17
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

La curva tiene una amplitud infinita, nunca toca el eje X, no


obstante si 𝑁 está muy alejado de 𝑁, su probabilidad es
despreciable. El 99% del área bajo la curva queda comprendido
por valores de 𝑁 que se alejen 3 ± 𝑁 de 𝑁. Conviene recordar
también que el 95% del área bajo la curva se encuentra limitado
por valores de 𝑁 ≤ 𝑁 ± 2𝑁 y el 68% por valores de 𝑁 ≤ 𝑁 ± 𝑁 y (Fig.

6).Un cambio en el valor de 𝑁, desplaza la distribución hacia la


derecha o la izquierda (Fig. 7a). Un cambio en el valor de 𝑁
cambia la forma, cuanto más pequeño es aumenta al máximo el
valor de
𝑁(𝑁) (Fig. 7b).

𝑁𝑁𝑁 ú𝑁𝑁𝑁𝑁𝑁 𝑁𝑁 ℎ 𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁


𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁:

𝑁(𝑁) = 𝑁

𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁:

18
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

𝑁(𝑁) = 𝑁2

19
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

2.3.2. DISTRIBUCION LOG-NORMAL

En probabilidades y estadísticas, la 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁ó𝑁 𝑁𝑁𝑁 −


𝑁𝑁𝑁𝑁𝑁𝑁 es una distribución de probabilidad de una variable
aleatoria cuyo logaritmo está normalmente distribuido. Es decir,
si X es una variable aleatoria con una distribución normal, entonces
𝑁𝑁𝑁(𝑁) tiene una distribución 𝑁𝑁𝑁 − 𝑁𝑁𝑁𝑁𝑁𝑁.

La base de una función logarítmica no es importante, ya que 𝑁𝑁𝑁𝑁


𝑁 está distribuida normalmente si y sólo si 𝑁𝑁𝑁𝑁 𝑁 está
distribuida normalmente, sólo se diferencian en un factor
constante.

𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁ó𝑁 𝑁𝑁𝑁
− 𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁 𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁ó𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁:

1 − (log 𝑁−𝑁)
𝑁(𝑁; 𝑁; 𝑁) = ⁄ 2
2𝑁

𝑁
𝑁𝑁√2𝑁

𝑁𝑁𝑁𝑁 𝑁 > 0,
𝑁𝑁𝑁𝑁𝑁 𝑁 𝑁 𝑁 𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁 𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁ó𝑁 𝑁𝑁𝑁á𝑁𝑁𝑁𝑁 𝑁𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁.

𝑁𝑁 𝑁𝑁𝑁𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑁𝑁:

𝑁+𝑁2

𝑁(𝑁) = 𝑁 2

𝑁 𝑁𝑁 𝑁𝑁𝑁𝑁𝑁𝑁𝑁𝑁
𝑁𝑁: 2 2
𝑁𝑁𝑁(𝑁) = (𝑁𝑁 − 1)𝑁2𝑁+𝑁

2.3.3. DISTRIBUCION EXPONENCIAL

La distribución exponencial es una distribución de


probabilidad continua con un parámetro cuya función de
densidad es:

20
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Su función de distribución acumulada es:

21
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

El valor esperado y la varianza de una variable aleatoria X con


distribución exponencial son:

La distribución exponencial es un caso particular de distribución


gamma con k = 1. Además la suma de variables aleatorias que siguen
una misma distribución exponencial es una variable aleatoria
expresable en términos de la distribución gamma.

2.3.3.1. Ejemplo

Ejemplos para la distribución exponencial es la distribución de la


longitud de los intervalos de una variable continua que transcurren
entre dos sucesos, que se distribuyen según la distribución de
Poisson.

 El tiempo transcurrido en un muestreo hasta obtener la primera


muestra del día se podría modelar como una exponencial.

 El intervalo de tiempo entre terremotos (de una determinada


magnitud) sigue una distribución exponencial.

 Las fuerzas tectónicas presentes en un área hasta la


producción de una falla se podría modelar como una
exponencial.

 En fiabilidad de sistemas, un dispositivo con tasa de fallo


constante sigue una distribución exponencial.

2.3.3.2. Calcular variables aleatorias

Se pueden calcular una variable aleatoria de distribución


exponencial por medio de una variable aleatoria de distribución

uniforme :

22
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

o, dado que es también una variable aleatoria con


distribución , puede utilizarse la versión más eficiente:

2.3.3.3. Parámetros

Parámetros

Dominio

Función de densidad (pdf)

Función de distribución (cdf)

Media

Mediana

Moda

Varianza

Coeficiente de simetría

Curtosis

Entropía

23
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Función generadora de
momentos (mgf)

Función característica

2.3.4. DISTRIBUCION BINOMIAL

Esta es una distribución discreta. En otros trabajos, a cada número


entero, desde cero hasta n, se asocia una probabilidad. Es posible
utilizar esta distribución para los grados, simplemente agrupando los
datos y asignando a cada clase los valores 0, 1, 2,…, n.

2.3.4.1. Ecuación y forma


La ecuación de esta distribución envuelve dos parámetros, n y p:

𝑁
Prob { x = k } = [ ] ( 𝑁 − 𝑁 )𝑁−𝑁 𝑁𝑁
𝑁

Que se puede interpretar como la probabilidad de obtener k bolas


negras n dibujadas con reemplazo, de una población donde las bolas
negras se encuentran en una proporción p.

La media de la distribución es np y la varianza es np ( 1 - p) . Puede


asumir una variedad de formas que puede verse en la figura adjunta.
Un hecho interesante es que cuando n tiende al infinito, x tiende a la
normalidad y en consecuencia ( x - np ) / 2√𝑁𝑁(1 − 𝑁) se convierte en
una variable normal unidad.

24
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

2.3.4.2. Ejemplo

Un ejemplo de aplicación se da por Contras (1964). Se refiere a la


distribución de grado de magnetita en el mineral de hierro de Labrador.
Este autor encontró que si porcentajes se transforman en números
enteros de modo que 1 corresponde a 7,5 % de magnetita, a
continuación, la distribución de los grados está representada
adecuadamente por una distribución binomial. El aspecto interesante
del modelo radica en la forma en que se puede utilizar para predecir el
número de muestras que se deben tomar para lograr una certeza dada
en el valor estimado de una explotación. Otros ejemplos y
generalización se pueden encontrar en Beckker (1964) y Hazen
(1967). Es muy útil en las preguntas sobre el tamaño de muestra y
preparación de la muestra.

2.3.4.3. Modelo apropiado

El estimador de máxima verosimilitud de p se obtiene directamente de


la media de la muestra desde x = np, siendo n el número total de la
muestra. La tecnología permite evitar el cálculo, mediante un programa
de ordenador por Ondrick y Griffiths (1969) que lo hace de forma
automática. Además, existen tablas que dan la probabilidad de que x
sea igual a k, como una función de p y n. Un interesante conjunto de
tablas se encuentra en Abramovitz y Stegun (1964).

25
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Figura adjunta. Diferentes formas posibles de la distribución binomial


para proporciones variables p y un número constante de sorteos n.

2.3.5. DISTRIBUCION DE POISSON

Muchos hechos no ocurren como resultado de un número definido de


pruebas de un experimento, sino en puntos de tiempo, espacio o
volumen al azar. El hecho puede ser el número de ocurrencias de
fósiles con ciertas características en x cm3 de sedimentos, el número
de partículas radiactivas emitidas por x cantidad de sustancia, el
número de terremotos en x años, etcétera. Experimentos de este tipo
se conocen como experimentos Poisson (atribuido al matemático
francés S.D. Poisson, 1781-1840) y reúnen las siguientes
características:

a) El número de ocurrencias del hecho es independiente de una unidad


especificada a otra. La unidad especificada puede ser un intervalo de
tiempo, de espacio o un volumen.
b) El valor esperado de la variable es proporcional al tamaño de la
unidad especificada.

26
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

c) La probabilidad de más de una ocurrencia del hecho en una unidad


especificada muy pequeña es despreciable en comparación con la
probabilidad de una sola ocurrencia; por lo tanto puede considerarse
nula.
d) Las pruebas son independientes.
e) La variable aleatoria bajo estudio es X, el número de ocurrencias
por unidad especificada.
f) La variable aleatoria Poisson es discreta y tiene infinitos valores
posibles.
g) La función de probabilidad Poisson, del número de ocurrencias por
unidad especificada queda completamente definida por su promedio
de ocurrencia en esa unidad especificada, el parámetro llamado
Lambda (𝑁).
h) La función de probabilidad que permite calcular la probabilidad de
obtener exactamente x ocurrencias en la unidad especificada es
𝑁𝑁
𝑁𝑁(𝑁, 𝑁) = 𝑁−𝑁
𝑁!

La distribución es asimétrica positiva pero la asimetría disminuye al


aumentar λ (Fig. 4).

i) La Esperanza de una variable Poisson es E(X) = 𝑁.

j) La varianza de una variable Poisson es V(X) = 𝑁.

27
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

k) La función de distribución acumulada de una variable Poisson, como


la de cualquier variable aleatoria discreta, da la probabilidad de
obtener r ó menos ocurrencias, se obtiene sumando las probabilidades
de obtener las probabilidades individuales para todos los valores
Poisson iguales o menores a r, es decir

𝑁𝑁(𝑁; 𝑁) = 𝑁(𝑁 ≤ 𝑁)

𝑁𝑁 = ∑ 𝑁𝑁 (𝑁; 𝑁)
𝑁=0

EJEMPLO:

Un evento que ocurre más de una vez, o se espera que ocurra más de
una vez, se dice que es recurrente.

El periodo de retorno es el intervalo de tiempo esperado entre


ocurrencias. El Popocatépetl es el volcán activo más alto de México. A
partir del estudio del historial de las erupciones se estimó el periodo de
retorno en 0,0202 años-1.

a) Calcular las probabilidades de tener 1, 2 y ninguna erupción en 20


años.

𝑁 = 0,0202 erupciones en un año. Como 𝑁 es


𝑁 = 0,404

28
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Ninguna erupción x = 0, una erupción x=1 y dos erupciones x=2.

e = 2.71828

𝑁−0.404 ∗ 0.4040
𝑁𝑁(0; 0.404) = = 0.668
0!

𝑁−0.404 ∗ 0.4041
𝑁𝑁(1; 0.404) = = 0.270
1!

𝑁−0.404 ∗ 0.4042
𝑁𝑁(2; 0.404) = = 0.054
2!

Algunas variables geológicas que siguen el modelo Poisson son:


minerales raros en rocas expresados como número de granos en
muestras de un tamaño dado, número de pozos de petróleo por área
en un yacimiento, el número de partículas emitidas por unidad de
tiempo de sedimentos radioactivos y todo evento u objeto que se
pueda contar en unidades iguales de área, volumen o intervalos de
tiempo iguales. También suele describir adecuadamente a los eventos
raros como inundaciones, tsunamis, actividad volcánica, etcétera.

2.3.6. DISTRIBUCION DE BERNOULLI

El modelo Bernoulli es el más sencillo de todos los modelos. Es


apropiado para describir experimentos que sólo resultan en un hecho
o en su opuesto tales como hallar petróleo (éxito) o no hallarlo
(fracaso) al perforar un pozo, proposiciones si o no (presencia de
fósiles, estructuras), entre otros.

29
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

Entonces una variable aleatoria Bernoulli X que toma solamente los


valores 0 y 1, con probabilidades respectivamente p y q = 1 – p (0 ≤ p
≤ 1).

La función de distribución de la variable Bernoulli es

𝑁(𝑁) = (𝑁. 𝑁) 𝑁 (𝑁. 𝑁)

Se puede probar que la esperanza y la varianza de este modelo son:

𝑁(𝑁) = ∑ 𝑁𝑁𝑁(𝑁𝑁) = 𝑁
𝑁

𝑁(𝑁) = 𝑁𝑁

El modelo Bernoulli tiene solo un parámetro p, aunque la mayoría de


las veces p es conocido, puede suceder que no lo sea.

30
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

CONCLUSIONES

 El histograma nos ayuda a solucionar un problema o mejor un


proceso en el cual estamos inmersos, ya sean geológicos u otros
ámbitos.
 La distribución normal, distribución de Gauss o distribución
gaussiana, es una de las distribuciones de probabilidad de
variable continua que con más frecuencia aparece aproximada en
fenómenos.
 La distribución binomial refleja el control en espacio y tiempo de
una variable Casi uniforme

31
UNIVERSIDAD NACIONAL DE CAJAMARCA
Facultad de Ingeniería
Escuela Académico Profesional de Ingeniería Geológica

BIBLIOGRAFÍA Y LINKOGRAFÍA

 DAVID MICHEL: Geostatistical ore reserve estimation Elsevier Scientific


Publishing Company. New York 1977
 MARTA ALPERIN. Introducción al análisis estadístico de datos
geológicos. Editorial de la Universidad Nacional de la Plata. Buenos
Aires 2013.
 http://www.uhu.es/fexp/segeo2012/arc/comunicaciones/08.pdf

 http://meteo.fisica.edu.uy/Materias/Analisis_Estadistico_de_Datos_Clima
ticos/2013/Distribuciones_Probabilidad_2013.pdf

 https://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial_negativa

 https://www.academia.edu/9826586/El_empleo_de_histogramas_y_de_l
os_pol%C3%ADgonos_de_frecuencia_en_la_interpretaci%C3%B3n_de
_los_datos_geoqu%C3%ADmicos

32

Potrebbero piacerti anche