Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
AO: TERCERO
TACNA - PER
2014
INTRODUCCIN
La estadstica es una forma de Recopilar, Clasificar, Describir los datos que uno va a
estudiar para hacer un anlisis estadstico descriptivo donde nos va informar como van los
datos productivos, ya sea de una empresa como en algunas encuestas y finalmente estos
datos son representados grficamente, gracias a la Representacin de la grafica uno puede
realizar una serie de preguntas necesarias en estadstica y resolverlas.
Existen pocas reas donde el impacto del desarrollo reciente de la estadstica se haya
hecho sentir ms que en la ingeniera y en la administracin industrial. En realidad, sera
difcil exagerar sus aportaciones a los problemas de produccin, al uso eficiente de
materiales y fuerzas de trabajo, a la investigacin bsica y al desarrollo de nuevos
productos. Al igual que en las otras ciencias, tambin la estadstica se ha convertido en una
herramienta vital para los ingenieros; en realidad, el conocimiento de la estadstica se ha
convertido en una verdadera necesidad pues sin ella no pueden apreciar, entender o aplicar
gran parte del trabajo realizado en su campo.
La explotacin minera es un proceso continuo, donde el control tanto de las reservas como
de los productos es sumamente importante para la continuidad del negocio minero. Es por
ello, que la optimizacin del proceso requiere un buen punto de partida en el sistema, el
cual obviamente consiste en contar con una buena estimacin de las calidades de la mena
presente en el yacimiento.
1) DATOS Y VARIABLES
Datos: son medidas o valores de las caractersticas susceptibles de observar y contar, se originan por
la observacin de una o ms variables de un grupo de elementos o unidades
Variables: es toda caracterstica que vara de un elemento a otro de la poblacin. Dos grandes clases:
Variables Cuantitativas: son las que se describen por medio de nmeros, como por ejemplo el peso,
Altura, Edad, Nmero de Suspensos
Cuantitativas discretas. Aquellas a las que se les puede asociar un nmero entero, es decir,
aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo
nmero de hermanos, pginas de un libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar mediante un nmero entero,
es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la
variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc.
No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las
trabajemos como si fuesen continuas y viceversa.
Variables Cualitativas: son aquellos caracteres que para su definicin precisan de palabras, es decir,
no le podemos asignar un nmero. Por ejemplo Sexo Profesin, Estado Civil, etc.
Ordenables: Aquellas que sugieren una ordenacin, por ejemplo la graduacin militar, El
nivel de estudios, etc.
No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica, pero no
establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.
2) POBLACION Y ELEMENTO:
Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de personas o
cosas. Este conjunto de personas o cosas es lo que denominaremos poblacin. Las personas o
cosas que forman parte de la poblacin se denominan elementos. En sentido estadstico un
elemento puede ser algo con existencia real, como un automvil o una casa, o algo ms abstracto
como la temperatura, un voto, o un intervalo de tiempo.
A su vez, cada elemento de la poblacin tiene una serie de caractersticas que pueden ser objeto del
estudio estadstico. Luego por tanto de cada elemento de la poblacin podremos estudiar uno o ms
aspectos cualidades o caracteres.
Poblacin finita: cuando el nmero de elementos que la forman es finito, por ejemplo el
nmero de alumnos de un centro de enseanza, o grupo clase.
Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o tan grande
que pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los
productos que hay en el mercado. Hay tantos y de tantas calidades que esta poblacin podra
considerarse infinita.
3) DEFINICIONES:
Clases o intervalos de clase: Grupo de valores que describen una caracterstica. Deben incluir todas
las observaciones y ser excluyentes. Los intervalos contienen los lmites de clase que son los puntos
extremos del intervalo. Se denominan intervalos cerrados, cuando contienen ambos lmites e
intervalos abiertos si incluyen solo un lmite.
Anchura o tamao del intervalo: es la diferencia entre los lmites reales de una clase
Nmero de clases: es el nmero total de grupos en que se clasifica la informacin, se recomienda que
no sea menor que 5 ni mayor que 15
Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los puntos
medios coincidan con los datos observados para minimizar el error.
Los grficos son tiles porque ponen en relieve y aclaran las tendencias que no se captan fcilmente
en la tabla, ayudan a estimar valores con una simple ojeada y brinda una verificacin grfica de la
veracidad de las soluciones.
Histograma:
Est formado por rectngulos cuya base es la amplitud del intervalo y tiene la caracterstica que la
superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de
cada tramo de valores, puede construirse con clases que tienen el mismo tamao o diferente
(intervalo variable). La utilizacin de los intervalos de amplitud variable se recomienda cuando en
alguno de los intervalos, de amplitud constante, se presente la frecuencia cero o la frecuencia de
alguno o algunos de los intervalos sean mucho mayor que la de los dems, logrando as que las
observaciones se hallen mejor repartidas dentro del intervalo.
Frecuencia absoluta: La frecuencia absoluta de una variable estadstica es el nmero de veces que
aparece en la muestra dicho valor de la variable, la representaremos por ni
Frecuencia relativa: La frecuencia absoluta, es una medida que est influida por el tamao de la
muestra, al aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia
absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es necesario
introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el
tamao de la muestra.
La denotaremos por fi
Porcentaje: La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente
hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida resulta de
multiplicar la frecuencia relativa por 100. La denotaremos por pi.
Frecuencia Absoluta Acumulada: Para poder calcular este tipo de frecuencias hay que tener en
cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene
mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de la
variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la
variable y lo representaremos por Ni.
Frecuencia Relativa Acumulada: Al igual que en el caso anterior la frecuencia relativa acumulada es
la frecuencia absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Fi
Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.
Xi ni Fi pi Ni Fi Pi
Total 50
4) MEDIDAS ESTADISTICAS:
Las medidas estadsticas pretenden "resumir" la informacin de la "muestra" para poder tener as un
mejor conocimiento de la poblacin. Se clasifican en:
Tipo de medidas:
a) MEDIA:
Media aritmtica: La media aritmtica de una variable se define como la suma ponderada de los
valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la
expresin:
Propiedades:
1. Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media queda
multiplicada o dividida por dicho numero.
2. Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha
cantidad.
3. Adems de la media aritmtica existen otros conceptos de media, como son la media
geomtrica y la media armnica.
Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco o nada
usual.
b) MEDIANA:
Si N es Par, hay dos trminos centrales, la mediana ser la media de esos dos
valores
c) MODA:
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la
nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa
la realizacin de ningn clculo.
Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que
tengan la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o
polimodal segn el caso.
Apoyndonos en el grfico podemos llegar a la determinacin de la expresin para la Moda que es:
Otros autores dan una expresin aproximada para la moda que viene dada por la siguiente expresin:
a) Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el
valor mayor y el menor de la distribucin. Lo notaremos como R. Realmente no es una medida muy
significativa e la mayora de los casos, pero indudablemente es muy fcil de calcular.
Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con
respecto a cualquiera de ellas, sin embargo, la ms utilizada es con respecto a la media.
No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su
correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos
como muestra la de todas las desviaciones y calculamos su media. Pero esta solucin es mala pues
como veremos siempre va a ser 0.
Luego por lo tanto esta primera idea no es vlida, pues las desviaciones positivas se contrarrestan
con las negativas.
*Desviacin media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por
dm.
por .
Aunque tambin es posible calcularlo como:
Desviacin tpica:
Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como
veremos cuando estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y
desviacin tpica poblacionales respectivamente.
Cuasivarianza:
Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N-1, la
Cuasidesviacin tpica:
Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto
implica que si cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez
modificados. Adems, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las
alturas presentan ms dispersin. Pues no es posible comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida "escalar", es decir, que no lleve asociado ninguna unidad de
medida.
Coeficiente de Variacin:
Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo
que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La
denotaremos por C.V.
Las medidas de localizacin dividen la distribucin en partes iguales, sirven para clasificar a un
individuo o elemento dentro de una determinada poblacin o muestra. As en psicologa los
resultados de los test o pruebas que realizan a un determinado individuo, sirve para clasificar a dicho
sujeto en una determinada categora en funcin de la 53-1-u-puntuaciMn obtenida.
Cuartiles: Medida de localizacin que divide la poblacin o muestra en cuatro partes iguales.
Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos, depende del tipo de
variable.
y
Deciles: Medida de localizacin que divide la poblacin o muestra en 10 partes iguales. No tiene
mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para
las variables continuas.
dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin.
k = 1 .. 9
Percentiles: Medida de localizacin que divide la poblacin o muestra en 100 partes iguales. No
tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo
para las variables continuas.
k=1 .. 99
EJEMPLO:
Como se puede observar la forma de calcular estas medidas es muy similar a la del clculo de la
mediana. Veamos el clculo de algunas de estas medidas en el ejemplo que estamos estudiando.
Vamos a calcular Q1,Q3, d3, y p45
Li-1 Li ni Ni
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50
Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25%
de N=50, corresponde al 2 intervalo.(50/4=12.5)
A) Asimetra: Hemos comentado que el concepto de asimetra se refiere a si la curva que forman los
valores de la serie presenta la misma forma a izquierda y derecha de un valor central (media
aritemtica)
Para medir el nivel de asimetra se utiliza el llamado Coeficiente de Asimetra de Fisher, que viene
definido:
Luego:
(1/30) * 0,000110
g1 = ------------------------------------------------- = -0,1586
(1/30) * (0,030467)^(3/2)
Por lo tanto el Coeficiente de Fisher de Simetra de esta muestra es -0,1586, lo que quiere decir
que presenta una distribucin asimtrica negativa (se concentran ms valores a la izquierda de la
media que a su derecha).
Curtosis: El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores
alrededor de la zona central de la distribucin. Se definen 3 tipos de distribuciones segn su grado de
curtosis:
Distribucin mesocrtica: presenta un grado de concentracin medio alrededor de los valores
centrales de la variable (el mismo que presenta una distribucin normal).
g2 = 0 (distribucin mesocrtica).
Variable Valor
n 98
valor min 5.0
valor max 691.8
L(A) 686.8
K 7.614853 8
W 90.20
Variable Valor
Media 326.949
Mediana 265.20
Cuartil1 166.365
Cuartil2 265.2
Cuartil3 526.05
Percentil1 166.365
Percentil2 265.20
Percentil3 526.05
Moda 650.2
3. Medidas de Dispersin
Variable Valor
Varianza 44255.034
Desviacin estandar 210.36881
Coeficiente de Variacin 0.643431
4. Medidas de Forma
Variable Valor
Coeficiente de Asimetria 0.2531714
Coeficiente de curtosis -1.2600401
DATA LEYES DE MINERAL
Variable Valor
n 98
valor min 0.7
valor max 1.7
L(A) 1.0
K 7.614853 8
W 0.13
Variable Valor
Media 1.256
Mediana 1.28
Cuartil1 1.1225
Cuartil2 1.28
Cuartil3 1.34
Percentil1 1.1225
Percentil2 1.28
Percentil3 1.34
Moda 1.29
3. Medidas de Dispersin
Variable Valor
Varianza 0.044140483
Desviacin estandar 0.210096366
Coeficiente de Variacin 0.16728505
4. Medidas de Forma
Variable Valor
Coeficiente de Asimetria -0.099263544
Coeficiente de curtosis 0.448364475
CONCLUSIONES
La estadstica es mtodo prctico para realizar y evaluar datos de gran
informacin ya que con ello podemos analizar fcil el proceso productivo de un
trabajo como en mina.