Autores: Jeisson Ramrez Fernndez Miguel Quino Zurita Alan Diaz Meja Alejandro Meja Alayo Aldhayr Terrones Jaime
Chimbote 2014 TEMA: Estadstica Matemticas
FINALIDAD: Recopilar, e interpretar datos que en el futuro servirn para proyectar posibles problemticas futuras, consiguiendo segn estos datos, la solucin ms viable y rpida.
1. INTRODUCCION: En la antigedad los egipcios hacan censos de las personas y de los bienes inmuebles que permitan conocer la distribucin de las propiedades para volver a restituirlos despus de la inundacin anual que provoca el ro Nilo. En la biblia hay referencias a censos del pueblo judo. Los griegos y los romanos hacan censos de personas y de propiedades.Un economista y profesor universitario llamado Gottfried Achenwall (prusiano, 1719-1772) fue quien forj la palabra "estadstica" con el significado de "ciencia de las cosas que pertenecen al Estado". Achenwall dijo que "la poltica ensea cmo deben ser los Estados, la Estadstica explica cmo son realmente".Dentro del campo de la estadstica pueden estudiarse caractersticas de la sociedad, de las personas, de los animales, de las plantas, de determinados productos o de cualquier objeto de inters humano en general, bien lejos del concepto de las "cosas que pertenecen al Estado". Para desarrollar la estadstica son indispensable las matemticas 2. CUERPO: Estadstica matemtica La estadstica matemtica es escala previa en el estudio de la estadstica desde un punto de vista puramente formal, usando la teora de la probabilidad y otras ramas de la matemtica tales como lgebra lineal y anlisis matemtico. La estadstica matemtica trata de la obtencin de informacin a partir de los datos. En la prctica tales datos contienen cierta aleatoriedad o incertidumbre. La estadstica trabaja con estos datos usando los mtodos de la teora de la probabilidad. La estadstica matemtica se divide en 2 partes que son: Estadstica descriptiva: parte que se encarga de describir los datos, esto es, de realizar un resumen y describir sus propiedades tpicas. Inferencia estadstica: parte que elabora conclusiones a partir de una muestra de los datos, en otras palabras, comprueba el ajuste de los datos a determinadas condiciones y proporciona una medida de la bondad de los mismos en trminos probabilsticos. La estadstica matemtica es la base terica para muchas prcticas en la estadstica aplicada. Definiciones Bsicas: Con el objeto de definir algunos de los trminos elementales que se usan en Estadstica, se plantear el estudio de un fenmeno en particular, desde el punto de vista estadstico. Supngase que se desea estudiar el fenmeno del rendimiento acadmico de los estudiantes de ao de Ciencias de un cierto Liceo, en la asignatura de Fsica. Poblacin: Se denomina 'poblacin' del estudio estadstico, en este caso, al grupo de todos los elementos en cuestin. Es importante observar que la palabra 'poblacin', en Estadstica, puede referirse a un conjunto de objetos y no necesariamente a un conjunto de personas o seres vivos en general. Muestra: Cuando la poblacin es muy numerosa, se hace difcil obtener y analizar la informacin proveniente de todos los individuos, y en ese caso se seleccionan algunos individuos representativos de la poblacin para hacer el estudio estadstico. El grupo de individuos seleccionados se denomina muestra. Variables estadsticas: Las variables estadsticas son los datos que proporcionan los individuos de la poblacin (o muestra) observada. Pueden ser cuantitativas o una variable cualitativa. Organizacin de Datos: Un primer paso a tomar para la organizacin de esta informacin, de manera que se facilite su estudio, es el siguiente: se construye una tabla estadstica, llamada tabla de frecuencias. La estadstica maneja gran cantidad de datos e intenta resumirlos en unos pocos representativos. Estos son los parmetros centrales Para guiarnos mejor partiremos de un ejercicio aplicativo: En nuestro ejemplo, el tamao de la muestra es de 2.000 observaciones.
Por ejemplo: el rango de estaturas 1,40 - 1,45 m figura 34 veces en las 2.000 observaciones: Frecuencia absoluta: 34 Frecuencia relativa: 34 / 2.000 = 1,7% La estadstica maneja gran cantidad de datos e intenta resumirlos en unos pocos representativos. Estos son los parmetros centrales. 1.- La media aritmtica representa el valor medio que toman los datos de una observacin estadstica. Se calcula sumando todos los resultados y dividiendo la suma entre el nmero de registros. La media aritmtica tan slo se puede calcular con datos numricos (no se puede calcular con datos cualitativos). Por ejemplo, en nuestro ejemplo sumaramos las 2.000 estaturas obtenidas y la suma la dividiramos entre 2.000. Media = suma de estaturas / 2.000 = 3.341,55 / 2000 = 1,671 m 2.- Moda: es el resultado ms repetido en una observacin estadstica (se puede calcular con datos numricos y cualitativos). Vemos que en este ejemplo el rango de valores ms repetido es 1,65 1,70, con 372 resultados. Este rango sera la moda de la muestra. 3.- Mediana: es el valor que toma la variable de manera que al ordenarla de menor a mayor quedara justo en el centro, siendo el 50% de los registros menores que ella y el otro 50% superiores a ella. En nuestro ejemplo ordenaramos las 2.000 estaturas de menor a mayor y buscaramos la que ocupase la posicin 1.000 (por ejemplo 1,68), de manera que la mitad de los resultados seran inferiores y la otra mitad superiores. Y para una mejor lectura de los datos se aplican grficos estadsticos:
Grficos de barras verticales: Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a graficar sea discreta o continua.
Grficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que componen un total.
Grficos de barras comparativas Se utilizan para comparar dos o ms series, para comparar valores entre categoras
Grficos de barras apiladas Se usan para mostrar las relaciones entre dos o ms series con el total.
Grficos de lneas En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s.
Grficos circulares Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma porcentual.
Grficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categora son muy extensos.
VARIANZA Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el nmero de observaciones que se tengan. Si la varianza es calculada a una poblacin (Total de componentes de un conjunto), la ecuacin sera:
Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media poblacional y (N) es el nmero de observaciones tamao de la poblacin. En el caso que estemos trabajando con una muestra la ecuacin que se debe emplear es:
Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa la media de la muestra y (n) es el nmero de observaciones tamao de la muestra. Si nos fijamos en la ecuacin, notaremos que se le resta uno al tamao de la muestra; esto se hace con el objetivo de aplicar una pequea medida de correccin a la varianza, intentando hacerla ms representativa para la poblacin. Es necesario resaltar que la varianza nos da como resultado el promedio de la desviacin, pero este valor se encuentra elevado al cuadrado.
2. Desviacin estndar o Tpica Esta medida nos permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviacin estndar basta con hallar la raz cuadrada de la varianza, por lo tanto su ecuacin sera:
Para comprender el concepto de las medidas de distribucin vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varan los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.
Por lo que su media es:
La varianza sera:
Por lo tanto la desviacin estndar sera:
Con lo que concluiramos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta informacin le permite al gerente determinar cunto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.
Medidas de Distribucin - Asimetra y Carosis
Las medidas de distribucin nos permiten identificar la forma en que se separan o aglomeran los valores de acuerdo a su representacin grfica. Estas medidas describen la manera como los datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro de la informacin. Su utilidad radica en la posibilidad de identificar las caractersticas de la distribucin sin necesidad de generar el grfico. Sus principales medidas son la Asimetra y la Carosis.
1. ASIMETRA Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (Media aritmtica). La asimetra presenta tres estados diferentes [Fig.5-1], cada uno de los cuales define de forma concisa como estn distribuidos los datos respecto al eje de asimetra. Se dice que la asimetra espositiva cuando la mayora de los datos se encuentran por encima del valor de la media aritmtica, la curva es Simtrica cuando se distribuyen aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce comoasimetra negativa cuando la mayor cantidad de datos se aglomeran en los valores menores que la media.
Figura 5-1
El Coeficiente de asimetra, se representa mediante la ecuacin matemtica,
Donde (g1) representa el coeficiente de asimetra de Fisher, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta ecuacin se interpretan:
(g1 = 0): Se acepta que la distribucin es Simtrica, es decir, existe aproximadamente la misma cantidad de valores a los dos lados de la media. Este valor es difcil de conseguir por lo que se tiende a tomar los valores que son cercanos ya sean positivos o negativos ( 0.5). (g1 > 0): La curva es asimtricamente positiva por lo que los valores se tienden a reunir ms en la parte izquierda que en la derecha de la media. (g1 < 0): La curva es asimtricamente negativa por lo que los valores se tienden a reunir ms en la parte derecha de la media.
Desde luego entre mayor sea el nmero (Positivo o Negativo), mayor ser la distancia que separa la aglomeracin de los valores con respecto a la media.
2. CURTOSIS Esta medida determina el grado de concentracin que presentan los valores en la regin central de la distribucin. Por medio del Coeficiente de Curtosis, podemos identificar si existe una gran concentracin de valores (Leptocrtica), una concentracin normal (Mesocrtica) una baja concentracin (Platicrtica).
Figura 5-2
Para calcular el coeficiente de Curtosis se utiliza la ecuacin:
Donde (g2) representa el coeficiente de Curtosis, (Xi) cada uno de los valores, ( ) la media de la muestra y (ni) la frecuencia de cada valor. Los resultados de esta frmula se interpretan:
(g2 = 0) la distribucin es Mesocrtica: Al igual que en la asimetra es bastante difcil encontrar un coeficiente de Curtosis de cero (0), por lo que se suelen aceptar los valores cercanos ( 0.5 aprox.). (g2 > 0) la distribucin es Leptocrtica (g2 < 0) la distribucin es Platicrtica
Cuando la distribucin de los datos cuenta con un coeficiente de asimetra (g1 = 0.5) y un coeficiente de Curtosis de (g2 = 0.5), se le denomina Curva Normal. Este criterio es de suma importancia ya que para la mayora de los procedimientos de la estadstica de inferencia se requiere que los datos se distribuyan normalmente.
La principal ventaja de la distribucin normal radica en el supuesto que el 95% de los valores se encuentra dentro de una distancia de dos desviaciones estndar de la media aritmtica (Fig.5-3); es decir, si tomamos la media y le sumamos dos veces la desviacin y despus le restamos a la media dos desviaciones, el 95% de los casos se encontrara dentro del rango que compongan estos valores.
Desde luego, los conceptos vistos hasta aqu, son slo una pequea introduccin a las principales medidas de Estadstica Descriptiva; es de gran importancia que los lectores profundicen en estos temas ya que la principal dificultad del paquete SPSSradica en el desconocimiento de los conceptos estadsticos.
Las definiciones plasmadas en este captulo han sido extradas de los librosEstadstica para administradores escrito por Alan Wester de la editorial McGraw-Hill y el libro Estadstica y Muestreo escrito por Ciro Martnez editorial Ecoe editores (Octava edicin). No necesariamente tienes que guiarte por estos libros ya que en las libreras encontraras una gran variedad de textos que pueden ser de bastante utilidad en la introduccin a esta ciencia.