Sei sulla pagina 1di 20

UNIDAD 1 1.

ESTADSTICA DESCRIPTIVA

Conceptos bsicos de Estadstica POBLACIN: Es el conjunto sobre el que estamos interesados en obtener conclusiones (hacer inferencia), normalmente es demasiado grande para poder abarcarlo. MUESTRA: Es un subconjunto de la poblacin al que tenemos acceso y sobre el que realmente hacemos las observaciones (mediciones). Debera ser representativo, est formado de miembros seleccionados de la poblacin (individuos, unidades experimentales). MUESTRA ALEATORIA: Es una muestra bien representativa de la poblacin. Se considera que cada elemento de la poblacin ha tenido la misma oportunidad de formar parte de la muestra. Las conclusiones basadas en una muestra aleatoria son confiables. VARIABLE: Es una caracterstica observable que vara entre los diferentes individuos de una poblacin. La informacin que disponemos de cada individuo es resumida en variables. DATO: Es un valor particular de la variable

1.2

Medidas de Tendencia central y dispersin (media, moda, varianza y desviacin estndar)

Las medidas de tendencia central (media, mediana y moda) sirven como puntos de referencia para interpretar los datos que se obtienen en una prueba. Las medidas de tendencia central ms comunes son: La media aritmtica: comnmente conocida como media o promedio. Se representa por medio de una letra M o por una X con una lnea en la parte superior. La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se representa como Md. La moda: que es el puntaje que se presenta con mayor frecuencia en una distribucin. Se representa Mo. De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms til. Sin embargo, cuando en una distribucin se presentan casos cuyos datos son muy bajos o muy altos respecto al resto de la poblacin, es recomendable utilizar la mediana o la moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores extremos). Cmo calcular, la media, la moda y la mediana? Media aritmtica o promedio

Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras ms simples, corresponde a la suma de un conjunto de datos dividida por el nmero total de dichos datos.

Ejemplo 1: En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3 n = 6 (nmero total de datos)

La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa el promedio.

Ejercicios:
1.- Durante 12 meses del ao un departamento de polica registro 4, 3, 5, 5, 10, 8, 9, 6, 3, 4, 8, 7 asaltos a mano armada. Calcular media, mediana y moda. 2.- En una compaa con 80 empleados 60 ganan, 3 dlares por hora, 20 ganan 2 dlares x hora. Determine la media del salario x hora. 3.- A las 20 juntas de una academia de baile tradicionalmente asistieron 26, 25, 28, 23, 25, 24, 21, 23, 26, 28, 32, 25, 27, 24, 22, 26, 24, 29, 27, 22. Obtenga la media, mediana y moda. 4.- 10 medidas de dimetro de un cilindro fueron registradas como 3.88, 4.09, 3.92, 3.97, 4.02, 3.95, 4.03, 3.92, 3.98, 4.06 pulgadas. Hallar la media aritmtica de las medidas.

PARA DATOS AGRUPADOS Media Aritmtica para Valores Agrupados: Para aproximar la media aritmtica de datos organizados en una distribucin de frecuencias, comenzamos por asumir que las observaciones de cada clase estn representadas por el punto medio de la clase. La media de una distribucin de frecuencias se calcula as:

En la que = media aritmtica = valor o punto medio de cada clase = frecuencia de cada clase = frecuencia en cada clase por el punto medio de la clase = suma de estos productos = nmero total de frecuencias Ejemplo: Calculemos la media del precio de venta de los vehculos. Precio de venta de vehculos (miles de pesos) 180 a 230 230 a 280 280 a 330 330 a 380 380 a 420 Total Frecuencia 25 28 26 17 13 109

El precio de venta medio de los vehculos puede estimarse a partir de datos agrupados en una distribucin de frecuencias, lo primero que debemos calcular es el punto medio de cada clase, para eso le calculamos el promedio: luego ese valor medio se multiplica por la frecuencia, como se muestra en la siguiente tabla:

Precio de venta de vehculos (miles de pesos) 180 a 230 230 a 280 280 a 330 330 a 380 380 a 420 Total

Frecuencia 25 28 26 17 13 109

Punto Medio 205 255 305 355 405 5125 7140 7930 6035 5265 31,495

Decimos entonces que la media del precio de venta del vehculo es: 288,900 pesos. La Mediana Para Valores Agrupados: La mediana es el valor por debajo del cual se encuentran una mitad de los valores y por encima del cual se encuentra la otra mitad. Como los datos estn organizados en una distribucin de frecuencias, se ha perdido algo de informacin. As no podemos calcular la mediana exacta, sin embargo, se puede estimar de la siguiente manera:

Dnde: = Lmite inferior de la clase que contiene la mediana. = Nmero de frecuencias. = frecuencia en la clase mediana. = nmero de las frecuencias acumuladas en las clases que preceden a la clase que contiene la mediana. = amplitud de la clase en la que se encuentra la mediana.

Utilicemos los datos del ejemplo anterior, pero en esta oportunidad debemos calcular la frecuencia acumulada, que no es ms que la suma acumulada de las frecuencias de cada clase o categora, vemoslo en la siguiente tabla: Precio de venta de vehculos (miles de pesos) 180 a 230 230 a 280 280 a 330 330 a 380 380 a 420 Total Frecuencia 25 28 26 17 13 109 Frecuencia Acumulada 25 53 79 96 109

Debemos localizar en cual clase se encuentra la mediana, para eso dividimos el total de la frecuencia entre 2, Ahora buscamos en la frecuencia acumulada el grupo de intervalos que tenga a este nmero: Podemos apreciar fcilmente que el tercer grupo de intervalos es el que posee al nmero en la posicin 54,5 debido a que el anterior slo llega hasta el nmero 53, observemos este diagrama: 53 280,000 Mediana 79 330,000

La mediana del precio de venta es: 282,884

Moda Para Datos Agrupados: Siendo la moda el valor con ms frecuencia, slo debemos buscar dentro de nuestra distribucin de frecuencias los intervalos con mayor cantidad de frecuencia, revisemos la tabla de precios de venta.

Precio de venta de vehculos (miles de pesos) 180 a 230 230 a 280 280 a 330 330 a 380 380 a 420 Total

Frecuencia 25 28 26 17 13 109

El intervalo de 230 a 280 miles de pesos es quien tiene mayor cantidad de observaciones, por lo tanto para determinar la moda calculamos el punto medio de la clase:

Por lo tanto la moda del precio de venta es 255,000 pesos.

EJERCICIO: 1.- Dadas la siguiente distribucin de frecuencias encontrar las medidas de tendencia central. Mximo de Carga (Toneladas) 9.3 9.7 9.8 10.2 10.3 10.7 10.8 11.2 11.3 11.7 11.8 12.2 12.3 12.7 12.8 13.2 TOTAL Frecuencia 2 5 12 17 14 6 3 1 Punto Medio

2.- Dadas la siguiente distribucin de frecuencias encontrar las media, mediana y moda. # tubos Frecuencia 14 46 58 76 68 62 48 22 6 Frecuencia Acumulada Punto Medio

Duracin de Horas 300 399 400 499 500 599 600 699 700 799 800 899 900 999 1000 1099 1100 1199 TOTAL

Medidas de dispersin: Miden que tanto se dispersan los datos recabados de su media. El Rango: El rango o recorrido es la medida de dispersin ms sencilla, consiste en calcular la diferencia entre el valor mayor o el valor menor de la observacin:

Desviacin Media: La desviacin media mide la cantidad media en que los valores de la poblacin, o de la muestra, varan de la media. Se define as: | |

Donde Es el valor de cada observacin Es la media aritmtica de los valores Es el nmero de observaciones en la muestra | | Indica el valor absoluto. En otras palabras se hace caso omiso de los signos de las desviaciones medias, Por qu? Porque si no lo hiciramos as las desviaciones positivas y negativas se anularan, y al desviacin siempre sera cero, y una medida de dispersin cero sera completamente intil. Nmero de horas 1.5 2.0 3.0 3.5 4.0 | | | | | | | | | | | | Desviacin Absoluta 0.8 0.3 0.7 1.2 1.7 4.7

El nmero de horas estudiada se desva de la media en una hora

Desviacin Media para Datos agrupados: Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es: | | Donde Es el valor de cada observacin Es la media aritmtica de los valores Es el nmero de observaciones en la muestra Frecuencia de cada clase | | Indica el valor absoluto. Ejemplo: Calcular la Desviacin Media de la siguiente distribucin Punto Medio 12.5 17.5 22.5 27.5 32.5 Frecuencia 3 5 7 4 2 21 37.500 87.500 157.500 110.000 65.000 457.5

Clase 10 15 15 20 20 25 25 30 30 35

| 27.857 21.429 5.000 22.857 21.429 98.571

9.286 4.286 0.714 5.714 10.714

Varianza y Desviacin Estndar: La varianza y la desviacin estndar son medidas de dispersin basadas en la desviacin media, pero en lugar de usar valores absolutos, elevamos al cuadrado las desviaciones. Elevar al cuadrado significa eliminar los nmeros negativos. La variancia y la desviacin son las medidas de dispersin ms tiles, pues proporcionan una medida ms significativa sobre el punto de dispersin.

Varianza: La media aritmtica de las desviaciones de la media elevadas al cuadrado. Desviacin Estndar: La raz cuadrada positiva de la varianza.

10

Varianza y Desviacin Estndar para datos simples La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. Su frmula es:

Donde Varianza poblacional Varianza muestral Valor de una observacin de la poblacin Media aritmtica de la poblacin Nmero de observaciones de la poblacin Ejemplo: Un corredor de seguros vende tres plizas por los siguientes precios en miles de pesos: 32, 23 y 26

La desviacin estndar es la raz cuadrada de la varianza, es decir la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin y se representa por:

Donde Desviacin estndar poblacional Desviacin estndar muestral Valor de una observacin de la poblacin Media aritmtica de la poblacin Nmero de observaciones de la poblacin
11

Varianza y Desviacin Estndar para datos agrupados

Varianza

Desviacin Estndar

Ejemplo: Calcular la varianza y desviacin estndar de la siguiente distribucin Punto Medio 12.5 17.5 22.5 27.5 32.5

Clase 10 15 15 20 20 25 25 30 30 35

Frecuencia 3 5 7 4 2 21 37.500 87.500 157.500 110.000 65.000 457.500

86.224 18.367 0.510 32.653 114.796

258.673 91.837 3.571 130.612 229.592 714.286

Varianza

Desviacin Estndar

12

Ejercicios: Calcular la desviacin media, varianza y desviacin estndar de las siguientes distribuciones. A) 9, 3, 8, 8, 9, 8, 9, 18 B) Punto Medio Frecuencia 1 8 10 9 8 4 2 42

Clase 10 20 20 30 30 40 40 50 50 60 60 70 70 80

13

1.3 Distribuciones de frecuencias La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente. Tipos de frecuencias: Frecuencia absoluta. Es el nmero de veces que aparece un determinado valor en un estudio estadstico. La suma de las frecuencias absolutas es igual al nmero total de datos. Frecuencia relativa. Es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada. Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Frecuencia relativa acumulada. Es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28 , 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

Temperatura

Frecuencia Absoluta

Frecuencia Relativa

Frecuencia Acumulada

Frecuencia relativa acumulada

27 28 29 30 31 32 33 34 Total

1 2 6 7 8 3 3 1 31

0.032 0.065 0.194 0.226 0.258 0.097 0.097 0.032 1

1 3 9 16 24 27 30 31

0.032 0.097 0.290 0.516 0.774 0.871 0.968 1.000

14

1.4 Histogramas Un histograma es una representacin grfica de una variable en forma de barras. Se usan para variables continuas o variables discretas, con un gran nmero de datos, y que se han agrupado en clases. En el eje de las abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. Ejemplo: El peso de 65 personas adultas viene dado por la siguiente tabla Clase [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) Marca de clase 55 65 75 85 95 105 115 Frecuencia 8 10 16 14 10 5 2 65 Frecuencia Acumulada 8 18 34 48 58 63 65

15

Si se representan las frecuencias acumuladas de una tabla de datos agrupados, se obtiene el histograma de frecuencias acumuladas.

1.5 Polgono de Frecuencias Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo obtenido en el histograma.

16

1.6 Diagrama de Pareto El Anlisis de Pareto es una comparacin cuantitativa y ordenada de elementos o factores segn su contribucin a un determinado efecto. El objetivo de esta comparacin es clasificar dichos elementos o factores en dos categoras: Las "Pocas Vitales" (los elementos muy importantes en su contribucin) y los "Muchos Triviales" (los elementos poco importantes en ella). El Diagrama de Pareto es la representacin grfica de la Tabla de Pareto correspondiente.

Construccin del diagrama de Pareto: 1. Preparar los datos. 2. Calcular las contribuciones totales y parciales. Ordenar los elementos. 3. Calcular el porcentaje y el porcentaje acumulado para cada elemento. 4. Trazar y rotular los ejes. 5. Dibujar un grfico de barras que representa el efecto de cada uno de los elementos contribuyentes. 6. Trazar un grfico lineal cuyos puntos representen el porcentaje acumulado de la tabla de Pareto. 7. Sealar los elementos Pocos Vitales y los Muchos Triviales. 8. Rotular el diagrama de Pareto.

17

Ejemplo: HURTOS EN UN GRAN ALMACN Un gran almacn, que registraba elevados costes por hurtos, encarg a un grupo de trabajo resolver el problema. Como el almacn dispona de varias plantas y ofreca mercanca de naturaleza muy diferente, el equipo decidi empezar las investigaciones recogiendo datos sobre los costes por hurtos en varias secciones y realizar un Anlisis de Pareto.
TABLA DE PARETO DE LOS COSTOS POR HURTOS % SECCIN COSTOS % TOTAL ACUMULADO DEL TOTAL Joyera 62 22% 22% Perfumera 58 20% 42% Deportes 50 18% 60% Msica 47 17% 76% Electrodomsticos 22 8% 84% Ropa 16 6% 90% Alimentacin 15 5% 95% Hogar 10 4% 99% Muebles 4 1% 100% TOTAL 284 100%

En las primeras cuatro secciones se registran el 76% de los costos totales por hurtos. Estas son las "pocas vitales". El equipo tendr que concentrar sus esfuerzos en buscar soluciones que evitan los hurtos en estas cuatro secciones. De esta manera obtendr una mejora significativa con una accin ms centrada en el problema.

18

1.7 Diagrama de dispersin Es la representacin grfica del grado de relacin entre dos variables cuantitativas. Caractersticas: Muestra la posibilidad de la existencia de la correlacin entre dos variables. Simplifica el anlisis de situaciones numricas complejas. Proporciona mayor informacin que el simple anlisis matemtico de correlacin, sugiriendo posibilidades y alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en su utilizacin.

Construccin del diagrama de dispersin: 1. Elaborar una teora admisible y relevante sobre la supuesta relacin entre dos variables. 2. Obtener los pasos correspondientes a las dos variables. 3. Determinar los valores mximo y mnimo para cada una de las variables. 4. Decidir sobre que eje se representar a cada una de las variables. 5. Trazar y rotular los ejes horizontal y vertical. 6. Marcar sobre el diagrama los pares de datos. 7. Rotular el grfico. Ejemplo: La fatiga es causa de los errores de tecleo

19

El Diagrama de Dispersin se puede utilizar para estudiar: Relaciones causa-efecto. Este es el caso ms comn en su utilizacin para la mejora de la calidad. Se utiliza el diagrama a partir de la medicin del efecto observado y de su posible causa. Ejemplo: Comprobar la relacin entre el nmero de errores y la hora en que se cometen. Relaciones entre dos efectos. Sirve para contrastar la teora de que ambos provienen de una causa comn desconocida o difcil de medir. Ejemplo: Analizar la relacin entre el nmero de quejas que llegan y el aumento/disminucin de las ventas, suponiendo que los dos dependen del nivel de satisfaccin del cliente. Posibilidad de utilizar un efecto como sustituto de otro. Se puede utilizar para controlar efectos difciles o costosos de medir, a travs de otros con medicin ms simple. Ejemplo: Estudiar la relacin existente entre reduccin de costes y satisfaccin del cliente para utilizar el parmetro de ms fcil medicin en la evaluacin de las actividades de planificacin. Relaciones entre dos posibles causas. Sirve para actuar sobre efectos de forma ms simple o adecuada y para analizar procesos complejos. Ejemplo: Analizar la relacin entre el porcentaje idneo de contenido en potasio de un fertilizante y la cantidad media de lluvia recogida en la zona de cultivo, puesto que ambos elementos influyen en la calidad del vino y el rgimen de lluvias no puede ser modificado.

20

Potrebbero piacerti anche