Sei sulla pagina 1di 21
Estadistica descriptiva: la calidad y la variabilidad Introduccion I 154 1 CAPITULO OCHO Estadistica descriptiva: la calidad y la variabilidad Obtencién de datos ‘Cuando se desea tomar una decisién importante, como resolver un problema de raft, 5 ccontar con informacién que permita identificar cuindo, dénde y en qué condiciones se da tal pro Dlema; es decir, se debe encontrar su regularidad estadistica y sus fuentes de variabilidad. Por des- gracia, la prictica de obtener informacion antes de actuar, corregir o decidir no es tan usual. Log hhabitos y las inercias imperantes conducen a muchas organizaciones a actuar conforme a su expe- riencia, por corazonadas, intuiciones, tradiciones, mediante el método de prueba y error. Existe un gran niimero de ejemplos que ilustran la importancia de la informacién para lograr rmejoras. Un caso es ef narrado por Juran (1990). En el siglo xox, un oficial de la marina de Estados ‘Unidos, Mathew Maury, analiz los diarios de a bordo de los viajes navales, en los que se registraban las condiciones externas durante el viaje: por ejemplo, velocidad y profundidad de las corrientes, temperatura y profundidad de las aguas, direcci6n y fuerza de los vientos. Maury recopill esta in- formacién y la analizs, con lo que identificé los lugares en el mar que tenian fuertes vientos, y la direcci6n de estos, asi como las zonas maritimas con corrientes de agua, temperaturas y profundids- des, y posteriormente registré todo ello en lo que se conoce como cartas de navegacién, Con la informacién proporcionada por las cartas de navegaciGn, los matincros podsfan planeat me- jor sus viajes, esquivando vientos ycorrientes desfavorables, y aprovechando otros. Como resultado, fen 1851 un barco que hacia 55 dias de Baltimore a Rio de Janeiro tard solo 38 gracias alas caras; de Nueva York a San Francisco pasb de hacer 119 dias a 89. Esto equivalea reducciones en el tiempo de via- je de 31 y 25%, respectivamente. La informacién registrada por los otros barcos se usé para que en Jos nuevos viajes no se cometieran los mismos erores, como navegar contra la corriente, por ejemplo. La mejora de procesos y los sistemas de calidad requieren que la toma de decisiones se apoye en un correcto andlisis de los datos y la informacién (vea el capitulo 3). De aqué que es necesario con- tar con informacién de calidad. Sin embargo, en las organizaciones hay deficiencias para obtener, como las siguientes: © “Daitis? Se obtienen datos sin ringin propdsito claro ni importante, 10 cual resulta en datos, cuestionarios, registros y reportes en espera de que tengan aigune utlidad 1 Esraro que se tenga un plan global de pox qué se va a obtener informacién, cul os la mejor fuente, obmo, cudndo, quién, donde, cémo se va a analizar. y qué decisiones se preten- den tomar. Como ejemplo asta el diseno de cuestionarios con papel, liz y ocurren ‘Informacion poco representatva y sesgada. «© Prejuicios y e1rores sobre ol papel de la estadistica en la obtencién de informacion: por ejemplo, tamofo de la muestra, confanza estadistica y selecoon aleatoria de la muestra, ‘spectos que requieren fundarrentos estadisticos pera su comprensién. ‘Antes de obtener informacién sobre un problema o una situacién, lo que se debe tener muy ce 10 y delimitado es el objetivo que se persigue y el tiempo y los recursos de que se dispone para abordar dicho problema. No hacer lo anterior conduce, con frecuencia, a que la informacién que se dbtiene no ayude a responder las interrogantes que se tienen y, en Glkima instaneia, a tomar decisio- nes erséneas. ‘Una ver localizado el problema, definidos los objetivos e identificado el tipo de informacion {que se necesita, surgen, entre oto ls siguientes incertogantes:cGmo obtener tal informacién en qué cantidad y cémo analizarla, Para estas tres cuestiones no existe una tinica respuesta que se pucda consular en un manual o en una tabla. La respuesta la proporciona esencialmente la estadistica a partir del conocimiento del objeto de esto (problema), del tipo de accién o decisicn que se desce tomary de los recursos y el tiempo de que se dispone para abordar el problema, Ena figura 8.1 se representa el papel o funcidn de la estadistica. En ella se aprecia que el obje tivo iltimo de la estadistica es apoyar (o fundamentar) la toma de decisiones 0 satisfacer ciertas pecesidades de informacién sobre una poblacidn o proceso. También se muestran aqui los pasos que hay que seguir cuando en el contexto de agin problema se requiere informacién. La estadistica en general as herramientas bisicas en particular, desempedan una funcién importance en cada uno {ie los pasos de la figura 81, tal como se evidenciard en los siguientes capitulos, La vaiailidd yo pensamionto estadistico De esta manera, con la identificacién de un problema o del objeto de estudio y se jn evaluando si las acciones dieron resultado de acuerdo con los objetivos planteados, lo que sirve para replantear objetivos y aplicar de nuevo el cick Mis adelante, en el capitulo 10, se estudiaran las hojas de verificacién y, en el capitulo 16, los iméiodos de muestreo aleatorio. Ambos son de gran utilidad en la obtencidn de datos. (~ Problema u ojeto ay eRe Co 3 >, Figura 8.1 Latoma a --ap- mm set } p> a> = La variabilidad y el pensamiento estadistico Lavariacién es parte de nuestra vida diaria: el tiempo que tardamos de nuestra casa a nuestro traba- jo oescucla es diferente de una dia a otro; la temperatura del ambiente es diferente de una hora 2 ‘ura; lo dulce de una bebida preparada en casa es diferente de un dia a ou aunque aparenitemente se preparé igual, etc. Esta ue ocurre en nucstras vidas, también ocurre en los resultados ellos procesos, ya que son gencrades por la interacci6n de materiales, miquinas, mano © mente de obra (gente), mediciones, medio ambiente y métodos. Estos ses elementos las 6 M, detcrminan de ma nera global todo proceso, y cada uno aporta parte de la variabilidad (y de la calidad) de los resultados de un proceso, como se esquematina en la figura 8.2. Por lo que si hay algGn cambio significative en dl desempefio del proceso la ran de tal modifcacién se encuentra en una o mis de las 6 M Maquina te ; ‘Medio ambiente Vorible de sla caraceristicas de cai) 8.2 La variabiliad Ge un proceso, Cade M aperta una pete no recesrimmente igual, de la vaiaién total observada 156 1 CAPITULO OCHO Estadistca descriptiva: a calidad y la vaiabilidad Asi, en un proceso, cada una de las 6 M tiene y aporta su propia variacién; por ejemplo, riales no son idénticos, ni toda la gente tiene las mismas habilidades y entrenamiento. Pero a través del tiempo, ocurten cambios en las 6 M, como la legada de un lote de material no ‘© con caracteristicas especiales, descuidos u olvidos, desajustes y desgastes de maquinas y’ tas, eroétera.! Precisamente por la constante posibilidad de que ocurran estos tipos de cambios y desajustes necesario monitorear con regularidad Jos signos vitales de un proceso o, en general, de un. por ejemplo, medir las caracteristicas clave de los insumos, las condiciones de operacién de | ‘equipos y las variables de salida de los diferentes procesos. Sin embargo, no todos los cambios en las. 6 M se reflejan en una variacin significativa en los resultados, ya que habrd algunos inherentes al funcionamiento del proceso mismo (causas comunes) y habré otros cambios que se deban a una si- wacién particular y atribuible (causas especiales). Por ello, es nevesario que el monitorco se realice apoyindose en las herramientas bisicas, como las que se estudian en este libro, para asi decidir cul ¢s la reaccidn 0 accién mis adecuada segin el tipo de cambio, que puede ir desde no hacer nada hasta generar un proyecto de mejora. La estadistica es vital en el control y monitoreo de procesos, yen la mejora ¢ innovacién de la calidad, ya que esta conformada de un conjunto de técnicas y conceptos orientadas a la recolecci6n yelanilisis de datos tomando en cuenta su variacién. En todo tipo de organizaciones y en tna gran diversidad de si io del presente capitulo; estos se dan debido a que permiten’ aciones, el uso de las técnicas estadisticas tiene los beneficios que se seialaron al * Identificar dénde, cémo, euéndo y con qué frecuencia se presentan los problemas (regula- fidad estadistica) = Analizar los datos procedentes de las guias clave del negocio, para asi identificar las fuen- tes de variabilidad, analizar su estabilidad y pronosticar su desempeno. = Detectar con rapidez, oportunidad y a un bejo costo ancrmalidades en los procesos y sis- temas de medicion (monitoreo oficez) "= Apoyar los procesos de planeacién y toma de docisiones, para que se hagan de manera objetiva con e! apoyo de hechos y datos. ‘= Expresar los hechos en forma de datos y evaluar de manera obietiva el impacto de accio- nes de mejore. = Enfocarse en los hechos vitales; og decir, on los problemas y causas realmente impor tantes, = Analizar de manera logica, sistemstica y ordenada la busqueda de mejoras. Pensamiento estad Lo que se acaba de explicar son aspectos fundamentales del pensamiento estadistico, que es una fi losofia de aprendizaje y accién basada en los siguientes principios: 1) todo el trabajo ocurre en un sistema de procesos interconectados; 2) la variacién existe en todos los procesos, y 3) entender y reducir la variacién son claves para el éxito. Se considera que es una filesofia de aprendizaje y accidn que se apoya en conceptos y métodos estadisticos, para aprender a ver el todo de una situacién problema a partir de entender Ia interrelacién de sus componentes y de conocer su variacién; y también la manera en la que responde a esto (accién). En el primer principio se habla de procesos interconectados para enfatizar que los procesos no operan de manera aistada, mis bien interactiian con el resto del sistema. De tal forma que si no se toma en cuenta el modo en el que se relaciona un proceso con el resto del sistema, la optimizacién de una de las partes puede tener un efecto negativo para el resto del sistema (vea el capitulo 3) El segundo principio reconece que los resultados de todos los procesos son variables, lo cual ya se explicé y quedard en evidencia a lo largo del libro. : La segunda ley de la termodinamica dice que cualquier sistema tiende a aumen opi, es decir, que si un intervenitl, justarlo o mejoralo, tiene a aumentar su desorden. La variatilidad y el pensamientoestacistico El eeeer principio es una de las razones y objetivos principales dela mejora: reduc lavariabi- hasta lograr nivel de excelencia en calidad, como el nivel de calidad Seis Sigma (vea el capi- tulo 15). El reto es que en una organizacin se logre profundizar en la filosofia del pensamiento festadistco para conocer la realidad tal como es (con variacién), pero también le permitird direccio- ‘mejor sus esfuerzos de mejora, En la figura 8.3 se muestra la forma en la que el pensamiento ‘extadistico puede ayudar en los diferentes niveles de una organizacién. “© Chea esttegiasy as comarca. + Usa datos de vais fms pera ig tone dae + Dssoroe inlonsra stones noma te recip dg pomeso «+ Estnue as empleaos a exer nuovs fornas dohacor su trabajo Desanolt proyectos sturturados. « Fhametas (sabe que ay vanac¢n. ‘+ Secentacen los process, yo eclama ‘810s ompleados por su variacin. Frocesos adninistratvas / pate een pate im ivieeeas fants Operacional ‘alia dats de los process. haciendo el abajo Ieentica metidas caves yaportunidate ‘de mejora. Tipos de variables En funcién de los valores que pueden tomar, las variables se chasifican en cualitativas y cuantitati- vas, Las variables cualitativas o de atributos asumen valores que representan categorias 0 atributos de las cosas y que no tienen de base una escala numérica; por ejemplo, tipo de producto, si este fun- ciona 0 no, etc. Existen varios métodos estadisticos a analizar est tipo de variables (vea, por ejemplo, los del capitulo 10). Mientras que las variables cuantitativas son aquellas cuyos valores proceden de mediciones o conteos referidos a escalas numéricas. Por ejemplo, peso de un lote, mimero de clien- tes endidos, niimero de productos defectuosos. 4 Las variables cuantitativas se clasifican como discretas y continuas. Las diseretas con fiecuencia proceden de conteos, y solo pueden tomar valores dentro de un conjunto numerable, For ejemplo: niimero de clientes atendidos (0, 1, 2, 3, .., etc.), ntimero de articulos defectuasos por lote, ntime- 10 de quejas, mimero de servicios de mantenimiento. Por su parte, las variables continuas pueden tomar cualquier valor dentro de un intervalo especifico. Por ejemplo, el tiempo en el que un cliente esatendido. Intuitivamente las variables de tipo continuo son aquellas que requieren un instrumen- to de medicin para cuantificarse, como peso, volumen, voltaje, longitud, resistencia, temperatura, humedad, tiempo, dimensiones varias, etcétera. Por otro lado, por su funcién en un proceso se pueden tener variables de entrada y de salida. Las primeras, tambin llamadas variables independientes (las X), por lo general son variables de con- trol del proceso, como temperature, velocidad, presién, eantidad y/o caracteristicas de algin insamo © material, ete. Ademis entre las variables de entrada se consideran aquellas que, aunque normal- ‘mente no estin controladas, influyen en los resultados de un proceso, como la humedad relativa en «1 medio ambiente, la habilidad de un operario, el método de trabajo, etcétera. 158 1 CAPITULO OCHO Estadistica deseriptiva a calidad y a varabilidad Las variables de salida, también Ilamadas variables de reppuesta 0 dependientes (las Y), reflejan, Jos resultados obtenidos por un proceso, como pueden ser las caraceristicas de calidad del produc: to de tal forma que a través de los valores que toman estas variables se evalia el desempefio del proceso, Por lo general, las variables de slida tienen especificaciones o tolerancias, porque los valo- res que deben tener estin especificados. Por ejemplo, en un proceso que produce piezas metilicas que se van a ensamblar, las dimensiones de estas deben caer dentro de cierto rango 0 especificacio- nes, de lo contratio no embonardn. Cuando se satifacen estos requerimientos se dice que el proce- so cumple las especificaciones de calidad. Existen tes tipos de variables de sada o caracteristicas de calidad, de acuerdo con el tipo de especificaciones que deben cumplir: ® Cuanto mas pequeno mejor. Son variables o caracteristicas de calided cuye Unica exigen- Cia es que no exceden un cierto valor méximo tolerado 0 una especificacién superior (ES), Yy cuanto més pequorio sea su valor, mejor. Por ejemplo, el porcentaje de impurezas en una sustancia o la cantidad de sustancias tOxicas en un producto alimenticio. ‘© Cuanto mas grande mejor. Son variables 0 caracteristicas de calidad a las que se les exi- {ge que sean mayores que un velor minimo o que una cierta especificacién inferior (EN. ¥ Cusnto mis grande sea el valor dela variable, sera mejor. Por ejemplo, la resistencia de una ppieza de plastico inyectado ola “blancura” de una tela de color blanco, ‘© £1 valor nominal es el mejor. Veriables que deben tener un valor espectfico y que, por Io tento, no deben ser menores que una especificacién inferior (El), pero tampoco mayores: que una superior (ES). Por ejamplo, el diametro interior de una tuerca o la longitud de una pieza para ensamible; no pueden ser ni muy chicas ni muy grandes. Una tarea primordial del control de calidad es conocer qué tanto los valores de una variable de satisfactorios, y saber de esa manera si el proceso es capaz de cumplir las salida de un proceso s especificaciones para esa variable, Por ello es necesario tomar datos de esta variable y analizarlos ade- cuadamente, Esto queda claro en dl cjemplo 8.1, sobre el azticar, donde se requiere decidir cusl de ls dos marcas cumple mejor con la especificaci6n: peso més cercano a 500 gramos CELLAR (2 variecion on ss ‘i En un restaurante se tiene una formule especifica para eleborar una cantidad determinada de "agua fresca’ la cual ‘contempla agregar 500 grams de aricar. Fs claro que resulta da suma importancia afiadir exactamente esa centided Ge azicar pera la calidad del agua, de lo contrario, esta queda muy dulce o desebxida, Aunque @ los cocineros se les ha insistido sobre lo anterior, es frecuente que no pesen el azdcar y la agreguen al tanteo. Al considerar la calidad dol ‘aque como un especto clave, se decide disofar un procedimiento a prueba de olvides: comprar boisas que contengan G00 gramos de aztiear. Suponga dos marcas de azucar que Cuentan con la presentacion de 500 grams; ahore es rnecesario decidir qué marca comprar. Con este propésito se pesan 40 bolses de ambas marcas, y se obtienen los da 108 de fa table 8.1. : Es claro que los datos son variables, porlo que se requieren analizar con técnicas estadisticas. En estos casos, pare saber el comportamiento (distribucion! de un conjunto de datos es neceserio estudiar tres de sus aspectos: tendencie central, variabildad y forma de su distribucién. En las secciones siguientes veremos diferentes métodos de la esta- Ulstica descriptive especializadas en estudiar uno o mas de estos aspectos. Tabla 8.1 Datos paral elemon 8.1 Marea See : A 503 S07 42 100 498 506 502 502 i 502 506 602 505 493 500 489 i 500 492 $00 515 510 S07 508 499 S10 494 503 439 508 913 502 §15 S44 507 510 498 SO7 491 S07 502 464 500 (contindah La variabilidad y ol ponsamiento estadistica Medidas de tendencia central Con las mediciones de una caracteristica de cali lad o variable de tipo cuantitativo, como las del jemplo 8.1, el primer aspecto a investigar es la tendencia central de los datos para identficar un valor en torno al cual los datos tienden a agruparse o concentrarse. Esto petmitiré conocer tal valor ry hacer algiin tipo de evaluacién con relacin a lo adecuado de este, lo cuales el caso en control de calidad donde se busca saber si el proceso esté centrado; es decir, saber sila rendencia central dela variable de salida es igual o est4 muy préxima a un valor nominal deseado (en el ejemplo, el valor nominal es 500 gramos). Enseguida veremos tres medidas de la tendencia central: la media, media- na y moda Media muestral Suponga que x,, x,y ~- +x, son las observaciones numéricas de una muestra, entonces la medida ‘mas usual de tendencia central es li mediao promedio muestral, que ¢s igual la media aritméti- 2 de todos los datos: 5 decir, la media muestral se obtiene sumando todos los datos, y el resultado se divide entre el meto de datos (n). En Excel, la funcién PROMEDIO( se puede utilizar para calcular la media Por ejemplo, los siguientes datos representan el sueldo sen de una empresa snal de siete trabajadores de cerca frca 1 100; 1300; 1 000; 1 500; 800; 1600; 1 100; 1200, por lo que el sueldo promedio de los trabajadotes es de 1.200 pesos. Bs claro que re decit que todos o li mayoria de los rabajadores ganen 1 200 pesos, es mis, je gana tal cantidad. Si para calcula la media se utilizaron todos los elementos de la poblacién (el universo sobre el ue se quiere tomar decisiones, por ejemplo. el sueldo de todos los trabajadores), entonces el pro- ‘medio calculado es la media poblacional y se denota con la letra griega mu, jt, Cabe destacar que 1h media del proceso 4. es igual a cierto valor. aunque no siempre se Conoce; mientras que el valor de 3 se obtiene para cada muestra y es diferente (variable) de una muestra a otra, ya que su valor depen- ‘de de los elementos que se seleccionan en la muestra (¥ ¢s una variable aleatoria), Por lo anterior, el valor que se observa de la media muestral,T, es porlo general diferente de la media poblacional 0 del proceso, 2. Luego hay que tener cuiddado con las afirmaciones que se hacen con base en ¥ sobre a media del proceso 0 poblacién. n dl ejem- fem 1 CAPITULO OCHO Estadistica desoriptiva: la calidad y la variabilidad Mediana o percentil 50 a (Otra medida de tendencia central de un conjunto de datos ¢s la mediana, T, que es igual al lor que divide a la mitad los datos cuando se ordenan de menor a mayor. Para caleular la cuando el mimero de datos es impar, los datos se ordenan de manera creciente y el que quede ‘medio de dicho ordenamiento seri la mediana; y si el ntimero de datos es pat, entonces la mediana se calcula dividiendo entre dos la suma de los ntimeros que estin en el centro del ordenamiento, Asi, los datos que son menores 0, a lo més, igual que la mediana ¥ constiruyen 50% de los datos; mientras que los que son mayores o iguales son el restante 50%. Por ello la mediana también se conoce como percentil 50. En Excel, a funcién MEDIANAO se puede utilizar para calcular la mediana. Por ejemplo, en el caso de los sueldos de los trabajadores, para calcular la mediana se ordenan los datos: £800; 1000; 1100; 1 100; 13005 1500 y 1.600; Entonces, como el niimero de datos es impar (n = 7), la mediana es ¥ = 1100, con lo que es posible asegurar que la mitad de los trabajadores de la muestra gana 1 100 pesos semanales 0 menos, Moda (Otra medida tradicional dea tendencia central de un conjunto de datos es la moda, que es igual a dato que se repite con més frecuencia. Su cilculo se puede hace en Excel por medio de la fincién MODA(), En el caso de los sueldos de los trabajadores Ia moda es 1 100. De aqui se desprende que no siempre la media es el dato més frecuente, ya que en este caso la media es 1200. y no 1 100. ‘Cuando en un grupo de datos hay algunos valores bastante diferentes del resto, ya sean muy pequefios, o bien, muy grandes, entonces la media no es una buena medida de tendencia central, ya que a esta la “jalan” los datos aipicoso ratos. Por ejemplo, en el caso de los sueldos de los traba- jadores, suponga que en esa érea hay un trabajador mis que gana 7 600 pesos por mes, con lo que ahora los sueldos son: 800; 1000; 1 100; 1 100; 1300; 1.500; 1 600 y 7600. En este caso la media €s 2000. Resulta evidente que el 2000 no refleja la tendencia central de los stiekdos, ya que solo un trabajador gana mis que la media. En estos casos la mediana es mejor ‘medida de tendencia central, ya que no resulta afectada por datos “raros”. Por ejemplo, en el caso de Jos trabajadores, cuando uno gana mucho més que el resco, la mediana es igual a (1100 + 1 300)/2 = 1200. Este valor si refleja la tendencia central de la mayoria de los sueldos. De lo amerior se desprende que, para describir la endencia central de los datos, ¢s importante apoyarse tanto en Ja media como en la mediana. Y en caso de que la media sea mucho més grande que la mediana, es seal de que existen datos 1 é “inflada’. Por cl contratio, si la media es significativamente menor que la mediana, encon- ces eso indica la presencia de datos mucho mis pequefios que el resto, los cuales hacen que ka media cesté “subestimada’, Tomar en cuenta lo anterior es de importancia primordial en la toma de deci- siones, ya que no siempre la media rfleja la verdadera tendencia central s grandes que el resto, los que hacen que la media Continuacién del ejemplo 8.1 En la tabla 6.1 se ve que la media y la mediana pera la muestre de la marca A son 502.3 y 602, respectivar ‘mienttas que para la marca B con 498.1 y 498.6, Ademds, la meda es 602 y 498 para las marcas A y B, re: ‘mente. Por lo que la tendencia central para cada marca se ale apxoximadamente lo mismo respecto al pos0 | Fido de 500 grames, De aqul que al tomer en cuenta Gnicamente las medidas de tendenca central. no se decidir cud de las dos marcas satisface mejor el requerimiento de peso. Por lo general, como en este caso, con bose en el promedio equivale a “lanzer un volado! A continuacion se anaizaré cémo al consicerar también tiabiidad de los dates se pueden tomar decsiones mis acertadas. a variabildad y 0! ponsamionto estadistico 8 Medidas de dispersion 0 variabilidad ‘Ademls dc la tcndencia central de un conjunto de datos, es nevesario conocer que tan diferentes son nite si es decir, es importance saber su variabilidad o dispersién. Esto es un elemento vical en el anilisis estadistico de un conjunto de datos, particularmente cuando se quiere hacer un estudio de apacidad de un proceso. Enseguida veremos cuatro formas de medir la variabilidad. La desviacibn estindar muestra cs la medida més usual de variablidad e indica qué tan es parcidos estin los datos respecto a la medias se denota con S'y se calcula mediante la siguiente ex- presiGn: +, son las observaciones numéricas de la muestra y ¥ es la media muestral. Como se puede apreciar, 5 mide la distancia que en “promedio” hay entre los datos y la media; por ello, ‘cuanto ms grande sea el valor de S, mayor variabilidad habra en los datos. La desviacién estndar ‘esti expresada en las mismas unidades de medicién (gramos, milimetros, etc.) que los datos. Ade- mis, Sno refleja la magnitud de los datos, solo lo retirado que estin los datos de la media, y al gual que esta, se ve afectada por datos atipicos. Su calculo en Excel se puede hacer con la funcién DESVESTAO. Desviacién estindar poblacional o del proceso, «. Si para calcular la desviaci6n estindar se utlizan todos los elementos dela poblacién o proceso, entonces se obtiene la desviacién estindar po- blacional y se denota por la letra griega sigma, 0: Por otra parte, el cuadrado de la desviaci6n estindar, S?, se conoce como varianza muestral, {que es muy importante para propésitos de inferencia estadistica. Y en forma equivalente, 0? es la varianza (0 variancia) poblacional. tra medida de dispersién es el rango o recorrido, R, que es igual ala diferencia entre el dato ‘mayor y el dato menor de un conjunto de datos, por lo que R mide la amplitud de la variacion de tun grupo de datos y también es independiente de la magnitud de los datos. En Excel, se puede ob- tener con el auxilio de las funciones Max( ) ~ Min(). Por ejemplo, sean los dos conjuntos de datos: {10, 12, 14} y (159, 161, 163), tentonces se ve que la magnitud de los datos es diferente, y eso lo refleja la media, que es de I2y 161, respectivamente, Pero en cuanto a la variabilidad, los datos de ambos conjuntos estin igualmente dispersos, como lo indica la desviacién estindar que es igual a 2 en ambos casos, y el rango que es de4 para los dos conjuntos. El coeficiente de variacién (CV) es una medida de vatiacin relativa ala magnitud de los da- tos, quc es igual a la desviacin estandar entre la media de los datos: cr =S a0 E] CV es titl para comparar la variacién de dos o més variables que estin medidas en diferentes escalas 0 unidades de medicién (por ejemplo, metro contra centimetro o metro contra kilogramo) Este coeficiente suele interpretarse como una medicién en términos porcentuales de la variacién de una variable, Por cjemplo, en el easo de los conjuntos de datos A y B que se presentaron en la defi- nicién del rango, se tiene que sus correspondientes CV son: 2 100= 16.66, CV, 12 respectivamente. Por lo que a variabilidad en los términos relativos del CV para el conjunto A es de 16.66%, mientras que para el conjunto B es solo de 1.242%, 162 1 CAPITULO OCHO Estadistica descriptiva:fa calidad y la veriabilidad ‘exigencia de que las bolsas pesen 500 gramos. Ahora, con el uso de las medidas de A patr de la tabla 8.1 se obtione: jacién del ejemplo 8. Marca A: $= 723, R= 31 Maica B: S= 3.68, = 16 ; De aqui se desprende que la muestra de bolsas de azticar de la marca Ationen una dispersién dos area B, tanto en términos do S como de A. Por lo tanto, como las muestras son representatives de ‘ytienen un tamario moderado, esto es una evidencia a favor de la marca B, ya que estas proporcionan un esd} ‘ano al peso deseado (500 gramnos). i Sila discrepancia entre las desviociones estindar hubiera sido menor, entonces para decidir s tal di Signifcativa 0 si podria atribuirse a variaciones debido al muestreo, se hace una prueba de hipotests (Gutierrez de JaVara, 2013), * Relacion entre x y S ‘Una forma de apreciar més caramente el sig persién en toro a la media esa través de la relacién entre la media y la desviacién estindar, la cual «sti dada por la desigualdad de Chebyshev y la regla empirica. Dos hechos particulares que afr man la desigualdad de Chebysher? es que entre X ~ 2S y ¥ + 2S esti por lo menos 75% de los ddavos de la muestra, y que entre X * 3S esta por lo menos 89%. En cuanto a la egla empitica, afirma que en muchos de los datos que surgen en la préctica se ha observado por la experiencia que: # ontie ¥ — Sy X + Sesté 68% de los datos de le muestra; = entie X ~25y.X + 25 esta 95%. y # ontie x ~ 35y x + 3Sesté 99.7%, estindar como medida de dis- Todos los intervalos anteriores son vilidos solo para los datos mucstrales y no necesari para toda la poblacién o procese. Sin embargo, s los intervalos se caleulan con la medi én estindar del proceso 0 poblaci In desvia |, entoncesserin vélidos para toda la poblacin. Porlo que en PU ee ge 4 medida en la quese tengan muestra aleatoras grandes y epresenatvs, lo interval anteriores BUORMMEMTOE isn dar una nda aprimada de o que ocusen el prose, Lo que afirma el teorema de Chebyshey se aplica para cualquier tipo de datos, independiente mente de su comportamiento o disribucién.? Mientras que la repla empitica, como su nombre lo dice, se a obtcnide por medio de la observacién empirica y es vélida para muchos de los casos ue se dan en Ia pritica, sobre todo silos datos tienen un comportamiento con cierto grado de similnud a una campana o lad rucién normal (yea cl apéndice). De cualquier manera, ambos «asos ilustran muy bien la manera en la que la desviacién estindar mide la variabilidad en torno a ha media Si se aplica la regla empirica alos datos del ejemplo 8.1 del peso de las bolsas de azticas, se tiene ‘que el intervalo X + 3S esti dado por: © Engeneral, la desiualdad de Chebyshev afirma que al menos (1 y 1 AS; dec ese porcent ‘s eullquier nuimero mayor que 1 > Apoyandh la repla empiric existe una extensdn als desigualdad de Chebyshey, hecha po Duncan, 1989), que aumenta el porcentaje que cubren los intervalos, Concretamente, est extension arena que sila diibucién de Xs unimodal, la probubilidad de que Xe desvie de at media en mas de kveces su desiaciSn ‘tindar, es igual 0 menor que 1/2.254#, Con lo que bajo estas circunstancias entre + 25 se encontrar al ‘mens 89% cle los datos muestrales yentte X* 3S estara al menos 95%. A2) X 100 de os datos estn entic 3 — &S e datos estard dentro de & desviciones estindar a parte de Ik media, donde + ramp y Meidel (yea La varabiidad ye! pensamiento estadistico 8 Marca A: 502.3 ~ 3(7.23) = 480.61 502.3 + 3(7.23) = 523.99 Marea B: 498.1 ~ 3(3.68) = 487.06 498.1 + 3(3.68) = 509.14 De esto se deduce que alrededor de 99% de los pesos de las bolsas de muestra dela marca A varia entre 480.61 y 523.99 gramos. Mientras que en el caso de la marca B, esta variacién esté entre 487.06 y 509.14 gramos. Con esto se confirma la evidencia a favor de la marca B. su elaboracién y se elovarén los costes dal fabricante. Por lo tanto, es necesario que el proceso de fabricacién esta tipo de laminas garantice que su grosor cumple con especficacones: El'= 4.2 y ES = 9.8 mrn = Se plantean las siguientes inverrogantes: qué tipo de laminas en cuanto a grosor se estén produciendo? 2El gro- ‘medio 0s adecuado? La varabiided de! grosor os mucha 9 poca? Para responder @ estas interrogantes de la x 73 ¥=47 S=048 Toriando en cuenta el tamafo de muestra y la forma en la que se obtuvo, se puede asegurar con un buen nivel de “eonfianza que el g0sor promedio no fue satistactoro, ve que es ao menor que 5mm; con el indice Kaus se detalla en [el siguiente capitulo, se ve que la media esté desfaseda 34% a la izquierda del Optimo de la especficacion. De la me- tana se ve que £0% de las 60 léminas medidas tuvo un grosor menor 0 igual que 4.7 mm. Para investigar la veriabiiad y saber si al menos el espesor de las 60 lémines cayo dentro de las espectficaciones, 'Se aplica la regla empiric, con lo que se ve que entre 473-3 x 0.48.y 4.73 +3 x 0.48 (3.29 y 6.17 mmm) estuvieron précticamente todas las JSminas de la muestre en cuanto @ grosor, por lo que hay serios problemas pues doberian haber ostado, alo mis, ontre 4.2 y 5.8. © De acuerdo can lo anterior, el proceso no es capaz da cumplir las requerimientas de calidad, porque se tiene de- Tasiada variacion y el proceso esta descentrado, donde se da una tendencia marcada a producir léminas més de!- ‘g2das (4,73), Para atender estos problemas, la experioncie indica que se debe trabajar primecamente on centrar ol Proceso y luego en reducir la variablidad Como se vio en los ejemplos 8.1 y 8 ‘stindar gxpresada por el te con base en la relacién entre la media y la desviacién zema de Chebyshev y la regla empirica, es posible determina si la va riabilidad es mucha, Se debe tener cuidado en la aplicacién de la regla empitica cuando se tienen, Iuestras pequefias y/o poco representativas, ya que las conclusiones serin poco contfiables respecto a toda la poblacién. Limites reales o naturales Debido a las propiedades de la distribucién nocmal (vea el apénuice), expresada por la regla empt: rica, lo que se ha estudiado da rigen a fo que se conoce como limites naturales o reales de un mites naturates proceso, Sea pla media yo" la desviacidn estindar del proceso, entonces los limites reales o natura oreales. les del proceso estin dads por Se btenon con p- 40.9434, eindean Limite real inferior (LRI) = yt = 30 ednde adonde via Limite real superior (LRS) = a + 30° ‘a solid de un proceso, Dentro de estos limites se ubicarin los valores de la variable de salida correspondiente, 16t CAPITULO OCHO Estadistica deseriptva: la calidad y la variabilidad Histograma y tabla de frecuencia En has secciones anteriores vimos que para el andlisis de un conjunto de datos es clave conocer st ten= dencia central y su dispersién. Ahora veremos que el histograma y la tabla de frecuencias permi- ten visualizar estos dos aspectos de un conjunto de datos, y ademés mucstran la forma en la que los ddacos se distribuyen en el intervalo en el que varian. Especificamente, el histograma es una represen= tacién grafica, en forma de barras, de la distribucién de un conjunto de datos o una variable, euyos datos se clasifican por su magnitud en cierto niimero de grupos o clases, y cada clase se representa por una barra. Todas las barras tienen el mismo ancho de base, pero su altura es proporcional a la cant dad de datos que pertenecen a dicha clase. Usualmente, el eje horizontal estd formado por una esea- Ja numérica para mostrar la magnitud de los datos y en el eje vertical se representan las frecuencias, bla 82 Tabla do frocuoncia para ol peso de las bolsas de azar de la marca A cere 1 aa0034857 1 2 aisga4gi4 — /f az z 3 491504971 /i/l i 4 Saara bos aT ha mt 18 5 03088086 lif IHil 1 " 6 soe7853 Mill 5 1 sM4as00 it sre 2 Construccion de un histograma Aun cuando la mayoria de los software estadisticos proporcionan de manera automitica el histogra- ‘ma, a continuacién, con los datos del ejemplo 8.1 del peso de las bolsas de anticar de la marca A, se ilustra la construccién de un histograma a fin de profundiaar en la comprensién del mismo. Paso 1. Determinar el rango de los datos. El rango es igual a la diferencia entre el dato m: minimo: R= 515 ~ 484 ="31 Paso 2. Obsener el ntimero de clases (NC). En general se recomienda que el niimeto de intervalos 6 clases sea de 5a 15. Para decidir un valor entre ete rango hay varios criterios. Uno de ellos dice que el ntimero de clases debe ser aproximadamente igual ala raiz cuadrada del niimero de da tos, Otro criteria, conocido como la regla de Sturgess, seftala que el niimero de clases es igual a1 + 3.3 Logys(niimero de datos). En el ejemplo, la raiz cuadrada de 40 (mimero de bolsas pesadas de la marca A) es mayor que scis, por lo que se eligen siete clases, NC = 7. Aplicando la regla de Sturgess, también se obti ya que 1 + 3.3 Log, (40) = 6.3. En ocasiones, al modificar el nimero de clases se pueden apreciar aspectos que no se habjan observado, por lo que, si se dis- ye un resultado sis pone de un programa computacional, ¢s recomendable experimentar con dife de clases que estén cereanos al valor propuesto Paso 3. Establecer la longitud de clase (LC). La longitud de clase se establece de tal manera que el ran 50 pueda cubritse en su toralidad por el niimero de clases determinado. As obtener la LC es dividiendo el rango entre el nsimero de clases: LC = RNC. Sin embargo, en ‘ocasiones resulta mis conveniente ampliar un poco el sango para que el histograma tenga una ‘una forma directa de Histograma y tabla de frecuencia mayor que la obscrvada en la muestra. En el ejemplo, el minimo es 484 y cobertura ligeramen le 480 520. Asi: imo es 515; de esta manera, al ampliar un poco, el histograma podria LC = (520 - 480)/7 = 5.7 Paso 4. Construir los intervalos de clase. Los intervalos de clase resultan de vide el rango (original o ampliado) entre el niimero de intervalos determinados con la LC, como se muestra en la tabla 8.2. El punto inicial para la primera dase debe ser el dato jemplo se inicia en 480. Para obtener la primera clase s€ fe suma al punto i no del rango ampliado. En el cial Ia longitud de clase y asi se obtiene cl intervalo de a primera clase (vea la abla 8.2). Para obtener el inter Jo de la segunda clase, se toma el final de la primera case como punto inicial y e le suma la Jongitud de clase y asfse sigue hasta completar todos los intervalos como se muestra en la tabla de frecuencias 8.2 Paso 5. ‘Obtener la frecuencia de cada clase. Para obtener la frecuencia se cuentan los datos que caen en ‘ada intervalo de clase (vea la tabla 8.2). Cuando un dato coincide con el final de una clase y principio de la siguiente, entonces tal dato suele incluirse en la primera, Paso 6. Graficar el histograma. Se hace una gréfica de barras en la que las bases de las barras sean los intervalos de clase y la altura sean las frecuencias de las clases. En el histograma dela figura 8.4 wuestra de las s¢ muestra este paso, en el que se puede aprecia la variabilidad del peso de bolsas de azticar de la marca A. que précticamente va de 480 a 520 gr En la figura 8.5 se muestra el histograma para los datos de la masca B, a partir dl cual se apre- ‘ia que tienen una variabilidad mucho menor que las bolsas de la marca A. En ambos histogramas se observa que la tendencia central en ambas muestra s similar (cercana a 500 gramos), Ademés, | compor in répida de los histogramas se ve que fa muestra de las no hay situaciones especiales en c mento, como dates raros, sesgos, etcetera Asi, con un vistazo y compara bolas de la marca B cumple mejor los requetimicntos para claborar el agua fresca en el restau a, y dada la gran diferencia en rante, Por lo tanto, dado que la muestra no es demasiado pequ variabilidad, las bolsas de aziicar de 500 gramos de la marca B son las que aseguran una mejor calidad en el agua fresca. Advierta que decidir con base en el histograma resulté mis intuitive que hacerlo con la apli «cacién de los criterios previos. Por elo, el histograma es fundamental para analizar un conjun tw de dates y decidir con base en su tendencia central, su va lidad y comportamicnto. BF ” Figera 84 bstogamo 0 «0 sto si sa paratelsas de aa Pes tela mara 166 1 CAPITULO OCHO Estadistica descriptiva: la calidad y la veriabilidad Soe Figura 85 Histogroma ‘ara bolsas de aricar 80 4%0 500 510 520 de lamaica 8 Peso a) ERR Espesor de léminas En el ejemplo 6.2 se evalus el espesor de las laminas de asbesto respecio a su valor ideal (5 mm) y a su veriabilided tolorada lontre 4.2 y 6.8 mm). En le figura 8.6 60 muestra ol histograma para ol espesor de las 60 léminss medidas ena muestra Con base en aste histograma, de un vistaro se aprecia que las Idminas analizadas tuvieron una tenden- Cia hacia la izquierda de 5, y que su variabilidad fue mas de fa tolerable, ya que parte del histograma queda fuera de les especificaciones, tanto de la inferior 4.2 como de la superior 58. Ademas, coro vernos enseguida, el histograma no es simétrico, ya que tiene una cola més larga a Is derecha (sosgo positivo) y se tiene un probable acantilado a la inquierda al no disminur més suavemnente la frecuencia del histograma; en ambos casos se debe investigar cusl es la razon, En suma, el proceso no es capaz de cumplir las especificaciones del grosor. Se recomienda generar acciones para ‘tender el problema: primero se debe tratar de centrar el procese y despuds reducir su variabilided. Se sugiere que la evaluacion de las acciones de mejora se evalen mediante el histograms, que es la herramienta con la cual se ha deteciado 0 ciagnosticado el problema (vea el ejercicio 18 dé este capitulo), Fi i } i } FiguraB6 Histograra para las laminas de 38 az 4650 54 58 asbesto Peso (a f Interpretacién del histograma Cuando un histograma se construye correctamente, es resultado de un ntimero suficiente de datos (de preferencia mas de 100), y ests son representativos del estado del proceso durante el periodo de interés. Se recomienda, pues, considerar los siguientes puntos en Ia interpretacién del histograma. 1. Observar la tendencia central de los datos. Localizar en el eje horizontal o escala de mediciéon Jas barras con mayores frecuencias. En el histograma de la figura 8.6, las mediciones mas co- ‘munes se encuentran entre 4.2 y 5 mm. Etudiar el centrado del proceso. Paraello, es necesario apoyarse en el punto anterior y observar la posicién central del cuerpo del histograma respecto a la calidad 6ptima y a las especifi- caciones, si las hay. Por ejemplo, en ha figura 8.6 el proceso (histograma) no esté centrado en Ia calidad éptima que es 5 mm. En a figura 8.7 inciso ¢) se muestra un proceso centrado con poca variabilidad, mientras que el inciso f) muestra un proceso descentrado con mucha variabilidad. Examinar la variabilidad. Para ello hay que observas,a partir del grupo de barras més alto, qué tan ripido disminuye la frecuencia de las demés barras; por jemplo, en la figura 8.72) se aprecia un histograma con poca dispersi6n y en la 8.78) uno con mucha. También se puede comparar Ja amplicud delas especificaciones con el ancho del histograma. Para considerar que la disper- siGn no es demasiada, el ancho del histograma debe caber con holgura en las especificaciones. Analizar la forma del bistograma, La forma de campana cs la forma de a distribucién que més se presenta en la préctica. Por lo que sil histograma no refleja en forma aproximada este tipo de distribucién, se debe investigar a qué se debe. Algunas de las formas tipicas que no coin- ciden con una distribucién de campana son: © Distribucion sesgada, Ena figura 8.7, incisos & y f), se aprecian histogramas con una distribucion sesgada ala derecha, ya que la cola derectia es mas grande que la zquier da, En términos generates, un sesgo en una variable de salida puede reflejar un despla- zamiento paulatino de un proceso debido # desgastes o desajustes; también puede indicar procedimientos viciados en la forma de obtener las ediciones o un desem- eno especial del proceso en el sentido que aparecen algunos valores inusuaimente altos de un solo lado de la distribucion lizquierdo 0 derecho). Cabe aclarar que existen ‘caracteristicas de calidad que por su naturaloza tionen sesgo, como los tiempos de vida, las resistencias a la fatiga. Una forma de decidir si una distribucién sesgada indica una situacion espacial que corragit es compararia con Ia distribucion de la misma caracte- ristica o de variables similares para datos obtenidos en otro periado. La recomendacion general es corroborar si hay algo especial detrés de una distribucién con sesgo. ‘©. Distribucién multimodal. En la figura 8.7c) se prosonta un histograma on el que se notan claramente dos modas 0 picos, que muestran dos tendencias centvales ciferentes. Este tipo de distribuciones con dos 0 mas modas retlejan la presencia de dos 0 mas realida- des 0 condiciones diferentes. Aigunas situaciones que pueden causar una distribucion multimodal son: . 2) Diferencias importantes de lote a lote en la materia prima que utiliza el proceso, de- bido a que proceden de diferentes provesdores 0 a exceso de variacién de un mis- mo proveedor. 'b) Enel proceso han intervenico varios operadores con critetios 0 métodos de trabajo diferente: Las mediciones fueron realizedas por personas o instruments diferentes, utiizan do distintos criterios con instrumentos mal calibrados. 4d) Elproceso, cuando gener los resultados de la distribucioh multimodal, estuvo ope- rando en condiciones diferentes (una condicion para cada mode). @) En general, una distribucién multimodal se debe a la presencia de fuentes de varia- ‘cin bien definidas que tienen que identficarse y corragitse para asi mejorar la ca- pacidad dol proceso correspondiente. Una forma de identificarlas es analizar por separado los datos en funcion de diferentes lotes de materia prima, operadores. instumentos de medicion, turnos o olas de produccion, etc., para asi comparar los resultados y ver si hay diferencias signiticativas.. 188 1 CAPITULO OCHO Estadistica descriptva: la cal «Poca vaiabilidad ‘hil, ©} Dos picos, bimodal dos realidades ditintas juntas 8 «Proceso cerrado con poca vritilidad Fig 7 Distintes tpos de histogramas idady la variabilidad ‘1 Mucha varibilidod il 4) Acantilado derecho A | 1) Proceso descent con mucha vaviatidad ie Errores en Ia toma de: = Distribucidn muy plana. En ocasiones, 0} histograma muestra una distribucién muy *chata” 0 muy plana y que esta lejos de tener forma de campana. Las situaciones que pueden causar esto son las mismas que las de la distribucion multimodal, con la par ticularidad de que las diferencias son menos fuertes; sin embargo, pueden afectar se- riamente la capacidad de un proceso. Por lo que también deben ser identificedas y comregidas mediante la estrategia recomendeda antes. © Distribucién con acantiiados. En el histograma de la figura 8.7d) se observa un acanti- Jado derecho, que es una suspensién 0 corte muy brusco en la caida de la distribucion. Algunas de las posibles causas que motivan la presencia de un acantiado son: lote de articulos previemente inspeccionados al 100% en el que se excluyeron los articulos ‘que no cumplian con alguna media minima 0 que excedian una medida maxima (como ene figura), problemas con el equipo de medicién, errores en la medicién 0 inspeccién {cuando el inspector esta predispuesto a no rechazar un articulo y observa que este Casi cumple con ls requistos, registra la medida minima aceptebte). En general, un acan- tilado es anormal y se debe buscar la causa del mismo. 5. Datos rarosatipcos. Una pequefiacantidad de mediciones muy extremas 0 atipica son ficil- mente identificadas mediante un histograma, debido a que aparece una o més barras pequefias bastante separadas 0 aisladas del resto, Un dato raro refleja una situaci6n especial que se debe investiga y entre las posibles causas estan la siguientes: '® Eldato es incorrecto, ya sea por error de medicién, de registro o de “dedo” cuando se introdujo ala computadora ‘® La medicion se hizo sobre un articulo o individuo que no pertenece al proceso o pobla- cién a la que pertenece e! resto. = Si quedan descartadas las dos situaciones anteriores, entonces la medicién se debe a lun evento rafo 0 especial. Es decr, cuando se hizo esa medicion estaba ocurtiendo en el proceso una situacion especial fuera de fo comun (en el capitulo 14 se trata con mayor detalle las stueciones especiales) 6. Eitratficar. En ocasiones, en el histograma no se observa ninguna forma particular, pero hay mucha variacién y, en consecuencia, la capacidad del proceso es baja. Cuando los datos pro- cedan de distintas maquinas, proveedores, lotes, turnos u operadores, puede encontrarse in- formacién valiosa si se hace un histograma por cada fuente (estratificar), con lo que se puede encontrar la maquina o el proveedor més problematico. Con base en los puntos anteriores, es recomendable que siempre que se analicen dates, se uti lice el histograma y este se interprete con devalle. De esa manera se podrin detect situaciones problemiticas y posibles soluciones para las mismas, Ademis, serd una forma concreta de que los datos y mediciones sobre los procesos, que en ocasiones abunda, se conviertan en informacién dil para la toma de decisiones y acciones. Se deberd tener la precaucién de que el histograma se haya obtenido de manera correcta, sobre todo en lo referenteal nimero de clases ya la cantidad de datos. Errores en la toma de decisiones con el uso de la media Hemos dicho que es frecuente que no se empleen datos para tomar decisiones, y cuande se wtilizan 1 frecuente que solo se use la media aritmética. El promedio sirve para evaluar productos, provee- dores, empleados, planes, empresas, etc. Por lo general, en estas evaluaciones, si el promedio fue satisfactorio se premia o felicta; si por el contrario, no lo fue, entonces se castigao se Hama la aten- clon, Cuando se decide de este modo, es frecuente caer en errores (Deming, 1989), debido a que el concepto que se tiene de la media es equivocado y no se toma en cuenta la variabilidad. ‘Aunque 2lo largo del presente capitulo se han mencionado algunos de los errores que se cometen por el uso excesive de la media y por ignorar la varabilidad, en esta secclin se presentarin, de mane- ra resumida, algunos de los errores mas fiecuentes en la concepci6n de la media (Gutiérrez, 1994). 1. Secree que los valores de todos los dates son iguales oestin many cerca de ta media, ignorando que {Gta no proporciona ninguna informacién sobre la variabilidad. Por ejemplo, al decir que el 170 | CAPITULO OCHO Estadistica descriptiv:la calidad y la varibilidad b Preguntes de repaso y ejercicios del capitulo 8 contenido promedio de una lata es de 375 ml, entonces es comtin que las © entiendan que todas las latas contienen 375 ml, o bien, que estén muy cerca de Jo cual reflea un desconocimiento de lo que mide la media y de la funcién de las variabilidad. En este caso, la variabilidad en el contenido de las latas tiene dos Fuentes: ‘mensiones y la cantidad vertida en las mismas. 2. La media como el dato mds frecuente, y con esto se olvicla que lo anterior solo se da en. simétricos y unimodales, es decir, desconociendo el concepto de moda y confundiéndolo, el de media. a. 3. La media es el valor que estd en medio y que a la inquierda de él quedan 50% de los datos, mismo que a la derecha. De este modo se ignora el concepto de mediana y el hecho de que: Ja media la “jalan” los sesgos y los datos “raros” de un solo lado. 4, Lamedia muestral igual. ala media poblacional, com lo que se desconoce que la media muestral es una variable aleatoria. Hl lector habri notado que en ls secciones anteriores se pone énfa- sisen que lo que se observa sobre el comportamiento de los datos es vilido para la muestra, y en la medida en la que esta sea representativa y grande, también tendré cierto grado de valider para la poblacién. or ejemplo, a partir de un lote se extrac una muestra aleatoria y se detecta que 15% de sus ar- ticulos no cumple con especificaciones de calidad; evidentemente eso quiere decir que tal lote y el proceso con el que se fabrics tienen problemas de calidad, aunque no se pueda asegurar, con base en la muestra, cudl es el porcentaje exacto de articulos en el lote que no cumple con especificaciones debido a que lo que se observa en la muestra es variable y depende de las piezas que fueron seleccio- nadas. Lo mis que se puede hacer es usar la muestra para estimar con cierta confianza un intervalo donde esté el porcentaje de articulos defectuosos en el lore (vea Gutiérrez Pulido y de la Vara, 2013), Con propésitos iluscrativos, suponga que en el departamento de ventas de una empresa laboran seis personas, cuya antigitedad en afios en la empresa es 2, 3, 4.6, 7, 10. Como se puede ver, la an- tigiiedad promedio de tales empleados es de 5.4 aos. Sin embargo. si se considera que se descono- fa la antigtiedad exacta de los seis trabajadores y que para investigarla se les pregunt6 a cuatro de ellos, entonces dos posibles muestras son 2, 3, 4, 6 y 4, 6, 7, 10. La primera muestra tiene una me- ia igual a 3.75 y la segunda a 6.75; ambas disctepan aunque procedan de la misma poblacién y suna de las dos es igual a la media real (5.4). As{ que una media muestral no es exactamente igual a la media poblacional. Como sc ha visto, el us0 del promedio como tinico criterio de decision puede llevar a errores, por lo que en la prictica cotidiana en la empresa y en la ensefianza de la estadistica se deben tomar precauciones, dando sentido y utilidad al resto de los conceptos estadisticos (mediana, deSviacion cstindar,histograma, inferencia estadi a), Jo cual no descartaria errores. pero si los reduciria de ‘manera importante y se estaria en la ruta de ade dero papel: entender la variabilidad. nla estadistica, para comprender su verda- 1. 2Qué obtuvo Mathew Maury al analizar los diarios 3. ‘Se dice que cuando en un proceso hay mucha varia de a bordo de los viajes navales? ‘én en sus 6 M, 20 tiene un proceso pobremente 2. Sobte el uso de datos pare toma de decisiones, con estandarizado, Expique con sus palabras por qué ou teste cede esto @) De manera resumida indique lo que expresa la 4. (Qué es el pensamiento estadistico? peal nes slo 5. Sofale cémo se puede utiizar el pensamiento esta- 1) én que situaciones os itl ol uso do técnicas os- stico en los niveles estratégico, directivo y ope tacisticas? faclonal de una organizacén @ Desorita algunas de las fallas en la obtencion de ©. Proporcione dos ejemplos de variables cualitativas y informacion que se comentaion en la primera 0s de variables cuantitativas. seccién de este copituo, 7. Se dijo que de acuerdo con el tipo de espectficaciones de una variable de salida existen tres categorias de variables: cuanto mis pequofia mejor, evanto més grande mer, vel valor cbjetivo es mejor. D6 un par de ejemplos para cada una de elas. 8. 2De qué manera afectan los datos raros a le media? 9. Explique los errores on la intorprotacion de la media que se sefalan en la seccién Errores en la tome de ddecisiones con e! uso de la media Explique la relacion entre le media y la desviacion es- tandar quo establece lo rogla empitca y el teorerna de Chebyshev. Se desea investigar el peso promedio de 1 000 articu- los de un lote, por lo que se eligen aleatoriamente 40 de ellos, s¢ pesan y se obtiene que X = 252 gramos con $= 6, 21 {Quiere decir que el peso medio de 10s 1000 ar tioulos os do 252? ) ¢La mayoria de los articulos pese 262 gramos? ) {De los 40 articulos en la muestra es probable que alguno pueda peser 300 gramos? Aptque la regia empiric pare contester. En una emprese se leven los reaistras del numero de falles de equipos por mes; la media es de 10y la me- na de 8: 10 12. @) Siusted tiene que reportara tendencia central de fallas, 2qué nimoro reportaria? by i Ladiscrepancia entre la media y la mediana se de- id @ que en varios meses ocurieran pocas falas? Un aspecto clave de la calidad de cierto producto es ‘su peso: la norma estabiece que suipeso minima sea de 2 kg. El ingeniero de produccicn informa que se esté cumpliendo con tal norma, ya que el peso pro- medio del producto es de 2.2 kg. ¢Estd usted de ‘acuerdo con el ingeniero? ‘Tres maquinas, A, B y C, realizan cortes de manera au tomatica de ciertas tras de hule. La jongitud ideal de Jas tiras es de 90 cm, con une tolerancia de *2 om. Se toma una muestra de 80 piezas de la produccién de una semana de cada maquina 2) La longitud promedio de las 80 tires de cada mé quina son: A, X = 90; B, ¥ = 905; C, X = 92, 14. Tabla 8.3 Doios por jercicio 16 NE HEE ses i Ri pe ecu i Hota Sane ; eens oat ae] ; 192 706 190 197 i im oh pees ao ae ee fal is 28 15, 16 994190183200 4007 t9B 180. 96 8419818 4 Ni aca io coma 00 «118793 186 5198S 1984198 188 mo 848907 m1 001 mat me 17197 ma tg 2 1970188 S= 15:8, S=10:C,S=05,d na estuvo funcionando mejor. pirica. Enel ejemplo 82 se detect6 que se t con el grosor de las léminas porque no $e eu las espocificaciones: 5 mm +0mm, Cé de corregit tal stuacién, un equipo general 10 de mejora. Para verficar si las acciones:

Potrebbero piacerti anche