Sei sulla pagina 1di 13

Semana 1

Modelos matemáticos
para la producción

Unidad 1
Estadística descriptiva

Material compilado con fines académicos, se prohíbe su


reproducción total o parcial sin la autorización de cada autor.
1. Estadística descriptiva
La estadística utiliza los métodos científicos para analizar información en forma de datos.
La estadística descriptiva es una variante o rama de la estadística que analiza grandes
cantidades de información cuantitativa agrupándola o resumiéndola. Trabajar o analizar
grandes cantidades de información muchas veces es muy difícil. La estadística descripti-
va, mediante herramientas como gráficos, o tablas nos va a permitir observar el compor-
tamiento de estos tipos de información de forma más simple y sencilla, permitiéndonos
trabajar con ella y tomar mejores decisiones.

Imaginemos por ejemplo que nos encontramos en un canal de producción de piezas


metalmecánicas que provee componentes para la industria automotriz, el director de la
empresa quiere un resumen del comportamiento de las dimensiones de este canal. ¿De
qué forma se podría resumir esta información? Una forma de hacerlo sería mediante la
estadística descriptiva. Se podría utilizar una gráfica donde se mostrarán los valores de las
mediciones de las piezas de dicho canal de producción sin necesidad de mostrar hojas
y hojas de datos de las mismas.

Es decir, la estadística descriptiva es usada para resumir información o datos para que
puedan ser observados y analizados de formas más sencillas y útiles.

1.1 Definición de estadística.


La estadística es una de las principales ramas de las matemáticas que se ocupa del estu-
dio, clasificación, análisis y representación de información. De acuerdo a la Real Academia
de la Lengua Española, estadística es el “Estudio de los datos cuantitativos de la pobla-
ción, de los recursos naturales e industriales, del tráfico o de cualquier otra manifestación
de las sociedades humanas” (RAE, 2018). Por su parte el Merriam Webster la define como
“una rama de las matemáticas que se ocupa de la recopilación, el análisis, la interpretación
y la presentación de masas de datos numéricos”. (Merriam-Webster, 2018). Con esto se
puede decir que la estadística es una parte de las matemáticas que va a estudiar, analizar
o interpretar grandes cantidades de datos cuantificables o numéricos de prácticamente
cualquier situación que se presente. En resumen, la estadística es una ciencia que nos
permite analizar e interpretar datos de formas que sin ella no nos sería posible.

La estadística también es el estudio de las probabilidades de que un evento determina-


do ocurra con base en la información cuantitativa recolectada disponible. La estadística
busca inferir las características o propiedades de información (por lo regular grandes
cantidades de datos o información) a través de la inspección de una muestra buscando
generar conclusiones con el mínimo de gastos posibles.

2
1.2 Tipos de estadística.
La estadística por lo general se divide en dos: la estadística descriptiva y la estadística
inferencial. Cuando se analiza información, como por ejemplo, la dimensión de determi-
nada pieza en una línea de producción, se pueden utilizar ambos tipos de estadística para
el análisis y para obtener un mejor resultado. A continuación, se verá lo que cada una de
las estadísticas es y cuál es su diferencia.

Figura 1: Estadística Descriptiva e Inferencial (Buzzle.com, 2018)

La estadística descriptiva y la inferencial son ambas procedimientos estadísticos que per-


miten analizar la información de una muestra y poder obtener conclusiones o inferencias
de ella.

Estadística Descriptiva
Se le conoce como estadística descriptiva al análisis de información que busca describir o
resumir datos o información de tal forma que se puedan percibir características, tenden-
cias, patrones o comportamientos. La estadística descriptiva nos permite presentar, ana-
lizar o visualizar información que sí solo se presentara de forma sencilla no sería posible
de comprender. Por lo tanto, este tipo de estadística nos permite el estudio de datos de
forma más significativa lo que facilita una interpretación más simple de la misma. Existen
2 tipos generales de medidas estadísticas usadas para describir datos.

• Las medidas de tendencia central.


• Las medidas de Dispersión.

En la estadística descriptiva la información se puede describir de forma muy precisa, el


análisis o conclusiones es solo para el grupo en cuestión, no se puede extender la con-
clusión a otro grupo. Se pueden usar elementos gráficos para describir la información.
Esta estadística te permite describir, organizar y llegar a conclusiones sobre un grupo de
datos específicos.

3
Algunas de las herramientas gráficas más usadas en este tipo de estadística son:

• Gráficas de pastel
• Gráficas de barras
• Histogramas
• Distribuciones de frecuencia
• Análisis o gráficas de medias

Estadística Inferencial
La estadística descriptiva analiza y provee datos de la información con la que se está
trabajando, sin embargo, muy a menudo no se puede tener acceso a toda la población
de interés. La estadística inferencial utiliza un grupo de técnicas que nos van a permitir
usar muestras para hacer generalizaciones acerca de la población de la cual fueron ex-
traídas. Por esto es muy importante que la muestra de datos represente lo mejor posible
a la población. El método que usa este tipo de estadística se le conoce como muestreo.
La estadística inferencial parte del hecho de que el muestreo tiene naturalmente un
margen o porcentaje de error, por lo que se espera que una muestra nunca represente
perfectamente o al 100% a una población.

La estadística inferencial es la consideración, estudio y análisis de un grupo de datos, a


diferencia de la estadística descriptiva, el análisis y conclusiones sí se puede extender a
un grupo de datos similares o más grandes. Este tipo de estadística nos ayuda a analizar,
generalizar y emitir juicios o conclusiones.
Los tipos de estadística son:
• Intervalos de confianza.
• Prueba de Hipótesis.

Algunas de las herramientas gráficas más usadas en este tipo de estadística son:
• Análisis de correlación
• Gráficas de regresión lineal
• Annova

1.3 Poblaciones y muestras.


Cuando analizamos información siempre nos vamos a encontrar con dos posibilidades,
la primera es la de poder analizar el universo, es decir todas las piezas, datos o valores
existentes de lo que buscamos analizar, es decir la población. Por otro lado, regularmente
por cuestiones de tiempo, costo o accesibilidad no nos es posible analizar una población
completa determinada por lo que se hace el análisis sobre solo una porción de la pobla-
ción la cual se denomina muestra.

4
Figura 2: Población y Muestra (Elaboración Propia)

La diferencia principal entre una población y una muestra radica en que la población in-
cluye TODOS los elementos de un conjunto de datos, piezas o información mientras que
la muestra solo contiene una parte de las observaciones de la población.

Trabajar sobre una población o sobre una muestra tiene algunas implicaciones, un ejem-
plo es que cuando una característica medible de una muestra como lo es una media o
una desviación estándar es denominado estadístico, pero si la característica es de una
población estamos entonces hablando de un parámetro.

Un muestreo, va a permitir seleccionar los elementos muestra de una población. Una


población consiste en N número de piezas u observaciones, una muestra tiene n número
de los mismos. Todas las posibles muestras de n tienen la misma probabilidad de ocurrir.
Como ejemplo tenemos toda la pasta producidas por la línea de producción 2 de una
fábrica de producción de pasta con un lote determinado de su ingrediente principal. La
población es toda la pasta producida en dicha línea de producción con el lote del ingre-
diente principal. La muestra sería una porción representativa de la misma.

5
1.4 Variables continuas y variables discretas.
Las variables discretas son aquellas que son cuantificables solo en números enteros
cerrados o en criterios específicos como por ejemplo el número de alumnos en un salón,
el color de un lápiz, el género de una persona.

Las variables continuas por su parte son aquellas cuyo valor se puede presentar en deci-
males, fracciones o partes dentro de un intervalo de valores definido. Como por ejemplo
tiempo o peso.

Visita la plataforma para ver el video relacionado

Una descripción muy completa de estas variables se puede encontrar en el siguiente


video de Khan Academy que se puede encontrar acceder mediante la siguiente liga:
https://youtu.be/dOr0NKyD31Q
(En ajustes se debe seleccionar en subtítulos, auto traducir y seleccionar español)

1.5 Agrupamiento de datos.


En matemáticas y en estadística, para poder analizar información o datos, es necesario
acomodarlos o agruparlos de tal manera que el trabajar con ellos sea más fácil y sencillo.
Existen muchas formas y métodos para ordenar, acomodar o agrupar datos partiendo de
las características de los mismos y de las razones u objetivo final que tengamos para ha-
cer dichos agrupamientos. Los métodos van a depender de los objetivos que se busquen
conseguir al analizar la información. Algunos de los objetivos más comunes de acuerdo a
Javier Benítez en su trabAjo de Investigación: Técnicas de Agrupamiento para el análisis
de Datos cuantitativos y cualitativos, son:

Análisis de Secuencias. Se analizan los datos y sus características para encontrar


secuencias en los mismos.
Clasificación. Busca dividir o agrupar los datos bajo determinados grupos de acuerdo
a criterios específicos.
Clusterización. La clusterización utiliza algoritmos que hacen agrupaciones de datos
de acuerdo a sus características.
Asociación. Busca encontrar las asociaciones existentes entre los datos.
Dependencias. Busca la relación de dependencia entre variables.
Predicción. Busca encontrar datos que validen hipótesis sobre el comportamiento o
características de un grupo de datos.
Regresión. A partir de un grupo de datos y su análisis se establece un patrón o mo-
delo para predecir el comportamiento de un grupo de datos. (Benítez, Javier, 2005)

6
Los datos agrupados son datos organizados en grupos conocidos como clases, es decir
la información o datos agrupados han sido clasificados. Una clase o categoría es un grupo
de datos que la persona que hace dichas clases o categorías ha definido. Cada clase va
a tener un tamaño específico el cual es conocido como tamaño de la clase o intervalo.
Los intervalos se calculan con la siguiente fórmula:

Intervalo = (Valor más grande – Valor más pequeño) / número de clases que se
requieren.

Cada clase va a tener 2 límites uno superior y otro inferior. Los límites son los valores
superiores e inferiores definidos para cada intervalo

1.6 Gráficas
Gráficas de Hoja y Tallo. Este tipo de gráfico conjunta información numérica analizándola,
dividiéndola y agrupándola por cada uno de sus dígitos. Por ejemplo, supongamos que se
encuestan al azar a personas en la calle preguntándoles por su edad y esta información
se registra siendo la siguiente:

81, 76, 23, 64, 59, 56, 35, 36, 32, 21


La gráfica de hoja y tallo quedaría de la siguiente forma:

8|1
7|6
6|4
5|96
3|562
2|31

En el tallo primer columna de a izquierda se colocan los primeros dígitos o las decenas
de cada número y luego en la segunda sección o grupo de columnas de la derecha se
colocan los dígitos de las unidades.

Histograma
El histograma es un gráfico que representa gráficamente la frecuencia que tienen determi-
nados datos continuos. Para construir un histograma se recomienda seguir los siguientes
pasos:
• Obtener los datos con los que se va a trabajar.
• Determinar los intervalos en los que van a ser agrupados los datos y seleccionar
el ancho apropiado de los grupos.
• Determinar de los datos la frecuencia o el número de datos que caen dentro de

7
los intervalos establecidos.
• Graficar los resultados.

Veamos el siguiente ejemplo: Se hace una investigación de mercado de las edades de


los clientes de determinado producto obteniendo la siguiente información.

Figura 3: Ejemplo, edades de clientes (Elaboración propia)

Se determina que los grupos van a ser de los 20 a los 30 años, de los 31 a los 40, de los
41 a los 50, de los 51 a los 60, de los 61 a los 70 y de los 71 a los 80 años quedando de
la siguiente forma:

Figura 4: Ejemplo, determinado la frecuencia (Elaboración propia)

Con los grupos y la frecuencia se obtiene el siguiente histograma:

Figura 6: Ejemplo de gráfica circular, obteniendo los porcentajes. (Ela-


boración Propia)

Con esta información se puede generar la gráfica circular, misma que quedaría de la si-
guiente forma:

8
Figura 7: Ejemplo de Gráfica Circular. (Elaboración Propia)

Del gráfico anterior podemos observar el porcentaje que ocupan las personas de 31 a 40
años con respecto a los demás.

Existen muchas gráficas y muchas variantes de las mismas las cuales son una herra-
mienta muy poderosa para ayudar a una persona departamento o empresa a mostrar las
características o patrones de la información que se analiza y las conclusiones o resul-
tados. Analizar información es un trabajo increíble al igual que difícil, las gráficas dan la
posibilidad de hacer que las personas a las que se les enseñan los puedan comprender
de una forma más fácil, rápida y simple, lo que es de gran utilidad al momento de tomar
decisiones importantes en una empresa.

1.7 Las medias de tendencia central (la media, la moda, la


mediana).

Las medidas de tendencia central son formas de presentar las características centrales de
la información, grupo de datos o los patrones de la misma. Algunas de las herramientas
de análisis de tendencia central son la media, mediana y la moda.

La Media Aritmética o promedio es una de las medidas más usadas. Esta medida puede
ser utilizada con datos continuos o discretos. La media es igual a la suma de todos los
datos dividida entre el número de datos.

Figura 8: Fórmula de la media de la muestra y de la población (Elaboración Propia)

9
La mediana es el valor medio de un conjunto de datos. La mediana se encuentra tomando
todos los valores del conjunto de datos, acomodándolos en orden ascendente y buscando
el valor que por orden se encuentra en medio de todos los datos, en caso de no ser un
solo dato, es decir que sean 2 datos, se toman esos 2 datos y se les saca el promedio.

La Moda, es el valor más común dentro del grupo de datos.

Para comprender mejor estos conceptos veamos el siguiente ejemplo.

La compañía de logística MexLogistics pide a su departamento de mejora continua un


análisis del tiempo que sus camiones hacen en su ruta principal ya que han observado
una gran variación en estos tiempos. El departamento hace el estudio y obtiene los si-
guientes resultados expresados en minutos cerrados (sin segundos)

Figura 9: Ejemplo de media, mediana y moda. Datos (Elaboración Propia)

Para facilitar el análisis acomodamos los datos de forma ascendente y buscamos el valor
mínimo, el valor máximo, así como la media, mediana y la moda.

Figura 10: Ejemplo, Datos ordenados (Elaboración Propia)

Figura 11: Ejemplo, Media, Mediana y Moda

Con esta información la empresa puede determinar que el promedio de los viajes es de
185.1 minutos con lo que podrá tomar decisiones de control sobre los otros tiempos mucho
más rápidos y mucho más lentos.

10
1.8 Medidas de dispersión (varianza y desviación estándar).
Las medidas de dispersión agrupan datos describiendo qué tanta dispersión hay entre los
mismos. Las medidas de dispersión usan algunas herramientas de análisis para analizar
la información como, por ejemplo, los rangos, cuartiles, varianza y desviación estándar.
El rango, es la diferencia que existe entre el valor más grande y el más pequeño, en un
grupo de datos.

Rango = Valor Máximo – Valor Mínimo


Figura 12: Fórmula del Rango (Elaboración Propia)

Los cuartiles son grupos de información generados al dividir los datos disponibles en 4.
Grupos de tamaños iguales. Cada cuartil contiene un cuarto o el 25% de los datos del
grupo de datos total.

La varianza (S2) va a medir que tan dispersos están los datos. La varianza es el promedio
de las diferencias al cuadrado de la media.

Figura 13: Fórmula de la Varianza (Elaboración Propia)

La desviación estándar es la medida de dispersión de los valores en un determinado gru-


po de datos. La desviación estándar es usada junto con la media de un grupo de datos
para resumir datos continuos.

Figura 14 Fórmula de la desviación Estándar de la muestra (Ela-


boración Propia)

En donde S es la desviación estándar, X es la media de la muestra y n es el número de


datos de la muestra.

Para la desviación estándar de la población la fórmula es:

11
Figura 15: Fórmula de la desviación estándar
de la Población (Elaboración Propia)

Para comprender mejor estos conceptos utilizaremos un ejemplo utilizando los datos del
ejemplo de la empresa de logística del tema anterior.

De los datos de la figura 10 vamos a obtener el rango y los cuartiles. El rango va a ser
obtenido de restar el valor máximo (280) menos el valor mínimo (71) y los cuartiles van
son los siguientes:

Figura 16: Ejemplo de rango y cuartiles (Elaboración Propia)

En el caso del ejemplo obtuvimos todas las medidas de los tiempos por lo que estamos
hablando de la población y no de una muestra. Con eso en mente se calculará la varianza
y la desviación estándar de la siguiente forma:

12
Figura 17: Ejemplo, Cálculo de la Varianza y de la Desviación estándar. (Elaboración Propia)

Con esto la empresa puede observar la desviación que tienen los tiempos y con esto
definir límites o parámetros para controlar los mismos.

13

Potrebbero piacerti anche