Sei sulla pagina 1di 11

Práctica N˚ 2: Estadística descriptiva del proceso

Característica

Tiempo
2
Estadística descriptiva del proceso
OBJETIVOS

Resumir la información en forma tabular y gráfica.


Calcular las principales medidas estadísticas.
Interpretar las medidas estadísticas calculadas.

 TEMAS A TR ATAR

Tablas de frecuencia.
Gráficos estadísticos.
Medidas estadísticas de tendencia central.
Medidas estadísticas de forma.
Medidas estadísticas de dispersión.

 D URACIÓN DE LA PRÁCTICA

Una sesión (2 horas).

 MARCO TEÓRIC O

1. Presentación tabular de datos

Lo realizamos mediante una tabla de frecuencia, la cual se define como el resumen que
se realiza en función de la totalidad de elementos de una muestra, o de una población
con respecto a una característica bastante particular que está estudiando alguna
variable.
Elementos de una tabla de frecuencias
a) Frecuencia absoluta(fi).- es el # de veces que se repiten los elementos de una
variable, por lo tanto se debe de cumplir:
n

∑f
i =1
i =N

b) Frecuencia relativa (hi).- es el cociente de cada frecuencia absoluta entre el #


total de elementos. Se calcula de la siguiente manera:

Ing. Ferly Urday Luna


fi
hi =
N
c) Frecuencia acumulada (Fi, Hi).- es la suma de una frecuencia dada y todas las
anteriores a ella.

d) Tabla de distribución de frecuencia.- es el arreglo ordenado en filas y


columnas de datos estadísticos según las diversas categorías de la variable,
mostrando la frecuencia o repetición en cada categoría. Este tipo de tabla se
utiliza para organizar los datos con el objeto de calcular algunas medidas de
resumen.

Frecuencias Frecuencias Frecuencias Frecuencias


Intervalos Marca
Clases absolutas Absolutas Relativas Relativas Grados
de clases de clase
simples Acumuladas Simples Acumuladas

i Ii fi Fi hi Hi Xi G°

1
2
.
n

Para rellenar los datos en la tabla de distribución de frecuencias, se debe seguir los
siguientes pasos:
 Ordenar los datos ya sea en forma ascendente o descendente;
 Calcular el rango de los datos, mediante.
Rango = Dato mayor- Dato menor
 Determinar el número de clases o intervalos
Regla de STURGES → k = 1+3,322 log (N)
Regla de Joule → k= N
Regla adicional → N ≤ 2k
Regla o método del experto → se considera un número arbitrario de clases,
teniendo en cuenta: 5 ≤ k ≤ 20
El número de clases o intervalos siempre debe ser un valor entero, por lo
tanto se puede redondear al número superior o inferior entero más próximo.

 Calcular la amplitud de los intervalos, mediante:


R Se redondea al número superior,
A = i = c = Ci =
n considerando el cambio mínimo.
 Se determina el cambio mínimo, el cual se define como la mínima variación
que puede llegar a existir para los valores de la variable, para determinar el
cambio mínimo se observa los datos y se sigue procede así:
Si los datos son enteros el cambio mínimo es 1.
Si los datos tienen un decimal el cambio mínimo es 0.1
Si los datos tienen dos decimales el cambio mínimo es 0.01
Si los datos tienen tres decimales el cambio mínimo es 0.001
 Constituir los intervalos;
 Efectuar el proceso de tabulación;

Ing. Ferly Urday Luna


 Calcular cada uno de los elementos de la tabla de frecuencias; e
 Interpretar los resultados.
2. Ejemplo de una tabla de frecuencias

Estos datos se refieren a la altura de


una muestra de estudiantes del VII
semestre de la Carrera de Ingeniería
Industrial, inscritos en el curso de
Control Estadístico de Procesos.

3. Gráficos Estadísticos
Los principales gráficos estadísticos que se trataran serán:
 Histograma.
 Polígono de frecuencias.
 Diagrama de tallos y Hojas.
 Diagrama de Cajas y bigotes (Box-Plot).

4. Medidas de Tendencia Central


4.1. Media Aritmética
Es un valor que tiende a situarse en el centro del conjunto de datos ordenados según
su magnitud. Es equivalente a dividir la suma de todos los puntajes, entre el número
total de éstos Es un valor intermedio situado entre los extremos de los datos de la
distribución.
N

X 1 + X 2 + X 3 + ..... + X N ∑X
i =1
i
∑X
X= = =
N N N

f X + f X + f X + ..... + f N X N ∑fX
i =1
i i
∑ fX = ∑ fX
X= 1 1 2 2 3 3 = =
f1 + f 2 + f 3 + ..... + f N N

∑f i
∑f N
i =1

4.2. Moda
Es la medida de tendencia central correspondiente al valor de la variable con mayor
frecuencia., es decir aquel valor que mas repite.
 d1 
Moda = Li +  ×i
 d1 + d 2 

Ing. Ferly Urday Luna


Donde:
Li = Límite inferior real de la clase modal.
d1 = diferencia de frecuencia de la clase modal y la anterior clase inmediata.
d2 = diferencia de frecuencia de la clase modal y la clase posterior inmediata.
i = intervalo de clase.

4.3. Mediana
Es la medida de tendencia central que divide la población en dos partes iguales. Se
representa por “Me” o “Md”.

N − Fi −1
Me = Li + 2 c
fi

Donde:
Li = Límite inferior real de la clase mediana (Es decir la clase que contiene a la
mediana).
N= Número total de datos.
Fi-1 = Suma de las frecuencias de todas las clases por debajo de la clase mediana.
fi = Frecuencia de la clase mediana.
c= Tamaño del intervalo de la clase mediana.

4.4. Cuantiles
Los cuantiles son las medidas estadísticas que dividen a los datos en una cantidad
determinada de partes no son más que una extensión del estudio de la mediana, por
lo tanto la interpretación de estos será muy similar que la de la mediana. También
son conocidos como medidas de posición. Los principales cuantiles son los
cuarteles, los deciles y los percentiles. Para calcularlos se utilizan la formulas:

Cuartiles Deciles Percentiles

QK = Li +
(K 4) × N − F i −1
c DK = Li +
( K 10) × N − F i −1
c PK = Li +
( K 100) × N − F
i −1
c
fi fi fi

Donde K=1,2,3 Donde K=1,2,…,9 Donde K=1,2,…,99

5. Medidas de Dispersión
5.1. La desviación estándar
Es la raíz cuadrada del cuadrado medio de las desviaciones a la media. También se
le llama desviación típica. Si se esta trabajando con una muestra, se lee representa
por s y si se trabaja con una población se le representa por σ.
n n
∑( X
2
i −X) ∑( X i
2
− X ) . fi
i =1
σ= σ= i =1
n n
Datos no agrupados Datos Agrupados

5.2. La varianza
Estadístico definido como el cuadrado de la desviación estándar; es, por lo tanto, una
medida de la dispersión de los datos de una muestra con respecto a su media. Se

Ing. Ferly Urday Luna


pueden usar las formulas de la desviación estándar, si se están trabajando con datos
no agrupados, también se puede usar:

nΣx 2 − ( Σx )2 nΣx 2 − ( Σx )2
σ2 = s2 =
n2 n( n − 1 )
5.3. Coeficiente de variación
Es el estadígrafo que “determina el grado de homogeneidad o heterogeneidad” de la
distribución que se analiza. Según esto, la distribución es más homogénea, “si el
coeficiente de variación es cada vez menor”.
El coeficiente de variación se representa por C.V y se da en tanto por ciento y su
valor es igual a la razón de la desviación estándar con la media aritmética de la
distribución. Su fórmula es:

σ
C.V = * 100
X
6. Medidas de Forma
6.1. Asimetría
Se dice que una distribución de frecuencias es simétrica, si los intervalos
equidistantes del intervalo central tienen iguales frecuencias. También se dice que
una distribución es simétrica si su curva de frecuencias es simétrica con respecto al
centro de los datos. Para calcular la asimetría existen varias medidas, una de ellas
es el coeficiente de asimetría de Pearson.

As =
X − Mo
As =
(
3 X − Mo ) Sesgo =
n

 Xi − X 
 
3

s s ( n − 1 )( n − 2 )  s 

Simétrica

Asimetría positiva Asimetría negativa

Ma=Me=Mo

Mo<Me<Ma Ma<Me<Mo

6.2. Curtosis
El Coeficiente de Curtosis analiza el grado de concentración que presentan los
valores alrededor de la zona central de la distribución.
Se definen 3 tipos de distribuciones según su grado de curtosis:
P75 − P25   X i − X  
4
− 0.5 Curtosis =  n( n + 1 ) 3( n − 1 )2
K=
P90 − P10  ∑   −
 ( n − 1 )( n − 2 )( n − 3 )  s   ( n − 2 )( n − 3 )
Si al distribución es normal, K tiende a 0. Si K tiende a 0.5, es leptocúrtica, y si K
tiende a -0.5, es platicúrtica.

Distribución mesocúrtica: presenta un grado de concentración medio alrededor


de los valores centrales de la variable (el mismo que presenta una distribución
normal).

Ing. Ferly Urday Luna


Distribución leptocúrtica: presenta un elevado grado de concentración alrededor
de los valores centrales de la variable.
Distribución platicúrtica: presenta un reducido grado de concentración alrededor
de los valores centrales de la variable.
Leptocurtica

Mesocurtica

Platicúrtica

6.3. Diagrama de Cajas


Los diagramas de cajas y bigotes –también llamados boxplots o box and whiskers– son
representaciones gráficas de una distribución estadística unidimensional en las que se
reflejan cinco parámetros: límite inferior, primer cuartil, mediana, tercer cuartil y límite
superior. A partir de estos cinco parámetros se pueden obtener fácilmente otros dos: el
rango y el rango intercuartílico. Además, también dan una medida de la simetría o
asimetría de la distribución, del sesgo y de la dispersión.
De un grafico de cajas, se obtiene información de los acerca de:
 La centralización, observando la ubicación de la mediana.
 La dispersión o variabilidad, mediante el rango intercuartilico.
 La simetría, comparando: Me - P25 con P75 - Me.
 Las colas, por la longitud de los segmentos que salen de los lados de la caja.

ACT IVIDADES DE LA PRÁCTICA

1. A continuación se presenta el numero de no conformidades encontradas en una


inspección a productos textiles.

2 0 0 0 1 0 1 0 2 1
1 1 1 3 2 2 3 1 0 2
0 2 2 1 3 1 0 3 1 1
1 1 1 3 2 0 0 2 1 1
3 0 1 1 0 1 0 0 3 0
1 0 1 1 0 0 2 3 2 1
3 1 0 1 1 2 1 2 2 0
0 0 1 0 3 0 1 0 1 2
0 4 0 2 0 4 0 1 2 1
1 1 1 1 3 1 1 1 2 0
Se le pide:

Ing. Ferly Urday Luna


a) Elaborar una tabla de distribución de frecuencias y sacar conclusiones.
b) Crear un histograma con su polígono de frecuencias.
c) Hallar la media aritmética, la moda y la mediana, que medida estadística seria la más
representativa de estos datos.
d) Calcular la desviación estándar y el coeficiente de variación. (Para datos agrupados
y no agrupados).
e) Encontrar el coeficiente de asimetría y kurtosis, interpretar los resultados.

2. Cantidad de miligramos de una sustancia contaminante encontrada en 60 muestras


recogidas de diferentes calles de la ciudad de Arequipa el 28 de marzo del 2007 a las
13:00 horas.

11,0 7,1 7,0 11,7 7,4 4,5 10,9 10,4 4,9 5,1 12,8 8,4 8,7 13,0 13,0
5,1 5,7 8,7 6,6 5,2 8,4 7,0 9,9 7,5 4,4 11,4 9,5 5,8 11,3 13,7
11,6 10,0 2,1 3,4 5,8 9,1 9,5 4,0 7,5 8,4 8,1 12,9 7,8 9,9 5,0
9,0 10,2 2,7 12,3 5,0 13,7 8,4 14,9 15,7 11,7 7,1 13,0 12,8 7,4 7,5
Se le pide:
a) Elaborar una tabla de distribución de frecuencias y sacar conclusiones.
b) Crear un histograma con su polígono de frecuencias.
c) Encontrar el diagrama de cajas y bigotes.
d) Hallar la media aritmética, la moda y la mediana. Interpretar los resultados.
e) Hallar Q1, D3, P90. Interpretar los resultados.
f) Hallar la desviación estándar, la varianza y el coeficiente de variación. Interpretar los
resultados.
g) Hallar el coeficiente de sesgo y curtosis. Interpretar los resultados.

3. En la siguiente tabla se presenta el número de veces que se colgó una máquina que
usa el sistema operativo Windows XP, durante un día de trabajo en la empresa
DITESSUR S.A. La frecuencia absoluta representa el número de máquinas.

Frecuencia Frec. Absoluta Frecuencia Frec. Relativa


Número de
Absoluta Acumulada Relativa Acumulada
veces
fi Fi hi Hi
3 3 0,05
4 6
5 19 0,17 0,32
6 15 0,57
7 14 48 0,8
8 55 0,12
9 5 0,08

Complete la tabla y responda las siguientes preguntas.

a) ¿Cuántas máquinas tienen más de 5 fallas?


b) ¿Qué porcentaje de las máquinas tiene menos de 6 fallas?
c) ¿Qué porcentaje de las máquinas tiene entre 5 y 7 fallas?
d) ¿Qué porcentaje de las máquinas tiene 3 o 9 fallas?

4. En un laboratorio de control de calidad de una empresa de hilandería, hubo una


explosión, y de los papeles quemados se pudo recuperar el siguiente fragmento de una
tabla de distribución de frecuencias.

Ing. Ferly Urday Luna


Intervalo hi Fi Hi
[20 - > 0,10
[ - > 0,25
[ - > 26
- > 0,90
[36 - >
Después de mucho revisar los únicos datos con los que se contaba, uno de los analistas
recordó que 8f4=5f3. Cree que podría ayudar a completar esta tabla de frecuencias, de
ser así, hallar el coeficiente de variación, los coeficientes de sesgo y curtosis, e
interprete los resultados. La tabla se refería al número de fardos rechazados clasificados
por su peso en Kg.

5. En una empresa de fabricación de ejes de motores, se desea saber si los operarios de


tornos realizan su trabajo según las normas indicadas, para ello se tomaron 8 muestras
de cada operario y se midió el diámetro exterior de los ejes.(Unidades en Cm)

Numero de eje
Operario 1 2 3 4 5 6 7 8
1 7.98 8.34 8.02 7.94 8.44 7.68 7.81 8.11
2 5.33 5.22 5.08 5.51 5.41 5.28 5.09 5.16
3 7.89 7.77 7.91 8.04 8.00 7.89 7.93 8.09
4 8.24 8.18 7.83 8.05 7.90 8.16 7.97 8.07
5 21.87 22.13 21.92 21.99 22.10 21.81 22.14 21.88
6 12.13 12.14 12.11 12.13 12.14 12.12 12.13 12.14

Con los datos obtenidos, ¿Cuál de los operarios es el que realiza su trabajo de manera
mas precisa?

6. En un artículo de una revista especializada se presentaron los datos de la viscosidad de


un proceso químico por lotes. Una muestra de estos datos se presenta a continuación

94.1 87.3 94.1 92.4 84.6 85.4


93.2 84.1 92.1 90.6 83.6 86.6
90.6 90.1 96.4 89.1 85.4 91.7
91.4 95.2 88.2 88.8 89.7 87.5
88.2 86.1 86.4 86.4 87.6 84.2
86.1 94.3 85.0 85.1 85.1 85.1
95.1 93.2 84.9 84.0 89.6 90.5
90.0 86.7 87.3 93.7 90.0 95.6
92.4 83.0 89.6 87.7 90.1 88.3
87.3 95.3 90.3 90.6 94.3 84.1
86.6 94.1 93.1 89.4 97.3 83.7
91.2 97.8 94.6 88.6 96.8 82.9
86.1 93.1 96.3 84.1 94.4 87.3
90.4 86.4 94.7 82.6 96.1 86.4
89.1 87.6 91.1 83.1 98.0 84.5

Se le pide:
a) Elaborar un diagrama de tallos y hojas.

Ing. Ferly Urday Luna


b) Elaborar una tabla de distribución de frecuencias y sacar conclusiones.
c) Crear un histograma con su polígono de frecuencias.
d) Hallar la media aritmética, la moda y la mediana. Interpretar los resultados.
e) Hallar Q1, D7, P80. Interpretar los resultados.
f) Hallar la desviación estándar, la varianza y el coeficiente de variación. Interpretar los
resultados.
g) Hallar el coeficiente de sesgo y curtosis. Interpretar los resultados.
h) Encontrar el diagrama de cajas y bigotes.

7. El tiempo hasta una falla en horas de un componente electrónico sometido a una


prueba de vida acelerada, se muestra a continuación. Para acelerar la prueba de falla,
las unidades se probaron a una temperatura elevada. Leer los datos hacia abajo y hacia
la derecha
109 174 158 211 164 179 137 175
192 147 203 186 072 246 193 163
231 197 170 190 169 188 140 237
179 085 217 168 185 208 164 175
228 124 255 151 182 167 209 169

Se le pide:
a) Elaborar una tabla de distribución de frecuencias y sacar conclusiones.
b) Crear un histograma con su polígono de frecuencias.
c) Hallar la media aritmética, la moda y la mediana. Interpretar los resultados.
d) Hallar Q1, D6, P95. Interpretar los resultados.
e) Hallar la desviación estándar, la varianza y el coeficiente de variación. Interpretar los
resultados.
f) Hallar el coeficiente de sesgo y curtosis. Interpretar los resultados.
g) Encontrar el diagrama de cajas y bigotes y sacar conclusiones.

EJERCICIOS
1. Una empresa embotelladora de yogurt comercializa botellas cuyo contenido es de 200
ml. Se ha tomado una muestra de 60 cajas, dando los siguientes resultados:

200 205 198 197 200 195


193 201 202 199 200 197
198 202 201 200 205 200
203 200 204 205 196 199
196 201 206 191 200 200
202 198 202 199 204 206
200 203 198 202 206 202
196 193 206 205 206 197
203 204 200 207 199 200
201 195 204 199 193 198

a) Elaborar una tabla de distribución de frecuencias y sacar conclusiones.


b) Crear un histograma con su polígono de frecuencias.
c) Hallar la media aritmética, la moda y la mediana. Interpretar los resultados.
(considere datos agrupados y no agrupados)

Ing. Ferly Urday Luna


d) Hallar Q1, D6, P95. Interpretar los resultados.
e) Hallar la desviación estándar, la varianza y el coeficiente de variación. Interpretar los
resultados. (considere datos agrupados y no agrupados)
f) Hallar el coeficiente de sesgo y curtosis. Interpretar los resultados.
g) Encontrar el diagrama de cajas y bigotes y sacar conclusiones.

2. Un empleado de una empresa acaba de recibir un embarque de 200 hojas de material


aislante de 1/8 de pulgada que se utilizarán en la fabricación de transformadores de
potencia. El espesor es la característica que más influye en la calidad del aislante y, por
consiguiente, en la del transformador. Las medidas realizadas se muestran en
milésimas de pulgadas (y redondeadas al milésimo más cercano).

Espesor Número de Hojas


118 2
119 8
120 5
121 9
122 8
123 23
124 27
125 51
126 14
127 23
128 14
129 10
130 5
131 1
!Especificación
de carácter no
válida

a. Prepare un diagrama que resuma los resultados de la inspección. Dibuje un polígono


de frecuencias que muestre la distribución del espesor para las 200 hojas.
b. ¿Qué características esenciales de este embarque puede usted determinar
inspeccionando el diagrama?
c. Determine la media aritmética.
d. Estime el espesor mediano.
e. ¿Qué indica la diferencia entre la media y la mediana acerca de la asimetría de la
distribución?
f. De las medidas anteriores ¿concluiría usted que el espesor promedio de este
embarque es menor o mayor que la especificación del fabricante de 1/8 de pulgada ó
125 milésimos?
g. Prepare las ojivas de las distribuciones acumuladas y determine las cuarteles. ¿Qué
interpretación tienen estos valores? ¿Qué porcentaje de hojas está por debajo de
128 milésimas?
h. Estime la desviación estándar.
i. Calcule un coeficiente de variación. ¿Cuál es la ventaja de esta medida de dispersión
relativa comparada con la medida correspondiente de dispersión absoluta?

3. Un fabricante de cosméticos adquirió una maquina para llenar las botellas de perfume
de 3 onzas. Para probar la precisión del volumen depositado en cada botella, hizo una
corrida de prueba con 18 recipientes. Los volúmenes resultantes (en onzas) de la
prueba fueron los siguientes:

3.02 2.89 2.92 2.84 2.90 2.97 2.95 2.94 2.93


3.01 2.97 2.95 2.90 2.94 2.96 2.99 2.97 2.99

Ing. Ferly Urday Luna


La compañía no suele recalibrar la maquina para este perfume si el volumen de llenado
de las 3 onzas difiere en 0.04 onzas o menos ¿Deberá recalibrarla?

 CUESTIONARIO
1. Describa detalladamente las formas en que se puede presentar la información
estadística si es que se ha sacado una muestra del llenado de 275 botellas de 375ml.
de Yogurt de la empresa GlorioS.A.
2. Explique todas las formas diferentes en que se pueden encontrar el número de clases
para la elaboración de una tabla de distribución de frecuencias. (Nota, revisar el
paquete Statgraphics para poder ampliar las respuestas)
3. ¿Qué es lo que miden las medidas de tendencia central?.
4. ¿Qué es lo que miden las medidas de tendencia posición?.
5. ¿Qué es lo que miden las medidas de tendencia dispersión?.
6. ¿Qué es la desviación estándar?

 REFEREN CI AS BIBLIOGRÁFICAS

1) Duncan, Acheson. 1989. Control de calidad y estadística industrial. Editorial Alfaomega.


pp 15 – 76.
2) Montgomery, D. 2005. Control Estadístico de la Calidad. Ed. LIMUSA WILEY. pp 39 – 50.
3) Córdova, M. 2003. Estadística Descriptiva e Inferencial. pp 1-81

DOCUMENTOS ADJUNTOS

Ing. Ferly Urday Luna

Potrebbero piacerti anche