Sei sulla pagina 1di 64

Capacidad de Procesos I

Estadstica Descriptiva

Objetivos de Aprendizaje
Analizar las principales tcnicas para realizar un anlisis descriptivo de un
conjunto de datos.
Interpretar correctamente un histograma y un diagrama de cajas.
Aplicar los conocimientos anteriores para realizar un estudio de capacidad de
un proceso.

Slide 2

Capacidad de Procesos
Las variables de salida de un proceso deben cumplir con ciertas metas y/o
especificaciones, a fin que sea posible considerar que el proceso funciona de
manera satisfactoria.
Una tarea primordial del Control de Calidad es conocer la habilidad o capacidad
de un proceso.

Capacidad de un Proceso
Consiste en conocer la amplitud de la variacin natural del proceso para una
caracterstica de calidad dada; esto permitir saber en qu medida tal
caracterstica de calidad es satisfactoria. (CUMPLE ESPECIFICACIONES)

Slide 3

Capacidad de Procesos
Para realizar un estudio de capacidad se deben tomar datos del proceso durante
un perodo considerable para que se refleje bien el desempeo del proceso.
En la medida en que el perodo de recoleccin de datos y los datos en s sean
ms amplios, mejor ser el conocimiento que tengamos del estado real del
proceso.

Estadsticos
Mediciones o clculos que se obtienen a partir de un conjunto de datos con el
objetivo de conocer sus caractersticas ms relevantes.

Slide 4

Qu es una Medida?
Es una evaluacin cuantificada de una caracterstica y/o nivel de desempeo
basado en datos.

Ejemplos:
Tiempo. (velocidad, edad)
Tamao (largo, altura, peso)
Valores monetarios (costos, ventas, ingresos, ganancias)
Conteo de caractersticas o atributos (tipos de cliente, gnero)
Conteo de defectos (nmero de errores, quejas)

Slide 5

Estadstica
Estadstica Descriptiva
Se encarga de la descripcin de los datos recopilados.
Se centra en tres aspectos:
Ubicacin (tendencia central)
Dispersin.
Forma.
Puede estudiar los datos de una poblacin o de una muestra.
Estadstica Inferencial
Se encarga de establecer conclusiones acerca de una poblacin basndose en la
estadstica descriptiva de una muestra.

Slide 6

Medidas Descriptivas
Medidas Descriptivas

Tendencia Central

Cuartiles

Variacin

Media aritmtica

Rango

Mediana

Rango Intercuartil

Moda

Varianza
Desviacin
Estndar

Slide 7

Forma
Sesgo

Por qu Medir?
Establecer el nivel actual de desempeo. (baseline).

Determinar prioridades para tomar acciones o no tomar acciones.

Comprender la magnitud de un problema.

Tener un mejor panorama de las causas potenciales de un problema y cambios en los procesos.

Para prevenir problemas y predecir el desempeo futuro.

Mantener las mejoras y establecer los lineamientos para mejoras futuras.

Slide 8

Mtodos de Medicin

Tendencia Central es la medida que describe


cmo todos los valores de los datos se agrupan en
torno a un valor central.

Variacin es la cantidad de disgregacin o


dispersin de los valores con respecto a un valor
central.

Forma es el patrn de distribucin de los valores


desde el menor hasta el mayor.

Slide 9

Es la propiedad de los datos


de agruparse alrededor de un
punto central.
Este centro puede ser el
promedio, el dato ms
frecuente o un dato
ubicado justo en el centro
del conjunto de datos.
Media, mediana y moda
son las medidas ms
comunes de tendencia
central.
Slide 10

Conte
o

Tendencia Central

Medida

Tendencia
Central

Media Muestral
Es el promedio aritmtico de un conjunto de datos.
Es una medida de tendencia central NO de variacin.
La media se requiere para calcular algunos estadstico de
variacin.
Media Muestral

i 1

Xi

Media Poblacional
N
X
i 1 i

x = Media
xi = Dato isimo.

n = tamao de muestra.

Slide 11

N = tamao de la poblacin.
= Media poblacional (mu)

Media
Afectada por valores extremos (outliers)
0 1 2 3 4 5 6 7 8 9 10

Media = 3

1 2 3 4 5 15

3
5
5

0 1 2 3 4 5 6 7 8 9 10

Media = 4

1 2 3 4 10 20

4
5
5

Mediana
Medida de tendencia central que es igual al valor que divide a la mitad
de los datos cuando son ordenados de menor a mayor.
La mediana es el valor que divide a todos los datos en dos partes
iguales.
El 50% de los datos se encuentra siempre a la izquierda de la mediana y
el otro 50% a su derecha.
Pasos
1. Se ordenan de menor a mayor
2. Se escoge el numero que esta a la mitad de los datos.
3. En caso de ser un par la mediana se calcula dividiendo entre dos la
suma de los nmeros que estn en el centro del ordenamiento.
Slide 13

Mediana
Ubicacin de la mediana:
n 1
Posicin
2
Si el nmero de datos es impar, la mediana es el valor central.
Si el nmero de datos es par, la mediana es el promedio
aritmtmtico de los dos valores centrales.

n 1
NO es el valor de la mediana, es la POSICIN de
2
la mediana en un arreglo ordenado de datos.

Mediana
En un arreglo ordenado, la mediana es el valor
medio. (50% ariba, 50% abajo)
0 1 2 3 4 5 6 7 8 9 10

Mediana = 3

0 1 2 3 4 5 6 7 8 9 10

Mediana = 3

No es afectada por valores extremos.

Moda
Es una medida de tendencia central que
corresponde al valor que se repite ms veces
en un conjunto de datos.
No es afectado por valores extremos.
Puede no haber moda.
Pueden haber varias modas.

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Moda = 9

0 1 2 3 4 5 6
No hay Moda

Cuartiles
Los cuartiles dividen a un conjunto de datos en cuatro partes
iguales: Q1 separa al 25% que abarca los valores ms
pequeos, del 75% restante que son los mayores.
El segundo cuartil Q2 es la mediana: 50% de sus valores
son menores que la mediana y 50% son mayores.
El tercer cuartil Q3 separa al 25% que abarca a los valores
ms grandes del 75% restante constituido por los que son
menores.

Slide 17

Cuartiles
Las ecuaciones que definen a Q1 y Q3 son:

Q1 n 1
4
3
(
n

1
)
Q3
4

Slide 18

Cuartiles
Para calcular los cuartiles se utilizan las siguientes reglas:
Regla 1 si el resultado es un nmero entero, entonces el
cuartil es igual al valor clasificado.
Regla 2 si el resultado es una fraccin de mitad, entonces el
cuartil es igual al promedio de los valores clasificados
correspondientes.
Regla 3 si el resultado no es un nmero entero ni una
fraccin de mitad, se redondea al entero ms cercano y se
selecciona ese valor clasificado.
Slide 19

Medidas de Tendencia Central


Las medidas de tendencia central no son suficientes como
criterio de calidad.
Por qu?

Medidas de Tendencia Central


Las medidas de tendencia central no son suficientes como
criterio de calidad.
Por qu?

Porque no toman en cuenta qu tan


dispersos estn los datos, un hecho vital
para la calidad.
Ejemplo Tabla 2.1 Pg. 18

La variabilidad reconoce
que
los
procecos
no
producen
resultados
idnticos siempre.
La variabilidad puede ser
causada por causas
identificables que actan
en el proceso o por
pequeas causas que
pertenecen al proceso en
s.
Rango,
desviacin
estndar y varianza son
las
ms
comunes
medidas de variacin.

Conteo

Variabilidad

Medida

Variabilidad
Slide 22

Medidas de Variabilidad
Adems de conocer la tendencia central de un conjunto de
datos es necesario saber qu tan diferentes son entre s, es
decir, es preciso determinar su variabilidad o dispersin.
Nos indican qu tan separados estn los datos unos de otros.
Variacin

Rango

Rango
Intercuartil

Varianza

Desviacin
Estndar

Coeficiente
de
Variacin

Medidas de Variabilidad

Las medidas de variacin brindan


informacin sobre la dispersin or
variabilidad de los valores de los
datos.

Misma
centralizacin,
diferente
variacin.

Rango
Es la ms simple medida de variacin.
Es la diferencia entre el valor mayor y el
valor menor de un conjunto de datos.
Rango = Xmayor Xmenor
Ejemplo:

0 1 2 3 4 5 6 7 8 9 10 11 12

13 14

Rango = 14 - 1 = 13
Se ve afectado por valores extremos.

Rango
El rango mide la distribucin total del conjunto de datos.
Aunque el rango es una medida simple de la variacin total de los
datos, no toma en cuenta cmo se distribuyen los datos entre los
valores menor y mayor.
En otras palabras el rango no indica si los valores estn distribuidos
de manera uniforme a lo largo del conjunto de datos, as no resulta
prudente utilizar el rango como medida de variacin cuando al menos
uno de los valores es extremo.
Slide 26

Desventajas del Rango


Ignora la forma en que estn distribuidos los datos.
7

10

11

12

Rango = 12 - 7 = 5

10

11

12

Rango = 12 - 7 = 5

Sensible a valores extremos


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

Rango = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120

Rango = 120 - 1 = 119


Slide 27

Rango Intercuartil
Es la diferencia entre el tercer y el primer cuartil de un conjunto de
datos, se le llama tambin dispersin media.
Q3 Q1 = Rango Intercuartil
Mide la dispersin en la mitad (parte central) de los datos, no se ve
influido por valores extremos. (Lo que permite la conveniencia de su
uso en ocasiones)

Slide 28

Rango Intercuartil
Ejemplo:
X

mnimo

Q1

25%

12

Mediana
(Q2)
25%

30

25%

45

Rango Intercuartil
= 57 30 = 27

Slide 29

Q3

mximo

25%

57

70

Varianza y Desviacin Estndar


La varianza y la desviacin estndar son dos
medidas de variacin muy utilizadas para tomar en
cuenta cmo se distribuyen los datos.
Miden las dispersin promedio alrededor de la
media, es decir qu tanto varan los valores ms
grandes que estn por encima de ella y cmo se
distribuyen los valores menores que estn por
debajo de ella.

Desviacin Estndar
Es la medida ms usual de variabilidad e indica qu tan esparcidos
estn los datos respecto a la media.
Desviacin estndar muestral: medida de variabilidad que indica
qu tan esparcidos estn los datos respecto a la media.
Desviacin estndar del proceso: refleja la variabilidad de un
proceso. Para su clculo se debe utilizar un nmero grande de datos
que hayan sido obtenidos en el transcurso de un lapso de tiempo
amplio.

Slide 31

Desviacin Estndar
Dicho de manera intuitiva: la desviacin estndar es la distancia
promedio de cada dato con respecto a la media.

Desviacin estndar
poblacional

Desviacin estndar
de la muestra.

( X i )

N
i 1
n

(x i x )
s
i 1 n 1

Tiene las mismas unidades que los datos originales.


Se utilizan todos los datos.
Slide 32

Desviacin Estndar
Desviacin estndar pequea

Desviacin estndar grande

Desviacin Estndar
Data A
Media = 15.5
11

12

13

14

15

16

17

18

19

20 21

S = 3.338

Data B
Media = 15.5
11

12

13

14

15

16

17

18

19

20 21

S = 0.926

Data C
Media = 15.5
11

12

13

14

15

16

17

18

19

20 21

S = 4.567

Varianza
Es otra medida de variabilidad.
(X i )

N
i 1

Varianza
Poblacional

Varianza
Muestral

(x i x )

i 1 n 1

Note que la varianza es el cuadrado de la desviacin


estndar.
Su desventaja es que sus unidades al cuadrado en
ocasiones no tienen interpretacin lgica.
Slide 35

Caractersticas de las Medidas de Variacin


1.

Cuanto ms esparcidos o dispersos estn los datos,


mayor es el rango, rango intercuartil, varianza y
desviacin estndar.

2.

Cunto ms concentrados u homogneos estn los


datos, menor es el rango, rango intercuartil, varianza y
desviacin estndar.

3.

Si todos los valores son los mismos, el rango, el rango


intercuartil, la varianza y la desviacin estndar son
iguales a cero.

4.

Ninguna de las medidas de variacin puede ser


negativa.

Coeficiente de Variacin
Es una medida relativa de la variacin que siempre se
expresa como porcentaje, ms que en trminos de las
unidades de los datos en particular, mide la dispersin de los
datos con respecto a la media.
El coeficiente de variacin (CV) es igual a la desviacin
estndar dividida entre la media.

S
CV
100%
X

Coeficiente de Variacin
Es til para comparar la variacin de dos o ms variables
que estn medidas en diferentes escalas o unidades de
medicin. Por ejemplo: metro frente a centmetro o metro
frente a kilogramo.

Coeficiente de Variacin
Stock A:
Precio promedio ao anterior = $50
Desviacin estndar = $5

S
$5
100%
CVA
100% 10%

$50
X

Stock B:
Precio promedio ao anterior = $100
Desviacin estndar = $5

S
$5
100%
CVB
100% 5%

$100
X

Ambos stocks
tienen la misma
desviacin,
pero el stock B
es menos
variable
respecto a su
precio.

Relacin entre X y S
Un forma de apreciar claramente el significado de la
desviacin estndar como medida de dispersin en torno a la
media, es a travs de la relacin entre la media y la
desviacin estndar, la cual est dada por la regla de
Chebyshev y la regla emprica.

Relacin entre X y S

Misma media, diferente desviacin.

Misma desviacin, diferente media.

La Regla Emprica
En la mayora de los conjuntos de datos, una gran parte de los valores
tienden a agruparse en algn valor cercano a la mediana.
En los conjuntos de datos asimtricos a la derecha, el agrupamiento se
presenta a la izquierda de la media, es decir en un valor menor que la
media.
En los conjuntos de datos asimtricos a la izquierda, el agrupamiento
se presenta a la derecha de la media, es decir en un valor mayor que
la media.
En los datos simtricos, los valores tienden a agruparse alrededor de
la
media y la mediana, generalmente una distribucin en forma de
campana, en estas distribuciones, la regla emprica permite examinar
la variabilidad de la siguiente manera:

La Regla Emprica
99.73%
95.46%
68.26%

(x)

1 2 3

La Regla Emprica
La regla emprica ayuda a medir cmo se distribuyen los
valores por encima y debajo de la media.
En los datos con mucha asimetra o en los que por alguna
razn no tienen forma de campana, se debe utilizar la
regla de Chebyshev.

Regla de Chebyshev
Esta regla establece que para todo conjunto de datos, independientemente
de su forma, el porcentaje de valores que se encuentran a una distancia de
k, desviaciones estndar o menos de la media, debe ser igual a:

(1 1 / k ) x100%
2

Puede usar esta regla para todo valor de k mayor que 1.


Al menos

(1 - 1/12) x 100% = 0%

dentro

k=1 ( 1)

(1 - 1/22) x 100% = 75% . k=2 ( 2)


(1 - 1/32) x 100% = 89% k=3 ( 3)

Regla de Chebyshev
Si el conjunto de datos tiene una forma que se aproxima a
la de una campana, la regla emprica reflejar con mayor
precisin la mayor concentracin de datos cerca de la
media.
Porcentaje de valores encontrados en
intervalos alrededor de la media
Intervalo

Chebyshev

Regla Emprica

( - , + )

Al menos 0%

Aproximadamente 68%

( - 2, + 2)

Al menos 75%

Aproximadamente 95%

( - 3, + 3)

Al menos 88.89%

Aproximadamente 99.7%

Lmites Reales o Naturales


Indican los puntos entre los cuales vara la salida de un
proceso y, por lo general se obtienen de la siguiente manera:
Lmite real inferior (LRI) = - 3
Lmite real superior (LRS) = + 3
El clculo de estos lmites est basado en la regla emprica,
los datos deben pertenecer a una distribucin normal.
En un estudio de capacidad, estos lmites reales se comparan
con las especificaciones para la caracterstica de calidad.

Forma
Una tercera propiedad que describe a un conjunto de datos
numricos es la forma.
Forma se refiere al patrn de distribucin de los valores de
los datos a travs del rango de todos los valores. La
distribucin puede ser simtrica cuando los valores
pequeos y grandes se equilibran entre s o asimtrica
cuando muestra desequilibrio de los valores pequeos o
grandes.

Forma
La forma influye en la relacin de la media con la mediana de
la siguiente manera:

Media < Mediana; asimtrica negativa o sesgo izquierdo.

Media = Mediana; simtrica o asimetra cero.

Media > Mediana; asimtrica positiva o sesgo derecho.

Forma

Histograma
Es la representacin grfica de la distribucin de un conjunto
de datos o de una variable, donde los datos se clasifican por
su magnitud en un cierto nmero de clases. Permite
visualizar:
Tendencia Central.
Dispersin.
Forma de la distribucin.

Histograma

Unimodal un proceso

Bimodal dos procesos

Inclinacin Positiva

Inclinacin Negativa

Histograma

Histograma

Interpretacin del Histograma


Se recomienda considerar los siguientes puntos en la
interpretacin del histograma:
1.

Estudiar el centrado del proceso.

2.

Examinar la variabilidad del proceso.

3.

Analizar la forma del histograma:


Sesgada: forma asimtrica de la distribucin. Un sesgo refleja el
desplazamiento paulatino de un proceso debido a desgastes o
desajustes; puede indicar tambin procedimientos viciados en la
forma de obtener mediciones o un desempeo especial del
proceso.
Multimodal: se aprecian claramente dos o ms modas (picos).
Algunas situaciones que originan esto son:

Interpretacin del Histograma


Multimodal: se aprecian claramente dos o ms modas (picos).
Algunas situaciones que originan esto son:

Diferencias importantes de lote a lote en materia prima debido a diferentes


causas: distintos proveedores por ejemplo.
Varios operadores o mtodos de trabajo diferentes.
Medicin realizada con instrumentos diferentes.
Condiciones diferentes del proceso.
Fuentes de variacin bien definidas (pueden ser identificadas y corregidas)

Distribucin muy plana: las causas de esto son similares a las


anteriores pero menos fuertes.
Distribucin con acantilados: suspensin o corte brusco en la cada
de la distribucin. Esto se puede deber a: exclusin de lotes,
problemas de medicin (equipo o mtodo).

Interpretacin del Histograma


5. Datos raros o atpicos: aparecen barras pequeas separadas o
aisladas del resto. Las causas pueden ser: dato incorrecto, eventos raros
o especiales.
6. Estratificar.
Limitaciones del Histograma
1. No considera el tiempo en que se obtuvieron los datos por lo que es
complicado detectar tendencias o estabilidad.
2. No es apropiado para comparar varios procesos, para esto es mejor
el diagrama de cajas.
3. La cantidad de clases influye en la forma del histograma, por lo que se
sugiere analizar los datos utilizando diferentes nmeros de clases.

Medidas de Forma
1. Sesgo es una medida numrica de la asimetra en la
distribucin de un conjunto de datos. Si es positivo, la
distribucin est cargada hacia la derecha.
2. Curtosis estadstico que mide que tan elevada o plana
es la curva de distribucin de unos datos respecto a la
distribucin normal.
Si la Curtosis es mayor que cero casi no hay datos en los extremos.
La Curtosis es cero para la Distribucin Normal, que es la
referencia.
Si la Curtosis es menor que cero hay una cantidad mayor de datos
en los extremos.

Diagrama de Caja

Qu son?
Los diagramas de caja son una representacin grfica de las diferentes
caractersticas del conjunto de datos.
Centro
Dispersin
Grado de simetra
Mximo
Identificacin de datos raros

Mnimo

3er cuartil
1er cuartil

2do cuartil

Resumen de Cinco Nmeros


Un resumen de cinco nmeros compuesto por:
Xmenor

Q1

Mediana

Q3

Xmayor

Permite determinar la forma de la distribucin.


Tipo de Distribucin
Comparacin

Asimtrico a la
Izquierda

Simtrico

Asimtrico a la
Derecha

La distancia de Xmenor
a la mediana contra la
distancia de la mediana
a Xmayor.

La distancia de Xmenor
a la mediana es mayor
que la distancia de la
mediana a Xmayor.

Ambas distancias son


iguales.

La distancia de Xmenor
a la mediana es menor
que la distancia de la
mediana a Xmayor.

La distancia de Xmenor
a Q1 contra la distancia
de Q3 a Xmayor.

La distancia de Xmenor
a Q1 es mayor que la
distancia de Q3 a
Xmayor.

Ambas distancias son


iguales.

La distancia de Xmenor
a Q1 es menor que la
distancia de Q3 a
Xmayor.

La distancia de Q1 a la
mediana
contra
la
distancia de la mediana
a Q3.

La distancia de Q1 a la
mediana es mayor que
la distancia de la
mediana a Q3.

Ambas distancias son


iguales.

La distancia de Q1 a la
mediana es menor que
la distancia de la
mediana a Q3.

Grfico de Caja y Bigotes

Grfico de Caja y Bigotes

Ejemplo Estudio Integral de


Capacidad

Fin de Presentacin