Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadstica Descriptiva
Objetivos de Aprendizaje
Analizar las principales tcnicas para realizar un anlisis descriptivo de un
conjunto de datos.
Interpretar correctamente un histograma y un diagrama de cajas.
Aplicar los conocimientos anteriores para realizar un estudio de capacidad de
un proceso.
Slide 2
Capacidad de Procesos
Las variables de salida de un proceso deben cumplir con ciertas metas y/o
especificaciones, a fin que sea posible considerar que el proceso funciona de
manera satisfactoria.
Una tarea primordial del Control de Calidad es conocer la habilidad o capacidad
de un proceso.
Capacidad de un Proceso
Consiste en conocer la amplitud de la variacin natural del proceso para una
caracterstica de calidad dada; esto permitir saber en qu medida tal
caracterstica de calidad es satisfactoria. (CUMPLE ESPECIFICACIONES)
Slide 3
Capacidad de Procesos
Para realizar un estudio de capacidad se deben tomar datos del proceso durante
un perodo considerable para que se refleje bien el desempeo del proceso.
En la medida en que el perodo de recoleccin de datos y los datos en s sean
ms amplios, mejor ser el conocimiento que tengamos del estado real del
proceso.
Estadsticos
Mediciones o clculos que se obtienen a partir de un conjunto de datos con el
objetivo de conocer sus caractersticas ms relevantes.
Slide 4
Qu es una Medida?
Es una evaluacin cuantificada de una caracterstica y/o nivel de desempeo
basado en datos.
Ejemplos:
Tiempo. (velocidad, edad)
Tamao (largo, altura, peso)
Valores monetarios (costos, ventas, ingresos, ganancias)
Conteo de caractersticas o atributos (tipos de cliente, gnero)
Conteo de defectos (nmero de errores, quejas)
Slide 5
Estadstica
Estadstica Descriptiva
Se encarga de la descripcin de los datos recopilados.
Se centra en tres aspectos:
Ubicacin (tendencia central)
Dispersin.
Forma.
Puede estudiar los datos de una poblacin o de una muestra.
Estadstica Inferencial
Se encarga de establecer conclusiones acerca de una poblacin basndose en la
estadstica descriptiva de una muestra.
Slide 6
Medidas Descriptivas
Medidas Descriptivas
Tendencia Central
Cuartiles
Variacin
Media aritmtica
Rango
Mediana
Rango Intercuartil
Moda
Varianza
Desviacin
Estndar
Slide 7
Forma
Sesgo
Por qu Medir?
Establecer el nivel actual de desempeo. (baseline).
Tener un mejor panorama de las causas potenciales de un problema y cambios en los procesos.
Slide 8
Mtodos de Medicin
Slide 9
Conte
o
Tendencia Central
Medida
Tendencia
Central
Media Muestral
Es el promedio aritmtico de un conjunto de datos.
Es una medida de tendencia central NO de variacin.
La media se requiere para calcular algunos estadstico de
variacin.
Media Muestral
i 1
Xi
Media Poblacional
N
X
i 1 i
x = Media
xi = Dato isimo.
n = tamao de muestra.
Slide 11
N = tamao de la poblacin.
= Media poblacional (mu)
Media
Afectada por valores extremos (outliers)
0 1 2 3 4 5 6 7 8 9 10
Media = 3
1 2 3 4 5 15
3
5
5
0 1 2 3 4 5 6 7 8 9 10
Media = 4
1 2 3 4 10 20
4
5
5
Mediana
Medida de tendencia central que es igual al valor que divide a la mitad
de los datos cuando son ordenados de menor a mayor.
La mediana es el valor que divide a todos los datos en dos partes
iguales.
El 50% de los datos se encuentra siempre a la izquierda de la mediana y
el otro 50% a su derecha.
Pasos
1. Se ordenan de menor a mayor
2. Se escoge el numero que esta a la mitad de los datos.
3. En caso de ser un par la mediana se calcula dividiendo entre dos la
suma de los nmeros que estn en el centro del ordenamiento.
Slide 13
Mediana
Ubicacin de la mediana:
n 1
Posicin
2
Si el nmero de datos es impar, la mediana es el valor central.
Si el nmero de datos es par, la mediana es el promedio
aritmtmtico de los dos valores centrales.
n 1
NO es el valor de la mediana, es la POSICIN de
2
la mediana en un arreglo ordenado de datos.
Mediana
En un arreglo ordenado, la mediana es el valor
medio. (50% ariba, 50% abajo)
0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
0 1 2 3 4 5 6 7 8 9 10
Mediana = 3
Moda
Es una medida de tendencia central que
corresponde al valor que se repite ms veces
en un conjunto de datos.
No es afectado por valores extremos.
Puede no haber moda.
Pueden haber varias modas.
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Moda = 9
0 1 2 3 4 5 6
No hay Moda
Cuartiles
Los cuartiles dividen a un conjunto de datos en cuatro partes
iguales: Q1 separa al 25% que abarca los valores ms
pequeos, del 75% restante que son los mayores.
El segundo cuartil Q2 es la mediana: 50% de sus valores
son menores que la mediana y 50% son mayores.
El tercer cuartil Q3 separa al 25% que abarca a los valores
ms grandes del 75% restante constituido por los que son
menores.
Slide 17
Cuartiles
Las ecuaciones que definen a Q1 y Q3 son:
Q1 n 1
4
3
(
n
1
)
Q3
4
Slide 18
Cuartiles
Para calcular los cuartiles se utilizan las siguientes reglas:
Regla 1 si el resultado es un nmero entero, entonces el
cuartil es igual al valor clasificado.
Regla 2 si el resultado es una fraccin de mitad, entonces el
cuartil es igual al promedio de los valores clasificados
correspondientes.
Regla 3 si el resultado no es un nmero entero ni una
fraccin de mitad, se redondea al entero ms cercano y se
selecciona ese valor clasificado.
Slide 19
La variabilidad reconoce
que
los
procecos
no
producen
resultados
idnticos siempre.
La variabilidad puede ser
causada por causas
identificables que actan
en el proceso o por
pequeas causas que
pertenecen al proceso en
s.
Rango,
desviacin
estndar y varianza son
las
ms
comunes
medidas de variacin.
Conteo
Variabilidad
Medida
Variabilidad
Slide 22
Medidas de Variabilidad
Adems de conocer la tendencia central de un conjunto de
datos es necesario saber qu tan diferentes son entre s, es
decir, es preciso determinar su variabilidad o dispersin.
Nos indican qu tan separados estn los datos unos de otros.
Variacin
Rango
Rango
Intercuartil
Varianza
Desviacin
Estndar
Coeficiente
de
Variacin
Medidas de Variabilidad
Misma
centralizacin,
diferente
variacin.
Rango
Es la ms simple medida de variacin.
Es la diferencia entre el valor mayor y el
valor menor de un conjunto de datos.
Rango = Xmayor Xmenor
Ejemplo:
0 1 2 3 4 5 6 7 8 9 10 11 12
13 14
Rango = 14 - 1 = 13
Se ve afectado por valores extremos.
Rango
El rango mide la distribucin total del conjunto de datos.
Aunque el rango es una medida simple de la variacin total de los
datos, no toma en cuenta cmo se distribuyen los datos entre los
valores menor y mayor.
En otras palabras el rango no indica si los valores estn distribuidos
de manera uniforme a lo largo del conjunto de datos, as no resulta
prudente utilizar el rango como medida de variacin cuando al menos
uno de los valores es extremo.
Slide 26
10
11
12
Rango = 12 - 7 = 5
10
11
12
Rango = 12 - 7 = 5
Rango = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango Intercuartil
Es la diferencia entre el tercer y el primer cuartil de un conjunto de
datos, se le llama tambin dispersin media.
Q3 Q1 = Rango Intercuartil
Mide la dispersin en la mitad (parte central) de los datos, no se ve
influido por valores extremos. (Lo que permite la conveniencia de su
uso en ocasiones)
Slide 28
Rango Intercuartil
Ejemplo:
X
mnimo
Q1
25%
12
Mediana
(Q2)
25%
30
25%
45
Rango Intercuartil
= 57 30 = 27
Slide 29
Q3
mximo
25%
57
70
Desviacin Estndar
Es la medida ms usual de variabilidad e indica qu tan esparcidos
estn los datos respecto a la media.
Desviacin estndar muestral: medida de variabilidad que indica
qu tan esparcidos estn los datos respecto a la media.
Desviacin estndar del proceso: refleja la variabilidad de un
proceso. Para su clculo se debe utilizar un nmero grande de datos
que hayan sido obtenidos en el transcurso de un lapso de tiempo
amplio.
Slide 31
Desviacin Estndar
Dicho de manera intuitiva: la desviacin estndar es la distancia
promedio de cada dato con respecto a la media.
Desviacin estndar
poblacional
Desviacin estndar
de la muestra.
( X i )
N
i 1
n
(x i x )
s
i 1 n 1
Desviacin Estndar
Desviacin estndar pequea
Desviacin Estndar
Data A
Media = 15.5
11
12
13
14
15
16
17
18
19
20 21
S = 3.338
Data B
Media = 15.5
11
12
13
14
15
16
17
18
19
20 21
S = 0.926
Data C
Media = 15.5
11
12
13
14
15
16
17
18
19
20 21
S = 4.567
Varianza
Es otra medida de variabilidad.
(X i )
N
i 1
Varianza
Poblacional
Varianza
Muestral
(x i x )
i 1 n 1
2.
3.
4.
Coeficiente de Variacin
Es una medida relativa de la variacin que siempre se
expresa como porcentaje, ms que en trminos de las
unidades de los datos en particular, mide la dispersin de los
datos con respecto a la media.
El coeficiente de variacin (CV) es igual a la desviacin
estndar dividida entre la media.
S
CV
100%
X
Coeficiente de Variacin
Es til para comparar la variacin de dos o ms variables
que estn medidas en diferentes escalas o unidades de
medicin. Por ejemplo: metro frente a centmetro o metro
frente a kilogramo.
Coeficiente de Variacin
Stock A:
Precio promedio ao anterior = $50
Desviacin estndar = $5
S
$5
100%
CVA
100% 10%
$50
X
Stock B:
Precio promedio ao anterior = $100
Desviacin estndar = $5
S
$5
100%
CVB
100% 5%
$100
X
Ambos stocks
tienen la misma
desviacin,
pero el stock B
es menos
variable
respecto a su
precio.
Relacin entre X y S
Un forma de apreciar claramente el significado de la
desviacin estndar como medida de dispersin en torno a la
media, es a travs de la relacin entre la media y la
desviacin estndar, la cual est dada por la regla de
Chebyshev y la regla emprica.
Relacin entre X y S
La Regla Emprica
En la mayora de los conjuntos de datos, una gran parte de los valores
tienden a agruparse en algn valor cercano a la mediana.
En los conjuntos de datos asimtricos a la derecha, el agrupamiento se
presenta a la izquierda de la media, es decir en un valor menor que la
media.
En los conjuntos de datos asimtricos a la izquierda, el agrupamiento
se presenta a la derecha de la media, es decir en un valor mayor que
la media.
En los datos simtricos, los valores tienden a agruparse alrededor de
la
media y la mediana, generalmente una distribucin en forma de
campana, en estas distribuciones, la regla emprica permite examinar
la variabilidad de la siguiente manera:
La Regla Emprica
99.73%
95.46%
68.26%
(x)
1 2 3
La Regla Emprica
La regla emprica ayuda a medir cmo se distribuyen los
valores por encima y debajo de la media.
En los datos con mucha asimetra o en los que por alguna
razn no tienen forma de campana, se debe utilizar la
regla de Chebyshev.
Regla de Chebyshev
Esta regla establece que para todo conjunto de datos, independientemente
de su forma, el porcentaje de valores que se encuentran a una distancia de
k, desviaciones estndar o menos de la media, debe ser igual a:
(1 1 / k ) x100%
2
(1 - 1/12) x 100% = 0%
dentro
k=1 ( 1)
Regla de Chebyshev
Si el conjunto de datos tiene una forma que se aproxima a
la de una campana, la regla emprica reflejar con mayor
precisin la mayor concentracin de datos cerca de la
media.
Porcentaje de valores encontrados en
intervalos alrededor de la media
Intervalo
Chebyshev
Regla Emprica
( - , + )
Al menos 0%
Aproximadamente 68%
( - 2, + 2)
Al menos 75%
Aproximadamente 95%
( - 3, + 3)
Al menos 88.89%
Aproximadamente 99.7%
Forma
Una tercera propiedad que describe a un conjunto de datos
numricos es la forma.
Forma se refiere al patrn de distribucin de los valores de
los datos a travs del rango de todos los valores. La
distribucin puede ser simtrica cuando los valores
pequeos y grandes se equilibran entre s o asimtrica
cuando muestra desequilibrio de los valores pequeos o
grandes.
Forma
La forma influye en la relacin de la media con la mediana de
la siguiente manera:
Forma
Histograma
Es la representacin grfica de la distribucin de un conjunto
de datos o de una variable, donde los datos se clasifican por
su magnitud en un cierto nmero de clases. Permite
visualizar:
Tendencia Central.
Dispersin.
Forma de la distribucin.
Histograma
Unimodal un proceso
Inclinacin Positiva
Inclinacin Negativa
Histograma
Histograma
2.
3.
Medidas de Forma
1. Sesgo es una medida numrica de la asimetra en la
distribucin de un conjunto de datos. Si es positivo, la
distribucin est cargada hacia la derecha.
2. Curtosis estadstico que mide que tan elevada o plana
es la curva de distribucin de unos datos respecto a la
distribucin normal.
Si la Curtosis es mayor que cero casi no hay datos en los extremos.
La Curtosis es cero para la Distribucin Normal, que es la
referencia.
Si la Curtosis es menor que cero hay una cantidad mayor de datos
en los extremos.
Diagrama de Caja
Qu son?
Los diagramas de caja son una representacin grfica de las diferentes
caractersticas del conjunto de datos.
Centro
Dispersin
Grado de simetra
Mximo
Identificacin de datos raros
Mnimo
3er cuartil
1er cuartil
2do cuartil
Q1
Mediana
Q3
Xmayor
Asimtrico a la
Izquierda
Simtrico
Asimtrico a la
Derecha
La distancia de Xmenor
a la mediana contra la
distancia de la mediana
a Xmayor.
La distancia de Xmenor
a la mediana es mayor
que la distancia de la
mediana a Xmayor.
La distancia de Xmenor
a la mediana es menor
que la distancia de la
mediana a Xmayor.
La distancia de Xmenor
a Q1 contra la distancia
de Q3 a Xmayor.
La distancia de Xmenor
a Q1 es mayor que la
distancia de Q3 a
Xmayor.
La distancia de Xmenor
a Q1 es menor que la
distancia de Q3 a
Xmayor.
La distancia de Q1 a la
mediana
contra
la
distancia de la mediana
a Q3.
La distancia de Q1 a la
mediana es mayor que
la distancia de la
mediana a Q3.
La distancia de Q1 a la
mediana es menor que
la distancia de la
mediana a Q3.
Fin de Presentacin