Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
0:
1. INTRODUCCIÓN
Introducción1
▪ En el momento de caracterizar una variable, de segmentar o
de realizar una primera prospecciónpara analizar las
variables, una serie de técnicas gráficas simples pueden
ayudar.
1363
Técnicas Estadísticas Gráficas Básicas
2. DIAGRAMAS DE TIEMPO
1364
Diagrama de tiempo1
▪ Un diagrama de tiempo es un gráfico de datos en
orden cronológico.
1 4
° °
5
°
Vamos a poner
las fechas en el
eje x
Diagrama de tiempo4
6°
7°
9 Time Series Plot of Promedio de tiempos
8 °
400
Columna
° Promedio de tiempos 300
fechas
100
0
17-01 31-01 15-02 02-03 17-03 01-04 16-04 01-05 16-05 31-05 15-06
Fecha_1
Diagrama de tiempo5
Permite
editar y
definir las
posiciones
del eje x.
11 12°
Haciendo
°
doble click
sobre el eje 10
x, despliega
un diálogo
°
13
°
Diagrama de tiempo6
15
°
Cambia el cursor
a un índice de la
mano. Permite
identificar,
Con click derecho dragueando,
en algún lugar del 14
datos
gráfico, despliega ° particulares del
una menú gráfico
Diagrama de tiempo7
Dragueando alrededor de un punto,
muestra la fila correspondiente.
En la fila de la planilla de datos
17 coloca un punto.
°
16
°
Diagrama de tiempo8
19
°
Seleccionamos
la fecha y día de
la semana
20°
21°
1° Lunes
M artes
M iércoles
Promedio de tiempos
300
Viernes
200
Diagrama con
subgrupos 100
2° 1 15 30 45 60 75
Index
90 105
Gráfico de
3 líneas para
Columna con
° cada grupo
los datos
4 (en este
Columna con ° caso para
las cada uno de
agrupaciones los días de
5 la semana)
°
Diagrama de tiempo agrupados2
Time Series Plot of Promedio de tiempos
Día dela
400 semana
Jueves
Lunes
M artes
M iércoles
Pedimos que
Promedio de tiempos
300
Viernes
use la variable
200
para agrupar
100
los datos
7
Hacemos
0 °
click 15 30 45 60 75
Index
90 105 120 135 150
derecho 8
sobre el °
gráfico Indicamos la columna con 9
la variable (en este °
caso los días)
10
°
Diagrama de tiempo agrupados3
11
°
Pone cada
grupo en
diferente
panel
Diagrama de tiempo segmentado
Vamos a
generar
gráficos
1 superpu
° est os
4
para
°
cada
segment
o
Ambas colas en
el mismo gráfico
2
°
3. HISTOGRAMA
Histogramas1
▪ El Histograma permite representar datos,
Continuos o Discretos, para evaluar la tendencia
central, la dispersión e identificar la forma de la
distribución o patrones.
14
12
10
Frequency
0
12 16 20 24 28 32 36
Torque
5
°
8
°
Indicamos en
6
gráficos separados
°
7°
Con la misma Y
para poder
comparar
Histogramas por grupos2
Indicamos la columna en
la cual están las variables
9 para segmentar
°
10 11
° °
Histogramas para
cada máquina
con la misma
escala de Y
Técnicas Estadísticas Gráficas Básicas
4. DIAGRAMA DE PUNTOS
Diagrama de Puntos
1
°
5
°
Con
grupos
2 Columna con
° los datos
Columna con
3 los grupos Gráfico de puntos
° superpuesto para
4 cada grupo
°
Técnicas Estadísticas Gráficas Básicas
5. PARETO
Diagrama de Pareto1
▪ Un diagrama de Pareto es un gráfico de barras
ordenadas de mayor a menor, donde cada barra
refleja la importancia o peso de cada uno de los
factores quese analizan.
2 3
°
Columna en °
la cual
tenemos la
frecuencia
Ejercicios Medir.mtw para cada
Columna 57 grupo o 5
“Cantidad” factor. °
Diagrama de Pareto4
Porcentajes
Pareto Chart of Defectos acumulados
Cantidad que 100
le 400
corresponde
al 1er Factor 80
o grupo 300
Percent
60
Count
200
40
100
20
0 0grupo
Defectos Rayado Cortadura Doblado Other Factores
sordenad y
Factores
4
os
Frecuencia
Count 351 49 19 según su
Percent 83,0 11,6 4,5 0,9
Cum % 83,0 94,6 99,1 100,0 cantidad
o
Nos dice que, inicialmente, debemos
poner foco en los rayones.
Error usual al aplicar Pareto
▪ Esun error asumir que un diagrama de barras ordenado
de mayor a menor es un Diagrama de Pareto.
Clave:
6. BOX PLOTS
Box-Plots1
▪ Los diagramas Box Plots permiten graficar
los estadísticos esenciales de una serie
de datos para evaluar y comparar
distribuciones.
1
°
3
°
4
Columna con
°
los datos
Como con los
Histogramas, permite
graficar en diferentes
gráficos o paneles
5
°
Box-Plots3
Valor máximo de la serie de
datos. Si hubiera un valor
superior al Boxplot of Promedio
Q3 + 1.5 RI = Q3 + 1.5(Q3 - Q1),
Entonces aparecería como *
3° cuartil (75%
41 de los datos)
El 50% de los datos
Promedio
2° cuartil (25% de
los datos acum)
La posición de la
Mediana y la
longitud de los
bigotes dan una Valor mínimo de la serie de
idea de la forma de datos. Si hubiera un valor
la distribución inferior al
Q1 - 1.5 RI = Q1 - 1.5(Q3 - Q1),
Entonces aparecería como *
Box-Plots agrupados1
Para graficar
2 diferentes
° subgrupos.
1
° 3
Columna en
°
la cual están
los datos.
4
°
5
°
Columna en la
cual están los
factores o
grupos. 6
°
Box-Plots agrupados2
Distribución de
los datos para
Distribución de
Distribución de Julieta
los datos para
los datos para
María
Franco
41
Promedio
40
39
38
7. DIAGRAMA DE DISPERSIÓN
Diagrama de Dispersión1
▪ Los gráficos o Diagramas de Dispersión
muestran cómo los pares de valores de una
variable independiente (xs) y la respuesta (Ys)
varían a medida que aquella cambia.
3
°
Columna en la cual 4°
está la variable 5
dependiente (Y)
°
6
°
Diagrama de Dispersión3
Los puntos se Scatterplot of Dureza vs Tiempo
7
encuentran muy °
dispersos, Pares de puntos x-Y
indicando bajo graficados
grado de
correlación
180
170
160
150
14,5 15,0 15,5 16,0 16,5 17,0 17,5 18,0 18,5
Variable ¿Cómo se mostrarían
Tiempo
dependient los puntos en
e (Y) variables con alto
Variable independiente (x) grado de asociación?
Diagrama de Dispersión4
Strong PositiveCorrelation Strong Negative Correlation
Fuerte 110
100
110
100
Fuerte
asociación asociación
90 90
80 80
Output
Output
70 70
50 50
variable variable
40 40
30 30
100 100
90 90
80 80
Output
Output
70 Y = 25.7595 + 0.645418X 70 Y = 90.3013 - 0.645418X
50 50
40 40
50 60 70 80 90 100 0 10 20 30 40 50
Input Input
85 85
75 75
Output
Output
55 55
40 50 60 70 80 90 10 20 30 40 50 60
Input Input
Diagrama de Dispersión agrupado1
1 2 Para crear un gráfico por
grupos
° °
Columna con el Columna con
resultado (Y) la variable (X)
3
°
4°
5
°
Columna
con los
grupos 6°
7
°
Diagrama de Dispersión agrupado1
8
°
Grupo 1
Grupo 2
Técnicas Estadísticas Gráficas Básicas
8. MATRIZ DE DISPERSIÓN
Matriz de Dispersión1
1
°
Columnas con
las variables a
2 relacionar
°
3 4
° °
5
°
Matriz de Dispersión2
Cada unidad
Dispersión del gráfico
entre Presión muestra el
y Tiempo_1 Diagrama de
Dispersiones
entre un par
de variables
Dispersión
entre Dureza
y Tiempo_1
Técnicas Estadísticas Gráficas Básicas
9. ESTRATIFICACIÓN
Estratificación
▪ Estratificación es una técnica usada en combinación con
otras para analizar los datos de una variable y, Y, x o X.
EjerciciosAnalizar.mtw
Columnas 181 “Reactor” a 183 “Temperatura del
agua de salida”.
Ejemplo 1
2
En este ejemplo se usa
un Diagrama de °
Dispersión
Ejemplo 1
3
°
Se pide un solo
gráfico
4°
5 6
El resultado es un diagrama
de Dispersión en el cual ° °
todos los puntos tienen igual
identficación
Con click en el botón derecho,
podemos editar los símbolos
de identificación de los
puntos.
Ejemplo 1 Se indica la columna en la cual están
los equipos a los cuales corresponde
cada par de valores.
7
°
8
9
°
°
▪ Gráficos de Individuales.
▪ Introducción.
▪ Métodos de Suavización.
▪ Ejercicios.
1431
Introducción a la serie de tiempos1
▪ Hemos visto a los gráficos de Control para analizarla
evolución de una característica a lo largo deltiempo.
c. Variación
TEMPORAL.“Venta de
galletitas a lo largo
del tiempo”.
Introducción a la serie de tiempos3
Para ello pueden ser usados procedimientos
tales como:
1. Métodos de suavización
Para encontrar patrones que pueden ser
estáticos o dinámicos.
2. ARIMA
(Autoregressive Integrated Moving
Average), para identificar patrones más
complejos y disimulados por los datos.
Métodos para suavizar
▪ Este enfoque descompone a los datos identificando una
eventual tendencia y los extiende al futuro.
Análisis de Tendencia
▪ El análisis de tendencia muestra un modelo que descompone
la tendencia de los datos. Esatendencia puede ser analizada
como lineal, cuadrática, exponencialo tipo S.
2
1 °
°
3
°
6
°
Análisis de Tendencia3
7 Trend Analysis Plot for Comercio
Linear Trend Model
° Y t = 313,989 + 1,16485*t
Variable
Los componentes Actual
estacionales se muestran Fits
Accuracy M easures
marcados MAPE 1,8999
MAD 6,6177
Comercio
MSD 67,4325
360
350
340
330
320
Recta de tendencia
muestra buen modelo,
310
1 6 12 18 24 30 36 aunque podría
60 probarse
Index con el modelo cuadrático
La estacionalidad tiene
un ciclo de 12 períodos.
Análisis de Tendencia4
Trend Analysis for Comercio
Data Comercio
Length 60
NMissing 0
Accuracy Measures
MAPE 1,8999
MAD 6,6177
MSD 67,4325 A menor valor de cualquiera de estos
estimativos, mejor es el modelo.
Análisis de Tendencia5
Residual Plots for Comercio
Normal Probability Plot Residuals Versus the Fitted Values
99,9 20
N 60
99 AD 1,038
90 P -Value 0,009 10
Residual
Percent
50 0
10 -10
1
0,1 -20
-20 -10 0 10 20 320 340 360 380
Residual Fitted Value
12 10
Frequency
8 Residual 0
4 -10
0 -20
-16 -8 0 8 16 1 5 10 15 20 25 30 35 40 45 50 55 60
Residual Observation Order
Descomposición
Modelo Aditivo
1 2 3
° ° °
Puede pedirse la
estimación de 4 5
futuros valores
° °
6
°
Análisis de Descomposición2
Registro de valores
de predicción y
estimación futura
7°
8°
10°
9°
Análisis de Descomposición3
12°
10°
13°
Análisis de Descomposición4
14 Time Series Decomposition Plot for Comercio
° 400 Multiplicative Model
Variable
Actual
Fits
Trend
La predicción3n8o0es Forecasts
buena en el primer
muy Accuracy M easures
ciclo. 360 MAPE 0,8908
Comercio
MAD 3,0351
MSD 16,5285
340
320
300
1 7 14 21 28 35 42 49 56 63
Index
1,00 1,00
0,96 0,95
1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 11 12
Percent Variation,
Índices para aplicarlos Residuals, by SeasonalPeriod
a la estacionalidad
12 10
5
8
0
4
-5
0
1 2 3 4 5 6 7 8 9 10 11 12 1 2 3 4 5 6 7 8 9 10 11 12
Análisis de Descomposición6
16
° Ecuación de la
recta de tendencia.
17
° Índices para aplicar a los
valores de cada período
dada la estacionalidad.
Análisis de Descomposición7
Accuracy Measures
MAPE 0,8908
MAD 3,0351
MSD 16,5285 A menor valor de cualquiera
de estos estimativos, mejor
Forecasts
es el modelo.
Period Forecast
61 372,964
62 368,687
63 371,370
64 379,150
65 387,248
66 391,582 Valores de predicción
18
°
Análisis de Descomposición8
Índice de Fit de tendencia y
Fit
Período Cte. Pendiente Estacionalid estacionalid
Tendencia
ad ad
Residual
5
Percent
50
0
10
-5
1
0,1 -10
-10 -5 0 5 10 300 325 350 375 400
Residual Fitted Value
estimación en el
Residual
5
10 primer 0
5 período -5
0 -10
-5 0 5 10 1 5 10 15 20 25 30 35 40 45 50 55 60
Residual Observation Order
Técnicas Estadísticas Gráficas Básicas
11. EJERCICIOS
Ejercicio 1
Consigna:
▪ Utilizando una serie de datos de un procesopropio,
construyan un diagrama de tiempo segmentado.
Tiempo:
▪ 20’
Ejercicio 2
Consigna:
▪ Construya un Histograma y un Diagrama de Puntos
para los datos de la columna 74.
▪ Busque segmentar.
▪ ¿Qué conclusiones puede conseguir?
Tiempo:
▪ 20’
Ejercicios Medir.mtw
Columna 74 “Medición”
Ejercicio 3
Consigna:
▪ Construya un Histograma y un Diagrama de Puntos
para los datos de la columna 85.
▪ Busque segmentar.
▪ ¿Qué conclusiones puede conseguir?
Tiempo:
▪ 10’
Ejercicios Medir.mtw
Columna 85 “Promedio de tiempos”
Ejercicio 4
Consigna:
▪ Construya un Box-Plot para los datos de la
columna 85.
▪ Busque segmentar.
▪ ¿Qué conclusiones puede sacar?
Tiempo:
▪ 10’
Ejercicios Medir.mtw
Columna 85 “Promedio de tiempos”
Ejercicio 5
Consigna:
▪ Construya un Box-Plot para los datos de la
columna 52.
▪ Busque segmentar simultáneamente por
operador y turno.
▪¿Qué conclusiones puede sacar?
Tiempo:
▪ 10’ Ejercicios Medir.mtw
Columna 52 “Promedio_1”
Ejercicio 6
Consigna:
▪ Construya un Diagrama de Pareto para los
datos de la columna 92.
▪ ¿Qué conclusiones puede sacar?
Tiempo:
▪ 5’
Ejercicios Medir.mtw
Columna 92
“Cantidad_1”
Ejercicio 7
Consigna:
▪ Construya un Diagrama de Dispersión y una Matriz
de Dispersión para verificar la existencia de
relación entre la cantidad de llamados entrantes y
los tiempos de espera del Call Center.
▪¿Qué conclusiones puede sacar?
Tiempo:
▪ 35’ Ejercicios Medir.mtw
Columna 85 “Promedio de Tiempos” a 88 “Llamadas Entrantes Totales”
Ejercicio 8
Consigna:
▪ Para los datos de la columna 88, construya
diferentes gráficos.
▪ Busque segmentar.
▪¿Qué conclusiones puede sacar?
Tiempo:
▪ 15’
Ejercicios Medir.mtw
Columna 88 “Llamados Entrantes Totales”
Ejercicio 9
Consigna:
▪ Utilizando los datos de las columnas 94 a 102, utilice los
diferentes gráficos vistos y responda:
1. ¿Qué distribución siguen la variables numéricas?
2. ¿Qué variables influyen sobre el Tiempo de Ciclo?
3. ¿Hay alguna relación entre las variables numéricas?
4. ¿Hay alguna mayor solicitud de préstamospor
industria?
5.Utilice otros gráficos para caracterizar lasvariables.
Tiempo:
▪ 30’ Ejercicios Medir.mtw
Columnas 94 “Solicitud_1” a 102 “Cantidad_2”
Ejercicio 10
Consigna:
▪ Utilizando datos de su propio proceso, por favor
emplee varios de los gráficos vistos para
analizarlos.
▪ Busque segmentar.
▪¿Qué conclusiones puede sacar?
Tiempo:
▪ 20’
Sesión 13.0:
➢ p-value.
▪ ¿Será una diferencia dada por el azar o refleja una verdadera diferencia?
¿Las muestras 1, 2 y 3,
son diferentes
simplemente porque las
unidades muestreadas
fueron diferentes y
aleatorias o hay un
cambio en el proceso? x1
x2
x3
¿Hay diferencias o no5?
Muestra 1 Muestra 2
s1 y s2
x1 y x 2
Peor Mejor
_ _
x1 x2
_ _ _ _
x1 x 2 x3 x4
▪ Algunos podrían asegurar que x2 (promedio del día 2) no es más que un
día como otros, y que x4 (promedio del día 4) definitivamente sería
empeoramiento. Pero, ¿y x3?
Riesgos α y β2
▪ Con x3 correríamos un riesgo, porque si miramos la curva más
detenidamente (recordemos que es asintótica)...
_ _
x1 x3
_ _
x1 x3
▪ Asegurarnos que no pertenece al proceso 1 significa que
podríamos confundirlo con un punto del proceso 2.
X
•Riesgo : está dentro del 0,05 de la distribución 1
•Riesgo : está fuera del 0,05 y la rechazamos;
y la aceptamos; pero el valor pertenece a la
pero el valor pertenece a la distribución 1.
distribución 2.
•Riesgo I o Riesgo del productor: “Encontrar una
•Riesgo II o Riesgo del consumidor: “No encontrar
diferencia cuando no existe”. Podría rechazar algo
una diferencia cuando existe”. Podría llegarle algo
que debería enviar.
mal.
•Usualmente 0,05 (opción 0,10).
•Usualmente < 0,20 (opción 0,10).
•1 - = Nivel de Confianza
•1 - = Potencia
Riesgos α y β7
▪ ¿Qué es potencia?
Hipótesis nula
Decisión Verdadera Falsa
▪ p-value
_
Valor para el x1
cual la
Valor en cuestión. Tiene una Desde este valor, la
probabilidad
probabilidad mayor a 0,05. probabilidad de pertenecer
es 0,5
Aceptamos que es de esta a la distribución es menor a
distribución α = 0,05
p-value (valor p)3
▪ Si, por el contrario, el p-value es menor que α, aceptamos que
el valor tiene baja probabilidad de pertenecer a la distribución y,
por lo tanto, que hay diferencias significativas.
Probabilidad
α = 0,05
_
Valor para el cual x1
la probabilidad
es 0,5 Hasta este valor, la Valor en cuestión. Tiene una
probabilidad de pertenecer a la probabilidad menor a 0,05.
distribución es mayor a α = Aceptamos que es de otra
0,05 distribución
p-value (valor p)4
2°
acciones con los
resultados No se reconoce la Los dueños de proceso no fueron
α
necesidad de cambio Dueños de procesos no involucrados adecuadamente en la
comunicados No se
=μ
revisión y aprobación de las mejoras
adecuadamente
implementan Ho : μ
antes después
4°
No hay un plan formal de implementación No se reconoce la necesidad de cambio
las mejoras
β
Otras motivaciones generadas por la Confusión con la
Plan de implementación evaluación de desempeño expresión “calidad”
no compartido
μ
Expectativas
Otros temas
importantes
Foco en resultados
económicos de corto falsas
Ha : μ
Plan de
implementación fallido
reclaman atención plazo exclusivamente
7°
Ho : μ
X =μ
antes después
Ha : μ μ
antes después