Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Aplicaciones
Universidad de Chile
Departamento de Ingeniería Industrial
1
Contenido
• Predicción de series de tiempo
• Del banco tradicional al banco virtual
Serie de tiempo:
Número de
pasajeros de una
línea aérea
https://www.analyticsvidhya.com/blog/2018/02/time-series-forecasting-methods/
https://robjhyndman.com/publications/
3
Economax
4
Diploma de Postítulo Inteligencia de Negocios 2019
Motivación del Problema
¿Qué
productos
pido?
¿Cuánto pido?
• Ventas pasadas
• Precios 25.000
• Estacionalidad
Monto ($)
• Festivos 15.000
• Clima 10.000
0
8
98
98
98
98
98
98
98
98
98
98
98
99
99
99
99
9
9
19
19
19
19
19
19
19
19
1
-1
-1
-1
-1
-1
-1
1-
1-
1-
1-
2-
2-
2-
3-
3-
3-
4-
4-
1
4
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
-0
01
08
15
22
29
05
12
19
26
05
12
19
26
02
09
16
23
30
Día
6
Diploma de Postítulo Inteligencia de Negocios 2019
Motivación del Problema
• ¿Cómo administrar el inventario?
8
Diploma de Postítulo Inteligencia de Negocios 2019
Knowledge Discovery in Databases: KDD
4.Interpretación y
Evaluación
3.Data Mining
Knowledge
Conocimiento
2.Selección y
Preprocesamiento
p(x)=0.02
1.Consolidación
de los Datos Patrones y Modelos
Warehouse
DW Datos preparados
Datos Consolidados
Fuentes de Datos
9
Diploma de Postítulo Inteligencia de Negocios 2019
1.Consolidación de los Datos
100
80
60 Verano
40
20
118389
0
01 21 10 30 19 09 29 18 08 28 17 06 26 18 07 27 17 06 26 16
- J - J - A - A - S - O - O -N -D - D - J -F - F - M - A - A - M -J - J - J
UL UL U U E C C O E E AN E E A P P A UN UN UL
-2 -2 G- G- P-2 T- T- V- C- C- -2 B-2 B-2 R- R- R- Y- -2 -2 -2
0 0 00 20 20 0 20 20 2 0 20 20 00 0 0 20 20 2 0 2 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 1 01 01 01 01 0 1 01 1 1 1
11
Diploma de Postítulo Inteligencia de Negocios 2019
1.Consolidación de los Datos:
Cerveza 1 Lt.
2000
Año Nuevo
Navidad
18 Sept
1000 Verano
114464
12
Diploma de Postítulo Inteligencia de Negocios 2019
1.Consolidación de los Datos
13
Diploma de Postítulo Inteligencia de Negocios 2019
Knowledge Discovery in Databases: KDD
4.Interpretación y
Evaluación
3.Data Mining
Knowledge
Conocimiento
2.Selección y
Preprocesamient
o p(x)=0.02
1.Consolidació
n de los Datos Patrones y Modelos
Warehouse
DW Datos preparados
Datos Consolidados
Fuentes de Datos
14
Diploma de Postítulo Inteligencia de Negocios 2019
2.Selección y Preprocesamiento
“En la vida real los datos no están como
quisiéramos”
15
Diploma de Postítulo Inteligencia de Negocios 2019
2.Preprocesamiento
precioPLU _ Economax
PB( N º PLU )
MAX ( precioPLU _ micromercado)
precioPLU _ Economax
PC ( N º PLU )
MIN ( precioPLU _ micromercado)
Estas variables también se reescalan entre 0 y 1
16
Diploma de Postítulo Inteligencia de Negocios 2019
Knowledge Discovery in Databases: KDD
4.Interpretación y
Evaluación
3.Data Mining
Knowledge
Conocimiento
2.Selección y
Preprocesamiento
p(x)=0.02
1.Consolidació
n de los Datos Patrones y Modelos
Warehouse
DW Datos preparados
Datos Consolidados
Fuentes de Datos
17
Diploma de Postítulo Inteligencia de Negocios 2019
3.Data Mining: Enfoques de
Solución
Modelos Ingenuos (enfoque actual)
Modelos Box Jenkins
SARIMAX (p,d,q) (sp,sd,sq) Y
Redes Neuronales
Perceptrón Multicapas (MLP)
18
Diploma de Postítulo Inteligencia de Negocios 2019
Análisis de Series de Tiempo
19
Diploma de Postítulo Inteligencia de Negocios 2019
Modelos Box Jenkins
• Requisitos de ARMA
– Al menos 50 observaciones
– La serie debe ser estacionaria
https://people.maths.bris.ac.uk/~magpn/Research/LSTS/TOS.html
20
Diploma de Postítulo Inteligencia de Negocios 2019
Modelos Box Jenkins
• Para convertir una serie no estacionaria en otra
estacionaria se puede:
– Aplicar transformaciones logarítmicas
– Diferenciar la serie (Xt - Xt-1)
• ARIMA(p,d,q) donde d es Nº de términos
diferenciados
• Seasonal ARIMA: SARIMA (p,d,q) (sp,sd,sq)
• SARIMAX con X variables externas (regresores)
21
Diploma de Postítulo Inteligencia de Negocios 2019
Redes Neuronales
• Modelos de conectividad
• Resuelven problemas de:
– Clasificación de patrones
– Aproximación de funciones
– Clustering
– Optimización
– Memoria asociativa n
– Predicción o pronóstico yk f ( wik xi )
i 0
22
Diploma de Postítulo Inteligencia de Negocios 2019
Aplicaciones de Redes Neuronales
• Clasificación:
– Detección de Fraude
– Predicción de Fuga de Clientes
– Predicción de Compra de productos (marketing
directo)
• Regresión:
– Estimación de riesgo de clientes (scoring)
– Pronóstico de índices financieros y bursátiles
(monedas, metales, stock markets, bonos, etc.)
23
Diploma de Postítulo Inteligencia de Negocios 2019
Multilayer Perceptron (MLP)
24
Diploma de Postítulo Inteligencia de Negocios 2019
MLP para forecasting
25
Diploma de Postítulo Inteligencia de Negocios 2019
Overfitting o Sobreajuste
27
Diploma de Postítulo Inteligencia de Negocios 2019
Desempeño del pronóstico: medidas de error
( y ( k ) ˆ
y ( k )) 2
1
k
( y ( k ) ˆ
y ( k )) 2
k
( y ( k ) y ( k )) 2
2N k
28
Diploma de Postítulo Inteligencia de Negocios 2019
O
N 29
M
56 UE
T
53 ED
W
50 HU
T
47 RI
F
44 A T
S
41 UN
S
39 ON
M
36 UE
T
33 ED
W
30 HU
T
27 RI
F
24 A T
S
Aplicación a PLU 100595
21 UN
S
19 ON
M
16 E
TU
13 ED
(Aceite Vegetal 1 Lt.)
W
10 U
TH
7 I
FR
Date
T
SA
1
400
300
200
100
0
100595
Aplicación de Box Jenkins
100595 100595
1,0 1,0
,5 ,5
0,0 0,0
Partial ACF
-,5 -,5
Confidence Limits Confidence Limits
ACF
30
Diploma de Postítulo Inteligencia de Negocios 2019
Aplicación de Box Jenkins
Error for V26 from ARIMA, MOD_2 NOCON Error for V26 from ARIMA, MOD_2 NOCON
1.0 1.0
.5 .5
0.0 0.0
-.5 -.5
Partial ACF
Confidence Limits Confidence Limits
ACF
31
Diploma de Postítulo Inteligencia de Negocios 2019
Modelos Tradicionales y MLP
32
Diploma de Postítulo Inteligencia de Negocios 2019
En Resumen...
Se realizaron pruebas con otros cinco productos, y se obtuvo que:
• ARIMA mejora los pronósticos obtenidos por métodos ingenuos
• Generalmente se obtienen mejores resultados con Redes Neuronales
(RN) que con ARIMA
• ARIMA entrega un modelo comprensible y buenos resultados, pero con
costos no despreciables (requerimientos estadísticos, y de conocimientos
del usuario)
• RN obtienen los mejores resultados de forma más automática, pero con
modelo tipo “black box”
33
Diploma de Postítulo Inteligencia de Negocios 2019
Sistema de Reposición Periódica
34
Diploma de Postítulo Inteligencia de Negocios 2019
Un id ade s
0
1 00
2 00
3 00
4 00
5 00
6 00
7 00
8 00
19/09 /0 0
0 3/10 /0 0
1 7/10/0 0
3 1/10/00
1 4/11/00
28 /11/00
12 /12/00
26/1 2/00
09/0 1/01
23/0 1/01
06/02 /01
2 0/02 /0 1
N i ve l d e Inv entar i o
Días
0 6/03 /0 1
2 0/03/0 1
N ivel de I nv entari o Di ario PL U 100 595
0 3/04/01
01 /05/01
15 /05/01
29/0 5/01
12/06 /0 1
26/06 /0 1
1 0/07 /0 1
Reposición de Inventarios
2 4/07 /0 1
Quiebres de venta: 1% con 5 días de alcance en inventario
35
Identifying web usage behavior
of bank customers
Araya, S., Silva, M., Weber, R. (2004): A Methodology for Web Usage Mining and its Application to
Target Group Identification. Fuzzy Sets and Systems 148, No. 1, 139-152
• Founded in 1937
Interpretation
Evaluation
Data Mining
Transformation
Pre-processing
Selection Patterns
transformed
data
pre-
processed
selected data
Data data
Transformed
Log Files Sessions data
Integrated Pattern
data
Clean
logs
Rules
Clusters
Interpre-
Selection Preprocessing Transformation Data Mining
Diploma de Postítulo Inteligencia de Negocios 2019
tación
Current situation
Registed Visitors of (Traditional)
Virtual Bank Bank Customers
Goal
• How do my navigating
customers behave?
• Clustering of navigating
customers
• Determine profile of
“heavy users” • Search for (traditional) customers that have
• => Fuzzy Clustering a profile similar to that of “heavy users”
L2 29 26 4277 10.3%
M1 58 31 4599 11.1%
M2 47 32 11829 28.5%
N e u ro n
In p u t L a y e r H id d e n O u tp u t L a y e r
Layer
Diploma de Postítulo Inteligencia de Negocios 2019
Identification of twins with Neural networks
Advanced selection
100%
Random selection
Percentage of
100%
total customers
Diploma de Postítulo Inteligencia de Negocios 2019
Marketing Campaign
New visitors from class H New visitors from class H (total)
that received the mailing
Week
Semana New Visitors
Clientes nuevos
13 737
14 153
15 114
16 101
TOTAL 1,105
11.0567
Semana
Week Clientes
New Visitorsnuevos
13 256
14 264
15 212
16 204
TOTAL 936
936
Connection rate of twins of = 5%
heavy users without mailing 18.300
www.neural-forecasting.com