Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Temario
Qu es anlisis dimensional?
Diseo de Datawarehouse
Qu es Anlisis
dimensional?
Definiciones
Fast
Analysis
Shared
Multidimensional
Information
Definiciones
Dimensin
Hechos
Implementacin de un Cubo
Implementacin de un Cubo
Cubos en BD
dimensional
Cubos en BD
relacional
Cubos con
componentes en
en BD dimensional
y BD relacional
Diseado para
anlisis de medidas
a travs de
categoras y
atributos
Optimizado para
carga masiva de
datos y para resolver
consultas complejas
y no predecibles
Usuamente tiene
pocos usuarios
concurrentes
Diseado para
operaciones
Optimizado para
transacciones:
consulta, ingreso,
modificacin y
eliminacin de uno
o pocos registros a
la vez
Miles de usuarios
concurrentes
Objetivos de la arquitectura
de un DW
Dimensionales
Histricos
Con detalles y resmenes
Consolidado y consistente
Orientado al sujeto, no la transaccin
Muchos son MUY GRANDES, pero esa
es una caracterstica, no una meta
Material con fines acadmicos
Capturar requerimientos
Disear el modelo dimensional
Desarrollar la arquitectura
Disear las componentes R y M (olap)
Desarrollar el rea de staging
Construir aplicaciones analticas
Mover datos
[repetir todo] ( www.dw-institute.org )
Material con fines acadmicos
Componentes del DW
Data Marts y
cubos
Sistemas OLTP
Operational Data
Store
Clientes
Olap
Reportes
Anlisis
Minado
Relational
DW
Database
1
Disear el
Data Warehouse
Poblar
Data Warehouse
Crear Cubos
& Analisis
Consultar
los Datos
Respuestas pre-calculadas
Motor diseado para anlisis
Obtener requerimientos
IT
Negocio
Esquema de DW / Objetivos
Facilidad de uso!
Arquitectura pensada para el cambio
(ejemplo: cambio de dimensiones)
Soporte a queries instantneos
Revisemos modelos!
Diseo normalizado OLTP
Warehouse
Ordering
Process
Chain
Retailer
Minimiza redundancia
Favorece transacciones OLTP
Multiples relaciones entre entidades
Dificil de mantener en el tiempo
Store
Retailer
Payments
Retailer
Returns
Product
POS
Process
Retail
Promo
Brand
GL
Account
Retail
Cust
Cash
Register
Clerk
Material con fines acadmicos
Diseo dimensional de DW
Customers
Channels
Dates
Sales
Promotions
Products
Material con fines acadmicos
Tablas de dimensiones
Cust acct
Cust
LName
G-538A2
Chau
94025
H-53915
Lopez
00215
222-54Q
Jones
60607
M
Material con fines acadmicos
Tablas de hechos
Customer Key
Customer ID
Customer Last Name
Promotions
Promotion Key
Promotion Name
Promotion Start Date
Promotion District
Sales Fact
Channels
Channel Key
Channel ID
Sales Channel
Name
Retail or Direct?
Customer Key
Date Key
Promotion Key
Channel Key
Product Key
Units
Price
Products
Product Key
Product ID
Product Name
Product Brand
Product Category
Customer Key
Customer ID
Customer Last Name
Promotions
Surrogate Key Promotion Key
Promotion Name
Biz Key
Promotion Start Date
Promotion District
Sales Fact
Channels
Channel Key
Channel ID
Sales Channel
Name
Retail or Direct?
Customer Key
Date Key
Promotion Key
Channel Key
Product Key
Units
Price
Products
Product Key
Product ID
Product Name
Product Brand
Product Category
Customer Key
Customer ID
Customer Last Name
Promotions
Surrogate Key Promotion Key
Promotion Name
Biz Key
Promotion Start Date
Promotion District
Sales Fact
Channels
Channel Key
Channel ID
Sales Channel
Name
Retail or Direct?
Customer Key
Date Key
Promotion Key
Channel Key
Product Key
Units
Price
Products
Primary Key
Facts
Product Key
Product ID
Product Name
Product Brand
Product Category
Dates
Date Key
Date attributes
Sessions
Session Key
Session attributes
Customers
Customer Key
Customer attributes
Time Key
Time attributes
Pages
Page Key
Page attributes
Referrer Sites
Referrer Site Key
Referrer attributes
Cdigos originales
Nombres
Descripciones
Jerarquas implcitas
Tablas atmicas
Tablas agregadas
Comunidades :
Brand Key
Brand Name
Product Category Key
Ejemplo de Snowflake
Year
CalQtr
Month
Dates
Week
QuadWeek
SalesQtr
Year
Channels
Promotions
Sales Fact
Date Key
Customer Key
Product Key
Channel Key
Promotion Key
Unit sales
Dollar sales
Country
State
City
Zip
Customers
Products
Brand
Subcategory
Category
Department
Family
Manejo de fechas
Granularidad:
Ejemplo
Slowly changing dimension CASO 1
Cust
ID
Cust
Lname
Cust
Fname
Cust
Key
Cust
ID
Cust
Lname
Cust
Fname
C58Q2
Brown
M.
C58Q2
Brown
M.
AG298
Chau
Mike
AG298
Chau
Mike
AX8D1
Lopez
Carolyn
AX8D1
Chau
Carolyn
Cust
ID
Cust
Cust
Row
Row
Lname Fname Current? Start
C58Q2
Brown
M.
yes
12/3/99
AG298
Chau
Frank
yes
1/15/00
AX8D1
Lopez
Carolyn
no
2/20/00
AX8D1
Chau
Carolyn
yes
9/16/00
Row
Stop
9/15/00
Material con fines acadmicos
Dimensiones combinadas
Operacin
1. Identificar el proceso de
negocio
2. Definir la granularidad
3. Identificar las
dimensiones
Modelamiento dimensional
Caso 1 - Retail
1. Proceso de negocios
1. Proceso de negocios
1. Proceso de negocios
Requerimientos
Publicidad en medios
Despliegues grficos
Cupones de descuento
Requerimientos
2. Declarar la granularidad
3. Seleccionar las
dimensiones
Dados los requerimientos, la decisin
Date
Product
Store
Promotion
Date
1
Full date
descripti
on
01/01/2002
Calendar
Day of
M
W
o
e
n
e
t
k
h
Tuesday
January
Calenda
r
Y
e
a
r
2002
Fiscal YearMont
h
F2002-01
Holiday
Indi
cato
r
Holiday
January 1, 2002
2
01/02/2002
Weekday
Wednes
d
a
y
January
2002
F2002-01
Non-Holiday
January 2, 2002
3
01/03/2002
Weekday
Thursda
January
2002
F2002-01
Non-Holiday
January 3, 2002
4
01 /04/2002
Weekday
Friday
January 4, 2002
Weekday
Indica
tor
January
2002
F2002-01
Non-Holiday
Weekday
Dimensin Producto
Dimensin Producto
Product Key
Product Description
Brand Description
Category Description
Department Description
Fat Content
Baked Well
Bread
Bakery
Reduced
Fluffy
Bread
Bakery
Regular
Fluffy
Bread
Bakery
Reduced
Light
Sweeten Bread
Bakery
Non-Fat
Coldpack
Frozen Desserts
Frozen Foods
Non-Fat
Freshlike
Frozen Desserts
Frozen Foods
Reduced
Frigid
Frozen Desserts
Frozen Foods
Regular
Icy
Frozen Desserts
Frozen Foods
Regular
F
a
t
F
a
t
F
a
t
F
a
t
F
a
t
F
a
Material con fines acadmicos
t
Dimensin Producto
As modelado, cada atributo es un interesante Header para un reporte de
anlisis, como:
DRILL-DOWN
POR
CATEGORA
DRILL-DOWN
POR
CONTENIDO
CALRICO
Dimensin Tienda
Dimensin Promocin
Dimensin Promocin
Dimensin Promocin
Dimensiones degeneradas
El hecho POS transaction number aparece como una primary key en
forma natural, pero en nuestro modelo tiene una Dimensin Nula.
Esto se llama dimensin degenerada (degenerate dimension o DD) y
habitualmente estn asociadas al nivel de granularidad del modelo
Las DD son muy tiles para agrupar hechos que estn asociados a
una misma transaccin (en este caso la compra realizada por un
cliente), en una relacin Parent-Child
Otros ejemplos son: Nmero de orden, Factura, Hoja de trabajo, etc.
Modelamiento dimensional
Caso 2 - Inventario
Conceptos dimensionales a
cubrir
Implicaciones de la cadena de valor
Modelo de snapshot peridico,
transaccional y de actualizacin para
manejar inventarios
Ejemplo de hechos semiaditivos y no
aditivos
Arquitectura de DW BUS de Kimball
Introduccin a la Cadena de
Valor
Muchas organizaciones (especialmente en el mundo retail)
Reempaque, maquila
Distribucin interna a centros de venta
Control de calidad
Almacenamiento temporal
Etc.
Fotografa peridica:
Transaccional:
1.
2.
3.
4.
Diseando el modelo
dimensional
1. El primero modelo
Nro productos
Nro locales
Nro mediciones (snapshots)
Material con fines acadmicos
Hechos semiaditivos
Extensiones al modelo
El nuevo modelo
dimensional
Soportando anlisis de margen de inventario
Al agregar nuevos hechos Cuidado con la Granularidad!!!
Por qu GRMOI no se coloca como un hecho? Porque es NO
ADITIVO!
2. Modelo transaccional
Registra cada transaccin que afecta el inventario,
tales como:
Ingreso de producto
Poner producto en control de calidad
Liberar producto de control de calidad
Devolver producto a proveedor por problema de calidad
Poner producto en un BIN
Autorizar producto para la venta
Retirar producto de BIN
Empacar o reempacar producto
Vender producto a cliente
Recibir producto devuelto por cliente
Retornar producto a inventario
Etc.
Material con fines acadmicos
El modelo dimensional
transaccional
3. Modelo de acumulacin de
fotos
Modelo de acumulacin de
fotos
El modelo dimensional
asociado
Integrando la cadena de
valor
Se han revisado tres formas de modelar
Dimensiones compartidas
DW Bus Architecture
(Kimball)
Inmon CFI
Kimball - BUS
Elementos de DW BUS
BUSINESS PROCESSES
Date
Product
Store
Promotion
Warehouse
Vendor
Retail Sales
Retail Inventory
Retail Deliveries
Warehouse Inventory
Warehouse Deliveries
Purchase Orders
Contract
Shipper
Uso de la Matriz