Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Data Warehouses
Búsqueda de
fecha
correlaciones
Consultas y entre datos.
Analisis
Multidimensional reportes
(OLAPs) Data Mining
complejos
Diccionario de Datos
Bases
de datos
Históricos Archivos .....
fuentes BD-Rel BD-Geo BD-Texto
Interoperabilidad - 2005
1
Data Warehouse
LAV GAV
DW DW
Bottom-Up Top-down
Interoperabilidad - 2005
Data Warehouse
2
Modelo Dimensional [Kim96]
Interoperabilidad - 2005
Tiempo
Cliente Sucursal
Ventas
Vendedor
Producto
Interoperabilidad - 2005
3
Tipos de esquemas en el MD (2)
Pais
• Snowflake:
– Resultado de descomponer Region
Semana Mes
cada dimensión en varias que
forman jerarquías. Ciudad
Fecha
Vendedor Sucursal
Ventas
Cliente Modelo
Ciudad
Producto
Region
Pais
Interoperabilidad - 2005
Diseño de DW
Interoperabilidad - 2005
4
Una propuesta desarrollada
en el InCo
• Herramienta para diseñar un esquema lógico de
DW a través de transformaciones. [Mar00]
– Conjunto de primitivas de transformación de esquemas
– Se obtiene la traza del diseño
– Modelo Relacional + clasificación de sus elementos en
conceptos dimensionales
– Definición de propiedades de consistencia de un
esquema de DW
– Reglas y estrategias para aplicación de las primitivas
Interoperabilidad - 2005
Arquitectura de la Transformación
relaciones
DW
primitivas
Aplicación de las
primitivas
BD fuente
relaciones
Interoperabilidad - 2005
5
El conjunto de Primitivas
Interoperabilidad - 2005
– ESQUEMA RESULTADO
• R’(A’1, ...., A’m) ∈ RelC /
{A’1, ...., A’m} = {A1, ...., An} – Y ∪ Z
Interoperabilidad - 2005
6
Aplicación de una Primitiva
SALES
sale_date SALES_DW
customer_id sale_date
presentation_id subtype_id
city_id presentation_id
sale_amount city_id
sale_cost sale_amount
HIERARCHY sale_cost
sale_qty ROLL UP sale_qty
CUSTOMERS
CUSTOMERS_DW
customer_id
subtype_id
customer_name
subtype_name
subtype_id
type_id
subtype_name
type_name
type_id
type_name
Interoperabilidad - 2005
Comparando esquemas
EF EDW
DW R1(....) f R’1(....)
. .
f . .
Rn(....) R’m(....)
I(EF) I(EDW)
BF f
Interoperabilidad - 2005
7
Estudiamos propiedades de f
• Vemos algunas fi
– Agregaciones
Ventas(producto, vendedor, cliente, fecha, cantidad)
I(Ventas) I(VentasDW)
f total, no inyectiva
Interoperabilidad - 2005
Estudiamos propiedades de f
– Historia en dimensiones
Clientes(ci, nombre, direccion, telefono)
8
Entonces...
• f es total, no inyectiva.
DW
• BF y DW no son
f equivalentes.
Interoperabilidad - 2005
• En adelante…
– Como tener en cuenta en el diseño de DW el hecho de
que proviene de múltiples fuentes
Interoperabilidad - 2005
9
Enfoques posibles
• Enfoque 1 DW
BD Integrada
Interoperabilidad - 2005
Enfoques posibles
• Enfoque 2 DW
SE2
SE1 SEn
1 etapa
Transformación - Primitivas
10
Enfoque elegido
Enfoque 1 si no si si
Enfoque 2 no si no no
Interoperabilidad - 2005
Ejemplo 1
BF1: BF2:
Ventas-Montevideo Ventas-Interior
V1 A1 20/2/01 20 V4 A1 4/2/01 10
V2 A1 14/2/01 5 V5 A2 5/3/01 20
V6 A2 10/3/01 4
V3 A2 3/3/01 30
DW:
Ventas
Articulo Mes Cantidad
A1 2/01 35
A2 3/01 54
Interoperabilidad - 2005
11
Ejemplo 1
BF1 DW: BF2 DW:
A1 2/01 25 A1 2/01 10
A2 3/01 30 A2 3/01 24
Integracion
DW:
Ventas
Articulo Mes Cantidad
A1 2/01 35
A2 3/01 54
Interoperabilidad - 2005
Ejemplo 2
BF1: BF2:
Temperaturas1 Temperaturas2
Ciudad Fecha Temp Ciudad Fecha Temp
Durazno 20/3/01 30
Durazno 3/3/01 30
DW:
Temperaturas
Ciudad Mes Temperatura
Montevideo 2/01 20
Interoperabilidad - 2005
12
Ejemplo 2
BF1 DW: BF2 DW:
Integracion
DW:
Temperaturas
Ciudad Mes Temperatura
Ejemplo 3
BF1:
Ventas
Articulo Fecha Cant Articulos
A1 7/2/02 50 A1 T1
A2 1/3/02 130 A2 T1
A3 2/3/02 80 A3 T2
A4 3/3/02 40 A4 T2
BF2:
Articulos
DW:
Articulo Nac-o-Imp
Vtas-art-nacionales
A1 N
Tipo-art Mes Cantidad
A2 I
T1 2/02 150
A3 N
T2 3/02 120
A4 N
Interoperabilidad - 2005
13
Ejemplo 3
Interoperabilidad - 2005
Casos
Interoperabilidad - 2005
14
Generacion DW multiples fuentes
DW
SE2
SE1 SEn
Correspondencias
semanticas Primitivas
Interoperabilidad - 2005
Correspondencias semanticas
• Tipos [Mot98]
– equivalencia
– inclusion
– solapamiento
– particion vertical/horizontal
– agrupamiento
• Ejemplo 3
– DW.Vtas-art-nacionales >> BF1.{Ventas, Articulos}
– DW.Vtas-art-nacionales ⊂ BF1.{Ventas, Articulos}
• f: A I(DW.Vtas-art-nacionales)
• A = { e ∈ I(BF1.{Ventas, Articulos}) / g(e).Nac-o-imp = “N” }
• g: I(BF1.{Ventas, Articulos}) I(BF2.Articulos)
Interoperabilidad - 2005
15
Correspondencias semanticas
Interoperabilidad - 2005
Modificacion de primitivas
Interoperabilidad - 2005
16
Ej.: DD-Adding N-1
Input:
- source schema: SDB1.R1( A1, ...., An ), SDB2.R2( B1, ...., Bm ) ∈ Rel
- f(C1, ...., Ck ) / { C1, ...., Ck } ⊆ { A1, ...., An }∪{ B1, ...., Bm }
- A / A ∈ { A1, ...., An } ∧ B / B ∈ { B1, ...., Bm } , join attributes
- is_fk , boolean argument
- R3 ∈ Rel , relation to which An+1 is a foreign key (optional)
- source instance : r1, r2
Resulting schema:
- R’1 ( A1, ...., An, An+1 ) ∈ Rel / An+1 represents f (C1, ...., Ck ) ∧
if is_fk then An+1 = AttFK(R’1, R3)
Generated Instance:
- r’1 = select A1, ...., An, f (C1, ...., Ck)
from SDB1.R1 SDB2.R2
where II-Match (SDB1.R1.A , SDB2.R2.B)
Interoperabilidad - 2005
Resulting schema:
Interoperabilidad - 2005
17
P15 – Relation Integration
Generated Instance:
X1 = {Nombre,Apellido}
Y1 = {Nombre} P15
Z1 = {Nombre}
X2 = {Cargo}
DW.Empleados
Y2 = {Posicion}
Nombre Cargo Telefono Sueldo
Z2 = {Cargo}
ii-type = ∩ Juan Perez C1 5050402 20000
ai-type = ∪
Silvia Gonzalez C4 2002120 5000
Interoperabilidad - 2005
18
Integracion de Instancias
Interoperabilidad - 2005
Bibliografía
• [Mar02] Adriana Marotta. Resolución de la Integración en el Diseño del Data
Warehouse. I Workshop de Bases de Datos, Jornadas Chilenas de Computación
(JCC'2002), Copiapo, CHILE, Nov. 2002.
• [Kim96] R. Kimball. The Data Warehouse Toolkit. J. Wiley & Sons, Inc. 1996
• [Mar00] Adriana Marotta. Data Warehouse Design and Maintenance through Schema
Transformations. Tesis de Maestría. Oct. 2000. InCo - Pedeciba, Facultad de Ingeniería,
Universidad de la República, Montevideo, Uruguay.
Interoperabilidad - 2005
19