Sei sulla pagina 1di 32

Comunidad 2:

Integrantes: Erika Berumen González


Roberto Ruiz Berumen
Miguel Ángel Peña
Martínez

MODELO
MULTIDIMENSIONAL
Operaciones OLAP
 Las limitaciones es la propia estructura de
la base de datos:
 Las consultas realizadas en los DSS son
muy complejas y su definición no está
fijada de antemano.
Como las consultas dependen de lo que

necesite el usuario en cada momento,


con un modelo relacional se debería
generar un índice por cada posible
consulta que desee el usuario, lo que
dificulta la gestión y mantenimiento de la
base de datos.
 Si lo que se quiere es acceder a un dato
individual básico como puede ser el
importe de una operación concreta, la
ventaja del modelo multidimensional
desaparece en favor del relacional.
Éstos son capaces de recuperar un dato

individual con mayor eficiencia que las


multidimensionales y, dada su utilización
masiva en sistemas OLTP.
Están optimizados para la inserción de

registros y el control concurrente de


usuarios.

En el modelo de datos multidimensional,


los datos se organizan en torno a los


conceptos de la empresa y la estructura
de datos manejada en este modelo son
matrices multidimensionales o
hipercubos.
El Modelo de Datos
7 Multidimensional
 Vista multidimensional del data
warehouse => influencia el diseño de la
base de datos, las herramientas front-end,

y los motores OLAP.


 Modelo multidimensional de datos: un


conjunto de medidas numéricas son los
objetos de análisis.
 – Ej: ventas, beneficios, duración de
llamadas, etc.

 Adicionalmente existen, asociadas a las medidas,
las dimensiones de
análisis, que proveen el contexto a las medidas, y se

describen mediante
atributos.

 El modelo define una medida como un valor en un


espacio multidimensional.
Estas medidas pueden también representar datos

agregados.

 Las dimensiones se pueden organizar en


jerarquías de agregación.

Tiempo
Establecimient
id_fecha o
9 id_establec
día
nro_establec
semana
Producto nombre
mes
dirección
id_producto año
distrito
nro_producto día_semana
ciudad
descripción día_mes
país
marca trimestre
tlfno
subcategoría festivo
fax
categoría .... Ventas
superficie
departamento id_fecha
tipo_almacén
peso id_producto
...
unidades_peso id_establec
tipo_envase importe
dietético unidades
... nro_clientes
Crear Esquema e Insertar
10
valores
CREATE DATABASE VENTAS_DM,

USE VENTAS_DM;

CREATE TABLE SALE (product char(2), client char(2), date


char(1), amt int);


INSERT INTO SALE VALUES ( 'p1', 'c1', '1', 12), ( 'p2', 'c1',
'1', 11),
( 'p1', 'c3', '1', 50), ( 'p2', 'c2', '1', 8), ( 'p1', 'c1', ‘2', 44),

( 'p1', 'c2', ‘2', 4);



Modelo de Datos
Multidimensional y
Funciones de Agregación 
 Sumar las cantidades (Amt)
del día 1  (Date)
En SQL:  SELECT sum(Amt)
                       FROM
SALE               
                       WHERE
Date = 1 
81 
result
Modelo de Datos
Multidimensional y
Funciones de Agregación 
 Sumar las cantidades por
día
En SQL:  SELECT Date, sum(Amt)
                  FROM SALE
                       GROUP
BY Date 
result
Modelo de Datos
Multidimensional y Funciones
de Agregación 
 Sumar cantidades por client,
product
En SQL:  SELECT product, client,
sum(amt)                 FROM
SALE
                GROUP BY product,
client
11.11.2. GROUP BY
Modifiers
 Ver archivo del Manual de
Referencia MySQL
 MySql_groupBy_rollUp.docx

Modelo de Datos
Multidimensional y Funciones
de Agregación 
En el Modelo de Datos 
Multidimensional junto con
valores de medición se
almacena información
sumarizada ( agregados )
Funciones de Agregación
16

 Operadores: sum, count, max, min,


average
 Claúsula “Having”
 Usando Jerarquías de dimensión
 Promedio por región (tienda -- store)
 Máximo por mes (fecha -- date)
Ejemplo de Data Cube
17
Date
1Q 2Q 3Q 4Q sum
u ct camera
video C
od USA
Pr CD o
sum u
Canada
n
Mexico t
r
sum
y

All,
All,
Ejercicio (1)
18
 Suponga que AAA Automobile Co. construye
una data warehouse para analizar las ventas
de sus autos.
 La medida measure - price de un auto
 Se necesita responder las siguientes consultas
típicas:
 encontrar las ventas totales por día, semana,
mes y año
 encontrar las ventas totales semana, mes y
año, ... para cada agencia
 encontrar las ventas totales semana, mes y
año, ... Para cada modelo de carro

Ejercicio (2)
19

 Dimensiones:
 time (day, week, month, quarter, year)
 dealer (name, city, state, region, phone)
 cars (serialno, model, color, category , …)

 Diseñe el esquema conceptual de la


datawarehouse

Datawarehouse de AAA Automobile
Co.
20

Date Dealer

Day Name
Week Price Fact Table City
Month State
Quarter Date Region
Year Phone
Dealer

Car Car

SerialNo
Model
Color unit_prices
Category
descount
total
Measurements
AAA Co. DataWarehouse
21

price
unitprice
date car
dealer
name serialNo
name serialNo model
city color
state desc. category
region
phone total

date
dateid
day
week
month
year
Esquema de la DataWarehouse AAA
(tarea)
car serialno model color category
A1000 Lupo plata compacto
date dateId day week month quarter year B2000 Jetta azul sport
22 C3000 Passat negro lujo
01-01-06 01 1 01 1 2006
01-03-06 01 1 03 1 2006
01-05-06 01 1 05 2 2006

price unitprice date name serialno desc total


110000 01-01-06 Dorada A1000 10 99000
160000 01-03-06 Angelópolis B2000 15 136000
280000 01-05-06 Centro C3000 25 210000

dealer name city state region phone


Dorada
Angelópolis
Centro Puebla Puebla SW 7557705
7566311
7557777
Consultas a AAA
23
Datawarehouse
 encontrar las ventas totales por día,
semana, mes y año

 SELECT day, sum(total)


 FROM PRICE, DATE
 WHERE date= dateid
 GROUP BY day

 AÑADIR ROLLUP
Consultas a AAA
24
Datawarehouse
 encontrar las ventas totales por día,
semana, mes y año
 encontrar las ventas totales semana,
mes y año, ... para cada agencia
 encontrar las ventas totales semana,
mes y año, ... Para cada modelo de
carro
 encontrar las ventas totales por mes
para todos las agencias en una
ciudad, región y estado dados.

OLAP Servers
25

• Relacional OLAP (ROLAP):


• DBMS relacional extendido que mapea
operaciones en datos
multidimensionales a operaciones
relacionales estandar
• Almacen toda la información incluyendo
fact tables como relaciones
• Multidimensional OLAP (MOLAP):
• Servidor de propósito especial que
directamente implementa operaciones
y datos multidimensionales
• Almacena conjuntos de datos
multidimensionales como arreglos
OLAP Servers
26

• OLAP Híbrido (HOLAP):


• Da a los usuarios y
administradores del
sistema la libertad para
seleccionar particiones.

OLAP Queries
27 (Consultas)
• Roll up: resume datos dentro de
una jerarquía de dimensión
• Si sabemos el volumen total de
ventas por ciudad es posible
agregar sobre la ubicaión
(location) para obtener ventas por
estado

28
OLAP Queries
• Roll down, drill down: ir desde alto
nivel de resumen hasta bajo nivel
de resumen o datos detallados
• Para una categoría de producto
particular, encontrar el detalle de
ventas para cada vendedor por
fecha
• Dado el total de ventas por estado, se
pueden pedir las ventas por ciudad;
o solo las ventas por ciudad para un
estado seleccionado
OLAP Queries
29

 Slice and dice: select and project


• Ventas de video en USA en los últimos
6 meses
• Slicing and dicing reducen el número
de dimensiones
• Pivot: reorientar el cubo
• El resultado del pivoteo es llamado
cross-tabulation
• Si se pivotea el cubo Sales en las
dimensiones Client y Product, se
obtiene una tabla para cada client
para cada valor de product
OLAP Queries
30
• Pivoteo puede ser combinado con
aggregation
sale prodId clientid date amt

p1 c1 1 12
p2 c1 1 11
p1 c3 1 50 day 2
p2 c2 1 8
p1 c1 2 44
day 1
p1 c2 2 4

c1 c2 c3 Sum c1 c2 c3 Sum
1 23 8 50 81 p1 56 4 50 110
2 44 4 48 p2 11 8 19
Sum 67 12 50 129 Sum 67 12 50 129
OLAP Queries
31

• Ranking: selección de los primeros n


elementos (e.j. select los 5 mejores
productos comprados en Julio)
• Otros: stored procedures, etc.
 Time functions

 e.j., time average


 ¡ GRACIAS POR SU
ATENCION !

Potrebbero piacerti anche