Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Capítulo 2
Diseño Dimensional
Objetivo
Temas
Measures (medidas):
• Son valores cuantitativos que almacenan las métricas del negocio y responde a la
pregunta ¿Cuánto?
• Están representados por columnas numéricas en la fact table.
• En algunos casos provienen directamente de los sistemas transaccionales.
• Son las variables que ayudarán a medir el desempeño del negocio.
• Una fila en una tabla de hechos corresponde a una o varias medidas
Marketing
- Unidades vendidas
- Valores actuales
- Valores presupuestados
Logística
- Unidades aceptadas
- Unidades devueltas
- Peso
- Costo inventario
- Montos comprados
Producción
- Tiempo de producción
- Capacidad usada
- Unidades embarcadas
- Unidades planificadas
- Unidades producidas
- Costos producción
- Horas hombre
- Peso ingresado
- Peso procesado
Las medidas tienen propiedades que permiten definir su funcionamiento, así como
controlar cómo aparecen ante los usuarios.
Al usar una dimensión para segmentar una medida, la medida se resume en las
jerarquías contenidas en la dimensión. Todas las medidas que se crean están
respaldadas por una función de agregación que determina la operación de la medida.
1.2.1 Aditivas
1.2.2 Semiaditivas
1.3 Semiaditivas
2.1 Dimensión
Ejemplo:
• Las dimensiones definen los niveles de análisis (Jerarquías). Esto permite obtener
agregación o sumarización.
• Es una entidad de negocios respecto de la cual, se deben analizar las métricas.
Ventas
- Producto
- Organización
- Tiempo
- Cliente
- Formas de pago
Marketing
- Producto
- Organización
- Tiempo
- Segmento de clientes
- Medios de entrega
- Territorios
Logística
- Estado
- Proveedores de inventario
- Materiales
- Productos
- Ubicación
- Organización
- Tiempo
Producción
- Organización
- Producto
- Procesos
- Estaciones de trabajo
• Es preciso que toda dimensión signifique lo mismo para cada tabla de hechos con la
que se relacione: fechas, productos, geografía, cliente …
• Generalmente provienen de las tablas maestras de los sistemas transaccionales.
• En cantidad de registros las dimensiones son las tablas más pequeñas.
• Las dimensiones están compuestas de dos partes:
- Atributos
- Jerarquías
Atributos
Jerarquías y niveles
Para crear tablas relacionadas, puede definir una relación entre dos tablas.
Una relación se establece cuando el valor de un campo, denominado campo
de coincidencia (a veces recibe el nombre de campo de clave) en un lado de
la relación se compara con éxito con un valor en el campo de coincidencia en
el otro lado de la relación de acuerdo con los criterios que especifique en la
relación.
Por ejemplo, puede crear una relación tal que cuando el valor en el campo ID
de estudiante de una tabla Alumnos sea igual al valor del campo ID de
estudiante de una tabla Clases, los registros de las dos tablas se relacionen.
o Clave principal:
o Clave externa:
Tipos de relaciones
3. Modelo dimensional
El modelo físico está compuesto de dos tipos de tablas: tablas dimensionales y tablas de
hechos.
Tienen una relación uno a muchos con la tabla de hechos (fact table).
Incluyen una clave primaria, de preferencia numérica y auto
incrementado.
- Ejemplo:
El modelo físico puede ser de dos tipos Star Schema (Modelo en estrella) o tipo Snowflake
(Copo de nieve).
- Características
Posee los mejores tiempos de respuesta.
Su diseño es fácilmente modificable.
- Inconvenientes
- Características
Posee mayor complejidad en su estructura.
Hace una mejor utilización del espacio.
Las tablas de dimensiones están normalizadas, por lo que requiere menos
esfuerzo de diseño.
Puede desarrollar clases de jerarquías fuera de las tablas de dimensiones,
que permiten realizar análisis de lo general a lo detallado y viceversa.
- Inconvenientes
5.1 Entrevistas
Template de entrevistas:
- Una vez que sabemos cuáles son las dimensiones y las tablas de hechos que
tendrá nuestro cubo, debemos crear una matriz o tabla mostrando
las Medidas en las filas y las Dimensiones en las columnas, y marcando la
intersección existente entre ellas con una ‘X’.
- Es aquí que surge la matriz de Bus, que es una excelente y casi indispensable
herramienta que nos ayuda a representar nuestro diseño del cubo.
- Las matrices de Bus son en general como se muestran a continuación:
Imaginemos que tenemos un cliente que es una tienda, y que ellos desean
crear un Datawarehouse para sus ventas.
Esta tienda tiene sucursales en todo el país, y también tiene
un Site o página Web por donde los clientes pueden hacer sus compras
que recibirán en la dirección que deseen pagando un monto extra por
transporte y entrega a domicilio.
En nuestro Datawarehouse tenemos que reflejar en este caso en
una Fact de ventas, cuándo se hace una venta, a qué cliente se le realizó
la venta, en qué fecha, cuál fue el articulo comprado, cuántos compró y
cuál fue el vendedor que realizó la venta (en caso que aplique), teniendo
por separado las ventas por internet de las ventas en las tiendas.
En este caso, tendríamos las medidas: “Ventas tienda” y “Ventas
Internet” para la Fact de ventas.
Y las dimensiones: fecha, cliente, vendedor y producto.
Como podemos notar, en este caso la medida “Ventas tienda” tendrá un
vendedor asociado, pero en el caso de la medida “Ventas Internet”, el
vendedor NO existe.
- Como podemos ver, la matriz de Bus en este caso nos sirvió para mostrar de
una manera fácil y sencilla cuáles son nuestras dimensiones, cuáles son
nuestras medidas y cuáles son las relaciones entre ellas.
- Por tanto, adoptar la matriz Bus como una herramienta para definir el diseño
y así poder mostrarlo al usuario de negocio, que agradecerá por simplificarle
el entendimiento del modelo del Datawarehouse para su negocio.
- Para dar inicio al desarrollo del modelo dimensional, se inicia con un diagrama
que nos muestra a través de líneas, círculos y rectángulos la representación
del modelo dimensional, en la parte izquierda encontramos los indicadores
que se caracterizan por ser métricas, los cuales se relaciona con las
dimensiones mostradas en la derecha y sus respectivos niveles.
- Ejemplo: Start Net expedientes
5.4 Jerarquías
- Una base de datos con “modelo dimensional” es una base de datos que tiene
una estructura adecuada para resolver consultas analíticas.
- Se trata de modelos sencillos que aseguran unos buenos tiempos de
respuesta, y que se corresponden bastante con el lenguaje de negocio de los
usuarios
- La implementación de una base de datos relacional, construirás el “modelo
dimensional” utilizando una estructura en estrella, o una estructura en copo
de nieve.
- Por ejemplo:
En un modelo estrella el diagrama de este modelo parece una estrella
con una tabla central alrededor de la cual se muestran un conjunto de
otras tablas.
La tabla central es la única tabla del esquema con varias uniones que la
conectan con todas las demás tablas.
Esta tabla central se denomina la tabla de hechos y las demás tablas se
denominan tablas de dimensiones.
Ejemplo:
a) SnapShot
b) Transaccional
c) Incremental
d) Ventajas
• Optimiza T° Respuesta
• Simplifica modelo para usuario final
e) Desventajas
a) Dimensión de roles
b) Súper dimensión
- Sobrescribir el valor
- Menos usada