Sei sulla pagina 1di 5

Análisis Multidimensional OLAP

Los datos empresariales, son de hecho, multidimensionales. Desde la perspectiva de análisis: los usuarios
empresariales desean extraer los datos adecuados de manera intuitiva con una inversión de tiempo mínima. Una
vez que se extraen los datos correctos del Almacén de Datos, se analizan, sintetizan y consolidan en información,
para después emplear esa información a fin de tomar mejores decisiones.

Análisis Multidimensional
Los usuarios empresariales necesitan el acceso interactivo a grandes volúmenes de datos guardados en bases de
datos relacionales, cuyos intentos son a menudo frustrados por pobres tiempos de respuesta y falta de
flexibilidad ofrecida por esta tecnología y su lenguaje de consulta SQL. La tecnología multidimensional está
diseñada para permitir el almacenamiento eficaz y la conveniente recuperación de grandes volúmenes de datos,
que pueden ser analizados desde diferentes perspectivas llamadas dimensiones. Tienen la habilidad de responder
a preguntas en una forma oportuna.

Base de Datos Relacional y Hojas de Cálculo


Una base de datos relacional, es una estructura en la cual todos los datos visibles al usuario están organizados
estrictamente como tablas de valores y las operaciones de la base de datos se aplican sobre estas. (Data
Definition Language - DDL) y (Data Manipulation Language - DML).
Una hoja de cálculo, es un software de aplicación utilizado normalmente por usuarios empresariales en tareas
financieras tales como: balances, presupuesto o previsiones, y otras. Incluyen funciones incorporadas que realizan
operaciones estándar para facilitar los cálculos.

Base de Datos Multidimensional


A diferencia de las bases de datos relacionales, las bases de datos multidimensionales están compuestas por
dimensiones que son atributos estructurales de un cubo, organizadas en jerarquías de categorías que describen
un conjunto de miembros similares sobre los cuales el usuario empresarial basa su análisis.

Las bases de datos relacionales están formadas por un conjunto de registros. Cada registro contiene información
organizada en campos. En la figura se muestra un ejemplo de base de datos relacional. En este caso se dice que la
tabla relacional está basada en un formato de filas y columnas, donde las columnas representan campos, y las
filas, registros. En esencia esta tabla tiene una sola dimensión.

Código Nombre Empleado Dirección Teléfono


001 Carlos Falcón Cdla. Alamos 032954-125

En la figura se tienen valores por concepto de sueldos por Oficina. En cada Oficina existen tres departamentos:
(Proyectos, Asistencia Técnica, Sistemas y Comunicaciones) que se encuentran en tres cantones (Riobamba,
Guamote, Quero). A continuación se muestra la tabla relacional:

Departamentos Oficinas Sueldos


Proyectos Riobamba 2000
Proyectos Guamote 1500
Proyectos Quero 950
Asistencia Técnica Riobamba 1500
Asistencia Técnica Guamote 1200
Asistencia Técnica Quero 750
Sistemas y Comunicaciones Riobamba 2500
Sistemas y Comunicaciones Guamote 1200
Sistemas y Comunicaciones Quero 900
Una forma óptima para representar esta tabla es por medio de una matriz de dos dimensiones

Departamentos Riobamba Guamote Quero


Proyectos 2000 1500 950
Asistencia Técnica 1500 1200 750
Sistemas y Comunicaciones 2500 1200 900

De esta forma se pueden realizar preguntas como ¿Cuánto se pago por concepto de Sueldos a los empleados del
departamento de Proyectos en Riobamba?. En casos simples no es necesario colocar la información en bases de
datos multidimensionales, pero si nos hacemos preguntas como: ¿Cuál fue el total por concepto de Sueldos a
empleados de Riobamba y Guamote?

Consolidación
Lo que la mayoría de usuarios necesitan de sus aplicaciones, es un tiempo de respuesta consistentemente rápido,
sin tener en cuenta el tipo de consulta. Esto depende de la cantidad de valores que deban ser calculados en el
menor tiempo posible (on the fly). Así que la única manera de conseguir el tiempo de respuesta consistentemente
rápido es preagregar (o “consolidar”) todos los subtotales lógicos y totales. En la figura 2.4 se muestra un ejemplo
de consolidación.
Riobamba Guamote Quero Total Oficinas
Proyectos 2000 1500 950 4450
Asistencia Técnica 1500 1200 750 3450
Sistemas y Comunicaciones 2500 1200 900 4600
Total Departamentos 6000 3900 2600 12500

Con todos los totales agrupados, podemos responder cualquier pregunta que involucra totales accediendo sólo a
un único registro. Las celdas que contienen en su interior los datos originales son llamadas inputs. Los totales
calculados son llamados outputs.

Variables Multidimensionales
Las variables multidimensionales, son las medidas numéricas similares a los campos valor en una base de datos
relacional como: “Sueldos”, “Incentivos”, “Anticipo a Sueldo” “Impuestos” y rubros afines a Sueldos y Salarios en
una base de datos de Rol de Pagos.

Las variables pueden definirse también como: relaciones matemáticas a otras variables, estas relaciones pueden
incluir operaciones aritméticas, promedios calculados, relaciones atrasadas en el tiempo, e incluso ecuaciones
simultáneas.

Un concepto más que debe introducirse es el de Variable Deducida. Una Variable Deducida desde el punto de
vista de usuario, parece ser una variable en la base de datos pero realmente esta se calcula en tiempo de
ejecución. Por ejemplo, una base de datos podría contener las variables para “Ingresos Totales” y “Egresos
Totales” del ejemplo anterior.

Jerarquías Múltiples dentro de las Dimensiones


El factor más importante al determinar cuántas dimensiones necesitará para una base de datos particular, es la
existencia de jerarquías múltiples dentro de las dimensiones. Si el servidor de base de datos multidimensional
soporta jerarquías múltiples dentro de una dimensión, todas estas relaciones pueden expresarse con una
dimensión.
Dimensión de Tiempo
Las respuestas a muchas preguntas requieren análisis de datos sobre períodos de tiempo. La tecnología de base
de datos relacional, no tiene ninguna provisión especial para ocuparse eficazmente del tiempo. Las bases de
datos multidimensionales bien diseñadas, sin embargo, tienen una forma especial para ocuparse de este tipo de
dimensión.

Formas de Representación
Una forma gráfica y útil de representar las variables dimensionales es el
Cubo, aunque se trabaje con un número de dimensiones mayor que tres.
Un cubo en geometría se define como: “Poliedro regular formado por seis CUBO SUELDOS
caras cuadradas”. Un poliedro es una porción de espacio limitada por
polígonos planos.
Sus elementos característicos son las caras, las aristas y los vértices.

Oficinas
 Las caras son los polígonos que la limitan. De
pa
 Las aristas son los lados de las caras, y limitan dos caras contiguas. rta os
me od
nt ri
 Los vértices son los de las caras. En cada vértice de un poliedro os Pe
concurren tres o más caras.

Vistas de Datos Multidimensionales


Al contrario de la vista de una tabla relacional, la vista de una estructura multidimensional muestra: dimensiones,
posiciones a lo largo de las dimensiones, intersecciones y valores de celda.

Rotación
Para entender el poder de una vista de una estructura multidimensional frente a una tabla relacional considérese
una estructura bidimensional, Sueldos: Departamentos por Región.

Rotar 90 Grados
DEPARTAMENTOS

Proy 6 5 4 Riobamba 6 3 4
REGIÓN

Asit Téc 3 5 5 Guamote 5 5 3

Sist & Com 4 3 2 Quero 4 5 2


Riobamba Guamote Quero Proy Asit Téc Sist & Com

REGIÓN DEPARTAMENTOS

La vista gira 90 grados en el sentido de las agujas del reloj sin que haya reestructuración de los datos

En el caso de que nuestra base de datos multidimensional tuviera tres dimensiones Departamentos, Región, Tipos
de Rol, entonces se tendría seis posibles vistas que pueden ser de interés para el usuario:

1. Departamentos por Región (con Tipo de Rol en el fondo)


2. Región por Departamentos (con Tipo de Rol en el fondo)
3. Región por el Tipo de Rol (con Departamentos en el fondo)
4. Tipo de Rol por Región (con Departamentos en el fondo)
5. Tipo de Rol por Departamentos (con Región en el fondo)
6. Departamentos por Tipo de Rol (con Región en el fondo)
DEPARTAMENTOS

REGIÓN

REGIÓN
REGIÓN DEPARTAMENTOS TIPO DE ROL

TIPO DE ROL TIPO DE ROL DEPARTAMENTOS

Vista 1 Vista 2 Vista 3

DEPARTAMENTOS
TIPO DE ROL

TIPO DE ROL

REGIÓN DEPARTAMENTOS TIPO DE ROL

DEPARTAMENTOS REGIÓN REGIÓN

Vista 4 Vista 5 Vista 6

Rebanado
Una base de datos multidimensional bien diseñada permite al usuario empresarial ir rápidamente a la vista exacta
de los datos que requiere. A través de una operación para el rebanado, el usuario empresarial selecciona las
posiciones deseadas a lo largo de cada una de las dimensiones que intervienen en la consulta.

En la figura se ilustra como el usuario empresarial puede querer determinar el pago de Sueldos para los
empleados de los Departamentos de Proyectos, de la Región Chimborazo y compararlos con los empleados de los
Departamentos de Asistencia Técnica, de la Región Tungurahua.

Proyectos

General
DEPARTAMENTOS

Asist. Técnica
Especial
Proyectos

General Chimborazo Tungurahua


L
O
R

Asist. Técnica
Especial
E
D
PO
TI

Chimborazo Tungurahua

REGIÓN
Roll-Up y Drill Down
Como previamente se describió, los usuarios empresariales Periodos Departamentos Oficinas
necesitan a menudo varias vistas de los mismos datos (es decir,
Sueldos por Departamentos frente a Sueldos por Región), sin
embargo, las vistas son muy similares (por ejemplo, Sueldos por Riobamba
Región frente a Sueldos por Provincia). Marzo 2003

Proyectos
La tecnología de base de datos multidimensional está diseñada
especialmente para facilitar el manejo de estas relaciones naturales.
Aunque es posible crear dimensiones separadas, independientes
para Región y Provincias en el ejemplo anterior, una solución más
elegante y poderosa es definir dos agregaciones relacionadas en la
misma dimensión.

Una agregación es la Región y otra es la Provincia. Estas dos agregaciones pueden ser consideradas como parte de
la misma dimensión.
DEPARTAMENTOS

Proyectos

General
L
O
R

Asist. Técnica
Especial
E
D
PO
TI

Riobamba Guamote Ambato Quero

Chimborazo Tungurahua

REGIÓN

Para el usuario empresarial, la habilidad de definir jerarquías, le permite la manipulación y el análisis detallado de
los datos en forma rápida a lo largo de diferentes niveles dentro de todas las dimensiones. Al proceso de subir un
nivel y bajar un nivel en una jerarquía se denomina “Roll Up” y “Drill Down”, respectivamente.

Potrebbero piacerti anche