Sei sulla pagina 1di 23

DATA

WAREHOUSE
Concepts & Rules

Que es Data Warehouse?


Tecnicamente Data Warehouse

es una base
de datos
corporativa que almacena datos
de diferentes fuentes con
ciertas reglas y que esta
disponible para los analisis de
negocio y la toma de decisiones
bajo
un
modelo
multidimensional.
Es un proceso y no un producto
que acompana al negocio de
acuerdo a su estrategia.

Que es Data Warehouse?


Nuestros clientes internos
deben
conceptualizarse
bajo el esquema siguiente:
Data Warehouse es el
expediente
de
nuestra
organizacin en donde se
almacenan los datos con las
reglas de negocio, bajo
estandares
y
con
la
disponibilidad
que
el
negocio demande.

Porque construir un DWH?


Sistemas no integrados

Mltiples e incompatibles estructuras de datos


Muchos puntos de entrada a los datos
Manejo de informacin histrica
Para facilitar las actividades de reporteo y anlisis de usuarios
Proveer una vista nica del negocio

La necesidad de montar un Data Warehouse nace cuando una


organizacin crece suficientemente como para tener un volumen
de datos suficientemente grande como para que acceder a los
datos sea un problema, como para comparar datos de diferentes
orgenes se a un problema.

Que es Data Warehouse?


Bill Inmon: A warehouse is a subject

oriented, integrated, time-variant


and non-volatile collection of data in
support of managements decision
making process.
Ralph Kimball: A warehouse is a

copy of transaction data specifically


structured for query and analysis.

Diferencias entre DWH y los sistemas


Transaccionales
Datos Primitivos / Operacionales

Datos Derivados / Data Warehouse

Orientados a la aplicacin

Orientados a un tema

Detallados

Sumarizados, al menos procesados y clasificados

Exacta, al momento del acceso

Representa valores a travs del tiempo

Sirve a los oficinistas, digitadores, cajeros

Sirve a los mandos medios y directivos

Puede ser actualizada

No se actualiza

Se ejecuta repetitivamente

Se ejecuta heursticamente (en demanda)

Los requerimientos para procesar se entiende a


priori

Los requerimientos para procesar se entienden a


posteriori

Accesible atmicamente

Accesible por conjuntos de datos

Orientado a la transaccin

Orientado al anlisis

No redundante

Redundante

Estructura esttica

Estructura dinmica

Pequeos volmenes de datos

Grandes volmenes de datos

Alto uso

Bajo uso

Descripcin de un Data Warehouse

Creacion de un Data Warehouse


Arquitectura
Capacidad
Integracin
Definicion y Diseno de Data Marts.
Organizacin fisica.
Definicion de Fuentes.
ETL
End-User application

Y Inmon creo el DWH en 7 das..


Para
comprender
el
potencial de nuestro DWH,
lo mejor es empezar a
construirlo y dejar que los
usuarios comprendan que
es y que se puede hacer
con el. Esto quiere decir
que la mejor manera de
afrontar la creacin de un
Data Warehouse es hacerlo
por fases.

Los 7 das .
Da 1
En el primer da hay una multiplicidad de sistemas
funcionando y dando soporte a nuestro entorno
operacional. Realizando transacciones.
Da 2
El da dos se empieza a llenar el Data Warehouse. Ya hay
algunas tablas y algunas Metricas introducidas y ya
empezamos a dar servicio a algn usuario que empieza a
ver el potencial

Los 7 das .
Da 3
El tercer da la mayora del Data Warehouse ya est lleno
y con estos datos frescos y listos para ser usado su
popularidad aumenta, creciendo el nmero de usuarios
interesados en l. Los sistemas de Business Intelligence
y analticos empiezan a mirar al Data Warehouse.
Da 4
El cuarto da el Data Warehouse ya est casi lleno y la
mayora de sistemas de Business Intelligence y analticos
ya atacan al Data Warehouse. Comienza la competicin
por acceder a los recursos del Data Warehouse.

Los 7 das .
Da 5
El quinto da nacen los datamarts. La competicin entre los diferentes
departamentos de la empresa es ya muy seria y en necesario crear
Datamarts. El Data Warehouse empieza a ser demasiado grande y
demasiado congestionado. Es mejor crear datamarts con la porcin
de informacin que cada departamento necesita y que estos trabajen
con esos subconjuntos especficos para ellos y no con todo el Data
Warehouse.
Da 6
El sexto da se consolidan los datamarts. Son ms cmodos,
manejables, Todo (o casi todo) el BI y anlisis se realiza a travs de
OLAP. Los datamarts se consolidan como la interaccin estndard de
la organizacin para el consumo de datos. El Data Warehouse pasa
a ser eso, el almacen del que se sacan los datos para ser
consumidos pero no se usa prctimente para nada mas que para
eso.

Los 7 das .
Da 7 o da N
La arquitectura ya est

desarrollada al 100%. En el lado


operacional, los sistemas
origen, quedan slo las
operaciones y todas las
consultas analticas se hacen
en el Data Warehouse o los
Datamarts. Cada departamento
con necesidades analticas
tiene ya su datamart a partir del
cual trabajan y del que incluso
empiezan a sacar sus datos
derivados, como anlisis whatif, escenarios etc.

Multidimensional: La clave!
para construir un Data Warehouse, hay que grabarse en la

mente que la informacin es multidimensional.


Mtricas (tambin llamadas indicadores) son aquellos datos

que implican un valor relacionado con un Hecho de Negocio.


Son siempre valores numricos, susceptibles de ser sumados
para obtener cualquier valor agregado, y responden a la
pregunta: Cunto? Ejemplos son: Deudas a proveedores,
Venta Neta, Unidades Vendidas, Minutos de una llamada
telefnica, Nmero de Hijos
Dimensiones son aquellos datos que califican o hacen
referencia a ese Hecho de Negocio, cmo se produjo y bajo
qu circunstancias, y responden a las preguntas Quin?,
Cundo?, Dnde?, Cmo?, Qu?, etc. Nmero
de Cliente, Fecha, Cdigo de Oficina, Clave de departamento,
municipio, rango de edad, etc, son dimensiones

Multidimensional: La clave!
Qu es un Hecho de Negocio?
Es cualquier Operacin que
tenga inters para el Negocio:
Una llamada telefnica que hay
que facturar, una venta de un
artculo, un pago de recibo, un
abono en una cuentaen fin
cualquier cosa que tenga reflejo
contable en una compaa, y que
sea relevante para el negocio. Y
casi siempre un Hecho de
Negocio tiene pocas mtricas,
y muchas dimensiones

Ejemplo Metricas/Dimensiones

Ejemplo Metricas/Dimensiones
En esta factura, los hechos de negocio son las lneas

individuales de venta, cada uno de los artculos que han


sido adquiridos en esa compra.
Para cada artculo, existen dos indicadores: el Nmero de

Artculos Adquiridos y el Precio de Venta al Pblico de


dichos artculos.
Todo lo dems, son dimensiones.: El cdigo del
vendedor que es normalmente la Seorita que nos atiende
en Caja; El tipo de terminal o numero de caja; El Centro
Comercial en que se produjo la Operacin ;cdigo de
empresa; cdigo de tienda; cdigo de Operacin ;
La Fecha y Hora en que se produjo la Operacin, La Forma
de Pago (en este caso En Efectivo; si hubiera sido con
tarjeta de crdito, aparecera su nmero, y la indicacin con
tarjeta de crdito de dbito, etc.

Como se representan las metricas y


dimensiones?
Mediante una representacin en Estrella (Star Schema, en
ingls) o, mejor an, con una representacin en Copo de
Nieve (Snowflake Schema). en el modelo en estrella las
dimensiones son de nicamente un nivel, mientras que en el
modelo en Copo de Nieve, las dimensiones pueden tener
jerarquas por ejemplo, un ao tiene la buena costumbre de
dividirse en doce meses, que a su vez se dividen en das, estos
en horas, stas en minutos, etc. Si se mantiene esa jerarqua,
es posible comparar las ventas de los cinco primeros das de
febrero de los ltimos tres aos, o las de los ltimos sbados de
junio, por franjas horarias, o las de ciertas secciones de
Alimentacin, por medio de pago y muchas ms que se les
ocurrirn a los responsables del negocio.

Como se representan las metricas y


dimensiones?

Data Marts
Los Data marts son subconjuntos de datos de un data
warehouse para reas especificas.
Entre las caractersticas de un data mart destacan:
Usuarios limitados.
rea especifica.
Tiene un propsito especifico.
Tiene una funcin de apoyo.

Cubos
es una base de datos multidimensional.
Qu es una dimensin?

Es aquello por lo que podemos desglosar

un indicador o mtrica.
Algunos ejemplos de dimensiones pudieran ser:
tienda, departamento, producto, linea, bodega, etc.

Beneficios
Los Procesos de Toma de Decisiones pueden ser mejorados

mediante la disponibilidad de informacin


Procesos y datos de los sistemas operacionales, as como los
datos en el Data Warehouse, son usados y examinados por
tanto pueden quedar expuestos posibles defectos en
aplicaciones actuales, siendo posible mejorar la calidad de
nuevas aplicaciones
La gente tiene mayor confianza en las decisiones
empresariales
La informacin compartida conduce a un lenguaje comn,
conocimiento comn, y mejoramiento de la comunicacin en la
empresa.
Visibilidad, accesibilidad, y conocimiento de los datos producen
mayor confianza en los sistemas operacionales.

Ejemplo

Potrebbero piacerti anche