Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
datos
Es u na BD c or p or ativa , q ue s e car acte riza por
inte gr ar y de p ura r inf orma cin de una o mas
f ue ntes
d istintas ,
pa ra
lu eg o
pro ce sar la s
p er mit ie n do s u an lisis des de inf inid ad de
p er sp ect iva s y c on gr an d es ve loc ida de s de
r e s p u e sta .
Introduccin
Los DW recogen los datos de los distintos entornos transaccionales de la
compaa, los filtran y procesan para su almacenamiento, proporcionando una
plataforma slida de datos consolidados e histricos para su posterior anlisis.
BD Transaccionales
Datos Externos
Produccin
Proveedores
Ventas
Nminas
Almacenes
de
Datos
Definicin: Almacn de
datos
Segn Bill Inmon, (1996)
Un DW se define como una coleccin de datos orientada al tema,
integrada, temporal y no voltil, usada principalmente para la toma de
decisiones
Caractersticas: Almacn de
datos
Segn Bill Inmon, (1996)
Orientacin al tema:
Base de Datos
Transaccional
CURSO
...
REUNION
...
PAS
...
TIEMPO
...
ventas
VENTA
...
PROTOTIPO
...
Informacin
necesaria
PRODUCTO
...
Caractersticas: Almacn de
datos
Segn Bill Inmon, (1996)
La integracin de los datos:
Fuente de
Datos 3
HTML
Base de Datos
Transaccional 1
Fuentes
Internas
Fuentes
Externas
Base de Datos
Transaccional 2
Almacn de
Datos
Fuente de
Datos 2
Tiempo
Datos
01/2014
Datos de Enero
02/2014
Datos de Febrero
03/2014
Datos de Marzo
INSERT
UPDATE
DELETE
Almacn de Datos
READ
READ
El periodo de tiempo cubierto por un AD vara entre 2 y 10 aos.
Metadato
Almacn de datos
las
aplicaciones
Informacin actual
Detallada
Detallada + ms resumida
Cambia continuamente
Estable
Almacn de datos
corporativo
Datamart Ventas
DBMS
ERP
E
T
L
OTROS
Datamart Financiero
Aportaciones de un Almacn
de datos
Proporciona una herramienta para la toma de decisiones en cualquier rea
funcional, basndose en informacin integrada y global del negocio.
Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para
encontrar relaciones ocultas entre los datos del almacn; obteniendo un
valor aadido para el negocio de dicha informacin.
Proporciona la capacidad de aprender de los datos del pasado y de predecir
situaciones futuras en diversos escenarios.
Simplifica dentro de la empresa la implantacin de sistemas de gestin
integral de la relacin con el cliente.
Supone una optimizacin tecnolgica y econmica en entornos de Centro de
Informacin, estadstica o de generacin de informes con retornos de la
inversin espectaculares.
Funcionalidades de un Sistema
de Almacn de datos
En el funcionamiento de un almacn de datos son muy importantes las
siguientes ideas:
Integrar los datos provenientes de las diferentes reas de la organizacin y
que con frecuencia tendrn diferentes estructuras (fuentes heterogneas).
zona
tiempo
Consultas
complejos
ETL
reportes
Minera de Datos
OLTP
CARGA
ALMACN
DE DATOS
CONSULTA
HERRAMIENTAS DE
CONSULTA
- Alertas
- Agregacin/desagregacin
Exploracin de
correlaciones desconocidas
HERRAMIENTAS Y CONSULTAS DE DATOS. Son los sistemas que permiten al usuario realizar la
exploracin de datos del almacn de Datos. Bsicamente constituyen el nexo entre el depsito de
datos y los usuarios.
USUARIOS. Son aquellos que se encargan de tomar decisiones y de planificar las actividades del
negocio
2.
3.
Diagramas de diseo de un
Almacn de datos
Por
qu
construir
Almacn de datos?
Necesidades
Empresariales
Accin
Por
qu
sucediendo?
un
est
Que
est
sucediendo?
Fase: Procesamiento de la
Informacin
Fase: Aplicar la tecnologa de
la Informacin
Complejidad
Data Warehouse
Data Mart
Tcnica
Arriba - Abajo
Abajo - Arriba
Estructura
Muy complejo
Bastante simple
Metodologa
Espiral
Mtodo RDBMS
Diseo fsico
Bastante riguroso
Bastante ligero
Usuario
Proceso
Herramientas
Tradicional (ERD
DFD)
Modelo dimensional
Arquitectura y metodologa
Modelo de datos
Beneficios al desarrollar
almacn de datos
Beneficios Directos:
Permite al usuario final realizar
anlisis amplios de diferentes
maneras.
Una vista consolidada de los
datos de la organizacin.
Ms y mejor informacin
oportuna.
Mejorar la performance del
sistema.
Simplificar el acceso a los
datos.
un
Beneficios Indirectos:
Mejorar el conocimiento de la
empresa.
Ventajas competitivas.
Mejorar
los
servicios
El
proceso
de
extraccin,
transformacin y cargado de datos
(ETL)
Para comprender el concepto de almacn de datos, es importante
entender cual es el proceso de construccin del mismo, denominado
ETL (Extraccin, Transformacin y Carga), a partir de los sistemas
operaciones de una compaa.
Extraccin de
datos
Origen de dato
externo y del
negocio
Transformacin
de datos
Supuestos de
calidad
de
datos
Regla de la
limpieza
de
datos
Verificacin
de los datos
Limpieza de
los datos
mapeo
esquemas
datos
Carga de
datos
de
de
Integracin de
los datos
reglas
agregacin
datos
de
de
Agregacin de
los datos
Almacn
datos
de
Transformacin y agrupacin
de datos
Transformacin
Mes
Producto
Cantidad
11
Producto1
$100
11
Producto2
$ 70
11
Producto3
$ 56
Tabla auxiliar
Valor
Transformacin y agrupacin
de datos
Para realizar la transformacin se debe realizar los siguientes pasos:
Establecer las reglas que sern utilizadas para realizar la
transformacin.
Detectar las inconsistencias que puedan originarse al tomar los datos
desde distintas fuentes.
Planificar cuidadosamente y con detalles la transformacin de los
datos.
Transformacin y agrupacin
de datos
Convenciones diferentes en el desarrollo de aplicaciones
Transformacin y agrupacin
de datos
Convenciones diferentes en el desarrollo de aplicaciones
Transformacin y agrupacin
de datos
Convenciones diferentes en el desarrollo de aplicaciones
Transformacin y agrupacin
de datos
Convenciones diferentes en el desarrollo de aplicaciones
Factura
Fecha: 10/05/2008
Factura
Cliente: Jos
Perez
BD
Fecha: 10/05/2008
Producto:
$ 50.00
Cliente: Jos Perez
Producto: $ 50.00
ETL
Mes
Producto
Cantidad
Valor
11
Producto1
$100
11
Producto2
$ 70
11
Producto3
$ 56