Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Objetivos
Describir las caractersticas de Data warehouse Identificar los componentes y funcionalidad en un ambiente Data warehouse de Oracle usando Common Warehouse Model Identificar los tres modelos de Data warehouse Listar las tareas principales de diseo de Bases de Datos Data warehouse
2
Sistema Origen
Tambin llamado Sistema Fuente o Sistema Legado Un sistema operativo de registros cuya funcin es capturar las transacciones del negocio
Un rea de almacenamiento y establecimiento de procesos que borran, transforman, combinan, quitan duplicados, tareas de preparacin de datos, archivo y preparar los datos de origen para usar en el data warehouse
Servidor de Presentacin
La mquina fsica destino en la que los datos del data warehouse se encuentra organizada y almacenada para consultas directas de los usuarios finales, los que escriben los reportes y otras aplicaciones
Modelo Dimensional
Una disciplina especfica para modelar datos que es una forma alternativa del modelo Entidad-Relacin (E/R)
Proceso de Negocio
Conjunto coherente de actividades de negocio que tienen sentido para los usuarios del negocio de nuestro data warehouse
Data Mart
Data Warehouse
Es una coleccin de datos temticos, integrada, no voltil, de tiempo variante diseada para soportar las necsidades en la admnistracin de DSS - Bill Inmon Un repositorio estructurado temtico, de tiempo variante, historial de datos usado para la devolucin de datos y toma de decisiones. Almacena datos atmicos y resumidos - Definicin Oracle
Temtico
Los Datos son categorizados y almacenados por tema de negocios en lugar de hacerlo por aplicacin
OLTP Aplicaciones
Planes de Equidad
Integrado
Cuentas Actuales
Prstamos
Aplicaciones OLTP
Data Warehouse
11
Tiempo Variante
Data warehouse contiene pedazos de datos a travs de diferentes perodos. Con estos pedazos de datos, el usuario puede ver reportes desde ahora hasta el pasado Se almacenan como una serie de instantneas, cada una representando un perodo
12
No Voltil
Carga
Lectura
13
Historial
Un Data warehouse usualmente contiene varios aos valiosos de datos. Esto es necesario para soportar las tendencias, previsin y desempeo de reportes basados en el tiempo; por ejemplo, el ao actual contra el anterior
14
Data warehouse es una facilidad para obtener informacin para responder preguntas. No es para la entrada de datos; las actualizaciones en lote son la normativa para refrescar Data warehouses
15
Dependiendo del propsito de Data warehouse, puede contener datos atmicos (Datos detallados a nivel de transaccin individual), datos resumidos o ambos
16
El trmino Almacn de Datos Operativos ha tomado muchas definiciones para ser til para el data warehouse Punto de integracin para los sistemas operativos Acceso para la toma de decisiones de los vendedores y ejecutivos
17
Procesamiento Analtico en Lnea La actividad general de consulta y presentacin de datos de texto y nmeros desde data warehouses, as como un estilo dimensional especficamente de consultas y presentaciones que es ejemplificado por un nmero de vendedores OLAP
18
OLAP (Cont)
19
20
Un conjunto de interfaces de usuario, aplicaciones y tecnologas de Bases de Datos propietarias que tienen un enfoque dimensional ms fuerte
21
ROLAP y MOLAP
22
Un conjunto de herramientas que consultan, analizan y presentan la informacin original para dar soporte a la necesidad del negocio
23
Componentes
Oracle Business Intelligence Reportes
Oracle9i
Darwin Express
Entrega de Informacin
Discoverer
Datos ERP
External data
Clickstream
24
Herramientas de Acceso
Operativo
Data Warehouse
No voltil
De tiempo variante
26
Plan Bsico
Elegir un proceso Elegir la tabla de factor de grano Elegir las dimensiones Elegir como administrar las actualizaciones
Enfocarse en el negocio, no la tecnologa Usar una metodologa de desarrollo iterativa Encontrar un campen para el proyecto e incluir los usuario finales
27
Fuente de la Base de Datos u otra rea de paso de Datos rea intermedia Objetivo Servidor de presentacin para nuevos datos warehouse o data mart
Origen
Escenario de Datos
Destino
28
Cliente
Locacin
Ventas
Proveedor
Producto
Primera carga
Refrescar
Refrescar
Refrescar
Purgar o Archivar
30
OLTP
Sub segundos a segundos DML 30 60 das
Data Warehouse
Segundos a horas Primordialmente slo de Lectura Instantneas sobre el tiempo Tema, tiempo Grande a muy grande Operacional, Interno, Externo Anlisis
31
Organizacin de los Aplicacin Datos Tamao Fuentes de Datos Actividades Pequeo a grande Operacional, Interno Procesos
Enfocarse en consultas Permitir el desarrollo incremental No ser una estructura voltil Proveer datos de historial
32
Uso de curvas
Variable Aleatorio
33
Expectativas de Usuario
Expectativas de Control Establecer objetivos alcanzables para respuesta de consulta Establecer SLAs Educar Crecimiento y uso son exponenciales
34
Implementacin de gran escala Alcanza (cobertura) todo el negocio Datos de todas las reas Desarrollo incremental Una sola fuente de datos Datos de toda la empresa sincronizados nico punto de distribucin para data marts dependientes
35
Data Warehouse
Empresa
Data Mart
Departamento
Temas
Mltiple
Fuente de Datos
Muchas
Pocas
Tiempo de Implementacin
Meses a aos
Meses
36
Datos Legales
Archivos Planos
Data Warehouse
Marketing
Datos de Operaciones
Sales
Finance
37
Datos Legales
Datos de Operaciones
Datos Externos
Datos Externos
38
Enfoques de Desarrollo
39
40
Desventajas
Alto riesgo
Toma mucho tiempo en entregar cualquier beneficio percibido por el negocio Corre el riesgo de tener que cambiar requerimientos
41
42
43
44
Iterativo
Diseo Construccin
45
Enfoque Cascada
Especificaciones Requerimientos Anlisis Implementacin
46
Enfoque Espiral
Anlisis Despliegue Prueba de unidad Requerimientos
y Especificaciones
Implementacin
Prueba de aceptacin
47
Metodologa
Asegura un acceso completo a los datos del Almacn Anima el desarrollo incremental Proporciona un enfoque gradual para un Data warehouse de la Empresa:
Arquitectura
Provee la planeacin, estructura y estandarizacin necesarias para asegurar la integracin de mltiples componentes, proyectos y procesos a travs del tiempo Establece el marco, estndares y procedimientos para el Data warehouse en un nivel empresario Instituto de Data warehouse
49
Los procesos ETL representan el factor nmero uno de xito para su proyecto Data warehouse y puede absorber hasta el 70 por ciento del tiempo gastado en un proyecto tpico de Data warehouse Revisin DM, Marzo 2001
Source
Staging Area
Target
50
Implementacin
Arquitectura Data Warehouse
Ex., Implementacin Incremental
Incremento n
51
Operacin y Soporte
Acceso a datos y reportes Refrescar los datos de warehouse Monitoreo Respuesta al cambio
52
CMW
Estndar de Oracle para metadatos warehouse Abrir el estndar para data warehouse y OLAP Permite mayor integracin de los metadatos de los productos Oracle
53
Administra Datos
Tabular
Espacial
Texto, Video
54
Almacenamiento
55
Funcionamiento Deseable
Escalabilidad Diseo Manejabilidad
Disponibilidad
Carga Extensibilidad
Datos
Acceso Arquitectura
Metadatos
Flexibilidad Integrado Administracin y revisin Accesibilidad Confiabilidad
Capacidad de planificacin y dimensionamiento
56
Procesos
Extraccin Arch. planos Transformacin/Carga Publicacin Subscripcin Federated Data Warehouse
ETT
Transformaciones
Data marts
Portal Capa(s) de Acceso B2C Modelo Empresario (Datos Atmicos) B2B Clickstream
rea(s) de Paso
Operacional
Repositorio de Metadatos
57
Definir el modelo de negocios Definir el modelo lgico Definir el modelo dimensional Definir el modelo fsico
58
Resumen
Data warehouse es un almacn de datos Existen diferentes modelos de Data warehouse Data warehouse sirve para solucionar problemas especficos de las empresas Tiene caractersticas que le permiten la flexibilidad de adaptarse a las empresas
59
60