Sei sulla pagina 1di 5

Unidad 3 Bases de Datos para el soporte de toma de decisiones

Bodegas de datos (Data Warehouse) En el contexto de la informtica un almacn de datos o bodegas de datos es una conexin de datos orientada a un determinado mbito (empresa organizacin, etc.) integrado no voltil y variable en el tiempo que ayuda a la toma de decisiones en la entidad en la que se utilizan. Se trata, sobre todo de un expediente completo de una organizacin mas all de la informacin transaccional y operacional, almacenado en una base de datos diseada para favorecer el anlisis y la divulgacin eficiente de datos (Especialmente OLAP Procesamiento analtico en lnea). El almacenamiento de datos no debe usarse con datos de uso actual. Los almacenes de datos contienen a menudo grandes cantidades de informacin que se subdividen a veces en unidades lgicas ms pequeas dependiendo del subsistema de la entidad de que proceda o para que sea necesario. Caractersticas del repositorio de datos

Orientado a temas: Los datos en la base de datos estn organizados de


manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real estn unidos entre s.

Variante en el tiempo: los cambios producidos en los datos a lo largo del


tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones:

No voltil: La informacin no se modifica ni se elimina una vez almacenado el


dato este se convierte en informacin de solo lectura y se mantiene para futuras consultas.

Integrado: La base de datos contiene los datos de todos los sistemas


operacionales de la organizacin y dichos datos deben ser consistentes. Un almacn de datos es una copia de las transacciones de datos especficamente estructurada para la consulta y el anlisis. Algunas definiciones se centran ms en los datos en s mismo, sin embrago los medios para obtener y analizar esos datos, para extraerlos transformarlos, y cargarlos as como las diferentes formas para realizar la gestin de datos son componentes esenciales de un almacn de datos.

Bodegas de datos (Data warehouse). Continuacin Funcin de un almacn de datos El almacn de datos da respuesta a las necesidades de usuarios expertos, utilizando Sistemas de Soporte a Decisiones (DSS), Sistemas de informacin ejecutiva (EIS) o herramientas para hacer consultas o informes. Los usuarios finales pueden hacer fcilmente consultas sobre sus almacenes de datos sin tocar o afectar la operacin del sistema. En el funcionamiento de un almacn de los datos son muy importantes las siguientes ideas:

Integracin de los datos provenientes de bases de datos distribuidas por las diferentes unidades de la organizacin y que con frecuencia tendrn diferentes estructuras (fuentes heterogneas). Se debe facilitar una descripcin global y un anlisis comprensivo de toda la organizacin en el almacn de datos. Separacin de los datos usados en operaciones diarias de los datos usados en el almacn de datos para los propsitos de divulgacin, de ayuda en la toma de decisiones, para el anlisis y para operaciones de control.

Peridicamente, se importan datos al almacn de datos de los distintos sistemas de planeamiento de recursos de la entidad (ERP) y de otros sistemas de software relacionados con el negocio para la transformacin posterior. Es prctica comn normalizar los datos antes de combinarlos en el almacn de datos mediante herramientas de extraccin, transformacin y carga (ETL). Estas herramientas leen los datos primarios (a menudo bases de datos OLTP de un negocio), realizan el proceso de transformacin al almacn de datos (filtracin, adaptacin, cambios de formato, ...) y escriben en el almacn. Fases de implantacin de un Data Warehouse Un Data Warehouse no se puede comprar, se tiene que construir. La construccin e implantacin de un Data. Warehouse es un proceso evolutivo. Metodologa propuesta por SAS Instituto: la "Rapid Warehousing Methodology". Dicha metodologa es iterativa, y est basada en el desarrollo incrementa) del proyecto de Data Warehouse dividido en cinco fases: Definicin de los objetivos Definicin de los requerimientos de informacin Diseo y modelizacin Implementacin Revisin

Definicin de los objetivos. Como en todo proyecto, un punto de especial relevancia son los objetivos del mismo, determinar qu es lo que se pretende con el proyecto, el caso de un Data Warehouse no es la excepcin.

Definicin de los requerimientos de informacin. Tal como sucede en todo tipo de proyectos, sobre todo si involucran tcnicas novedosas como son las relativas al Data Warehouse, es analizar las necesidades y hacer comprender las ventajas que este sistema puede reportar. Diseo y modelizacin. Se identificarn las fuentes de los datos (sistema operacional, fuentes externas,..) y las transformaciones necesarias para, a partir de dichas fuentes, obtener el modelo lgico de datos del Data Warehouse. Implementacin. Lleva implcitos los siguientes pasos:
Extraccin de los datos del sistema operacional y transformacin de los mismos. Carga de los datos validados en el Data Warehouse. Esta carga deber ser planificada con una periodicidad que se adaptar a las necesidades de refresco detectadas durante las fases de diseo del nuevo sistema. Explotacin del Data Warehouse mediante diversas tcnicas dependiendo del tipo de aplicacin que se de a los datos: Query & Reporting On-line analytical processing (OLAP) Executive Information System (EIS) Informacin de gestin Decision Support Systems (DSS) Visualizacin de la informacin Data Mining Minera de Datos, etc. La informacin necesaria para mantener el control sobre los datos se almacena en los metadatos tcnicos (cuando describen las caractersticas fsicas de los datos) y de negocio (cuando describen cmo se usan esos datos). Con la finalizacin de esta fase se obtendr un Data Warehouse disponible para su uso por parte de los usuarios finales y el departamento de informtica.

Revisin. La construccin del Data Warehouse no finaliza con la implantacin del mismo, sino que es una tarea iterativa en la que se trata de incrementar su alcance aprendiendo de las experiencias anteriores. Despus de implantarse, debera realizarse una revisin del Data Warehouse planteando preguntas que permitan, despus de los seis o nueve meses posteriores a su puesta en marcha, definir cules seran los aspectos a mejorar o potenciar en funcin de la utilizacin que se haga del nuevo sistema.

Componentes a tener en cuenta a la hora de construir un Data Warehouse Hardware Software de almacenamiento (SGBD) Software de extraccin y manipulacin de datos Herramientas MiddIeware,

Hardware. Un componente fundamental a la hora de poder contar con un Data Warehouse que responda a las necesidades analticas avanzadas de los usuarios, es el poder contar con una infraestructura hardware que la soporte.
Por un lado, a este tipo de sistemas suelen acceder pocos usuarios con unas necesidades muy grandes de informacin, a diferencia de los sistemas operacionales, con muchos usuarios y necesidades puntuales de informacin. Debido a la flexibilidad requerida a la hora de hacer consultas complejas e imprevistas, y al gran tamao de informacin manejada, son necesarias unas altas prestaciones de la mquina. Por otro lado, debido a que estos sistemas suelen comenzar con una funcionalidad limitada, que se va expandiendo con el tiempo, es necesario que los sistemas sean escalables para dar soporte a las necesidades crecientes de equipamiento. En este sentido, ser conveniente el optar por una arquitectura abierta, que nos permita aprovechar lo mejor de cada fabricante.

Software de almacenamiento (SGBD). Como hemos comentado, el sistema que gestione el almacenamiento de la informacin (Sistema de Gestin de Base de Datos o SGBD), es otro elemento clave en un Data Warehouse. Independientemente de que la informacin almacenada en el Data Warehouse se t pueda analizar mediante visualizacin multidimensional, el SGBD puede estar realizado utilizando tecnologa de Bases de Datos Relacionales o Multidimensionales.
Las bases de datos relacionales, se han popularizado en los sistemas operacionales, pero se han visto incapaces de enfrentarse a las necesidades de informacin de !os entornos Data Warehouse. Por ello, y puesto que, como hemos comentado, las necesidades de informacin suelen atender a consultas multidimensionales, parece que unas Bases de Datos multidimensionales, parten con ventaja.

Software de extraccin y manipulacin de datos. Estas herramientas debern proporcionar las siguientes funcionalidades:

Control de la extraccin de los datos y su automatizacin, disminuyendo el tiempo empleado en el descubrimiento de procesos no documentados, minimizando el margen de error y permitiendo mayor flexibilidad.

Acceso a diferentes tecnologas, haciendo un uso efectivo del hardware, software, datos y recursos humanos existentes. Proporcionar la gestin integrada del Data Warehouse y los Data Marts existentes, integrando la extraccin, transformacin y carga para la construccin del Data Warehouse corporativo y de los Data Marts. Uso de la arquitectura de metadatos, facilitando la definicin- de los objetos de negocio y las reglas de consolidacin. Soporte en la explotacin del Data Warehouse. entre entornos

Herramientas Middleware. Que provean conectividad diferentes, para ayudar en la gestin del Data Warehouse.

Con el uso de estas herramientas de MiddIeware, lograremos:

Maximizar los recursos ejecutando las aplicaciones en la plataforma ms adecuada. Integrar los datos y aplicaciones existentes en una plataforma distribuida. Automatizar la distribucin de datos y aplicaciones desde un sistema centralizado. Reducir trfico en la red, balanceando los niveles de cliente servidor (ms o menos datos en local, mas o menos proceso en local). Explotar las capacidades de sistemas remotos sin tener que aprender mltiples entornos operativos. Asegurar la escalabilidad del sistema-. Desarrollar aplicaciones en local y explotarlas en el servidor.

Tcnicas de explotacin de la implantacin OLAP. ROLAP, MOLAP Query & Reporting Data Mining o Minera de Datos Webhousing Executive Information System (EIS) o Informacin de gestin Decision Support Systems (DSS) Visualizacin de la informacin

Potrebbero piacerti anche