Sei sulla pagina 1di 5

Data Warehousing

Cesar Eduardo Crespo Rodrguez, Universidad Autnoma de Quito (UNAQ)

INTRODUCCION Desde que a principios de la dcada de 1980 comenzaron a desarrollarse bases de datos siguiendo el modelo relacional, la capacidad y velocidad de estos sistemas ha ido mejorando ao tras ao. La informacin almacenada en las bases de datos se orient desde un primer momento al registro de transacciones, sistemas OLTP - On Line Transaction Processing - de un modo tal que los procesos se disearon fundamentalmente para introducir informacin en los sistemas, pero no para extraerla de ellos. A medida que ha ido creciendo el volumen de informacin almacenada, ha crecido tambin la dificultad de acceder a ella de un modo sencillo y eficiente. Es el sitio donde se almacena todos los datos con la finalidad de archivamiento, anlisis de efecto y por la seguridad de los mismos. En una data warehouse las tablas que almacenan informacin se disean de una manera especial pensando en que almacenarn cantidades gigantescas de informacin. Esta informacin es almacenada de diferentes bases de datos, un Data Warehouse es un nico equipo o varios ordenadores (servidores) atados juntos para crear un sistema gigante de computadoras como se puede observar en la Fig. 1 de abajo.

Fig. 1 Como trabaja un Data Warehouse

Un Data Warehouse se vale de una base de datos relacional diseada para el acceso rpido y anlisis y no al proceso transaccional. El Data Warehouse separa la carga del anlisis y normalmente contiene datos histricos derivados de datos transaccionales. Ya que esta gran cantidad de informacin que se almacene solo nos servir de consulta por lo tanto no es necesario tenerla relacionada, ya que los datos pueden ser primarios o con formato y pueden contener diferente tipos de temas tales como los salarios, datos de recursos humanos, operativos, salarios, etc. Y as tenemos una pequea tabla de comparacin de una base de datos operacional con una Data Warehouse

Base de Datos Operacional Datos Operacionales Orientado a la aplicacin Actual Detallada Cambia continuamente

Data Warehouse Datos del negocio para Informacin Orientado al sujeto Actual + histrico Detallada + ms resumida Estable

Existen muchas definiciones para el Data Warehouse, la ms conocida fue propuesta por William Inmon - considerado el padre del Data Warehouse - en 1992: "Un DW es una coleccin de datos orientados a temas, integrados, no-voltiles y variante en el tiempo, organizados para soportar necesidades empresariales". Diferentes tipos de informacin El ingreso de datos en el data warehouse viene desde el ambiente operacional en casi todos los casos. El data warehouse es siempre un almacn de datos transformados y separados fsicamente de la aplicacin donde se encontraron los datos en el ambiente operacional. Por qu debera usted o su organizacin utilizar un Data Warehouse? Aqu tenemos algunos de los pros y los contras para utilizar este tipo de estructura de datos. El primer punto seria para que todos los empleados o el usuario final pueda generar informes con los datos, realiza un anlisis y el poder tomar alguna decisin, con lo cual le ayudara a conocer ms a cerca del medio ambiente que su negocio opera. Los Data Warehouse tambin refuerzan la coherencia de los datos y le permite comprobar una y otra vez para determinar la relevancia de la informacin. Debido a que la mayora de los Data Warehouse estn integrados, se puede extraer datos de diferentes reas de su negocio, por ejemplo, recursos humanos, finanzas, informtica, contabilidad, etc. Cabe sealar que hay algunos aspectos negativos de tener un Data Warehouse como el hecho de que consumen mucho tiempo y recursos al crearlos y mantenerlos en funcionamiento. Tambin podra tener un problema con que los sistemas actuales fueran incompatibles con l. Tambin es importante considerar los requerimientos futuros y las actualizaciones de software, que tienen que ser compatibles con los anteriores. La seguridad puede ser de gran preocupacin, si los datos son accesibles a travs de una red abierta como Internet. Usted no desea que sus datos sean vistos por su competidor o peor, hackeados y destruidos. Los elementos bsicos de un Data WareHouse

Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes tambin se le conoce como Legacy System.

rea de trfico de datos: es un rea de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data WareHouse. Servidor de presentacin: la maquina fsica objetivo en donde los datos del Data WareHouse son organizados y almacenados para queries directos por los usuarios finales, reportes y otras aplicaciones. Modelo dimensional: una disciplina especfica para el modelado de datos que es una alternativa para los modelos de entidad relacin. Procesos de negocios: un coherente grupo de actividades de negocio que hacen sentido a los usuarios del negocio del Data WareHouse. Data Mart: un subgrupo lgico del Data WareHouse completo. Data WareHouse: bsquedas fuentes de datos de la empresa. Y es la unin de todos los data marts que la constituyen. Almacenamiento operacional de datos: es el punto de integracin por los sistemas operacionales. Es el acceso al soporte de decisiones por los ejecutivos. OLAP: actividad general de bsquedas para presentacin de texto y nmeros del Data WareHouse, tambin un estilo dimensional especifico de bsquedas y presentacin de informacin y que es ejemplificada por vendedores de OLAP. ROLAP: un grupo de interfases de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional. MOLAP: un grupo de interfases de usuarios, aplicaciones y propietarios de tecnologa de bases de datos que tienen un fuerte estilo dimensional. Aplicaciones para usuarios finales: una coleccin de herramientas que hacen los queries, analizan y presentan la informacin objetivo para el soporte de las necesidades del negocio. Herramientas de acceso a datos por usuarios finales: un cliente de Data WareHouse. Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propios queries manipulando directamente las tablas relacionales y sus uniones. Modelado de aplicaciones: un sofisticado tipo de cliente de Data WareHouse con capacidades analticas que transforma o digiere las salidas del Data WareHouse. Meta Data: toda la informacin en el ambiente del Data WareHouse que no son as mismo los datos actuales.

CONCLUSIONES Data WareHouse son de una gran ayuda para poder obtener una informacin rpida, precisa y adems que se la tiene como un respaldo ya que nos permite extraerla de manera ms fcil. El almacenamiento de datos es la tecnologa lder y ms confiable usada hoy en da por las empresas para la planificacin, previsin y gestin para, por ejemplo planificacin de los recursos, la prediccin y el control financieros, etc. Despus de la evolucin del concepto de almacenamiento de datos durante los primeros aos 90 se pensaba que esta tecnologa crecer a un ritmo muy rpido, pero por desgracia es no la realidad. Mucho se ha de hacer en este campo en relacin con el diseo y la el desarrollo de almacenes de datos y mucho queda por hacer, pero una rea que requiere atencin especial por parte de la comunidad de investigacin es de datos almacn de mantenimiento.

BIBLIOGRAFIA Laudon Keneth C., Laudon Jane P. , Sistemas de Informacin Gerencial (8 ed.)

Mxico, Pearson Educacin, (2004) http://www.dwinfocenter.org/casefor.html http://datawarehouse.ittoolbox.com/ Ralph Kimball, Laua Reeves, Margy Ross, Warren ....The Data WareHouse Lifecycle Toolkit Wiley Edition

Potrebbero piacerti anche