Sei sulla pagina 1di 26

Bases De Datos Para El Soporte En La Toma De Decisiones

3.1.- Bodegas de Datos (Data Warehouse)

Conjunto de datos integrados y orientados a una materia, varan con el tiempo, soportan el proceso de toma de decisiones de la administracin y esta orientada al manejo de grandes volmenes de datos provenientes de diversas fuentes o diversos tipos.

Estos datos cubren largos perodos de tiempo lo que trae consigo que se tengan diferentes esquemas de los datos, Previo a su utilizacin se debe aplicar procesos de anlisis, seleccin y transferencia de datos seleccionados desde las fuentes.

3.1.1.- Objetivo Bodegas de Datos


Definicin de Bill Inmon

Orientado a temas.- Los datos estn organizados de manera que todos los elementos queden unidos entre s. Variante en el tiempo.- Los cambios producidos a lo largo del tiempo quedan registrados para que los informes puedan reflejar esas variaciones. No voltil.- La informacin no se modifica ni se elimina, una vez almacenado se convierte en slo lectura, y se mantiene para futuras consultas.

Integrado.- Contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes. Inmon defiende una metodologa descendente (Modelo top-down) al disear un almacn de datos, se considerarn mejor todos los datos corporativos. En esta metodologa los Data marts se crearn despus de haber terminado el data warehouse completo de la organizacin.

Definicin de Ralph Kimball


Una copia de las transacciones especficamente estructurada para la consulta y el anlisis. Determin que un data warehouse no era ms que: la unin de todos los Data marts de una entidad. Defiende por tanto una metodologa ascendente (Modelo bottom-up(las partes individuales se disean con detalle y luego se enlazan para formar componentes ms grandes, que a su vez se enlazan hasta que se forma el sistema completo.)) a la hora de disear un almacn de datos.

Es una coleccin de datos orientada a un determinado mbito (empresa, organizacin, etc.), integrado, no voltil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza. Se trata, de un expediente completo de una organizacin, ms all de la informacin transaccional y operacional, almacenado en una base de datos diseada para favorecer el anlisis y la divulgacin eficiente de datos.

Que es un Data WareHouse?

Es un repositorio de datos de muy fcil acceso, alimentado de numerosas fuentes, transformadas en grupos de informacin sobre temas especficos de negocios, para permitir nuevas consultas, anlisis, reporteador y decisiones.

Objetivo

Su propsito es soportar la toma de decisiones en un negocio (no las operaciones del negocio). Data marts son subconjuntos de datos de un data warehouse para reas especificas.

Entre las caractersticas de un data mart destacan:


Usuarios limitados. rea especifica. Tiene un propsito especifico. Tiene una funcin de apoyo.

3.1.2 Funcionamiento Data warehouse


Almacn o contenedor de datos que son necesarios o tiles para una organizacin. Debe entregar la informacin correcta a la gente indicada en el momento ptimo y en el formato adecuado. El almacn de datos da respuesta a las necesidades de usuarios expertos, utilizando Sistemas de Soporte a Decisiones (DSS), Sistemas de informacin ejecutiva (EIS) o herramientas para hacer consultas o informes.

En el funcionamiento de un almacn de los datos son muy importantes las siguientes ideas: Integracin de los datos provenientes de bases de datos distribuidas por las diferentes unidades de la organizacin y que con frecuencia tendrn diferentes estructuras (fuentes heterogneas). Separacin de los datos usados en operaciones diarias en el almacn de datos para los propsitos de divulgacin, ayuda en la toma de decisiones, para el anlisis y para operaciones de control. Ambos tipos de datos no deben coincidir en la misma base de datos, obedecen a objetivos muy distintos y podran entorpecerse entre s.

3.1.3 Consideraciones Diseo Data warehouse

Al construir un Data Warehouse se necesitan herramientas para ayudar a la migracin y a la transformacin de los datos hacia el almacn. Ya construido, se requieren medios para manejar grandes volmenes de informacin. Se disea su arquitectura dependiendo de la estructura interna de los datos del almacn y especialmente del tipo de consultas a realizar.

Con este criterio los datos deben ser repartidos entre numerosos data marts. Para abordar un proyecto de data warehouse es necesario hacer un estudio de algunos temas generales de la organizacin o empresa, los cuales se describen a continuacin:

Situacin actual de partida.- Cualquier solucin propuesta de data warehouse debe estar muy orientada por las necesidades del negocio, debe ser compatible con la arquitectura tcnica existente y planeada de la compaa. Tipo y caractersticas del negocio.Tener el conocimiento exacto sobre el tipo de negocios de la organizacin y el soporte que representa la informacin dentro de todo su proceso de toma de decisiones.

Entorno tcnico.- Incluir el hardware (mainframes, servidores, redes,...) as como aplicaciones y herramientas. Se dar nfasis a los Sistemas de Soporte a Decisiones (DSS), si existen en la actualidad, cmo operan, etc. Expectativas de los usuarios.- Es una forma de vida de las organizaciones y como tal, tiene que contar con el apoyo de todos los usuarios y su convencimiento sobre su bondad.

Etapas de desarrollo.- Con el conocimiento previo, ya se entra en el desarrollo de un modelo conceptual para la construccin del data warehouse. Prototipo.- Esfuerzo designado a simular tanto como sea posible el producto final que ser entregado a los usuarios.

Piloto.- Es el primero (o cada uno de los primeros) resultados generados de forma iterativa que se harn para llegar a la construccin del producto final deseado. Prueba del concepto tecnolgico.- Es un paso opcional que determina si la arquitectura especificada del data warehouse funcionar finalmente como se espera.

3.1.4 Herramientas para extraer transformar y cargar fuentes de datos


Funciones ETL (extraccin, transformacin y carga) Implican las siguientes operaciones: Extraccin.- Accin de obtener la informacin deseada a partir de los datos almacenados en fuentes externas.

Transformacin.- Cualquier operacin realizada sobre los datos para que puedan ser cargados en el data warehouse o se puedan migrar de ste a otra base de datos.
Carga.- Consiste en almacenar los datos en la base de datos final, por ejemplo el data warehouse objetivo normal.

3.1.4.1 Elementos que integran un almacn de datos

Metadatos "datos acerca de los datos", documenta, entre otras cosas, qu tablas existen, qu columnas posee cada una de las tablas y qu tipo de datos se pueden almacenar. Su funcin es recoger todas las definiciones de la organizacin y el concepto de los datos en el almacn de datos concerniente a: *Tablas , *Columnas de tablas , *Relaciones entre tablas , *Jerarquas y Dimensiones de datos y *Entidades y Relaciones

Middleware ofrece servicios u operaciones que hacen posible el funcionamiento de aplicaciones distribuidas sobre plataformas heterogneas que se sita entre las capas de aplicaciones y las capas inferiores (sistema operativo y red). Su funcion es asegurar la conectividad entre todos los componentes de la arquitectura de un almacn de datos. Funciones ETL.

3.1.5 Ventajas e inconvenientes de los almacenes de datos


Ventajas

Ms fcil el acceso a una gran variedad de datos a los usuarios finales. Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisin tales como informes de tendencia', ejemplo: obtener los tems con la mayora de las ventas en un rea en particular dentro de los ltimos dos aos; informes de excepcin, informes que muestran los resultados reales frente a los objetivos planteados a priori.

Pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestin de relaciones con clientes.

Inconvenientes

A lo largo de su vida pueden suponer altos costos. El almacn de datos no suele ser esttico. Los costos de mantenimiento son elevados. A veces, ante una peticin de informacin estos devuelven una informacin subptima, que tambin supone una perdida para la organizacin.

Se pueden quedar obsoletos relativamente pronto. Existe una delgada lnea entre los almacenes de datos y sistemas operativos. Hay que determinar qu funcionalidades de estos se pueden aprovechar y cules se deben implementar, resultara costoso implementar operaciones no necesarias o dejar de implementar alguna que s vaya a necesitarse.

Potrebbero piacerti anche