Sei sulla pagina 1di 7

Universidad Politcnica de Tlaxcala

Ingeniera en Tecnologas de la Informacin

DISEO DE BASE DE DATOS

Maestra: Candy Atonal Nolasco

Presentan: Ma. Isabel Gutirrez Cervantes y Adrin Polvo Funes

Tema: Almacn de datos

Las bases de datos tradicionales equilibran el requisito de acceso a datos con la necesidad de asegurar
la integridad de los mismos, los vendedores de software y el personal de mantenimiento de sistemas
han comenzado a disear sistemas para realizar estas funciones. El mercado de almacenes de datos ha
sufrido un rpido crecimiento desde mediados de los aos noventa. Dado que se han creado
almacenes de datos para satisfacer las necesidades particulares de las empresas, no existe una sola
definicin cannica del trmino almacn de datos.

Un Almacn de Datos (o Data Warehouse) es una gran coleccin de datos que recoge informacin de
mltiples sistemas fuentes u operacionales dispersos, y cuya actividad se centra en la Toma de
Decisiones -es decir, en el anlisis de la informacin- en vez de en su captura. Una vez reunidos los
datos de los sistemas fuentes se guardan durante mucho tiempo, lo que permite el acceso a datos
histricos; as los almacenes de datos proporcionan al usuario una interfaz consolidada nica para los
datos, lo que hace ms fcil escribir las consultas para la toma de decisiones.

Caractersticas del Almacn de Datos

Organizado en torno a temas. La informacin se clasifica en base a los aspectos que son de
inters para la empresa.
Integrado. Es el aspecto ms importante. La integracin de datos consiste en convenciones de
nombres, codificaciones consistentes, medida uniforme de variables, etc.
Dependiente del tiempo. Esta dependencia aparece de tres formas:
o La informacin representa los datos sobre un horizonte largo de tiempo.
o Cada estructura clave contiene (implcita o explcitamente) un elemento de tiempo
(da, semana, mes, etc.).
o La informacin, una vez registrada correctamente, no puede ser actualizada.
Arquitectura de un sistema de almacn de datos
(Data Warehouse)
La mayor diferencia entre la arquitectura de un almacn de datos y una base de datos OLTP
estndar, conteniendo datos de los sistemas del planeamiento del recurso de la empresa
(como SAP, CRM) es que en una estructura de bodega de datos las tablas estn
denormalizadas entre variables y dimensiones.

1. Datos operacionales. Origen de datos para el componente de almacenamiento fsico del


Almacn de Datos.
2. Extraccin de datos. Seleccin sistemtica de datos operacionales usados para formar parte
del Almacn de Datos.
3. Transformacin de datos. Procesos para sumarizar y realizar cambios en los datos
operacionales.
4. Carga de datos. Insercin de datos en el Almacn.
5. Almacn. Almacenamiento fsico de datos de al arquitectura Data Warehouse.
6. Herramienta de acceso. Herramientas que proveen acceso a los datos.

El tiempo debe estar presente en todos los registros contenidos en un DW. Las bases de datos
operacionales contienen los valores actuales de los datos. Un DW no es ms que una serie de
instantneas en el tiempo tomadas peridicamente.

Los bloques funcionales se corresponden con un sistema de informacin completo que utiliza un
almacn de datos:

Nivel operacional: Contiene datos primitivos (operacionales) que estn siendo permanentemente
actualizados, usados por los sistemas operacionales tradicionales que realizan operaciones
transaccionales.
Almacn de datos: Contiene datos primitivos correspondientes a sucesivas cargas del Almacn de
Datos y algunos datos derivados. Los datos derivados son datos generados a partir de los datos
primitivos al aplicarles algn tipo de procesamiento (resmenes).
Nivel departamental (Data Mart): Contiene casi exclusivamente datos derivados. Cada
departamento de la empresa determina su nivel departamental con informacin de inters a
dicho nivel. Va a ser el blanco de salida sobre el cual los datos en el almacn son organizados y
almacenados para las consultas directas por los usuarios finales, los desarrolladores de reportes y
otras aplicaciones.
Nivel individual: Contiene pocos datos, resultado de aplicar heursticas, procesos estadsticos, etc.,
a los datos contenidos en el nivel anterior. El nivel individual es el objetivo final de un Almacn de
Datos. Desde este nivel acceder el usuario final y se podrn plantear diferentes hiptesis, as
como navegar a travs de los datos contenidos en el Almacn de Datos.

Un almacn de datos debe entregar la informacin correcta a la gente indicada en el momento


adecuado en el formato correcto. El almacn de datos da respuesta a las necesidades
de usuarios conocedores, utilizando sistemas de ayuda en la decisin (DSS), Sistemas de Informacin

Ejecutiva (EIS) o herramientas para hacer consulta o informes. Los usuarios finales fcilmente pueden
hacer consultas sobre sus almacenes de datos sin tocar o afectar la operacin del sistema.
Los almacenes de datos existen para facilitar las consultas complejas, que involucran a gran cantidad
de datos y que son con frecuencia ad hoc. Por lo tanto, deben proporcionar un soporte de consulta
mucho mayor y ms eficaz que el exigido por las bases de datos transaccionales. El componente de
acceso de los almacenes de datos soporta una funcionalidad de hoja de clculo extendida, un
procesamiento de consultas eficiente, consultas estructuradas, consultas ad hoc y minera de datos. La
funcionalidad de hoja de clculo extendida incluye un soporte para lo ms novedoso en aplicaciones
de hojas de clculo

Metadata
Uno de los componentes ms importantes de la arquitectura de un DW es el Metadata. Es definido
comnmente como: "datos acerca de los datos", en el sentido de que se trata de datos que describen
cul es la estructura de los datos y cmo se relacionan.
El Metadata documenta exactamente, entre otras cosas, qu tablas existen para esa aplicacin, qu
columnas poseen cada una de las tablas y qu tipo de datos se pueden almacenar. Los datos son de
inters para el usuario final, el Metadata es de inters para los programas que tienen que manejar
estos datos.
Error al crear miniatura: Falta archivo
Sin embargo, el rol que cumple el Metadata en un ambiente de DW es muy diferente al rol que
cumple en los ambientes operacionales. En un ambiente de DW el Metadata juega un rol
fundamental.

Middleware
La funcin del Middleware es la de asegurar la conectividad entre todos los componentes de
la arquitecturade un DW. El Middleware puede verse como capa API, en base a la cual los
programadores pueden desarrollar aplicaciones que trabajen en diferentes ambientes sin preocuparse
de los protocolos de red ycomunicaciones en que se corrern. De esta manera se ofrece una mejor
relacin costo/rendimiento que pasa por el desarrollo de aplicaciones ms complejas, en menos
tiempo.

API
Application Programmer Interface (Interfaz de Programacin de Aplicacin). Lenguaje y formato de
mensaje utilizados por un programa para activar e interactuar con las funciones de otro programa o
de un equipo fsico. middleware Asegura la conectividad entre todos los componentes de una
infraestructura informtica. Es la estructura para enlazar todas las aplicaciones en forma integrada.

Mecanismos de Extraccin
Otro de los componentes de la arquitectura de un DW son los sistemas OLAP. Estos tipos de sistemas
estn orientados a la realizacin de anlisis estratgicos de la informacin contenida en un DW de una
manera ad-hoc. Los anlisis estratgicos requieren de una visin dinmica y multidimensional de la
informacin diferente a la que se encuentra en los sistemas OLTP.
Este tipo de anlisis est orientado a procesar grandes volmenes de datos de forma que se puede
medir la evolucin del negocio a travs del tiempo, mediante la confeccin de comparaciones, el
estudio de indicadores, desviaciones, etc. Esto requiere la posibilidad de realizar anlisis Top Down, es
decir, que estos sistemas deben poseer el dinamismo necesario para permitir la reformulacin de la
consulta realizada de acuerdo al anlisis de los resultados obtenidos en una primera instancia.
Mecanismos de Carga
Existen dos formas bsicas de desarrollar esta tarea:
Acumulacin Simple. La acumulacin simple es, sin duda, la ms sencilla y comn, y consiste en
realizar una sumarizacin o resumen de todas las transacciones comprendidas en el perodo de
tiempo seleccionado y transportar el resultado como una nica transaccin hacia el DW.
Rolling. El proceso de Rolling por su parte, se aplica en los casos en que se opta por mantener varios
niveles de granularidad. Para ello se almacena informacin resumida a distintos niveles,
correspondientes a distintas agrupaciones de la unidad de tiempo.

EJEMPLO

REFERENCIAS
ETL-Tools.Info (2006)Almacn de datos consultado el 6 de marzo de 2015 en

http://etl-tools.info/es/bi/almacendedatos_arquitectura.htm
Roberto H.(2003) Almacenes de datos (Datawarehouse) consultado el 6 de marzo de 2015 en

http://www2.rhernando.net/modules/tutorials/doc/bd/dw.html
S/A (2015) Almacenes de datos consultado el 6 de marzo de 2015 en
http://www.ecured.cu/index.php/Almac%C3%A9n_de_Datos
Alberto A. (2006) ) Almacenes de datos consultado el 6 de marzo de 2015 en
https://books.google.es/books?id=280trvxZv3IC&pg=PT69&dq=Almacen+de+datos&h
l=es&sa=X&ei=Zbr5VLquBs73yQTolIDQDQ&ved=0CC4Q6AEwAQ#v=onepage&q=Al
macen%20de%20datos&f=false
Juan Carlos T. (2011) Almacenes de datos consultado el 6 de marzo de 2015 en
https://books.google.es/books?id=E7Aceg-o4oC&printsec=frontcover&dq=Almacen+de+datos&hl=es&sa=X&ei=Zbr5VLquBs73y
QTolIDQDQ&ved=0CCcQ6AEwAA#v=onepage&q=Almacen%20de%20datos&f=false
Liudmila P.(2006) Almacenes de datos importancia consultado el 6 de marzo de 2015 en

http://www.mailxmail.com/curso-almacenes-datos-importanciaestandar/caracteristicas-almacen-datos
Wladimiro D.(s/f) Almacenes de datos importancia consultado el 6 de marzo de 2015 en
http://informatica.uv.es/iiguia/DBD/Teoria/data-warehouses.pdf

Potrebbero piacerti anche