Sei sulla pagina 1di 20

Data WareHouse

Que es un DataWareHouse?
Es un repositorio de datos de muy fcil acceso, alimentado de numerosas fuentes, transformadas en grupos de informacin sobre temas especficos de negocios, para permitir nuevas consultas, anlisis, reporteador y decisiones.

PROYECTO DATA WAREHOUSING

Analisys services Reporting services

SQL Server Integratin services Analisys services

Proyecto Data WareHousing

Data WareHouse
Los objetivos fundamentales de un Data WareHouse son:

Hace que la informacin de la organizacin sea accesible: los contenidos del Data WareHouse son entendibles y navegables, y el acceso a ellos son caracterizados por el rpido desempeo. Hacer que la informacin de la organizacin sea consistente: la informacin de una parte de la organizacin puede hacerse coincidir con la informacin de la otra parte de la organizacin. Si dos medidas de la organizacin tienen el mismo nombre, entonces deben significar la misma cosa. Y a la inversa, si dos medidas no significan la misma cosa, entonces son etiquetados diferentes. Informacin consistente significa, informacin de alta calidad. Significa que toda la informacin es contabilizada y completada.

Proyecto Data WareHousing

Data WareHouse

Es informacin adaptable y elstica: el Data WareHouse esta diseado para cambios continuos. Cuando se le hacen nuevas preguntas al Data WareHouse, los datos existentes y las tecnologas no cambian ni se corrompen. Cuando se agregan datos nuevos al Data WareHouse, los datos existentes y las tecnologas tampoco cambian ni se corrompen.

Es la fundacin de la toma de decisiones: el Data WareHouse tiene los datos correctos para soportar la toma de decisiones. Solo hay una salida verdadera del Data WareHouse: las decisiones que son hechas despus de que el Data WareHouse haya presentado las evidencias. La original etiqueta que preside el Data WareHouse sigue siendo la mejor descripcin de lo que queremos construir: un sistema de soporte a las decisiones.

Proyecto Data WareHousing

Data WareHouse
Los procesos bsicos de un Data WareHouse (ETL)

Extraccin: este es el primer paso de obtener la informacin hacia el ambiente del Data WareHouse. Transformacin: una vez que la informacin es extrada hacia el rea de trafico de datos, hay posibles paso de transformacin como; limpieza de la informacin, tirar la basura que no nos sirve, seleccionar nicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, hacindolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensin. Carga: al final del proceso de transformacin, los datos estn en forma para ser cargados.

Proyecto Data WareHousing

SQL Server

Proyecto Data WareHousing

Integratin Services

Estructura de Data WareHousing SQL Server 2008

En esta parte de la pantalla vemos la estructura de una BD ordinaria , en la cual vemos un solo servidor, diferentes Bases de datos y tablas de informacin.

Estructura de Data WareHousing SQL Server 2008

Una base de datos esta conformada por Tablas, Vistas y en la cual podemos tambin programar eventos mediante el lenguaje Transact SQL que son Consultas o Querys a las diferentes tablas y Bases de datos que puedan existir en uno o varios servidores.

Estructura de Data WareHousing SQL Server 2008

Una base de datos esta conformada por Tablas, Vistas y en la cual podemos tambin programar eventos mediante el lenguaje Transact SQL que son Consultas o Querys a las diferentes tablas y Bases de datos que puedan existir en uno o varios servidores, as como tambin podemos programas Jobs o Tareas para que estas se ejecuten en ciertas horas y das.

Estructura de Data WareHousing Transact SQL

En una consulta SQL podemos realizar varios procesos a una BD por ejemplo, insert, update, droptable, delete, select, createview, createtable, truncate, etc. y estos combinados en una sola consulta, a esto se le llama transformacin o tratamiento de la informacin.

Estructura de Data WareHousing Transact SQL

El tratamiento de la informacin es importante ya que en este podemos agregar las uniones con otras tablas ya sea del mismo servidor o de otra tabla que no pertenezca al mismo origen de datos, la consulta raz normalmente solo tiene los campos principales y los dems datos descriptivos los tomamos de catlogos que cuentan con las llaves primarias y secundarias ya definidas y con las cuales se pueden hacer las uniones a otras tablas y las descripciones de cada uno de los campos, cabe mencionar que para realizar una unin es necesario tener el mismo tipo y tamao en el campo de dato en las llaves.

Estructura de Data WareHousing Transact SQL

En esta imagen vemos el ejemplo de una consulta a una tabla de informacin, la cual ya fue tratada por varias consultas y en la cual se esta realizando unin a otras tablas para extraer los campos de descripcin y as poder formar una tabla con la informacin ya detallada de las unidades de negocio.

Estructura de Data WareHousing Jobs

El proceso de Extraccin, Tratamiento y Carga de informacin (ETL), se puede automatizar creando Jobs o trabajos en SQL server, aqu podemos programar a que horas y das queremos que sean ejecutados los procedimientos almacenados (SP) sin que se tenga que correr manualmente estas consultas.

Estructura de Data WareHousing Integration Services

Integration Services es una plataforma para crear soluciones de integracin de datos de alto rendimiento, incluidos los paquetes de extraccin, transformacin y carga (ETL) para el almacenamiento de datos. Integration Services incluye herramientas grficas y asistentes para crear y depurar paquetes; tareas para realizar funciones de flujo de trabajo tales como operaciones FTP, ejecucin de instrucciones; orgenes y destinos de datos para extraer y cargar datos; transformaciones para limpiar, agregar, mezclar y copiar datos.

Flujo de Control

Flujo de datos

Estructura de Data WareHousing Integratin Services

Integration Services es la herramienta para el inicio de desarrollo de un Data WareHouse ya que este software nos ayuda a integrar los servidores y bases de datos en un solo origen y es la principal herramienta para el desarrollo de un ETL, para acceder a este servicio se utiliza Visual Studio y SQL Integration Services.

Estructura de Data WareHousing ETL

Como resultado final del ETL podemos obtener ya un origen de informacin Dinmico ya que este ante cualquier actualizacin ya sea en un a tabla o campo de cualquier base de datos que este integrado en el ETL, ser visualizado en nuestro Data WareHouse sin tener que realizar nada manualmente o correr procesos independientes.

Estructura de Data WareHousing Cubos de Informacin

Cuando ya tenemos un origen de datos en el cual extraemos informacin de diferentes orgenes se puede proceder a incluir la misma en herramientas de diseo de cubos de informacin o herramientas de Businnes Intelligence para el anlisis de informacin.

Estructura de Data WareHousing Cubos de Informacin

La funcin de las herramientas de desarrollo de cubos, es procesar la informacin que ya paso por el proceso del ETL (Extraccin, Transformacin y Carga) y el cual nos va a permitir manejar o mover la informacin de forma rpida y concisa.

Estructura de Data WareHousing Cubos de Informacin

Finalmente ya terminado el procesamiento, da como resultado un cubo de informacin con un origen de datos conectado a un Data WareHouse y que ante cualquier modificacin o cambio en cualquiera de las bases de datos, este se vera reflejado de inmediato en la prxima carga de informacin.

Proyecto Data WareHousing

Universidad Insurgentes Plantel Ciudad Azteca Materia: Programacin Orientada a Objetos I

Profesor:
Alumno: Ral Valle Morales Grupo: I9251 2do. Parcial

Potrebbero piacerti anche