Sei sulla pagina 1di 19

Sesin 4:

Poblando un Data
Warehouse
MCP Ing. Ricardo Mendoza Rivera

Overview

Reconociendo el Proceso
Mtodos de Poblacin de un Data Warehouse
Herramientas para Poblar un Data Warehouse
Poblando un Data Warehouse Usando DTS

Reconociendo el Proceso
OLTP
Sistemas
SQL
Server

Area Temporal
de Depuracin

Data Marts

Datos
Datos Venta
Venta

Sales

Datos
Datos Equipos
Equipos

Oracle

Tenebrosa

Validar, Recoger ,
Transform
Preparar Data Consistente Data

Data
Warehouse

Poblar Data
Warehouse

Service
Other

Distribuir
Data

Validando Data
Validar y Corregir Data en el Orgen Antes de Importar
Determinar y Corregir los Procesos que Invalidan Data
Grabar Data Invalida para su Revisin

Preparar Data Consistente


La Inconsistencia puede ser:
La Data en cada source es consistente, pero debe ser
representada en forma diferente en el data warehouse
Data es representada diferente en diferentes sources
Puede preparar la Data Consistente:
Transladar cdidos o valores a cadenas lebles
Convertir versiones mltiples en una simple
representacin

Transformando Data
Transformar
Cambiar
buyer_name
buyer_name reg_id
reg_id total_sales
total_sales
Barr,
Adam
II
17.60
Barr, Adam
II
17.60
Chai,
Sean
IV
52.80
Chai, Sean
IV
52.80
OMelia,
Erin
VI
8.82
OMelia, Erin
VI
8.82
......
......
......

buyer_name
buyer_name reg_id
reg_id total_sales
total_sales
Barr,
Adam
2
17.60
Barr, Adam
2
17.60
Chai,
Sean
4
52.80
Chai, Sean
4
52.80
OMelia,
Erin
6
8.82
OMelia, Erin
6
8.82
......
......
......

Combinar
buyer_first
buyer_first buyer_last
buyer_last reg_id
reg_idtotal_sales
total_sales
Adam
Barr
22
17.60
Adam
Barr
17.60
Sean
Chai
4
52.80
Sean
Chai
4
52.80
Erin
OMelia
6
8.82
Erin
OMelia
6
8.82
......
......
......
......

buyer_name
buyer_name reg_id
reg_id total_sales
total_sales
Barr,
22
17.60
Barr,Adam
Adam
17.60
Chai,
Sean
4
52.80
Chai, Sean
4
52.80
OMelia,
Erin
6
8.82
OMelia, Erin
6
8.82
......
......
......

Calcular
buyer_name
buyer_name price_id
price_id qty_id
qty_id
Barr,
Adam
.55
32
Barr, Adam
.55
32
Chai,
Sean
1.10
48
Chai, Sean
1.10
48
OMelia,
Erin
.98
9
OMelia, Erin
.98
9
......
......
......

buyer_name
buyer_name price_id
price_id
Barr,
Adam
Barr, Adam .55
.55
Chai,
Sean
1.10
Chai, Sean
1.10
OMelia,
Erin
.98
OMelia, Erin .98
......
......

qty_id
qty_id total_sales
total_sales
32
17.60
32
17.60
48
52.80
48
52.80
99
8.82
8.82
......
......

Mtodos para Poblar un Data Warehouse

Seleccione un Mtodo de acuerdo a las necesidades de su


negocio
Mtodo 1: Validar, y transformar data
en un ambiente temporal
Mtodo 2: Validar y transformar data
durante el proceso de carga de datos
Migrar Data cuando haya poca concurrencia al Sistema

Herramientas para Poblar un Data Warehouse


Condiciones al Seleccionar una Herramienta
Transact-SQL Query
Distributed Query
SQL Server Integration Services (SSIS)

Condiciones al Seleccionar una Herramienta


Formatear Source y Destination Data
Localizar el Source y Destination Data
Importar o Exportar los Objetos de la Base Datos
Frecuencia de la Transferencia de Data
Interface de Flexible de y Facil Manejo

Transact-SQL Query
Cliente

ResumenCliente
Nombre
Nombre
Steve
Douglas
Les
Paul

Apellido
Apellido
Johnson
Smith
Wilson
Salinger

NombreCompleto
NombreCompleto
Johnson, Steve
Smith, Douglas
Wilson, Les
Salinger, Paul

USE Tenebrosa_mart
SELECT Apellido+ ,' + Nombre As NombreCompleto
INTO ResumenCliente
FROM Tenebrosa.dbo.Cliente

Distributed Query
USE
USE Tenebrosa_mart
Tenebrosa_mart
SELECT
SELECT Producto,
Producto, Proveedor
Proveedor
INTO
INTO item_dim
item_dim
FROM
FROM ServidorAlmacen.Ventas.dbo.producto
ServidorAlmacen.Ventas.dbo.producto pp JOIN
JOIN
ServidorContable.Ventas.dbo.proveedor
ServidorContable.Ventas.dbo.proveedor ss
ON
ON p.idProveedor
p.idProveedor == s.idProveedor
s.idProveedor

ServidorContable

ServidorAlmacen

Servidor : Local

Ventas
Proveedor
Proveedor Tabla
Tabla

Ventas
Producto
Producto Tabla
Tabla

Item_Dim
Item_Dim Tabla
Tabla

SQL Server Integration Services

Data Source y Tipos de Destino


OLE DB
ODBC
ASCII text file

XML
Custom
HTML

Spreadsheet
Herramientas
SQL Server Business Intelligence Development
Studio
dtsrun utility

Poblando un Data Warehouse Usando SSIS


Creando un Proyecto
Creando las Conexiones de Datos
El control Flow de un Package
Data Flow
Realizando Transformaciones y Mapeos

Creando un Proyecto

Creando las Conexiones de Datos

El Control Flow de un Package

Data Flow

Realizando Transformaciones y Mapeos

Laboratorio: Poblando un Data WareHouse

Creando el Proyecto

Creando conexiones

Incorporando Tareas

Ejecutando Paquete

Programando Tareas Automatizadas de


Ejecucion.

Potrebbero piacerti anche