Sei sulla pagina 1di 46

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Facultad de Ciencias e Ingeniera Especialidad Ingeniera Industrial

ANLISIS Y DISEO DE SISTEMAS


Semana 12

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Primero Conceptos de BUSINESS INTELLIGENCE (BI)

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Inteligencia de Negocios
Conjunto de actividades involucradas en la obtencin, gestin, y anlisis de datos para producir informacin a ser distribuida a los miembros de una organizacin, para mejorar su toma de decisiones - Brackett, 1999 Business Intelligence se refiere al proceso de convertir datos en conocimiento y conocimiento en acciones para crear la ventaja competitiva del negocio - The Data Warehousing Institute Una decisin es la accin que un ejecutivo debe tomar cuando la informacin es tan incompleta que la respuesta no es obvia por si misma - A. W. Radnor

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Necesidades de Informacin
Estrategias de Inteligencia de Negocios Alta Direccin
CONOCIMIENTO

Estratgica

Tctica

Gerentes
INFORMACIN

Todos
Operacional
DATOS

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

El proceso de la toma de Decisiones


Informacin Gerencial Herramientas Herramientaspara parael el apoyo apoyoal alanlisis anlisisy ytoma toma de decisiones de decisiones
OLAP OLAP Estrategia

Informacin Operativa

Herramientas Herramientaspara parael el manejo manejo transaccional transaccionalde dela la informacin informacin

OLTP OLTP

Da a Da

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Situacin a resolver con BI


Sistemas de Apoyo a toma de decisin (Ambiente de Gestin)

Sistemas de Apoyo a funciones del negocio (Ambiente Operacional)


6

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Situacin a resolver con BI


Fuente de informacin
O P E R A C I O N A L

Usuarios de negocios

G E S T I O N

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Situacin a resolver con BI


Frustracin de los ejecutivos debido a ... Desfase entre disponibilidad de la informacin y su oportunidad comercial. Los datos no soportan la visin global de la empresa que las gerencias necesitan. Inconsistencia de la informacin. El contexto histrico de la informacin no est disponible. No pueden hacerse preguntas complejas.

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Objetivos y Desafos de una Solucin BI


Objetivos: Informacin consolidada Calidad de informacin Proveer datos histricos y con detalle Realizar consultas ad hoc & anlisis sofisticado Tiempos de respuesta a consultas casi instantneos Desafos: Escalabilidad en capacidad de almacenamiento, en capacidad de procesamiento, en personal especializado. Rendimiento Flexibilidad Fuentes de datos heterogneas

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Segundo Conceptos de Bases de Datos y DataWarehouse

10

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Bases de Datos y su uso


OBJETIVO: Uso de Datos para el soporte en la toma de decisiones de la empresa. Generalmente, la informacin que se quiere investigar sobre un cierto dominio de la organizacin se encuentra en bases de datos de la empresa y otras fuentes muy diversas, tanto internas como externas. Muchas de estas fuentes son las que se utilizan para el trabajo diario (bases de datos operacionales o transaccionales).

11

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Bases de Datos y su uso


Las propias bases de datos de trabajo se pueden utilizar para extraer conocimiento actual e histrico. Uso de la base de datos transaccional para varios cometidos: Se mantiene el trabajo transaccional diario de los sistemas de informacin originales (conocido como OLTP, On-Line Transactional Processing). Se hace anlisis de los datos en tiempo real sobre la misma base de datos (conocido como OLAP: On-Line Analytical Processing).

12

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Problema con las Bases de Datos Relacionales


Sin embargo el uso de consultas complejas perturba el trabajo transaccional diario de los sistemas de informacin originales (killer queries).
Sistemas con datos replicados (consistencia) Se debe hacer en perodos restringidos (por la noche o en fines de semana).

Las bases de datos estn diseada para transaccional, no para el anlisis de los datos.

el

trabajo

En las bases de datos transaccionales la redundancia es signo de INEFICIENCIA, en los datawarehouse la redundancia es requerida para un procesamiento y respuesta eficiente.

13

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Bodegas (warehouse) de Datos (data)


Se desea operar eficientemente con esos datos... Teniendo en cuenta adems que los costos de almacenamiento masivo y conectividad se han reducido drsticamente en los ltimos aos Parece razonable recoger los datos (informacin histrica) en un sistema de almacenamiento y consulta de datos, con caractersticas de: dedicado, uso especfico y automatizado.

NACE EL DATAWAREHOUSING

DataWarehouses (Almacenes o Bodegas de Datos)


14

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Que es DataWarehousing?
Es una coleccin de tecnologas de apoyo a las decisiones, cuyo objetivo es habilitar al trabajador con conocimientos para la toma de mejores y ms rpidas decisiones

15

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Esquema Tcnico General de una solucin BI

Datawarehouse

ETL
Extraccin, Transformacin y Carga de datos
Ventas Obras Proyectos

Datos Operacionales y Externos

Consultas, Reportes, Anlisis.


Compras

Otros

BASE DE DATOS RELACIONAL

BASE DE DATOS MULTIDIMENSIONAL

16

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Arquitectura genrica de un DWH respecto a una solucin de BI


La Arquitectura de un DWH viene determinada por su situacin central como fuente de informacin para las herramientas de anlisis.
Fuentes Internas Base de Datos Transaccional Extract, Transform, Load Herramientas de consultas e informes Herramientas Sistemas de Informacin

ETL
Fuente de Datos 1
texto

Bodega de Datos (DWH)

Interfaz y Operadores

Fuente de Datos 3
HTML

Herramientas OLAP

Fuente de Datos

Fuentes Externas

Copias de Seguridad

Herramientas de Minera de Datos

17

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Esquema General de una solucin BI


Ventas
Datos Externos (Excel, Word, etc.)

Aplicaciones (Sql Server, Oracle, ERP, GGHH, Etc.)

C o n v e r s i n

Finanzas

Data Warehouse
Recursos Humanos

Produccin

Ambiente Operacional

Data Mart

18

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Esquema General de una solucin BI

19

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Tercero Definiciones de DataWarehouse (como parte de BI)

20

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo su anlisis desde infinidad de pespectivas y con grandes velocidades de respuesta. La creacin de un datawarehouse representa en la mayora de las ocasiones el primer paso, desde el punto de vista tcnico, para implantar una solucin completa y fiable de Business Intelligence.
21

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Bill Inmon fue uno de los primeros autores en escribir sobre el tema de los almacenes de datos, define un data warehouse (almacn de datos) en trminos de las caractersticas del repositorio de datos: Orientado a temas.- Los datos en la base de datos estn organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre s. Variante en el tiempo.- Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones. No voltil.- La informacin no se modifica ni se elimina, una vez almacenado un dato, ste se convierte en informacin de slo lectura, y se mantiene para futuras consultas. Integrado.- La base de datos contiene los datos de todos los sistemas operacionales de la organizacin, y dichos datos deben ser consistentes. Inmon defiende una metodologa descendente (top-down) a la hora de disear un almacn de datos, ya que de esta forma se considerarn mejor todos los datos corporativos. En esta metodologa los Data Marts se crearn despus de haber terminado el data warehouse completo de la organizacin.

22

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

"Building the Data Warehouse" (1992)

Un DataWarehouse es :

1. 2. 3. 4. 5. 6.

Orientada a un tema (subject-oriented), Integrada Temporal (Cambiante en cada perodo de tiempo), No voltil Es una coleccin estructurada de datos (una base de datos) que es usada para el apoyo de decisiones organizacionales Automatizado

23

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Un DataWarehouse es:

1. Orientado a un objetivo
DW: Orientado hacia la informacin relevante de la organizacin se disea para consultar eficientemente informacin relativa a las actividades (ventas, compras, produccin, ...) bsicas de la organizacin, no para soportar los procesos que se realizan en ella (gestin de pedidos, facturacin, pagos, inventarios, etc).

Base de Datos Transaccional


CURSO ... REUNION ... PAS ... VENTA ... PROTOTIPO ... PRODUCTO ... GAMA ...

Informacin Necesaria
24

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Un DataWarehouse es:

2. Integrado
integra datos recogidos de diferentes sistemas operacionales de la organizacin (y/o fuentes externas).

DW: Integrado

Fuente de Datos 1
texto

Fuente de Datos 3
HTML

Fuente de Datos 2

Base de Datos Transaccional 1 Fuentes Internas Base de Datos Transaccional 2 Fuentes Externas

Bodega de Datos (Datawarehouse)

Datos transaccionales

Datos agregados

25

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Un DataWarehouse es:

3. Temporal
los datos son relativos a un perodo de tiempo y deben ser incrementados peridicamente.

DW: Variable en el tiempo

Los datos son almacenados como fotos (snapshots) correspondientes a perodos de tiempo.

Tiempo

Datos

01/2003 Datos de Enero 02/2003 Datos de Febrero 03/2003 Datos de Marzo

Datos actuales

Datos histricos

26

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Un DataWarehouse es:

4. No Voltil
los datos almacenados no son actualizados, slo son incrementados.
Carga

DW: No voltil

Bases de datos operacionales

Bodega de Datos

INSERT UPDATE DELETE

READ

READ

El perodo de tiempo cubierto por un DW vara entre 2 y 10 aos.


27

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Un DataWarehouse es:

5. Una coleccin estructurada de datos

28

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Un DataWarehouse es:

6. Automatizado

29

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Cuarto Diseo de un DataWarehouse

30

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Ventajas de un DataWarehouse Bodegas de Datos (DWH)


ventajas para las organizaciones

rentabilidad de las inversiones realizadas para su creacin

aumento de la competitividad en el mercado

aumento de la productividad de los tcnicos de direccin


31

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Problemas a asumir con la implementacin de un DataWarehouse

Bodegas de Datos (DWH)


problemas para las organizaciones privacidad y seguridad de los datos incremento continuo de los requisitos de los usuarios

sub-valoracin del esfuerzo necesario para su diseo y creacin

sub-valoracin de los recursos necesarios para la captura, carga y almacenamiento de los datos

32

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

OLTP (Transaccionales) vs. OLAP (Analticas)


Sistema Operacional (OLTP)
- almacena datos actuales - almacena datos de detalle - bases de datos medianas (5TB - 50TB, ) - los datos son dinmicos (actualizables) - los procesos (transacciones) son repetitivos - el nmero de transacciones es elevado - tiempo de respuesta pequeo (segundos) - dedicado al procesamiento de transacciones - orientado a los procesos de la organizacin - soporta decisiones diarias cotidianas - sirve a muchos usuarios (administrativos)

Almacn de datos (OLAP) - DWH


- almacena datos histricos - almacena datos de detalle y datos agregados a distintos niveles - bases de datos grandes (50TB - 200+ TB) - los datos son estticos - los procesos no son previsibles - el nmero de transacciones es bajo o medio - tiempo de respuesta variable (segundos-horas) - dedicado al anlisis de datos - orientado a la informacin relevante - soporta decisiones estratgicas - sirve a tcnicos de direccin, analistas

33

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Diseo de DWH: Modelo Multidimensional


En un esquema multidimensional se representa una actividad que es objeto de anlisis (hecho) y las dimensiones que caracterizan la actividad (dimensiones). La informacin relevante sobre el hecho (actividad) se representa por un conjunto de indicadores (medidas o atributos de hecho). La informacin descriptiva de cada dimensin se representa por un conjunto de atributos (de dimensin). a

Dimensiones

2 2 0 0 0 0 3 4 2 0 0 5

n o li M o L a rc u S n S a i dr o I s Producto1

Producto2 Producto 3

Hecho
Ventas en MUS$ 34

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Usando cubos para ver el modelo multidimensional


El valor de una determinada mtrica por un conjunto de Dimensiones se hallara en la interseccin de los ejes de las mismas. Aunque hablamos de cubo no estamos restringidos a 3 Dimensiones, en la prctica puede haber muchas ms.
2 2 0 0 0 0 3 4 2 0 0 5
a lin o M o L a rc S u ro

n S a

id I s

2 2 0 0 0 0 3 4 2 0 0 5

a lin o M o L a rc u S

n S a

id I s

ro

Producto1 Producto2 Producto 3

Producto1 Producto2 Producto 3

Ventas
Muestra las ventas del producto 2, en el a ao 2005 en Surco

Ventas
Muestra las ventas durante 2004 de todos los productos en todos los distritos

35

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Tipo de Modelos Multidimensionales

Esquema de Estrella (lineal o Star schema): Un hecho est en medio del conjunto de dimensiones Esquema de Copo de Nieve (jerrquico o Snowflake schema): Un refinamiento del anterior, donde alguna jerarqua dimensional es normalizada en un conjunto de pequeas dimensiones. Constelacin de Hechos: Tablas de mltiples hechos, vistas como una coleccin de estrellas.

36

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

37

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

38

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Modelo Constelacin de Hechos

Este es el modelo mas popular para representar DW, ya que permite incluir muchos cubos al mismo tiempo en la representacion. En este modelo las algunas dimensiones son compartidas por diversos hechos, y con ello los cubos pueden ser de distintas dimensiones Adems, un modelo de DW puede permitir incluir dimensiones no orientadas hacia el anlisis, sino solo de carcter descriptivo

39

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Pasos en el diseo de un DW
Paso 1. Elegir un proceso de la toma de decisiones en la organizacin. Paso 2. Decidir el nivel de detalle (granularidad) de representacin del proceso. Paso 3. Identificar las dimensiones de anlisis que caracterizan el proceso (siempre incluir la variable tiempo). Paso 4. Decidir la informacin a almacenar sobre el proceso.

40

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Paso 1. Elegir un proceso de la organizacin para modelar


Proceso: actividad de la organizacin que requiere de anlisis y toma de decisiones, y que puede ser soportada por un OLTP del cual se puede extraer informacin con el propsito de construir la bodega de datos.
Pedidos (de clientes) Compras (a suministradores) Facturacin Envos Ventas Inventario
41

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Paso 2. Decidir el nivel de detalle de representacin


Granularidad: es el nivel de detalle al que se desea almacenar informacin sobre la actividad a modelar.
Define el nivel atmico de datos en el almacn de datos. Determina el significado de los registros en las diferentes tablas. Determina las dimensiones bsicas del esquema transaccin en el OLTP informacin diaria informacin semanal informacin mensual. ....

42

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Paso 3. Identificar las dimensiones que caracterizan el proceso


Dimensiones: son aquellas que caracterizan la actividad al nivel de detalle (granularidad) que se ha elegido. Tiempo (dimensin temporal: cundo se produce la actividad?) Producto (dimensin cul es el objeto de la actividad?) Local (dimensin geogrfica: dnde se produce la actividad?) De cada dimensin se debe decidir los atributos (propiedades) relevantes para el anlisis de la actividad. Entre los atributos de una dimensin existen jerarquas naturales que deben ser identificadas (da-mes-ao)

43

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Paso 4. Decidir la informacin a almacenar sobre el proceso


Hechos (facts): informacin (sobre la actividad) que se desea almacenar en cada tupla de la tabla de hechos y que ser el objeto del anlisis.
Precio Unidades Importe .... Nota: algunos datos que en el OLTP coincidiran con valores de atributos de dimensiones, en el almacn de datos pueden representar hechos (ejemplo: el precio de venta de un producto).
44

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Diseo de un DW: Otras orientaciones de diseo


Evitar normalizar: Si se define una tabla de dimensin para cada dimensin identificada en el anlisis, es frecuente que entre el conjunto de atributos de la tabla aparezcan dependencias funcionales que hacen que la tabla no est en 3 F.N. El ahorro de espacio no es significativo. Siempre introducir la dimensin Tiempo En una bodega de Datos muchas consultas son restringidas y parametrizadas por criterios relativos a periodos de tiempo (ltimo mes, este ao, ...).

45

PONTIFICIA UNIVERSIDAD CAT CATLICA DEL PER PER AN ANLISIS Y DISE DISEO DE SISTEMAS

Preguntas?

46

Potrebbero piacerti anche