Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Agenda
Informacin en el contexto actual Que Q es Business I t lli B i Intelligence? ? Elementos que componen el concepto Data Warehouse y Data Marts g p Tecnologas relacionadas al proceso de BI
Introduccin
INFORMACIN
La calidad o ausencia de ella en los productos o servicios de una empresa no es lo nico para competir en esta economa globalizada, el grado y nivel d comunicacin con sus clientes, empleados y socios l d i l de i i li t l d i es tambin un factor importante. Entre mas ampliamente disponible tenga la informacin una empresa, sta se vuelve mas valiosa. valiosa Cuando un departamento de marketing tiene informacin precisa de la base instalada de productos y servicios, est mejor capacitada para desarrollar promociones mejor enfocadas. Cuando los clientes pueden fcilmente verificar que un producto est en el inventario, es mucho mas probable que estos realicen la compra. Cuando el CEO tiene acceso instantneo a datos de tendencias, ellos pueden dar un giro de apenas 10 centavos en una direccin que desemboque en un ganancias de miles de dlares a la empresa
Entorno
Aunado esto A nado a esto, el ad enimiento del Internet a n estras advenimiento nuestras vidas ha resultado en un nuevo paradigma que modificar radicalmente la forma en que se harn negocios en el tercer milenio, y junto con ello, emergern nuevos emporios que encabezarn los cambios hacia lo que hoy se ha denominado como la e-conomy o economa digital En la actualidad las empresas mas rentables y con las que toda t d compaa d b d asociarse en un f t deber de i futuro para seguir i creciendo (y eventualmente sobrevivir), son en su mayora las de Tecnologas de Informacin, ya sea consultoras, de desarrollo de software, de hardware o telecomunicaciones. Lo cual nos una idea de cuan importante son estas empresas para el desarrollo de cualquier industria.
La Organizacin
La gran mayora de las organizaciones tienen una abundancia de datos, pero una serios problemas a la hora de gestionar el conocimiento. Las mtricas del funcionamiento y los recursos de informacin mas importantes siguen estando perdidos en un mar d nmeros y d i t t i t d did de de sistemas desconectados. La gran mayora de las organizaciones tienen muchos sistemas dispersos, cada uno de los cuales tiene sus propias fuentes de datos y mecanismos de representacin. El mantenimiento de informacin actualizada a travs de los departamentos y unidades de negocios es extremadamente difcil. En contraparte mientras mas integrada sea una organizacin es mas contraparte, organizacin, fcil para cualquier integrante de esta obtener la informacin que se necesite, as cualquier individuo se encuentra ms habilitado para tomar una mejor decisin.
El nuevo concepto
El cambiante entorno econmico y la problemtica de sistemas descrita anteriormente impulsaron el surgimiento del llamado Business Intelligence, el cual es un concepto que trata de englobar todos los Sistemas de Informacin de una organizacin para obtener d ellos no solo i i bt de ll l informacin o conocimiento, si no una verdadera g que g inteligencia q le confiera a la organizacin una ventaja competitiva por sobre sus competidores.
Estos sistemas i l E i incluyen: EIS DSS, ES MSS OLAP EIS, DSS ES, OLAP, as como nuevas tecnologas como Minera de Datos, Administracin del Conocimiento y principalmente Data Warehousing. El conjunto de tecnologas que usan Data Warehousing y OLAP (On-line A liti P W h i (O li Analitic Procesing, i procesamiento analtico en lnea), combinado con herramientas de reporte, son referidas como Business Intelligence, porque ayudan a las compaas a ganar inteligencia en operaciones y desempeo.
Buksard, Mollot Richards B k d M ll t y Ri h d (2000) comentan que l t la necesidad de nuevas herramientas de acceso y reporte de informacin, para diversos tipos de usuarios, usuarios ha impulsado la creacin de nuevas herramientas, colectivamente conocidas como Business Intelligence. Business Intelligence no es una sola tecnologa o aplicacin. No es una "cosa", sino que se trata de un paquete" de productos que trabajan de manera j para p proveer datos, informacin y reportes p conjunta p analticos que satisfagan las necesidades de una gran variedad de usuarios finales.
Business Intelligence es la habilidad de consolidar informacin y analizarla con la suficiente velocidad y precisin para descubrir ventajas y tomar mejores decisiones de negocios. Definicin compatible con la necesidad actual de p los negocios que ante la presin de ser cada da ms competitivos, para mantenerse tienen la doble tarea no slo de permanecer sino de ser lucrativos (Cano, 1999).
Las compaas actualmente usan una amplia gama de tecnologas y productos para saber que es lo que est pasando en la organizacin. Las herramientas mas comunes (simple consulta y reporte de datos, procesamiento analtico en p ,p lnea, anlisis estadstico, predicciones y minera de datos) pueden ser usadas de una gran variedad de formas formas. El objetivo de todo esto es transformar las montaas de datos en informacin til para la empresa (McGeever, 2000).
Inteligencia?
El radical crecimiento de nuevas f formas de inteligencia generada por computadora es una de las dos revoluciones en materia de TI que se estn dando en la actualidad. La segunda es el internet, la cual ya todos g , y conocemos (Martn, 2001) p p Las dos revoluciones van a soportar y ampliar una a la otra. El conjunto de ambas resultar en una radical reinvencin de los negocios.
El surgimiento de nuevas tecnologas webbased, ofrecen mucha mayor capacidad a un precio dramticamente menor que hace un par de aos. Los sistemas actuales de Business Intelligence g estn construidos en una moderna infraestructura, que consiste de una arquitectura federada (tambin conocida como modular) que acomoda todos los componentes en un moderno sistema g g (Hackney, 2000) y ) de inteligencia de Negocios (
Data Warehousing y D t M t sistemas de almacn d d t D t W h i Data Marts, i t d l de datos. Aplicaciones analticas. Data Mining, herramientas para minera de datos. OLAP, herramientas de procesamiento analtico de datos. Herramientas de consulta y reporte de datos. Herramientas de produccin de reportes personalizados. ELT, herramientas de extraccin, traduccin y carga de datos. Herramientas de administracin de sistemas. Portales de informacin empresarial. Sistemas de base de datos datos. Sistemas de administracin del conocimiento. (CMS)
Business I t lli B i Intelligence (BI) se le denomina al tipo de software l d i l ti d ft que permite a las organizaciones acceder a datos, analizarlos y compartir la informacin. Una suite integrada de BI extrae con rapidez datos de distintas fuentes y los organiza permitiendo de manera g , g amigable el anlisis, la simulacin y la generacin de informacin relevante que puede ser distribuida por toda la organizacin para soportar la toma de decisiones cotidianas y estratgicas, as como para mejorar el desempeo g j gerencial y operativo. Una plataforma integral de Business Intelligence accede a informacin histrica, permite el desarrollo de pronsticos histrica estadsticos y ofrece las herramientas para el diseo de aplicaciones de anlisis.
I. M I Manejo de las Relaciones de Marketing: E t rea aspira a f j d l R l i d M k ti Esta i focalizarse li en los objetivos de la empresa, la gente, los procesos de negocios y la infraestructura en la elaboracin de los productos, los servicios y la interaccin cara a cara con los clientes y las necesidades de cada uno de ellos. II. Anlisis de Rentabilidad: Esto involucra realizar un anlisis de dnde se generan las ganancias, qu conjunto de productos contribuyen ms a las ganancias totales, si los costos de publicidad son proporcionales a las totales ventas, y qu lneas de productos o qu productos deben ser revisados para eliminarlos posteriormente. III. Reduccin de Costos: En este caso cuando las compaas estn en p una crisis financiera, el anlisis de la informacin puede ayudarlos a identificar reas donde los costos pueden ser reducidos con el menor impacto para el negocio. Las decisiones de reduccin de costos pueden basarse en informacin objetiva detallada Por ejemplo los programas de detallada. ejemplo, retencin de empleados pueden ser implementados para reducir la rotacin en las compaas.
BI EN ACCIN!
Un poco de historia.......
Data Marts & DW
SIG
Reportes Impresos
70's
80's
90's
2000's
Business Inteligence es un trmino creado por Howard Dresner - Gartner Group en 1993. Es una amplia categora de soluciones y software para recolectar datos consolidarlos datos, consolidarlos, analizarlos y finalmente proveer informacin de una forma que permita a los usuarios de la empresa tomar mejores decisiones de negocios. Estos sistemas incluyen: EIS, DSS, ES, MSS OLAP, as como nuevas tecnologas como Minera de Datos, Administracin del Conocimiento y principalmente Data Warehousing. El conjunto de tecnologas que usan Data Warehousing y OLAP (On-line Analitic Procesing, procesamiento analtico en lnea), combinado con herramientas de reporte, son referidas como Business Intelligence, porque ayudan a las compaas a ganar inteligencia en operaciones y desempeo. DOS TENDENCIAS ... Un Data Mart es subconjunto lgico de un
Data Warehouse ... Un Data Warehouse esta hecho de la unin de todos sus Data Marts, Ralph Kimball, 1997.
Puedes capturar todos los pececillos del ocano, ponerlos juntos y, a pesar de ello, no hacen una ballena, Bill Inmon, 1998
Necesidades Especificas
Historia
Data Mart
Detalle
El diseo del Data Mart debe ser orientado a ser PARTE del Data Warehouse Corporativo
Mayor informacin
Muchas fuentes
Mayor performance
Mayor simplicidad
Orientado
CRM
Mainframe
External Data
Warehouse
Warehouse
Integracin
Resuelve el problema de INCONSISTENCIA de: Conceptos Tipos de datos Entidades Atributos Proteccin de las aplicaciones que alimentan el Data Warehouse o Data Marts: Cargas slo en horas no pico Slo en demanda Centralizacin de operaciones de transformacin y limpieza: De las aplicaciones al Data Staging Area Del Data Staging Area al Data Warehouse
Warehouse
Integracin
Appl 1
m,f balance numeric(13,2) numeric(13 2)
1 Consolidacin
Appl 2
0,1 balance pic9(9)v99
2 Estandarizacin
Appl 3
x,y balance numeric(11,0) numeric(11 0)
Appl 4
male, female balance pic s9(7)v99 comp-3 comp 3
Warehouse
Variante en el tiempo
Snapshot de datos:
Un gran horizonte de tiempo de 5 a 10 aos La estructura clave contiene un elemento tiempo Una vez tomado el snapshot, el registro no p , g puede ser actualizado
Warehouse
No voltil
Se carga la informacin Se accesa a la informacin NO EXISTE actualizacin continua de la informacin
Considera informacin final, resultado de los procesos operacionales: filtrada, integrada y consolidada. consolidada
Data Marts
Exploratorio
Arquitectura de Anlisis
Query Tools
Contiene escenarios de acuerdo al nivel de importancia de los p indicadores para cada nivel de usuarios:
Usuario Gerencial Usuario Analista
PIRAMIDE DE USUARIOS
Usuario Tcnico
Informacin Sumarizada
METADATA
Informacin Histrica
Modelos de Datos:
Data Warehouse
Anlisis Multidimensional
Anlisis de FCE Anlisis de Datos Sumarizados
Data Mining
Estadsticas Anlisis de Tendencias y Comportamientos Proyecciones
Internet/ Intranets
Legacy Systems y
DATA
Staging Area Database Data Server
METADATA
INFORMATION
KNOWLEDGE
Appl. Q&R Models AdHoc Analysis Tools
Application Server
Users
Fuentes de Datos
Procesos ETL
Data Warehouse
Aplicaciones BI
VSAM
Database Server Modelos 3ra. FN Detalle de Data Marts Data Staging Area Procesos ETL Jobs Administracin de las Cargas Modelos Dimensionales: Data Marts Consolidados
Desktop Analysis
ERP
RDBMS
Aplicaciones de Usuario Final Acceso Directo Aplicaciones OLAP Browser Aplicaciones Data Mining
Reporp tes
OLAP Server Procesos OLAP Jobs Administracin d l Ad i i t i de las Cargas Modelos Multidimensionales Herramientas OLAP
Systematics y
Flat File
Load Program
Data Model
Management Reports
Agenda
Business Intelligence (Conceptos)
Modelamiento Relacional
Modelo Relacional
La performance se busca a travs de la normalizacin Las consultas son continuas y repetitivas La informacin cambia constantemente: Estados, atributos Los datos son almacenados luego de haber estado cerrados por cierto periodo de tiempo Ms transacciones en menos tiempo Complejo para analizar por usuarios del negocio Elimina la redundancia
Modelamiento Dimensional
Modelo Dimensional
La performance se busca a travs de la redundancia: Menos normalizada (de-normalizada) Las consultas no son predecibles: ni en la forma ni en el fondo Almacena informacin que no cambia: No voltil Determina el CUANDO deben ser ledos los datos Lo significativo es guardar por mucho tiempo informacin cerrada operacionalmente El costo de procesamiento es mnimo Marco intuitivo de anlisis, fcil de usar
Un modelo entidad-relacin modela la relacin entre los datos, el modelo dimensional modela situaciones estndar del negocio Un modelo entidad-relacin tiene una estructura , variada, una manera asimtrica de relacionar los datos, el modelo dimensional la simetra es evidente Un modelo entidad-relacin provee la data empaquetada para un modelo dimensional dentro de la estructura de datos del negocio
Esquema Estrella
Modelamiento Dimensional
Dimensin Tiempo
Llave_Tiempo DiadelaSemana NumeroSemana Mes PeriodoFiscal Etc. Fact Ventas Llave_Tiempo Llave_Producto Llave_Tienda Llave_Cliente Llave_Vendedor Llave_Promocion ValorVentaDolares UnidadesVendidas ValorCostoDolares Vl C t D l
Tcnica de diseo lgico Presentar la informacin bajo un marco intuitivo que permita un acceso de alta performance Tiene un esquema radial Ti di l compuesto de una tabla central y un conjunto de pequeas tablas a su alrededor.
Dimensin Tienda Llave_Tienda CodigoTiemda Nombre Tienda Direccion Di i Distrito Etc. Dimensin Vendedor Llave_Vendedor Ll V d d CodigoVendedor NombreVendedor Nivel Vendedor Etc. Dimensin Promocin Llave_Promocion CodigoPromocion NombrePromocion TipoPrecio TipoAnuncio Etc.
Dimensin Producto Llave_Producto CodigoProducto Descripcion Linea Categoria SubCategoria TipoEmpaque Tamao UnidadVenta etc. etc Dimensin Cliente Llave_Cliente NombreCliente PerfilCompras PerfilCredito Direccion etc.
Modelamiento Dimensional
Esquema Estrella Caractersticas:
Modelo lgico estructurado y extensible Aadir nuevos casos de negocio de nuevas aplicaciones g Aadir nuevos anlisis Representa un modelo del negocio mas que un modelo de datos Una vista particular de una parte del negocio Los procesos del negocio se ven reflejados en uno o varios modelos estrella Representa informacin operacional esttica en un punto en el tiempo Lgica aditiva: leer millones de registros para sumarlos
Modelamiento Dimensional
Esquema Estrella
Customer Customer No Customer Name Customer Type Cd Customer Type Desc
4 Dimension Star
Order Fact Customer No Sales Rep Cd Product Cd Order Date Order Qty Order Line Value
Order Header Order Line Product Product Cd Product Name Product Type Cd Product Type Desc Product Line Cd Product Line Name Product Line Manager
Product P d
Organization Sales Rep Cd Sales Rep Name Sales Area Cd Sales Area Desc
Modelamiento Dimensional
Esquema Estrella Caractersticas:
De-normalizacin: Menos joins entre tablas en los queries Simplificar la elaboracin d queries Si lifi l l b i de i Mejor performance en tiempo de respuesta de los queries Mejor administracin de los datos histricos j
Modelamiento Dimensional
Dimensin Tiempo Dimensin Tienda
Llave_Tienda CodigoTiemda Nombre Tienda Direccion Di i Distrito Etc. Llave_Tiempo DiadelaSemana NumeroSemana Mes PeriodoFiscal Etc.
Dimensin Producto
Llave_Producto CodigoProducto Descripcion Linea Categoria SubCategoria TipoEmpaque Tamao UnidadVenta etc. etc
Puntos de entrada al Data Mart Facts Contiene los valores numricos y aditivos Contienen detalle y sumarizaciones (agregaciones)
Fact Ventas
Llave_Tiempo Llave_Producto Llave_Tienda Llave_Cliente Llave_Vendedor Llave_Promocion ValorVentaDolares UnidadesVendidas ValorCostoDolares Vl C t D l
Dimensin Vendedor
Llave_Vendedor CodigoVendedor NombreVendedor Nivel Vendedor Etc.
Dimensin Promocin
Llave_Promocion CodigoPromocion NombrePromocion TipoPrecio TipoAnuncio Etc.
Dimensin Cliente
Modelamiento Dimensional
Modelamiento Dimensional
Jerarqua
Conjunto de atributos
Jerarqua J
Un miembro puede ser un hijo de otro miembro Puede existir ms de una por dimensin
Atributos
Modelamiento Dimensional
Drill Up and Down
Dimensin Tiempo Di i Ti Time_key (PK) SQ_Date Day_of_week Week_number Week number month Dimensin Tienda Store_key Store key (PK) Store_id Store_name address district region i
District Atherton Atherton Atherton Belmont Belmont Belmont Brand Clean Fast More Power Zippy Clean Fast More Power Zippy
Modelamiento Dimensional
Fact
... time_key (FK) ... ... ...
Modelamiento Dimensional
Esquema Estrella - Facts
Informacin de un evento especfico en el tiempo Refleja el mayor nivel de granularidad del anlisis Contiene atributos numricos GENERALMENTE aditivos diti Los datos no cambian en el tiempo
Fact Foto Semanal Llave_Tiempo Llave_Cuenta Llave_Cliente Llave_Sectorista Llave_Agencia Saldo Principal Soles Monto Linea de Crdito Monto Sobregiro
Fact Evento Venta Llave_Tiempo Llave_Producto Llave_Tienda Llave_Cliente Llave_Vendedor Llave_Registrador Llave_Promocion Venta en dlares Unidades Vendidas Costo en dlares Precio Unitario dlares
Modelamiento Dimensional
Esquema Estrella - Facts
en un da o mes, se mide el nmero de transacciones de un producto o de una cuenta las medidas son aditivas y son en un nmero limitado
Modelamiento Dimensional
Esquema Estrella - Facts
tomados en un momento especifico en el tiempo son el resultado de un periodo de tiempo especfico Las medidas son aditivias y semi-aditivas
Linea de Items: linea de items de la factura es un registro
Llave_Tiempo Llave_Cuenta Llave_Cliente Llave_Sectorista Llave_Agencia Saldo Principal Soles Monto Linea de Crdito Monto Sobregiro
tomados en un momento especifico en el tiempo tiene mltiples llaves de tiempo para las diferentes fases por las que pasa la lnea de item
Modelamiento Dimensional
Esquema Estrella - Facts
Modelamiento Dimensional
Esquema Estrella - Facts
Time_key 1 1 1 1 ... 32
Fact Mensual
Time_key 1 2 3 4 ... 32
Month 1 1 1 1 ... 2
Multidimensional Analysis
Referidos
Forecasting
Tcnica que usa informacin histrica para crear modelos que ayuden a predecir comportamientos o requerimientos d l i i t del negocio.
Data Mining
Descubrir t d D b i tendencias, i patrones y relaciones en la informacin. Descubrir asociaciones (correlaciones entre eventos), secuencias (eventos relacionados con otros eventos), Clasificaciones (patrones p para establecer p perfiles) y ) clusters (encontrando y visualizando nuevos grupos de factores)
Visual Analysis
Visual Analysis
Geographic Analysis
Preguntas?