Sei sulla pagina 1di 22

Empresa de Tecnologas de la Informacin y Servicios Telemticos Avanzados CITMATEL I Taller de Proyeccin y Prospeccin en Tecnologas de Informacin y Comunicacin, Cuba Venezuela

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO

Autores:

Ing.Lilliam Vega Torres Ing.Luis Rojas Daz Lic.Cecilia Placeres Villar

Ciudad de la Habana, Cuba Noviembre 2008

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO RESUMEN


En el presente trabajo se expone el concepto de inteligencia de negocio. Asocindolo directamente con las tecnologas de la informacin, se define este concepto y se exponen las caractersticas de la infraestructura informtica para dar respuesta a las crecientes necesidades de informacin de la empresa moderna. Se define el data warehouse o almacn de datos como base conceptual para el desarrollo de la inteligencia de negocio mediante tcnicas informticas. Por ltimo, se describe la plataforma Business Intelligence OpenSource Pentaho como herramienta concreta para su implementacin.

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO NDICE


La inteligencia de negocio. ................................................................................................................ 1 Su implementacin mediante la plataforma Pentaho.........................................................................1 Resumen............................................................................................................................................ 2 La Inteligencia de Negocio. Su implementacin mediante la plataforma Pentaho ..........................3 ndice.................................................................................................................................................. 3 Introduccin........................................................................................................................................ 4 La Inteligencia de Negocio. Su implementacin mediante la plataforma Pentaho ..........................5 Inteligencia de negocio....................................................................................................................... 4 Sistemas de apoyo a la toma de decisiones......................................................................................5 Data warehouse.............................................................................................................................. 6 Procesamiento analtico.................................................................................................................. 8 Modelo multidimensional .............................................................................................................. 10 Herramientas de inteligencia de negocio de software libre (Open Source)......................................11 La plataforma Business Intelligence OpenSource Pentaho.............................................................12 El servidor OLAP.......................................................................................................................... 13 Capas del servidor Mondrian........................................................................................................ 14 Herramientas Cube Designer y Workbench..................................................................................17 Herramienta ETL Kettle................................................................................................................ 18 Minera de datos........................................................................................................................... 19 Conclusiones ................................................................................................................................... 20 Referencias bibliogrficas................................................................................................................ 21 Glosario de trminos........................................................................................................................ 22

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO INTRODUCCIN


En la actualidad, en cualquier organizacin se hace necesario la toma decisiones, en ocasiones muy estratgicas para lograr un desarrollo satisfactorio. Generalmente estas decisiones, estn basadas en enormes volmenes de informacin registrada en bases de datos operacionales o de otros tipos de fuentes de datos. La recopilacin y anlisis de esta informacin, dado su carcter heterogneo y su volumen se convierten usualmente en un problema para las organizaciones y es aqu donde interviene la Inteligencia de Negocio (BI por sus siglas en ingls: Business Intelligence), mediante los Sistemas de Apoyo a la Toma de Decisiones. [18] Hoy existen dismiles soluciones de BI, siendo la plataforma Open Source Pentaho Business Intelligence una de las ms utilizadas actualmente. Esta plataforma de manera general cubre operaciones de Anlisis de Datos y de Informes empresariales, haciendo esto entre otras cosas que sea una solucin muy flexible para cubrir una amplia gama de necesidades empresariales, tanto tpicas como las sofisticadas y especficas al negocio.

INTELIGENCIA DE NEGOCIO
Se define por Inteligencia de Negocio o Business Intelligence (BI) a la transformacin de los datos de la compaa en conocimiento para obtener una ventaja competitiva. Desde un punto de vista ms pragmtico, y asocindolo directamente a las tecnologas de la informacin, podemos definir Business Intelligence como el conjunto de metodologas, aplicaciones y tecnologas que permiten reunir, depurar y transformar datos de los sistemas transaccionales e informacin desestructurada (interna y externa a la compaa) en informacin estructurada, para su explotacin directa (reporting, anlisis OLAP...) o para su anlisis y conversin en conocimiento soporte a la toma de decisiones sobre el negocio. [6] Este conjunto de herramientas y metodologas tienen en comn las siguientes caractersticas: Accesibilidad a la informacin. Los datos son la fuente principal de este concepto. Lo primero que debe garantizar este tipo de herramientas y tcnicas ser el acceso de los usuarios a los datos con independencia de la procedencia de estos. Apoyo en la toma de decisiones. Se busca ir ms all en la presentacin de la informacin, de manera que los usuarios tengan acceso a herramientas de anlisis que les permitan seleccionar y manipular slo aquellos datos que les interesen. Orientacin al usuario final. Se busca independencia entre los conocimientos tcnicos de los usuarios y su capacidad para utilizar estas herramientas. El trmino inteligencia empresarial se refiere al uso de los datos de una empresa para facilitar la toma de decisiones a las personas que deciden, es decir, la comprensin del funcionamiento actual y la anticipacin de acciones para dar una direccin bien informada a la empresa. Las herramientas de inteligencia se basan en la utilizacin de un sistema de informacin de inteligencia que se forma con distintos datos extrados de los datos de produccin, con informacin relacionada con la empresa o sus mbitos y con datos econmicos. Mediante las herramientas y tcnicas ETL (extraer, transformar y cargar) se extraen los datos de distintas fuentes, se depuran y preparan (homogeneizacin de los datos) para cargarlos en un almacn de datos. Por ltimo, las herramientas de inteligencia analtica posibilitan el modelado de las representaciones en base a consultas para crear tablas; esto se conoce como presentacin de informes. [7] 4

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


De acuerdo a su nivel de complejidad se pueden clasificar las soluciones de Business Intelligence en: Consultas e informes simples (Queries y reports). Cubos OLAP (On-Line Analytic Processing). Data Mining o minera de datos. Sistemas de previsin empresarial; prediccin mediante estudio de series temporales (ejemplo: Previsin de ventas).

La figura 1 muestra las etapas por la que transitan los datos que forman parte del proceso de informacin en una organizacin, pero con los roles involucrados en este proceso de toma de decisiones. [3]

Fig.1 Etapas por las que transitan los datos en un proceso de toma de decisiones Desde un punto de vista ms pragmtico, y asocindolo directamente con las tecnologas de la informacin, podemos definir Business Intelligence como el conjunto de metodologas, aplicaciones y tecnologas que permiten reunir, depurar y transformar datos de los sistemas transaccionales e informacin desestructurada (interna y externa a la compaa) en informacin estructurada, para su explotacin directa (reporting, anlisis OLTP / OLAP, alertas...) o para su anlisis y conversin en conocimiento, dando as soporte a la toma de decisiones sobre el negocio. [1]

SISTEMAS DE APOYO A LA TOMA DE DECISIONES


Los Sistemas de Apoyo a la Toma de Decisiones, o en ingls: Decision Support Systems (DSS) como sistemas informticos, consisten habitualmente en varios componentes: bases de datos fuentes, sistemas de Extraccin-Transformacin-Carga de datos, Data Warehouse (DW) o Almacenes de Datos, herramientas de Procesamiento Analtico en Lnea (OLAP), bases de datos multidimensionales y otras herramientas de anlisis de informacin. El apoyo para la toma de decisiones, no es parte de la tecnologa de base datos por si misma, sino que resulta de la combinacin de varias aplicaciones de esta tcnica (Figura 2). Las aplicaciones reciben los nombres de Data Warehouse, Datamart o Mercado de datos, OLAP (Procesamiento Anlitico en Lnea), Minera de Datos, entre otros.

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO

Fig.2 Apoyo para la toma de decisiones

DATA WAREHOUSE
Un Data Warehouse (DW) o Almacn de datos es una base de datos corporativa que se caracteriza por integrar y depurar informacin de una o ms fuentes distintas, para luego procesarla permitiendo su anlisis desde infinidad de pespectivas y con grandes velocidades de respuesta. La creacin de un datawarehouse representa en la mayora de las ocasiones el primer paso, desde el punto de vista tcnico, para implantar una solucin completa y fiable de Business Intelligence. [4] Los "almacenes de datos" son una tecnologa relativamente reciente, encaminada a proporcionar metodologas para recopilar e integrar los datos histricos de una organizacin, cuyo fin es el anlisis, la obtencin de resmenes e informes complejos y la extraccin de conocimiento. Esta tecnologa est diseada especialmente para organizar grandes volmenes de datos de procedencia generalmente estructurada (por ejemplo bases de datos relacionales). La ventaja principal de este tipo de bases de datos radica en las estructuras en las que se almacena la informacin (modelos de tablas en estrella, en copo de nieve, cubos relacionales, etc). Este tipo de persistencia de la informacin es homognea y fiable, y permite la consulta y el tratamiento jerarquizado de la misma (siempre en un entorno diferente a los sistemas operacionales). La siguiente tabla describe las diferencias que se deben tener en cuenta para estructurar y disear almacenes de datos en comparacin con las bases de datos transaccionales. [5] Parmetros Propsito Tipo de datos Caractersticas de los datos Modelo de datos Nmero y tipo de usuarios Acceso Base de Datos Transaccional Operaciones diarias. Soporte a las aplicaciones. Datos de funcionamiento de la organizacin. Datos de cambiantes, incompletos. funcionamiento, internos, Almacn de Datos Recuperacin de informacin, informes, anlisis y minera de datos. Datos tiles para sumarizacin, etc. el anlisis, la y

Datos histricos, datos internos externos, datos descriptivos.

Datos normalizados. Cientos/miles: aplicaciones, operarios, administrador de la base de datos. SQL. Lectura y escritura.

Datos en estrella, en copo de nieve, parcialmente desnormalizados, multidimensionales. Decenas: analistas. directores, ejecutivos,

SQL y herramientas propias (slice & dice, drill, roll, pivot). Lectura.

Tabla 1. Diferencias entre las bases de datos transaccionales y los almacenes de datos. 6

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO

Principales aportes de un data

warehouse:

Proporciona una herramienta para la toma de decisiones en cualquier rea funcional, basndose en informacin integrada y global del negocio. Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor aadido para el negocio de dicha informacin. Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios. Simplifica dentro de la empresa la implantacin de sistemas de gestin integral de la relacin con el cliente. Supone una optimizacin tecnolgica y econmica en entornos de Centro de Informacin, estadstica o de generacin de informes con retornos de la inversin espectaculares.

Existen dos paradigmas en el campo del Data Warehousing, el paradigma de Bill Inmon y el paradigma de Ralph Kimball, ambos conocidos como los padres del Data Warehouse. El paradigma de Inmon: La tecnologa de data warehouse, forma parte de los sistemas de inteligencia de negocio. Una empresa debe tener un Data Warehouse y varios Data Marts que se nutran de la informacin del Data Warehouse. En un Data Warehouse la informacin puede estar almacenada en 3 ra Forma Normal. [2] Segn defini el propio Bill Inmon, un datawarehouse se caracteriza por ser: Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La informacin suele estructurarse tambin en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios. Temtico: slo los datos necesarios para el proceso de generacin del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una nica tabla del datawarehouse. De esta forma, las peticiones de informacin sobre clientes sern ms fciles de responder dado que toda la informacin reside en el mismo lugar. Histrico: el tiempo es parte implcita de la informacin contenida en un datawarehouse. En los sistemas operacionales, los datos siempre reflejan el estado de la actividad del negocio en el momento presente. Por el contrario, la informacin almacenada en el datawarehouse sirve, entre otras cosas, para realizar anlisis de tendencias. Por lo tanto, el datawarehouse se carga con los distintos valores que toma una variable en el tiempo para permitir comparaciones. No voltil: el almacn de informacin de un datawarehouse existe para ser ledo, pero no modificado. La informacin es por tanto permanente, significando la actualizacin del datawarehouse la incorporacin de los ltimos valores que tomaron las distintas variables contenidas en l sin ningn tipo de accin sobre lo que ya exista.

El paradigma de Kimball: Un Data Warehouse es la unin de todos los Datamarts de las diferentes reas de una empresa. La informacin se almacena siguiendo un modelo dimensional. [2] Ambos paradigmas son vlidos pero se considera al de Ralph Kimball como el ms ajustado a la evolucin de esta tecnologa dado que la mayora de las organizaciones por diversos motivos, casi siempre tiempo y costo de produccin, comienzan por la implementacin de varios Data Marts que 7

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


posteriormente se integran en un Data Warehouse, y el modelo dimensional se ha convertido en un patrn de diseo muy difundido en esta tecnologa. Otra caracterstica del datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc. Los metadatos sern los que permiten simplificar y automatizar la obtencin de la informacin desde los sistemas operacionales a los sistemas informacionales. Los objetivos que deben cumplir los metadatos, segn el colectivo al que va dirigido, son: Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su propio lenguaje de negocio, indicando qu informacin hay y qu significado tiene. Ayudar a construir consultas, informes y anlisis, mediante herramientas de Business Intelligence como DSS, EIS o CMI. Dar soporte a los responsables tcnicos del datawarehouse en aspectos de auditora, gestin de la informacin histrica, administracin del datawarehouse, elaboracin de programas de extraccin de la informacin, especificacin de las interfaces para la realimentacin a los sistemas operacionales de los resultados obtenidos... etc.

Para comprender ntegramente el concepto de datawarehouse, es importante entender cual es el proceso de construccin del mismo, denominado ETL (Extraccin, Transformacin y Carga), a partir de los sistemas operacionalees de una compaa: Extraccin: obtencin de informacin de las distintas fuentes tanto internas como externas. Transformacin: filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin. Carga: organizacin y actualizacin de los datos y los metadatos en la base de datos. El desarrollo de los sistemas de informacin sustentados sobre bases de datos, ha trado como consecuencia la proliferacin de herramientas de consultas cada vez ms complejas. Por tanto, es necesario distinguir los diferentes tipos de procesamiento existentes: el procesamiento transaccional y el procesamiento analtico.

PROCESAMIENTO ANALTICO
Los datawarehouse soportan el procesamiento analtico en lnea, conocido como OLAP ( On-Line Analytical Processsing), El procesamiento OLAP rene un gran nmero de operaciones (solamente de consulta), en las se cruzan gran cantidad de informacin con el objetivo final de crear informes y resmenes que sean tiles en la toma de decisiones. Los algoritmos que utiliza estn implementados para optimizar los tiempos de respuesta a las consultas, logrando eficiencia y almacenando los datos en estructuras especializadas. [12] OLAP fue creado bajo las siguientes ideas: Lograr rapidez de respuesta: entregar la informacin a los usuarios finales en el menor tiempo posible, de 0 a 5 segundos. Posibilitar el anlisis: Ofrecer anlisis numrico y estadstico de los datos, con valores agregados. Esto permite analizar tendencias, causas, detectar variables de inters y descender hasta los niveles ms bajos de la informacin, lo que se complementa con la ayuda de los motores de reportes y grficos que se incluyen. Tambin incluye vistas personalizadas. Compartir Datos: Incluye los mecanismos de seguridad necesarios para compartir la informacin entre los usuarios que se definan. Basado en un Estructura Multidimensional : Haciendo sencilla la seleccin y navegacin de los datos. 8

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


Recuperacin de Informacin: Acceso a los datos y recuperacin de informacin valiosa (solo lectura) para las diferentes aplicaciones clientes. Existen tres tipos de OLAP: Sistemas M-OLAP En un sistema M-OLAP los datos se encuentran almacenados en archivos con estructura multidimensional, los cuales reservan espacio para todas las combinaciones de todos los posibles valores de todas las dimensiones de cada una de las variables, incluyendo los valores de dimensin que representan acumulados. Es decir, un sistema M-OLAP contiene precalculados (almacenados) los resultados de todas las posibles consultas a la base de dato]. M-OLAP consigue consultas muy rpidas a costa de mayores necesidades de almacenamiento, y retardos en las modificaciones (que no deberan producirse salvo en casos excepcionales), y largos procesos batch de carga y clculo de acumulados. MOLAP es la forma clsica de OLAP. Se construye el almacn de datos directamente sobre estructuras matriciales multidimensionales. Se almacenan las agregaciones y una copia de los datos bases. Una vez realizada la carga, el motor de MOLAP se encarga de brindar la informacin detallada y agregada. Solo se requiere la participacin del servidor de bases de datos cuando se vuelvan a procesar los datos. El sistema M-OLAP utiliza una arquitectura de dos niveles: La bases de datos multidimensionales y el motor analtico. [10] Sistemas R-OLAP (Relational OLAP) Se construye el almacn de datos directamente sobre un gestor de base de datos relacional, todas las tablas (hechos y dimensiones) son almacenadas en tablas relacionales. En R-OLAP, al contener solo las combinaciones de valores de dimensin que representan detalle, es decir, al no haber redundancia, el archivo de base de datos es pequeo. Los procesos batch de carga son rpidos (ya que no se requiere agregacin), y sin embargo, las consultas pueden ser muy lentas, por lo que se aplica la solucin de tener al menos algunas consultas precalculadas. El sistema R-OLAP utiliza una arquitectura de tres niveles. La base de datos relacional maneja los requerimientos de almacenamiento de datos, y el motor R-OLAP proporciona la funcionalidad analtica. El nivel de base de datos usa bases de datos relacionales para el manejo, acceso y obtencin del dato. El nivel de aplicacin es el motor que ejecuta las consultas multidimensionales de los usuarios. El motor R-OLAP se integra con niveles de presentacin, a travs de los cuales los usuarios realizan los anlisis OLAP. HOLAP (Hybrid OLAP): usa tablas relacionales para almacenar la informacin base y estructuras multidimensionales para las agregaciones, o sea, es una combinacin de los dos anteriores. Cada uno de los tipos de OLAP tienen beneficios en dependencia del problema en que se aplique. MOLAP requiere de menor espacio de almacenamiento y es ms rpido calculando las agregaciones y devolviendo las respuestas, aunque se recomienda emplear para pequeos volmenes de datos. ROLAP es considerado el ms escalable, pero es ms lento en el pre procesamiento y rendimiento de las consultas. HOLAP es rpido en el pre procesamiento y rendimiento de las consultas, aunque ms lento que MOLAP y es escalable. HOLAP es ideal para grandes fuentes de datos. [17]

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


R-OLAP vs. M-OLAP

M-OLAP
Consulta rpidas debido a la optimizacin del rendimiento de almacenamiento, la indexacin multidimensional y la memoria cach. La etapa de procesamiento (carga de datos) puede ser bastante larga, sobre todo para grandes volmenes de datos. Normalmente, esto se puede evitar con un procesamiento incremental, es decir, solo el procesamiento de los datos que han cambiado (por lo general, los nuevos datos) en lugar de volver a procesar de todo el conjunto de datos. Las herramientas M-OLAP tradicionalmente tienen dificultades para consultar con modelos con dimensiones muy altas (del orden de millones de miembros). Eficaz extraccin de datos lograda gracias a la pre-estructuracin de los datos agregados. El modelo de almacenamiento en vectores/matrices proporciona una indexacin natural.

R-OLAP
Las herramientas R-OLAP tienen menor rendimiento que las herramientas MOLAP. Con una gran variedad disponible de herramientas de carga de datos, y la posibilidad de ajustar el cdigo ETL(Extract, Transform, Load) a un modelo de datos particular, los tiempos de carga son generalmente mucho menores que con las cargas M-OLAP automatizadas. R-OLAP se considera ms escalable para manejar grandes volmenes de datos, especialmente modelos con dimensiones de gran cardinalidad. La carga de tablas agregadas debe ser gestionado por cdigo personalizado ETL. Las herramientas R-OLAP no ayudan con esta tarea. Esto significa que se necesita ms tiempo de desarrollo de cdigo. R-OLAP se basa en una base de datos de propsito general para consultar y cachear, y por lo tanto hay varias tcnicas especiales empleadas por las herramientas M-OLAP que no estn disponibles (tales como el indexado jerrquico especial). Sin embargo, las herramientas modernas R-OLAP toman ventaja de las ltimas mejoras en el lenguaje SQL tales como los operadores CUBE y ROLLUP, Vistas de Cubo DB2, as como tambin otras extensiones SQL OLAP. Estas mejoras SQL pueden mitigar los beneficios de las herramientas M-OLAP.

MODELO MULTIDIMENSIONAL
El modelo multidimensional dentro del entorno de las bases de datos, es una disciplina de diseo que se sustenta en el modelo entidad relacin y en las realidades de la ingeniera de texto y datos numricos. [9] Dadas las caractersticas de los almacenes de datos es ideal la utilizacin en su diseo de un Modelo Multidimensional (MMD). Este tipo de diseo tiene como ventajas sobre el Modelo EntidadRelacin (MER), que es muy flexible, est desnormalizado y orientado a los intereses de un usuario final, aunque esto no significa que existan inconsistencias en los datos. Mediante la

10

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


utilizacin de un MMD se disminuye la cantidad de tablas y relaciones entre ellas, lo que agiliza el acceso a los datos. [18] El modelo multidimensional se representa a travs de la definicin de las tablas de hechos y dimensiones. Tablas de Hechos: Representan la ocurrencia de un determinado proceso dentro de la organizacin y no tienen relacin entre s. Generalmente, almacenan medidas numricas, las que representan valores de las dimensiones, aunque en ocasiones estas no estn presentes y se les denominan tablas de hechos sin hechos. La llave de la tabla de hecho, es una llave compuesta, debido a que se forma de la composicin de las llaves primarias de las tablas dimensionales a las que est unida. Existen tablas de hechos que no contienen medidas, a estas tablas se les denomina tablas de hechos sin hechos, es decir, la relacin entre las dimensiones que definen la llave de esta tabla de hecho implica por si sola la ocurrencia de un evento. Tablas de Dimensiones: Contienen, generalmente, una llave simple y atributos que la describen. En dependencia del esquema de diseo que se asuma pueden contener llaves forneas de otras tablas de dimensin. Existe una dimensin fundamental en todo DW, la dimensin tiempo. Esto ocurre porque todo registro que se incluya constituye la ocurrencia de un fenmeno en un instante de tiempo definido. Dicha dimensin es la que establece uno de los objetivos fundamentales de la construccin de un DW, la conservacin de un histrico. Los atributos dimensionales son fundamentalmente textos descriptivos, estos juegan un papel determinante porque son la fuente de gran parte de todas las necesidades que deben cubrirse, adems, sirven de restricciones en la mayora de las consultas que realizan los usuarios. Esto significa, que la calidad del modelo multidimensional, depender en gran parte de cuan descriptivos y manejables, sean los atributos dimensionales escogidos. La dimensin ms importante de un Data Warehouse, es la dimensin tiempo, ya que esta ser la encargada de decir en que momento ocurri este hecho. Existen varios esquemas para el modelado de los datos en un Data Warehouse siendo los ms utilizados: Esquema de Estrella: La tabla de hechos est en el centro de la estrella y estn relacionadas con ella de forma radial todas las tablas de dimensiones, las cuales no se relacionan entre s. No existen caminos alternativos en las dimensiones. Esquema de Copo de Nieve: Es parecido al de estrella pero existen jerarquas en las dimensiones. Las tablas de dimensiones pueden estar relacionadas, o sea, existen caminos alternativos en ellas. La ventaja fundamental que proporciona este esquema, es que se ocupa menor espacio de almacenamiento, sin embargo, aumenta el nmero de tablas con las que el usuario debe interactuar e incrementa la complejidad de las consultas a realizar. El esquema estrella proporciona mayor compresin, navegabilidad, es ms cercano a como el usuario final refleja la visin de una consulta empresarial. Se recomienda que de ser posible se emplee un esquema estrella antes que un copo de nieve, justificndose la utilizacin de mayor espacio de almacenamiento, en la disminucin del tiempo de obtencin de la informacin que se necesita.

HERRAMIENTAS DE INTELIGENCIA DE NEGOCIO DE SOFTWARE LIBRE (OPEN SOURCE)


La comunidad Open Source hoy en da ha incursionado prcticamente en todas las reas de la informtica y existen algunas donde su supremaca es indudable. En el rea de la Inteligencia de Negocio tambin se ha producido un despegue en el desarrollo de soluciones. Una solucin basada en Inteligencia de Negocio, de acuerdo a sus caractersticas debe de estar soportada por un conjunto de herramientas donde se establece una cooperacin entre ellas para transitar por las diferentes etapas del proceso de anlisis de los datos, desde la adquisicin hasta la visualizacin de los resultados. Entre las principales herramientas disponibles estn: 11

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


Herramientas ETL: Kettle, Clover, Enhydra Octopus, etc. Desarrollo OLAP: Mondrian y JPivot. Minera de Datos: WEKA, YALE y otras herramientas con versiones libres limitadas como: Tiberius, WizWhy, CART y See5 / C5.0. Motores de Reportes y Grficos: JFreeReport, BIRT, JasperReport y JFreeChart. Entorno de desarrollo para Cuadros de Mando ( Dashboards): JetSpeed y JBoss Portal. Gestores de Bases de Datos: MySQL y PostgreSQL. Soluciones completas: Pentaho y SpagoBI.

LA PLATAFORMA BUSINESS INTELLIGENCE OPENSOURCE PENTAHO


La corporacion Pentaho es el patrocinador primario y propietario del projecto Pentaho BI. La PLATAFORMA Pentaho BI es una iniciativa en curso por la comunidad de Open Source que provee organizaciones con mejores soluciones para las necesidades de BI de una empresa. PENTAHO es un proyecto iniciado por una comunidad OpenSource, provee una alternativa de soluciones de BI en distintas reas como en la Arquitectura, Soporte, Funcionalidad e Implantacin. Estas soluciones al igual que su ambiente de implantacin estn basados en JAVA, hacindolo flexible en cubrir amplias necesidades empresariales. A travs de la integracin funcional de diversos proyectos de OpenSource permite ofrecer soluciones en reas como: Anlisis de informacin, Reportes, Tableros de mando conocido como DashBoards, Flujos de Trabajo y Minera de Datos. Pentaho se define a si mismo como una plataforma de BI orientada a la solucin y centrada en procesos que incluye todos los principales componentes requeridos para implementar soluciones basados en procesos y ha sido concebido desde el principio para estar basada en procesos. [14] La solucin Business Intelligence OpenSource Pentaho pretende ser una alternativa a las soluciones propietarias tradicionalesms completas: Business Objects, Cognos, Microstrategy, Microsoft, etc., por lo que incluye todos aquellos componentes que nos podemos encontrar en las soluciones BI propietarias ms avanzadas: [8] Reporting Anlisis Data Mining ETL Auditora de uso y rendimiento Planificador Seguridad. Perfiles Plataforma 100% J2EE, asegurando la escalabilidad, integracin y portabilidad. Servidor: puede correr en servidores compatibles con J2EE como JBOSS AS, WebSphere, Tomcat, WebLogic y Oracle AS. Base de datos: va JDBC, IBM DB2, Microsft SQL Server, MySQL, Oracle, PostgreSQL, NCR Teradata, Firebird. Sistema operativo: no hay dependencia. Lenguaje interpretado. Lenguaje de programacin: Java, Javascript, JSP, XSL (XSLT/XPath/XSL-FO). Interfaz de desarrollo: Java SWT, Eclipse, Web-based. Repositorio de datos basado en XML. 12

Algunas de sus caractersticas son:

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


Todos los componentes estn expuestos va Web Services para facilitar la integracin con Arquitecturas Orientadas a Servicios (SOA). La PLATAFORMA BI de Pentaho integra componentes OpenSource mostrando una combinacin de flujos de trabajo y administracin de procesos. En la figura 3 se muestra la arquitectura funcional de PENTAHO.

Fig.3 Arquitectura funcional de PENTAHO Las soluciones que Pentaho ofrece se componen fundamentalmente de una infraestructura de herramientas de anlisis e informes, integrados con un motor del flujo de los procesos de negocio. La plataforma ser capaz de ejecutar las reglas de negocio necesarias, expresadas en forma de procesos y actividades y de presentar y entregar la informacin adecuada en el momento adecuado. Presenta una organizacin por productos: Reporting, Anlisis, Dahsboards y Data Mining. [16] Est construdo en torno al servidor de aplicaciones J2EE JBoss y Jboss Portal, habilitando que toda la informacin sea accesible mediante un browser. Presenta informes en los formatos habituales (html, excel, pdf...) mediante JfreeReport. Para la generacin de PDFs utiliza Apache FOP. Asimismo incorpora la librera JPivot, gracias a la cual se pueden ver tablas OLAP a travs de un browser y realizar las aplicaciones tpicas de anlisis OLAP (drill down, slice and dice...). Adems, integra Pentaho Report Design Wizard, una herramienta de diseo de informes y facilita el trabajo con JfreeReport. Para generar grficos se apoyan en JFreeChart, una librera para generar los grficos ms comunes (2D, 3D, barras, lneas series temporales, Gantt...), interfaces para acceder a diferentes fuentes de datos, exportacin a PNG, JPEG y PDF y soporte para servlets, JSPs, applets y aplicaciones clientes. Los WebServices son una caracterstica fundamental de Pentaho. Las acciones, que son las tareas ms sencillas que constituyen una solucin de Pentaho, pueden publicarse como WebServices. Pentaho utiliza como motor de WebServices Apache Axis, quedando los servicios descritos en el lenguaje de definicin de servicios web WSDL.

EL SERVIDOR OLAP
Para obtener la funcionalidad de procesamiento analtico en lnea (OLAP) se utilizan otras dos aplicaciones: el servidor OLAP Mondrian, que combinado con Jpivot, permiten realizar consultas al data warehouses y permite que los resultados sean presentados mediante un navegador de modo que el usuario pueda realizar las actividades tpicas de navegacin. Mondrian utiliza MDX como 13

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


lenguaje de consulta, que fue un lenguaje propuesto por Microsoft. Funciona sobre las bases de datos estndar del mercado: Oracle, DB2, SQL-Server, MySQL, etc., lo cual habilita y facilita el desarrollo de negocio basado en la plataforma Pentaho. Mondrian es una de las aplicaciones ms importantes de la plataforma Pentaho BI. Es un servidor OLAP open source que gestiona comunicacin entre una aplicacin OLAP (escrita en Java) y la base de datos con los datos fuente. (ver figura 4) Es decir, Mondrian acta como JDBC para OLAP. Un ejemplo rpido sobre el flujo de datos es: 1. El cliente manda una solicitud de consulta bajo la interfaz web JPivot 2. Mondrian recibe la solicitud y bajo el esquema de metadatos que definen sus conceptos multidimensionales busca si ya tiene los datos en cache respondiendo rpidamente a la peticin. 3. Si los datos no se encontraron en cache ejecuta las sentencias SQL para generar los datos. 4. Se almacenan los datos recibos en cache para agilizar posteriores consultas. 5. Y finalmente se devuelve el resultado al usuario cliente a travs de la interfaz.

Fig.4 Funcionamiento de Mondrian

CAPAS DEL SERVIDOR MONDRIAN


El servidor OLAP Mondrian comprende cuatro capas. Vistas desde el nivel del usuario final, stas son: la capa de presentacin, la capa dimensional, la capa de estrella y la capa de almacenamiento. [13] La capa de presentacin determina lo que ve el usuario final en su monitor y cmo ste puede interactuar para formular nuevas consultas. Existen muchas formas de presentar los conjuntos de datos multidimensionales, como tablas pivotantes, grficos de pastel, barras y lneas, as como herramientas avanzadas de visualizacin como grficos dinmicos y mapas interactivos. Estas pueden estar escritas en Swing o JSP, los grficos pueden ser exportados a formato GIF o JPEG o pueden ser transmitidas a una aplicacin remota va XML. Por diversas y heterogneas que parezcan estas formas de presentacin, tienen en comn la gramtica multidimensional, medidas y celdas en las cuales la capa de presentacin efecta preguntas y el servidor OLAP retorna la respuesta. 14

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO


La capa dimensional analiza gramaticalmente, valida y ejecuta sentencias MDX. Una consulta es evaluada en mltiples fases. Los ejes son calculados primero y luego los valores de las celdas dentro de los ejes. Por razones de eficiencia, la capa dimensional enva requerimientos de celdas (cell-requests) a la capa de agregacin, en lotes. Un transformador de sentencias ( query transformer) permite a la aplicacin manipular consultas existentes, en vez de construir una sentencia nueva por cada peticin. Los metadatos describen el modelo multidimensional, y de qu manera se corresponde o mapea en el modelo relacional. La capa de estrella es la responsable de mantener un cach agregado. Una agregacin es un conjunto de valores de medidas (celdas) en memoria, calificadas por un conjunto de valores de columnas de dimensiones. La capa dimensional enva solicitudes de conjuntos de celdas. Si la celda requerida no est en el cach, o es derivables desplegando una agregacin del cach, el controlador de agregacin enva una solicitud a la capa de almacenamiento. La capa de almacenamiento se encuentra representada por un sistema de gestin de bases de datos relacional (SGBDR), esto es lo que convierte a Mondrian en un servidor ROLAP. Es la capa responsable de brindar celdas agregadas de datos y miembros de las tablas dimensionales. La decisin de utilizar un SGBDR se basa en que brinda toda la funcionalidad necesaria para efectuar las agregaciones requeridas para simular un modelo multidimensional, quitando la complejidad del desarrollo MOLAP y manteniendo independiente la decisin del SGBDR a ser utilizado, ganando en flexibilidad. Estas capas pueden existir en una misma mquina, o pueden encontrarse distribuidas entre diferentes mquinas. Las capas 2 y 3, las que comprenden el servidor Mondrian, deben estar en la misma mquina. La capa de persistencia (capa 4) puede encontrarse separada, siendo accedida remotamente va una conexin JDBC. En un ambiente multiusuario, la lgica de presentacin (capa 1) se alojar en la mquina de cada usuario final, a menos que la lgica de presentacin sea un modelo cliente-servidor como lo es JSP. Mondrian brinda una API (application program interface) para que las aplicaciones clientes puedan ejecutar consultas. Ya que no existe una API universalmente aceptada para ejecutar consultas OLAP, la API que ofrece Mondrian es propietaria. De todos modos, cualquiera que haya utilizado JDBC debera adaptarse fcilmente; la diferencia fundacional reside en el lenguaje de consultas: Mientras que JDBC est fuertemente ligado a SQL, Mondrian (y en general, cualquier motor OLAP) brinda soporte en un lenguaje llamado MDX (Multi-Dimensional eXpresions). Como se muestra en la figura 5, se crea una conexin a travs de un DriverManager, de forma similar a como lo hace JDBC. La consulta ( query) es anloga a una sentencia JDBC y se crea analizando una cadena MDX. El resultado se similar a un ResultSet JDBC, pero consiste de ejes y celdas en lugar de filas y columnas, dado que se est trabajando con datos multidimensionales. El rbol derivado de una consulta puede ser modificado mediante operaciones de ordenamiento y despliegue (DrillDown), ya que la tecnologa OLAP tiene como objetivo la exploracin de datos. La API presenta el esquema de base de datos como un conjunto de objetos: esquema, cubo, dimensin,jerarqua, nivel, miembro. Un esquema define una base de datos multidimensional: contiene un modelo lgico, compuesto por cubos, jerarquas y miembros en adicin a un mapeo de este modelo en un modelo fsico. El modelo lgico consiste en las construcciones usadas para escribir consultas en lenguaje MDX, esto es, cubos, dimensiones, jerarquas, niveles y miembros. import mondrian.olap.*; import java.io.PrintWriter; Connection connection = DriverManager.getConnection( "Provider=mondrian;" + 15

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO

"Jdbc=jdbc:odbc:MondrianFoodMart;" + "Catalog=/WEB-INF/FoodMart.xml;", null, false); Query query = connection.parseQuery( "SELECT {[Measures].[Unit Sales], [Measures].[Store Sales]} on columns," + " {[Product].children} on rows " + "FROM [Sales] " + "WHERE ([Time].[1997].[Q1], [Store].[CA].[San Francisco])"); Result result = connection.execute(query); result.print(new PrintWriter(System.out)); Fig.5 Ejemplo de fragmento java para conectar a Mondrian, ejecutar una consulta e imprimir el resultado El modelo fsico es la fuente de datos, la cul es presentada a travs del modelo lgico. Es tpicamente un esquema estrella, el cual consiste en un conjunto de tablas en una base de datos relacional. Los esquemas Mondrian se alojan en un archivo XML. Este esquema puede ser editado de forma manual, o utilizando las herramientas Workbench o Cube Designer de Mondrian. Jpivot es un conjunto de bibliotecas configurables JSP que permiten mostrar tablas y grficos, para mostrar la navegacin tpica de los entornos OLAP: drill-down, rotar ejes, dril-through, etc. Utiliza Mondrian como servidor OLAP preferente, pero tambin podra acceder a los cubos OLAP de Microsoft Analysis Services. La conexin con las Bases de Datos se realiza via JDBC y realiza los clculos en memoria, sin generar nuevos ficheros y bases de datos que mantener y almacenar. La principal diferencia de JPivot respecto a otras bibliotecas en Javascript es que JPivot nicamente realiza la consulta de los datos necesarios, es decir los que se muestran en ese momento a diferencia de las bibliotecas de Javascript que contienen todos los datos de la consulta y los muestran de diferente manera en funcin de los filtros aplicados.

Fig.6 Ejemplo de resultado de una consulta con la utilizacin de JPivot 16

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO HERRAMIENTAS CUBE DESIGNER Y WORKBENCH
Para crear el modelo de los datos en la plataforma Pentaho se configura la fuente de los datos y el cubo OLAP en el fichero de configuracin XML llamado fichero del esquema Cubo Mondrian (Mondrian Cube Schema). En este fichero de esquema se pueden definir las dimensiones, los niveles de jerarqua de dimensiones, los hechos y conexin a la base de datos relacional que sirve los datos para el cubo OLAP. El fichero del esquema Cubo Mondrian es un fichero del tipo XML que se puede crear con cualquier editor de texto. Esto puede resultar muy difcil y consumir mucho tiempo, pero la plataforma cuenta con las aplicaciones open source Pentaho Cube Designer y Schema Workbench que constituyen un buen apoyo al proceso de creacin de los cubos.

Fig.7 Ejemplo de diseo de un cubo utilizando Cube Designer Mondrian Schema Workbench (ver figura 8) es un entorno visual para el desarrollo y prueba de cubos OLAP Mondrian. Si bien la definicin del XML para esquemas Mondrian no es extremadamente compleja, en la prctica resulta engorroso recordar cada uno de los elementos junto a sus atributos y sub-elementos. Con esta aplicacin, se puede configurar una conexin JDBC como el modelo fsico, para luego elaborar el esquema lgico de manera simple y efectiva. Para ello el entorno ofrece un editor de esquemas con la fuente de datos subyacente para su validacin. Permite la ejecucin de consultas MDX contra el esquema y la base de datos y la navegacin por la base de datos subyacente. [11]

17

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO

Fig.8 Ejemplo de diseo de un cubo utilizando Workbench

HERRAMIENTA ETL KETTLE


Kettle es un proyecto que incluye un conjunto de herramientas para realizar las tareas ETL (extraccin, transformacin y carga). Uno de sus objetivos es que el proyecto ETL sea fcil de generar, mantener y desplegar. [19] Se compone de 4 herramientas: SPOON: permite disear de forma grfica la transformacin ETL. PAN ejecuta las transformaciones diseadas con SPOON. CHEF permite, mediante una interfaz grfica, disear la carga de datos incluyendo un control de estado de los trabajos. KITCHEN permite ejecutar los trabajos batch diseados con Chef.

Fig.9 Ejemplo de diseo e implementacin de una transformacin ETL utilizando Spoon

18

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO MINERA DE DATOS


Pentaho incorpora la tecnologa WeKa, la que provee un completo conjunto de algoritmos que automatizan los procesos de transformacin de datos a la forma en que la minera de datos puede explotarlos. Weka es una herramienta extensible e integrable que incluye herramientas para realizar transformaciones sobre los datos, tareas de clasificacin, regresin, clustering, asociacin y visualizacin. Los resultados pueden ser visualizados en modo grfico, ya sea agrupados, segmentados, en forma de rbol de decisin, bosque aleatorio, redes neurales y componentes de anlisis. Utiliza filtros para la discrecin, normalizacin, re-muestreo, seleccin y trasformacin de atributos. Maneja clasificadores proveyendo modelos para la prediccin nominal o cantidades numricas. [15] Weka est integrada por una extensa coleccin de algoritmos de Mquinas de conocimiento desarrollados por la universidad de Waikato (Nueva Zelanda) implementados en Java, tiles para ser aplicados sobre datos mediante los interfaces que ofrece o para embeberlos dentro de cualquier aplicacin. Adems, Weka contiene las herramientas necesarias para realizar transformaciones sobre los datos, tareas de clasificacin, regresin, clustering, asociacin y visualizacin. Weka est diseado como una herramienta orientada a la extensibilidad por lo que resulta sencillo aadir nuevas funcionalidades.

19

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO CONCLUSIONES


El uso de las tcnicas y arquitecturas de Inteligencia de Negocio permite solucionar uno de los problemas ms comunes que afrontan las organizaciones actuales: el procesamiento de grandes volmenes de datos y la extraccin de conocimiento con el objetivo de sentar bases para la toma de decisiones estratgicas que influyan directamente en el mejoramiento del desempeo de la organizacin. La comunidad Open Source ha dado grandes pasos en el desarrollo de herramientas informticas de Inteligencia de Negocio. En estos momentos, cuenta con proyectos estables, que constituyen variantes de solucin que merecen ser consideradas. Destaca entre ellos, el proyecto Business Intelligence OpenSource Pentaho que hoy integra el conjunto de herramientas necesarias para dar una respuesta informtica coherente, confiable y escalable a las necesidades de informacin de la empresa moderna.

20

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO REFERENCIAS BIBLIOGRFICAS


[1] Arquitectura de una solucin de Business Intelligence, http://www.sinnexus.com/business_intelligence/arquitectura.aspx.Fecha de consulta junio 2008. Bill Inmon vs. Ralph Kimball, http://www.1keydata.com/datawarehousing/ inmon-kimball.htm. Fecha de consulta junio 2008. BUSINESS INTELLIGENCE: CONCEPTOS Y ACTUALIDAD, http://www.gestiopolis.com. Fecha de consulta junio 2008. Datawarehouse, http://www.sinnexus.com/business_intelligence/datawarehouse.aspx. Fecha de consulta junio 2008. Hernndez, J.O; Ramrez, M.J.Q; Ferri, C.R: Introduccin a la Minera de Datos, Editorial Pearson, 2004. Inteligencia de negocio, http://www/ibermatica/publicaciones/Bussines Intelligence.pdf, Fecha de consulta junio 2008. Inteligencia empresarial, http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos. Fecha de consulta junio 2008. Introduccin a PENTAHO, http://www.gravitar.biz/index.php/category/pentaho/. Fecha de consulta julio 2008. Kimball Ralph:Fact Tables and Dimension Tables, http://www.intelligententerprise.com/030101/602warehouse1_1.jhtml. Fecha de consulta julio 2008.

[2] [3] [4] [5] [6] [7] [8] [9]

[10] Manuel de la Herrn Gascn, http://www.eside.deusto.es/profesores/mherran/. Fecha de consulta julio 2008. [11] Mondrian Schema Workbench, http://wiki.pentaho.com/display/PMOPEN/Mondrian+ Schema+Workbench. Fecha de consulta septiembre 2008. [12] OLAP, http://en.wikipedia.org/wiki/OLAP. Fecha de consulta julio 2008. [13] Pentaho. Architecture. Layers of a Mondrian System, http://mondrian.pentaho.org/documentation/architecture.php. Fecha de consulta septiembre 2008. [14] PENTAHO: Creacin de un cubo con Mondrian, http://www.gravitar.biz/index.php/herramientas-bi/. Fecha de consulta julio 2008. [15] Pentaho Data Mining, http://www.pentaho.com/products/data_mining/. Fecha de consulta septiembre 2008. [16] Pentaho: la solucion Open Source Business Intelligence, http://todobi.blogspot.com/2006/05/pentaho-la-solucion-open-source.html. consulta Julio 2008. Fecha de

[17] R-OLAP vs. M-OLAP, http://businessintelligence.ittoolbox.com/documents/popular-q-anda/molap-vs-rolap-1990#. Fecha de consulta julio 2008. [18] TODO BI, Informe Business Intelligence. Recopilacin de los mejores artculos de inteligencia de negocio del 2006. Abril 2006. [19] Transformacin grafica ETL con Spoon un componente de Pentaho Data Integration (Kettle), http://www.gravitar.biz/index.php/bi/introduccion-pentaho-parte-1/#comment-46. Fecha de consulta septiembre 2008. 21

LA INTELIGENCIA DE NEGOCIO. SU IMPLEMENTACIN MEDIANTE LA PLATAFORMA PENTAHO GLOSARIO DE TRMINOS


Almacn de datos: en ingls: Data Warehouse, es una coleccin de datos orientada a un dominio, integrada, no voltil y que vara en el tiempo. Business Intelligence: Conjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anlisis de datos existentes en una organizacin o empresa. Cubo: una coleccin de dimensiones y medidas en un rea temtica particular. Datamart: Es un almacn de datos departamental, o sea, orientado a un sector determinado de la organizacin. Es tambin conocido: mercado de datos. JavaServer Pages (JSP): tecnologa Java que permite generar contenido dinmico para web, en forma de documentos HTML, XML o de otro tipo. Las JSP's permiten la utilizacin de cdigo Java mediante scripts. Adems es posible utilizar algunas acciones JSP predefinidas mediante etiquetas. Estas etiquetas pueden ser enriquecidas mediante la utilizacin de Libreras de Etiquetas externas e incluso personalizadas. Minera de Datos: Conjunto de tcnicas para la induccin de conocimiento til a partir de masas muy grandes de datos. Tiene un solapamiento importante con otras disciplinas como la estadstica tradicional, el reconocimiento de patrones, la inteligencia artificial, etc. Procesamiento Analtico en Lnea: (OLAP), consiste en la realizacin de consultas a estructuras multidimensionales que contienen datos resumidos. Su objetivo fundamental es lograr altas velocidades en consultas complejas. Software Libre: Software que, una vez obtenido, puede ser usado, copiado, estudiado, modificado y redistribuido libremente. El software libre suele estar disponible gratuitamente en Internet, o a precio del costo de la distribucin a travs de otros medios. XML: sigla en ingls de Extensible Markup Language (lenguaje de marcas ampliable). Es un metalenguaje extensible de etiquetas y permite definir la gramtica de lenguajes. Se propone como un estndar para el intercambio de informacin estructurada entre diferentes plataformas.

22

Potrebbero piacerti anche