Sei sulla pagina 1di 47

RESUMEN

El presente Proyecto de tesis titulado Propuesta de un Business Intelligence para la Toma de Decisiones en una Empresa de Rubro Textil, tiene como objetivo principal proponer una solucin utilizando una metodologa prctica y una herramienta tecnolgica de BI, las cuales soporten las necesidades y requerimientos de las personas involucradas con KUNA.

Este proyecto consiste en presentar la informacin requerida de una manera amigable y resumida.

En primer lugar, se identifico las fuentes de informacin y mediante procesos ETL de Pentaho se pobl el almacn, adems de otra informacin relacionada a los procesos seleccionados. Luego se hizo el modelamiento conceptual y lgico de los datos usando el esquema Estrella para el Modelamiento de los Datawarehouse; y por ltimo, se utilizo la herramienta Report Designer de Pentaho para la explotacin de informacin, y la presentacin de resultados.

La implementacin fue realizada en KUNA, permitiendo as evaluar el comportamiento de las Ventas en los Puntos de Venta para posteriores Compras, Abastecimientos, Promociones, etc. y la respectiva Toma de Decisiones eficaz y eficiente.

ABSTRACT

This thesis project entitled "Proposal for a Business Intelligence for Decision-Making in a textile industry company" has as main objective to propose a solution using a practical and technological BI tool, which support the needs and requirements of the people involved with KUNA.

This project is to present the required information in a friendly manner and summarized.

First, it identifies the sources of information and using Pentaho ETL process populated the warehouse, and other information related to the selected processes. Then there was conceptual and logical modeling of data using the star schema for the data warehouse modeling, and finally, use the Pentaho Report Designer tool for the exploitation of information, and presentation of results.

The implementation was done in KUNA, thus allowing to evaluate the performance of sales in the POS for subsequent purchases, supplies, ideas, etc., and the respective Decision Making effective and efficient.

INTRODUCCION

Hoy, las empresas se encuentran en un cambio y crecimiento constante, buscando el mejoramiento continuo en sus actividades. Para mantenerse en el auge competitivo es necesaria la respuesta gil a todo tipo de situaciones, y contando con informacin precisa permitir una capacidad mayor de anlisis y velocidad en la Toma de Decisiones.

Durante un largo periodo el acceso a datos demandaba tiempo y costo, generando inconformidad. Gracias a los nuevos sistemas para la administracin de informacin, y al uso de metodologas este tiempo y costo se ha minimizado, es as, que las empresas se encuentran preparadas ante cualquier cambio en el nicho de negocio.

El presente proyecto tiene como finalidad mostrar el manejo de informacin, y as la posterior toma de decisiones en las diferentes jerarquas, con la implementacin de un Business Intelligence, considerando COSTO y BENEFICIO para con la empresa y el usuario final, considerando los procesos de calidad empresarial, adems de la gestin de la informacin, entre otros.

Considero indispensable, KUNA, debe estar preparada para todos los cambios posibles en el macroambiente externo e interno, considerando as, a los factores sociales y culturales, a la competencia, a las condiciones econmicas del entorno, a la tecnologa, manteniendo su continuidad en el negocio y posicionamiento estratgico.

El proyecto ha sido estructurado en cinco captulos:

En el Captulo I, Planteamiento Terico, se da la definicin del Proyecto y se describen los objetivos.

En el Captulo II, Marco Terico, se presentan conceptos tericos para comprender la estructura del proyecto.

En el Captulo III, Caso de Estudio, se presenta a la empresa en donde se aplica el proyecto, Incalpaca TPX especficamente a su marca KUNA, as como la estructuracin de sus procesos.

En el Captulo IV, Propuesta de Desarrollo, se presentan las consideraciones iniciales, as como la metodologa HEFESTO utilizada para el Desarrollo e Implementacin del BI, y visualizacin de los reportes esperados.

En el Capitulo V, Evaluacin de la Propuesta, se presentan las conclusiones del proyecto basados en los objetivos propuestos.

Y por ltimo, las recomendaciones del caso.

CAPITULO I

PLANTEAMIENTO TEORICO

1.1.

EL PROBLEMA

1.1.1. ENUNCIADO DEL PROBLEMA

Propuesta de un Business Intelligence para la Toma de Decisiones en una Empresa de Rubro Textil.

1.1.2. DESCRIPCION DEL PROBLEMA

Es primordial para toda empresa u organizacin, un buen manejo de su informacin que conlleve a la toma de decisiones precisa y eficiente considerando las herramientas y tcnicas de extraccin, transformacin y carga de datos convertidos en informacin til, de manera que le permita mantenerse en el auge de la competitividad.

Los continuos cambios a nivel mundial van afectando la economa y los intereses de los consumidores, aclarando que no solo es un tema de calidad del producto y/o servicio ofrecido, sino de la importancia del plan estratgico de la organizacin para afrontar los diversos cambios internos como externos.

Las organizaciones optan por aplicativos de BI por muchas razones, por ejemplo: soporte a toma de decisiones, consultas y reportes, solucin OLAP, dashboards, forecasting, etc.

Segn [1]; Business Intelligence o traducido al espaol, Inteligencia de Negocios o Inteligencia Empresarial, es el conjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anlisis de los datos existentes en una organizacin o empresa.

Es por eso que, considerando el mejoramiento continuo de la Empresa INCALPACA TPX S.A. ante la problemtica mundial, y a falta de no contar con informacin clara y adecuada que permita a directivos, gerencias y jefaturas tomar decisiones precisas, este proyecto facilita un entorno de trabajo que ayudara a la mencionada empresa, especficamente a su Marca KUNA, a convertirse en una empresa gil para responder a todo tipo de situaciones considerando la vulnerabilidad de los ciclos econmicos, la lealtad de sus clientes, la creciente presin de normativas y las expectaciones de sus accionistas.

1.1.2.1.AREA CIENTIFICA A LA QUE CORRESPONDE EL PROBLEMA

1.1.2.1.1. AREA

Tecnologas de Informacin.

1.1.2.1.2. LINEA

Inteligencia de Negocios.

1.1.2.2.ANALISIS DE LAS VARIABLES

1.1.2.2.1. VARIABLE INDEPENDIENTE

Propuesta de Implementacin. Necesidad de Conocimiento para la Toma de Decisiones.

Indicadores:

Factibilidad. Adaptabilidad. Escalabilidad. Confiabilidad.

1.1.2.2.2. VARIABLE DEPENDIENTE

Business Intelligence.

Indicadores:

Flexibilidad al crecimiento y cambio de la informacin. Tiempo de respuesta adecuado. Seguridad y confiabilidad de la data mostrada. Usabilidad y facilidad de manejo.

1.1.2.3.TIPO Y NIVEL DE LA INVESTIGACION

1.1.2.3.1. TIPO

Aplicado.

1.1.2.3.2. NIVEL

Descriptivo.

1.1.3. JUSTIFICACION DEL ESTUDIO

A medida que las organizaciones van creciendo y las exigencias competitivas del mercado incrementan, son ms sensibles por el control interno y manejo de sus datos, y el almacenamiento de estos convertidos en informacin cada vez son ms grandes, buscando herramientas y mecanismos de anlisis ms potentes para una toma de decisiones eficaz y eficiente.

Este proyecto tiene como finalidad la implementacin de un Business Intelligence, considerando COSTO y BENEFICIO para con la empresa y el usuario final, considerando los procesos de calidad empresarial, adems de la gestin de la informacin, entre otros.

Considero indispensable, que toda empresa, as como para la marca KUNA, debe estar preparada para todos los cambios posibles en el macro-ambiente externo e interno, considerando as, a los factores sociales y culturales, a la competencia, a las condiciones econmicas del entorno, a la tecnologa.

El control de datos determinantes para los procesos, especficamente para Compras y Abastecimientos es de vital importancia, ya que de estos depende la continuidad de KUNA en el negocio y su posicionamiento estratgico.

El desarrollo e implementacin del presente proyecto resultara ser beneficioso para KUNA, por las siguientes razones:

Automatizacin y simplificacin de procedimientos en la obtencin de Reportes Grficos y Textuales.

Comparativas de Productos ms vendidos por Punto de Venta para posteriores Compras, Abastecimientos, Promociones, etc.

Entre otras consultas destinadas para KUNA y departamentos inmersos de INCALPACA TPX.

1.1.4. ALCANCES Y DELIMITACIONES DE LA INVESTIGACION

1.1.4.1.ALCENCES

1.1.4.1.1. AMBITO DEL PROYECTO

Los datos relevantes al proyecto y las verificaciones de aplicabilidad del estudio son de Ventas, Transferencias, Contratos; los cuales sern utilizados para el anlisis y desarrollo respectivo del Proyecto Propuesto.

1.1.4.1.2. ALCANCES

El presente Proyecto pretende:

Demostrar los beneficios de utilizar una herramienta en la Implementacin de un Business Intelligence.

1.1.4.2.DELIMITACIONES

1.1.4.2.1. ESPACIAL

El proyecto propuesto se desarrollara en la Empresa Incalpaca Textiles Peruanos de Exportacin S.A., especficamente para su marca KUNA, en la ciudad de Arequipa.

10

1.1.4.2.2. TEMPORAL

Los datos usados para el proyecto, son comprendidos en los aos Enero 2009 Junio 2011.

1.1.4.2.3. SOCIAL

El proyecto propuesto est dirigido a la Gerencia de KUNA, Jefatura de Administracin y Logstica KUNA, Jefatura de Sistemas.

1.1.4.2.4. CONCEPTUAL

El proyecto propuesto se basa en variables e indicadores que medirn los resultados finales de este.

1.2.

OBJETIVOS

1.2.1. OBJETIVO GENERAL

Proponer un Business Intelligence para la toma de decisiones en una Empresa de Rubro Textil.

11

1.2.2. OBJETIVOS ESPECIFICOS

Analizar y Evaluar la problemtica del entorno organizacional y procesos de negocio.

Demostrar la importancia al transformar datos en conocimiento para la toma de decisiones implementando un Business Intelligence para KUNA.

Justificar el uso de la herramienta seleccionada para la toma de decisiones considerando Costo/Beneficio para la Organizacin.

1.3.

HIPOTESIS

DADO QUE a falta de una buena organizacin de datos claros y precisos que permita la toma de decisiones en KUNA, ES PROBABLE QUE la implementacin de un Business Intelligence apoye a los procesos inmersos al cumplimiento de las Estrategias Empresariales.

12

CAPITULO II

MARCO TEORICO

2.1.

INTELIGENCIA DE NEGOCIOS

2.1.1. INTRODUCCION

Figura 2.1. Ciclo de Business Intelligence (Fuente: [IN0201])

Tambin conocida como

Inteligencia Empresarial o BI (BUSINESS

INTELLIGENCE), es la solucin a la Administracin de Informacin generando Conocimientos y as, escenarios, pronsticos y reportes que apoyen a la toma de decisiones en el momento y lugar correcto incrementando la efectividad de una empresa.

13

2.1.2. DEFINICION

Segn [2]; La Inteligencia de Negocios se refiere a un anlisis de alta tecnologa de los datos corporativos con el fin de tomar decisiones estratgicas. Esta implica buscar y analizar datos provenientes de mltiples fuentes ubicadas en toda la empresa y externos a ella.

Segn [3]; La Inteligencia de Negocios es el cconjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anlisis de datos existentes en una organizacin o empresa. Este conjunto de herramientas y metodologas tienen en comn las siguientes caractersticas: Accesibilidad a la informacin, apoyo en la toma de decisiones y orientacin al usuario final.

Segn [4]; La Inteligencia de Negocios es el uso de un almacn de informacin como herramienta estratgica y tctica para ganar ventaja competitiva, as como apoyar el proceso de toma de decisiones. Adems, de la habilidad de explorar y analizar datos para revelar la existencia de tendencias dentro de un negocio bajo un set de tecnologas que van desde arquitecturas para almacenar datos, metodologas, tcnicas para analizar informacin y software entre otros, con un fin comn para el apoyo a la toma de decisiones.

14

Segn [14]; Inteligencia de Negocios se puede presentar como el proceso de integracin y tratamiento de los datos para convertirlos en informacin relevante, que provea a las organizaciones del conocimiento necesario para la obtencin de ventajas competitivas.

Entonces, podemos considerar a la Inteligencia de negocios como el proceso de integracin y tratamiento de datos que convertidos en informacin proporcionan conocimiento para apoyar la toma de decisiones en una organizacin bajo herramientas y metodologas que permitan la extraccin, transformacin y carga de la informacin.

2.1.3. NIVELES DE USO DE DATOS

Segn [8]; Tanto en empresas pequeas como en grandes organizaciones existen variados sistemas informatizados que tienen como objetivo principal garantizar la persistencia de las operaciones diarias realizadas. Estas operaciones se realizan segn reglas de negocios predefinidas y se almacenan en grandes bases de datos. Dentro de las organizaciones se pueden reconocer distintos niveles de uso de los datos como se ve en la (Figura 2.2.)

15

Figura 2.2. Niveles de Uso de Datos (Fuente: [IN0202])

Plazo Corto plazo Mediano plazo Largo plazo

Nivel Operacional y Administrativo De Conocimientos Estratgico

Uso Obtencin y control de datos Decisiones tcticas Decisiones estratgicas

Tabla 2.1. Consumo de Informacin segn niveles (Fuente: [IN0202])

2.1.4. BENEFICIOS

Genera ventaja competitiva al ser un factor estratgico para la empresa u organizacin.

Mejora la calidad en la toma de decisiones. Orienta soluciones al usuario final. Asiste a las reas involucradas para planear u pronosticar el trabajo, respuesta rpida a los cambios del entorno del negocio.

16

Segn [15]; Entre los beneficios ms importantes que BI proporciona a las organizaciones, vale la pena destacar los siguientes:

Reduce el tiempo mnimo que se requiere para recoger toda la informacin relevante de un tema en particular, ya que la misma se encontrar integrada en una fuente nica de fcil acceso.

Automatiza la asimilacin de la informacin, debido a que la extraccin y carga de los datos necesarios se realizar a travs de procesos predefinidos.

Proporciona herramientas de anlisis para establecer comparaciones y tomar decisiones.

Cierra el crculo que hace pasar de la decisin a la accin. Permite a los usuarios no depender de reportes o informes programados, porque los mismos sern generados de manera dinmica.

Posibilita la formulacin y respuesta de preguntas que son claves para el desempeo de la organizacin.

Permite acceder y analizar directamente los indicadores de xito. Se pueden identificar cules son los factores que inciden en el buen o mal funcionamiento de la organizacin.

Se podrn detectar situaciones fuera de lo normal. Permitir predecir el comportamiento futuro con un alto porcentaje de certeza, basado en el entendimiento del pasado.

Los usuarios podrn consultar y analizar los datos de manera sencilla e intuitiva.

17

2.1.5. COMPONENTES

Figura 2.3. Componentes de Business Intelligence (Fuente: [IN0203])

2.2.

PROCESO ANALITICO EN LINEA (OLAP)

2.2.1. DEFINICION

Segn [5]; OLAP en una solucin utilizada en el campo de la llamada Inteligencia Empresarial (BI), cuyo objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de Datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de direccin, minera de datos y reas similares. 18

Segn [6]; OLAP es un trmino empleado para describir el anlisis de datos complejos del Datawarehouse. En manos de empleados cualificados, las herramientas OLAP pueden utilizar posibilidades informticas distribuidas para realizar anlisis que necesiten mayor espacio de almacenamiento y capacidad de procesamiento que el que puede prestar de forma econmica y eficaz un computador personal individual. El elemento principal de OLAP es el cubo, que contiene los datos de inters para los usuarios.

2.2.2. TIPOS DE SISTEMAS OLAP

ROLAP Almacn de Datos: Motor Relacional Tablas Normalizadas Esquema de Trabajo: Estrella o Copo de Nieve Arquitectura: Servidor de datos relacional y motor OLAP Anlisis de enorme cantidad de datos

Sistemas OLAP MOLAP

HOLAP

Almacn de Datos: Almacn de Datos: Base de Datos Motor Relacional / Base Multidimensional de Datos Mejor rendimiento: Multidimensional indexacin y Engloba tcnicas que optimizacin de combinan MOLAP y almacenamiento. ROLAP. Menos espacio para almacenamiento: tcnicas de comprensin.

Tabla 2.2. Tipos de Sistemas OLAP (Fuente: [IN0204])

19

2.2.3. OLTP VS. OLAP

OLTP Bases de Datos orientadas al Procesamiento de Transacciones. El acceso a los datos est optimizado para tareas frecuentes de lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen que soportar las BD de bancos o hipermercados diariamente). Los datos se estructuran segn el nivel aplicacin (programa de gestin a medida, ERP o CRM implantado, sistema de informacin departamental...). Los formatos de los datos no son necesariamente uniformes en los diferentes departamentos (es comn la falta de compatibilidad y la existencia de islas de datos). El historial de datos suele limitarse a los datos actuales o recientes.

OLAP Bases de Datos orientadas al Procesamiento Analtico. El acceso a los datos suele ser de slo lectura. La accin ms comn es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones. Los datos se estructuran segn las reas de negocio, y los formatos de los datos estn integrados de manera uniforme en toda la organizacin. El historial de datos es a largo plazo, normalmente de dos a cinco aos. Las bases de datos OLAP se suelen alimentar de informacin procedente de los sistemas operacionales existentes, mediante un proceso de extraccin, transformacin y carga (ETL).

Tabla 2.3. Comparativa entre Sistema OLAP y OLTP (Fuente: [IN0205])

20

2.3.

GESTION DEL CONOCIMIENTO

Segn [16]; La Gestin del Conocimiento es, en definitiva, la gestin de los activos intangibles que generan valor para la organizacin. La mayora de estos intangibles tienen que ver con procesos relacionados de una u otra forma con la captacin, estructuracin y transmisin de conocimiento. Por lo tanto, la Gestin del Conocimiento tiene en el aprendizaje organizacional su principal herramienta.

En este momento deberamos plantearnos cul es la diferencia entre dato, informacin y conocimiento:

Figura 2.4. Diferencia entre Datos, Informacin y Conocimiento (Fuente: [IN0206])

Dato, localizados en el mundo. Informacin, mediador entre ambos conceptos. Conocimiento, localizado en agentes (personas, organizaciones, etc.)

21

Segn [17-a]; Proceso de identificar, adquirir, utilizar y crear, tanto datos como informacin y conocimientos, relevantes, externos e internos a la organizacin, para mejorar tanto la eficiencia como la eficacia de la empresa con el fin de garantizar su permanencia en el escenario competitivo.

2.4.

DATA WAREHOUSE

2.4.1. INTRODUCCION

Tambin conocido como Almacn de Datos.

Antes de implementar un BI es necesario gestionar datos guardados en diversos formatos, fuentes y tipos, para luego depurarlos e integrarlos, adems de almacenarlos en un solo destino o BD que permita su posterior anlisis y exploracin.

2.4.2. DEFINICION

Segn [9]; Datawarehouse o Depsito de Datos, es una coleccin de datos orientado a temas, integrado, no voltil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales, definicin dada por Wiiliam Harvey Inmon.

22

Segn [18]; menciona a Ralph Kimball, autor que define un almacn de datos como: "una copia de las transacciones de datos especficamente estructurada para la consulta y el anlisis". Tambin fue Kimball quien determin que un datawarehouse no era ms que: "la unin de todos los Datamarts de una entidad".

2.4.3. CARACTERISTICAS

Segn [15]; quien menciona a William Harvey Inmon como el padre del DW, el cual define ciertas caractersticas para el Almacn de Datos.

2.4.3.1.ORIENTADA AL NEGOCIO

La informacin se clasifica en base a los aspectos que son de inters para la organizacin. Esta clasificacin afecta el diseo y la implementacin de los datos encontrados en el almacn de datos, debido a que la estructura del mismo difiere considerablemente a la de los clsicos procesos operacionales orientados a las aplicaciones.

2.4.3.2.INTEGRADA

Implica que todos los datos de diversas fuentes que son producidos por distintos departamentos, secciones y aplicaciones, tanto internos como externos, deben ser consolidados en una instancia antes de ser agregados al DW, y deben por lo tanto ser analizados para asegurar su calidad y limpieza, entre otras cosas.

23

A este proceso se lo conoce como Integracin de Datos, y cuenta con diversas tcnicas y subprocesos para llevar a cabo sus tareas. Una de estas tcnicas son los procesos ETL: Extraccin, Transformacin y Carga de Datos (Extraction, Transformation and Load).

2.4.3.3.VARIANTE EN EL TIEMPO

Debido al gran volumen de informacin que se manejar en el DW, cuando se le realiza una consulta, los resultados deseados demorarn en originarse. Este espacio de tiempo que se produce desde la bsqueda de datos hasta su consecucin es del todo normal en este ambiente y es, precisamente por ello, que la informacin que se encuentra dentro del depsito de datos se denomina de tiempo variable.

Esta caracterstica bsica, es muy diferente de la informacin encontrada en el ambiente operacional, en el cual, los datos se requieren en el momento de acceder, es decir, que se espera que los valores procurados se obtengan a partir del momento mismo de acceso.

2.4.3.4.NO VOLATIL

La informacin es til para el anlisis y la toma de decisiones solo cuando es estable. Los datos operacionales varan momento a momento, en cambio, los datos una vez que entran en el DW no cambian.

24

La actualizacin, o sea, insertar, eliminar y modificar, se hace de forma muy habitual en el ambiente operacional sobre una base, registro por registro, en cambio en el depsito de datos la manipulacin bsica de los datos es mucho ms simple, debido a que solo existen dos tipos de operaciones: la carga de datos y el acceso a los mismos. Por esta razn es que en el DW no se requieren mecanismos de control de concurrencia y recuperacin.

2.4.4. ESTRUCTURA

Segn [15]; describe cada tipo de datos que componen los almacenes de datos.

2.4.4.1.DETALLE DE DATOS ANTIGUOS

Representan aquellos datos antiguos, que no son frecuentemente consultados. Tambin se almacenan a nivel de detalle, normalmente sobre alguna forma de almacenamiento externa, ya que son muy pesados y en adicin a esto, no son requeridos con mucha periodicidad. Este tipo de datos son consistentes con los de Detalle de datos actuales. Por ejemplo, en este nivel, al igual que en el anterior, se encontrara el detalle de una venta realizada en tal fecha, pero con la particularidad de que el da en que se registr la venta debe ser lo suficientemente antigua, para que se considere como histrica.

25

2.4.4.2.METADATA

Representan la informacin acerca de los datos. De muchas maneras se sita en una dimensin diferente al de otros datos del DW, ya que su contenido no es tomado directamente desde el ambiente operacional.

Estos diferentes niveles de detalle o granularidad, se obtienen a travs de tablas de hechos agregadas y/o preagregadas.

2.4.4.3.DETALLE DE DATOS ACTUALES

Son aquellos que reflejan las ocurrencias ms recientes. Generalmente se almacenan en disco, aunque su administracin sea costosa y compleja, con el fin de conseguir que el acceso a la informacin sea sencillo y veloz, ya que son bastante voluminosos. Su gran tamao se debe a que los datos residentes poseen el ms bajo nivel de granularidad, o sea, se almacenan a nivel de detalle. Por ejemplo, aqu es donde se guardara el detalle de una venta realizada en tal fecha.

2.4.4.4.DATOS LIGERAMENTE RESUMIDOS

Son los que provienen desde un bajo nivel de detalle y sumarizan o agrupan los datos bajo algn criterio o condicin de anlisis. Habitualmente son almacenados en disco. Por ejemplo, en este caso se almacenara la sumarizacin del detalle de las ventas realizadas en cada mes.

26

2.4.4.5.DATOS COMPLETAMENTE RESUMIDOS

Son aquellos que compactan an ms a los datos ligeramente resumidos. Se guardan en disco y son muy fciles de acceder. Por ejemplo, aqu se encontrara la sumarizacin de las ventas realizadas en cada ao.

Figura 2.5. Estructura de los Datos en un Datawarehouse (Fuente: [IN0207])

2.4.5. VENTAJAS

Segn [19]; menciona las siguientes ventajas:

27

Datos de toda la compaa, organizados para facilitar las consultas ms analticas que transaccionales.

Los procesos de transformacin han sido aplicados a los datos para permitir un tiempo de respuesta mnimo a las consultas.

Modelo de fatos multidimensional para hacer ms fcil la navegacin explotacin de datos.

La administracin de la seguridad est centralizada para garantizar la necesidad de informacin dependiendo del perfil de los usuarios.

2.4.6. PROCESOS ETL

2.4.6.1.DEFINICION

Segn [7]; ETL o en ingles Extract-Transform-Load que significan Extraer, Transformar y Cargar datos. Es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organizacin y aporta los mtodos y herramientas necesarias para mover datos desde mltiples fuentes a un almacn de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, Datamart bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), tambin llamado Gestin de los Datos (Data Management).

La idea es que una aplicacin ETL lea los datos primarios de unas bases de datos de sistemas principales, realice transformacin, validacin, el proceso cualitativo, filtracin y al final escriba datos en el almacn y en este momento los datos son disponibles para analizar por los usuarios.

28

Figura 2.6. Proceso ETL (Fuente: [IN0208])

2.4.6.1.1. EXTRACCION

Obtencin de informacin de las distintas fuentes tanto internas como externas.

2.4.6.1.2. TRANSFORMACION

Filtrado, limpieza, depuracin, homogeneizacin y agrupacin de la informacin.

2.4.6.1.3. CARGA

Organizacin y actualizacin de los datos y los metadatos en la base de datos.

29

2.4.6.2.HERRAMIENTAS Y APLICACIONES ETL

IBM Websphere DataStage (anteriormente Ascential DataStage y Ardent DataStage)

Pentaho Data Integration (Kettle ETL) - Una herramienta Open Source Business Intelligence

SAS ETL Studio Oracle Warehouse Builder Cognos Decisionstream Ab Initio BusinessObjects Data Integrator (BODI) Microsoft SQL Server Integration Services (SSIS)

2.5.

DATA MART

2.5.1. DEFINICION

Segn [10]; Un DataMart es una versin especial de almacn de datos (DataWarehouse). Son subconjuntos de datos con el propsito de ayudar a que un rea especfica dentro del negocio pueda tomar mejores decisiones. Los datos existentes en este contexto pueden ser agrupados, explorados y propagados de mltiples formas para que diversos grupos de usuarios realicen la explotacin de los mismos de la forma ms conveniente segn sus necesidades.

30

El DataMart es un sistema orientado a la consulta, en el que se producen procesos batch de carga de datos (altas) con una frecuencia baja y conocida. Es consultado mediante herramientas OLAP (On line Analytical Processing Procesamiento Analtico en Lnea) que ofrecen una visin multidimensional de la informacin.

En sntesis, se puede decir que los DataMarts son pequeos DataWarehouse centrados en un tema o un rea de negocio especfico dentro de una organizacin.

Segn [11]; Un Datamart es un subconjunto de una bodega de datos para un propsito especfico (e.g., un Datamart financiero, uno de marketing, etc.). Se puede ver como una vista de la bodega de datos orientada a un aspecto de un negocio, con un tiempo de vida reducido (e.g., 3 aos).

Su funcin es apoyar a otros sistemas para la toma de decisiones. Un Datamart debe de permitir queries de muchas formas usando herramientas OLAP. Para el proceso de construccin de bodegas de datos existen dos enfoques:

Construir primero un ncleo de la bodega de datos y luego hacer varios Datamarts.

Construir primero un Datamart e ir expandiendo poco a poco la bodega de datos y aadiendo nuevos Datamarts.

31

2.5.2. VENTAJAS

Simples de implementar. Facilidad de creacin, conlleva poco tiempo de construccin y puesta en marcha.

Fcil acceso a los datos que se necesitan frecuentemente. Mejora el tiempo de respuesta del usuario final, reflejando rpidamente sus beneficios y cualidades.

Costo inferior al de la aplicacin de un completo almacn de datos.

2.5.3. ARQUITECTURA

Segn [15]; de acuerdo a las operaciones que se deseen o requieran desarrollar, los Datamart pueden adoptar las siguientes arquitecturas:

2.5.3.1.TOP-DOWN

Primero se define el DW y luego se desarrollan, construyen y cargan los DM a partir del mismo.

Esta forma de implementacin cuenta con la ventaja de no tener que incurrir en complicadas sincronizaciones de hechos, pero requiere una gran inversin y una gran cantidad de tiempo de construccin.

32

Figura 2.7. Arquitectura TOP-DOWN (Fuente: [IN0208])

2.5.3.2.BOTTOM-UP

Se definen previamente los DM y luego se integran en un DW centralizado. La ventaja que trae aparejada este modelo es que cada DM se crea y pone en funcionamiento en un corto lapso de tiempo y se puede tener una pequea solucin a un costo no tan elevado. El mayor inconveniente est dado en tener que sincronizar los hechos al momento de la consolidacin en el depsito.

Figura 2.8. Arquitectura BOTTOM-UP (Fuente: [IN0208])

33

2.6.

DATA MINING

2.6.1. INTRODUCCION

Tambin conocido como Minera de Datos.

2.6.2. DEFINICION

Segn [21]; Datamining es el conjunto de tcnicas y tecnologas que permiten explorar grandes bases de datos, de manera automtica o semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto.

Bsicamente, el datamining surge para intentar ayudar a comprender el contenido de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas.

2.6.3. ETAPAS

2.6.3.1.DETERMINACION DE LOS OBJETIVOS

Delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en data mining.

34

2.6.3.2.PRE-PROCESAMIENTO DE LOS DATOS

Seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.

2.6.3.3.DETERMINACION DEL MODELO

Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.

2.6.3.4.ANALISIS DE LOS RESULTADOS

Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

35

Figura 2.9. Carga de Trabajo en las fases de un Proyecto de Datamining (Fuente: [IN0209])

2.6.4. VENTAJAS

Resulta un buen punto de encuentro entre los investigadores y las personas de negocios.

Ahorra grandes cantidades de dinero a una empresa y abre nuevas oportunidades de negocios.

Trabajar con esta tecnologa implica cuidar un sinnmero de detalles debido a que el producto final involucra "toma de decisiones".

36

CAPITULO III

CASO DE ESTUDIO

3.1.

DESCRIPCION DE LA EMPRESA

3.1.1. IDENTIFICACION DE LA EMPRESA

La empresa en donde se desarrolla el Proyecto propuesto es INCALPACA TPX, especficamente a su marca KUNA.

3.1.1.1.INCALPACA TPX

INCALPACA TPX S.A., es una empresa peruana textil, destinada a la transformacin, produccin y comercializacin de prendas basadas en las fibras de los camlidos sudamericanos: llama, alpaca, guanaco, vicua.

En 1979, despus de 20 aos de experiencia en la produccin de hilados de Alpaca y en actividades de comercio exterior, los accionistas del GRUPO INCA decidieron incursionar en la produccin de finas telas de Alpaca, as como chompas y prendas de tejido de punto en general. Estas dos divisiones se unen a finales del ao 1996 dando lugar al nacimiento de la empresa INCALPACA TPX S.A.

37

INCALPACA actualmente cuenta con cinco lneas de produccin: Telas, Tejido de Punto, Accesorios, Confecciones en Tejido Plano y la Lnea de Casa. En todas ellas estamos comprometidos a alcanzar y mantener los ms altos estndares de calidad, innovacin y servicio al cliente.

A travs de todos estos aos, INCALPACA ha sido capaz de posicionar exitosamente sus productos tanto en el mercado nacional como en el internacional, no slo bajo los nombres de las ms prestigiosas casas de modas del mundo, sino tambin bajo sus conocidas marcas: TUMI y CONDOR; y sus tiendas KUNA. [INC01]

Figura 3.1. Logo INCALPACA TPX (Fuente: [CE0301])

3.1.1.2.KUNA

KUNA, es una franquicia internacional en pleno desarrollo que, consciente del rol que tiene en la difusin de valores peruanos, en los ms exigentes mercados, ha lanzado una imagen, rescatando elementos caractersticos del perodo milenario incaico, el cual armoniza con sofisticados sistemas de exhibicin y ventas, para la comercializacin de prendas de la ms alta calidad.

38

KUNA lleva en cada prenda la suavidad de la mejor fibra proveniente de nuestras alpacas y vicuas, llamas y guanacos, pero lleva tambin el cuidado que pone el GRUPO INCA en la conservacin, crianza y mejora de estas especies, y en la preservacin de las comunidades andinas y de sus invaluables conocimientos y cultura.

KUNA le entrega al mundo del diseo y de la moda un estilo que expresa y evoca, la obra de la naturaleza, la destreza humana y el legado de una herencia fabulosa y las convierte en una expresin contempornea con un estilo nico y cautivante.

KUNA como parte del GRUPO INCA se identifica con su filosofa empresarial Trabajando con la naturaleza por lo que, junto con las empresas que lo conforma, colabora y participa en programas de cuidado del medio ambiente, de ayuda a las comunidades andinas dedicadas a la crianza de los camlidos sudamericanos, capacitaciones a talleres textiles, as como programas que incentivan el deporte y la educacin y concientizacin de la sociedad con respecto al medio ambiente, entre otros. [KUN02]

Figura 3.2. Logo KUNA (Fuente: [CE0302])

39

3.1.2. VISION Y MISION

3.1.2.1.VISION

Vestir al Mundo con lo nuestro.

3.1.2.2.MISION

Somos un equipo socialmente responsable, especializado en transformar las fibras nobles de los andes, que con creatividad y calidad reconocidas, abrigamos a nuestros clientes.

40

3.1.3. ORGANIGRAMA

3.1.3.1.INCALPACA TPX

3.1.3.2.KUNA

41

http://es.wikipedia.org/wiki/Tabla_de_hechos

[14] http://www.slideshare.net/soreygarcia/inteligencia-de-negocios-1092940

[16] Artculo publicado por Juan Carrin Maroto,

http://www.gestiondelconocimiento.com/introduccion.htm

[17] http://www.a3net.net/es/gescon/definiciones.htm a.- Prez Castao Bernardo. Tesis Doctoral

[18] http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos

[19] http://www.slideshare.net/romangm/taller-de-inteligencia-de-negocios

[21] http://www.sinnexus.com/business_intelligence/datamining.aspx

[22] http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx

42

I.

TEXTOS

[2] RICHARD L. DAFT Teora y Diseo Organizacional 9a. Ed.

[4] INTELLEGO, Business Intelligence Consulting

[6] HARREGUY, MORALES ALVARO Migrador OLAP, Facultad de Ingeniera, Universidad de la Repblica Oriental del Uruguay, Diciembre 2000.

[15] ING. BERNABEU R. DARIO HEFESTO, Metodologa para la Construccin de un DataWarehouse, Crdoba Argentina, Julio 2010.

[20] LLUIS CANO, JOSEP BUSINESS INTELLIGENCE, Competir con Informacion, Depsito Legal: M-41185-2007. http://www.slideshare.net/pirocho/metodologia-proyectos-de-bi

II.

FIGURAS Y TABLAS

43

[IN0201] http://www.lingaro.com/lingaro/competencies/business-intelligence

[IN0202] http://www.slideshare.net/dvelasquezt/academia-latinoamericana-debusiness-intelligence-albi [IN0203] LLUIS CANO, JOSEP BUSINESS INTELLIGENCE, Competir con Informacin [IN0204] http://www.fing.edu.uy/~ruggia/T5s/Migrador-OLAP.pdf [IN0205] http://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx [IN0206] http://www.sinnexus.com/business_intelligence/piramide_negocio.aspx [IN0207] http://www.inei.gob.pe/biblioineipub/bancopub/Inf/Lib5084/14.HTM [IN0208] ING. BERNABEU R. DARIO HEFESTO, Metodologa para la Construccin de un DataWarehouse, Crdoba Argentina, Julio 2010. [IN0209] http://www.sinnexus.com/business_intelligence/datamining.aspx [CE0301] http://www.incalpaca.com

44

[CE0302] Manual de Procedimientos KUNA [CE0303] Esquema de la Organizacin INCALPACA TPX

45

ANEXO A

CUESTIONARIOS

46

ANEXO B

TIPOS DE MODELO LOGICO DEL DATAWAREHOUSE

47

Potrebbero piacerti anche