Sei sulla pagina 1di 172

UNIVERSIDAD ANDINA

NSTOR CCERES VELSQUEZ


FACULTAD DE INGENIERA DE SISTEMAS
ESCUELA PROFESIONAL DE INGENIERA DE SISTEMAS

TESIS
ESTRATEGIA EMPRESARIAL BUSINESS INTELLIGENCE PARA
EL SOPORTE A LA TOMA DE DECISIONES GERENCIALES

PRESENTADA POR:
VALDEMARD CHINO RAMIREZ

PARA OPTAR EL TTULO PROFESIONAL DE


INGENIERO DE SISTEMAS

JULIACA PER
2016
UNIVERSIDAD ANDINA
NSTOR CCERES VELSQUEZ
FACULTAD DE INGENIERA DE SISTEMAS
ESCUELA PROFESIONAL DE INGENIERA DE SISTEMAS

TESIS

ESTRATEGIA EMPRESARIAL BUSINESS INTELLIGENCE PARA EL SOPORTE


A LA TOMA DE DECISIONES GERENCIALES

PRESENTADA POR:

VALDEMARD CHINO RAMIREZ

PARA OPTAR EL TTULO PROFESIONAL DE: INGENIERO DE SISTEMAS

APROBADO POR:

PRESIDENTE : ___________________________________
MSc. Ing. Juan Benites Noriega

PRIMER MIEMBRO : ___________________________________


Dr. Ing. Richard Condori Cruz

SEGUNDO MIEMBRO : ____________________________________


MSc. Ing. Ninasivincha Garate, Ral Simen

JULIACA PER
2016
iii

DEDICATORIA

A mis familiares, amigos por


su aliento y apoyo durante el
desarrollo de la tesis.

Valdemard
iv

AGRADECIMIENTO

A mis docentes de la facultad


de ingeniera de sistemas de
la UANCV, por compartir
sus sabios conocimientos, a
los Seores Jurados por su
paciencia en la revisin del
proyecto.

Valdemard
v

NDICE
Portada ............................................................................................................................... i

Pgina de Firma de Jurados .............................................................................................. ii

Dedicatoria ....................................................................................................................... iii

Agradecimiento ............................................................................................................... iv

ndice ............................................................................................................................... v

Resumen............................................................................................................................ix

Introduccin ..................................................................................................................... .x

CAPTULO I
GENERALIDADES

1.1.PROBLEMA DE INVESTIGACIN ........................................................................ 1


1.1.1. Anlisis de la situacin problemtica ............................................................... 1
1.1.2. Descripcin del problema tipo y nivel ............................................................. 2
1.2.FORMULACIN DEL PROBLEMA........................................................................ 3
1.2.1. Problema general .............................................................................................. 3
1.2.2. Problemas especficos ..................................................................................... 3
1.3.OBJETIVOS .............................................................................................................. 3
1.3.1. Objetivo general .............................................................................................. 3
1.3.2. Objetivos especficos ....................................................................................... 4
1.4.JUSTIFICACIN ...................................................................................................... 4

CAPTULO II

MARCO REFERENCIAL

2.1.ANTECEDENTES DE LA INVESTIGACION ........................................................ 5


2.1.1. Publicaciones de Tesis ..................................................................................... 5
2.2.MARCO TERICO ................................................................................................ 11
2.2.1. BASES TERICAS ....................................................................................... 11
2.2.2. BUSINESS INTELLIGENCE ....................................................................... 11
Ventajas de un sistema de Inteligencia de Negocios ................................... 12
vi

Modelo de Madurez para Inteligencia de Negocios ................................... 14

Fase 1: No existe BI. ................................................................................... 14

Fase 2: No existe BI, pero los datos son accesibles. ................................... 15

Fase 3: Aparicin de procesos formales de toma de decisiones basada en


datos............................................................................................................. 15

Fase 4: Data Warehouse. ............................................................................. 16

Fase 5: Data warehouse crece y el reporting se formaliza. ......................... 17

Fase 6: Despliegue de OLAP. ..................................................................... 18

Fase 7: Business Intelligence se formaliza. ................................................. 19

Cundo es necesario la Inteligencia de Negocios? .................................... 19

Metodologa para aplicar Inteligencia de Negocios en una organizacin .. 20

Estrategia de Inteligencia de Negocios ...................................................... 21

2.2.3. DATA WAREHOUSE .................................................................................. 25


La base de un sistema Inteligencia de Negocios: La Bodega de datos ........ 26

Elementos de un Data warehouse ............................................................... 30

Tipos de Tablas de Hecho ........................................................................... 31

Tablas de Dimensiones ............................................................................... 32

Existen otros tipos de dimensiones cuya clasificacin es funcional ........... 33

Tipos de Mtricas ....................................................................................... 34

Esquemas para un Data warehouse ............................................................. 36

2.2.4. INTEGRACIN DE DATOS: ETL ............................................................. 37


Integracin de datos .................................................................................... 39

Tcnicas de integracin de datos ................................................................ 43

Distribucin ................................................................................................. 43

Tecnologas de integracin de datos ........................................................... 47

Uso de la integracin de datos .................................................................... 53


vii

2.2.5. DISEO DE CUBOS OLAP ......................................................................... 54


Por qu OLAP? ......................................................................................... 57

Tipos de OLAP ........................................................................................... 60

Elementos OLAP ........................................................................................ 63

2.2.6. MARCO CONCEPTUAL ............................................................................. 65


AGENTES .................................................................................................. 65

BUSINESS INTELLIGENCE .................................................................... 65

DATA MINING .......................................................................................... 65

DATA WAREHOUSE ............................................................................... 66

INTEGRACIN DE DATOS ..................................................................... 66

MULTIDIMENSIONALIDAD .................................................................. 66

OLAP .......................................................................................................... 67

CAPTULO III

METODOLOGA DE LA INVESTIGACIN

3.1.TIPO Y DISEO DE INVESTIGACION ............................................................... 68


3.1.1. TIPO DE INVESTIGACION ........................................................................ 68
3.1.2. DISEO DE INVESTIGACIN .................................................................. 68
3.2.TECNICAS E INSTRUMENTOS ........................................................................... 68
3.3.PROCEDIMIENTOS ............................................................................................... 69
3.4.POBLACION Y MUESTRA ................................................................................... 69
3.5.METODLOGIA DE DESARROLLO PARA LA ESTRATEGIA EMPRESARIAL
BUSINESS INTELIGENCE ................................................................................... 70
3.6.HIPOTESIS ............................................................................................................. 70
Hiptesis General ..................................................................................................... 70

Hiptesis Especficas ............................................................................................... 70

Variables .................................................................................................................. 70

Operacionalizacion de variables .............................................................................. 71


viii

CAPTULO IV

ANALISIS E INTERPRETACION DE RESULTADOS

4.1.RESULTADOS ....................................................................................................... 72
4.2.VALIDACIN DEL PROTOTIPO MEDIANTE LA ENCUESTA ...................... 93
4.3.MTODO DE APLICACIN ................................................................................. 93
4.4.RESULTADOS DE LA ENCUESTA ..................................................................... 94
4.5.CONTRASTACION DE LA HIPOTESIS ............................................................ 134

CONCLUSIONES ....................................................................................................... 136

RECOMENDACIONES .............................................................................................. 137

BIBLIOGRAFA ......................................................................................................... 138

ANEXOS ..................................................................................................................... 142


ix

RESUMEN

La presente investigacin ESTRATEGIA EMPRESARIAL BUSINESS

INTELLIGENCE PARA EL SOPORTE A LA TOMA DE DECISIONES

GERENCIALES que tiene por objetivo general Implementar un prototipo de

estrategia empresarial Business Intelligence para el soporte a la toma de

decisiones gerenciales.

Para lo cual se ha utilizado un tipo de estudio descriptivo y un diseo no

experimental, adems se ha utilizado la metodologa de desarrollo de prototipos.

Asimismo, se ha utilizado para la recoleccin de datos la tcnica del anlisis

documental y la observacin, con sus correspondientes instrumentos tales como

gua de anlisis documental y la gua de observacin.

Finalmente, culminada la investigacin y el informe final de tesis se

arrib a la siguiente conclusin: Se ha logrado implementar un prototipo de

estrategia empresarial Business Intelligence para el soporte a la toma de

decisiones gerenciales, utilizando la herramienta pentaho community v6.1.196.

Palabras clave: Estrategia, empresarial, Business, Inteligence, toma, decisiones.


x

INTRODUCCIN

Cuando se habla de sistemas de Informacin se tiene que mencionar los

sistemas de informacin conocidos como sistemas de inteligencia de negocios o

business intelligence, que en la actualidad son utilizados para apoyar la toma de

decisiones empresariales. Los mismos que estn basados en grandes bases de

datos organizados para realizar consultas personalizadas y acorde a las

necesidades gerenciales.

Primero fueron los datos, y aproximadamente desde 1970, las empresas

utilizaban libretas, es decir, soporte en papel, para almacenar los datos

operativos de sus negocios. En esas libretas se apuntaban las ventas realizadas,

los gastos de la empresa, los datos de los clientes. Es cierto que haba empresas

que utilizaban sistemas informticos para su gestin, pero la compra y el

mantenimiento de dichos sistemas slo estaba al alcance de las grandes

compaas. Con la aparicin de la informtica personal el uso de programas

informticos de gestin pas a ser algo comn y a estar al alcance de cualquier

empresa. Hoy en da podemos decir que cualquier empresa utiliza programas

informticos para la gestin de los datos de su explotacin diaria: compras,

ventas, gastos, gestin de clientes. Pero cul es el siguiente paso? ... despus

vino la informacin. Prcticamente todas las empresas de la actualidad disponen

de bases de datos que almacenan datos sobre sus actividades y sus colaboradores

(clientes, proveedores) mediante distintos programas informticos (programas de

contabilidad, de facturacin, de gestin de clientes, etc.).


xi

Por lo tanto, podemos decir que las empresas disponen, por norma

general, de multitud de datos histricos, fiables y rigurosos de todas las

actividades realizadas. Es lgico pensar que dichos datos podran ser refinados,

agrupados, tratados y analizados para intentar extraer informacin que

permitiera ayudar en la toma de decisiones de la empresa. Encontrar patrones de

conducta en la compra de nuestros clientes, presentar informacin en tiempo real

sobre el rendimiento de las distintas sucursales de una empresa a su direccin, o

identificar los clientes potenciales tanto de forma positiva o negativa (saber si su

costo de gestin es superior al beneficio que dejan) son ejemplos que muestran

qu se podra obtener a partir de los datos de la empresa. Este hecho, datos

operativos de las empresas en informacin que d soporte a la toma de

decisiones, es lo que se conoce como inteligencia de negocio o Business

Intelligence.

Finalmente, en la presente tesis titulada ESTRATEGIA

EMPRESARIAL BUSINESS INTELLIGENCE PARA EL SOPORTE A LA

TOMA DE DECISIONES GERENCIALES, tiene por objetivo general

Implementar un prototipo de estrategia empresarial Business Intelligence para el

soporte a la toma de decisiones gerenciales.

El informe final de la tesis est organizado en 4 captulos:

CAPTULO I: GENERALIDADES, el cual se consigna el planteamiento del

problema y la formulacin del problema, adems se formulan el objetivo general

y especfico.
xii

La problemtica radica en el hecho de no utilizar herramientas, aunque

las mejoras aparecen seguidas. las tcnicas La inteligencia de negocios es un

concepto que emergi en la dcada de los 90s como un sistema de informacin

que buscaba proporcionar la arquitectura tecnolgica necesaria para aprovechar

los datos operacionales generados por las organizaciones, esta tecnologa

buscaba tratar los datos para transformarlos en informacin, luego en

conocimiento y as utilizarlos en el proceso de toma de decisiones, de forma que

se lograra obtener y mantener ventaja competitiva. En la ltima dcada este tipo

de sistemas de informacin ha ganado madurez, pasando a ser la evolucin de

los sistemas de soporte a la toma de decisiones tradicionales, y una de las

tecnologas de informacin de mayor crecimiento en el rea de los sistemas de

soporte a la toma de decisin, segn lo revelan informes de firmas

internacionales como Hitachi, ya que en esta investigacin exploraremos los

aspectos positivos de pentaho community. Uno de estos es incorporar la

informacin no estructurada en el proceso de toma de decisiones.

CAPTULO II: MARCO REFERENCIAL, en este captulo se muestra las

teoras referidas al tema de investigacin acompaado de un marco conceptual

sobre los trminos ms utilizados en la tesis.

La base para esta investigacin est en las teoras o antecedentes. En la

actualidad, las organizaciones han empezado a utilizar herramientas de

inteligencia de negocios para la toma de decisiones. Las empresas utilizan estos

sistemas para visualizar la informacin al momento de tomar una decisin,

basndose en la calidad y cantidad de informacin analizada y as evitar una


xiii

determinacin errnea nos demuestran con un estudio realizado en Europa que

los personales de las empresas pierden una media de 67 minutos diariamente

buscando informacin de la organizacin, lo que equivale un 15,9% de su

jornada laboral, ocasionando prdidas monetarias por la falta de sistemas de

toma de decisiones. se recomienda el uso de estos sistemas de informacin, los

cuales son capaces de almacenar grandes cantidades de informacin para su

anlisis en las organizaciones; es decir, generar informacin valiosa de manera

automatizada otro de los beneficios al implementar una herramienta de BI es que

permitir a las empresas soportar las decisiones que son tomadas al nivel interno

o externo. las organizaciones no logran obtener los beneficios que ofrece un

sistema de BI, debido al mal planteamiento de los flujos de informacin entre

diversas reas.

CAPTULO III: METODOLOGA DE LA INVESTIGACIN, en este

captulo se aborda el tipo de investigacin, las tcnicas e instrumentos de

recoleccin de datos, los procedimientos a utilizar, la poblacin y la muestra

sobre la cual se ha trabajado la investigacin; y la metodologa de desarrollo

utilizada para el prototipo.

CAPTULO IV: RESULTADOS, en esta parte de la tesis se muestra los

resultados a los cuales se han arribado.

Los resultados de la prueba del aplicativo pentaho comunity versin 6.1,

en el cual se muestra las posibilidades y formas en las que se pueden transformar

los datos.
xiv

Tambin incluye los resultados de encuesta aplicada, para la

implantacin de un prototipo, los beneficios que en adelante significa para las

organizaciones.

Finalmente, se consideran las conclusiones, recomendaciones, bibliografa y los

anexos correspondientes.
1

CAPTULO I

GENERALIDADES

1.1. PROBLEMA DE INVESTIGACIN

1.1.1. Anlisis de la situacin problemtica

En la actualidad las empresas u organizaciones manejan

grandes volmenes de informacin, donde el problema es que

dicha informacin no est bien organizada y a disponibilidad de

los usuarios para beneficio de la empresa u organizacin. Por ello

se afirma lo siguiente: algo peor que no tener informacin

disponible es tener mucha informacin y no saber qu hacer con

ella.

Por lo tanto, la Inteligencia de Negocios o Business

Intelligence (BI) es la solucin a ese problema, pues por medio de

dicha informacin puede generar escenarios, pronsticos y

reportes que apoyen a la toma de decisiones, lo que se traduce en

una ventaja competitiva.

La clave para BI es la informacin y uno de sus mayores

beneficios es la posibilidad de utilizarla en la toma de decisiones.

En la actualidad hay una gran variedad de software de BI con

aplicaciones similares que pueden ser utilizados en las diferentes

reas de la empresa, tales como, ventas, marketing, finanzas, etc.

Son muchas las empresas que se han beneficiado por la


2

implementacin de un sistema de BI, adems se pronostica que

con el tiempo se convertir en una necesidad de toda empresa.

1.1.2. Descripcin del problema tipo y nivel

El problema a tratar es la carencia y la no utilizacin de

tecnologas de sistemas de informacin tales como el Business

Inteligence por las empresas de la regin de Puno, que permiten

dar apoyo a la toma de decisiones mediante la organizacin de la

informacin bases de datos utilizando minera de datos y

datawarehouse, Lo cual es determinante para la toma de

decisiones, por lo que con la presente investigacin queremos

promover el uso y difusin de la tecnologa de Business

Inteligence, por parte de gerentes y directivos de las empresas.

As mismo brindar un entorno de inteligencia de negocios

que permita mostrar un modelo que puedan seguir personas o

profesionales interesados en referencia a este tema tan importante

y de actualidad para un buen manejo de la informacin.

Esta estrategia de inteligencia de negocios permitir a las

empresas ganar ventaja frente a los competidores, ya que tendrn

informacin a la mano y necesaria para tomar decisiones

adecuadas. Lo cual conlleva una administracin de excelencia y

acorde al avance de la tecnologa de informacin y

comunicaciones.
3

El tipo de problema de investigacin ser aplicado

tecnolgica, el cual se encuentra en un nivel de investigacin

bsico descriptivo.

1.2. FORMULACIN DEL PROBLEMA

1.2.1. Problema general

Es factible implementar un prototipo de estrategia

empresarial business intelligence para el soporte a la toma de

decisiones gerenciales?

1.2.2. Problemas especficos

Es factible realizar una bsqueda de informacin sobre

herramientas de business intelligence y elegir una que nos permita

proponer un prototipo de estrategia empresarial business

intelligence para el soporte a la toma de decisiones gerenciales?

Es factible desarrollar el modelamiento del prototipo de

estrategia empresarial business intelligence para el soporte a la

toma de decisiones gerenciales?

1.3. OBJETIVOS

1.3.1. General

Implementar un prototipo de estrategia empresarial

business intelligence para el soporte a la toma de decisiones

gerenciales.
4

1.3.2. Especficos

Realizar una bsqueda de informacin sobre herramientas de

business intelligence y elegir una que nos permita proponer un

prototipo de estrategia empresarial business intelligence para el

soporte a la toma de decisiones gerenciales.

Desarrollar el modelamiento del prototipo de estrategia

empresarial business intelligence para el soporte a la toma de

decisiones gerenciales.

1.4. JUSTIFICACIN

La presente investigacin se justifica por lo siguiente:

Porque la estrategia business intelligence, en la actualidad son

indispensables para la toma de decisiones gerenciales de una

organizacin de cualquier tipo, debido a los grandes volmenes de

informacin que se manejan y la necesidad de acceso a la informacin al

momento.

La estrategia de business intelligence, como el que se muestra y

propone en esta tesis permiten que los gerentes modernos de este mundo

globalizado y basado en TICs, puedan tomar las decisiones adecuadas

con el objetivo de alcanzar el xito organizacional.

Finalmente, la presente investigacin, beneficiara a todos los gerentes de

empresas y organizaciones, brindndoles el conocimiento para aplicar la

estrategia de business intelligence.


5

CAPTULO II

MARCO REFERENCIAL
2.1. ANTECEDENTES DE LA INVESTIGACION

2.1.1. Publicaciones de Tesis

en esta etapa se hizo bsqueda en repositorios, de

investigaciones, se han encontrado los siguientes antecedentes:

a) AUTOR: Pea Ayala, Alejandro

TESIS: INTELIGENCIA DE NEGOCIOS: UNA

PROPUESTA PARA SU DESARROLLO EN LAS

ORGANIZACIONES

UBICACIN: MEXICO: presentado en el Instituto

Politcnico Nacional de Mxico.

AO: 2002

CONCLUYE: Arribo a la siguiente conclusin general: En

la obra se ha podido apreciar el mtodo para plantear y

desarrollar un sistema de Inteligencia de Negocios, a partir de

comprender un perfil que describe su naturaleza. Al apreciar

los atributos de la Inteligencia de Negocios se aprecia que esta

no reemplaza a las Tecnologas de la Informacin

convencionales. Sino que ms bien, convive con ellas e

integra a las Tecnologas del Conocimiento en un marco

organizado jerrquicamente en campas de proceso.


6

b) AUTOR: Villarreal Rosero, Roberto Xavier

TESIS: ESTUDIO DE METODOLOGAS DE

DATA WAREHOUSE PARA LA IMPLEMENTACIN DE

REPOSITORIOS DE INFORMACIN PARA LA TOMA

DE DECISIONES GERENCIALES.

UBICACIN: ECUADOR: universidad tcnica del norte

facultad de ingeniera en ciencias aplicadas, carrera de

ingeniera en sistemas computacionales.

AO: 2013

CONCLUYE: Arribo a la siguiente conclusin general: Se

realiz el estudio de metodologas de Data Warehouse para la

implementacin de repositorios de informacin para la toma

de decisiones gerenciales, y luego la aplicacin de la

metodologa seleccionada en la implementacin de una

aplicacin utilizando la herramienta de Inteligencia de

negocios Pentaho para crear reportes que permitan conseguir

los objetivos planteados, se muestran las siguientes

conclusiones:

La implementacin de herramientas de Inteligencia de

negocios en las empresas colabora al mejoramiento de la

administracin y gestin de los datos, mostrando una

mejor visin del estado actual e histrico de las empresas

o negocios a travs de la toma de decisiones oportunas.


7

La utilizacin de una metodologa de desarrollo tanto para

implementaciones de software como de desarrollo de Data

Warehouse permiten obtener productos de calidad y en

tiempos relativamente cortos ya que se conoce los pasos a

seguir y las posibles complicaciones que se puede tener en

el transcurso.

El uso de la metodologa Ralph Kimball representa u

proceso eficaz en tiempo y recursos debido a que se

obtiene la solucin al problema en corto plazo,

acoplndose a la metodologa tradicional de desarrollo de

software.

Existen excelentes herramientas de software libre para el

desarrollo de sistemas de inteligencia de negocios. La

versin community de Pentaho por ahora est siendo

mantenido por la comunidad, pero actualmente existe

alternativas a jpivot como visor OLAP.

Cuando se trata de reportes que utilizan una gran cantidad

de informacin el usuario debe tener conocer las

dimensiones y medidas que van a interactuar en el reporte

BI, para mejorar el rendimiento.


8

c) AUTOR: Marchn Rumbea, Karina Raquel

TESIS: ANLISIS DE COMPETENCIAS Y

HABILIDADES PARA QUE UN USUARIO UTILICE

HERRAMIENTAS DE INTELIGENCIA DE NEGOCIOS

EN LAS PYMES DEL ECUADOR

UBICACIN: ECUADOR: presentada en la Escuela

Superior Politcnica del Litoral en la Facultad de Ingeniera

en Electricidad y Computacin de Guayaquil.

AO: 2009

CONCLUYE: Arribo a la siguiente conclusin general: Las

PYMES ecuatorianas poseen un gran potencial para generar

produccin, empleo e ingresos es ms si el sector recibiera el

suficiente apoyo para su desarrollo como poltica de estado

para bajar el nivel de desempleo, tendra muchas condiciones

para constituirse en el motor del desarrollo y tener mayor

participacin de producir para el mercado internacional. Es

por ello que esta tesis est encaminada a transmitir a los

pequeos y medianos empresarios que la tecnologa ha

ocupado un lugar muy importante en las organizaciones ya

que ha permitido que sus procesos sean ms efectivos y

eficientes. El contar con tecnologa que se adapte a los

cambios constantes que se generan, es una ventaja competitiva

que hace que las organizaciones sigan teniendo presencia

creciente en el mercado.
9

d) AUTOR: Recasens Snchez Javier

TESIS: INTELIGENCIA DE NEGOCIOS Y

AUTOMATIZACIN EN LA GESTIN DE PUNTOS Y

FUERZA DE VENTAS EN UNA EMPRESA DE

TECNOLOGA

UBICACIN: CHILE: presentada en la universidad de

Chile Facultad de Ciencias Fsicas y Matemticas del

departamento de Ingeniera Industrial.

AO: 2011

CONCLUYE: Arrib a la siguiente conclusin general: En

el siguiente trabajo se ha logrado dar una solucin completa y

rentable a la principal problemtica de una empresa de

tecnologa que opera en el Retail chileno. Inicialmente se

tiene una compaa sin las herramientas necesarias para tomar

decisiones optimas sobre los Puntos de Venta y Fuerza de

Venta, debido principalmente a la dispersin de datos entre las

diferentes cadenas, falta de control y organizacin en los

procesos que no son apoyados por ningn sistema de

informacin que pueda automatizar la creacin de reportes de

gestin.
10

e) AUTOR: Alejandro Rojas, Zaldvar

TESIS: IMPLEMENTACIN DE UN DATA MART

COMO SOLUCIN DE INTELIGENCIA DE NEGOCIOS,

BAJO LA METODOLOGA DE RALPH KIMBALL PARA

OPTIMIZAR LA TOMA DE DECISIONES EN EL

DEPARTAMENTO DE FINANZAS DE LA

CONTRALORA GENERAL DE LA REPBLICA

UBICACIN: PERU: presentada en la Universidad San

Martin de Porras de Lima.

AO: 2014

CONCLUYE: Arribo a la siguiente conclusin general: Se

construy un modelo de datos OLAP, que permiti ejecutar

las consulta, a partir de informacin previamente procesada

obteniendo como resultado la flexibilidad al usuario al realizar

las diferentes consultas pre elaboradas. Adems, se efectuaron

las pruebas, para corregir los errores siguiendo la solucin de

inteligencia de negocios y se dise las interfaces, mediante la

herramienta QlikView para desplegar el cubo OLAP


11

2.2. MARCO TERICO

2.2.1. BASES TERICAS

2.2.1.1.BUSINESS INTELLIGENCE

El desarrollo de las empresas en el contexto del

anlisis de la informacin ha propiciado la necesidad de

tener mejores, ms rpidos y ms eficientes mtodos para

extraer y transformar los datos de una organizacin en

informacin y distribuirla a lo largo de la cadena de valor.

La inteligencia de negocio responde a esta

necesidad, y se puede entender, en una primera

aproximacin, que es una evolucin de los sistemas de

soporte a las decisiones (DSS, Decissions Suport

Systems). El concepto de Inteligencia de negocios, a pesar

de ser un tema crtico e importante en las empresas, no es

un tema nuevo. En octubre de 1958 Hans Peter Luhn,

investigador de IBM, acu el trmino en el artculo A

Business Intelligence System: La habilidad de aprender

las relaciones de hechos presentados de la forma que guen

las acciones hacia una meta deseada. (Oramas, 2009)

Se puede precisar hoy como:

La adquisicin y utilizacin de conocimiento

basado en hechos para mejorar la estrategia del negocio y

las ventajas tcticas del mercado. (Oramas, 2009)


12

Desde entonces, el concepto ha evolucionado apilando

diferentes tecnologas, metodologas y trminos bajo ste

concepto. Es necesario, por lo tanto, establecer una

definicin formal: Se entiende por Business

Intelligence al conjunto de metodologas, prcticas,

aplicaciones y capacidades enfocadas a la creacin y

administracin de informacin que permite tomar mejores

decisiones a los usuarios de una organizacin. (Daz,

2010)

Entre las tecnologas que forman parte de la

Inteligencia de Negocios se encuentran:

OLAP
Data W arehouse
Cuadro de mando
Cuadro de mando integral
Minera de datos
Dashboards
Integracin de datos
Previsiones
Reporteadores

Ventajas de un sistema de Inteligencia de Negocios

La implantacin de estos sistemas de informacin

proporciona diversas ventajas entre las que se puede

destacar:
13

Crear un crculo virtuoso de la informacin (los

datos se transforman en informacin que genera un

conocimiento que permite tomar mejores decisiones que

se traducen en mejores resultados y que generan nuevos

datos). Como se ilustra en la siguiente figura:

Ciclo de vida informacin (Urquizu, 2010)

Permitir una visin nica, conformada, histrica,


persistente y de calidad de toda la informacin.
Crear, manejar y mantener mtricas, indicadores
claves de rendimiento (KPI, Key Performance
Indicator) e indicadores claves de metas
fundamentales para la empresa.
Aportar informacin actualizada tanto a nivel agregado
como en detalle.
Reducir e l diferencial de orientacin de negocio entre el
departamento de
14

Tecnologas de la Informacin y la organizacin


Mejorar la comprensin y documentacin de los
sistemas de informacin en el contexto de una
organizacin.

Modelo de Madurez para Inteligencia de Negocios

El modelo de madurez permite clasificar la

organizacin desde el punto de vista del grado de madurez

de implantacin de sistemas de Inteligencia de Negocios

en la misma.

Las caractersticas que presentara cada etapa del

modelo de madurez, seran las siguientes: (Ordoez, 2011)

Fase 1: No existe BI.

Los datos se hallan en los sistemas de

procesamiento de transacciones en lnea (OLTP, On-Line

Transaction Processing), dispersos en otros soportes o

incluso slo contenidos en el know-how de la

organizacin. Las decisiones se basan en la intuicin, en

la experiencia, pero no en datos consistentes. El uso de

datos corporativos en la toma de decisiones no ha sido

detectado y tampoco el uso de una herramienta adecuada

al hecho.

En general, el valor de la informacin en la toma

de decisiones no es suficientemente apreciado y

promovido en la organizacin; aparecen varias versiones


15

de la verdad, dependiendo de cmo cada ejecutivo

define conceptos como Utilidad, Ingresos,

Facturacin o cualquier otro que requiere para su

anlisis y por supuesto, de qu fuente los toma; cada

funcionario maneja un argot propio y no existe un acuerdo

corporativo sobre los trminos del negocio.

Fase 2: No existe BI, pero los datos son accesibles.

No existe un procesado normal de los datos para la

toma de decisiones, aunque algunos usuarios tienen acceso

a informacin de calidad y son capaces de justificar

decisiones con dicha informacin. Frecuentemente este

proceso se realiza mediante Excel o algn tipo de

reporting. Se intuyen que deben existir soluciones para

mejorar este proceso, pero se desconoce la existencia de la

Inteligencia de Negocios.

Fase 3: Aparicin de procesos formales de toma de

decisiones basada en datos.

Se establece un equipo que controla los datos y

que permite hacer informes contra los mismos que

permiten tomar decisiones fundamentales. Los datos son

extrados directamente de los sistemas transaccionales sin

data cleansing ni modelizacin, ni existe un data

warehouse.
16

En un escenario menos desalentador (aunque

todava lejano de la solucin ptima), o bien, una vez

capitalizada la mala experiencia anterior, se decide

disponer de una infraestructura tecnolgica separada de

los sistemas OLTP; pero como no hay recursos para

una adecuada planeacin y la solucin se necesita

ya, se implementa un primer datamart para resolver el

problema crtico: tpicamente la informacin de ventas.

Si bien se lleva a cabo un proceso deETLC en

alguna extensin y eventualmente se combinan las fuentes

necesarias, normalmente no se realiza una identificacin

adecuada de requerimientos, y la informacin

incorporada en el datamart no es completa, no obedece a

criterios ni necesidades corporativas sino

departamentales, y tpicamente se agrega, limitando as

su potencial para el anlisis.

Fase 4: Data Warehouse.

El impacto negativo contra los sistemas OLTP

lleva a la conclusin de que un repositorio de datos es

necesario para la organizacin. Se percibe la bodega de

datos como una solucin deseada. El reporting sigue

siendo personal.
17

En vista de la experiencia adquirida, es claro que

la unin de los datamarts en una bodega de datos

corporativa, no es posible a menos que se lleve a cabo un

proceso de planeacin y anlisis de requerimientos con

ese alcance, es decir, con alcance corporativo. Un

proceso que lleve a la identificacin juiciosa de

dimensiones y medidas fundamentales del negocio,

identificando y seleccionando sus fuentes potenciales e

incluyendo toda la informacin inherente a cada

componente. Un proceso que logre capturar en toda su

extensin a la esencia de la informacin del negocio, y

que vaya de la mano con la creacin de un glosario de

trminos y conceptos que idealmente gue la consulta y

explotacin d e la informacin del negocio.

Fase 5: Data warehouse crece y el reporting se

formaliza.

La bodega de datos funciona y se desea que todos

se beneficien del mismo, de forma que el reporting

corporativo se formaliza. Se habla de OLAP, pero slo

algunos identifican realmente sus beneficios, es hacer las

cosas bien: Planear global y construir local, ahora s,

como debi hacerse desde el principio; el concepto de

bodega de datos corporativa toma fuerza, se entiende la

utilidad y complejidad del proceso de ETL. Los


18

problemas de calidad de los sistemas OLTP empiezan a

solucionarse de raz. La planeacin estratgica de la

organizacin se mide con base en indicadores y stos ya

pueden calcularse de una manera ms automtica y segura

con base en la bodega de datos. Adems, las herramientas

para construccin de tableros de control demuestran su

efectividad, ahora que adems no debe llevarse a cabo un

proceso manual tortuoso para alimentarlas.

Fase 6: Despliegue de OLAP.

Despus de cierto tiempo, ni el reporting ni la

forma de acceso al data warehouse es satisfactoria

para responder a preguntas sofisticadas. OLAP se

despliega para dichos perfiles. Las decisiones empiezan a

impactar de forma significativa en los procesos de

negocios de toda la organizacin. Se tiene una verdadera

integracin entre la gestin estratgica y la gestin

operacional. La informacin es el activo principal de la

organizacin y se cumplen las metas: La informacin es

accesible (entendible, navegable y con alto

desempeo), la informacin es consistente, adaptable y

soporta los cambios en el negocio, hay control de acceso

y visibilidad sobre el uso de la informacin, y UNA y

solo una verdad y fuente nica de informacin.


19

Fase 7: Business Intelligence se formaliza.

Aparece la necesidad de implantar otros procesos

de inteligencia de Negocio como Data Mining, Balanced

Scorecard, entre otros; y procesos de calidad de datos

impactan en procesos como Customer Relationship

Management (CRM), Supply Chan Management

(SCM) Se ha establecido una cultura corporativa que

entiende claramente la diferencia entre sistemas OLTP y

DSS.

El sistema de Inteligencia de Negocio desborda

los lmites corporativos y se extiende a clientes,

proveedores, socios de negocio y en general los

stakeholders, trmino en ingls que agrupa a todos

los terceros de inters relacionados con la empresa. BI

es un recurso corporativo estratgico que definitivamente

orienta el negocio.

Cundo es necesario la Inteligencia de Negocios?

Existen situaciones en las que la implantacin de

un sistema de Inteligencia de Negocios resulta adecuada.

Se destaca, entre todas las que contienen:

La toma de decisiones se realiza de forma intuitiva en

la organizacin

Identificacin de problemas de calidad de informacin


20

Uso de Excel como repositorios de informacin

corporativos o de usuario. Lo que se conoce como

Excel caos.

Necesidad de cruzar informacin de forma gil entre

departamentos.

Las campaas de marketing no son efectivas por la

informacin usada.

Existe demasiada informacin en la organizacin

para ser analizada de la forma habitual. Se ha

alcanzado la masa crtica de datos.

Es necesario automatizar los procesos de extraccin y

distribucin de informacin.

Metodologa para aplicar Inteligencia de Negocios en

una organizacin:

ANLISIS Y REQUERIMIENTOS

No hay ningn viento favorable para el que no sabe a

qu puerto se dirige Arthur Schopenhauer (1788-1860)

Filsofo alemn.

En primer lugar, se debe identificar qu se

quiere obtener a partir de la Inteligencia de Negocios.

Ya conocidas las ventajas y los casos en los que se

recomienda implementar un proyecto de inteligencia de

negocios (el cul no es un proyecto a corto plazo), se


21

debe prestar gran atencin al objetivo que se quiere lograr

con esta implementacin.

La frase que inicia este apartado hace alusin a

lo que se desea obtener en este primer paso de la

metodologa: Saber a dnde se debe dirigir.

En definitiva, los sistemas de Inteligencia de

Negocios buscan responder a las siguientes preguntas:

Qu sucedi?

Qu sucede ahora?

Por qu sucedi?

Qu suceder?

Estrategia de Inteligencia de Negocios

Implementar un proyecto de inteligencia de

negocios en una organizacin es una tarea de gran

dedicacin. Las buenas prcticas ensean que, para llegar

a un buen fin, es importante tener una estrategia de

inteligencia de negocio que coordine de forma eficaz las

tecnologas, el uso, y los niveles en el proceso de

madurez.

Pero, cmo se puede detectar que no existe una

estrategia?
22

Es posible detectar que no existe una estrategia

definida a travs de los siguientes tems y percepciones

en el interior de la organizacin:

Los usuarios de la organizacin indican que el rea de


informtica o tecnologas de informacin, son el
origen de sus problemas de inteligencia de negocio.
Las directivas consideran que implementar un
proyecto de inteligencia de negocio es otro costo ms.
El area de Informtica contina preguntando a los
usuarios finales sobre las necesidades de los
informes
El sistema de Inteligencia de Negocio est soportado
por el soporte del rea de tecnologa.
No hay diferencia entre BI y gestin del rendimiento
No es posible medir el uso del sistema de inteligencia
de negocio
No es posible medir el retorno de inversin (ROI,
Return On Invest) del proyecto de Inteligencia de
Negocios
Se considera que la estrategia para la bodega de datos
es la misma que para el sistema de inteligencia de
negocio
No hay un plan para desarrollar, contratar, retener
y aumentar el equipo de Inteligencia de Negocio
No se ha socializado que la empresa tiene una
estrategia para la Inteligencia de Negocio
No existe un responsable funcional (o bien, el
asignado no es el adecuado).
No existe un centro integrado de gestin de
competitividad
23

Existen mltiples soluciones en la organizacin


distribuidas en diferentes departamentos que repiten
funcionalidad
No hay un plan de formacin real y consistente de uso
de las herramientas
Alguien cree que es un xito que la informacin
consolidada est a disposicin de los usuarios finales
al cabo de dos semanas
Los usuarios creen que la informacin de la bodega de
datos no es correcta.
El desarrollo de una estrategia de negocio es un
proceso a largo plazo que incluye mltiples
actividades, entre las que es conveniente destacar:
Crear un equipo de gestin de Inteligencia de Negocio.
Tiene el objetivo de generar conocimiento en
tecnologas, metodologas, estrategia, con la presencia
de un sponsor a nivel ejecutivo y con analistas de
negocio implicados y que tengan responsabilidad
compartida en xitos y fracasos.
Establecer los estndares de Inteligencia de Negocio
en la organizacin para planear tanto las tecnologas
existentes como las futuras adquisiciones.
Identificar qu procesos de negocio necesitan
diferentes aplicaciones analticas que trabajen de
forma continua para asegurar que no existen silos de
funcionalidad.
Desarrollar un framework de mtricas a nivel
empresarial como el pilar de una gestin del
rendimiento a nivel corporativo.
Incluir los resultados de metodologas analticas
(minera de datos u otras) en los procesos de negocio
24

con el objetivo de aadir valor a todo tipo de


decisiones.
Revisar y evaluar el portafolio actual de soluciones en
un contexto de riesgo/recompensas.
Considerar inversiones inteligentes cuyo retorno de
inversin estn dentro de un periodo de tiempo de un
ao. Adems, tener en cuenta los diferentes anlisis de
mercado, de soluciones e incluso el hype cycle de
Gartner para conocer el estado del arte.
Aprender de los xitos y fracasos de otras empresas
revisando casos de estudio y consultando a las
empresas del sector para determinas qu ha funcionado
y qu no.
Culturizar la organizacin con la orientacin de
inteligencia de negocio.
Alinear los departamentos, en especial de Tecnologa
y la estrategia de la organizacin en caso de no poder
organizar un Centro de Competencia de Inteligencia de
Negocio, fundamental para trabajar como equipo
integrado. El departamento de tecnologa debe
entender las necesidades y entregar la mejor solucin
ajustada a la necesidad particular y escalable a otras
futuras.
Poner atencin en las necesidades que requieren
inteligencia de negocio en la organizacin porque se
acostumbra a satisfacer a los usuarios o departamentos
que gritan ms fuerte, y esto no significa que den
mayor valor a la organizacin. Por ejemplo, los
departamentos de finanzas son un caso tpico de baja
atencin en este tipo de soluciones.
25

2.2.2. DATA WAREHOUSE

La inteligencia de Negocios y su enfoque ha tenido una

interesante dinmica tanto acadmica como industrial en los

ltimos aos. Uno de los conceptos claves que ms ha tomado

fuerza es el repositorio de datos, tambin conocido como data

warehouse.

Data Warehouse [Fuente: imgenes de internet]

Este captulo se enfoca en la introduccin de la

metodologa ya consolidada en mltiples proyectos y las cuales

han dado la evolucin actual de este concepto, el objetivo de este

captulo es la introduccin del concepto de data warehouse y la

aplicacin de la metodologa usando un ejemplo con una

solucin open source, en este caso pentaho data integration y


26

cmo repositorio de datos el motor de base de datos oracle

express edition.

La base de un sistema de Inteligencia de Negocios: La

Bodega de datos

Una data warehouse es un repositorio de datos que

proporciona una visin global, comn e integrada de los datos de

la organizacin, con las siguientes propiedades:

Estable
Coherente
Fiable
Con informacin histrica

En distintos artculos de internet identifican como

funcionalidades de un sistema de datawarehuse tales como:

(Velasco, 2004)

Integracin de bases de datos heterogneas


(relacionales, documentales, geogrficas, archivos, etc.).
Ejecucin de consultas complejas no predefinidas
visualizando el resultado en forma de grfica y en diferentes
niveles de agrupamiento y totalizacin de datos.
Agrupamiento y desagrupamiento de datos en forma
interactiva.
Anlisis de problema en trminos de dimensiones. Por
ejemplo, permite analizar datos histricos a travs de una
dimensin tiempo.
Control de calidad de datos para asegurar, no solo la
consistencia de la base, sino tambin la relevancia de los
27

datos en base a los cuales se toman las decisiones.

Al abarcar el mbito global de la organizacin y con

un amplio alcance histrico, el volumen de datos puede ser

demasiado grande (centenas de terabytes). Las bases de datos

relacionales son el soporte tcnico ms comnmente usado para

almacenar las estructuras de estos datos y sus grandes volmenes.

(Curto, 2007)

Presenta las siguientes caractersticas:

Orientado a un tema: organiza una coleccin de informacin


alrededor de un tema
central. Las transacciones operacionales estn diseadas
alrededor de aplicaciones y funciones, como por ejemplo
pagos, ventas, entregas de mercadera, para una institucin
comercial. Un Data W arehouse est organizado alrededor de
los temas ms globales, como cliente, vendedor, producto y
actividades.
Integrado: incluye datos de mltiples orgenes y presenta
consistencia de datos.
Cuando los datos son copiados del ambiente operacional,
son integrados antes de entrar en el date warehouse. Por
ejemplo, un diseador puede representar el sexo como "M" y
"F", otro puede representarlo como "0" y "1", o "x" e "y", y
otro usar las palabras completas "masculino" y "femenino".
No importa la fuente de la cual el sexo llegue al data
warehouse, debe ser guardado en forma consistente.
Variable en el tiempo: se realizan fotos de los datos basadas
en fechas o hechos.
28

Los datos en la bodega de datos son precisos para un cierto


momento, no necesariamente ahora; por eso se dice que los
data warehouse son variantes en el tiempo. Las varianzas
en el tiempo de los datos de un warehouse se
manifiestan de muchas maneras. La bodega de datos
contiene datos de un largo horizonte de tiempo. Las
aplicaciones operacionales, sin embargo, contienen datos de
intervalos de tiempo pequeos, por cuestiones de
performance (tamao de las tablas). Toda estructura clave en
un data warehouse contiene implcita o explcitamente un
elemento del tiempo. Esto no necesariamente pasa en el
ambiente operacional.
No voltil: slo de lectura para los usuarios finales.
Updates, inserts y deletes son efectuados regularmente, en
una base de datos transaccional. La manipulacin de datos
en un data warehouse, es mucho ms sencilla. Solo ocurren
dos operaciones, la carga inicial, y el acceso a los datos. No
hay necesidad de updates (en su sentido general).
Frecuentemente la bodega de datos est constituido por una
base de datos relacional, pero no es la nica opcin factible,
tambin es posible considerar las bases de datos orientadas a
columnas o incluso basadas en lgica asociativa. (Daz, 2010)
Se debe tener en cuenta que existen otros elementos en el
contexto de un a bode de datos:
Data Warehousing: es el proceso de extraer y filtrar
datos de las operaciones comunes de la organizacin,
procedentes de los distintos sistemas de informacin
operacionales y/o sistemas externos, para transformarlos,
integrarlos y almacenarlos en un almacn de datos con el fin
de acceder a ellos para dar soporte en el proceso de toma de
decisiones de una organizacin.
29

Data Mart: es un subconjunto de los datos de la bodega de


datos cuyo objetivo es responder a un determinado anlisis,
funcin o necesidad, con una poblacin de usuarios
especfica. Al igual que en un data warehouse, los
datos estn estructurados en modelos de estrella o copo de
nieve, y en un data mart puede ser dependiente o
independiente de un data warehouse. Por ejemplo, un
posible uso sera para la minera de datos o para la
informacin de marketing. El data mart est pensado para
cubrir las necesidades de un grupo de trabajo o de un
determinado departamento dentro de la organizacin.
Operational Data Store: es un tipo de almacn de datos que
proporciona slo los ltimos valores de los datos y no su
historial; adems, generalmente admite un pequeo desfase o
retraso sobre los datos operacionales.
Staging Area: es el sistema que permanece entre las fuentes
de datos y la bodega de datos con el objetivo de:

Facilitar la extraccin de datos desde fuentes de


origen con una heterogeneidad y complejidad grande.

Mejorar la calidad de datos


Ser usado como cach de datos operacionales con el que
posteriormente se realiza el proceso de data warehousing
Uso de la misma para acceder en detalle a informacin no
contenida en la bodega de datos
Procesos ETL: tecnologa de integracin de datos basada
en la consolidacin de datos que se usa tradicionalmente
para alimentar data warehouse, data mart, staging area y
ODS. Usualmente se combina con otras tcnicas de
consolidacin de datos.
Metadatos: datos estructurados y codificados que escriben
caractersticas de instancias; aportan informaciones para
30

ayudar a identificar, descubrir, valorar y administrar las


instancias descritas.

Elementos de un Data warehouse

La estructura relacional de una base de datos operacional

sigue las formas normales en su diseo. Una data warehouse no

debe seguir ese patrn de diseo. La idea principal es que la

informacin sea presentada desnormalizada para optimizar las

consultas. Para ello se debe identificar, en el seno de la

organizacin, los procesos de negocio, las vistas para el proceso

de negocio y las medidas cuantificables asociadas a los mismos.

De esta manera se habla de:

Tabla de Hecho: es la representacin en la bodega de datos de

los procesos de negocio de la organizacin. Por ejemplo, una

venta puede identificarse como un proceso de negocio de manera

que es factible, si corresponde en la organizacin, considerar la

tabla de hecho de ventas.

Dimensin: es la representacin en la bodega de datos de una

vista para un cierto proceso de negocio. Retomando el ejemplo de

una venta, para la misma se tiene el cliente que ha comprado, la

fecha en que se ha realizado. Estos conceptos pueden ser

considerados como vistas para este proceso de negocio. Puede ser

interesante recuperar todas las compras realizadas por un cliente.

Ello hace entender por qu se identifica como una dimensin.


31

Mtrica: son los indicadores de negocio de un proceso de

negocio. Aquellos conceptos cuantificables que permiten medir

este proceso de negocio. Por ejemplo, en una venta se tiene el

importe de la misma.

Tipos de Tablas de Hecho

A nivel de diseo una tabla de hecho es aquella que

permite guardar dos tipos de atributo diferenciados:

Medidas del proceso/actividad/flujo de trabajo/evento que se


pretende modelizar.
Claves forneas hacia registros en una tabla de dimensin
(en otras palabras, hacia una vista de negocio)

Existen diferentes tipos de tablas de hecho:

Transaction Fact Table: representan eventos que suceden


en un determinado espacio-tiempo. Se caracterizan por
permitir analizar los datos con el mximo detalle. Por
ejemplo, se puede pensar en una venta que tiene como
resultado mtricas como el importe de la misma.
Factless Fact Tables/Coverage Table: son tablas que no
tienen medidas, y tiene
sentido dado que representan el hecho de que el evento
suceda. Frecuentemente se aaden contadores a dichas
tablas para facilitar las consultas SQL. Por ejemplo, se
puede pensar en la asistencia en un acto benfico en el que
por cada persona que asiste se tiene un registro, pero se
podra no tener ninguna mtrica asociada ms.
Periodic Snapshot Fact Table: Son tablas de hecho
usadas para recoger informacin de forma peridica a
32

intervalo de tiempo regulares. Dependiendo de la situacin


medida o la necesidad de negocio, este tipo de tablas de
hecho son una agregacin de las anteriores o estn diseadas
especficamente. Por ejemplo, se puede pensar en el balance
mensual. Los datos se recogen acumulados de forma
mensual.
Accumulating Snapshot Fact Table: representan el ciclo d
evida completo con un
principio y un final- de una actividad o un proceso. Se
caracterizan por tener mltiples dimensiones relacionadas con
los eventos presentes en un proceso. Por ejemplo, se puede
pensar en un proceso de matrcula de un estudiante:
recopila datos durante su periodo de vida que suelen sustituir
los anteriores (superacin y recopilacin de asignaturas, por
ejemplo). (Curto, 2007)

Tablas de Dimensiones

Las dimensiones recogen los puntos de anlisis de un

hecho. Por ejemplo, una venta se puede analizar en funcin del

da de venta, producto, cliente, vendedor o canal de venta, entre

otros. Respecto al punto de vista de la gestin histrica de

los datos, stos se pueden clasificar como:

SCD Tipo 0: no se tiene en cuenta la gestin de los cambios


histricos y no se realiza esfuerzo alguno. Nunca se cambia la
informacin, ni se reescribe.
SCD Tipo 1: No se guardan datos histricos. La nueva
informacin sobrescribe la antigua siempre. La sobrescritura
se realiza, principalmente, por errores de calidad de datos.
Este tipo de dimensiones son fciles de mantener, y se usan
cuando la informacin histrica no es importante.
33

SCD Tipo 2: Toda la informacin histrica se guarda en la


bodega de datos. Cuando hay un cambio se crea una nueva
entrada con fecha y surrogate key apropiadas. A partir de ese
momento ser el valor usado para futuras entradas. Las
antiguas usarn el valor anterior.
SCD Tipo 3: Toda la informacin histrica se guarda en la
bodega de datos. En este caso se crean nuevas columnas con
los valores antiguos y los actuales son remplazados con los
nuevos.
SCD Tipo 4: Es lo que se conoce habitualmente como tablas
histricas. Existe una tabla con los datos actuales y otra con
los antiguos o los cambios.
SCD Tipo 6/Hbrida: Combina las aproximaciones de los
tipos 1, 2 y 3 (y, claro, entonces 1+2+3=6). Consiste en
considerar una dimensin de tipo 1 y aade un par de
columnas adicionales que indican el rango temporal de
validez de una de las columnas de la tabla. Si bien su diseo
es complejo, entre sus beneficios se puede destacar que reduce
el tamao de las consultas temporales. Existe otra variante
para este tipo de dimensin que consiste en tener versiones del
registro de la dimensin (numerados de 0 a n+1, donde 0
siempre es la versin actual). (Curto, 2007)

Existen otros tipos de dimensiones cuya clasificacin es

funcional:

Degenaradas: se encuentran como atributos en la tabla de


hecho, si bien tiene el significado de un punto de vista de
anlisis. Contiene informacin de baja cardinalidad formada
por relaciones dicotmicas. Frecuentemente contienen slo un
atributo y, por ello, no se crea una tabla aparte. Por ejemplo,
el sexo de un paciente.
34

Monster: es conveniente comentar que algunas


dimensiones pueden crecer
desmesuradamente. Una buena prctica es romper la
dimensin en dos tablas: una que contenga los valores
estticos y otra que contenga los valores voltiles. Un ejemplo
claro puede ser la informacin de cliente. Se debe ser
conscientes de cul es la informacin primordial del mismo y
cul la que slo se usa puntualmente en los informes u otros
anlisis.
Junk: que contiene informacin voltil que se usa
puntualmente y que no se guarda de forma permanente en la
bodega de datos.
Conformadas: que permite compartir informacin entre
dimensiones. Consiste en dimensiones definidas
correctamente para que sean usadas por dos tablas y poder as
realizar consultas comunes. El ejemplo ms fcil es la
dimensin temporal.
Bridge: que permiten definir relaciones n a m entre tablas de
hecho. Necesarias para definir por la relacin entre un piloto
y sus mltiples patrocinadores.
Role-playing: que tienen asignado un significado. Por
ejemplo, se puede tener la dimensin fecha, pero tambin
fecha de entrega.
Alta cardinalidad: que contienen una gran cantidad
de datos difcilmente consultables en su totalidad. Por
ejemplo, cada uno de los habitantes de un pas.

Tipos de Mtricas

Se puede distinguir diferentes tipos de medidas, basadas

en el tipo de informacin que recopilan, as como su

funcionalidad asociada:
35

Mtricas: valores que recogen el proceso de una actividad


o los resultados de la misma. Estas medidas proceden del
resultado de la actividad de negocio.
Mtricas de realizacin de actividad (leading): miden la
realizacin de una actividad. Por ejemplo, la participacin
de una persona en un evento.
Mtricas de resultado de una actividad (lagging): recogen
los resultados de una actividad. Por ejemplo, la cantidad de
puntos de un jugador en un partido.
Indicadores clave: valores correspondientes que hay que
alcanzar y que suponen el grado de asuncin de los
objetivos. Estas medidas proporcionan informacin sobre el
rendimiento de una actividad o sobre la consecucin de una
meta.
Key Performance Indicator (KPI): indicadores clave de
rendimiento. Ms all de la eficacia, se definen unos valores que
explican en qu rango ptimo de rendimiento se debera situar
al alcanzar los objetivos. Son mtricas del proceso.
Key Goal Indicator (KGI):indicadores de metas. Definen
mediciones para informar a la direccin general si un proceso
TIC ha alcanzado su requisito de negocio, y se expresan por lo
general en trminos de criterios de informacin.

Se debe aadir que existen tambin indicadores de desempeo.

Los indicadores clave de desempeo (en definitiva, son KPI)

definen mediciones que determinan cmo se est desempeando

el proceso de TI para alcanzar la meta. Son los indicadores

principales que sealan si ser factible lograr una meta o no, y son

buenos indicadores de las capacidades, prcticas y habilidades.


36

Los indicadores de metas de bajo nivel se convierten en

indicadores de desempeo para los niveles altos.

Esquemas para un Data warehouse

Existen principalmente dos tipos de esquemas para

estructurar los datos en un almacn de datos:

Esquema en estrella: A nivel de diseo, consiste en una tabla de


hechos (o lo que en los libros se encontrar como fact table) en
el centro para el hecho objeto de anlisis y una o varias tablas de
dimensin por cada punto de vista da anlisis que participa de la
descripcin de ese hecho. Consiste en estructurar la informacin
en procesos, vistas y mtricas recordando a una estrella (por ello
el nombre). En la tabla de hecho se encuentran los atributos
destinados a medir (cuantificar): sus mtricas. La tabla de
hechos solo presenta uniones con dimensiones. (Curto, 2007)

Esquema en estrella [Fuente: imgenes de internet)]

Esquema en copo de nieve: es un esquema de representacin


derivado del esquema de estrella, en el que las tablas de
dimensin se normalizan en mltiples tablas. Por esta razn, la
37

tabla de hechos deja de ser la nica tabla del esquema que se


relaciona con otras tablas y aparecen nuevas uniones. Es posible
identificar dos tipos de esquemas en copo de nieve: (Curto,
2007)
Completo: en el que todas las tablas de dimensin en el
esquema de estrella aparecen ahora normalizadas. O
Parcial: slo se lleva a cabo la normalizacin de algunas de
ellas.

Esquema en copo de nieve [Fuente: imgenes de internet]

2.2.3. INTEGRACIN DE DATOS: ETL

Se consideran las siguientes reas, cuando se refiere a

integracin en un contexto empresarial:

Integracin d e datos: proporciona una visin nica de todos

los datos de negocio, sin importar su ubicacin. Este es el mbito

de la inteligencia de negocio.
38

Integracin d e aplicaciones: proporciona una visin

unificada de todas l as aplicaciones tanto internas como

externas a la empresa. Esta integracin se consigue mediante la

coordinacin de los flujos de eventos (transacciones, mensaje o datos)

entre aplicaciones.

Integracin de procesos de negocio: proporciona una visin

unificada de todos los procesos de negocio. Su principal ventaja

es que las consideraciones de diseo del anlisis e

implementacin de los procesos de negocio son aislad os del

desarrollo de las aplicaciones.

Integracin de la interaccin de los usuarios: proporciona una

interfaz segura y personalizada al usuario del negocio (datos,

aplicaciones y procesos de negocio).

Integracin de datos: ETL [Fuente: imgenes de internet]

Este captulo se centrar en la integracin de datos en

general y en los procesos ETL (Extraccin, Trasformacin y


39

Carga) e n particular, que una de las tecnologas de

integracin de datos que se usa en los proyectos de

implantacin de Bussiness Intelligence.

El objetivo de este captulo es conocer las diferentes

opciones de integracin de datos en el mbito de la inteligencia

de negocio y, en particular, conocer el diseo de procesos

ETL.

Integracin de datos

Dentro del contexto de la inteligencia de negocios, las

herramientas ETL han sido la opcin usual para alimentar la

bodega de datos. La funcionalidad bsica de estas herramientas

est compuesta por:

Gestin y administracin de servicios


Extraccin de datos
Transformacin de datos
Carga de datos
Gestin de datos

En la siguiente grfica se ilustran los distintos

componentes del proceso de ETL para una bodega de datos o data

warehouse:
40

Proceso Integracin de datos (Daz, 2010)

En los ltimos aos, estas herramientas han

evolucionado incluyendo ms funcionalidades propias de una

herramienta de integracin de datos. Se puede destacar:

Servicios de acceso/entrega de datos (va


adaptadores/conectores)
Gestin de servicios
Perfiles de datos (Data profiling)
Calidad de datos (Data quality)
Procesos operacionales
Servicios de transformacin: CDC (Captura de datos
modificados), SCD (Dimensiones de variacin lenta),
validacin, agregacin.
Servicios de acceso a tiempo real
Extract, Transform and Load (ETL)
Integracin de informacin empresarial (EII de sus siglas
en ingls Enterprise
Information Integration)
41

Integracin de aplicaciones empresariales (EAI de sus siglas


en ingls Enterprise
Applications Integration)
Capa de transporte de datos
Gestin de datos

En la siguiente grfica se detalla la integracin de las


funcionalidades descritas en la evolucin de los procesos ETL:

Suite Integracin de datos (Daz, 2010)

Esta evolucin es consecuencia de diversos motivos,

entre los que se puede destacar los diferentes tipos de datos que

existen:

Estructurados: contenidas en bases de datos

Semiestructurados: en formatos legibles para mquinas, si

bien no estn completamente estructurados: HTML tabulado,

Excel, CSV, que pueden obtenerse mediante tcnicas estndar

de extraccin de datos.
42

No estructurados: en formatos legibles para humanos, pero no

para mquinas:

Word, HTML no tabulado, PDF, que pueden obtenerse

mediante tcnicas avanzadas como text mining u otras. (Daz,

2010)

As como la evolucin de las necesidades de negocio.

Por ello el punto de partida adecuado es definir

formalmente el concepto de integracin de datos: Se entiende por

integracin de datos al conjunto de aplicaciones, productos,

tcnicas y tecnologas que permiten una visin nica

consistente de los datos de negocio. ( I n m o n , 2 0 0 5 )

Respecto a la definicin:

Las aplicaciones son soluciones a medida que permiten la

integracin de datos en base al uso de productos de integracin.

Los productos comerciales desarrollados por terceros

capacitan la integracin mediante el uso de tecnologas de

integracin.

Las tecnologas de integracin son soluciones para realizar la

integracin de datos.
43

Tcnicas de integracin de datos

Existen diferentes tcnicas de integracin de datos:

(McBurney, 2008)

Propagacin de datos: Consiste en copiar datos de un

lugar de origen a un entorno destino local o remoto. Los datos

pueden extraerse del origen mediante programas que generen un

archivo que debe ser transportado al destino, donde su utilizar

como archivo de entrada para cargar en la base de datos de

destino. Una aproximacin ms eficiente es descargar slo los

datos que han cambiado en origen respecto a la ltima

propagacin realizada, generando un archivo de carga

incremental que tambin ser transportado al destino. Este tipo

de procesos son habitualmente de tipo en lnea y trabajan con una

arquitectura push. Puede realizarse como:

Distribucin

Intercambio bidireccional. Puede ser master-slave o peer-

to-peer.

Consolidacin de datos: Consiste en capturar los cambios

realizados en mltiples entornos de origen y propagarlos a un

nico entorno destino, donde se

almacena una copia de todos estos datos. Ejemplos son una data

warehouse o un ODS, alimentado por varios entornos de


44

produccin. Con esta tcnica es difcil trabajar con tiempos de

latencia bajos:

Cuando no se requiere latencia baja, se suele proveer los datos

mediante procesos batch en intervalos prefijados (superior a varias

horas). Se usan consultas SQL para conseguir los datos (lo que se

denomina tcnica pull).

Cuando se requiere latencia baja, se utiliza la tcnica push. En

este caso, la aplicacin de integracin de datos debe identificar los

cambios producidos en origen para transmitir slo esos cambios, y

no todo el conjunto de datos del origen. Para ello, se suele emplear

algn tipo de tcnica de tipo CDC (change data capture).

Federacin de datos: Proporciona a las aplicaciones una visin lgica

virtual comn de una o ms bases de datos. Esta tcnica permite acceder

a diferentes entornos origen de datos, que pueden estar en los mismos o

en diferentes gestores de datos y mquinas, y crear una visin de este

conjunto de bases de datos como si fuese en la prctica una base de datos

nica e integrada. Cuando una aplicacin de negocio lanza una consulta

SQL contra esta vista virtual, el motor de federacin de datos

descompone la consulta en consultas individuales para cada uno de los

orgenes de datos fsicos involucrados y la lanza contra cada uno de ellos.

Cuando ha recibido todos los datos respuesta a las consultas, integra los

resultados parciales en un resultado nico, realizando las sumatorias,

agregaciones y/o ordenaciones necesarias para resolver la consulta


45

original, y devuelve los datos a la aplicacin que lanz la peticin

original. Uno de los elementos claves del motor de federacin es

el catlogo de datos comn. Este catlogo contiene informacin

sobre los datos: su estructura, su localizacin y, en ocasiones, su

demografa (volumen de datos, cardinalidad de las claves, claves

de clustering, etc). Ello permite que se pueda optimizar la

divisin de la consulta original al enviarla a los gestores de bases

de datos, y que se elija el camino ms eficiente de acceso global a

los datos.

CDC (Change Data Capture): Se utiliza para capturar los

cambios producidos por las aplicaciones operacionales en las

bases de datos de origen, de tal manera que pueden ser

almacenados y/o propagados a entornos destino para que stos

mantengan la consistencia con los entornos origen. A

continuacin, se listan las cuatro principales tcnicas del CDC:

CDC por aplicacin: consiste en que la propia aplicacin es la

que genera la actualizacin de datos en origen, y se

encarga de actualizar directamente los entornos destino, o

almacenar localmente los cambios en una tabla de paso (staging)

mediante una operacin de INSERT dentro de la misma unidad

lgica de trabajo.

CDC p o r timestamp: se puede emplear cuando los datos de

origen incorporan un timestamp (por ejemplo a nivel de fila si


46

el origen es una tabla relacional) de la ltima actualizacin de

sta. El CDC se limitar a escanear los datos de origen para

extraer los datos que posean un timestamp posterior al de la

ltima vez que se ejecut el proceso de CDC: estos datos son los

que han cambiado desde la ltima captura de datos y, por tanto,

son los que deben actualizarse en los entornos destino.

CDC por triggers: los triggers o disparadores son acciones que se

ejecutan cuando se actualizan (por UPDATE, DELETE o

INSERT) los datos de una determinada tabla sobre la que estn

definidos. Esos triggers pueden utilizar estos datos de la

actualizacin en sentencias SQL para generar cambios SQL en

otras tablas locales o remotas. Por lo tanto, una forma de capturar

cambios es crear tiggers sobres las tablas de origen, cuyas

acciones modifiquen los datos de las tablas destino.

CDC por captura de log: consiste en examinar constantemente

el archivo de log de la base de datos de origen en busca de

cambios en las tablas que se deben monitorizar. Estos

programas basan su eficiencia en la lectura de buffers de

memoria de escritura en el log, por lo que la captura de la

informacin no afecta el rendimiento del gestor relacional al

no requerir acceso al disco que contiene el archivo de log.

Tcnicas hibridas: la tcnica elegida en la prctica para la

integracin de datos depender de los requisitos de negocio para


47

la integracin, pero tambin en gran medida de los requisitos

tecnolgicos y de las probables restricciones presupuestales. A la

prctica se suelen emplear tcnicas de integracin constituyendo

lo que se denomina una tcnica hibrida.

Tecnologas de integracin de datos

Existen diferentes tecnologas de integracin de datos

basadas en las tcnicas presentadas:

ETL: permite extraer datos del entorno origen,

transformarlos segn nuestras necesidades de negocio para

integracin de datos y cargar estos datos en los entornos destino.

Los entornos origen y destino son usualmente bases de datos o

archivos, pero en ocasiones tambin pueden ser colas de

mensajes de un determinado middleware, as como archivos u

otras fuentes estructuradas, semi-estructuradas o no

estructuradas. Est basada en tcnicas d e consolidacin. Las

herramientas de ETL en la prctica mueven o transportan datos

entre entornos origen y destino, pero tambin documentan como

estos datos son transformados (si lo son) entre el origen y el

destino almacenando esta informacin en un catlogo propio

de metadatos; intercambian estos metadatos con otras

aplicaciones que puedan requerirlos y administran todas

las ejecuciones y procesos de la ETL: planificacin del

transporte de datos, log de errores, los de cambios y


48

estadsticas asociadas a los procesos de movimiento de datos.

Este tipo de herramientas suelen tener un interfaz de usuario de

tipo GUI y permiten disear, administrar y controlar cada uno de

los procesos del entorno ETL.

ETL de generacin de cdigo: Consta de un entorno grafico

donde se disean y especifican los datos de origen, su

transformacin y los entornos destino. El resultado generado es

un programa de tercera generacin (tpicamente COBOL) que

permite realizar las transformaciones de datos. Aunque estor

programas simplifican el proceso ETL, incorporan pocas mejoras

en cuanto al establecimiento y automatizacin de todos los

flujos de procesos necesarios para realizar la ETL. Usualmente

los administradores de datos los encargados de distribuir y

administrar el cdigo complicado, planificar y ejecutar los

procesos en lotes, y realizar el transporte de los datos.

ETL basados en motor: Permite crear flujos de trabajo en

tiempo de ejecucin definidos mediante herramientas grficas. El

entorno grafico permite hacer un mapping de los entornos de

datos de origen y destino, las transformaciones de datos

necesarios, el flujo de procesos y los procesos por lotes

necesarios. Toda esta informacin referente a diseo y procesos

del ETL es almacenada en el repositorio del catlogo de metadatos.

Se compone por diversos motores:


49

a) Motor de extraccin: utiliza adaptores como ODBC,

JDBC, JNDI, SQL nativo, adaptadores de archivos

planos u otros. Los datos pueden ser extrados en modo

pull planificado, tpicamente soportando tcnicas de

consolidacin en proceso por lotes, o mediante modo push,

tpicamente utilizando tcnicas de propagacin en procesos

de tipo en lnea. En ambos casos se pueden utilizar tcnicas

de changed data capture (CDC) ya vistas.

b) Motor de transformacin: Proporciona una librera de

objetos que permite a los desarrolladores transformas los

datos de origen para adaptarse a las estructuras de datos de

destino, permitiendo, por ejemplo, la sumarizacion de los

datos en destino en tablas resumen.

c) Motor de carga: Utiliza adaptadores a los datos de destino,

como el SQL nativo, o cargadores masivos de datos o

archivos de destino.

d) Servicios de administracin y operacin: Permiten la

planificacin, ejecucin y monitorizacin de los procesos

ETL, as como la visualizacin de eventos y la recepcin y

resolucin de errores en los procesos.

ETL integrado en la base de datos: algunos fabricantes

incluyen capacidades ETL dentro del motor de la base de datos

(al igual que lo hacen con otro tipo de caractersticas, como

soporte OLAP y minera de datos). En general, presentan menos


50

funcionalidades y complejidad, y son una solucin menos

completa que los ETL comerciales basados en motor o de

generacin de cdigo. Por ello, a los ETL integrados en base de

datos se les clasifica en tres clases en relacin con los ETL

comerciales (basados en motor o de generacin de cdigo):

e) ETL cooperativos: con ellos, los productos comerciales

pueden usar funciones avanzadas del gestor base de datos

para mejorar los procesos de ETL. Ejemplos ETL

cooperativos son aquellos que pueden utilizar procedimientos

almacenados y SQL complejo para realizar las

transformaciones de los datos en origen de una forma ms

eficiente, o utilizar paralelismo de CPU en consultas para

minimizar el tiempo de los procesos ETL.

f) ETL complementarios: Cuando los ETL de bases de datos

ofrecen funcionalidades complementarias a los ETL

comerciales. Por ejemplo, hay gestores de bases de datos que

ofrecen soporte a MQT (Materializad Query Tables) o vistas

de sumarizacion precalculadas, mantenidas y almacenadas

por el gestor que puede usarse para evitar

transformaciones de datos realizadas por ETL comercial.

Adems, otros gestores permiten la interaccin directa

mediante SQL con middleware de gestin de mensajes (por

ejemplo, leyendo una cola de mensajes mediante un UDF o

permitiendo la insercin de nuevos mensajes en colas


51

mediante SQL) o con aplicaciones que se comunican

mediante web services.

g) ETL competitivos: algunos gestores ofrecen

herramientas graficas integradas que explotan sus

capacidades ETL en lo que claramente es competencia con

los ETL comerciales.

EII: el objetivo de la tecnologa EII es permitir a las aplicaciones

el acceso a datos dispersos (desde una data mart hasta archivo de

texto o incluso web services) como si estuviesen todos residiendo

en una base de datos comn. Por lo tanto, se basa en la federacin.

El acceso a datos dispersos implica la descomposicin de la

consulta inicial (habitualmente en SQL) direccionada contra la

vista virtual federada en subcomponentes, que sern procesados

en cada uno de los entornos donde residen los datos. Se recogen

los resultados individuales de c ada uno de los subcomponentes de

la consulta, se combinan adecuadamente y se devuelve el

resultado a la aplicacin que lanzo la consulta. Los productos de

EII han evolucionado desde dos entornos origen diferenciados:

las bases de datos relacionales y las bases de datos XML.

Actualmente, la tendencia en productos EII es que soporten ambas

interfaces a datos, SQL (ODBC y JDBC) y XML (XQuery y

XPath). Los productos comerciales que implementan EII varan

considerablemente en las funcionalidades que aportan; el rea ms

diferenciadora es la optimizacin de las consultas distribuidas. Las


52

caractersticas bsicas de los productos que implementan

soluciones de integracin de datos EII son:

Transparencia: los datos parecen estar en un origen nico.


Heterogeneidad: integracin de datos de diferentes fuentes
(relacionales, XML, jerrquicos) y tambin no estructurados.
Extensibilidad: posibilidad de federar cualquier frente de
datos.
Alta funcionalidad: acceso con lectura y escritura a
cualquier fuente soportada.
Autonoma: acceso no disruptivo para los datos o las
aplicaciones.
Rendimiento: posibilidad de optimizar las consultas
dependiendo del tipo y fuente de datos.

EDR: Tiene el objetivo de detectar los cambios que suceden en

las fuentes de origen esta soportada por las tcnicas de integracin

de datos de CDC (chance data capture) y por la tcnica de

propagacin de datos. Consta bsicamente de los siguientes

elementos:

Programa de captura: se encarga de recuperar los cambios


producidos en la base de datos de origen. Esta captura puede
ser realizada a travs de una salida que lea constantemente el
log de recuperacin de la base de datos, a travs de triggers o
mediante una aplicacin externa de usuario. El programa de
captura se apoya en una serie de tablas donde se almacena
informacin de control del proceso captura, como por ejemplo
las tablas que son orgenes de replicacin.
Sistema de transporte: Los sistemas de transportes ms
comunes son a travs de tablas de paso (staging), que dan
53

lugar a la denominada replicacin de tipo SQL, o a travs de


un middleware de gestin de colas, la denominada queue-
replication o Q-replication.

Programa de aplicacin de cambios: es la pieza que, o bien

leen mediante SQL de las tablas de staging los cambios de

colas en la Q-replication, y mediante la informacin de control

almacenada en tablas realiza el mapeo entre datos de origen y

de destino, realiza las transformaciones necesarias a los datos y

actualiza los datos de destino mediante SQL si se trata de

destinos relacionales, o publica un registro XML para que

pueda ser tratado por aplicaciones de propsito general.

Programa de administracin: permite las definiciones

necesarias de origen de datos y destinos, mapeos,

transformaciones y establecer los intervalos de aplicacin de

cambios. Usualmente es una herramienta de tipo grfico.

Utilidades: programas de utilidad que sirven para, por ejemplo,

planificar una carga de datos inicial del destino a partir de los

datos de origen. (Daz, 2010)

Uso de la integracin de datos

Los procesos de integracin de datos se usan en mltiples

tipologas de proyectos. Se puede destacar los siguientes:

Migracin de datos.
54

Procesos de calidad de datos.


Corporate Performance Management (CPM).
Master Data Management (MDM).
Customer Data Integration (CDI).
Product Information Management (PIM).
Enterprise Information Management (EIM).
Data W arehousing.
Business Intelligence (BI).

2.2.4. DISEO DE CUBOS OLAP

OLAP es el acrnimo en ingls de procesamiento analtico en

lnea (On-Line Analytical Processing), Es una solucin

utilizada en el campo de la llamada Inteligencia de

Negocios cuyo objetivo es agilizar la consulta de grandes

cantidades de datos. Para ello utiliza estructuras

multidimensionales (o Cubos OLAP) que contienen datos

resumidos de grandes Bases de datos o Sistemas Transaccionales

(OLTP).
55

Cubo OLAP de tres dimensiones (Yahazee, 2009)

OLAP es uno de los conceptos ms importantes de

inteligencia de negocio. Si bien el trmino OLAP se introduce por

primera vez en 1993, los conceptos base del mismo, como por

ejemplo el anlisis multidimensional, son mucho ms antiguos.

Es necesario, antes de continuar, introducir una definicin

formal de OLAP:

Se entiende por OLAP, o proceso analtico en lnea, al

mtodo gil y flexible para organizar datos, especialmente

metadatos, sobre un objeto o jerarqua de objetos como en un

sistema u organizacin multidimensional, y cuyo objetivo es

recuperar y manipular datos y combinaciones de los mismos a

travs de consultas o incluso informes. (Wrembel, 2006)


56

A pesar de ser una tecnologa que ya tiene ms de cuatro

dcadas, sus caractersticas y su evolucin han provocado que la

gran mayora de soluciones de soluciones del mercado incluya un

motor OLAP.

Es necesario precisar:

Las herramientas OLAP de los diferentes fabricantes, si bien


son similares, no son completamente iguales dado que
presentan diferentes especificaciones es del modelo terico.
Las soluciones open source OLAP han sido las ltimas a
aadirse a la lista y, por ahora, no tienen tanta variedad como
su equivalente propietario.
En el mercado Open Source OLAP slo hay dos soluciones
actualmente: el motor ROLAP Mondrian y el motor MOLAP
PALO.

A diferencia del conocido OLTP, OLAP describe una clase de

tecnologas diseadas para mantener especficamente el anlisis y

acceso a datos. Mientras el procesamiento transaccional

generalmente confa solamente en las bases de datos relacionales,

OLAP viene a ser un sinnimo con vistas multidimensionales de

los datos del negocio. Estas vistas multidimensionales se apoyan

en la tecnologa de bases de datos multidimensionales.

OLAP se est convirtiendo rpidamente en la base

fundamental para Soluciones Inteligentes incluyendo Business

Performance Management, Planificacin, presupuestos,

previsiones, informes financieros, anlisis, modelos de simulacin,


57

Descubrimiento de Conocimiento, e informes de Bodegas de

datos.

Por qu OLAP?

Para comprender las ventajas de la tecnologa OLAP es

necesario, primero, hacer una comparacin con el procesamiento

transaccional en lnea (OLTP), de tal forma que se pueda valorar

el alcance de esta tecnologa de informacin.

OLTP (Relacional) OLAP(Multidimensional)

Automatizado Resumido

Presente Histrico

Un registro por tiempo Muchos registros al tiempo

Orientado a Proceso Orientado al tema

Comparacin OLTP vs OLAP (Flores, 2008)

La razn de usar OLAP para las consultas es la velocidad de

respuesta. Una base de datos relacional almacena entidades en

tablas discretas si han sido normalizadas. Esta estructura es

buena en un sistema OLTP pero para las complejas consultas

multitabla es relativamente lenta. Un modelo mejor para

bsquedas (aunque peor desde el punto de vista operativo) es

una base de datos multidimensional.


58

Las aplicaciones OLTP se caracterizan por la creacin de

muchos usuarios, actualizaciones o recuperacin de registros

individuales. Por consiguiente, las bases de datos OLTP se

perfeccionan para actualizacin de transacciones. Las aplicaciones

OLAP son usadas por analistas y gerentes que frecuentemente

quieren una vista de datos de nivel superior, como las ventas

totales por lnea de producto, por regin, etc. Las bases de datos

OLAP normalmente se actualizan en lote, a menudo de mltiples

fuentes, y proporcionan un back-end analtico poderoso a las

aplicaciones de mltiples usuarios. Por tanto, las bases de datos

OLAP se perfeccionan para el anlisis.

Mientras las bases de datos relacionales son buenas al recuperar

un nmero pequeo de archivos rpidamente, ellas no son buenas

al recuperar un nmero grande de archivos y resumirlos sobre la

marcha. Un tiempo de respuesta lento y el uso excesivo de

recursos del sistema son las caractersticas comunes de las

aplicaciones de soporte de decisin construidas exclusivamente

sobre la tecnologa de bases de datos relacionales. Debido a la

facilidad con la cual se puede emitir un ejecutar una consulta

SQL externa, muchos distribuidores de Sistemas de Informacin

no brindan a c c e s o directo a los usuarios a sus bases de datos

relacionales.

Muchos de los problemas que las personas intentan resolver con

la tecnologa relac ional son realmente multidimensionales en


59

naturaleza. Por ejemplo, una consulta SQL para crear

resmenes de ventas del producto por la regin, las ventas de

la regin por producto, y as sucesivamente, podran involucrar

la revisin de la mayora, si no todos, los registros en una base

de datos de mercadeo y podra tomar horas de proceso. Un

servidor OLAP podra ocuparse de estas preguntas en unos

segundos. (Tindys , 2010)

Las aplicaciones OLTP tienden a tratar con datos atomizados

registro a un tiempo, considerando que las aplicaciones de

OLAP normalmente se tratan de los datos resumidos.

Mientras las aplicaciones O L T P generalmente no requieren

de datos histricos, casi cada aplicacin de OLAP se preocupa

por ver las tendencias y por consiguiente requiere de datos

histricos. Como consecuencia, las bases de datos OLAP

necesitan la capacidad de ocuparse de datos series de. Mientras

las aplicaciones OLTP y bases de datos tienden a ser

organizados alrededor de procesos especficos (como

ordenes de entrada), las aplicaciones OLAP tienden a ser

orientadas al tema, respondiendo a preguntas como Qu

productos estn vendiendo bien? o Dnde estn mis oficinas

de ventas ms dbiles?. (jaac, 2010)


60

Tipos de OLAP

Existen diferentes tipos de OLAP, que principalmente difieren

en cmo se guardan los datos: (Daz, 2010)

MOLAP (Multidimensional OLAP): es la forma clsica de

OLAP y frecuentemente es referida con dicho acrnimo. MOLAP

utiliza estructuras de bases d e datos generalmente optimizadas

para recuperacin de los mismos. Es lo que se conoce como bases

de datos multidimensionales (o, ms coloquialmente, cubos). En

definitiva, se crea un archivo que contiene todas las posibles

consultas precalculadas. A diferencia de las bases de datos

relacionales, estas formas de almacenaje estn optimizadas para

la velocidad de clculo. Tambin se optimizan a menudo para

la recuperacin a lo largo de patrones jerrquicos de acceso. Las

dimensiones de cada cubo son tpicamente atributos tales como

periodo, localizacin, producto o cdigo de cuenta. La forma en la

que cada dimensin ser agregada se define por adelantado. (Daz,

2010)

ROLAP (Relacional OLAP): trabaja directamente con

las bases de datos relacionales, que almacenan los datos base

y las tablas dimensionales como tablas relacionales mientras se

crean nuevas tablas para guardar la informacin agregada.

HOLAP (Hibrido OLAP): no hay acuerdo claro en la industria en

cuanto a qu constituye el OLAP hbrido, exceptuando el hecho de


61

que es una base de datos en la que los datos se dividen en

almacenaje relacional y multidimensional. Por ejemplo, para

algunos vendedores, HOLAP consiste en utilizar las tablas

relacionales para guardar cantidades ms grandes de datos

detallados, y utiliza el almacenaje multidimensional para algunos

aspectos de cantidades ms pequeas de datos menos detallados o

agregados.

DOLAP (Desktop OLAP): es un caso particular de OLAP ya

que est orientado a equipos de escritorio. Consiste en obtener la

informacin necesaria desde la base de datos relacional y

guardarla en el escritorio. Las consultas y los anlisis son

realizados contra los datos guardados en el escritorio.

In-memory OLAP: es un enfoque por el que muchos

nuevos fabricantes estn optando. Consiste en que la

estructura dimensional se genera slo a nivel de memoria y

se guarda el dato original en algn formato que potencia su

despliegue de esta forma (por ejemplo, comprimido o

mediante una base de datos lgica asociativa). En este

ltimo punto es donde cada fabricante pone su nfasis.

Cada tipo tiene ciertas ventajas, aunque hay desacuerdo sobres

las ventajas especficas de los diferentes proveedores.

MOLAP es mejor en sistemas ms pequeos de datos, es ms

rpido para calcular agregaciones y retornar respuestas y


62

necesita menos espacio de almacenaje. ltimamente, in-memory

OLAP est apuntndose como una opcin vlida al MOLAP.

ROLAP s e considera ms escalable. Sin e m b a r g o , e l pre

proceso de grandes volmenes es difcil de implementar

eficientemente, as que se desecha con frecuencia. De otro

modo, el funcionamiento de consultas pude ser no ptimo.

HOLAP est entre los dos en todas las reas, pero puede

preprocesar rpidamente y escalar bien.

Todos los tipos son, sin embargo, propensos a la explosin de la

base de datos. ste es un fenmeno que causa la cantidad

extensa de espacio de almacenaje que es utilizado por las bases

de datos OLAP cuando se resuelven ciertas, pero frecuentes,

condiciones: alto nmero de dimensiones, de resultados

calculados de antemano y de datos multidimensionales escasos.

La dificultad en la implementacin OLAP deviene en la

formacin de las consultas, elegir los datos base y desarrollar el

esquema. Como resultado, la mayora de los productos

modernos vienen con bibliotecas enormes de consultas

preconfiguradas. Otro problema est en la baja calidad de los

datos, que deben ser completos y constantes.


63

Elementos OLAP

OLAP permite el anlisis multidimensional. Ello significa que la

informacin est estructurada en ejes (puntos de vista de anlisis)

y celdas (valores que se estn analizando).

En el contexto OLAP existen diferentes elementos comunes a

las diferentes topologas OLAP (que en definitiva se diferencian

a nivel prctico en que en MOLAP se precalculan los datos, en

ROLAP no, y en in-memory se generan al iniciar el sistema):

Esquema: un esquema es una coleccin de cubos, dimensiones,

tablas de hecho y roles.

Cubo: es una coleccin de dimensiones asociadas a una tabla de

hecho. Un cubo virtual permite cruzar la informacin entre

tablas de hecho a partir de sus dimensiones comunes.

Tabla de hecho, dimensin y mtrica

Jerarqua: es un conjunto de miembros organizados en

niveles. En cuanto a bases de datos, se puede entender como

una ordenacin de los atributos a una dimensin.

Nivel: es un grupo de miembros en una jerarqua que tienen los

mismos atributos y nivel de profundidad en una jerarqua.

Miembro: es un punto de la dimensin de un cubo que pertenece

a un determinado nivel de una jerarqua. Las mtricas (medidas)


64

en OLAP se consideran un tipo especial de miembro que

pertenece a su propio tipo de dimensin. Un miembro puede

tener propiedades asociadas.

Roles: permisos asociados a un grupo de usuarios.

MDX: es un acrnimo de Multidimensional eXpressions (aunque

tambin es como Multidimensional Query eXpression). Es el

lenguaje de consulta de estructuras OLAP, fue creado en 1997

por Microsoft y, s bien no es un lenguaje estndar, la gran

mayora de fabricantes de herramientas OLAP lo han

adoptado como estndar de hecho.


65

2.3. MARCO CONCEPTUAL

AGENTES:

Los agentes son programas que piensan. Ellos pueden realizar

tareas a un nivel muy bsico sin necesidad de intervencin humana. Por

ejemplo, unos agentes pueden realizar tares un poco complejas, como

elaborar documentos, establecer diagramas de flujo, etc.

BUSINESS INTELLIGENCE

Es una estrategia empresarial que persigue incrementar el

rendimiento de la empresa o la competitividad del negocio, a travs de la

organizacin inteligente de sus datos histricos (transacciones u

operaciones diarias), usualmente residiendo en Data Warehouse

corporativos o Data Marts departamentales

DATA MINING:

Las empresas suelen generar grandes cantidades de informacin

sobre sus procesos productivos, desempeo operacional, mercados y

clientes. Pero el xito de los negocios depende por lo general de la

habilidad para ver nuevas tendencias o cambios en las tendencias. Las

aplicaciones de data mining pueden identificar tendencias y

comportamientos, no slo para extraer informacin, sino tambin para

descubrir las relaciones en bases de datos que pueden identificar

comportamientos que no muy evidentes.


66

DATA WAREHOUSE:

Es la respuesta de la tecnologa de informacin a la

descentralizacin en la toma de decisiones. Coloca informacin de todas

las reas funcionales de la organizacin en manos de quien toma las

decisiones. Tambin proporciona herramientas para bsqueda y anlisis.

INTEGRACIN DE DATOS

Dentro del contexto de la inteligencia de negocios, las

herramientas ETL han sido la opcin usual para alimentar la bodega de

datos. La funcionalidad bsica de estas herramientas est compuesta por:

Gestin y administracin de servicios


Extraccin de datos
Transformacin de datos
Carga de datos
Gestin de datos

MULTIDIMENSIONALIDAD:

La informacin multidimensional se puede encontrar en hojas de

clculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de

reunir informacin dispersa en toda la empresa e incluso en diferentes

fuentes para as proporcionar a los departamentos la accesibilidad, poder

y flexibilidad que necesitan para analizar la informacin. Por ejemplo, un

pronstico de ventas de un nuevo producto en varias regiones no est

completo si no se toma en cuenta tambin el comportamiento histrico de


67

las ventas de cada regin y la forma en que la introduccin de nuevos

productos se ha desarrollado en cada regin en cuestin.

OLAP

es uno de los conceptos ms importantes de inteligencia de

negocio. Si bien el trmino OLAP se introduce por primera vez en 1993,

los conceptos base del mismo, como por ejemplo el anlisis

multidimensional, son mucho ms antiguos.


68

CAPTULO III

METODOLOGIA DE LA INVESTIGACION

3.1. TIPO Y DISEO DE INVESTIGACION

3.1.1. TIPO DE INVESTIGACION

El tipo de investigacin de acuerdo al abordaje de la

ingeniera de sistemas y como se plantea la investigacin ser de

tipo descriptivo, porque se hace una descripcin de las etapas de

desarrollo del sistema.

3.1.2. DISEO DE INVESTIGACIN

El diseo es no experimental, ya que se toma la

informacin acorde a la realidad.

3.2. TECNICAS E INSTRUMENTOS

Las tcnicas que se utilizaran son:

La encuesta

La observacin

Anlisis documental

Los instrumentos que se utilizaran que corresponden a las

tcnicas anteriormente mencionadas son:

La gua de encuesta

La gua de observacin

La gua de anlisis documental


69

3.3. PROCEDIMIENTOS

Para el desarrollo de la aplicacin de business inteligence se

utilizar un modelo de desarrollo evolutivo, denominado modelo de

prototipos, que permite modelar e implementar la aplicacin

computacional de manera rpida y acorde a las necesidades del cliente o

usuario final.

3.4. POBLACION Y MUESTRA

POBLACION

Nuestra poblacin est compuesta por gerentes y administradores

personas dedicadas a la toma de decisiones, tanto en el sector pblico y

privado. En tal sentido se tom intencionadamente o directamente un

total de 30 profesionales dedicadas a este rubro en la ciudad de Puno,

MUESTRA

Dado que nuestra poblacin es reducida, es que se ha optado por

entrevistar a todos sus integrantes, ya que, adems, se presentan las

condiciones apropiadas para lograr este cometido.

A esta muestra se le llama censal, porque es igual a la poblacin

MUESTREO

Se ha considerado un muestreo no probabilstico, intencionado o

directo.
70

3.5. METODLOGIA DE DESARROLLO PARA LA ESTRATEGIA

EMPRESARIAL BUSINESS INTELIGENCE

Para la implementacin se ha utilizado el modelo de desarrollo de

prototipos, el cual se ajusta a las necesidades de la presente investigacin.

Para la implementacin se ha utilizado el modelo de desarrollo de

prototipos, el cual se ajusta a las necesidades de

3.6. HIPOTESIS

Hiptesis General

Ha sido posible implementar un prototipo de estrategia

empresarial business intelligence para el soporte a la toma de decisiones

gerenciales.

Hiptesis Especficas

Ha sido posible realizar una bsqueda de informacin sobre

herramientas de business intelligence y elegir una que nos permita

proponer un prototipo de estrategia empresarial business intelligence para

el soporte a la toma de decisiones gerenciales.

Ha sido posible desarrollar el modelamiento del prototipo de

estrategia empresarial business intelligence para el soporte a la toma de

decisiones gerenciales.

Variables

Variable Independiente

Estrategia empresarial business intelligence


71

Variable Dependiente

Toma de decisiones gerenciales

Operacionalizacion de variables

ESCALA DE
VARIABLES DIMENSIONES INDICADORES INSTRUMENTO
MEDICION

Variable Independiente: Modelamiento Nivel de modelamiento Si


Gua de encuesta

Estrategia empresarial business Funcionalidad Nivel de funcionalidad No


intelligence

Variable Dependiente: Si Gua de encuesta

Toma de decisiones gerenciales Toma de decisiones Nivel de toma de No


decisiones
72

CAPTULO IV

ANLISIS Y DISCUSIN DE RESULTADOS

3.7. RESULTADOS

RESULTADOS DE LA APLICACIN, ESTRATEGIA


EMPRESARIAL BUSINESS INTELLIGENCE, PARA EL SOPORTE
A LA TOMA DE DECISIONES GERENCIALES

FIGURA 01

PANTALLA DE INICIO DE SESIN

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
73

FIGURA 02
PANTALLA DE LA PAGINA PRINCIPAL EN LA VENTANA DE
ANALISIS

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
FIGURA 03
PANTALLA CREANDO CUENTA DE USUARIOS SEGN LA
NECESIDAD DE CADA ACTIVIDAD.

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
74

FIGURA 04
PANTALLA EDITANDO, CREANDO, ASIGNANDO ROLES
PARA CADA USUARIO

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
75

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

FIGURA 05
PANTALLA CONFIGURANDO LA CUENTA MAIL SERVER

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
76

FIGURA 06

PANTALLA AGREGAR OTROS COMPLEMETOS QUE SE


NESECITEN, IDIOMA, PLUGINS, Y OTROS.

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
77

FIGURA 07
PANTALLA DE ANALISIS
Para realizar un Anlisis, debemos construir dicho anlisis; es por ello
que seguiremos las siguientes pautas:

- Para construir un anlisis debe crearse un Cubo OLAP y esto se


realiza mediante la aplicacin Schema Workbench, por tanto, esta
aplicacin necesita saber con qu BD debemos trabajar, es decir,
tener el Driver para conectarse al BD; en este caso usaremos el driver

- Este Driver no slo deber integrarse con Schema Workbench sino


que debe estar tambin integrado (copiado) en las siguientes carpetas:

X:\Archivos de programa\pentaho\biserver-ce\tomcat\lib
X:\Archivos de programa\pentaho\schema-workbench\drivers

- Realizado la copia de este Driver en las respectivas carpetas, es


necesario reinicializar el servidor BI.

Agregamos nuestra conexin de base de datos

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
78

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

User: root
Password: root
79

FIGURA 08

PANTALLA CREACION DE UN CUBO OLAP

La creacin de un Cubo OLAP se realizar desde Schema Workbench,


para ello nos dirigimos a su carpeta y ejecutamos: workbench.bat.

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
80

Paso seguido es crear el cubo, se recomienda que el cubo no tenga


errores para que la publicacin salga satisfactoria.

Acto seguido deber publicarse dicho cubo para que Pentaho pueda
realizar su respectivo anlisis, para ello nos dirigimos a File / Publish

Publish Password: password


User:Admin
Password:password

CORREGIR ERROR:deberemos dirigirnos a:


X:\Archivos de programa\pentaho\biserver-ce\pentaho-
solutions\system
Aqu debemos modificar el archivo: publisher_config.xml
-->
<publisher-config>
<publisher-password>password</publisher-password>
</publisher-config>
Pentaho por defecto trae sin contrasea dicho archivo, seguido
debemos reiniciar el servidor.

seguidamente debemos configurar la publicacin:


81

FIGURA 9

PANTALLA EJECUCION DEL ANALISIS


Es hora de realizar el anlisis:

- Nos dirigimos a pentaho: http://localhost:8080/ y desde ah podemos


realizar nuestro New Analisys .
- Para nuestro primer anlisis Usaremos un Plugin llamado:
a) Sayku Analitics, este complemento previamente ya sido configurado,
y colocado en la carpeta que corresponde.
b) Sayku Shart Plus, un adicional de sayku analitics, que mejora el
interfaz de visualizacin.
c) Jpivot4: este paquete viene preinstalado en la suite, y solo lo
ejecutaremos el anlisis.

Ingresando a nuevo anlisis, de sayku analistics

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
82

Generando nuestro primer anlisis

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Generando anlisis filtrado por regiones

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
83

Exportando nuestro anlisis, de la tabla a analizar a pdf

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Anlisis filtrado por departamentos

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
84

Cantidad de ventas por ao filtrado por lnea de producto

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
85

Anlisis en barra por producto y por ao

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Anlisis de venta de producto, filtrado por estado de orden

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
86

Anlisis de venta de producto, filtrado por pas

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Anlisis de venta de producto, y su participacin en porcentaje por


pas

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
87

Anlisis de venta de producto, filtrado por ao y regin y su


representacin en porcentaje, en forma grafica

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Anlisis de venta de producto, filtrado por ao y regin y su


representacin en porcentaje, en forma de tabla

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
88

Visualizando un anlisis anterior en sayku plus chart, por


participacin

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Generando anlisis, filtrado por pas y lmite de crdito, en sayku


plus en representacin lineal

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
89

Generando anlisis, filtrado por pas y lmite de crdito, en sayku


plus en representacin grafica

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Generando anlisis, filtrado por pas y lmite de crdito.

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
90

Ingresando al men del plugin para analisis en Jpivot4

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Ingresando a anlisis filtrado por estado de una orden.

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
91

Ingresando a anlisis filtrado por estado de una orden y su


representacin grafica

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor

Tambin como herramienta adicional, podemos crear nuestro


Dashboard de forma personalizado, segn la necesidad de anlisis de
negocio.

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
92

Fuente : Aplicacin de estrategia empresarial Business Intelligence


Elaboracion: El autor
93

3.8. VALIDACIN DEL PROTOTIPO MEDIANTE LA ENCUESTA

MTODO DE APLICACIN.

Lo primero es brindarle una charla de aproximadamente 20 minutos

sobre la forma como se usa el prototipo y su objetivo, despus del cual se

dej un espacio de 20 minutos adicionales, para que la persona termine

de familiarizarse con el prototipo. Posteriormente se le aplic la encuesta

correspondiente.
94

3.9. RESULTADOS DE LA ENCUESTA.

RESPECTO A LA NECESIDAD DE IMPLEMENTAR BUSINESS

INTELIGENCE

3.9.1. invierte ms tiempo preparando informacin que analizndola?

Cuadro N 1

Condicin # %
Si 27 90
No 3 10
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 1

invierte ms tiempo preparando


informacin que analizndola?

-10,00%

90,00%

Si No

FUENTE: Cuadro N 1
ELABORADO: elaboracin propia
95

El 90% de los encuestados consideran que invierte ms tiempo

preparando informacin que analizndola, En tanto que el restante 10%

considera que es adecuada la proporcin del tiempo en su labor, debido a

que utilizan tcnicas de procesamiento de informacin en minora.

se determina que el usuario en mayora invierte ms tiempo preparando

informacin que analizndola, y necesitan instrumentos para optimizar su

labor.
96

3.9.2. Pasa mucho tiempo tratando de hacer que los reportes en Excel

sean visualmente entendibles?

Cuadro N 2

Condicin # %
Si 24 80
No 6 20
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 2

Pasa mucho tiempo tratando de hacer


que los reportes en Excel sean
visualmente entendibles?

-20%

80%

Si No

FUENTE: Cuadro N 2
ELABORADO: elaboracin propia
97

El 80% de los encuestados consideran que. Pasa mucho tiempo tratando

de hacer que los reportes en Excel sean visualmente entendibles, En tanto

que el restante 20% considera que tiene un manejo bsico, debido a que

utilizan tcnicas de procesamiento de informacin.

se determina que el usuario en mayora Pasa mucho tiempo tratando de

hacer que los reportes en Excel sean visualmente entendibles y necesitan

instrumentos para optimizar su labor.


98

4.1.1 Quisiera tener una gua sobre los eventos cuando los administradores
anteriores implementaban determinada estrategia?
Cuadro N 3

Condicin # %
Si 29 96.67
No 1 3.33
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 3

Quisiera tener una gua sobre los eventos


cuando los administradores anteriores
implementaban determinada estrategia?

-3,33%

96,67%

Si No

FUENTE: Cuadro N 3
ELABORADO: elaboracin propia
99

El 96,67% de los encuestados consideran que. Quisiera tener una gua

sobre los eventos cuando los administradores anteriores implementaban

determinada estrategia, En tanto que el restante 3.33% considera que es

adecuada la informacin que poseen en su labor.

se determina que los usuarios en mayora necesitan instrumentos para

optimizar su labor.
100

4.1.2 Quiere saber qu productos, son ms rentables durante periodos?


Cuadro N 4

Condicin # %
Si 29 96.67
No 1 3.33
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 4

Quiere saber qu productos, son ms


rentables durante periodos?

-3,33%

96,67%

Si No

FUENTE: Cuadro N 4
ELABORADO: elaboracin propia
101

El 96,67% de los encuestados consideran que. Quiere saber qu

productos, son ms rentables durante periodos, En tanto que el restante

3.33% considera que es adecuada la informacin que poseen en su labor.

se determina que los usuarios en mayora necesitan tener instrumentos

para optimizar flujo de informacin en requerimiento de mercadera por

temporada.
102

4.1.3 No sabe que patrones de compra tienen sus clientes por zonas?
Cuadro N 5

Condicin # %
Si 25 83.33
No 5 16.67
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 5

No sabe que patrones de compra tienen


sus clientes por zonas?

-16,67%

83,33%

Si No

FUENTE: Cuadro N 5
ELABORADO: elaboracin propia
103

El 83,33% de los encuestados consideran que. No sabe que patrones de

compra tienen sus clientes por zonas, En tanto que el restante 16,67%

considera que es adecuada la informacin que poseen en su labor.

se determina que los usuarios admiten no tener informacin de

preferencias y que alguna herramienta seria ptimo.


104

4.1.4 Ha perdido oportunidades de negocio por recibir informacin no


oportuna?
Cuadro N 6

Condicin # %
Si 23 76.67
No 7 23.33
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 6

Ha perdido oportunidades de negocio


por recibir informacin no oportuna?

-23,33%

76,67%

Si No

FUENTE: Cuadro N 6
ELABORADO: elaboracin propia
105

El 76,67% de los encuestados consideran que. Ha perdido oportunidades

de negocio por recibir informacin no oportuna, En tanto que el restante

23,33% considera que es adecuada la informacin que poseen en su

labor.

se determina que de los 30 encuestados 23 dice que podra haber

aprovechado de informacin oportuna de negocio y que alguna

herramienta mejorara su competitividad.


106

4.1.5 Trabaja horas extras el fin de mes para procesar reportes?


Cuadro N 7

Condicin # %
Si 28 93.33
No 2 6.67
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 7

Trabaja horas extras el fin de mes para


procesar reportes?

-6,67%

93,33%

Si No

FUENTE: Cuadro N 7
ELABORADO: elaboracin propia
107

El 93,33% de los encuestados consideran que. Trabaja horas extras el fin

de mes para procesar reportes, En tanto que el restante 6,67% considera

que es adecuada la informacin que poseen en su labor.

se determina que la mayora de los encuestados, trabaja horas extras el

fin de mes para procesar reportes y que alguna herramienta le permitir

alcanzar objetivos organizacionales.


108

4.1.6 Quisiera convertir informacin de distintas origines en un informe


resumido e entendible grficamente?
Cuadro N 8

Condicin # %
Si 27 90
No 3 10
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 2

Quisiera convertir informacin de


distintas origines en un informe resumido
e entendible grficamente?

-10,00%

90,00%

Si No

FUENTE: Cuadro N 8
ELABORADO: elaboracin propia
109

El 90% de los encuestados consideran que. Quisiera convertir

informacin de distintas origines en un informe resumido e entendible

grficamente, En tanto que el restante 10% considera que es adecuada la

informacin que poseen en su labor.

se determina que, de forma grfica los datos se interpretan mas

rpidamente y que alguna herramienta por lo tanto una decisin ptima.


110

4.1.7 No sabe con claridad si su personal alcanza objetivos planteados?


Cuadro N 9

Condicin # %
Si 20 66.67
No 10 33.33
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 9

No sabe con claridad si su personal


alcanza objetivos planteados?

-33,33%

66,67%

Si No

FUENTE: Cuadro N 1
ELABORADO: elaboracin propia
111

El 66,67% de los encuestados consideran que. No sabe con claridad si su

personal alcanza objetivos planteados, En tanto que el restante 33,33%

considera que es adecuada la informacin que poseen en su labor.

se determina que, no tener informacin de cada elemento, retrasa

objetivos organizacionales y que alguna herramienta ayuda a cumplir

objetivos.
112

4.1.8 No tiene idea de por qu tiene devolucin de mercadera?


Cuadro N 10

Condicin # %
Si 16 53.33
No 14 46.67
Total 30 100
FUENTE: Encuesta 1
ELABORADO: elaboracin propia

Grafico N 10

No tiene idea de por qu tiene


devolucin de mercadera?

-46,67%
53,33%

Si No

FUENTE: Cuadro N 10
ELABORADO: elaboracin propia
113

El 53,33% de los encuestados consideran que. No tiene idea de por qu

tiene devolucin de mercadera, En tanto que el restante 46,67%

considera que es adecuada la informacin que poseen en su labor.

se determina que, la mayora de encuestados no tiene idea de por qu

tiene devolucin de mercadera, y que sera positivo que alguna

herramienta con informacin cruzada, permita evitar, aspectos negativos.


114

4.2 RESPECTO A LA HERRAMIENTA DE INTERACCION, BUSINESS


INTELIGENCE
4.2.1 respecto al interfaz, le parece fcil el acceso de usuarios?

Cuadro N 11

Condicin # %
Si 23 76.67
No 7 23.33
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 2

respecto al interfaz, le parece fcil el


acceso de usuarios?

-23,33%

76,67%

Si No

FUENTE: Cuadro N 11
ELABORADO: elaboracin propia
115

A la pregunta respecto al interfaz, le parece fcil el acceso de usuarios?

los encuestados respondieron en su mayora (76,67%) en forma positiva,

en tanto que un 23,33% de los encuestados respondieron negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
116

4.2.2 cree que el rol usuario le permite accionar de forma especfica?

Cuadro N 12

Condicin # %
Si 20 66.67
No 10 33.33
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 12

cree que el rol usuario le permite


accionar de forma especfica?

-33,33%

66,67%

Si No

FUENTE: Cuadro N 12
ELABORADO: elaboracin propia
117

A la pregunta cree que el rol usuario le permite accionar de forma

especfica? los encuestados respondieron en su mayora (66,67%) en

forma positiva, en tanto que un 33,33% de los encuestados respondieron

negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
118

4.2.3 Es adecuada la informacin asociada a los componentes del sistema?

Cuadro N 13

Condicin # %
Si 23 76.67
No 7 23.33
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 13

Es adecuada la informacin asociada a los


componentes del sistema?

-23,33%

76,67%

Si No

FUENTE: Cuadro N 13
ELABORADO: elaboracin propia
119

A la pregunta Es adecuada la informacin asociada a los componentes

del sistema? los encuestados respondieron en su mayora (76,67%) en

forma positiva, en tanto que un 23,33% de los encuestados respondieron

negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
120

4.2.4 La bsqueda de las opciones del sistema es rpida y sencilla?

Cuadro N 14

Condicin # %
Si 25 93.33
No 5 6.67
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 14

La bsqueda de las opciones del sistema


es rpida y sencilla?

-6,67%

93,33%

Si No

FUENTE: Cuadro N 14
ELABORADO: elaboracin propia
121

A la pregunta La bsqueda de las opciones del sistema es rpida y

sencilla? los encuestados respondieron en su mayora (93,33%) en forma

positiva, en tanto que un 6,67% de los encuestados respondieron

negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
122

4.2.5 El manejo y navegacin, es intuitivo y cumple con sus funciones?

Cuadro N 15

Condicin # %
Si 23 76.67
No 7 23.33
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 15

El manejo y navegacin, es intuitivo y


cumple con sus funciones?

-23,33%

76,67%

Si No

FUENTE: Cuadro N 15
ELABORADO: elaboracin propia
123

A la pregunta El manejo y navegacin, es intuitivo y cumple con sus

funciones? los encuestados respondieron en su mayora (76,67%) en

forma positiva, en tanto que un 23,33% de los encuestados respondieron

negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
124

4.2.6 El formato mostrado de los datos del sistema es adecuado?

Cuadro N 16

Condicin # %
Si 19 63.33
No 11 36.67
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 16

El formato mostrado de los datos del


sistema es adecuado?

-36,67%

63,33%

Si No

FUENTE: Cuadro N 16
ELABORADO: elaboracin propia
125

A la pregunta El formato mostrado de los datos del sistema es

adecuado? los encuestados respondieron en su mayora (63,33%) en

forma positiva, en tanto que un 36,67% de los encuestados respondieron

negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
126

4.2.7 La exploracin del sistema y sus contenidos es adecuada?

Cuadro N 17

Condicin # %
Si 21 70
No 9 30
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 17

La exploracin del sistema y sus


contenidos es adecuada?

-30,00%

70,00%

Si No

FUENTE: Cuadro N 17
ELABORADO: elaboracin propia
127

A la pregunta La exploracin del sistema y sus contenidos es adecuada?

los encuestados respondieron en su mayora (70%) en forma positiva, en

tanto que un 30% de los encuestados respondieron negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
128

4.2.8 Existe congruencia entre el componente activo y los datos mostrados


por el sistema?

Cuadro N 18

Condicin # %
Si 24 80
No 6 20
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 18

Existe congruencia entre el componente


activo y los datos mostrados por el
sistema?

-20,00%

80,00%

Si No

FUENTE: Cuadro N 18
ELABORADO: elaboracin propia
129

A la pregunta Existe congruencia entre el componente activo y los datos

mostrados por el sistema? los encuestados respondieron en su mayora

(80%) en forma positiva, en tanto que un 20% de los encuestados

respondieron negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
130

4.2.9 Midiendo en funcin del tiempo, cree Ud. que el tiempo de respuesta es
adecuado a sus necesidades de su empresa?

Cuadro N 19

Condicin # %
Si 27 90
No 3 10
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 19

Midiendo en funcin del tiempo, cree Ud.


que el tiempo de respuesta es adecuado a
sus necesidades de su empresa?

-10,00%

90,00%

Si No

FUENTE: Cuadro N 19
ELABORADO: elaboracin propia
131

A la pregunta Midiendo en funcin del tiempo, cree Ud. que el tiempo

de respuesta es adecuado a sus necesidades de su empresa? los

encuestados respondieron en su mayora (90%) en forma positiva, en

tanto que un 10% de los encuestados respondieron negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
132

4.2.10 respecto a la prueba de la herramienta BI una vez implementada, cree


que le ayudara a tomar decisiones estratgicas?

Cuadro N 20

Condicin # %
Si 26 86.67
No 4 13.33
Total 30 100
FUENTE: Encuesta 2
ELABORADO: elaboracin propia

Grafico N 20

respecto a la prueba de la herramienta BI


una vez implementada, cree que le
ayudara a tomar decisiones estratgicas?

-13,33%

86,67%

Si No

FUENTE: Cuadro N 20
ELABORADO: elaboracin propia
133

A la pregunta respecto a la prueba de la herramienta BI una vez

implementada, cree que le ayudara a tomar decisiones estratgicas? los

encuestados respondieron en su mayora (86,67%) en forma positiva, en

tanto que un 13,33% de los encuestados respondieron negativamente

Se determina que, con capacitaciones de uso y funcionalidad en sesiones,

podra mejorar.
134

3.10. CONTRASTACIN DE LA HIPTESIS

De acuerdo a la hiptesis general planteada para la presente

investigacin:

Hiptesis General

Es factible implementar un prototipo de estrategia empresarial business

intelligence para el soporte a la toma de decisiones gerenciales.

Una vez aplicado el instrumento de la encuesta para medir la propuesta

de de implementar un prototipo de estrategia empresarial business

intelligence para el soporte a toma de decisiones gerenciales; respecto a

la necesidad de implementar una estrategia de business intelligence y

sobre la interaccin con dicha estrategia, se ha determinado que entre un

60% a 90% de los encuestados han respondido positivamente SI. Lo cual

implica que existe una buena aceptacin de la herramienta de business

intelligence tanto en la solucin al problema de toma de decisiones y de

la interaccin con la interface de dicha herramienta.

Los encuestados respondieron mayoritariamente a cada pregunta en la

encuesta SI en un porcentaje que va desde un 60% a un 90%, lo cual

permite aceptar la hiptesis de investigacin en el sentido de la estrategia

de business intelligence permite en un nivel bueno el soporte a la toma de

decisiones gerenciales en las empresas u organizaciones.

En consecuencia, se puede concluir que la hiptesis planteada en la

presente investigacin se acepta y se corrobora con los resultados


135

obtenidos de la aplicacin de la encuesta. Determinando que los

encuestados estn de acuerdo que el uso de la estrategia de business

intelligence permite una buena toma de decisiones gerenciales.


136

CONCLUSIONES

Primero.

Se logr implementar un prototipo de estrategia empresarial business

intelligence para el soporte a la toma de decisiones gerenciales

utilizando pentaho, la cual permite una eficiente toma de decisiones por

parte de los gerentes y administradores.

Segundo.

Se logr realizar una bsqueda de informacin sobre herramientas de

business intelligence y elegir una que nos permita proponer un prototipo de

estrategia empresarial business intelligence para el soporte a la toma de

decisiones gerenciales, que es el Pentaho.

Tercero.

Se logr desarrollar el modelamiento del prototipo de estrategia

empresarial business intelligence para el soporte a la toma de decisiones

gerenciales.
137

RECOMENDACIONES

Primero.

A los gerentes de las empresas de la regin de Puno, recomendarles que utilicen

estrategias de business intelligence, tal como es Pentaho; para mejorar y

garantizar la toma de decisiones organizacionales.

Segundo.

A todos los acadmicos relacionados al area de la ingeniera de sistemas e

informtica, recomendarles que puedan proponer y utilizar alguna estrategia de

de business intelligence, para dar soluciona problemas organizacionales al

momento de tomar decisiones.

Tercero.

A los dueos de empresas de la regin de Puno, recomendarles que puedan

analiaar la opcin de adquirir un sistema de informacin de business

intelligence, para garantizar el xito en su organizacin. Y adems estar acorde

al avance tecnolgico del mundo de negocios.


138

BIBLIOGRAFA

Abukari, K. (2003). Business Intelligence in Action. Canada.

Betts, M. (2004). The future of business intelligence, Computerworld. Retrieved from


https://books.google.com.pe/books?id=sCY5TkmLDT0C&pg=PA22&lpg=PA2
2&dq=Betts+M.+(2000).+%E2%80%9CThe+future+of+business+intelligence%
E2%80%9D.+Computerworld.&source=bl&ots=Ijl6YH7e4M&sig=ImiztjeglUa
klRT1IqtegLn7TNQ&hl=es&sa=X&ved=0ahUKEwj3v8XFmbrQAhWBQCYK
H

Boada, B., & Tituaa, A. (2012). DESARROLLO DE UNA APLICACIN DE


BUSINESS INTELLIGENCE (BI) PARA LA EMPRESA EMPAQPLAST.
Sangolqui. Retrieved from
https://www.academia.edu/20146139/Tesis_BI_Empaqplast_2012

Cano, J. L. (2007). Business Intelligence Competir con informacin. Retrieved from


http://itemsweb.esade.edu/biblioteca/archivo/Business_Intelligence_competir_c
on_informacion.pdf

Collado Villalva. (n.d.). http://ayto-colladovillalba.org/recursos/doc/desarrollo-


local/documentos/sistemas-de-soporte-a-la-decision-bussiness-intelligence-
para-las-pymes-de-colla.pdf. Retrieved 10 15, 2016, from http://ayto-
colladovillalba.org/recursos/doc/desarrollo-local/documentos/sistemas-de-
soporte-a-la-decision-bussiness-intelligence-para-las-pymes-de-colla.pdf

Crdoba, B. D. (2007). Hefesto: metodologa para la construccin. Cordoba. Retrieved


from https://es.scribd.com/doc/55234594/Data-Warehousing-Hefesto

Crdoba, B. R. (2007). Data warehousing: investigacin y sistematizacin de


conceptos. Cordoba, Argentina. Retrieved from
http://es.slideshare.net/byroncayo/hefesto-v21

Curto, J. (2007, Noviembre 19). Information managment. Retrieved Noviembre 14,


2016, from Data Warehousing, Data Warehouse y Datamart:
http://josepcurto.com/2007/11/19/diseno-de-un-data-warehouse-estrella-y-copo-
de-nieve/
139

Daz, J. C. (2010). Introduccin al Business Intelligence (Realizacin editorial: El


Ciervo 96, S.A. ed.). Barcelona, Espaa: UOC. Retrieved from
https://blogvirtualtec.files.wordpress.com/2015/02/introduccion_al_business_int
elligence.pdf

Dych , J., & Levy, E. (2006). Customer Data Integration: Reaching a Single Version
of the Truth (SAS Institute Inc.). Wiley. doi:ISBN-13: 978-0471916970

Flores, J. T. (2008). On Line Analytical Processing. (J. T. Flores, Editor, & U. P.


Aplicadas, Producer) Retrieved Octubre 25, 2016, from Comparativo OLTP y
OALP: http://html.rincondelvago.com/olap.html

Goodwin, C. (2003). Technology: Business Intelligence Assault on the data


mountain. Proquest. Accountancy.

Hernndez, J., & Ramrez , M. (2004). Introduccin a la Minera de Datos. Editorial


Pearson Educacin SA, Madrid. Madrid.

Hitachi Group Company. (2016, Noviembre 10). pentaho. Retrieved from pentaho
community : http://community.pentaho.com/

Inmon, B. (2005). Building the Data Warehouse. Vancouver, Canada, U.S.A. Retrieved
from
https://books.google.com.pe/books?id=9T6Oe6AujzUC&printsec=frontcover&d
q=inauthor:"W.+H.+Inmon"&hl=es&sa=X&ved=0ahUKEwivgNGdtO3QAhW
BOSYKHfU2DnAQ6AEILTAB#v=onepage&q&f=false

jaac. (2010, NOVIEMBRE 2016). Diferencias entre OLTP y OLAP. Retrieved from
http://oltp.wikispaces.com/Diferencia+entre+OLTP+y+OLAP

Kimball, R. (2013). The data warehouse toolkit Third edition. Indianapolis. Retrieved
from
http://www.essai.rnu.tn/Ebook/Informatique/The%20Data%20Warehouse%20T
oolkit,%203rd%20Edition.pdf

Laberge, R. (2011). The Data Warehouse mentor. Practical Data Warehouse Business
Intelligence Insights .Mc Graw Hill. Mc Graw Hill.
140

Liebowitz, J. (2006). Strategic Intelligence: Business Intelligence, Competitive


Intelligence, and Knowledge Management. Retrieved from
https://books.google.com.pe/books?id=sCY5TkmLDT0C&printsec=frontcover
&hl=es&source=gbs_ge_summary_r&cad=0#v=onepage&q&f=false

McBurney, V. (2008). Knowledge sharing communities.

Montoya, R. S. (2011). Ilustrados. (R. S. Montoya, Editor) Retrieved Octubre 18, 2016,
from Business intelligence (BI) - To BI or not to BI:
http://www.ilustrados.com/tema/748/Business-intelligence---.html

Oramas, J. (2009). Arquitecturas empresariales. Bogota, Colombia.

Ordoez, M. E. (2011, Mayo). Un modelo de madurez de BI. Retrieved from


http://www.acis.org.co/intelinfo/wp-content/uploads/2011/05/Un-Modelo-de-
Madurez-de-BI-Parte-II.pdf

Rafanelli, M. (2003). Multidimensional Databases. Problems and Solutions. Italia: Idea


Group Inc. Retrieved from
https://books.google.com.pe/books?id=c09kW5ANN0kC&pg=PR2&dq=Multidi
mensional+Databases.+Problems+and+Solutions.+Idea+Group+Inc.&hl=es&sa
=X&ved=0ahUKEwjevN7wkLvQAhXF3SYKHQRRB14Q6AEIGzAA#v=onep
age&q=Multidimensional%20Databases.%20Problems%20and%20Solutions

Rincon del BI. (2010, Abril). Retrieved 10 25, 2016, from Kimball vs Inmon
Ampliacin de conceptos del Modelado Dimensional.:
https://churriwifi.wordpress.com/2010/04/19/15-2-ampliacion-conceptos-del-
modelado-dimensional/

Tindys . (2010). BD Dimensionales. Retrieved Octubre 21, 2016, from


http://www.buenastareas.com/ensayos/Bd-Dimensionales/142094.html

Tupson Technologies. (2004). Business Intelligence. Retrieved noviembre 03, 2016,


from http://www.tupson.com/busintel.htm

Urquizu, P. (2010, Enero 05). Business Intelligence Facil. Retrieved Octubre 2016,
from Datos, informacin y conocimiento:
https://www.businessintelligence.info/dss/datos-informacion-conocimiento.html
141

Velasco, R. H. (2004). Tutorial de Data warehousing. Espaa.

Wrembel, R. (2006). Data Warehouses and OLAP Concepts, Architectures and


Solutions.

Yahazee, J. (2009). Cubos OLAP. Retrieved octubre 12, 2016, from


https://app.assembla.com/spaces/tabd_olap/wiki/Trabajo_Te%C3%B3rico/print
142

ANEXOS
ANEXO 1

ENCUESTA

EMPRESA: ____________________________________________________________
ENTREVISTADO: ______________________________________________________
CARGO: _____________________________FECHA: __________________________

1. RESPECTO A LA NECESIDAD DE IMPLEMENTAR BUSINESS


INTELIGENCE

1.1.invierte ms tiempo preparando informacin que analizndola?


Si
No
1.2.Pasa mucho tiempo tratando de hacer que los reportes en Excel sean
visualmente entendibles?
Si
No
1.3.Quisiera tener una gua sobre los eventos cuando los administradores
anteriores implementaban determinada estrategia?
Si
No
1.4.Quiere saber qu productos, son ms rentables durante periodos?
Si
No

1.5.No sabe que patrones de compra tienen sus clientes por zonas?
Si
No
1.6.Ha perdido oportunidades de negocio por recibir informacin no oportuna?
Si
No
1.7.Trabaja horas extras el fin de mes para procesar reportes?
Si
No
1.8.Quisiera convertir informacin de distintas origines en un informe resumido
e entendible grficamente?
Si
No
1.9.No sabe con claridad si su personal alcanza objetivos planteados?
Si
No
1.10. No tiene idea de por qu tiene devolucin de mercadera?
Si
No

2. RESPECTO A LA FUNCIONALIDAD DE LA HERRAMIENTA


BUSINES INTELIGENCE

2.1. respecto al interfaz, le parece fcil el acceso de usuarios?


Si
No
2.2.cree que el rol usuario le permite accionar de forma especfica?
Si
No
2.3.Es adecuada la informacin asociada a los componentes del sistema?
Si
No
2.4.La bsqueda de las opciones del sistema es rpida y sencilla?
Si
No

2.5.El manejo y navegacin, es intuitivo y cumple con sus funciones?


Si
No
2.6.El formato mostrado de los datos del sistema es adecuado?
Si
No
2.7.La exploracin del sistema y sus contenidos es adecuada?
Si
No

2.8.Existe congruencia entre el componente activo y los datos mostrados por el


sistema?

Si
No

2.9.Midiendo en funcin del tiempo, cree Ud. que el tiempo de respuesta es


adecuado a sus necesidades de su empresa?

Si
No

2.10. respecto a la prueba de la herramienta BI una vez implementada, cree


que le ayudara a tomar decisiones estratgicas?

Si
No
ANEXO 02
ANEXO 03

MATRIZ DE CONSISTENCIA

PROBLEMA OBJETIVO HIPOTESIS VARIABLES TECNICAS E METODOLOGIA


INSTRUMENTOS
PROBLEMA GENERAL OBJETIVO GENERAL HIPOTESIS GENERAL Variable Tcnica Tipo
Es factible implementar un Implementar un prototipo de Es factible implementar un Independiente Encuesta Descriptivo
prototipo de estrategia estrategia empresarial business prototipo de estrategia Estrategia
empresarial business intelligence para el soporte a empresarial business empresarial
intelligence para el soporte a la toma de decisiones intelligence para el soporte a la business
la toma de decisiones gerenciales. toma de decisiones gerenciales. intelligence
gerenciales?

PROBLEMAS OBJETIVOS ESPECIFICOS HIPOTESIS ESPECIFICOS Variable Instrumento Diseo


ESPECIFICOS Realizar una bsqueda de Es factible realizar una Dependiente Gua de encuesta No experimental
Es factible realizar una informacin sobre bsqueda de informacin sobre Toma de
bsqueda de informacin herramientas de business herramientas de business decisiones Poblacin
sobre herramientas de intelligence y elegir una que intelligence y elegir una que nos gerenciales 30 profesionales
business intelligence y elegir nos permita proponer un permita proponer un prototipo conocedores de toma
una que nos permita proponer prototipo de estrategia de estrategia empresarial de decisiones
un prototipo de estrategia empresarial business business intelligence para el
empresarial business intelligence para el soporte a soporte a la toma de decisiones Muestra
intelligence para el soporte a la toma de decisiones gerenciales. Es igual a la poblacin.
la toma de decisiones gerenciales. Muestra censal
gerenciales?
Desarrollar el modelamiento Es factible desarrollar el Mtodo
Es factible desarrollar el del prototipo de estrategia modelamiento del prototipo de Hipottico deductivo
modelamiento del prototipo empresarial business estrategia empresarial business
de estrategia empresarial intelligence para el soporte a intelligence para el soporte a la
business intelligence para el la toma de decisiones toma de decisiones gerenciales.
soporte a la toma de gerenciales.
decisiones gerenciales?
ANEXO 04

Instalacin de la suite BI Pentaho 6.1, en Windows 7 64bits

Previamente a la instalacin el equipo debe estar actualizado y quitar las


aplicaciones que causan conflictos, La instalacin constar de dos fases,
instalacin de la plataforma Java y la base de datos en MYSQL y configuracin
seguido de la instalacin y la configuracin de la suite Pentaho Community 6.1.

Paso 1: Instalacin

verificamos los programas necesarios, usaremos las seleccionadas y las


instalamos.

KIT: Una vez descargado dicho archivo, le damos doble clic para que empiece
la instalacin del mismo. nos aparecer una pantalla como esta: Empezar la
instalacin de Java JDK .
RUTA: Al terminar la instalacin del Java JDK, nos pedir la carpeta de destino
donde se tiene que instalar el JRE de Java, este es importante instalarlo, para
que se ejecuten los programas hecho en Java.

Empezar la instalacin de Java JRE


Una vez que haya terminado la instalacin del Java, le daremos clic en close y
terminar la instalacin de Java JDK

Todava aqu no termina esto, configuramos las variables de entorno para que
podamos compilar desde la Consola de Comandos de Windows 7.

A continuacin, pasamos a la configuracin de variables de entorno, para la


plataforma java.

CONFIGURACION: Nos vamos a la pestaa de Opciones Avanzadas y damos


clic en Variables de Entorno

AGREGANDO VARAIBLE: las Variables de sistema, agregamos variable


llamada JAVA_HOME, en valor de variable agregamos la ruta de nuestro Java.
EDITAMOS VARIABLE: a la variable llamada Path le agregamos la ruta de
instalacin de nuestro java.

Y si se muestra esto, qued instalado el Java JDK en nuestro sistema de


Windows 7, y podemos crear los programas y compilarlos desde la consola de
comandos.

INSTALANDO BASE DE DATOS:

instalamos MySQL Server 5.6, como motor base de Datos.

En la opcin typical y siguiente


A continuacin, instalamos la herramienta MySQL Workbench 6.2, para tener
facilidad en editar nuestra base de datos.

Nos instalar en la siguiente ruta.


Seleccionamos la opcin completa.

A continuacin, instalamos nuestro conector ODBC de base de datos para


otras fuentes de datos como Excel y Acces.
El puerto de escucha ser el puerto 3306

Usuario:root

Pasoword:root

y ya podemos probar la conexin de nuestra base de datos.


Paso 2:

instalacin y configuracin de la herramienta y paquetes de la suite Pentaho.

Archivos necesarios:

Para ejecutar Pentaho es necesario que este se integre con el JDK instalado
en la mquina, editamos el archivo: c:pentaho/biserver-ce/start-pentaho.bat,
indicando la direccin donde se ubica el JDK:
Paso 3:

Realizado este proceso deberemos ejecutar Pentaho, en la carpeta biserver-ce


ejecutamos como administrador (star-pentaho.bat); Si efectivamente cargo
deberemos realizar: ingresar a una de estas opciones.

http://localhost:8080/pentaho/

http://192.168.0.26:8080/pentaho/Login

nuestro usuario y contrasea, por tanto un usuario por defecto sera:

User Name: admin

Password: password
ANEXO 05

PENTAHO

Es un proyecto iniciado por una comunidad OpenSource21, provee una


alternativa de soluciones de Inteligencia de Negocio en distintas reas como en
la Arquitectura, Soporte, Funcionalidad e Implantacin. Estas soluciones al
igual que su ambiente de implantacin estn basados en JAVA, hacindolo
flexible en cubrir amplias necesidades empresariales. A travs de la integracin
funcional de diversos proyectos de OpenSource permite ofrecer soluciones en
reas como: Anlisis de informacin, Reportes, Tableros de mando conocido
como DashBoards, Flujos de Trabajo y Minera de Datos.

Los mdulos de la plataforma Pentaho BI son:

Pentaho Reporting: es una solucin basada en el proyecto JFreeReport y permite


generar informes giles y de gran capacidad. Pentaho Reporting permite la
distribucin de los resultados del anlisis en mltiples formatos - todos los
informes incluyen la opcin de imprimir o exportar a formato PDF, XLS, HTML
y texto. Los reportes Pentaho permiten tambin programacin de tareas y
ejecucin automtica de informes con una determinada periodicidad.

Pentaho Analysis: suministra a los usuarios un sistema avanzado de anlisis de


informacin. Con uso de las tablas dinmicas, generadas por Mondrian y
JPivot, el usuario puede navegar por los datos, ajustando la visin de los datos,
los filtros de visualizacin, aadiendo o quitando los campos de agregacin. Los
datos pueden ser representados en una forma de SVG o Flash, los cuadros
de mando, o tambin integrados con los sistemas de minera de datos y los
portales web. Adems, con el Microsoft Excel Analysis Services, se puede
analizar los datos dinmicos en Microsoft Excel (usando la conexin a OLAP
server Mondrian).
Pentaho Dashboards: todos los componentes del modulo Pentaho Reporting y
Pentaho Anlisis pueden formar parte de un Dashboard22. En Pentaho
Dashboards es fcil incorporar una gran variedad en tipos de grficos, tablas y
velocmetros e integrarlos con los Portales JSP, en donde podr visualizar
informes, grficos y anlisis OLAP.

Pentaho Data Mining: permite minera de datos a travs de sofisticados


algoritmos para descubrir patrones y correlaciones significativas que de otra
manera se puede ocultar con el anlisis y los reportes estndar. stos se pueden
utilizar para ayudar a entender mejor

la empresa y tambin para mejorar el rendimiento futuro a travs de anlisis


predictivo.

Pentaho Date Integration: permite implementar los procesos ETL, Ofrece


integracin de datos de gran alcance mediante un enfoque innovador de
metadatos. [Fuente: (Torres, 2008)]

Potrebbero piacerti anche