Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
FACULTAD DE INGENIERA DE
SISTEMAS E INFORMTICA
Presentado por:
Tarapoto Per
2010
1
INDICE
INDICE....2
INTRODUCCIN....4
I. DE LA ORGANIZACIN.....5
1.1. UBICACIN...5
1.2. MISIN.5
1.3. VISIN..5
1.4. CONTEXTO O SITUACION ACTUAL....5
1.5. ORGANIGRAMA.....6
II. PLANTEAMIENTO DEL PROBLEMA.7
2.1. DEFINICIN DEL PROBLEMA...7
2.2. JUSTIFICACIN DE ESTUDIO8
III. MARCO TERICO.9
3.1. ANTECEDENSTES DEL PROBLEMA..9
3.1.1. Construccin de un sistema de apoyo a la toma de decisiones para el
rea gerencial del Hospital de Clnicas9
3.1.2. Proyecto en Sedapal..10
3.1.3. Proyecto en Corporacin DROKASA10
3.1.4. Proyecto ENAPU..10
3.2. BASES TERICAS11
3.2.1. Inteligencia de Negocios.11
3.2.2. Data warehouse...13
3.2.3. Modelamiento Multidimensional..16
3.2.4. Metodologas de BI.19
3.2.5. Solucin de Herramientas Business Intelligence.24
IV. OBJETIVOS..26
4.1. OBJETIVO GENERAL....26
4.2. OBJETIVOS ESPECFICOS......26
V. TECNICAS Y HERRAMIENTAS EMPLEADAS..26
5.1. Tcnicas26
5.2. Herramientas.26
VI. ALTERNATIVAS DE SOLUCIN.........27
6.1. Alternativa 0127
2
6.2. Alternativa 0227
6.3. Descripcin de las alternativas27
VII. SELECCIN Y DESARROLLO DE LA ALTERNATIVA..28
7.1. Desarrollo de la propuesta28
7.1.1. Metodologa de Ralph Kimball.28
7.2. Cronograma.31
7.3. Anlisis de Costos.32
a. Requerimientos.32
b. Beneficios..33
c. Anlisis Costo/Beneficio.34
VIII. PROTOTIPO.36
IX. CONCLUSIONES.48
X. RECOMENDACIONES.49
XI. BIBLIOGRAFIA...50
3
INTRODUCCIN
4
I. DE LA ORGANIZACIN
1.1. UBICACIN
1.2. MISIN
Dar una mejor atencin al servicio del cliente, mediante las diferentes
estrategias que tiene el gerente con sus empleados, para dar salida a las
ventas de los productos que ofrece la empresa, de esa manera generar
ingresos o ganancias por el bien de la empresa.
1.3. VISION
5
Actualmente la empresa cuenta con diferentes empleados que ocupan las
distintas reas que tiene la empresa. En el rea de ventas cuenta con tres
empleados, en el rea de compras cuenta con un empleado, en el rea de
almacn cuenta con dos empleados, tambin la empresa tiene un contador
quien se ocupa de todos los movimientos financieros que realiza.
1.5. ORGANIGRAMA
6
II. PLANTEAMIENTO DEL PROBLEMA
A esto se suma el desconocimiento por parte de los usuarios finales, los que
ignoran la existencia de nuevas herramientas, mucho ms eficientes y
sencillas de usar y que brindan informacin ms relevante para la toma de
decisiones y as emplear mejores decisiones para fidelizar a los clientes y ver
cules son los productos ms vendidos por temporadas.
7
2.2. JUSTIFICACIN DE ESTUDIO
8
III. MARCO TEORICO
9
Ms all de la metodologa en s, este trabajo permite mostrar las
actividades y tiempos que involucra la construccin de un sistema de
informacin con caractersticas de apoyo a la toma de decisiones. El
sistema construido se basa en el uso de tecnologa data warehousing y
OLAP. Para el Hospital de Clnicas este trabajo tuvo los siguientes
aportes:
Documentacin completa del sistema legado de partida.
Documentacin de diseo del sistema de Data Warehouse e
implementacin de un prototipo del cubo de Compras.
Conocimiento a nivel gerencial de la situacin actual de la
institucin respecto de los sistemas informticos que necesitan
finalizacin para poder ser integrados a un Data Warehouse
corporativo.
Conocimientos a nivel gerencial de las posibilidades de apoyo que
un Data Warehouse puede brindar a su gestin.
Si bien se cuenta con mejor tecnologa para resolver un sistema de
informacin que ayude a la toma de decisiones, es importante resaltar
el tiempo que consume la actividad de preparacin para el uso de la
misma, en particular el relevamiento de sistemas legados con
documentacin escasa o inexistente. Tambin se pudo experimentar
un alto costo en tiempo debido a la brecha que puede existir entre los
requerimientos a nivel gerencial y los sistemas realmente existentes
en una institucin de gran porte.
10
del Trfico de Carga, Trfico de Naves, Trfico de Contenedores,
Facturacin y Cobranzas, Servicios a las Naves y Servicios a las Cargas.
Adicionalmente se desarrollo un Dashboard (tablero de control) que
incluye 27 Indicadores Operativos y de Gestin del Puerto. Solucin
desarrollada sobre la plataforma MicroStrategy y Oracle Database.
3.2.1.1. Definicin:
La Inteligencia de Negocios o Business Intelligence (BI) se puede
definir como el proceso de analizar los bienes o datos acumulados en
la empresa y extraer una cierta inteligencia o conocimiento de ellos.
Dentro de la categora de bienes se incluyen las bases de datos de
clientes, informacin de la cadena de suministro, ventas personales y
cualquier actividad de marketing o fuente de informacin relevante
para la empresa.
11
Fase 1 Dirigir y Planear. En esta fase inicial es donde se debern
recolectar los requerimientos de informacin especficos de los
diferentes usuarios, as como entender sus diversas necesidades, para
que luego en conjunto con ellos se generen las preguntas que les
ayudarn a alcanzar sus objetivos.
12
de las inversiones en tecnologa de administracin de datos y
bases de datos.
Mayor agilidad empresarial. La combinacin de mtodos de
prediccin ms exactos y la generacin de informes con
herramientas de implementacin y respuesta a transacciones en
tiempo real, se obtiene un rpido resultado de gran capacidad de
reaccin ante nuevas oportunidades.
Menores costes operativos. Reduccin de tiempo para la
recopilacin empresarial y permite a los empleados realizar
consultas, preparar informes e implementar resultados sin la
necesidad de ayuda de especialistas de IT.
Optimizacin de la adquisicin de clientes. Rpida identificacin
de clientes potenciales y presentacin de campaas eficaces y
precisas.
Mayor fidelidad de los clientes. Permite determinar qu
productos, caractersticas y servicios valoran los clientes. Ofrece
tambin herramientas eficaces para la comunicacin
personalizada.
3.2.2.1. Definicin
Una de las definiciones ms famosas sobre Data Warehouse, es la de
William Harvey Inmon, quien define: Un Data Warehouse es una
coleccin de datos orientada al negocio, integrada, variante en el
tiempo y no voltil para el soporte del proceso de toma de decisiones
de la gerencia.
Sistema fuente:
Sistemas operacionales de registros donde sus funciones son
capturar las transacciones del negocio. A los sistemas fuentes
tambin se le conoce como Legacy System.
rea de trfico de datos:
Es un rea de almacenamiento y grupo de procesos, que limpian
transforman, combinan, remover los duplicados, guardan,
archivan y preparan los datos fuente para ser usados en el Data
WareHouse.
13
Servidor de presentacin:
La maquina fsica objetivo en donde los datos del Data
WareHouse son organizados y almacenados para consultas
directas por los usuarios finales, reportes y otras aplicaciones.
Modelo dimensional:
Una disciplina especfica para el modelado de datos que es una
alternativa para los modelos de entidad relacin.
Procesos de negocios:
Un coherente grupo de actividades de negocio que hacen sentido
a los usuarios del negocio del Data WareHouse.
Data Mart: Un subgrupo lgico del Data WareHouse completo.
Data WareHouse: Bsquedas fuentes de datos de la empresa. Y
es la unin de todos los Data Marts que la constituyen.
Almacenamiento operacional de datos: es el punto de
integracin por los sistemas operacionales. Es el acceso al soporte
de decisiones por los ejecutivos.
OLAP: actividad general de bsquedas para presentacin de texto
y nmeros del Data WareHouse, tambin un estilo dimensional
especfico de bsquedas y presentacin de informacin y que es
ejemplificada por vendedores de OLAP.
ROLAP: un grupo de interfases de usuarios y aplicaciones que le
dan a la base de datos relacional un estilo dimensional.
MOLAP: un grupo de interfases de usuarios, aplicaciones y
propietarios de tecnologa de bases de datos que tienen un fuerte
estilo dimensional.
Aplicaciones para usuarios finales: una coleccin de
herramientas que hacen los queries, analizan y presentan la
informacin objetivo para el soporte de las necesidades del
negocio.
Herramientas de acceso a datos por usuarios finales: un
cliente de Data WareHouse.
Ad Hoc Query Tool: un tipo especfico de herramientas de acceso
a datos por usuarios finales que invita al usuario a formas sus
propios queries manipulando directamente las tablas relacionales
y sus uniones.
14
Modelado de aplicaciones: un sofisticado tipo de cliente de Data
WareHouse con capacidades analticas que transforma o digiere
las salidas del Data WareHouse.
Meta Data: toda la informacin en el ambiente del Data
WareHouse que no son as mismo los datos actuales.
15
3.2.3. Modelamiento multidimensional
Relacional ROLAP.
Multidimensional MOLAP.
Hbrido HOLAP.
16
Es el ms simple de interpretar y optimiza los tiempos de respuesta
ante las consultas de los usuarios. Este modelo es soportado por casi
todas las herramientas de consulta y anlisis, y los metadatos son
fciles de documentar y mantener, sin embargo es el menos robusto
para la carga y es el ms lento de construir.
17
Una de las razones principales para utilizar este tipo de modelo, es la
posibilidad de segregar los datos de las tablas de dimensiones y
proveer un esquema que sustente los requerimientos de diseo. Otra
razn es que es muy flexible y puede implementarse despus de que
se haya desarrollado un esquema en estrella. Posee las siguientes
caractersticas:
18
Su diseo y cualidades son muy similares a las del esquema en
estrella, pero posee una serie de diferencias con el mismo, que son
precisamente las que lo destacan y caracterizan. Entre ellas se pueden
mencionar:
3.2.4. Metodologas de BI
19
3.2.4.3. Metodologa de Clearpeaks
20
o sea la parte cuantitativa de la informacin para la toma de
decisiones.
Diseo de la Seleccin de
Arquitectura Productos e
Tcnica Instalacin
Especificacin de Desarrollo de
Aplicaciones para Aplicaciones para
Usuarios Finales Usuarios Finales
21
Definicin de los requerimientos del Negocio: El objetivo de esta
etapa es entender las necesidades del negocio y determinar los
requerimientos de los usuarios finales. Los diseadores del data
warehouse deben entender los factores claves que dirigen el negocio
para determinar efectivamente los requerimientos.
22
Seleccin e instalacin de productos: Utilizando el Diseo de la
Arquitectura Tecnolgica como marco, se especifican los
componentes estructurales tales como: plataforma de Hardware,
administrador de base de datos, herramientas de preparacin
("staging").
Utilizando el diseo de arquitectura tcnica como marco, es
necesario evaluar y seleccionar componentes especficos de la
arquitectura como la plataforma de hardware, el motor de base de
datos, la herramienta de preparacin. Una vez evaluados y
seleccionados los componentes determinados se procede con la
instalacin y prueba de los mismos.
23
3.2.5. SOLUCIN DE HERRAMIENTAS BUSINESS INTELLIGENCE
3.2.5.1. Stage
DataStage [DAT 2007] es una herramienta que permite soportar la
informacin que necesita la compaa, y construir un Data Warehouse
en tiempo real. El DataStage es una herramienta ETL
(Extract/Transform/Load - Extraccin, Transformacin y Carga) que
utiliza notacin grfica para construir integracin de datos para dar
soluciones, y est disponible en varias versiones, como Server Edition
y Enterprise Edition. Es una de las herramientas ETL ms rpidas y
potentes del mercado.
3.2.5.2. SSIS
El software SQL Server Integration Services (SSIS) [SQL 2005],
permite la integracin de los datos de cualquier fuente. SISS provee
una plataforma escalable y extendible que capacita al equipo
desarrollador a construir, mantener, y desplegar soluciones de
integracin para alcanzar soluciones de integracin nicas de acuerdo
a las necesidades. Destacan sus herramientas de minera de datos y
administracin de objetos.
3.2.5.3. Sunopsis
Tambin existe en el mercado, Sunopsis [SUN 2007], que ofrece un
alto desempeo y una integracin efectiva, cubriendo las necesidades
de integracin. Esta herramienta permite el desarrollo y el
mantenimiento simple, que permite que los proyectos de integracin
se realicen a tiempo y en presupuesto. Sinopsis trabaja con una
arquitectura ELT (Extraccin, Load, Transform) en lugar de la
tradicional ETL.
3.2.5.4. Microstrategy
Existen soluciones como MicroStrategy Business Intelligence
Solutions [MIC 2007] que permite mejorar y predecir el
comportamiento del negocio, poniendo informacin en las manos de
toda persona de negocios en la empresa. Esta tecnologa ofrece
capacidades de monitoreo, de reportes y de anlisis, que permiten
tomar mejores decisiones cada da, y lograr las metas planteadas en
cada organizacin. Esta herramienta permite la generacin de
24
scorecards y dashboards, reportes, anlisis OLAP, anlisis avanzado y
predictivo, alertas y notificaciones.
3.2.5.5. Cognos
Cognos 8 Business Intelligence [COG 2007] es una plataforma del
grupo IBM que permite la generacin y visualizacin de reportes,
cubos, dashboards y Balance scorecards, adems de la gestin de
permisos y usuarios necesaria para la implementacin de la
plataforma.
3.2.5.7. Pentaho
Existen herramientas orientadas a la Inteligencia de Negocios, de
cdigo abierto (Open Source) y de uso libre. Entre estas herramientas
se encuentra Pentaho [PEN 2007], la cual es una herramienta muy
completa, pues incluye elaboracin de reportes, cubos, dashboards,
data mining, ETL y una plataforma BI (lugar desde donde se puede
acceder a los datos).
3.2.5.8. Octopus
Octopus [OCT 2007] es, al igual que pentaho, una herramienta libre
pero slo se centra en los procesos ETL. Est basada en Java y por lo
tanto se puede conectar a cualquier fuente JDBC.
A continuacin se presenta un cuadro comparativo, con las
herramientas mencionadas anteriormente, que muestra las
caractersticas trascendentales para un trabajo como el que se
desarrollar en el presente proyecto de tesis.
25
Luego de detallar las diferentes herramientas que existen para la
construccin de Business Intelligence, en este cuadro se resume las
caractersticas principales de cada herramienta, de la cual el grupo ha
elegido la herramienta de SQL Server para la elaboracin del
Datawarehouse, el cual permite ETL (Extraccin, Transformacin y
Carga) y la elaboracin de reportes de acuerdo a las necesidades de la
organizacin.
IV. OBJETIVOS
Para la elaboracin del presente proyecto se har uso de las siguientes tcnicas con
sus respectivas herramientas, como se detalla a continuacin:
5.1.1. Tcnicas
5.1.2. Herramientas
26
VI. ALTERNATIVAS DE SOLUCIN:
Nombre de
Componentes (Resultados
cada Acciones necesarias para
necesarios para lograr el
Alternativa lograr cada resultado
Objetivo)
analizada
Alternativa 1: Elaboracin de la base del
Adquisicin concurso.
mediante Resultado 01: Automatizacin de
compra de un todo el proceso para realizar
Licitacin.
Datawarehouse informes especficos.
desarrollados
Implementacin.
por terceros, Resultado 02: Monitorizacin
para el apoyo a adecuada de todas las
Implantacin.
la toma de actividades diarias en la
decisiones. organizacin.
Capacitacin.
Puesta en marcha.
Alternativa 2:
Implementacin Levantamiento de
Resultado 01: Automatizacin de
de un Informacin.
todo el proceso para realizar
Datawarehouse
informes especficos.
para el apoyo a
la toma de Desarrollo del sistema.
Resultado 02: Monitorizacin
decisiones
adecuada de todas las
desarrollado por
actividades diarias en la
la unidad Utilizacin de equipos
organizacin.
formuladora y informticos existentes.
ejecutora del
27
proyecto.
Capacitacin al usuario
Implantacin.
28
Diseo de la Seleccin de
Arquitectura Productos e
Tcnica Instalacin
Especificacin de Desarrollo de
Aplicaciones para Aplicaciones para
Usuarios Finales Usuarios Finales
29
No hay una fuente comn de los datos.
Productividad
La productividad es un punto muy importante a tener en cuenta,
especialmente en organizaciones como la nuestra que poseen datos con una
historicidad. Cuando surge la necesidad de producir un informe corporativo
utilizando muchos archivos y de los datos que la organizacin ha ido
acumulando a travs de los aos, entonces se debe:
Un cambio en el enfoque
Para resolver los distintos problemas, las organizaciones necesitan
implementar un cambio de arquitectura de sus sistemas de decisin, y es aqu
donde juega un papel muy importante el Datawarehouse.
El datawarehouse suple las incapacidades que poseen los sistemas
transaccionales, almacenando datos que poseen las siguientes caractersticas:
30
7.2. CRONOGRAMA
31
7.3. ANALISIS DE COSTOS
A continuacin se detallan los costos para el diseo y implementacin del Datawarehouse en la empresa comercial
Arvalo.
a) REQUERIMIENTOS
Funcionales
tem Descripcin Unidad de medida Cantidad
1 Un jefe de proyecto Mes 2
2 Administrador de Base de Datos Mes 2
3 Programador Mes 2
No Funcionales
tem Descripcin Unidad de medida Cantidad
1 Computadora Unidad 3
2 Celular Unidad 2
3 Electricidad Mes 2
4 tiles de oficina Lista 1
5 Impresora Unidad 1
DETALLES
Personal
Item Descripcin U.M Cant P.U (S/.) Importe (S/)
32
1 Jefe de proyecto. Mes 2 2 000.00 4 000.00
Administrador y diseador
2 de Base de Datos. Mes 2 1 500.00 3 000.00
3 Programador Mes 2 800.00 1 600.00
Total 8 600.00
Servicios
Item Descripcin U.M Cant P.U (S/.) Importe (S/.)
1 tiles de oficina Lista 1 300.00 300.00
2 Electricidad Mes 2 70.00 140.00
3 Telfono Mes 2 150.00 300.00
Total 740.00
Software
Item Descripcin Cantidad Precio Total
1 Visual Studio .Net 2005 1 500 500.00
2 SQL Server 2005 Developer 1 550 550.00
3 Microsoft Office 2007 1 450 450.00
Total 1500.00
Hardware
33
Item Descripcin Cantidad Precio Total
1 Computadoras 2 1800 3600.00
2 SQL Server 2005 Developer 1 3000 3000.00
3 Impresora 1 180 180.00
Total 6780.00
Cuadro Resumen.
tem Descripcin Monto (S/.)
1 Personal 8 600.00
2 Materiales y/o Servicios 740.00
3 Licencias 1500.00
4 Hardware 6780.00
Total 17 620.00
El costo total para la construccin del Datawarehouse es de S/. 17 620, tanto en pago a personal, materiales y costo de
licencias.
34
b) BENEFICIOS
Dentro de los muchos beneficios otorgados por la implementacin de un sistema de soporte de decisin basado en un
Datawarehouse son:
Reduccin de tiempos y costos asociados con la consolidacin de datos provenientes de distintas fuentes.
Acceso inmediato y flexible a informacin critica de la organizacin resultando esto en ventajas competitivas.
Mejoras en la calidad de los datos: consistencia, precisin y documentacin.
Creacin de una infraestructura flexible, capaz de adaptarse rpidamente a los cambios tcticos y estratgicos
de negocio.
Mayor conocimiento de las necesidades y expectativas de los clientes, pudiendo segmentar el mercado de
acuerdo a intenciones de negocios.
Decisiones ms rpidas.
Mejor entendimiento del negocio.
Descubrimiento de nuevas oportunidades de negocio.
Incremento de productividad y reduccin de costos en la disponibilidad de informacin.
Monitoreo del normal desenvolvimiento de las operaciones de la organizacin.
Capacidad de realizar comparaciones y obtener tendencias centrando la atencin sobre los verdaderos puntos
problemas.
Ahorro de costos en pago de horas extras al personal.
c) ANALISIS COSTO/BENEFICIO
35
Para demostrar la sostenibilidad y factibilidad del proyecto se har una evaluacin de costo-beneficio para ello se
tendr en cuenta los siguientes indicadores y datos:
FLUJO DE CAJA
SOFTWARE
Visual Studio.Net 2005 500.00
SQL Server 2005 550.00 550.00 550.00 550.00 550.00
Microsoft Office 2007 450.00 450.00 450.00 450.00 450.00
36
SERVICIOS
Desarrolladores y 8 600.00 3 000.00
Capacitacin
Otros servicios 740.00 740.00 740.00 740.00 740.00
De acuerdo al flujo de caja que se detalla en el cuadro anterior, se puede observar que con la implementacin del Data
warehouse la empresa en los dos primeros aos despus de la implementacin tiene beneficios negativos, lo cual desde
el tercer ao de funcionamiento del Data warehouse se obtiene beneficios econmicos favorables para la empresa.
37
VIII. PROTOTIPO
En esta parte de proyecto se muestran algunas imgenes del diseo del Data warehouse.
Tiempo_Dim
TiempoKey
Anual
Trimestre Banco_Dim
Mes BancoKey
Dia Descripcion
Fecha idBanco
Ventas_Hecho Cobranza_Hecho
VentasKey idCobranzaKey
ClienteKey ClienteKey
ProductoKey Personal_Dim TiempoKey MedioPago_Dim
PersonalKey PersonalKey BancoKey MedioPagoKey
Unidades MontoCobrado
Peso InteresCobrado
38
ETL (EXTRACCIN TRANSFORMACIN CARGA)
CREACCIN DE UN NUEVO PROYECTO DE INTEGRATION SERVICES
39
ESTABLECEMOS LA CONEXIN CON LA BASE TRANSACCIONAL
40
PROCEDEMOS A CREAR LA TAREA DE FLUJO DE DATOS
41
Definimos el origen de datos para cada flujo de control, en el flujo de datos.
42
Para cada flujo de datos se define el origen y destino de datos.
43
DESTINO (DATA WAREHOUSE)
44
COMPLETADA LA TAREA EJECUTAMOS EL PROYECTO PARA COMENZAR CON EL ETL
MICROSOFT EXCEL
45
46
47
IX. CONCLUSIONES
48
X. RECOMENDACIONES
49
XI. BIBLIOGRAFA
www.microsoft.com/spain/partner/gotomarket/bi/businessintelligence.
mspx
http://www.monografias.com/trabajos17/data-warehouse/data-
warehouse.shtml
50