Sei sulla pagina 1di 44

CARRERA DE INGENIERÍA DE SISTEMAS

GUÍA DE PRÁCTICA DE ASIGNATURA DE BASE DE DATOS III


LABORATORIO DE TECNOLOGÍAS #3

NÚMERO DE PRÁCTICA: BDIII- IS.P.3.017.702-02

NOMBRE DE LA PRÁCTICA:

Diseño y publicación de cubos OLAP, gestión de consultas MDX mediante visores


OLAP.

1. DATOS INFORMATIVOS:
CARRERA: Ingeniería de Sistemas
CICLO/NIVEL: Séptimo Semestre
FECHA: 22/11/2017
DOCENTE RESPONSABLE: Ing. Bertha Mazón
ESTUDIANTE(S) RESPONSABLE(S):
Jaramillo Romero Segundo Ezequiel
Jijón Reinoso Michael Andrés

2. FUNDAMENTACIÓN

Según Nader J. (2006), La inteligencia de negocios es el "conjunto de tecnologías que


permiten a las empresas utilizar la información disponible en cualquier parte de la
organización para hacer mejores análisis, descubrir nuevas oportunidades y tomar
decisiones más informadas".

Datas marts. Representa un subconjunto de datos enfocados en el análisis de un


departamento, área o ámbito específico en una organización (Mosquera & Hallo, 2014).
En el diseño de un data mart se involucran varios componentes:
- Tabla de hechos. Es la tabla central del esquema, donde se evidencias medidas
o indicadores claves del negocio que se desean analizar.
- Medida. Valor numérico que contribuyen al análisis de un hecho, un ejemplo
puede ser la cantidad oro vendido, total en valor monetario de la venta, utilidad,
etc.
- Dimensiones: Describen las perspectivas o vistas que se requieren de las
medidas del negocio. Por ejemplo: Cantidad de oro vendido por año y semestre.
Cubos OLAP. Son representaciones de los datos, por lo general en formato XML, que
sirven de intermediarios entre el data warehouse y las aplicaciones BI.
Análisis y Aplicaciones BI. Son las herramientas y aplicaciones para el análisis
descriptivo y predictivo de los datos. Entre ellos están los visores OLAP, tableros de
control (dashboards), reportes y consultas Ad Hoc, Minería de datos. Este tipo de
aplicaciones se clasifican en dos: los sistemas de soporte de decisiones y los sistemas
de información para ejecutivos (Ghosh, 2015; Gounder, Iyer, Professor-ccis, Mazyad, &
Prof, 2016; A Marinheiro & Bernardino, 2015; Vassell, Apperson, Calyam, Gillis, &
Ahmad, 2016).
CARRERA DE INGENIERÍA DE SISTEMAS
Sistema de soporte de decisiones (SSD): Permiten modelar la información usada por
los gerentes como apoyo para la toma de decisiones, (Castro, Uribe, & Castro, 2014).
Estos sistemas facilitan el análisis de datos debido a que disponen de información
histórica accesible rápidamente y presentada en informes dinámicos, flexibles e
interactivos.

3. OBJETIVOS:
 Diseñar cubos OLAP
 Implementar visores de cubos OLAP
 Realizar el análisis multidimensional OLAP respondiendo a preguntas de
negocio.

4. MATERIALES E INSUMOS

 Computadora
 Software
o Postgres SQL
o Pentaho BI Server

5. PROCEDIMIENTO

Par esta práctica se trabajará con el mismo caso de estudio de la práctica 1 y con el
data warehouse que en dicha práctica se implementó.

Caso de estudio:

La empresa X ubicada en la ciudad de Machala se dedica a la venta de


electrodomésticos. Los artículos tienen un determinado fabricante, están organizados
por categorías, tienen una utilidad y representan una inversión para la empresa.

En las facturas de venta se establece el número de la factura, el estado (TRUE=activa


o FALSE=inactiva), el cliente que realiza la compra, el monto total de la venta, la
ganancia total de cada venta y la fecha respectiva. Además, se debe considerar son la
cantidad de artículos vendidos.

Aplicando un proceso metodológico de inteligencia de negocios, realice:

1. El diseño de un data warehouse que satisfaga el requerimiento del dueño,


administradores o gerentes en base a las siguientes preguntas de negocio:

- ¿Cuál es la inversión que posee la empresa organizado por categoría en cada


día, mes y año?
- ¿Cuál es el total de las ventas en cada día, mes y año?
- ¿Cuál es la ganancia que se obtiene por cada factura de venta?
- ¿Cuál es el cliente que ha efectuado la mayor compra en un determinado mes?
- ¿Hacia qué ciudad se ha realizado el mayor monto de ventas en el mes?
CARRERA DE INGENIERÍA DE SISTEMAS
- ¿Cuántos artículos se venden por día, mes y año?
- ¿Cuál es la categoría de los artículos más vendidos por día, mes y año?

6. CUADROS DE RESULTADOS

Para conocer la inversión de la empresa X en una determinada fecha, es necesario


quitar la medida denominada inversión de la tabla de artículos y agregar una tabla de
hechos, a la cual se llamará kardex, la misma que deberá contar con la medida
inversión. Por lo tanto, la tabla artículos no se considerará con una tabla de hechos, sino
sólo una dimensión. Entonces, el esquema con el cual se realizará la práctica es el
siguiente:

1. CONEXIÓN AL DATA WAREHOUSE

Para crear la conexión entre Pentaho y la data warehouse, se debe crear las vistas
con las cuales se va a trabajar.
CARRERA DE INGENIERÍA DE SISTEMAS

Se debe crear un cubo OLAP por cada datamarts, lo cual implica también crear la misma
cantidad de vistas.

Seleccionar la base de datos dw_inventario, pulsar en el botón , dirigirse a la


pestaña de construcción de consultas de manera gráfica, y seleccionar los campos que
se desean mostrar.

Para observar la consulta que se ha generado, pulsar en la pestaña de SQL editor.


Ahora copiar en código, para crear la vista.
CARRERA DE INGENIERÍA DE SISTEMAS

Crear la vista, colocar un nombre, en este caso vista_kardex, y pegar el script anterior.
CARRERA DE INGENIERÍA DE SISTEMAS

Abrir el Pentaho Server BI, para esto ejecutar el siguiente archivo

Esperar a que el Tomcat indica que la herramienta de Pentaho está lista.

Abrir un navegador e ingresar a la dirección correspondiente, la cual dependerá del


número de puerto que se esté utilizando para Pentaho, en este caso
localhost:8080/pentaho
CARRERA DE INGENIERÍA DE SISTEMAS

Iniciar sesión como administrador

Luego se muestra la siguiente ventana. En la cual se debe pulsar en Manage Data


Sources para establecer la conexión con la base de datos denominada dw_inventario
CARRERA DE INGENIERÍA DE SISTEMAS

Pulsar en la lista que se muestra a continuación y selecciona nueva conexión

Ahora escribir el nombre de la conexión, seleccionar el tipo de base de datos, el nombre


del host, de la base de datos, el número de puerto, el usuario y contraseña.
CARRERA DE INGENIERÍA DE SISTEMAS

Verificar la conexión, para esto pulsar en el botón Test

En la siguiente imagen se muestra que la conexión ha sido creada


CARRERA DE INGENIERÍA DE SISTEMAS

2. DISEÑO DE CUBOS OLAP

Para crear los cubos OLAP en Pentaho Server BI, ubicarse dentro de manage data
sources y dar clic en new data source
CARRERA DE INGENIERÍA DE SISTEMAS
Establecer un nombre a la conexión, seleccionar el tipo de fuente, la conexión y
escribir la consulta respectiva.

Se puede hacer una vista previa de los datos, para esto pulsar en Data Preview
CARRERA DE INGENIERÍA DE SISTEMAS

Luego de finalizar la creación del cubo OLAP, aparece una ventana, en la cual se puede
modificar las funciones de agregación de las medidas, así como eliminar las medidas y
dimensiones innecesarias, de ser el caso seleccionar la opción de customize model
now.
CARRERA DE INGENIERÍA DE SISTEMAS
Eliminar los campos que no son medidas y de igual forma en las dimensiones

Luego de pulsar en el botón OK, se observa el cubo creado

Realizar el mismo procedimiento para los demás cubos, para esto se tiene que haber
creado las vistas respectivas en PostgreSQL.
CARRERA DE INGENIERÍA DE SISTEMAS

3. INSTALACIÓN DE VISORES DE CUBOS OLAP

Para proceder con la instalación de los visores de cubos OLAP se tiene que haber
iniciado sesión en Pentaho Server BI.

Instalación de Saiku Analytics


Buscar la opción que dice Marketplace y pulsar sobre la misma.
CARRERA DE INGENIERÍA DE SISTEMAS
Seleccionar la opción que dice Pentaho Marketplace.

Al abrirse una nueva pestaña se tiene que buscar la opción que dice Saiku Analytics y
pulsar la misma.
CARRERA DE INGENIERÍA DE SISTEMAS
Para finalizar la descarga de Saiku Analytics se tiene que pulsar en el botón Downloas
Plugin.

Esperar a que termine la descarga, descomprimir el archivo y cortarlo.

Acceder a la carpeta denominada system de Pentaho BI Server y pegar la carpeta saiku.

Para poder utilizar el visor de cubos OLAP, Saiku Analytics, se tiene que reiniciar
Pentaho BI Server.
Al pulsar en File, New, Saiku Analytics por primera vez aparece un mensaje que indica
que no se cuenta con la licencia respectiva, por lo cual se debe copiar la dirección que
especificada en el mensaje de ayuda (https://licensing.meteorite.bi/login) para proceder
a descargar la licencia.
Abrir un navegador y pegar la dirección especificada, con lo cual se mostrará la siguiente
ventana
CARRERA DE INGENIERÍA DE SISTEMAS

Pulsar en Sign Up, luego escribir el nombre de usuario, la clave, el nombre real, la
dirección de correo electrónico, y hacer clic en SAVE, para de esta manera crear una
cuenta.

Después acceder al correo especificado en el paso anterior para completar el registro.

Ahora se tiene que ingresar el nombre de usuario y contraseña, luego pulsar en


SUBMIT.
CARRERA DE INGENIERÍA DE SISTEMAS

Continuando con la obtención de la licencia, se debe crear primero una nueva empresa

Especificar los datos de la organización o institución, y pulsar en SAVE.


CARRERA DE INGENIERÍA DE SISTEMAS

Crear ahora sí una nueva licencia, debiendo especificar los datos solicitados como el
nombre de host, el número máximo de usuarios, el tipo de licencia y nombre de usuario
y la compañía especificada en el paso anterior. Por último, pulsar en SAVE
CARRERA DE INGENIERÍA DE SISTEMAS

Pulsar en Download Licence y esperar que se descargue el archivo.

En este caso se procedió a cambiar el nombre del archivo license_license.lic por


license.lic debido a que no se reconocía a la licencia por parte de Saiku Analytics. Copiar
dicho archivo a la carpeta saiku.
CARRERA DE INGENIERÍA DE SISTEMAS

Para evidenciar los cambios se debe reiniciar Pentaho BI Server.


Hacer clic en la pestaña File, New y en Saiku Analytics.
CARRERA DE INGENIERÍA DE SISTEMAS
Esperar hasta que se abra el visor de cubo OLAP denominado Saiku Analytics.

Instalación de Pivot4j Analytics


Buscar la opción que dice Marketplace y pulsar sobre la misma.
CARRERA DE INGENIERÍA DE SISTEMAS
Seleccionar la opción que dice Pentaho Marketplace.

Al abrirse una nueva pestaña se tiene que buscar la opción que dice Pivot4j Analytics y
pulsar la misma.
CARRERA DE INGENIERÍA DE SISTEMAS

Después pulsar en Download Plugin

Esperar que se termine el proceso de descarga, extraer los archivos del mismo y cortar
la carpeta denominada pivot4j.

Acceder a la carpeta denominada system de Pentaho BI Server y pegar la carpeta


pivot4j.

Para poder utilizar el visor de cubos OLAP, Pivot4j Analytics, se tiene que reiniciar
Pentaho BI Server.
CARRERA DE INGENIERÍA DE SISTEMAS

Esperar hasta que se abra el visor de cubo OLAP denominado Pivot4j Analytics. Se
observará una nueva ventana que solicita el nombre del catálogo y cubo. Con lo cual se
verifica que se ha instalado correctamente este visor de cubos OLAP.
CARRERA DE INGENIERÍA DE SISTEMAS

4. ANÁLISIS MULTIDIMENSIONAL OLAP SEGÚN PREGUNTAS DE NEGOCIO


(Tablas y gráficos estadísticos, sentencia MDX por cada pregunta):

1.- ¿Cuál es el total de las ventas por día en el mes de octubre del 2017?

Consulta MDX:
SELECT {[Measures].[fv_monto_total_venta]} ON COLUMNS, {[tie_dia_fv].[1], [tie_dia_fv].[2], [tie_dia_fv].[3],
SELECT NON EMPTY {[Measures].[fv_monto_total_venta]} ON COLUMNS, NON EMPTY {[tie_dia_fv].[1],
[tie_dia_fv].[2], [tie_dia_fv].[3], [tie_dia_fv].[4], [tie_dia_fv].[5], [tie_dia_fv].[6], [tie_dia_fv].[7], [tie_dia_fv].[8],
[tie_dia_fv].[10], [tie_dia_fv].[11], [tie_dia_fv].[12], [tie_dia_fv].[13], [tie_dia_fv].[14], [tie_dia_fv].[15],
[tie_dia_fv].[16], [tie_dia_fv].[18], [tie_dia_fv].[20], [tie_dia_fv].[21], [tie_dia_fv].[23], [tie_dia_fv].[24],
[tie_dia_fv].[25], [tie_dia_fv].[26], [tie_dia_fv].[27], [tie_dia_fv].[28], [tie_dia_fv].[29], [tie_dia_fv].[30]} ON
ROWS FROM [cubo_factura_venta] WHERE CrossJoin([tie_mes_fv].[10], [tie_anio_fv].[2017])
CARRERA DE INGENIERÍA DE SISTEMAS

2.- ¿Cuál es la ganancia que se obtiene en cada mes del 2017?

Consulta MDX:
SELECT NON EMPTY {[Measures].[fv_ganancia_venta]} ON COLUMNS, NON EMPTY {[tie_mes_fv].[2],
[tie_mes_fv].[6], [tie_mes_fv].[7], [tie_mes_fv].[8], [tie_mes_fv].[9], [tie_mes_fv].[10], [tie_mes_fv].[11]} ON
ROWS FROM [cubo_factura_venta] WHERE [tie_anio_fv].[2017]

3.- ¿Cuál es el cliente que ha efectuado la mayor compra en el mes de noviembre?


CARRERA DE INGENIERÍA DE SISTEMAS

Consulta MDX:
SELECT NON EMPTY {[Measures].[fv_monto_total_venta]} ON COLUMNS, NON EMPTY
Order({[per_nombre].[Ana], [per_nombre].[Antonio], [per_nombre].[Rocio], [per_nombre].[Daniel],
[per_nombre].[Juan], [per_nombre].[Luis], [per_nombre].[Pepa Luna], [per_nombre].[Raquel],
[per_nombre].[Saida], [per_nombre].[sdf], [per_nombre].[Sofia], [per_nombre].[Tania]},
[Measures].[fv_monto_total_venta], DESC) ON ROWS FROM [cubo_factura_venta] WHERE
CrossJoin([tie_mes_fv].[11], [tie_anio_fv].[2017])

4.- ¿Hacia qué ciudad se ha realizado el mayor monto de ventas en el mes?

Consulta MDX:
SELECT NON EMPTY {[Measures].[fv_monto_total_venta]} ON COLUMNS, NON EMPTY
Order({[ciu_nombre].[El Guabo], [ciu_nombre].[Huaquillas], [ciu_nombre].[Machala], [ciu_nombre].[Pasaje],
[ciu_nombre].[Santa Rosa]}, [Measures].[fv_monto_total_venta], DESC) ON ROWS FROM [cubo_factura_venta]
WHERE [tie_anio_fv].[2017]
CARRERA DE INGENIERÍA DE SISTEMAS
5.- ¿Cuántos artículos se venden por día en el mes de octubre del 2017?

Consulta MDX:

WITH SET [~FILTER] AS {[tie_anio_fv].[2017]} SET [~COLUMNS] AS


{[cat_nombre].[cat_nombre].Members} SET [~ROWS_tie_mes_fv_tie_mes_fv]
AS {[tie_mes_fv].[10]} SET [~ROWS_tie_dia_fv_tie_dia_fv] AS
{[tie_dia_fv].[tie_dia_fv].Members} SELECT NON EMPTY
CrossJoin([~COLUMNS], {[Measures].[det_unidades_vendidas]}) ON
COLUMNS, NON EMPTY
NonEmptyCrossJoin([~ROWS_tie_mes_fv_tie_mes_fv],
[~ROWS_tie_dia_fv_tie_dia_fv]) ON ROWS FROM [cubo_detalle] WHERE
[~FILTER]
CARRERA DE INGENIERÍA DE SISTEMAS
6.- ¿Cuál es la inversión que posee la empresa organizado por categoría en el mes de
octubre del 2017?

Consultas MDX:
WITH SET [~FILTER] AS {[tie_anio_k].[tie_anio_k].Members} SET [~COLUMNS] AS
{[cat_nombre].[cat_nombre].Members} SET [~ROWS] AS {[tie_mes_k].[10]} SELECT
NON EMPTY CrossJoin([~COLUMNS], {[Measures].[inversion]}) ON COLUMNS, NON
EMPTY [~ROWS] ON ROWS FROM [cubo_kardex] WHERE [~FILTER]

7.- ¿Cuál es la categoría de los artículos más vendidos en los meses de septiembre,
octubre y noviembre en el 2017?
CARRERA DE INGENIERÍA DE SISTEMAS

Consulta MDX:

WITH SET [~FILTER] AS {[tie_anio_fv].[2017]} SET [~COLUMNS] AS


{[cat_nombre].[cat_nombre].Members} SET [~ROWS] AS {[tie_mes_fv].[10],
[tie_mes_fv].[9], [tie_mes_fv].[11]} SELECT NON EMPTY CrossJoin([~COLUMNS],
{[Measures].[det_unidades_vendidas]}) ON COLUMNS, NON EMPTY [~ROWS] ON
ROWS FROM [cubo_detalle] WHERE [~FILTER]

7. CONCLUSIÓN

Los diferentes visores de cubos con los que cuenta Pentaho proporcionan
diversas formas de visualizar las consultas de los datos en el datawarehouse,
además de poner generar informes y guardarlos en archivos de lectura como
PDF.

La generación de cubos permite realizar informe, respondiendo las diferentes


preguntas de negocios planteadas, de esta manera se pueden tomar las mejores
decisiones a partir de los resultados obtenidos.

Los procedimientos aplicados en la práctica permiten conocer más acerca de la


generación de informes a partir de información histórica, lo cual es indispensable
para la mejor toma de decisiones.

8. RECOMENDACIÓNES

 El Server BI y Data Integration de Pentaho deben estar en correcto


funcionamiento para asegurar la correcta manipulación de los datos.
 Poseer un ordenador con características tales que se pueda hacer uso del
software respectivo sin ningún tipo de problema.
 Asegurar que los datos estén correctos y ordenados, de tal manera que no
afecten al resultado final.

9. ANEXOS
Anexar manual paso a paso del desarrollo de la práctica.
CARRERA DE INGENIERÍA DE SISTEMAS

MANUAL
VISOR DE CUBOS OLAP: SAIKU
CARRERA DE INGENIERÍA DE SISTEMAS

Pulsar en el botón Creare new, luego en Saiku Analytics

Se visualizará la ventana principal del visor de cubos OLAP, Saiku Analytics, luego
pulsar en create a new query
CARRERA DE INGENIERÍA DE SISTEMAS

Seleccionar un cubo para generar un informe estadístico.


CARRERA DE INGENIERÍA DE SISTEMAS

Con lo cual se visualizan las medidas y dimensiones respectivas

Seleccionar y mover la medida


CARRERA DE INGENIERÍA DE SISTEMAS

Luego hacer lo mismo con las dimensiones, es decir; moverla para mostrarlas como
columna o fila, según sea necesario. Además, hay la posibilidad de aplicar filtros
CARRERA DE INGENIERÍA DE SISTEMAS

Si se requiere sólo mostrar información de un mes específico, seleccionar la


dimensión y establecer que mes se desea mostrar.
CARRERA DE INGENIERÍA DE SISTEMAS

Si se requiere aplicar un filtro arrastrar la dimensión correspondiente y establecer


que dato o datos se quieren filtrar.

Luego pulsar en el botón OK.


CARRERA DE INGENIERÍA DE SISTEMAS

Después de especificar las medidas, filas, columnas y filtros, se puede observar la


tabla correspondiente

Y se podría incluir un gráfico estadístico al pulsar en el botón que se indica a


continuación:
CARRERA DE INGENIERÍA DE SISTEMAS

MANUAL
VISOR DE CUBOS OLAP: PIVOT4J
CARRERA DE INGENIERÍA DE SISTEMAS
Pulsar en el botón Creare new, luego en Pivot4J Analytics

Se visualizará una ventana que solicita el cubo con el cual se creará el reporte de
análisis

Seleccionar el cubo OLAP, para generar el informe estadístico, luego pulsar en el


botón Aprobar.
CARRERA DE INGENIERÍA DE SISTEMAS
Con lo cual se visualizan las medidas y dimensiones respectivas

Seleccionar y mover la medida

Luego hacer lo mismo con las dimensiones, es decir; moverlas para mostrarlas como
columna o fila, según sea necesario.
CARRERA DE INGENIERÍA DE SISTEMAS
Además, hay la posibilidad de aplicar filtros

Si se requiere sólo mostrar información de un mes y año específico, seleccionar la


dimensión y establecer que mes y año se desea mostrar en el reporte.
CARRERA DE INGENIERÍA DE SISTEMAS
Después de especificar las medidas, filas, columnas y filtros, se puede observar la
tabla correspondiente

Y se podría incluir un gráfico estadístico al pulsar en el botón chart

Potrebbero piacerti anche