Sei sulla pagina 1di 23

SISTEMAS DE INTELIGENCIA DE NEGOCIOS

Estructura de contenidos

INTRODUCCIÓN...........................................................................3

1. BODEGA DE DATOS (DATA WAREHOUSE)...................................3



1.1. Componentes............................................................3
1.1.1. Orígenes de datos.........................................4
1.1.1.1. Sistemas propios...........................................4
1.1.1.2. Origen externos............................................4

1.1.2. Área de almacenamiento de Datos.....................4
1.1.2.1. Modelos de datos dimensionales......................4
1.1.2.2. Cubos OLAP..................................................7

1.1.3. Herramientas de Acceso a datos.....................10
1.1.3.1. Reportes , Informes y herramientas Dashboard..10
1.1.3.2. Minería de Datos..........................................10
1.1.3.3. Sistemas de Soporte a las Decisiones...........11

2. CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS..12



2.1. Requisitos de Negocio..................................................12
2.2. Modelado dimensional..................................................13
2.3. Diseño y desarrollo ETL..................................................14
2.4. Diseño y construcción de cubos.....................................16
2.5. Implementación Interfaz de usuario..............................17
2.6. Plan de Mantenimiento..................................................18
2.7. Pruebas e Implementación............................................18

GLOSARIO..................................................................................20

BIBLIOGRAFÍA............................................................................22

FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje


SISTEMAS DE INTELIGENCIA DE NEGOCIOS

2
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

INTRODUCCIÓN

Cada día son más las organizaciones alrededor del mundo, que establecen
estrategias y asumen posiciones privilegiadas en el sector debido a la
toma de decisiones de apoyados en Sistemas de Inteligencia de Negocios.

La generación de conocimiento asegura una mejor gestión de los procesos


en las organizaciones, la cadena de valor que adquieren los datos durante
su recorrido por la organización sólo es posible si se tienen adecuadamente
estructuradas las actividades que hacen posible contar con soluciones de
Inteligencia de Negocios (BI).

1. BODEGA DE DATOS (DATA WAREHOUSE)

1.1 Componentes

La estructura organizacional de la bodega permite identificar tres elementos


esenciales en la bodega de datos:

Modelos de Datos
Dimensionales Reportes , Informes y
herramientas Dashboard
VENTAS
Esquema en Estrella

ERP
Esquema Copo de Nieve

SCM Minería de Datos

Web Log Esquema Constelación


Procesos ETL

Sistemas de Soporte
Origenes de Datos a las Decisiones
Externos

Cubos OLAP

Orígenes de datos Área de almacenamiento Herramientas de


Acceso a Datos

3
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

1.1.1. Orígenes de datos

Corresponde a las fuentes que suministran los datos que conformaran la


bodega y permitirán la generación de información asociada a la filosofía
organizacional.

1.1.1.1. Sistemas propios

Al interior de las organizaciones existen sistemas de información los cuales


son la fuente primaria para proveer los datos a transferir a la bodega.
Los repositorios de estos datos pueden ser bases de datos relacionales,
archivos de datos, archivos planos, hojas de cálculo, entre otros, esto
determina la necesidad de establecer procesos pertinentes para el análisis
de los mismos y determinar cuáles de esos datos representan la naturaleza
del negocio y de los objetivos propuestos para la bodega de datos.

1.1.1.2. Orígenes externos

Además de los sistemas de la organización la interacción con sistemas


externos también genera fuentes de datos, los cuales pueden también
corresponder a diferentes formatos, estos deben ser analizados para
determinar el proceso ETL que corresponda para su inclusión como fuente
de datos en la bodega. Entre estos se encuentran datos de tipo estadístico
y cualitativo, como los desarrollados a través de estudios de mercado,
poblacional, tendencias de la industria, etc.

1.1.2. Área de almacenamiento de Datos

La información contenida en la bodega en su mayoría debe estar


desnormalizada , para agilizar el tiempo de procesamiento de las consultas,
ya que se requiere manejar grandes volúmenes de datos derivados y la
realización de cálculos a diferentes niveles.

1.1.2.1. Modelos de datos dimensionales

Para la construcción del modelo lógico conceptual de la estructura de la


bodega de datos, se utiliza una representación multidimensional de las
variables que conforman los diferentes indicadores de gestión y control.
Se utilizan los modelos estrella, copo de nieve y constelación como forma
de representación gráfica; los componentes de estos modelos son tablas
de datos de dos tipos: tablas de dimensiones y tablas de hechos.

4
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

Las tablas de dimensiones son equivalentes a una entidad en un modelo


de datos, tienen una llave primaria y datos que representan los filtros de
información a aplicar, contienen información que en ciertos modelos debe
estar desnormalizada; es importante no olvidar que siempre debe existir
una tabla de dimensión asociada al tiempo, esta debe construirse con
diferentes medidas de tiempo y preferiblemente debe utilizar como llave
primaria un dato de tipo entero, para optimizar los tiempos de búsqueda
y el espacio de almacenamiento.

Las tablas de hechos representan eventos del negocio que deben ser
cuantificables, poseen una llave primaria propia y llaves foráneas que
identifican la relación con las tablas de dimensiones. Posee además otros
campos asociados a las métricas con las que se establecen las respuestas
que forman parte del objetivo de información.

1.1.2.1.1. Esquema en Estrella

Este esquema es un modelo de datos compuesto por una tabla central


denominada Tabla de hechos “Fact Table”, que contiene los datos fuente
de información para el análisis, y unas tablas denominadas dimensiones,
que se encuentran relacionadas con la tabla de hechos.

Dimensiones

Dimensiones Dimensiones

TABLA DE HECHOS

Dimensiones Dimensiones

5
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

Debido a la simplicidad del modelo, ofrece gran velocidad de procesamiento


al ser usado en el análisis, permitiendo acceder tanto a los datos resumidos
a partir de funciones de agregado como al detalle de la información. Esta
velocidad es producto de la indexación que sufren las tablas de dimensiones
en forma individual, sin afectar el rendimiento de la base de datos en su
conjunto.

1.1.2.1.2. Esquema Copo de Nieve

En este esquema el modelo de datos está compuesto por una tabla


central denominada Tabla de hechos, pero a diferencia del esquema
en estrella las tablas de dimensiones no están relacionadas todas con
dicha tabla. Algunas de las tablas de dimensiones están directamente
relacionadas con otras dimensiones, estableciendo una estructura similar
a la representación gráfica de un copo de nieve.

TABLA DE HECHOS

Al sufrir un proceso de normalización, se reduce el espacio requerido de


almacenamiento en las dimensiones minimizando la redundancia en los
datos, pero al tener que construir más tablas de dimensiones la consulta
de datos disminuye el rendimiento al tener que crear más tablas y
consecuentemente el número de combinaciones (Joins) para procesarlas.

6
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

1.1.2.1.3. Esquema Constelación

En este esquema el modelo de datos consta de más de una tabla de


hechos, lo cual aumenta la complejidad del modelo. Las tablas de
dimensiones son compartidas por las tablas de hechos. Aunque el modelo
ofrece flexibilidad, su estructura puede ser muy compleja para mantener.

Las tablas de hechos pueden llegar a representar diferentes niveles de


detalle, representados por su relación con una misma dimensión. Algunas
tablas representarán detalles y otras representarán pronósticos. Siendo
entonces este modelo una combinación de esquemas en Estrella o Copo
de Nieve.

Dimensiones Dimensiones

HECHOS A HECHOS B

Dimensiones Dimensiones

Dimensiones

1.1.2.2. Cubos OLAP –OnLine Analytical Processing

Un cubo OLAP o de Procesamiento


Analítico en Línea, representa una base
de datos multidimensional caracterizada C 25 32 93
porque el almacenamiento se realiza a L Cliente 1
I

través de un arreglo multidimensional. E


N Cliente 2 13 15 50
AÑOS
T
E
S Cliente 3 56 45 11 Año 3

Las bases de datos relacionales tienen Año 2


Año 1

limitaciones respecto al análisis de


Libro 1 Libro 2 Libro 3

LIBROS
grandes volúmenes de datos, por esta

7
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

razón la propuesta del almacenamiento en cubos agilizaría los procesos


de análisis sobre los datos, sin embargo estaría limitada al periodo de
tiempo para el cual se construyo el cubo, siendo necesario rediseñar el
cubo si el periodo de análisis cambia.

Las dimensiones en el cubo representan los posibles filtros asociados a


las consultas, cuando se tienen más de tres dimensiones, los cubos se
denominan hipercubos.

Las herramientas OLAP permiten:

“rotar” los cubos.

C 25 32 93 Libro 1
25 13 56
L Cliente 1 L
I I
B
E
N Cliente 2 13 15 50 R Libro 2 32 15 45
AÑOS AÑOS
T O
E S
S Cliente 3 56 45 11 Año 3 Libro 3 93 50 11 Año 3
Año 2 Año 2
Año 1 Año 1
Libro 1 Libro 2 Libro 3 Cliente 1 Cliente 2 Cliente 3

LIBROS CLIENTES

Cambio de dimensión “clientes” por la de “libros”.

Seleccionar sólo algunas de las celdas

C
L
AÑOS
I

13 15
E
N Cliente 2 Año 1
T
E
S Libro 1 Libro 2

LIBROS

8
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

Totalizar por item

C
L Cliente 1
150
I
E
N Cliente 2
T
78 AÑOS
E
S Cliente 3 Año 3
112 Año 2
Año 1

LIBROS

O cambiar el nivel de agregación para obtener totales en diferentes niveles.

Cubos con mas detalles

C
Cliente 1 57 93
L
I
E
N Cliente 2 28 50
AÑOS
T
E
S Cliente 3 101 11 Año 3
Año 2
Año 1
Materia 1 Materia 2

MATERIAS

Se puede obtener diferentes jerarquías a partir de los atributos de las


dimensiones.

9
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

1.1.3. Herramientas de Acceso a datos

Una vez se tengan almacenados Dashboard Add Widgets...

los datos, es necesario procesarlos


Dashboard
Services

para que se conviertan en View Agents


Visual Console

conocimiento y apoyen la toma GIS Maps


Inventory

de decisiones. Estas herramientas Edit My User


Reporting

pueden categorizarse de acuerdo SNMP console


Menssages

con la complejidad de su uso o Extensions


Manage Incidents

la manera en que presenta la


información así:

1.1.3.1. Reportes , Informes y Herramientas Dashboard

Aquí se presentan los datos para que el usuario visualice la información


en un alto nivel, establece Herramientas para la generación de consultas
e informes con interfaz gráfica, las cuales a través de asistentes facilitan
la realización de peticiones complejas.

El término dashboard (tablero de control) hace alusión a una página


desarrollada con tecnología Web, donde se muestre en tiempo real la
información de la empresa, producto de las operaciones de Inteligencia de
Negocios. Su utilidad se centra en la posibilidad de generar análisis casi
instantáneos.

Para la construcción de los tableros de control es importante identificar los


indicadores de rendimiento claves (KPI – Key Performance Indicator), que
generalmente están asociados a un objetivo de negocio y de esta forma
hacer seguimiento a través de tasas o porcentajes que indican si se esta
cerca o por encima de una meta del negocio. A partir de esta filosofía se
puede descomponer una meta organizacional en metas operacionales.

1.1.3.2. Minería de Datos

La minería de datos busca que a partir de los datos almacenados se pueden


extraer patrones que permitan convertir estos datos en Inteligencia de
Negocios (BI), para lo cual existen en el mercado infinidad de soluciones
de software que proporcionan ventajas competitivas a las organizaciones.

10
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

Estas herramientas facilitan la


construcción de modelos de minería
de datos, utilizando orígenes distintos,
tanto de fuentes relacionales como
de cubos multidimensionales. En
estas herramientas se pueden aplicar
las diferentes técnicas asociadas a la
minería como son: el modelado de
regresión lineal, árboles de decisión,
redes neuronales, agrupación, etc.
También permiten la visualización de
los modelos y generar las consultas
de predicción.

1.1.3.3. Sistemas de Soporte a las Decisiones

Un Sistema de Soporte a la Decisión


(DSS) es una herramienta de Inteligencia
de Negocios que permite acceder a los
datos para su análisis y proyección como
información importante para cualquier
organización.

Dentro de las características asociadas a


estas herramientas se encuentran:

• Generación de informes dinámicos y flexibles, ya que permiten ser


modificados.
• Facilidad de utilización para los usuarios.
• Segmentación de información por perfil de usuario.
• Tiempos de respuesta óptimos.
• Integración con los demás sistemas de la compañía.
Dentro de las herramientas DSS se encuentran:
• Sistemas de información gerencial (MIS, Management Information
Systems): provee soporte a tareas organizacionales relacionadas con
aplicaciones CRM/ERP.
• Sistemas de información ejecutiva (EIS, Executive Information
System): provee acceso sencillo a información interna y externa
relevante para alcanzar las metas, especializado en el presentar el
estado diario de la organización a través de indicadores clave.

11
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

2. CICLO DE VIDA DE UN SISTEMA DE INTELIGENCIA DE NEGOCIOS

7 Pruebas e Implementación

6 Plan de Mantenimiento

5 Implementación Interfaz de Usuario

4 Diseño y Construcción de Cubos

3 Diseño y Desarrollo ETL

2 Modelado Dimensional

1
Requisitos de Negocio

El anterior diagrama representa las etapas necesarias para la


implementación de un Sistema de Inteligencia de Negocios, estas etapas
son afrontadas por diferentes metodologías y representan un modelo de
procesos a realizar..

2.1. Requisitos de Negocio

Para crear diseños apropiados es necesario identificar


los requerimientos claves correspondientes a los
factores de éxito del negocio, de tal manera que se
describa el alcance de cada nivel de los usuarios y
del Data Warehouse (Bodega de Datos).

Se deben especificar en forma clara y precisa las


funciones que se esperan de la Bodega de Datos,
para lo cual es importante considerar las expectativas
de los diferentes usuarios, tanto a nivel operativo,
como gerencial y del mismo administrador de base
de datos.

12
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

Es necesario además identificar las temáticas y objetivos de las áreas


funcionales de la organización y el nivel de detalle de la información
requerida ya que la granularidad determina los niveles de agrupamiento
a implementar, las dimensiones de categorización (tiempo, ubicación
geográfica, sector de industria, clientes, productos, etc.).

En esta etapa se deben determinar cual es el problema que se desea


resolver y establecer los criterios de éxito que pueden ser cualitativos
o cuantitativos. Es importante considerar con que información previa se
cuenta y si se tienen los datos necesarios para resolver los interrogantes.

2.2. Modelado Dimensional

En esta etapa se debe pasar de un modelo Relacional de datos a un


modelo dimensional, para lo cual se deben identificar las dimensiones,
los hechos y el modelo a utilizar. Para determinar los campos contenidos
en estas es recomendable considerar los siguientes ítems:

• Tabla de Dimensiones:

o Debe contener una clave simple no relacionada con la llave del


negocio, normalmente se refiere a llaves auto numéricas.
o Sus campos deben ser descriptores que complementen la información
y representan los niveles de agregación.
o Debe incluir las claves del negocio.
o Siempre debe existir una dimensión temporal.
o Deben ser claras y explicitas ya que representan la interfaz que
tendrán los usuarios para navegar por la información.
o No se debe escatimar en cuanto al número de atributos para la
tabla de dimensiones, ya que el numero de registros que contendrá
es mínimo respecto al de la tabla de hechos.
o Las dimensiones de fechas pueden tener diversas formas de
representarse.
o El numero de dimensiones depende del modelo dimensional adoptado,
pero si se encuentra un numero muy elevado puede ser que algunas
no son independientes y deberían agruparse.
o En algunos casos se requiere normalizar las dimensiones,
generándose un modelo copo de nieve.
o Deberían ayudar a responder las siguientes preguntas: ¿qué?,
¿quién?, ¿por qué?, ¿dónde? y ¿cuándo?

13
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

• Tabla de Hechos

o Debe contener una clave propia, independiente de las claves de


negocio.
o Los campos representan las métricas, por lo tanto son numéricos
y aditivos (no se almacenan valores individuales, solo totales y
subtotales)
o Contiene los campos de referencia hacia las tablas de dimensiones.
o Cada fila corresponde a una medida
o Si se requiere calcular porcentajes y proporciones deben almacenarse
el numerador y el denominador.
o No tienen valores nulos.
o Existen algunas tablas sin hechos (FactLess) que se utilizan para
relacionar las dimensiones y deben contener un campo de hecho
ficticio con valor por defecto igual a uno (1).

El nivel de detalle con el que se debe construir el modelo depende de


las preguntas que se quieran responder, aunque lo mejor es utilizar el
máximo nivel de detalle, teniendo en cuenta el espacio disponible en
la bodega de datos, también es necesario considerar que cada nivel de
agregación hace que se pierda parte de la información.

2.3. Diseño y desarrollo de procesos ETL

E (Extraction) T (Transformation) L (Load)

Limpieza Integración
Extracción
Transformación Actualización

Como se observa en la gráfica el proceso ETL recoge información de


diferentes fuentes, transforma los datos convirtiéndolos en datos de
calidad y veracidad, por último carga y actualiza la Bodega de Datos.

Los procesos ETL por lo general consumen mucho tiempo en un proyecto


de BI y es punto clave para el éxito.

14
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

Como se observa en la gráfica el proceso ETL recoge información de


diferentes fuentes, transforma los datos convirtiendo en datos de calidad
y veracidad por ultimo carga, actualiza en la DW.

El proceso extracción, transformación y carga está compuesto por las


siguientes etapas:

a. Extracción: Este proceso obtiene los datos físicamente de las distintas


fuentes de información utilizando técnicas y herramientas ETL, para la
selección del método es necesario tener en cuenta algunas problemáticas
de la extracción de datos como lo son el tipo de plataforma, protocolos,
juego de caracteres, tipos de datos, etc.

b. Limpieza: Al recuperar los datos en bruto, se requiere comprobar la


calidad de los mismos y corregir errores relacionados con campos nulos,
duplicados, inconsistencias en los datos, etc.

Etapas de la limpieza de datos:


• Depurar los valores: Se pueden separar los datos de acuerdo con la
estructura de destino de los datos o la regla definida para esto.
• Corregir: A partir de fuentes de datos externas se puede verificar
la información existente.
• Estandarizar: A partir de formatos definidos por las reglas de
negocio, se sustituyen valores en los campos de datos
• Relacionar: Verifica en otras fuentes la existencia de datos
relacionados, para evitar duplicados.
• Consolidar: A partir de la identificación de relaciones entre registros,
se llevan a una sola representación.

c. Transformación: Una vez que los datos se encuentran “limpios”, se


transforman de acuerdo con las reglas de negocio y las características de
las herramientas a utilizar.

En la transformación se consideran cambios de formato, cambios de


códigos, adición de valores derivados y agregados. Es importante recordar
que los agregados cumplen un valor importante, ya que al almacenar el
resultado de estos cálculos en la Bodega de Datos, se obtendrá un mayor
rendimiento al realizar las consultas respectivas, sin olvidar que el nivel
de granularidad puede estar determinado por la dimensión del tiempo.

d. Integración: En este proceso se realiza la carga de los datos y debe


validarse que los datos cargados en la bodega de datos son consistentes

15
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

con los que se encontraban en el medio transaccional.

e. Actualización: Este proceso es en el cual se determina la periodicidad


con la cual se van a añadir y sincronizar los nuevos datos a la Bodega de
Datos.

2.4. Diseño y construcción de cubos

Un cubo representa un subconjunto de datos de la bodega almacenado en


una estructura multidimensional. Para proceder a la implementación de
los cubos es necesario determinar el tipo de cubo y la herramienta que
se utilizará para ello.

La construcción física de las tablas de dimensiones y las tablas de hechos


se realizan de acuerdo con el modelo dimensional definido y la herramienta
a utilizar, se ejecutan los procesos ETL para poblar las tablas y se genera
el cubo para obtener las respuestas a los requerimientos definidos.
Posteriormente se procede a visualizar la información del cubo.

Para definir el tipo de cubo a construir es necesario identificar las opciones


de almacenamiento que se tienen así:

Rendimiento: En este caso debe ser de tipo MOLAP (Multidimensional


On-Line Analytical Processing) almacenando en una base de datos
multidimensional tanto los datos como las agregaciones.

Capacidad:

ROLAP

Detalles Vistas
de
Usuario
Agregaciones

(Relational On-Line Analytical Processing), los datos de los hipercubos


así como las agregaciones se encuentran dentro de una base de datos
relacional

16
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

HOLAP

Detalles Vistas
de
Usuario
Agregaciones

(Hibrid On-Line Analytical Processing), los datos se encuentran en una


estructura relacional y los agregados en una estructura multidimensional.

DOLAP

Vistas
Detalles de
Usuario

(Desktop On-Line Analytical Processing), Los datos se encuentran en una


base de datos multidimensional almacenada en un equipo Cliente.

2.5. Implementación de la Interfaz de usuario

Una vez que han sido construidos los cubos se deben establecer las
herramientas que permitirán la visualización de la información, para lo
cual se cuenta con diversidad de posibilidades tales como:

• Herramientas para la realización de informes, en las cuales participan


desarrolladores, quienes construyen de acuerdo con requerimientos
cambiantes de los usuarios, los informes que van siendo solicitados.
• Herramientas OLAP, que proporcionan a partir de los SMBD
aplicaciones que permiten visualizar los datos desde diferentes
contextos: informes, graficas, estadísticas etc.
• Aplicaciones de DashBoard, permitiendo la visualización sincrónica
de indicadores, referidos a objetivos o metas procedimentales.
• Sistemas DSS, donde se permite utilizar diferentes niveles de análisis
a la información a partir de aplicaciones definidas para ello.

17
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

2.6. Plan de Mantenimiento

Debido a la naturaleza dinámica de algunos datos, es necesario establecer


un plan de acción para considerar los ajustes o reconstrucción de algunos
de los objetos de la Bodega de datos. La siguiente lista proporciona algunos
de los elementos a considerar en el plan de mantenimiento.

• Modificación de datos de origen de las dimensiones. En este


caso debe analizarse si el cambio se asume para toda la historia
del dato (p.e. cambia la fecha de nacimiento del cliente) o si debe
generarse un nuevo ciclo a partir de la modificación del mismo (p.e.
una sucursal cambia de responsable).

Se hace necesario modelar la información de manera tal que no se


pierda el historial de los datos, para esto es posible utilizar “claves
subrogadas”. Una característica importante de la Bodega de Datos, es
la de repositorio de información Histórica.

• Rendimiento. Se debe considerar el espacio ocupado en la bodega


de datos, por esto es posible que se haga necesario modificar las
estructuras de las tablas para aliviar el tamaño de los objetos en la
bodega.

Es importante tener en cuenta que no se debe construir un modelo


para generar un informe en particular, sino que debe dar respuesta a
diferentes áreas a partir de la inclusión de los indicadores y conceptos
del negocio.

• Subutilización de Tablas Agregadas. Aun cuando estas tablas


proporcionan una mejora en el rendimiento de las consultas es
necesario asegurarse que la herramienta BI que se esta utilizando sea
capaz de aprovecharlas, de lo contrario los costes de mantenimiento
y actualización permanente de estas tablas solo harían mas complejo
el sistema.

2.7. Pruebas e Implementación

En esta etapa se evalúa el modelo, partiendo de los criterios de éxito


que se establecieron en la primera etapa. El proceso debe ser revisado a
partir de los resultados obtenidos para determinar si es necesario repetir
alguna de las etapas anteriores.

18
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

ERP

CRM Proceso
de Data
SCM Integración Warehouse
de datos
Proceso de auditoría
Legancy y reconciliación.

Calidad de
Usuarios
datos
BI
Control
Puntos de control de Calidad de datos

Se evalúa el modelo respecto a los objetivos planteados y si no existen


restricciones de tiempo se prueba con un problema real, también debe
evaluarse respecto a objetivos diferentes a los inicialmente planteados.

Si los resultados no son satisfactorios se hace necesario realizar otra


iteración desde la fase de modelado o del proceso de ETL; en caso contrario
se hace necesario proceder a la implementación del Sistema de BI.

La implementación se ejecuta a partir del diseño de una estrategia, que


debe incluir la monitorización y mantenimiento de los modelos adoptados
por la bodega de datos, así como la presentación de los resultados de
forma clara y precisa a los usuarios, para cumplir con los objetivos de
conocimiento.

19
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

GLOSARIO

DWH: (Data WareHouse). Bodega de Datos. Es un conjunto de datos


integrados sobre los cuales se soportan procesos de toma de decisiones
para grandes volúmenes de datos.

ETL: (Extraction, Transformation and Load). Corresponde a los


procesos de:

Extracción: Aquí se identifican las fuentes y la información requerida


por el almacén de datos (BD, archivos planos, aplicaciones no
relacionales, etc.).

Transformación: Una vez se selecciona la información a ser cargada


al almacén, ésta se debe tratar para evitar que la migración no
interrumpan su carga; por ejemplo: tipos de datos, formatos de fecha,
caracteres especiales no visibles (cambios de línea, chr(10),chr(13)),
caracteres de comillas sencillas y otros.

Carga: Después de determinar las fuentes de información, las


transformaciones y limpieza de la información extraída, se procede a
determinar la fuente destino y el mapeo entre la estructura origen y
la destino para realizar la carga de los datos extraídos

KDD: (Knowledge Discovery from Databases). Descubrimiento de


Conocimiento en Bases de Datos cuyo objetivo es encontrar conocimiento
útil, válido, relevante y nuevo sobre una determinada actividad mediante
algoritmos, para grandes volúmenes de datos.

ODS (OPERATIONAL DATA STORE) o Almacén Operacional De Datos

BI: (Business Intelligence) Inteligencia de Negocios es la habilidad para


transformar los datos en información, y la información en conocimiento,
de forma que se pueda optimizar el proceso de toma de decisiones en los
negocios.

20
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

GLOSARIO

OLAP: es el acrónimo en inglés de procesamiento analítico en línea (On-


Line Analytical Processing). Es una solución utilizada en el campo de la
llamada Inteligencia empresarial (o Business Intelligence) cuyo objetivo
es agilizar la consulta de grandes cantidades de datos. Para ello utiliza
estructuras multidimensionales (o Cubos OLAP) que contienen datos
resumidos de grandes Bases de datos o Sistemas Transaccionales (OLTP).
Se usa en informes de negocios de ventas, marketing, informes de
dirección, minería de datos y áreas similares.

La principal característica que potencia a OLAP, es que es lo más rápido a


la hora de ejecutar sentencias SQL de tipoSELECT, en contraposición con
OLTP que es la mejor opción para operaciones de tipo INSERT, UPDATE Y
DELETE

21
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

BIBLIOGRAFÍA

Cano, J. L. (2007). BUSINESS INTELLIGENCE: Competir con Información.


Recuperado el 15 de Mayo de 2012, de http://www.iwith.org/pdf/Libro_
BI_Competir_con_Informacion.pdf

Gallardo Arancibia, J. A. (2009). Metodología para el desarrollo de


proyectos en Minería de Datos CRISP-DM. Recuperado el 20 de Mayo de
2012, de http://www.oldemarrodriguez.com/yahoo_site_admin/assets/
docs/Documento_CRISP-DM.2385037.pdf

Zorrilla, M. (2010). Data WareHouse y OLAP. Recuperado el 29 de Abril


de 2016: http://docplayer.es/689025-Data-warehouse-y-olap-marta-
zorrilla-universidad-de-cantabria-2010-11.html

22
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje
SISTEMAS DE INTELIGENCIA DE NEGOCIOS

OBJETO DE SISTEMAS DE INTELIGENCIA


APRENDIZAJE DE NEGOCIOS

Desarrollador de contenido Ana Yaqueline Chavarro Parra


Experto temático Edna Mireya Rivera L.

Asesor Pedagógico Rafael Neftalí Lizcano Reyes

Manuel Francisco Silva Barrera


Productor Multimedia
Víctor Hugo Tabares Carreño

Daniel Eduardo Martínez Díaz


Programadores
Grateful Dead Montaño Sierra

Líder expertos temáticos Ana Yaqueline Chavarro Parra

Líder línea de producción Santiago Lozada Garcés

R
PANDORAFMS, es una marca registrada propiedad de PANDORAFMS
Enterprise. Copyright ©

Registered trademark

Atribución, no comercial,compartir igual

Este material puede ser


distribuido, copiado y exhibido por
terceros si se muestra en los
créditos. No se puede obtener
ningún beneficio comercial y las
obras derivadas tienen que estar
bajo los mismos términos de
licencia que el trabajo original.

23
FAVA - Formación en Ambientes Virtuales de Aprendizaje SENA - Servicio Nacional de Aprendizaje

Potrebbero piacerti anche