Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESCUELA DE INFORMTICA
INTELIGENCIA DE NEGOCIOS
INTRODUCCIN
En el ltimo decenio del siglo XX e inicios del siglo XXI, la humanidad ha asistido con
asombro a profundas transformaciones en las relaciones econmicas nacionales e
internacionales, en el campo del conocimiento cientfico-tecnolgico y en la globalizacin
de la economa que ha establecido y sigue determinando una nueva estructura
empresarial, con un avance vertiginoso por alcanzar altos estndares de productividad y
calidad en las operaciones cotidianas de sus empresas.
La Inteligencia de Negocios (Business Intelligence BI), es una alternativa tecnolgica y de
administracin de negocios, que permite manejar la informacin para la toma de
decisiones acertadas en todos los niveles de una organizacin, desde la extraccin,
depuracin y transformacin de datos, hasta la explotacin y distribucin de la
informacin mediante herramientas de fcil uso para los usuarios. En el mbito
empresarial, las decisiones se toman en alguno de los tres niveles organizacionales:
estratgico, tctico u operativo. Las decisiones estratgicas se centran en la direccin del
negocio a largo plazo siendo labor de los ejecutivos de alta gerencia. Las decisiones
tcticas corresponden a los gerentes de nivel medio y se enfocan en la planeacin,
anlisis y produccin de proyectos; a nivel operativo los empleados toman decisiones
cotidianas que se requieren para convertir los planes en accin.
CAPTULO I
INTRODUCCIN A LA
INTELIGENCIA DE NEGOCIOS
1.1.
todos aquellos conocimientos tcitos o explcitos que generan valor econmico para la
empresa.
Prcticamente nadie cuestiona el hecho de que vivimos en la Era de la Informacin y que
la informacin tiene un valor econmico, esto se evidencia por que existen empresas
cuyo nico negocio es alrededor de la venta de informacin, como por ejemplo Gartner
Group, Empresas de Internet y Amazon, entre otras. En mercadotecnia, el conocimiento
es el nico camino posible para sostener ventajas competitivas. Es ms, en la actualidad,
la informacin y el conocimiento son considerados como el capital intelectual que soporta
la riqueza de una organizacin.
En el momento que una persona decide cambiar de empleo se est llevando consigo
informacin, conocimientos y est vendiendo su fuerza intelectual por un mayor precio; el
campo laboral nos indica que la fuerza de trabajo intelectual aumenta su costo con dos
factores bsicos que generan conocimiento: la experiencia y la educacin. Por su parte,
si un sistema que posee informacin eventualmente desaparece o falla, generar
prdidas a la empresa, incluso por cada minuto que est detenido. En la actualidad las
empresas estn apostando mucho por la tecnologa y los individuos para que juntos
tengan un conocimiento suficiente que acerque la visin interna de ambos a la realidad
exterior, en la medida que esa brecha disminuye, las decisiones tomadas se acercan ms
a la realidad exterior, generando decisiones ms correctas y en menos tiempo; si la
brecha o "gap de informacin" aumenta, puede ocasionar grandes prdidas para la
organizacin.
Es fcil entenderlo, suponiendo una situacin hipottica en la cual un nuevo auto es
diseado con lujo, pero con algunos toques de un auto deportivo y, sin realizar ningn
tipo de estudio previo ms que la intuicin y el sentido comn, se pretende lanzarlo para
que sea adquirido por adultos mayores de 30 aos. Para ello, una vez que se encuentra
La importancia de una buena informacin puede ser vista como la diferencia en valor
entre una decisin correcta y una decisin equivocada, en donde la decisin est basada
en esa informacin. Mientras ms grande sea esa diferencia entre decisin correcta y
errnea, mayor ser la importancia de contar con una buena informacin (BITAM, 2002.).
lo que el usuario demanda. Es importante resaltar que todos los Sistemas de Informacin
tienen un fin muy particular, y se complementan para sostener, de la manera ms
eficiente, un negocio; sin embargo, no todos pueden solucionar las distintas demandas de
los usuarios, precisamente porque son diseados para alguna rea de aplicacin muy
especfica.
El motivo por el cual existen varios sistemas de informacin es porque los usuarios tienen
preguntas muy especficas que no cualquier sistema puede resolver. De hecho, las bases
de datos operacionales, que son las indispensables en cualquier organizacin, no estn
organizadas para responder a preguntas globales sino a pequeos grupos de datos.
Preguntas que involucren consultas complejas podran resolverse en un lapso extenso,
en el cual cabe la posibilidad de que la vigencia desaparezca. Lo importante es destacar
que una base de datos o sistema de informacin no tienen la capacidad de resolver las
necesidades informativas de toda la organizacin (BITAM, 2002.).
decisiones y, a pesar de que stas no tienen un impacto global, deben ser tambin
correctas y oportunas, pues ciertos grupos dependen de las mismas.
Directores, gerentes, supervisores, jefes, todos aquellos que toman decisiones deben
tener suficiente informacin para apoyarse en su trabajo cotidiano, el lugar que ocupen
en la pirmide organizacional se vuelve secundario cuando el enfoque es hacia el manejo
de procesos y todos los puestos tienen cierta relacin y dependencia entre s.
De modo general en una pirmide organizacional, los requerimientos informativos se
dividen en 3 partes:
Informacin Estratgica
Informacin Tctica
Informacin Estratgica
Est orientada principalmente a soportar la Toma de Decisiones de las reas directivas
para alcanzar la misin empresarial. Se caracteriza porque son sistemas sin carga
peridica de trabajo y sin gran cantidad de datos, sin embargo, la informacin que
almacenan est relacionada a un aspecto cualitativo ms que cuantitativo, que puede
indicar como operar la empresa ahora y en el futuro, el enfoque es distinto, pero sobre
todo es distinto su alcance. Se asocia este tipo de informacin a los ejecutivos de primer
nivel de las empresas.
Un punto importante es que la informacin estratgica toma grandes cantidades de datos
de reas relacionadas y no se enfoca especficamente hacia una sola, de ah que las
decisiones que puedan ser tomadas impactan directamente sobre toda la organizacin.
Informacin Tctica
Informacin que soporta la coordinacin de actividades y el plano operativo de la
estrategia, es decir, se plantean opciones y caminos posibles para alcanzar la estrategia
indicada por la direccin de la empresa. Se facilita la gestin independiente de la
informacin por parte de los niveles intermedios de la organizacin. Este tipo de
informacin es extrada especficamente de un rea o departamento de la organizacin,
por lo que su alcance es local y se asocia a gerencias o subdirecciones.
Informacin Tcnico Operacional
Se refiere a las operaciones tradicionales que son efectuadas de modo rutinario en las
empresas mediante la captura masiva de datos y Sistemas de Procesamiento
Transaccional. Las tareas son cotidianas y soportan la actividad diaria de la empresa
(contabilidad, facturacin, almacn, presupuesto y otros sistemas administrativos).
Tradicionalmente se asocian a las Jefaturas o Coordinaciones operativas o de tercer
nivel.
Si consideramos factores internos y externos de una organizacin podramos concluir que
los requerimientos actuales se orientan a conocer y mejorar los costos de toda la cadena
econmica. Estos requerimientos se reflejan en el inters por tener a la mano los
diagnsticos que arrojen informacin especfica y clave para determinada rea de
conocimiento, en el menor tiempo posible. La tendencia es que las reas directivas
necesitan en su escritorio la informacin clave de su empresa; en todos los niveles el
requerimiento es similar aunque, evidentemente, tiene objetivos diferentes. El paradigma
de la informacin exclusiva en los niveles directivos para apoyar la toma de decisiones no
es obsoleto, simplemente se debe mejorar y complementar agregando la informacin
tambin en otros niveles medios y jefaturas, o sea, en cualquier persona que tenga el
poder de tomar decisiones (BITAM, 2002.).
1.1.6. Usuarios
El usuario es distinto incluso en la misma pirmide organizacional. Mientras los sistemas
operativos tienen interfaces muy especializadas para un usuario que realiza una
operacin rutinaria, los usuarios estratgicos realizan consultas variadas y no previstas
de la informacin, por lo que los sistemas deben ser sencillos y con toda la informacin
disponible que cubra cualquier consulta requerida, de este caso el software final debe ser
orientado a un usuario en particular y, por ende, deber adecuarse al conocimiento que
tenga sobre el tema.
1.2.
nuestros negocios deben reaccionar de acuerdo al cambio del mercado. De otro modo el
mercado globalizado, la presin inmensa de la competencia, los arranques tecnolgicos
entre otros cambios drsticos a que se han dado, irn debilitando nuestra empresa. Esto
nos muestra que las empresas en la actualidad estn invirtiendo en tecnologa y
soluciones con las cuales se mantienen competitivas en este mundo cambiante, ahora las
empresas no dependen tan solo de factores como ubicacin, productos o marketing. Sino
tambin del conocimiento basado en informacin comprensible, detallada y relevante que
es crucial para lograr y sostener ventajas competitivas. El poseer conocimientos correctos
significa tener respuestas correctas y realizar decisiones estratgicas para su ejecucin
en beneficio de la empresa. Pero las tareas de recolectar, procesar, limpiar y transformar
la informacin necesaria para la toma de decisiones no es una tarea sencilla mas si
consideramos que una empresa tiene distintas reas que a veces se encuentran alejadas
de los ejecutivos de negocios. El Componente de Inteligencia de Negocios (Business
Intelligence) que resuelve este caos en el manejo y anlisis la informacin o datos es el
Data Warehouse. El Data Warehouse es un conjunto de procesos y acciones, es una
coleccin de datos orientados a un tema, integrados y no voltiles en el soporte al
proceso de toma de decisiones de la gerencia.
Data Warehouse es el centro de la arquitectura para los sistemas de informacin en la
dcada de los '90. Soporta el procesamiento informtico al proveer una plataforma slida,
a partir de los datos histricos para hacer el anlisis. Facilita la integracin de sistemas
de aplicacin no integrados. Organiza y almacena los datos que se necesitan para el
procesamiento analtico, informtico sobre una amplia perspectiva de tiempo. Un Data
Warehouse es una coleccin de datos orientado a temas, integrado, no voltil, de tiempo
variante que es considerada la solucin integral y oportuna para desarrollar negocio y se
usa para el soporte del proceso de toma de decisiones gerenciales. Data Warehouse es
una herramienta con procesos para consolidar y administrar datos de variadas fuentes
con el propsito de responder preguntas de negocios y tomar decisiones. Data
dispositivo
de memoria no
voltil,
proveniente
de
mltiples
Orientado al tema
Una primera caracterstica del Data Warehouse es que la informacin se clasifica en base
a los aspectos que son de inters para la empresa. Siendo as, los datos tomados estn
en contraste con los clsicos procesos orientados a las aplicaciones. El ambiente
operacional se disea alrededor de las aplicaciones y la base de datos combina estos
elementos en una estructura que acomoda las necesidades de la aplicacin. La
alineacin alrededor de las reas de los temas afecta el diseo y la implementacin de
los datos encontrados en el Data Warehouse. Las 48principales reas de los temas
influyen en la parte ms importante de la estructura clave. Las aplicaciones estn
relacionadas con el diseo de la base de datos y del proceso. En Data Warehouse se
enfoca el modelamiento de datos y el diseo de la base de datos. El diseo del proceso
no es separado de este ambiente. Las diferencias entre la orientacin de procesos y
Los datos histricos son de poco uso en el procesamiento operacional. La informacin del
depsito por el contraste, debe incluir los datos histricos para usarse en la identificacin
y evaluacin de tendencias como vemos en la figura continuacin.
No voltil
La informacin es til slo cuando es estable. Los datos operacionales cambian sobre
una base momento a momento. La perspectiva ms grande, esencial para el anlisis y la
toma de decisiones, requiere una base de datos estable. En la siguiente Figura se
muestra que la actualizacin es decir el proceso de insertar, borrar y modificar, se hace
regularmente en el ambiente operacional sobre una base de registro por registro. Pero la
manipulacin bsica de los datos que ocurre en el Data Warehouse es mucho ms
simple. Hay dos nicos tipos de operaciones: la carga inicial de datos y el acceso a los
mismos. No hay actualizacin de datos en el depsito, como una parte normal de
procesamiento.
Figura 2 No voltil
Fuente: (Bernabeu, 2010)
Escalable
Cuando la organizacin est lista para implementar una solucin de Data Warehouse, la
solucin necesita acomodarse al incremento dramtico de la demanda de los datos.
Como las instituciones crecen en otras reas, la solucin de Data Warehouse necesita
localizar los nuevos orgenes de datos y debe variar en su tamao de acuerdo a las
necesidades.
(Bernabeu, 2010)
Tal y como se puede apreciar, el ambiente est formado por diversos elementos que
interactan entre s y que cumplen una funcin especfica dentro del sistema. Por ello es
que al abordar la exposicin de cada elemento se lo har en forma ordenada y teniendo
en cuenta su relacin con las dems partes.
Bsicamente, la forma de operar del esquema superior se resume de la siguiente
manera:
Los datos son extrados desde aplicaciones, bases de datos, archivos, etc. Esta
informacin generalmente reside en diferentes tipos de sistemas, orgenes y arquitecturas
y tienen formatos muy variados.
Los datos son integrados, transformados y limpiados, para luego ser cargados en el DW.
Principalmente, la informacin del DW se estructura en cubos multidimensionales, ya que
estos preparan esta informacin para responder a consultas dinmicas con una buena
performance. Pero tambin pueden utilizarse otros tipos de estructuras de datos para
representar la informacin del DW, como por ejemplo Business Models.
Los usuarios acceden a los cubos multidimensionales, Business Models (u otro tipo de
estructura de datos) del DW utilizando diversas herramientas de consulta, exploracin,
anlisis, reportes, etc.
A continuacin se detallar cada uno de los componentes de la arquitectura del Data
Warehousing, teniendo como referencia siempre el grfico antes expuesto, pero
resaltando el tema que se tratar.
OLTP
Figura 5 OLTP
(Bernabeu, 2010)
OLTP (On Line Transaction Processing), representa toda aquella informacin
transaccional que genera la empresa en su accionar diario, adems, de las fuentes
externas con las que puede llegar a disponer.
Como ya se ha mencionado, estas fuentes de informacin, son de caractersticas muy
dismiles entre s, en formato, procedencia, funcin, etc.
Entre los OLTP ms habituales que pueden existir en cualquier organizacin se
encuentran:
Archivos de textos.
Hipertextos.
Hojas de clculos.
Informes semanales, mensuales, anuales, etc.
Bases de datos transaccionales.
Load Manager
(Bernabeu, 2010)
Para poder extraer los datos desde los OLTP, para luego manipularlos, integrarlos y
transformarlos, para posteriormente cargar los resultados obtenidos en el DW, es
necesario contar con algn sistema que se encargue de ello. Precisamente, la Integracin
de Datos en quien cumplir con tal fin.
La Integracin de Datos agrupa una serie de tcnicas y subprocesos que se encargan de
llevar a cabo todas las tareas relacionadas con la extraccin, manipulacin, control,
integracin, depuracin de datos, carga y actualizacin del DW, etc. Es decir, todas las
tareas que se realizarn desde que se toman los datos de los diferentes OLTP hasta que
se cargan en el DW.
Como se mencion anteriormente cuando se trataron las caractersticas del DW1, si bien
los procesos ETL (Extraccin, Transformacin y Carga) son solo una de las muchas
tcnicas de la Integracin de Datos, el resto de estas tcnicas puede agruparse muy bien
en sus diferentes etapas. Es decir, en el proceso de Extraccin tendremos un grupo de
tcnicas enfocadas por ejemplo en tomar solo los datos indicados y mantenerlos en un
almacenamiento intermedio; en el proceso de Transformacin por ejemplo estarn
aquellas tcnicas que analizarn los datos para verificar que sean correctos y vlidos; en
el proceso de Carga de Datos se agruparn por ejemplo tcnicas propias de la carga y
actualizacin del DW.
(Bernabeu, 2010)
El DW Manager presenta las siguientes caractersticas y funciones principales:
Query Manager
(Bernabeu, 2010)
Este componente realiza las operaciones necesarias para soportar los procesos de
gestin y ejecucin de consultas relacionales, tales como Join y agregaciones, y de
consultas propias del anlisis de datos, como drill-up y drill-down.
Query Manager recibe las consultas de los usuarios, las aplica a la estructura de datos
correspondiente (cubo multidimensional, Business Models, etc.) y devuelve los resultados
obtenidos.
Cabe aclarar que una consulta a un DW, generalmente consiste en la obtencin de
indicadores a partir de los datos (hechos) de una tabla de hechos, restringidas por las
propiedades o condiciones de los atributos que hayan sido creados.
Las operaciones que se pueden realizar sobre modelos multidimensionales y que son las
que verdaderamente les permitirn a l@s usuari@s explorar e investigar los datos en
busca de respuestas, son:
Drill-down.
Drill-up.
Drill-across.
Roll-across.
Pivot.
Page.
Drill-through.
(Bernabeu, 2010)
Las herramientas de consulta y anlisis son sistemas que permiten a l@s usuari@s
realizar la exploracin de datos del DW. Bsicamente constituyen el nexo entre el
depsito de datos y los usuarios.
Utilizan la metadata de las estructuras de datos que han sido creadas previamente
(cubos multidimensionales, Business Models, etc.) para trasladar a travs de consultas
SQL los requerimientos de los usuarios, para luego, devolver el resultado obtenido.
Estas herramientas tambin pueden emplear simples conexiones a bases de datos
(JNDI, JDBC, ODBC), para obtener la informacin deseada.
A travs de una interfaz grfica y una serie de pasos, los usuarios generan consultas que
son enviadas desde la herramienta de consulta y anlisis al Query Manager, este a su
vez realiza la extraccin de informacin al DW Manager y devuelve los resultados
obtenidos a la herramienta que se los solicit. Luego, estos resultados son expuestos
ante los usuarios en formatos que le son familiares.
Este proceso se puede comprender mejor al observar la siguiente figura:
(Bernabeu, 2010)
El mismo, se lleva a cabo a travs de seis pasos sucesivos:
1. Los usuarios seleccionan o establecen que datos desean obtener del DW,
mediante las interfaces de la herramienta que utilice.
2. La herramienta recibe el pedido de los usuarios, construye la consulta (utilizando
la metadata) y la enva al Query Manager.
3. El Query Manager ejecuta la consulta sobre la estructura de datos con la que se
est trabajando (cubo multidimensional, Business Model, etc.).
4. El Query Manager obtiene los resultados de la consulta.
Usuarios
Figura 11 Usuarios
(Bernabeu, 2010)
L@s usuari@s que posee el DW son aquell@s que se encargan de tomar decisiones y
de planificar las actividades del negocio, es por ello que se hace tanto nfasis en la
integracin, limpieza de datos, etc, para poder conseguir que la informacin posea toda la
calidad posible.
Es a travs de las herramientas de consulta y anlisis, que los usuarios exploran los
datos en busca de respuestas para poder tomar decisiones proactivas.
Para comprender mejor a los usuarios del almacn de datos, se har referencia a las
diferencias que estos tienen con respecto a los del OLTP:
Los usuarios que acceden al DW concurrentemente son pocos, en cambio los que
acceden a los OLTP en un tiempo determinado son muchos ms, pueden ser
cientos o incluso miles. Esto se debe principalmente al tipo de informacin que
contiene cada fuente.
Los usuarios del DW, generan consultas sobre una gran cantidad de registros, en
cambio los del OLTP lo hacen sobre un pequeo grupo. Esto se debe a que como
ya se ha mencionado, el depsito contiene informacin histrica e integra varias
fuentes de datos.
La metodologa de Kimball
1.2.4.2.
.
Figura 13 Desarrollo del DWH segn la metodologa de Bill Inmon
FUENTE: (CHICAS, 2010)
ptima de datos para analizar la informacin al detalle desde todas las perspectivas que
afecten a los procesos de dicho departamento. Un datamart puede ser alimentado desde
los datos de un data warehouse, o integrar por s mismo un compendio de distintas
fuentes de informacin.
Por ejemplo, un posible usos sera para el data mining. El data mart est pensado para
cubrir las necesidades de un grupo de trabajo o de un determinado departamento dentro
de la organizacin. Es el almacn natural para los datos departamentales. En cambio, el
mbito del data warehouse es la organizacin en su conjunto. Es el almacn natural para
los datos corporativos comunes.
Segn (MICROSFT DATA WAREHOUSE TRAINING, 2000)
Data Marts: Es un subconjunto del Data Warehouse, usado normalmente
para el anlisis parcial de los datos. Ej: El Data Mart de los datos del
departamento ventas y el Data Mart de Inventarios. El objetivo de subdividir
est dado por la complejidad computacional del anlisis global de todas las
dimensiones del Data Warehouse y por la necesidad de rapidez.
Segn (DEFINE META GROUP)
"Un Data Mart es una aplicacin de Data Warehouse, construida rpidamente
para soportar una lnea de negocio simple".
Un Data Mart es una base de datos departamental que est especializada en el
almacenamiento de informacin confidencial de un rea de negocios especfica, adems
permite a los usuarios acceso a los datos que ellos necesitan para analizarlos ms a
menudo.
1.3.
El primer paso para obtener los datos suele comenzar con tareas de extraccin,
transformacin y carga. Conocidos como procesos ETL (Extract, Transform and Load)
pueden realizarse con herramientas tambin denominadas ETL o sin ellas segn
necesidades. En cualquier caso es muy importante poner el mayor esfuerzo en
convertirlos en procesos desasistidos o automatizados.
1.3.1. Extraer
La primera parte del proceso ETL consiste en extraer los datos desde los sistemas de
origen. La mayora de los proyectos de almacenamiento de datos fusionan datos
provenientes de diferentes sistemas de origen. Cada sistema separado puede usar una
organizacin diferente de los datos o formatos distintos. Los formatos de las fuentes
normalmente se encuentran en bases de datos relacionales o ficheros planos, pero
pueden incluir bases de datos no relacionales u otras estructuras diferentes. La
extraccin convierte los datos a un formato preparado para iniciar el proceso de
transformacin.
Una parte intrnseca del proceso de extraccin es la de analizar los datos extrados, de lo
que resulta un chequeo que verifica si los datos cumplen la pauta o estructura que se
esperaba. De no ser as los datos son rechazados.
Un requerimiento importante que se debe exigir a la tarea de extraccin es que sta
cause un impacto mnimo en el sistema origen. Si los datos a extraer son muchos, el
sistema de origen se podra ralentizar e incluso colapsar, provocando que ste no pueda
utilizarse con normalidad para su uso cotidiano. Por esta razn, en sistemas grandes las
operaciones de extraccin suelen programarse en horarios o das donde este impacto
sea nulo o mnimo.
1.3.2. Transformar
La fase de transformacin aplica una serie de reglas de negocio o funciones sobre los
datos extrados para convertirlos en datos que sern cargados. Algunas fuentes de datos
requerirn alguna pequea manipulacin de los datos. No obstante en otros casos
pueden ser necesarias aplicar algunas de las siguientes transformaciones:
Seleccionar slo ciertas columnas para su carga (por ejemplo, que las columnas
con valores nulos no se carguen).
Traducir cdigos (por ejemplo, si la fuente almacena una "H" para Hombre y "M"
para Mujer pero el destino tiene que guardar "1" para Hombre y "2" para Mujer).
Codificar valores libres (por ejemplo, convertir "Hombre" en "H" o "Sr" en "1").
Calcular totales de mltiples filas de datos (por ejemplo, ventas totales de cada
regin).
Dividir una columna en varias (por ejemplo, columna "Nombre: Garca, Miguel";
pasar a dos columnas "Nombre: Miguel" y "Apellido: Garca").
1.3.3. Carga
La fase de carga es el momento en el cual los datos de la fase anterior (transformacin)
son cargados en el sistema de destino. Dependiendo de los requerimientos de la
organizacin, este proceso puede abarcar una amplia variedad de acciones diferentes.
En algunas bases de datos se sobrescribe la informacin antigua con nuevos datos.
Los data warehouse mantienen un historial de los registros de manera que se pueda
hacer una auditora de los mismos y disponer de un rastro de toda la historia de un valor
a lo largo del tiempo.
Existen dos formas bsicas de desarrollar el proceso de carga:
Rolling: El proceso de Rolling por su parte, se aplica en los casos en que se opta
por mantener varios niveles de granularidad. Para ello se almacena informacin
resumida a distintos niveles, correspondientes a distintas agrupaciones de la
unidad de tiempo o diferentes niveles jerrquicos en alguna o varias de las
dimensiones de la magnitud almacenada (por ejemplo, totales diarios, totales
semanales, totales mensuales, etc.).
La fase de carga interacta directamente con la base de datos de destino. Al realizar esta
operacin se aplicarn todas las restricciones y triggers (disparadores) que se hayan
definido en sta (por ejemplo, valores nicos, integridad referencial, campos obligatorios,
rangos de valores). Estas restricciones y triggers (si estn bien definidos) contribuyen a
que se garantice la calidad de los datos en el proceso ETL, y deben ser tomados en
cuenta.
De
componente: Consiste
en
el
funcionamiento
simultneo
de
cuando un almacn de datos tiene que ser actualizado con los contenidos en un sistema
de origen, es necesario establecer puntos de sincronizacin y de actualizacin.
Mientras que la Inteligencia de negocio tiende hacia una puntualidad real, los almacenes
de datos generales e individuales se tienen que actualizar ms a menudo, ya que las
ventanas de tiempo de carga se reducen.
Una interfaz de usuario para transformaciones eficaz y fcil de usar compatible con el
trabajo en colaboracin, la reutilizacin de procesos y los metadatos comunes.
1.4.
Un cubo
OLAP, Online
Analytical
Processing,
es
una
base
de
datos
pero
Rotar (Swap): alterar las filas por columnas (permutar dos dimensiones de
anlisis)
Bajar (Down): bajar el nivel de visualizacin en las filas a una jerarqua inferior.
Expandir (Expand): id. anterior sin perder la informacin a nivel superior para
ste y el resto de los valores.
Para distinguir los requerimientos OLAP, es importante distinguir entre las plataformas
OLAP y las interfaces de usuario OLAP.
preferible esta diferenciacin). Los clculos se realizan en una base de datos relacional,
con grandes volmenes de datos y tiempos de navegacin no predecibles. Parte de la
premisa que las capacidades Olap se desarrollan mejor contra este tipo de bases de
datos.
El sistema ROLAP utiliza una arquitectura de tres niveles. La base de datos relacional
maneja los requerimientos de almacenamiento de datos, y el motor ROLAP proporciona
la funcionalidad analtica.
El nivel de base de datos usa bases de datos relacionales para el manejo, acceso
y obtencin del dato.
El motor ROLAP se integra con niveles de presentacin, a travs de los cuales los
usuarios realizan los anlisis OLAP.
Los usuarios finales ejecutan sus anlisis multidimensionales, a travs del motor ROLAP,
que transforma dinmicamente sus consultas a consultas SQL. Se ejecutan estas
consultas SQL en las bases de datos relacionales, y sus resultados se relacionan
mediante tablas cruzadas y conjuntos multidimensionales para devolver los resultados a
los usuarios.
La arquitectura ROLAP es capaz de usar datos precalculados si estos estn disponibles,
o de generar dinmicamente los resultados desde los datos elementales si es preciso.
Esta arquitectura accede directamente a los datos del Data Warehouse, y soporta
tcnicas de optimizacin de accesos para acelerar las consultas. Estas optimizaciones
son, entre otras, particionado de los datos a nivel de aplicacin, soporte a la
desnormalizacin y joins mltiples.
Algunos fabricantes son: Oracles BI EE, SAP Netweaver BI, MicroStrategy, Cognos 8,
BusinessObjects Web Intelligence.
Multidimensional OLAP (MOLAP): los datos son replicados en plataformas con un
almacenamiento construido a propsito que asegura mayor velocidad en los anlisis. Los
clculos se llevan a cabo en un servidor con una base de datos multidimensional,
partiendo de la premisa que un sistema OLAP estar mejor implantado almacenando los
datos multidimensionalmente.
El sistema MOLAP utiliza una arquitectura de dos niveles: La bases de datos
multidimensionales y el motor analtico.
interfaz a travs del cual los usuarios finales visualizan los anlisis OLAP. Una
arquitectura cliente/servidor permite a varios usuarios acceder a la misma base de
datos multidimensional.
Los sistemas con alta volatilidad de los datos (aquellos en los que cambian las
reglas de agregacin y consolidacin), requieren una arquitectura que pueda
realizar esta consolidacin ad-hoc. Los sistemas ROLAP soportan bien esta
Los ROLAP pueden crecer hasta un gran nmero de dimensiones, mientras que
los MOLAP generalmente son adecuados para diez o menos dimensiones.
Por ello, y resumiendo, el ROLAP es una arquitectura flexible y general, que crece
para dar soporte a amplios requerimientos OLAP. El MOLAP es una solucin
particular, adecuada para soluciones departamentales con unos volmenes de
informacin y nmero de dimensiones ms modestos.
problemas
surgidos
durante
los
procesos
productivos,
las
1.5.
DSS dirigidos por modelos: Utiliza datos y parmetros proporcionados por los
usuarios para ayudar a los encargados de adoptar decisiones en el anlisis de
una situacin, que no son necesariamente los datos intensivos.
DSS dirigidos por datos: Tambin llamados orientados por datos, enfatizan el
acceso y la manipulacin de series temporales de datos internos de la empresa y,
a veces, tambin de datos externos.
Segn el mbito
DSS para la gran empresa: Este DSS estar enlazado con un almacn de datos
de gran tamao y dar servicio a muchos gerentes, directores y/o ejecutivos de la
compaa.
1.5.2. Funciones
1.5.4. Componentes
Diferentes autores identifican diferentes componentes principales para un DSS. En
cualquier caso cada sistema SSD consiste de al menos de los subsistemas de datos,
interface de usuario, y de administracin del modelo, as como tambin de los
usuarios.
El subsistema de datos del SSD est compuesto de la base de datos del SSD, del
sistema de administracin de la base de datos, del directorio de datos y de la facilidad
para hacer consultas.
La base de modelo.
El lenguaje de modelacin.
El hardware y el software.
Factores
involucrados
con
la
facilidad
de
uso,
accesibilidad,
interacciones humano-mquina.
El usuario o gerente es la persona que tiene que tomar la decisin que pretende
ser soportada por el SSD.
1.6.
minera de datos.
CAPTULO II
ETAPA DE ANLISIS,
DISEO E IMPLEMENTACIN
DEL SISTEMA DE SOPORTE DE
DECISIONES
Metodologa de Kimball. Kimball fue quien determin que un data warehouse no era
ms que: "la unin de todos los Data marts de una entidad". Defiende por tanto una
metodologa ascendente (bottom-up) a la hora de disear un almacn de datos.
todos los datos corporativos. En esta metodologa los Data marts se crearn despus
de haber terminado el data warehouse completo de la organizacin.
Model Driven Architecture 2.0 (MDA 2.0). Desarrollado por The Object
Management Group (OMG). Consiste en un conjunto de estndares que asisten en
la creacin, implementacin, evolucin y desarrollo de sistemas dirigido por modelos.
Los estndares que constituyen MDA son: Lenguaje Unificado de Modelado (UML),
Meta-Object-Facility (MOF), Meta-Data Interchange
Metamodel (CWM).
Metodologa HEFESTO.
(Bernabeu, 2010)
HEFESTO es una metodologa propia, cuya propuesta est fundamentada en una muy
amplia investigacin, comparacin de metodologas existentes, experiencias propias en
procesos de confeccin de almacenes de datos. Cabe destacar que HEFESTO est en
continua evolucin, y se han tenido en cuenta, como gran valor agregado, todos los
feedbacks que han aportado quienes han utilizado esta metodologa en diversos pases y
con diversos fines.
La idea principal, es comprender cada paso que se realizar, para no caer en el tedio de
tener que seguir un mtodo al pie de la letra sin saber exactamente qu se est
haciendo, ni por qu.
A continuacin se presenta la arquitectura de la metodologa y se la describe
brevemente:
(Bernabeu, 2010)
Como se puede apreciar, se comienza recolectando las necesidades de informacin de
los usuarios y se obtienen las preguntas claves del negocio. Luego, se deben identificar
los indicadores resultantes de los interrogativos y sus respectivas perspectivas de
anlisis, mediante las cuales se construir el modelo conceptual de datos del DW.
Despus, se analizarn los OLTP para determinar cmo se construirn los indicadores,
sealar las correspondencias con los datos fuentes y para seleccionar los campos de
estudio de cada perspectiva.
Una vez hecho esto, se pasar a la construccin del modelo lgico del depsito, en
donde se definir cul ser el tipo de esquema que se implementar. Seguidamente, se
confeccionarn las tablas de dimensiones y las tablas de hechos, para luego efectuar sus
respectivas uniones.
Por ltimo, utilizando tcnicas de limpieza y calidad de datos, procesos ETL, etc, se
definirn polticas y estrategias para la Carga Inicial del DW y su respectiva actualizacin.
Preguntas identificadas:
-
Indicador
Indicadores:
-
Utilidad en ventas
Cantidad vendida
Costo de compra
Perspectiva de Anlisis:
-
Mes
Trimestre
Semestre
Ao
Cliente
Producto
Lnea
Marca
2.4.1.1
Indicadores
Utilidad en Ventas
La utilidad en ventas se la realiza una vez que se determina el valor de las ventas netas
que ha realizado la empresa y el costo de lo que se ha vendido, es as que se la
determina restando de las ventas netas y el valor del costo de lo vendido.
Monto total de ventas
El monto total de las ventas se lo determina mediante los clculos de las ventas
realizadas ya sean al contado, como a crdito para luego poder obtener el presupuesto
de las ventas que se han realizado.
Cantidad vendida
Es el nmero de productos que se han vendidos a los clientes de la empresa Data Mart.
Costo de compra
El costo de compra se lo conoce como un gasto que representa la entrada de nuevos
productos a la empresa, con el fin de generar ingresos a la organizacin.
El diseo del Datamart que se puede apreciar en la imagen es el que se hizo para la
empresa DATAMARKET.
FROM
Zonas b INNER JOIN Zonas a ON b.ZonCodigo = a.ZonCodigo
WHERE
(LEN(b.ZonCodigo) = 4)
ORDER BY b.ZonDescripcion;
DetMovInventarios2010.DMICantidad *
DetMovInventarios2010.DMIPrecio AS VentaTotal,
DetMovInventarios2010.DMICantidad *
DetMovInventarios2010.DMIPrecio - DetMovInventarios2010.DMICostoMercaderia *
DetMovInventarios2010.DMICantidad
AS Utilidad
FROM
CabMovInventarios2010 INNER JOIN
DetMovInventarios2010 ON CabMovInventarios2010.CMINumero =
DetMovInventarios2010.DMINumero
WHERE
(DetMovInventarios2010.DMICodTipo = '55')
UNION
SELECT
CabMovInventarios2011.CMIFecha AS fecha,
CabMovInventarios2011.CMICodSujeto AS cli_codigo,
DetMovInventarios2011.DMICodArticulo AS pro_codigo,
DetMovInventarios2011.DMICantidad AS monto_venta,
DetMovInventarios2011.DMICostoMercaderia AS costo_unitario,
DetMovInventarios2011.DMIPrecio AS PUV,
DetMovInventarios2011.DMICostoMercaderia *
DetMovInventarios2011.DMICantidad AS CostoTotal,
DetMovInventarios2011.DMICantidad *
DetMovInventarios2011.DMIPrecio AS VentaTotal,
DetMovInventarios2011.DMICantidad *
DetMovInventarios2011.DMIPrecio - DetMovInventarios2011.DMICostoMercaderia *
DetMovInventarios2011.DMICantidad
AS Utilidad
FROM
CabMovInventarios2011 INNER JOIN
DetMovInventarios2011 ON CabMovInventarios2011.CMINumero =
DetMovInventarios2011.DMINumero
WHERE
(DetMovInventarios2011.DMICodTipo = '55')
UNION
SELECT
CabMovInventarios2012.CMIFecha AS fecha,
CabMovInventarios2012.CMICodSujeto AS cli_codigo,
DetMovInventarios2012.DMICodArticulo AS pro_codigo,
DetMovInventarios2012.DMICantidad AS monto_venta,
DetMovInventarios2012.DMICostoMercaderia AS costo_unitario,
DetMovInventarios2012.DMIPrecio AS PUV,
DetMovInventarios2012.DMICostoMercaderia *
DetMovInventarios2012.DMICantidad AS CostoTotal,
DetMovInventarios2012.DMICantidad *
DetMovInventarios2012.DMIPrecio AS VentaTotal,
DetMovInventarios2012.DMICantidad *
DetMovInventarios2012.DMIPrecio - DetMovInventarios2012.DMICostoMercaderia *
DetMovInventarios2012.DMICantidad
AS Utilidad
FROM
CabMovInventarios2012 INNER JOIN
DetMovInventarios2012 ON CabMovInventarios2012.CMINumero =
DetMovInventarios2012.DMINumero
WHERE
(DetMovInventarios2012.DMICodTipo = '55');
Cdigo MDX del Monto Total de Ventas realizadas por aos segn clientes
select NON EMPTY {[Measures].[PrecioTotal]} ON COLUMNS,
NON EMPTY Crossjoin(Hierarchize(Union({[Anio].[All Anios]}, [Anio].[All Anios].Children)),
{[Cliente].[All Clientes]}) ON ROWS from [Ventas]
Cdigo MDX del Monto Total de Ventas realizadas por aos segn Productos
select NON EMPTY {[Measures].[PrecioTotal]} ON COLUMNS,NON EMPTY
Crossjoin(Hierarchize(Union({[Anio].[All Anios]}, [Anio].[All Anios].Children)),
{[Producto].[All Productos]}) ON ROWS from [Ventas]