Sei sulla pagina 1di 8

Datawarehouse

Un Datawarehouse es una base de datos corporativa que se caracteriza por


integrar y depurar informacin de una o ms fuentes distintas, para luego
procesarla permitiendo su anlisis desde infinidad de pespectivas y con
grandes velocidades de respuesta. La creacin de un datawarehouse
representa en la mayora de las ocasiones el primer paso, desde el punto de
vista tcnico, para implantar una solucin completa y fiable de Business
Intelligence.

La ventaja principal de este tipo de bases de datos radica en las estructuras en


las que se almacena la informacin (modelos de tablas en estrella, en copo de
nieve, cubos relacionales... etc). Este tipo de persistencia de la informacin es
homognea y fiable, y permite la consulta y el tratamiento jerarquizado de la
misma (siempre en un entorno diferente a los sistemas operacionales
El trmino Datawarehouse fue acuado por primera vez por Bill Inmon, y se
traduce literalmente como almacn de datos. No obstante, y como cabe
suponer, es mucho ms que eso. Segn defini el propio Bill Inmon, un
datawarehouse se caracteriza por ser:

* Integrado: los datos almacenados en el datawarehouse deben integrarse en


una estructura consistente, por lo que las inconsistencias existentes entre los
diversos sistemas operacionales deben ser eliminadas. La informacin suele
estructurarse tambin en distintos niveles de detalle para adecuarse a las
distintas necesidades de los usuarios.

* Temtico: slo los datos necesarios para el proceso de generacin del


conocimiento del negocio se integran desde el entorno operacional. Los datos
se organizan por temas para facilitar su acceso y entendimiento por parte de
los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser
consolidados en una nica tabla del datawarehouse. De esta forma, las
peticiones de informacin sobre clientes sern ms fciles de responder dado
que toda la informacin reside en el mismo lugar.

* Histrico: el tiempo es parte implcita de la informacin contenida en un


datawarehouse. En los sistemas operacionales, los datos siempre reflejan el

estado de la actividad del negocio en el momento presente. Por el contrario, la


informacin almacenada en el datawarehouse sirve, entre otras cosas, para
realizar anlisis de tendencias. Por lo tanto, el datawarehouse se carga con los
distintos valores que toma una variable en el tiempo para permitir
comparaciones.

* No voltil: el almacn de informacin de un datawarehouse existe para ser


ledo, pero no modificado. La informacin es por tanto permanente,
significando la actualizacin del datawarehouse la incorporacin de los ltimos
valores que tomaron las distintas variables contenidas en l sin ningn tipo de
accin sobre lo que ya exista.

Otra caracterstica del datawarehouse es que contiene metadatos, es decir,


datos sobre los datos. Los metadatos permiten saber la procedencia de la
informacin, su periodicidad de refresco, su fiabilidad, forma de clculo... etc.

Los metadatos sern los que permiten simplificar y automatizar la obtencin de


la informacin desde los sistemas operacionales a los sistemas
informacionales.

Los objetivos que deben cumplir los metadatos, segn el colectivo al que va
dirigido, son:

* Dar soporte al usuario final, ayudndole a acceder al datawarehouse con su


propio lenguaje de negocio, indicando qu informacin hay y qu significado
tiene. Ayudar a construir consultas, informes y anlisis, mediante herramientas
de Business Intelligence como DSS, EIS o CMI.

* Dar soporte a los responsables tcnicos del datawarehouse en aspectos de


auditora, gestin de la informacin histrica, administracin del
datawarehouse, elaboracin de programas de extraccin de la informacin,
especificacin de las interfaces para la realimentacin a los sistemas
operacionales de los resultados obtenidos... etc.

Por ltimo, destacar que para comprender ntegramente el concepto de


datawarehouse, es importante entender cual es el proceso de construccin del
mismo, denominado ETL (Extraccin, Transformacin y Carga), a partir de los
sistemas operaciones de una compaa:

* Extraccin: obtencin de informacin de las distintas fuentes tanto internas


como externas.

* Transformacin: filtrado, limpieza, depuracin, homogeneizacin y


agrupacin de la informacin.

* Carga: organizacin y actualizacin de los datos y los metadatos en la base


de datos
Una de las claves del xito en la construccin de un datawarehouse es el
desarrollo de forma gradual, seleccionando a un departamento usuario como
piloto y expandiendo progresivamente el almacn de datos a los dems
usuarios. Por ello es importante elegir este usuario inicial o piloto, siendo
importante que sea un departamento con pocos usuarios, en el que la
necesidad de este tipo de sistemas es muy alta y se puedan obtener y medir
resultados a corto plazo.

Principales aportaciones de un datawarehouse

* Proporciona una herramienta para la toma de decisiones en cualquier rea


funcional, basndose en informacin integrada y global del negocio.

* Facilita la aplicacin de tcnicas estadsticas de anlisis y modelizacin para


encontrar relaciones ocultas entre los datos del almacn; obteniendo un valor
aadido para el negocio de dicha informacin.

* Proporciona la capacidad de aprender de los datos del pasado y de predecir


situaciones futuras en diversos escenarios.

* Simplifica dentro de la empresa la implantacin de sistemas de gestin


integral de la relacin con el cliente.

* Supone una optimizacin tecnolgica y econmica en entornos de Centro de


Informacin, estadstica o de generacin de informes con retornos de la
inversin espectaculares.

Si no est familiarizado con el concepto de datawarehouse, puede resultarle


til, adems, examinar las siguientes definiciones:

* Datamart

* Datamining

* Cuadro de Mando Integral

* Sistemas de Soporte a la Decisin (DSS)

* Sistemas de Informacin Ejecutiva (EIS)

2.2.6.1. Data Warehouse y Sistemas de Marketing

La aplicacin de tecnologas de Data Warehouse supone un nuevo enfoque de


Marketing, haciendo uso del Marketing de Base de Datos. En efecto, un sistema
de Marketing Warehouse implica un marketing cientfico, analtico y experto,
basado en el conocimiento exhaustivo de clientes, productos, canales y
mercado.

Este conocimiento se deriva de la disposicin de toda la informacin necesaria,


tanto interna como externa, en un entorno de Data Warehouse, persiguiendo
con toda esta informacin, la optimizacin de las variables controladas del
Marketing Mix y el soporte a la prediccin de las variables no controlables
(mediante tcnicas de Data Mining). Basndose en el conocimiento exhaustivo
de los clientes se consigue un tratamiento personalizado de los mismos tanto
en el da a da (atencin comercial) como en acciones de promocin
especficas.

Las reas en las que se puede aplicar las tecnologas de Data Warehouse a
Marketing son, entre otras:
Investigacin Comercial
Segmentacin de mercados
Identificacin de necesidades no cubiertas y generacin de nuevos productos,
o modificacin de productos existentes
Fijacin de precios y descuentos
Definicin de la estrategia de canales de comercializacin y distribucin
Definicin de la estrategia de promocin y atencin al cliente
Relacin con el cliente:
Programacin, realizacin y seguimiento de acciones comerciales
Lanzamiento de nuevos productos
Campaas de venta cruzada, vinculacin, fidelizacin, etc.
Apoyo al canal de venta con informacin cualificada
2.2.6.2. Data Warehouse y Anlisis de Riesgo Financiero

El Data Warehouse aplicado al anlisis de riesgos financieros ofrece


capacidades avanzadas de desarrollo de aplicaciones para dar soporte a las
diversas actividades de gestin de riesgos. Es posible desarrollar cualquier
herramienta utilizando las funciones que incorpora la plataforma, gracias a la
potencionalidad estadstica aplicada al riesgo de crdito.
As se puede usar para llevar a cabo las siguientes funcionalidades:
Para la gestin de la posicin:

Determinacin de la posicin, Clculo de sensibilidades, Anlisis what/if,


Simulaciones, Monitorizacin riesgos contra lmites, etc.
Para la medicin del riesgo:
Soporte metodologa RiskMetrics (Metodologa registrada de J.P. Morgan /
Reuters), Simulacin de escenarios histricos, Modelos de covarianzas,
Simulacin de Montecarlo, Modelos de valoracin, Calibracin modelos
valoracin, Anlisis de rentabilidad, Establecimiento y seguimiento. de lmites,
Desarrollo/modificacin modelos, Stress testing, etc.
El uso del Data Warehouse ofrece una gran flexibilidad para creacin o
modificacin de modelos propios de valoracin y medicin de riesgos, tanto
motivados por cambios en la regulacin, como en avances en la modelizacin
de estos instrumentos financieros.

Ello por cuanto se puede almacenar y poner a disposicin informacin histrica


de mercado y el uso de tcnicas de Data Mining nos simplifica la implantacin
de cualquier mtodo estadstico. Los mtodos de previsin, se pueden realizar
usando series histricas, (GARCH, ARIMA, etc.)

Pero la explotacin de la informacin nos permite no solo la exploracin de los


datos para un conocimiento de la informacin histrica, sino tambin para
examinar condiciones de normalidad de las que la mayora de las metodologas
de valoracin del riesgo parten.
Adems de implantar modelos ya existentes, se pueden acometer anlisis con
vistas a determinar modelos propios, basados en anlisis de correlacin para el
estudio de la valoracin del riesgo de carteras o procesos de simulacin de
Montecarlo.
Todo ello en una plataforma avanzada de gestin de la informacin basada en
la fcil visualizacin de la misma y de su anlisis estadstico como soporte a
metodologas estndar de facto, o a las particularidades de cada entorno.
2.2.6.3. Data Warehouse y Anlisis de Riesgo de Crdito

La informacin relativa a clientes y su entorno se ha convertido en fuente de


prevencin de Riesgos de Crdito. En efecto, existe una tendencia general en

todos los sectores a recoger, almacenar y analizar informacin crediticia como


soporte a la toma de decisiones de Anlisis de Riesgos de Crdito.
Los avances en la tecnologa de Data Warehouse hacen posible la optimizacin
de los sistemas de Anlisis de Riesgo de Crdito:
Para la gestin del riesgo de crdito los sistemas operacionales han ofrecido:
Sistemas de Informacin para Gerencia (MIS) e informes de Soporte a la
Decisin de Problemas (DSS) estticos y no abiertos a nuevas relaciones y
orgenes de datos, situacin en la que la incorporacin de nuevas fuentes de
informacin ha sido un problema en lugar de una ventaja.
Exploraciones de datos e informes cerrados y estticos.
Anlisis sin inclusin de consideraciones temporales lo que imposibilita el
anlisis del pasado y la previsin del futuro.
Herramientas de credit-scoring no flexibles, construidas sobre algoritmos
difcilmente modificables, no adaptados al entorno de la empresa, o
exclusivamente basados en la experiencia personal no contrastada, con lo que
los sistemas han ayudado a repetir los errores en vez de a corregirlos.
Pero estos sistemas tradicionales se enfrentan a una problemtica difcil de
resolver para acomodarse a las necesidades analticas de los Sistemas de
Anlisis del Riesgo, necesidades que se pueden cubrir mediante el uso de
tecnologas de Data Warehouse
Dentro de la Prevencin de Impagados, utilizando sistemas OLAP se puede
obtener el grado interno de concentracin de riesgos con el cliente, y
almacenar la variedad de fuentes internas o externas de informacin
disponibles sobre el mismo. Ello nos permite obtener sin dificultad la posicin
consolidada respecto al riesgo del cliente. El anlisis se puede realizar
asimismo por las diferentes caractersticas de la operacin para la que se
realiza el anlisis, en cuanto al plazo y la cuanta de la misma, la modalidad de
crdito elegida, la finalidad de la operacin o las garantas asociadas a la
misma. Usando las mismas capacidades es fcil el establecer una
segmentacin ABC de la cartera de clientes potenciales o reales que nos
optimicen el nivel de esfuerzo en el Anlisis de Riesgos.
En el soporte al proceso de Anticipacin al Riesgo, se puede dar un adecuado
soporte a la correcta generacin y consideracin de seales de alerta, teniendo
en cuenta las pautas y condicionantes diferenciados dependiendo del tipo de
cliente y producto usando Data Mining
Para el caso del Seguimiento del ciclo de Impagados, de nuevo el uso de
sistemas OLAP, simplifican el anlisis la diversidad de los diferentes

parmetros que intervienen en el mismo, tales como la jerarqua de centros de


recobro a contemplar, la diferente consideracin dependiendo de la antigedad
del impago, del cliente o del importe impagado. Un sistema de Data Mining
puede aconsejar la mejor accin en caso de impagados, litigio, precontencioso,
etc. frente a los parmetros de importe, antigedad, zona geogrfica, etc.
Estos sistemas hacen que el analista se dedique con ms intensidad al anlisis
de la informacin, que es donde aporta su mayor valor aadido, que a la
obtencin de la misma. No obstante, estos sistemas deben de huir de las
automatizaciones completas sin intervencin del analista: es l el que mejor
sabe lo que quiere descubrir. "La herramienta debe ser un medio y no un fin".
2.2.6.4. Data Warehouse: Otras reas de aplicacin

Otras reas de la empresa han aplicado las soluciones que proporciona la


tecnologa Data Warehouse para mejorar gran parte de sus procesos actuales.
Entre ellas destacamos:
Control de Gestin:
Sistemas de Presupuestacin, Anlisis de Desviaciones, Reporting (EIS, MIS,
etc.)
Logstica:
Mejora de la relacin con proveedores, Racionalizacin de los procesos de
control de inventarios, Optimizacin de los niveles de produccin, Previsin de
la demanda en infraestructura.
Recursos Humanos
Planificacin de incorporaciones, Gestin de carreras profesionales, Asignacin
de recursos a proyectos alternativos, etc.

Potrebbero piacerti anche