Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2 Componentes de la Inteligencia de
Negocios
Fuentes de Informacin
Procesos ETL
Datawarehouse
Motor OLAP
Herramientas de Visualizacion
El propio datawarehouse o
almacn de datos, con el
Metadata o Diccionario de datos.
Se busca almacenar los datos
de una forma que maximice su
flexibilidad, facilidad de acceso y
administracin.
Las
herramientas
de
visualizacin, que nos permitirn
el anlisis y la navegacin a travs
de los mismos.
Fuente de Datos
Las fuentes de informacin a las que podemos
acceder son:
Sistemas transaccionales que inluyen aplicaciones
desarrolladas a la medida., ERP, CRM, SCM, etc.
(Online Transaction
Processing)
Fuente de Datos
Sistemas de informacin departamentales:
previsiones, presupuestos, hojas de calculo,etc.
(Online Transaction
Processing)
Fuente de Datos
Existen muchos factores que contribuyen a la complejidad de cargar la
informacin en un datawarehouse.
Uno de los principales es el nmero de fuentes de informacin distintas de las
que cargamos la informacin.
Adems, el nmero de fuentes de informacin vara de una organizacin a
otra: en grandes corporaciones se habla de una media de 8 bases de datos, y
en algunos casos puede llegar a 50.
(Online Transaction Processing)
Fuente de Datos
La informacin que cargamos en un datawarehouse normalmente es
estructurada, es decir, aquella que se puede almacenar en tablas: en la
mayora de los casos es informacin numrica.
Dentro de la informacin no
estructurada tenemos:
correos elecrnicos, cartas,
informes, videos, etc.
Fuente de Datos
En esta fase, el punto clave es identificar las fuentes ms apropiadas de las
cuales recuperaremos la informacin, deberemos analizar los formatos, la
disponibilidad y la calidad de la informacin.
Asumir que la calidad de los datos es buena puede ser un error fatal en los
proyectos de Business Intelligence
Generalmente no se piensa en la calidad de los datos, permitiendo que los
errores sean cargados al datawarehouse. Debera por tanto establecerse un
control o conjunto de controles en el proyecto que localizara los errores en los
datos y no permitiera la carga de los mismos.
Las comprobaciones se debern llevar a cabo, de forma manual o
automatizada, teniendo en cuenta distintos niveles de detalle y variando los
periodos de tiempo, comprobando que los datos cargados coinciden con los
de las fuentes de datos origen
Muchos de estos casos se deben a que los usuarios pueden introducir datos
sin ningn tipo de control. Siempre que se pueda, es recomendable que los
usuarios elijan entre distintos valores, en lugar de introducirlos libremente ellos.
No es una buena opcin corregirlos en el proceso ETL y no modificar las
aplicaciones origen. Esta alternativa es mucho ms rpida inicialmente, pero
mucho ms costosa a largo plazo.
Los errores tambin se pueden producir, por ejemplo, en el proceso de ETL
o al integrarlos en el datawarehouse.