Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introduccin
Por
Elizabeth Len Guzmn, Ph.D.
Profesora
Ingeniera de Sistemas
Grupo de Investigacin MIDAS
Agenda
1.Introduccin
2.Definicin
3.ETL
4.Bodega de Datos
5.Data Mart
Introduccin
No solo intuicin para que el negocio
crezca
Inteligencia de Negocios
Toma de Decisiones
Conocimiento
Informacin
Datos
Inteligencia de Negocios
Definicin
Es el proceso de integracin y
tratamiento de los datos para
convertirlos en informacin que
permita apoyar a los tomadores
de decisiones en la organizacin
Inteligencia de Negocios
Definicin
Es una alternativa tecnolgica que permite
generar conocimiento a la empresa
Servicios de Reporte
Creacin, administracin y visualizacin de
informes
Motor para alojar y procesar informes
Inteligencia de Negocios
Caractersticas
Inteligencia de negocios provee soluciones
a nivel empresarial que permiten a los
tomadores de decisiones transformar
informacin clave de su negocio en
acciones concretas traducindose en
beneficios tangibles:
Reduccin de costos
Mayor rentabilidad
Mejores relaciones comerciales
La Inteligencia de Negocios
Caractersticas Deseables
Entrega de Informacin
Consultas y Reportes
Anlisis Tablero instrumentos (dashboard)
Distribucin informacin (autom.)
Reportes
Manejo de eventos
Consultas Integracin con otras herramientas
de clculo(Ej: excel)
Facilidades de Anlisis
Anlisis multidimensional (OLAP)
Dashboards Clculos y Modelamiento (What-if)
Man. Eventos Anlisis avanzado y Minera
Visualizacin avanzada
Minera de Datos Plataforma para Desarrollo e
Integracin
ETL DQ Seguridad - Metadata
02/06/13 Introduccin a la Mineria de Datos y 15
Aplicaciones
Fases de una solucin de
Inteligencia de Negocios
.
ETL - Extraction, Transformation and
Load
Proceso que permite mover datos desde
mltiples fuentes, reformatearlos y
limpiarlos, y cargarlos en otra base de
datos, data mart, o data warehouse para
analizar.
Extraccin y Transformacin de los datos
desde las fuentes: Bases de datos, ERP,
excel, archivos texto, etc.
Carga de los datos transformados a la
bodega
Extraccin
primera parte del proceso ETL
extraer los datos desde los sistemas de
origen
Diferente organizacin, formatos
deja los datos en formato especial para ser
transformados
Si existen muchos datos, peligro de
colapsar. Se programa en horarios en el que
el impacto sea mnimo
Transformacin
Aplica reglas de negocio o funciones sobre
los datos extrados para convertirlos en
datos que sern cargados
Ejemplos de transformaciones:
Seleccionar slo ciertas columnas para su
carga (por ejemplo, que las columnas con
valores nulos no se carguen).
Traducir cdigos (por ejemplo, si la fuente
almacena una "H" para Hombre y "M" para
Mujer pero el destino tiene que guardar "1"
para Hombre y "2" para Mujer).
Transformacin
Codificar valores libres (por ejemplo, convertir
"Hombre" en "H).
Obtener nuevos valores calculados (por
ejemplo, total_venta = cantidad * precio).
Unir datos de mltiples fuentes (por ejemplo,
bsquedas, combinaciones, etc.).
Calcular totales de mltiples filas de datos (por
ejemplo, ventas totales por cada producto).
Dividir una columna en varias (por ejemplo,
columna "Nombre: Diaz, Maria"; pasa a dos
columnas "Nombre: Maria" y "Apellido: Diaz").
Carga
Datos transformados son cargados en la
bodega
Interaccion directa con la bodega
Se aplicaran restricciones y triggers que
esten definidos:
valores nicos,
integridad referencial,
campos obligatorios,
rangos de valores
Ejemplo ETL
Bodegas de Datos
El objetivo de construir una bodega es centralizar
y resumir (agregacin) la gran variedad de datos e
informacin.
Arquitectura particular para almacenar datos cuyo
diseo no est preparado para soportar el
proceso transaccional
Contiene informacin histrica de la empresa para
permitir anlisis de su evolucin
Estructurada para optimizar consultas, y las
actualizaciones se hacen fuera de lnea
Fases de una solucin de
Inteligencia de Negocios
.
Bodega de Datos
Definicin
Es un conjunto de datos integrados o
orientados a un objetivo especfico, que
varan con el tiempo (datos histricos) y
que no son transitorios.
Soportan el proceso de toma de
decisiones de la administracin y est
orientada al manejo de grandes
volmenes de datos provenientes de
diversas fuentes o diversos tipos [1]
Bodega de Datos
Definicin
Una Bodega de Datos es una base de
datos que organiza y almacena una
coleccin de informacin derivada
directamente de los sistemas
operacionales y de algunos datos externos
[2].
Bodegas de datos
Informacin
Se apoyan en tres procesos de organizacin
de alto nivel:
Tomado de [1]
Data Mart
Bodegas de datos pequeas especficas de
un departamento o dependencia de la
empresa
Utilizados para almacenar particularidades de
un sector o para optimizar las consultas
Implementacin
Top-down
Bottom-up
Top-down
Bottom-up
Cubo
DM1
OLTP
DM2
Fuente de
datos 1
DM4
Fuente de
datos 3
Cliente
DM3
Diseo Lgico y Fsico de la Bodega
Estos modelos permiten:
Planear la extraccin y transformacin
Estimar las necesidades de administracin
del DBMS
Planear prototipos para las aplicaciones
finales
El diagrama dimensional del ciclo de vida del
negocio
Diseo Seleccin e
Tcnico de la Instalacin
arquitectura del producto
Especificaciones de Desarrollo
la de la
Aplicacin de Aplicacin de
Usuario final
Usuario final
Tomado de [5]
Planeacin del Proyecto
1. Definicin del proyecto
1. Asegurar la factibilidad del proyecto
2. Alcance preliminar del proyecto
3. Justificacin de negocio
2. Planeacin del proyecto
1. Establecer la identidad del proyecto
2. Recursos del proyecto
3. Plan del proyecto
3. Gerencia del proyecto
1. Reunin de lanzamiento (Kick-Off)
2. Monitorear el estado del proyecto
3. Actualizacin y documentacin del Plan del Proyecto
4. Manejo del alcance
5. Plan de comunicaciones
ELEMENTOS BASICOS DE UNA BODEGA DE DATOS
rea de rea de
presentacin Herramientas de acceso
Sistemas rea de almacenamiento The Data Warehouse Datos accesados por
Fuentes de datos Servidores el usuario final
(Herencia)
Herramientas especficas de
Storage: populate,
Data Mart #1: alimentar
consulta
Archivos planos; replicate,
OLAP (ROLAP and/or MOLAP)
RDBMS; Servicios de consulta;
recover
Other Dimensional
Informes escritos
extraer Orientado a tema de negocio alimentar