Sei sulla pagina 1di 178

Anlisis y explotacin de Informacin

M.Sc. Edwin Asnate Salazar

Filosofa
Qu es lo que hace que una empresa, corporacin, un gerente, un administrador, etc., sobresalga o obtenga mejores ventajas competitivas con respecto al resto?

Las decisiones correctas que toma !

CUL ES EL PROBLEMA EN LA ACTUALIDAD?

Almacenar un gran volumen de datos no contribuye al aumento de conocimiento en vista que no somos capaces de procesarlos.
PARADOJA

De cuantos ms datos dispongamos menos informacin tenemos

DEFINICION
La Inteligencia de Negocios (BI) es el proceso de analizar los datos acumulados en la empresa y extraer un conocimiento de ellos. BI procesa los datos histricos de una empresa a travs de la construccin de Data Mart o Data Warehouses y los explota con fines de anlisis y para la mejor toma de decisiones.

DEFINICION
BI es el conjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anlisis de datos existentes en una organizacin o empresa. Tiene en comn las siguientes caractersticas:

Accesibilidad a la informacin. Apoyo en la toma de decisiones. Orientacin al usuario final.

BI Digest. Lecturas sobre el Business Intelligence y anlisis de la informacin. Recuperado el 14 de Junio del 2008. http://www.bidigest.com/business/intelligence/datawarehouse/interesantisimo%C2%BF

Este conjunto de herramientas y metodologas tienen en comn las siguientes caractersticas:

INTELIGENCIA DE NEGOCIOS

Accesibilidad a la informacin.

Los datos son la fuente principal de este concepto. Lo primero que deben garantizar este tipo de herramientas y tcnicas ser el acceso de los usuarios a los datos con independencia de la procedencia de estos.

Apoyo en la toma de decisiones.

Se busca ir ms all en la presentacin de la informacin, de manera que los usuarios tengan acceso a herramientas de anlisis que les permitan seleccionar y manipular slo aquellos datos que les interesen.

Orientacin al usuario final.

Se busca independencia entre los conocimientos tcnicos de los usuarios y su capacidad para utilizar estas herramientas.

INTELIGENCIA DE NEGOCIOS
Las soluciones de BI se pueden clasificar las de en:

Reportes empresariales.
Queries y reports.

Consultas e informes simples:

Anlisis y consultas a cubos OLAP (On Line Analytic Processing). Sistemas de reporting y anlisis on
line de datos.

Anlisis estadstico y Data Mining. Minera de datos. Sistemas de previsin, planificacin y control de gestin.(Informes de entrega, dispositivos de alerta
(Balanced Score Card).

EMPRESA SIN ORGANIZACIN CRUZADA


CLASES DE SISTEMAS DE INFORMACIN
Sistemas en el nivel estratgico
(ESS)

GRUPOS A LOS QUE SIRVE


Administradores del nivel superior

Informacin

ESS

Sistemas en el nivel de administracin


( MIS y DSS )

DSS DSS MIS

DSS DSS DSS MIS MIS MIS

Administradores del nivel medio

MIS

Sistemas en el nivel operativo


(TPS)

TPS

TPS
Abastecimiento y Produccin

TPS
Contabilidad / Finanzas

TPS
Servicios de Informacin

TPS

Trabajadores operativos

Ventas y marketing

Recursos humanos

Ordenes y directivas

EMPRESA SIN ORGANIZACIN CRUZADA


CLASES DE SISTEMAS DE INFORMACIN
Sistemas en el nivel estratgico
(ESS)

GRUPOS A LOS QUE SIRVE


Administradores del nivel superior

ESS

Sistemas en el nivel de administracin


( MIS y DSS )

DSS DSS MIS

DSS DSS DSS MIS MIS MIS

Administradores del nivel medio

MIS

Sistemas en el nivel operativo


(TPS)

TPS

TPS
Abastecimiento y Produccin

TPS
Contabilidad / Finanzas

TPS
Servicios de Informacin

TPS

Trabajadores operativos

Ventas y marketing

Recursos humanos

INFRAESTRUCTURA DE T.I. (Hardware , software , redes , tecnologa de almacenamiento de datos)

FoxPro

Access, Visual Basic Oracle, MySQL , Cobol

SQL Server, .NET

Excel 2000

Redes Novell, Redes Windows, Red, Windows Server 2000,

EMPRESA CON ORGANIZACIN CRUZADA


CLASES DE SISTEMAS DE INFORMACIN
Sistemas en el nivel estratgico
(ESS)

GRUPOS A LOS QUE SIRVE


Administradores del nivel superior

Sistemas en el nivel de administracin


( MIS y DSS )

D S S, MIS TPS

Administradores del nivel medio

Sistemas en el nivel operativo


(TPS)

Trabajadores operativos

Ventas y marketing

Abastecimiento y Produccin

Contabilidad / Finanzas

Servicios de Informacin

Recursos humanos

Infraestructura de T.I. compartida para toda organizacin

Ordenes y directivas

Informacin

ESS

LA BI DENTRO LA CATEGORIAS DE SI
CLASES DE SISTEMAS DE INFORMACIN
Sistemas en el nivel estratgico
(ESS)

GRUPOS A LOS QUE SIRVE


Administradores del nivel superior

Sistemas en el nivel de administracin


( MIS y DSS )

Inteligencia de Negocios

Administradores del nivel medio

Sistemas en el nivel operativo


(TPS)

Trabajadores operativos

Ventas y marketing

Abastecimiento y Produccin

Contabilidad / Finanzas

Servicios de Informacin

Recursos humanos

Ordenes y directivas

Informacin

DEFINICION ESTRATEGICA
Se define como la habilidad de consolidar informacin y analizarla con la suficiente velocidad y precisin para descubrir ventajas y tomar mejores decisiones de inteligentes.

EXITO EMPRESARIAL

OBJETIVO ESTRATGICO DE BI
COMPETIVIDAD

DATOS

INFORMACIN

CONOCIMIENTO

Base de Datos BI

TIPO DE CONOCIMIENTO

Extraccin del conocimiento

Almacn de datos: Data Warehouse


Es una base de datos que almacena los datos actuales e histricos de toda la organizacin, con el propsito de realizar anlisis que apoyen las decisiones.

DATA WAREHOUSE

Almacn de datos: DataMart


Es una base de datos que almacena los datos actuales e histricos de un rea funcional de la organizacin, con el propsito de realizar anlisis que apoyen las decisiones.

DATA MART

CONCEPTOS QUE COMPRENDE BI


Consultas y reportes ESS Metadata Sistemas ETL Data warehouese Data mart Reportes financieros DSS Hojas de clculo (Excel)

Anlisis analtico en lnea Cabina de pilotos de mando digitales Tableros de mando y Tablero de mando Integral Flujos de trabajo Alerta y notificaciones Minera de datos Anlisis predictivo

INTELIGENCIA DE NEGOCIOS

Herramientas de transmisin

Portales

ESTRUCTURA DE BI
Segn Turban, E., Sharda, R., Liang T. and Aronson, J. (2006), la BI tiene cuatro principales componentes: una data warehouse con su origen de datos; el anlisis de negocios que una coleccin de herramientas para manipuleo, minera y anlisis en el data warehouse; administracin del rendimiento del negocio (BPM) para analizar el rendimiento y las interfaces del negocio (ejemplo tablero de mando).
Turban, E., Sharda, R., Liang T. and Aronson, J. (2006). Decision Support And Business Intelligence Systems. Edition 8. United States of Amrica: Prentice Hall.

ESTRUCTURA DE BI

VISTAZO GENERAL A BI
OLTP Archivos Histricos Cliente Portal

ERP CRM OTROS SI

SCM

(ETL)

DW, DATA MART

IINTERFAZ DEL USUARIO


Anlisis de datos (OLAP, DataMining)

Stage area

Almacn de Datos

DATOS EXTERNOS

Caractersticas de una solucin de BI


Ubica, extrae, transforma y centraliza datos desde mltiples ubicaciones y formatos. No importa si los datos estn almacenados en sistemas mainframe, bases de datos relacionales, hojas de clculo o archivos de texto. Toda esta informacin ser extrada y almacenada en un repositorio central.

Caractersticas de una solucin de BI


Consolida y estandariza la informacin. La informacin de un cliente puede encontrarse en varios sistemas utilizando un identificador distinto en cada sistema (el RUC en el sistema contable, una clave autogenerada en el sistema CRM, etc.). Esto dificulta la generacin de reportes consolidados. Una solucin de BI consolida la informacin, de manera que se establece una clave nica para cada cliente.

Caractersticas de una solucin de BI


Proporciona repositorios centralizados de almacenamiento de la informacin, y herramientas para analizar y explotar dicha informacin.

Caractersticas de una solucin de BI


BI da acceso a los datos a quienes lo necesitan en el momento en que la necesitan. Sus usuarios se encuentran en todos los niveles de la organizacin

ANLISIS MULTIDIMENSIONAL OLAP

VENTAS
Operaciones: Dado Tajada Pivoting

Cliente - Zona Tiempo

Producto

Formulario de Ventas

Modelo Entidad-Relacin de Ventas

Modelo Estrella

Modelo Copo de Nieve

Diferencia entre una BD OLTP y BI


Entidad-Relacin

Bases de datos OLTP Tiempo Estructuracin Optimizacin Tiempo real Integridad de los datos. Alta normalizacin Procesos transaccionales (modificacin de datos)

Bases de datos OLAP Peridica Fcil consulta. Informacin desnormalizada Consultas.

Data Mining (Minera de datos)


Es un conjunto de metodologas y herramientas que permiten extraer el conocimiento til (comportamiento, modos de operacin, informacin para descubrir patrones, tendencias, etc.) para mejorar la toma de decisiones, comprensin y mejora de procesos etc. partiendo de grandes cantidades de datos.

VISTAZO GENERAL A BI
Archivos Histricos TPS

Conocimientos para tomar decisiones


(Administracin del Conocimiento) Difusin y uso

Portal

Cliente

ERP
OTROS SI

CRM SCM
(ETL)
Dw DataMart

IINTERFAZ DEL USUARIO


(SQL, Excel, SPSS, etc)

DATOS EXTERNOS

Stage area

Almacen de datos Anlisis de datos (OLAP, DataMining)

Plataforma Analtica

Integracin y recopilacin

Seleccin, limpieza y transformacin

OLAP y Minera de Datos

Evaluacin e interpretacin

Integration Services (SSIS)


Es una plataforma que permite generar soluciones de integracin de datos de alto rendimiento, entre las que se incluyen paquetes de extraccin, transformacin y carga (ETL) para el almacenamiento de datos.

ETL

Analysis Services (SSAS)


Es una plataforma de Microsoft SQL Server 2005 que proporciona funciones de procesamiento analtico en lnea (OLAP) y minera de datos para soluciones de Inteligencia de Negocios.
Datawarehouse
Data Mart

OLAP, DataMining

IINTERFAZ DEL USUARIO

Reporting Services (SSRS)


Proporciona la capacidad de generar informes empresariales que extraen contenido de una variedad de orgenes de datos relacionales y multidimensionales, pblica informes que se ven en diversos formatos, administra la seguridad y las suscripciones de manera centralizada.
OLAP, DataMining

IINTERFAZ

DEL USUARIO

Clientes

PROCESO BI: RALPH KIMBALL

Justificacin Planeamiento Anlisis de

Evaluacin del caso de negocio Evaluacin de la infraestructura Empresarial Planeamiento del proyecto Definicin de los requerimientos del proyecto Anlisis de repositorio de metadato

negocio
Anlisis de datos

Desarrollo del prototipo

Diseo
Diseo de ETL

Diseo de base de datos

Diseo de repositorio de metadato

Construccin
Desarrollo de ETL

Desarrollo de aplicaciones Data Mining

Desarrollo de repositorio de metadato

Despliegue
Implementacin Evaluacin de versin

MODELO DEL SUPERMERCADO

MODELO DEL SUPERMERCADO


Se desea analizar las ventas de los productos, partiendo de la estructura de la base de datos de los tickets.

Tickets

MODELO E-R DEL SUPERMERCADO

MODELO SUPERMERCADO
Qu se desea analizar?

Analizar los tickets de venta Analizar los artculos que se venden ms

Si se desea analizar la evolucin de los tickets de venta se debe decidir el periodo (tiempo) en que se desea realizar anualmente, trimestralmente, mensualmente o semanalmente, por cada da de la semana, o diferenciando das festivos. Para tal se debe construir la tabla tiempo que lo permita.

MODELO DEL SUPERMERCADO


Otro anlisis sera descubrir si hay diferencias respecto a los tickets que se pagan al contado o los que se pagan a travs de una tarjeta de crdito. Del anlisis se puede desprender la posibilidad de establecer nuestra propia tarjeta de dbito o crdito.

MODELO DEL SUPERMERCADO


Otro anlisis sera comparar teniendo en cuenta otras caractersticas de los centros: poblacin, cercana a mercado o colegios.

MODELO DEL SUPERMERCADO


Otro anlisis sera comparar los tickets entre los centros o bien entre los centros de una misma ciudad.

MODELO DEL SUPERMERCADO


Esta esta informacin no est en el sistema de informacin de los tickets de venta: la tendremos que aadir a nuestro modelo si queremos llevar a cabo este tipo de anlisis.
Con la informacin disponible en nuestro modelo podemos analizar cul es el horario de ms afluencia de clientes, lo que nos permitir ajustar el personal necesario para los distintos horarios.

ESQUEMA ESTRELLA DEL SUPERMERCADO


Se construye a partir del modelo E-R la cual permitir responder a las preguntas planteadas con los tickets de venta. Debemos de tener en cuenta: Tabla de hechos: aquello que queremos medir o analizar. Tabla de dimensiones: la forma que queremos medir o analizar. Lo que queremos medir son los tickets y lo vamos a analizar por: tiempo, franja horaria, centro, empleado y forma de pago.

ESQUEMA ESTRELLA DEL SUPERMERCADO

TABLA DE HECHOS DEL SUPERMERCADO

TABLA DE DIMENSIONES DEL SUPERMERCADO

Las tablas de dimensiones nos permiten agrupar los hechos en funcin a los valores de la dimensin.

CARACTERISTICAS DE ESQUEMA ESTRELLA


La tabla de hechos contiene los datos a medir sin redundancia Una sola tabla por dimensin La tabla de hechos (Fact Table) tiene el atributo columna que forma la clave de cada dimensin (claves forneas). Cada tabla de dimensin (Dimension Table) es una tabla desnormalizada. Distintas esquemas estrellas que comparten dimensiones se denominan constelacin de hechos.

DIMENSIN TIEMPO
Permite: Analizar si la venta es igual para cualquier da de la semana. Analizar las ventas en los fines de semana. Analizar las ventas en los das de fiesta. Analizar si se vende ms al principio o finales de cada mes. Comparar las ventas entre los diferentes meses, trimestres e incluso aos.

DIMENSIN HORA
Permite:
Analizar las ventas de las distintas franjas horarias, las cuales pueden ser: 09:00 a 11:59 12:00 a 14:59 15:00 a 17:59 18:00 a 21:00

DIMENSIN FORMAS DE PAGO


Permite conocer como pagan los clientes:
Al contado Tarjeta de crdito Tarjeta de dbito

DIMENSIN EMPLEADO
Permite conocer que empleados o categora de empleados han hecho la cobranza de los tickets de venta en los terminales POS.

DIMENSIN CENTRO
Permite: Analizar cual es el importe de los tickets de venta de un centro, centro de una poblacin o provincia e incluso ordenarlos por cdigo postal.

Analizar el importe de los tickets de venta en funcin a los metros cuadrados de los centros. Se ha agregado descripcin de zona para analizar la diferencia entre las diferentes zonas.

ESQUEMA COPO DE NIEVE SUPERMERCADOS


Es un modelo estrella que no est totalmente normalizado, sea aparecen relaciones entre las tablas de dimensiones mientras en el esquema estrella solo hay relaciones entre la tabla de hechos y las de dimensiones.

ESQUEMA COPO DE NIEVE DEL SUPERMERCADO

GRANULARIDAD (tiene que ver con la tabla de hechos)


Granularidad es la diferencia de nivel de detalle en el anlisis. Si se desea analizar cada una de las lnea de detalle de los tickets de venta la granularidad tendr que ser mayor. Determina el nivel de detalle que se quiere al responder a las preguntas de negocio.

MODELO ESTRELLA DE LAS LNEAS DE LOS TICKETS DEL SUPERMERCADO

JERARQUA DE LAS DIMENSIONES

JERARQUA DE LAS DIMENSIONES


La jerarqua en las dimensiones nos permite pasar del mximo detalle a la agregacin en los distintos niveles de la jerarqua. La jerarqua no permite agregar o desagregar la informacin. Un agregado son clculos de datos a nivel de detalle teniendo en cuenta las jerarquas.

12234,345

MULTIDIMENSIONALIDAD
La multidimensionalidad permite analizar la informacin por distintas dimensiones a la vez. Por ejemplo analizar las ventas de un artculo, pero a la vez hacerlo por centro y por ao.

EJEMPLOS DE ESQUEMAS DE ALGUNOS SECTORES

TRABAJO: EJEMPLO DE UNA SITUACIN DE VENTAS MS COMPLICADA

Paquetes de Integration Services


Paquete
Task Container Task Task

Task

Data Flow Task

Data Flow Task

Data Flow Task


Source Adapter Source Adapter

Transformation

Transformation

Destination Adapter

Destination Adapter

Paquete de (SSIS)
Es una coleccin de tareas que pueden ejecutarse en un modo ordenado. Las restricciones de precedencia ayudan administrar el orden en que las tareas sern ejecutadas.

Tarea de SSIS
Una tarea puede ser mejor descrita como una unidad individual de trabajo. Ellas proveen funcionalidad a los paquetes, en la misma forma como lo hacen mtodos en los lenguajes de programacin.

Restricciones de precedencia en SSIS


Ordenan las tareas para que sean ejecutadas en un determinado orden. Ellos ordenan el flujo de trabajo en los paquetes SSIS basa-dos en determinadas condiciones.

Contenedores en SSIS
Son el punto principal en la arquitectura de SSIS, que ayudan a las las tareas agruparse lgicamente en una unidad de trabajo

Origen de datos en SSIS


Un origen de datos es donde especifica la ubicacin de los orgenes de datos fuente para ser recuperados en la extraccin de datos.

Transformaciones en SSIS
Son los componentes claves que cambian los datos a un formato deseado. Actualizan, agregan, ordenan, mezclan, modifican, resumen, limpian y distribuyen datos.

Destino de datos en SSIS


Aceptan los datos desde los orgenes de datos o desde las transformaciones. Carga los datos en los almacenes de datos o crean conjuntos de datos almacenados en la memoria.

Paquete de (SSIS)
Es una coleccin de tareas que pueden ejecutarse en un modo ordenado. Las restricciones de prece-dencia ayudan admi-nistrar el orden en que las tareas sern ejecutadas.

Tarea de SSIS
Una tarea puede ser mejor descrita como una unidad individual de trabajo. Ellas proveen funcionalidad a los paquetes, en la misma forma como lo hacen mtodos en los lenguajes de programacin.

Restricciones de precedencia en SSIS


Ordenan las tareas para que sean ejecutadas en un determinado orden. Ellos ordenan el flujo de trabajo en los paquetes SSIS basados en determinadas condiciones.

Contenedores en SSIS
Son el punto principal en la arquitectura de SSIS, que ayudan a las las tareas agruparse lgicamente en una unidad de trabajo

Origen de datos en SSIS


Un origen de datos es donde especifica la ubicacin de los orgenes de datos fuente para ser recuperados en la extraccin de datos.

Transformaciones en SSIS
Son los componentes claves que cambian los datos a un formato deseado. Actualizan, agregan, ordenan, mezclan, modifican, resumen, limpian y distribuyen datos.

Destino de datos en SSIS


Aceptan los datos desde los orgenes de datos o desde las transformaciones. Carga los datos en los almacenes de datos o crean conjuntos de datos almacenados en la memoria.

Contenedor en SSIS
Los contenedores proporcionan estructura en paquetes y servicios a las tareas en el flujo de control. SSIS incluye los siguientes tipos de contenedor para agrupar tareas e implementar flujos de control repetidos: El contenedor de secuencias El contenedor de bucles Foreach El contenedor de bucles For

Contenedor de Secuencias en SSIS


El contenedor de secuencias define un flujo de control que es
un subconjunto del flujo de control de paquete. Los contenedores de secuencias agrupan el paquete en varios flujos de control independientes, cada uno con una o varias tareas y contenedores que se ejecutan en el flujo de control global del paquete. El uso de un contenedor de secuencias ofrece muchas ventajas: Permite deshabilitar grupos de tareas para centrar la depuracin en un subconjunto del flujo de control del paquete. Permite administrar propiedades en varias tareas de una ubicacin estableciendo propiedades en un contenedor de secuencias en lugar de hacerlo en las tareas individuales. Proporciona un mbito para variables usadas por un grupo de tareas y contenedores relacionados.

Contenedor de Bucles Foreach en SSIS


Define un flujo de control que se repite en un paquete. La implementacin del bucle es similar a la estructura de bucle Foreach de los lenguajes de programacin. En un paquete, los bucles se habilitan mediante un enumerador Foreach. El contenedor de bucles Foreach repite el flujo de control para cada miembro de un enumerador especificado. SSIS proporciona los siguientes tipos de enumerador: Enumerador Foreach File para enumerar los archivos de una carpeta. El enumerador puede recorrer subcarpetas.
Enumerador de ADO para Foreach, para enumerar filas de tablas. Por ejemplo, puede obtener las filas de un conjunto de registros ADO. Otros.

Variables en SSIS
Las variables almacenan valores que un paquete SSIS y sus contenedores, tareas y controladores de eventos pueden usar en tiempo de ejecucin. Puede usar variables en paquetes de SSIS para :
Actualizar propiedades de elementos de paquete en tiempo de ejecucin. Incluir una tabla de bsqueda almacenada en la memoria. Cargar variables con valores de datos y usarlas posteriormente para especificar una condicin de bsqueda en una clusula WHERE. Cargar una variable con un nmero entero y luego usar el valor para controlar bucles dentro de un flujo de control de paquetes. Llenar valores de parmetros para instrucciones Transact-SQL en tiempo de ejecucin. Generar expresiones que incluyen valores de variable

Variables en SSIS

Ciclo de Vida: ralph Kimball

INTELIGENCIA DE NEGOCIOS

MINERA DE DATOS

Ing. Javier Alberto Manrique Quionez

Situacin actual
La mayora de las empresas generan y almacenan gran cantidad de informacin. Ejemplos: Europe's Very Long Baseline Interferometry (VLBI) tiene 16 telescopios que generan 1Gbyte/segundo de informacin astronmica durante una sesin de observacin que dura 25 das. AT&T atiende a billones de llamadas cada da.

UC Berkeley estim que en 2002 se generaron 5 exabytes (5 millones de terabytes) de nuevos datos.
La tasa de crecimiento de nueva informacin ronda el 30% cada ao

Situacin actual
Las mayores bases de datos: France Telecom tiene la mayor base de datos para el soporte de toma de decisiones, en 2003 rondaba los 30 TB. Google busca en 3.3 Billones de paginas: ? TB. IBM WebFountain, 160 TB en 2003. Internet Archive (org) > 300TB.

Alexa Internet Archive, 10 aos tomando datos, >500TB.

QU MOTIVA ALMACENAR TANTOS DATOS?

Abaratamiento de almacenamiento.

los

sistemas

de

Incremento de la velocidad de procesamiento en las computadoras. SGBD cada vez ms poderosos.

Compatibilidad y velocidad en la transmisin de datos.

CUL ES EL PROBLEMA?
Almacenar un gran volumen de datos no contribuye al aumento de conocimiento en vista que no somos capaces de procesarlos. PARADOJA De cuantos ms datos dispongamos menos informacin tenemos

INTERS EMPRESARIAL Y COMERCIAL


Idea Clave: Implementar tcnicas de extraccin de conocimiento de BD. Premisas: "Los datos contienen informacin oculta y necesaria que a simple vista no se logra apreciar. El conocimiento oculto es crucial para las empresas. Ayuda a una toma de decisiones rpida. Ayuda a mejorar la productividad. Mejor conocimiento del cliente. Conocimiento oculto condiciona Productividad y Necesidad de conocimiento

Extraccin del conocimiento

TIPO DE CONOCIMIENTO

Qu es el Data Mining?
Data

Mining is la extraccin semiautomtica de patrones, cambios, asociaciones, anomalas y otras estructuras estadsticas significativas de grandes volmenes de datos . R. Grossman La extraccin no-trivial de informacin implcita, previamente desconocida, y potencialmente til desde los datos. W. Frawley, et al 1992. La ciencia de extraer informacin til desde grandes volmenes de datos o bases de datos. D. Hand, et al 2001. Conocida tambin : - Mquina de aprendizaje - Anlisis predictivo.

Data Mining (Minera de datos)


Es un rea que se agrupa en torno a la gestin del conocimiento y que es un conjunto de metodologas y herramientas que permiten extraer el conocimiento til (patrones de comportamiento, modos de operacin, informacin til para descubrir patrones, tendencias, etc.) para la ayuda en la toma de decisiones, comprensin y mejora de procesos o sistemas, etc. partiendo de grandes cantidades de datos.

KDD (Knowledge Discovery in Database)


Se define como la aplicacin de la minera de datos a grandes bases de datos. La palabra "descubrimiento" est relacionada con el hecho de que mucha de la informacin valiosa es desconocida con anterioridad; En todo caso, estas tcnicas pueden ayudar a confirmar cualquier sospecha sobre el comportamiento del sistema en un particular contexto. El descubrimiento de conocimiento en base de datos combina las tcnicas tradicionales con numerosos recursos desarrollados en el rea de la inteligencia artificial.

EXITO EMPRESARIAL

OBJETIVO DEL KDD

COMPETIVIDAD

DATOS

INFORMACIN

CONOCIMIENTO

Base de Datos

KDD (Knowledge Discovery in Database)


Descubrimiento de Conocimiento a partir de Bases de Datos

(KDD, del Databases).

ingls

Knowledge

Discovery

from

Proceso no trivial de identificar patrones vlidos, novedosos, potencialmente tiles y en ltima instancia comprensibles a partir de los datos. Fayyad et al. 1996

KDD (Knowledge Discovery in Database)


Diferencia clara con mtodos estadsticos: la estadstica se utiliza para validar o parametrizar un modelo sugerido y preexistente, no para generarlo. Diferencia sutil Anlisis Inteligente de Datos (IDA, del ingls Intelligent Data Analysis) que corresponda con el uso de tcnicas de inteligencia artificial en el anlisis de los datos.

ENFOQUE MULTIDISCIPLINARIO DE LA MINERIA DE DATOS

Relacin de DM con Otras Disciplinas


La minera de datos (DM) es ms que una fase del KDD:
Fase que integra los mtodos de aprendizaje y estadsticos para obtener hiptesis de patrones y modelos. Al ser la fase de generacin de hiptesis, vulgarmente se asimila KDD con DM. Adems, las connotaciones de aventura y de dinero fcil del trmino minera de datos han hecho que ste se use como identificador del rea.

Relacin de DM con Otras Disciplinas


La minera de datos no es una extensin de los sistemas OLAP (On-Line Analytical Processing). La minera de datos aspira a ms Otras herramientas de consultas sofisticadas o anlisis estadstico, pueden responder a preguntas como: Han subido las ventas del producto X en junio?

Las ventas del producto X bajan cuando promocionamos el producto Y?


Pero slo con tcnicas de minera de datos podremos responder a preguntas del estilo: Qu factores influyen en las ventas del producto X? Cul ser el producto ms vendido si abrimos una delegacin en Portugal?

Relacin de DM con Otras Disciplinas


Visin con las herramientas tradicionales:
El analista empieza con una pregunta, una suposicin o simplemente una intuicin y explora los datos y construye un modelo. El analista propone el modelo.

Visin con la minera de datos:


Aunque el analista no pierde la posibilidad de proponer modelos, el sistema encuentra y sugiere modelos.

Ventajas:
Generar un modelo requiere menos esfuerzo manual y permite evaluar cantidades ingentes de datos. Se pueden evaluar muchos modelos generados automticamente, y esto aumenta la probabilidad de encontrar un buen modelo. El analista necesita menos formacin sobre construccin de modelos y menos experiencia.

reas de Aplicacin - Problemas Tipo


Comercio/Marketing:

- Identificar patrones de compra de los clientes.


- Buscar asociaciones entre clientes y caractersticas demogrficas. - Predecir respuesta a campaas de mailing. - Anlisis de cestas de la compra. Banca: - Detectar patrones de uso fraudulento de tarjetas de crdito. - Identificar clientes leales. - Predecir clientes con probabilidad de cambiar su afiliacin. - Determinar gasto en tarjeta de crdito por grupos. - Encontrar correlaciones entre indicadores financieros. - Identificar reglas de mercado de valores a partir de histricos.

reas de Aplicacin - Problemas Tipo

Seguros y Salud Privada: - Anlisis de procedimientos mdicos solicitados conjuntamente. - Predecir qu clientes compran nuevas plizas. - Identificar patrones de comportamiento para clientes con riesgo. - Identificar comportamiento fraudulento. Transportes: - Determinar la planificacin de la distribucin entre tiendas. - Analizar patrones de carga.

reas de Aplicacin - Problemas Tipo


Medicina: - Identificacin de terapias mdicas satisfactorias para diferentes enfermedades. - Asociacin de sntomas y clasificacin diferencial de patologas.
- Estudio de factores (genticos, precedentes, hbitos, alimenticios, etc.) de riesgo/salud en distintas patologas. - Segmentacin de pacientes para una atencin ms inteligente segn su grupo. - Predicciones temporales de los centros asistenciales para el mejor uso de recursos, consultas, salas y habitaciones. - Estudios epidemiolgicos, anlisis de rendimientos de campaas de informacin, prevencin, sustitucin de frmacos, etc.

reas de Aplicacin - Problemas Tipo


Procesos Industriales Extraccin de modelos sobre comportamiento de compuestos. Deteccin de piezas con trabas. Prediccin de fallos Modelos de calidad. Estimacin de composiciones ptimas en mezclas. Extraccin de modelos de coste. Extraccin de modelos de produccin. Simulacin costes/beneficios segn niveles de calidad

El proceso de extraccin de conocimiento

El proceso de extraccin de conocimiento

Las fases del proceso de extraccin de conocimiento


KDD es un proceso iterativo e interactivo:
Es

iterativo porque la salida de alguna fase puede hacer volver a pasos anteriores y porque a menudo hay que hacer varias iteraciones para conseguir conocimiento de alta calidad.

Es

interactivo porque el experto en el dominio debe ayudar en la preparacin y validacin del conocimiento extrado

UN VISTAZO GENERAL A BI Y DM
OLTP

Cliente

Portal

ERP
OTRO S SI

CR M SCM

DW, DATA MART

IINTERFAZ DEL USUARIO

DATOS EXTERNOS

(ETL) Plataforma Analtica

Data Analysis (OLAP, DataMining)

UN VISTAZO GENERAL DE KDD Y DM


Archivos Histricos TPS

Conocimientos para tomar decisiones


(Administracin del Conocimiento) Difusin y uso

Portal

Cliente

ERP
OTROS SI

CRM SCM
(ETL)
Dw DataMart

IINTERFAZ DEL USUARIO


(SQL, Excel, SPSS, etc)

DATOS EXTERNOS

Stage area

Almacen de datos Anlisis de datos (OLAP, DataMining)

Plataforma Analtica

Integracin y recopilacin

Seleccin, limpieza y transformacin

OLAP y Minera

de Datos

Evaluacin e interpretacin

El Proceso KDD

En las fases de integracin y recopilacin se determinan las fuentes de informacin que pueden ser tiles y donde conseguirlas.

Luego, se transforman los datos a un formato comn donde se detectan y eliminan inconsistencias.
Dado que las fuentes provienen de diferentes aplicaciones pueden contener errores o faltar datos: Esto se corrige en la fase de seleccin, limpieza y transformacin. La seleccin incluye tanto una seleccin horizontal (Registros/filas), como vertical (columnas/atributos) Algunos autores unen las tres primeras fases en una sola: Preparacion de datos

El Proceso KDD

En la fase Minera de Datos se decide cual es la tarea a realizar: Clasificar, agrupar, etc. En la fase de evaluacin e interpretacin se evalan los patrones que son analizados por los expertos, estos deciden si son validos o se hace un proceso iterativo. La fase de difusin se extiende el conocimiento hacia los usuarios.

CRISP-DM
CRoss-Industry Standard Process for Data Mining) Es un consorcio de empresas (inicialmente bajo una subvencin inicial de la Comisin Europea), incluyendo SPSS, NCR y DaimlerChrysler. CRISP-DM (www.crisp-dm.org)

CRISP-DM

CRISP-DM
Comprensin del negocio Comprensin de datos

Proceso de minera de datos Evaluacin

Preparacin de datos

Despliegue

Modelamiento

CRISP-DM

CRISP-DM
COMPRENSIN DEL NEGOCIO Entender los objetivos y requerimientos del proyecto desde una perspectiva de negocio. Subfases: Establecimiento de los objetivos de negocio (contexto inicial, objetivos y criterios de xito), Evaluacin de la situacin (inventario de recursos, requerimientos, suposiciones y restricciones, riesgos y contingencias, terminologa y costes y beneficios), Establecimiento de los objetivos de minera de datos (objetivos de minera de datos y criterios de xito) y Generacin del plan del proyecto (plan del proyecto y evaluacin inicial de herramientas y tcnicas).

CRISP-DM
COMPRENSIN DE LOS DATOS

Recopilar y familiarizarse con los datos, identificar los problemas de calidad de datos y ver las primeras potencialidades o subconjuntos de datos que puede ser interesante analizar (segn los objetivos de negocio en la fase anterior).
Subfases: Recopilacin inicial de datos (informe de recopilacin) Descripcin de datos (informe de descripcin) Exploracin de datos (informe de exploracin) verificacin de calidad de datos (informacin de calidad).

CRISP-DM
PREPARACIN DE LOS DATOS El objetivo de esta fase es obtener la "vista minable". Aqu se incluye la integracin, seleccin, limpieza y transformacin. Subfases:

Seleccin de datos (razones de inclusin / exclusin), Limpieza de datos (informe de limpieza de datos), Construccin de datos (atributos derivados, registros generados), Integracin de datos (datos mezclados) Formateo de datos (datos reformateados).

CRISP-DM
MODELADO Es la aplicacin de tcnicas de modelado o de minera de datos propiamente dichas a las vistas minables anteriores. Subfases: Seleccin de la tcnica de modelado (tcnica de modelado, suposiciones de modelado) Diseo de la evaluacin (diseo del test) Construccin del modelo (parmetros elegidos, modelos, descripcin de los modelos) Evaluacin del modelo (medidas del modelo, revisin de los parmetros elegidos).

CRISP-DM
EVALUACIN Es necesario evaluar (desde el punto de vista de la finalidad) los modelos de la fase anterior. Es decir, si el modelo nos sirve para responder a algunos de los requerimientos del negocio. Subfases: Evaluacin de resultados (evaluacin de los resultados de minera de datos, modelos aprobados), Revisar el proceso (revisin del proceso) y Restablecimiento de los siguientes pasos (lista de posibles acciones, decisin).

CRISP-DM
DESPLIEGUE: Se trata de explotar la potencialidad de los modelos, integrarlos en los procesos de toma de decisin de la organizacin, difundir informes sobre el conocimiento extrado, etc. Subfases: Planificacin del despliegue (plan del despliegue), Planificacin de la monitorizacin y del mantenimiento (plan de la monitorizacin y del despliegue), Generacin del informe final (informe final, presentacin final) Revisin del proyecto (documentacin de la experiencia).

Aprovechando Data Mining del

QU SE PUEDE HACER CON DM?


EXPLORAR NUESTROS DATOS

BUSCAR PATRONES

REALIZAR PREDICCIONES

PROCESO DATA MINING CON SQL SERVER 2005


Comprensin del negocio Comprensin de los datos SSAS (OLAP) DSV

Data SSIS SSAS(OLAP) SSRS

Preparacin de los datos

SSIS SSAS (OLAP )

Data
Despliegue Modelado

SSAS (Data Mining)

Evaluacin

www.crisp-dm.org

Decision Trees

Sequence Clustering

Clustering

Time Series

Nave Bayes

Association

Neural Net

PROCESO DE DM UTILIZADO EN EL TUTORIAL

Definir el problema Preparar los datos Explorar los datos Generar modelos Explorar y validar los modelos Implementar y actualizar los modelos

PROCESO DE DM UTILIZADO UTILIZANDO OLAP

Aplicacin de las herramientas

TAREA

ALGORITMOS DE MICROSOFT QUE SE PUEDEN USAR Algoritmo de rboles de decisin de Microsoft Algoritmo Bayes naive de Microsoft Algoritmo de clsteres de Microsoft Algoritmo de red neuronal de Microsoft (SSAS) Algoritmo de rboles de decisin de Microsoft Algoritmo de serie temporal de Microsoft Algoritmo de clsteres de secuencia de Microsoft Algoritmo de asociacin de Microsoft Algoritmo de rboles de decisin de Microsoft Algoritmo de clsteres de Microsoft Algoritmo de clsteres de secuencia de Microsoft

Predecir un atributo discreto.Por ejemplo, predecir si el destinatario de una campaa de correo directo adquirir un producto.

Predecir un atributo continuo. Por ejemplo, prever las ventas del ao prximo. Predecir una secuencia. Por ejemplo, realizar un anlisis del flujo de clics en el sitio Web de una empresa. Buscar grupos de elementos comunes en transacciones. Por ejemplo, utilizar el anlisis de la cesta de compra para sugerir a un cliente la compra de productos adicionales. Buscar grupos de elementos similares. Por ejemplo, segmentar datos demogrficos en grupos a fin de comprender mejor las relaciones entre los atributos.

Aplicacin de las herramientas

La plataforma Pentaho: Open Source Business Intelligence

La plataforma Pentaho: Open Source Business Intelligence


La Open BI Suite de Pentaho, provee un completo espectro de funcionalidades de Inteligencia de Negocios, incluyendo reportes, anlisis, tableros de control, minera de datos, integracin de datos y una plataforma de BI que la han convertido en la suite de cdigo abierto ms popular del mundo. Los productos Pentaho son utilizados por organizaciones lderes tales como MySQL, Motorola, Terra Industries, DivX entre otras.

La plataforma Pentaho: Open Source Business Intelligence


Presentacin de informes Todas las organizaciones utilizan la presentacin de informes en una u otra forma. Como resultado, la presentacin de informes se considera la necesidad ncleo de Inteligencia de Negocios y a menudo es la primera aplicacin Bi desplegada. Pentaho permite la presentacin de informes, fcil acceso, el formato, y entregar informacin a los empleados, clientes y socios de las organizaciones de

La plataforma Pentaho: Open Source Business Intelligence


Pentaho Anlisis Explorar informacin empresarial interactivamente en lnea, con capacidades de drill-down, rebanada y dados.Pentaho Anlisis proporciona un rico, analtico poder en manos de sus trabajadores del conocimiento - ayudndoles a adquirir los conocimientos y la comprensin que necesitan para optimizar las decisiones empresariales.

La plataforma Pentaho: Open Source Business Intelligence


Tableros de Pentaho Proporcionar de inmediato en conocimiento individual, departamental, o los resultados de la empresa por la prestacin de clave en una atractiva e intuitiva interfaz visual. Pentaho Tableros de usuarios de negocios da informacin crtica que necesitan para comprender y mejorar el desempeo organizacional.

La plataforma Pentaho: Open Source Business Intelligence


Pentaho integracin de datos Accede, limpia e integrar los datos de su organizacin siempre que lo tenga. Pentaho Integracin de Datos ofrece potentes capacidades para extraer, transformar y cargar (ETL) datos con la de un entorno de diseo intuitivo, demostrada, escalable y basada en estndares y arquitectura.

La plataforma Pentaho: Open Source Business Intelligence


Descubrir relaciones ocultas en sus datos y descubrir los indicadores de rendimiento futuro con Pentaho Data Mining. Take your business intelligence to the next level through predictive analytics and exploit correlations in your data to better to improve organizational performance. Lleve a su inteligencia de negocios al siguiente nivel a travs de anlisis predictivo y aprovechar las correlaciones en sus datos para una mejor para mejorar el desempeo organizacional.

La plataforma Pentaho: Open Source Business Intelligence


Las soluciones de Pentaho estn escritas en Java y tienen un ambiente de implementacin tambin basado en Java. Eso hace que Pentaho es una solucin muy flexible para cubrir una amplia gama de necesidades empresariales tanto las tpicas como las sofisticadas y especificas al negocio.

La plataforma Pentaho: Open Source Business Intelligence

La plataforma Pentaho: Open Source Business Intelligence

La plataforma Pentaho: Open Source Business Intelligence

La plataforma Pentaho: Open Source Business Intelligence

La plataforma Pentaho: Open Source Business Intelligence

Mondrian: Caractersticas claves

On-Line Analytical Processing (OLAP) cubes


automated aggregation speed-of-thought response times 100% Java J2EE Supports any JDBC data source MDX and XML/A Enables ad-hoc, interactive data exploration Ability to slice-and-dice, drill-down, and pivot Provides insights into problems or successes

Open Architecture

Analysis Viewers

How Mondrian Extends MySQL for OLAP Applications

MySQL Provides

Mondrian Provides

Data storage SQL query execution Heavy-duty sorting, correlation, aggregation Integration point for all BI tools

Dimensional view of data MDX parsing SQL generation Caching Higher-level calculations Aggregate awareness

Open Architecture

Viewers

Microsoft Excel (via Spreadsheet Services)

Open Standards (Java, XML, MDX, XML/A, SQL) Cross Platform (Windows & Unix/Linux) J2EE Architecture Server Clustering File or RDBMS Repository Fault Tolerance Data Sources JDBC JNDI
Cube Schema XML Cube Schema XML Cube Schema XML

Web Server

JPivot servlet

J2EE Application Server JPivot servlet Mondrian


cube cube cube

XML/A servlet

JDBC

JDBC

JDBC

RDBMS

RDBMS

The End of 'Build vs. Buy'

http://www.pentaho.com/products/data_integration/

Otras plataformas

OTROS PRODUCTOS

Elder Research, www.dataminglab.com

ETAPAS DEL PROCESO DE INGENIERIA


1. Determinar las necesidades del negocio 3. Evaluacin orgenes y procedimientos operacionales

2. Evaluacin de la solucin actual DSS

PROYECTO DE INGENIERA BI

6. Propuesta de solucin BI DSS

4. Evaluacin de las iniciativas BI DSS de los competidores

5. Determinar los objetivos de las aplicaciones BI DSS

Determinar las necesidades del negocio Evaluacin orgenes y procedimientos operacionales Evaluacin de las iniciativas BI DSS de los competidores

Determinar los objetivos de las aplicaciones BI DSS Propuesta de solucin BI DSS Evaluacin de la solucin actual DSS Evaluacin de la solucin actual DSS Evaluacin de la solucin actual DSS Evaluacin de la solucin actual DSS

DESARROLLO CONVENCIONAL DE LA CASCADA

OPORTUNIDADES DEL NEGOCIO EVALUACIN DE VERSIN ESTRATEGIA DE DSS

IMPLEMENTACIN

PLANEAMIENTO DEL PROYECTO

VERSIONES DE
PRUEBAS

APLICACIONES BI
DESARROLLO DISEO

REQUERIMIENTOS DE INFORMACION ESTRATGICA

ANLISIS DE NEGOCIOS

Justificacin Planeamiento Anlisis de

Evaluacin del caso de negocio Evaluacin de la infraestructura Empresarial Planeamiento del proyecto Definicin de los requerimientos del proyecto Anlisis de repositorio de metadato

negocio
Anlisis de datos

Desarrollo del prototipo

Diseo
Diseo de ETL

Diseo de base de datos

Diseo de repositorio de metadato

Construccin
Desarrollo de ETL

Desarrollo de aplicaciones Data Mining

Desarrollo de repositorio de metadato

Despliegue
Implementacin Evaluacin de versin

1. ACTIVIDADES DE EVALUACIN DE CASO DE NEGOCIOS


1. Determinar las necesidades del negocio

2. Evaluacin de la solucin actual DSS

3. Evaluacin orgenes y procedimientos operacionales 5. Determinar los objetivos de las aplicaciones BI DSS

4. Evaluacin de las iniciativas BI DSS de los competidores

6. Propuesta de solucin BI DSS

7. Llevar a cabo el anlisis costo beneficio

8. Llevar a cabo la evaluacin de riesgos

9. Escribir el reporte de evaluacin

2. 01. ACTIVIDADES DE EVALUACIN DE LA INFRAESTRUCTURA TECNICA


1. Evaluacin de la plataforma existente

2. Evaluacin y seleccin de nuevos productos

3. Escribir un reporte de evaluacin de infraestructura tcnica

4. Ampliar la plataforma actual

2.02. ACTIVIDADES DE EVALUACIN DE LA

INFRAESTRUCTURA NO TECNICA
1. Evaluacin de la efectividad de los componentes de la infraestructura no tcnica 2. Escribir un reporte de evaluacin de infraestructura no tcnica 2. Mejorar la infraestructura no tcnica

3. ACTIVIDADES DE PLANEACION DEL PROYECTO


1. Determinar los requerimientos del proyecto

2. Determinar la condicin de los orgenes de archivos y base de datos

3. Determinar o revisar los costos estimados 5. Identifique los factores crticos de xito 6. Preparar el documento del proyecto

4. Revise la evaluacin de riesgo

7. Crear un plan de proyecto de alto nivel

8. Empezar el proyecto

4. ACTIVIDADES DE DEFINICION DE LOS REQUERIMIENTOS


1. Definir los requerimientos incrementar la infraestructura tcnica 2. Definir los requerimientos incrementar la infraestructura no tcnica 3. Definir los requerimiento de reportes 4. Definir los requerimientos de origen de datos

5. Revisar el alcance del proyecto

6. Ampliar el modelo lgico de datos

7. Definir los acuerdos de nivel de servicio preliminares

8. Escribir el documento de requerimiento de aplicaciones

5. ACTIVIDADES DE ANALISIS DE DATOS

2. Redefinir el modelo lgico de datos

4. Ampliar el modelo lgico empresarial 6. Escribir las especificaciones de limpieza de datos

1. Anlisis de orgenes de datos externos

3. Analizar la calidad del origen de datos

5. Resolver las discrepancias de datos

6. ACTIVIDADES DE DESARROLLO DE PROTOTIPOS DE APLICACION


1. Analizar los requerimientos de acceso 5. Disear los requerimientos y consultas 4. Preparar el documento del prototipo 6. Construir el prototipo 7. Demostrar el prototipo

2. Determinar el alcance del prototipo

3. Seleccionar las herramientas para el prototipo

7. ACTIVIDADES DE ANALISIS DE REPOSITORIO DE META DATOS


1. Analizar los requerimientos de repositorio de metadatos

2. Analizar requerimientos de interfaces para repositorio de metadatos

4. Crear un meta modelo lgico

5. Crear el meta-meta dato

3. Analizar los accesos de repositorio de metadatos y requerimientos de reportes

8. ACTIVIDADES DE DISEO DE BASE DE DATOS


1. Revisar los requerimientos de acceso a datos 2. Determinar los requerimientos de agregaciones y resmenes

3. Disear la base de datos destino

4. Disear la infraestructura fsica de base de datos

5. Construir la base de datos destino 6. Desarrollar los procedimientos de mantenimiento de base de datos 7. Prepararse para monitorear y afinar el diseo de base de datos 8. Prepararse para monitorear y afinar el diseo de consultas

9. ACTIVIDADES DE DISEO DE ETL

1. Crear documento de mapeo de origendestino

4. Disear los programas ETL

3. Disear los flujos de procesos ETL

2. Testear las funciones de las Herramientas ETL

6. Configurar la rea Stage para ETL

10. ACTIVIDADES DE DISEO DE REPOSITORIO DE METADATOS


1. Disear base de datos de repositorio de metadatos

4. Disear aplicacin de metadatos

O R

2. Instalar y probar el producto de repositorio de metadatos

3. Disear proceso de migracin de metadatos

11. ACTIVIDADES DE DESARROLLO DE ETL

4. Crear el meta-meta dato

1. Analizar los requerimientos de repositorio de metadatos

2. Analizar requerimientos de interfaces para repositorio de metadatos

3. Crear un meta modelo lgico 5. Analizar los accesos de repositorio de metadatos y requerimientos de reportes

12. ACTIVIDADES DE DESARROLLO DE APLICACIONES

1. Determinar los requerimientos finales del proyecto

4. Probar los programas de aplicacin

3. Construir y probar los programas de aplicacin

2. Disear los programas de aplicacin

5. Proveer acceso a datos y analizar entrenamiento

13. ACTIVIDADES DE MINERIA DE DATOS


1. Establecer los problemas de negocio 3. Consolidad y limpiar datos

2. Coleccionar datos

4. Preparar datos

5. Construir modelo de anlisis de datos

6. Interpreatr los resultados de la minera de datos 8. Monitorear anlisis de modelo de datos sobre tiempo

7. Llevar a cabo validacin externa de resultados

14. ACTIVIDADES DE DESARROLLO DE REPOSITORIO DE METADATOS


2. Determinar el alcance del prototipo 1. Analizar los requerimientos de acceso 3. Seleccionar las herramientas para el prototipo 4. Preparar el documento del prototipo 5. Disear los requerimientos y consultas

6. Construir el prototipo

15. ACTIVIDADES IMPLEMENTACION


1. Plan de implementacin

2. Configurar el ambiente de produccin 3. Instalar todos los componentes de aplicacin BI 5. Cargar las base de datos de produccin 4. Configurar el programa de produccin

6. Preparar para soporte continuo

16. ACTIVIDADES DE EVALUACIN DE VERSIN

1. Prepararse para la revisin postimplementacin 3. Conducir la reunin de revisin postimplementacin 2. Organizar la reunin de revisin postimplementacin 4. Dar seguimiento a la revisin post_implementacin

Potrebbero piacerti anche