Sei sulla pagina 1di 24

Los futuros desafos de la Inteligencia de Negocios

Richard Weber Departamento de Ingeniera Industrial Universidad de Chile rweber@dii.uchile.cl

El Vrtigo de la Inteligencia de Negocios


Data Warehouse / Data Mart

CRM: Customer Relationship Management (Gestin de la relacin con el cliente)

OLAP: Online Analytical Processing

CMR: ???

Inteligencia de Negocios (Business Intelligence)

Data Mining: Minera de datos

Knowledge Management Balanced Scorecard Inteligencia Artificial

KPI: Key Performance Indicators

Business Intelligence Definicin


Business Intelligence The term Business Intelligence (BI) represents the tools and systems that play a key role in the strategic planning process of the corporation. These systems allow a company to gather, store, access and analyze corporate data to aid in decision-making. Generally these systems will illustrate business intelligence in the areas of customer profiling, customer support, market research, market segmentation, product profitability, statistical analysis, and inventory and distribution analysis to name a few. http://www.webopedia.com/TERM/B/Business_Intelligence.html

Llamamos Inteligencia empresarial o Inteligencia de negocios (business intelligence, BI) al conjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anlisis de datos existentes en una organizacin o empresa. http://es.wikipedia.org/wiki/Inteligencia_de_negocios

Proceso de KDD Knowledge Discovery in Databases

Transformacin Preprocesamiento

Data Mining

Seleccin
Datos preprocesados

Patrones Datos transformados

Datos

Datos seleccionados

Interpretacin y Evaluacin

KDD es el proceso no-trivial de identificar patrones previamente desconocidos, vlidos, nuevos, potencialmente tiles y comprensibles dentro de los datos

Futuros Desafos

Metodolgico: 1. Distintos formatos de datos (text mining, video mining, ) 2. Data Mining dinmico Seguimiento de los Modelos 3. Combinacin con Teora de Juegos

Organizacional: 1. Gestin del Cambio (Change Management) 2. Rediseo de Procesos (BPM)

Metodologa de Procesamiento de los Textos 1/10

1. Limpieza de los textos 2. Stemming, es decir reducir palabras a su raiz 3. Creacin de matriz Opinin x Palabra 4. Determinacin de los pesos de cada palabra en cada opinin (TF*IDF) 5. Representacin de cada opinin por un vector de palabras 6. Agrupamiento (clustering) de opiniones en base a los vectores de palabras 7. Extraccin de grupos (clusters) de opiniones 8. Identificacin de opiniones originales que pertenecen a cada cluster 9. Interpretacin semntica de los textos pertenecientes a cada opinin original

Metodologa de Procesamiento de los Textos 2/10

1. Limpieza de los textos Eliminar palabras poco relevantes: Por ejemplo: y, o, la, el, uno, un, una, que, muy, Aplicacin de sinnimos: Por ejemplo: hijo, hijos, hija, hijas, nio, nios, nia, nias -> nio

Metodologa de Procesamiento de los Textos 3/10

2. Stemming, es decir reducir palabras a su raiz

Por ejemplo: Reducir las palabras como, comi, comida, a su raiz COMER

Metodologa de Procesamiento de los Textos 4/10

3. Creacin de matriz Opinin x Palabra


Calidad Opinin 1: II_Apoderados1.txt Opinin 2: II_Apoderados2.txt Opinin 3: II_Apoderados3.txt 0 1 1 Formacin 1 1 0 1 0 0 1 0 1 0 1 1 0 1 0

Metodologa de Procesamiento de los Textos 5/10

4. Determinacin de los pesos de cada palabra en cada opinin (TF*IDF)

TF*IDF: Text Frequency * Inverse Document Frequency El peso de una palabra en un documento (aqu: opinin) es igual a su frecuencia en el texto entero multiplicado por la inversa de la frecuencia en el documento (opinin). Pesoi,j = peso de palabra i en documento j

Metodologa de Procesamiento de los Textos 6/10

5. Representacin de cada opinin por un vector de palabras

Opinin 1: II_Apoderados1.txt

0.8

0.1

0.8

Pasos 1. 5.: Del texto real al modelo

Metodologa de Procesamiento de los Textos 7/10

6. Agrupamiento (clustering) de opiniones en base a los vectores de palabras Cada cluster contiene vectores similares (Homogeneidad dentro de los clusters). Vectores de distintos clusters son diferentes (Heterogeneidad entre los clusters). Tcnicas para encontrar clusters: K-medias (estadstica), Self-organizing feature maps de Kohonen (redes neuronales),

Comparando documentos

En su notacin vectorial, las opiniones se pueden comparar.

oi (m1i ,..., mRi )


R

o j (m1 j ,..., mRj )

dp (oi , o j ) = cos =

mki mkj
k =1 R R

oi
( mkj ) 2

k =1

( mki )

k =1

oj

Metodologa de Procesamiento de los Textos 8/10

7. Extraccin de grupos (clusters) de opiniones


14 12 10 8 6 Frecuencia del 4 2 ganador 0 0

2 1 3 4 5

10

12

10 12

Mapa de Kohonen

aqu: 5 clusters

Metodologa de Procesamiento de los Textos 9/10

8. Identificacin de opiniones originales que pertenecen a cada cluster


Por ejemplo: Cluster 1 en Antofagasta contiene las siguientes 8 opiniones: II_Director9.txt, II_Apoderados22.txt, II_CentroApoderados12.txt, II_CentroApoderados56.txt, II_CentroApoderados80.txt, II_CentroApoderados85.txt, II_CentroApoderados92.txt, II_Consejero1.txt

Pasos 6. 8.: Aplicacin del modelo, aqu: clustering de opiniones

Metodologa de Procesamiento de los Textos 10/10

9. Interpretacin semntica de las opiniones originales pertenecientes a cada cluster

Paso 9.: Paso inverso: Del modelo al texto real.

Data Mining Dinmico

Clustering: Descripcin de objetos: Estructura de clases: Conjunto de atributos: valores actuales - trayectorias fija - variable con el tiempo fijo - variable con el tiempo

Clasificacin: Clasificacin de data streams Clasificacin dinmica

Data Mining Dinmico

Descripcin de objetos: valores actuales - trayectorias


Atributo 2 Atributo 2

Atributo 1 Situacin esttica

Atributo 1 Situacin dinmica

Data Mining Dinmico

Estructura de clases:
Atributo 2

fija - variable con el tiempo


Atributo 2

Atributo 1 Situacin en tiempo t

Atributo 1 Situacin en tiempo t+1

Data Mining y Teora de Juegos


Datos Modelo

Data Mining

Teora de Juegos

Clientes

Cmo se comportan los clientes?

Cmo se deben comportar los clientes?

Bravo, C., Weber, R. (2007): Modelo de Tarificacin en Base a SVMs y Juegos Repetidos. Congreso ptima 2007, Puerto Montt, 21-23 de noviembre de 2007

Gestin del Cambio (Change Management) Change management is the process of developing a planned approach to change in an organization. (http://en.wikipedia.org/wiki/Change_management) www.change-management.com/

Capacitacin de los profesionales involucrados. Siempre lo hemos hecho as! Nunca lo hemos hecho as. Los dems tambin lo hacen as!

Rediseo de Procesos (BPM)

BPM: Disciplina empresarial cuyo objetivo es mejorar la eficiencia a travs de la gestin sistemtica de los procesos de negocio (BPR), que se deben modelar, automatizar, integrar, monitorizar y optimizar de forma continua. http://es.wikipedia.org/wiki/Business_Process_Management

Integracin de los modelos analticos a los procesos de negocio.

Ms informacin
Escuela de Verano Latinoamericana en Inteligencia Computacional" EVIC 2008 15-17 de diciembre de 2008, Universidad de Chile, Santiago

Diplomado Inteligencia de Negocios DEA, Universidad de Chile http://www.dii.uchile.cl/educacion_continua/ 7 de julio al 15 de octubre de 2008. Portal de Knowledge Discovery: www.kdnuggets.com

Portal de Inteligencia de Negocios: www.businessintelligence.com

Los futuros desafos de la Inteligencia de Negocios


Richard Weber Departamento de Ingeniera Industrial Universidad de Chile rweber@dii.uchile.cl

Potrebbero piacerti anche