Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CMR: ???
Llamamos Inteligencia empresarial o Inteligencia de negocios (business intelligence, BI) al conjunto de estrategias y herramientas enfocadas a la administracin y creacin de conocimiento mediante el anlisis de datos existentes en una organizacin o empresa. http://es.wikipedia.org/wiki/Inteligencia_de_negocios
Transformacin Preprocesamiento
Data Mining
Seleccin
Datos preprocesados
Datos
Datos seleccionados
Interpretacin y Evaluacin
KDD es el proceso no-trivial de identificar patrones previamente desconocidos, vlidos, nuevos, potencialmente tiles y comprensibles dentro de los datos
Futuros Desafos
Metodolgico: 1. Distintos formatos de datos (text mining, video mining, ) 2. Data Mining dinmico Seguimiento de los Modelos 3. Combinacin con Teora de Juegos
1. Limpieza de los textos 2. Stemming, es decir reducir palabras a su raiz 3. Creacin de matriz Opinin x Palabra 4. Determinacin de los pesos de cada palabra en cada opinin (TF*IDF) 5. Representacin de cada opinin por un vector de palabras 6. Agrupamiento (clustering) de opiniones en base a los vectores de palabras 7. Extraccin de grupos (clusters) de opiniones 8. Identificacin de opiniones originales que pertenecen a cada cluster 9. Interpretacin semntica de los textos pertenecientes a cada opinin original
1. Limpieza de los textos Eliminar palabras poco relevantes: Por ejemplo: y, o, la, el, uno, un, una, que, muy, Aplicacin de sinnimos: Por ejemplo: hijo, hijos, hija, hijas, nio, nios, nia, nias -> nio
Por ejemplo: Reducir las palabras como, comi, comida, a su raiz COMER
TF*IDF: Text Frequency * Inverse Document Frequency El peso de una palabra en un documento (aqu: opinin) es igual a su frecuencia en el texto entero multiplicado por la inversa de la frecuencia en el documento (opinin). Pesoi,j = peso de palabra i en documento j
Opinin 1: II_Apoderados1.txt
0.8
0.1
0.8
6. Agrupamiento (clustering) de opiniones en base a los vectores de palabras Cada cluster contiene vectores similares (Homogeneidad dentro de los clusters). Vectores de distintos clusters son diferentes (Heterogeneidad entre los clusters). Tcnicas para encontrar clusters: K-medias (estadstica), Self-organizing feature maps de Kohonen (redes neuronales),
Comparando documentos
dp (oi , o j ) = cos =
mki mkj
k =1 R R
oi
( mkj ) 2
k =1
( mki )
k =1
oj
2 1 3 4 5
10
12
10 12
Mapa de Kohonen
aqu: 5 clusters
Clustering: Descripcin de objetos: Estructura de clases: Conjunto de atributos: valores actuales - trayectorias fija - variable con el tiempo fijo - variable con el tiempo
Estructura de clases:
Atributo 2
Data Mining
Teora de Juegos
Clientes
Bravo, C., Weber, R. (2007): Modelo de Tarificacin en Base a SVMs y Juegos Repetidos. Congreso ptima 2007, Puerto Montt, 21-23 de noviembre de 2007
Gestin del Cambio (Change Management) Change management is the process of developing a planned approach to change in an organization. (http://en.wikipedia.org/wiki/Change_management) www.change-management.com/
Capacitacin de los profesionales involucrados. Siempre lo hemos hecho as! Nunca lo hemos hecho as. Los dems tambin lo hacen as!
BPM: Disciplina empresarial cuyo objetivo es mejorar la eficiencia a travs de la gestin sistemtica de los procesos de negocio (BPR), que se deben modelar, automatizar, integrar, monitorizar y optimizar de forma continua. http://es.wikipedia.org/wiki/Business_Process_Management
Ms informacin
Escuela de Verano Latinoamericana en Inteligencia Computacional" EVIC 2008 15-17 de diciembre de 2008, Universidad de Chile, Santiago
Diplomado Inteligencia de Negocios DEA, Universidad de Chile http://www.dii.uchile.cl/educacion_continua/ 7 de julio al 15 de octubre de 2008. Portal de Knowledge Discovery: www.kdnuggets.com