Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTELIGENCIA DE NEGOCIOS
COMPUTACIN E INFORMTICA
INTELIGENCIA DE NEGOCIOS
La revolucin informtica, la acumulacin cada vez mayor de informacin y el desarrollo de mtodos estadsticos avanzados para el anlisis de dicha informacin son el escenario en que surge el Data Mining.
Data Mining, es el proceso de extraccin no trivial de informacin implcita, previamente desconocida y potencialmente til.
Tambin referenciado como Descubrimiento del Conocimiento en Bases de Datos (Knowledge Discovery in Databases o KDD).
Knowledge
__ __ __ __ __ __ __ __ __
Understanding
Database
Como proceso de identificacin de patrones vlidos, y potencialmente tiles (Data Mining), se tienen los siguientes tipos de Data Mining: Modelamiento Predictivo. Clustering. TextMining. WebMinig. Sistemas de Recomendacin.
Clustering. - Esta tcnica consiste en encontrar grupos (clusters) de datos segn su grado de semejanza. Una aplicacin clsica es la de Segmentacin de Clientes.
TextMining: - Difiere del modelamiento predictivo por estar enfocado al procesamiento de documentos de texto.
7
WebMining. - Ya sea para extraer informacin de manera automtica de la web (web crawling) o para detectar patrones sobre el comportamiento de los usuarios en su pgina web.
Sistemas de Recomendacin: - Sugieren a los usuario cosas que les podran interesar en base a patrones detectados a partir de su comportamiento histrico.
Cules son las prioridades y tendencias de los clientes?. Quines son los ms rentables? Cmo pueden atraer ms clientes como ellos? Cmo determina que clientes adquirir y retener?.
10
Los viernes por la tarde, los hombres entre 25 y 35 aos que compraban cerveza tambin compraban paales.
Wal-Mart utiliz este resultado para reubicar estos productos en lugares estratgicamente dispuestos: pusieron la cerveza cerca de los paales.
16.000 de los 40.000 clientes que compraron paales tambin compraron cerveza (40%)
11
Los pasos a seguir para la realizacin de un proyecto de minera de datos son siempre los mismos, independientemente de la tcnica especfica de extraccin de conocimiento usada: 1. 2. 3. 4. Determinacin de los objetivos. Preprocesamiento de los datos. Determinacin del modelo. Anlisis de los resultados.
12
1. Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en data mining.
13
2. Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.
14
3. Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.
15
4. Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.
16
17
Estadsticas
tiles en descripcin y visualizacin simple de datos.
Test de hiptesis: Max, min, medias, sigma, frecuencias, .
Histogramas 2D
Bsqueda de correlaciones Regresiones lineales
20
Redes Neuronales
Inspiradas en la estructura neuronal biolgica
Qu son? Grupo de neuronas (unidad bsica de procesamiento) interconectadas con distinta influencia mutua (peso). Aprenden a partir de ejemplos, como nosotros!!!!! Memoria, basada en los pesos
21
Redes Neuronales
aprender
22
Redes Neuronales
Son extremadamente tiles en: Clasificacin Objetivo: aprender la relacin Datos histricos si(=1), no(=0) Para nuevos clientes Datos nuevo cliente nmero entre 0 y 1 Es la probabilidad de que este cliente nos diga s Esta probabilidad junto a una estimacin de beneficios nos permitir decidir como actuar Son muy tiles en Estimacin Prediccin
23
Arboles de Decisin
Herramientas muy populares para clasificacin Atractivo: Sus resultados pueden expresarse mediante reglas ejecutables directamente en SQL Problemas: El nmero de reglas generalmente es enorme Son superadas por las redes (prediccin)
24
Arboles de Decisin
Cada rama se divide en otras para disminuir la diversidad. Diversidad: como ms baja es, indica predominio de una clase
Msica: Se escribe de forma extraa pero ilumina la vida Data Mining Se escribe de forma extraa pero ilumina el negocio"
27