Sei sulla pagina 1di 26

COMPUTACIN E INFORMTICA

INTELIGENCIA DE NEGOCIOS

COMPUTACIN E INFORMTICA

INTELIGENCIA DE NEGOCIOS

APLICACIN DE LAS HERRAMIENTAS Y TCNICAS DE INTELIGENCIA DE NEGOCIOS


MINERA DE DATOS (DATA MINING)
2

DATA MINING INTRODUCCIN

La revolucin informtica, la acumulacin cada vez mayor de informacin y el desarrollo de mtodos estadsticos avanzados para el anlisis de dicha informacin son el escenario en que surge el Data Mining.

DATA MINING MINERA DE DATOS

Data Mining, es el proceso de extraccin no trivial de informacin implcita, previamente desconocida y potencialmente til.
Tambin referenciado como Descubrimiento del Conocimiento en Bases de Datos (Knowledge Discovery in Databases o KDD).

Knowledge Discovery Process


Integration Interpretation & Evaluation Knowledge

Knowledge
__ __ __ __ __ __ __ __ __

Patterns and Rules

Understanding

Database

Transformed Data Target Data

Tipos de Data Mining

Como proceso de identificacin de patrones vlidos, y potencialmente tiles (Data Mining), se tienen los siguientes tipos de Data Mining: Modelamiento Predictivo. Clustering. TextMining. WebMinig. Sistemas de Recomendacin.

MINERA DE DATOS (DATA MINING)


Modelamiento Predictivo: - Quizs el rea de mayor desarrollo dentro de Data Mining son los algoritmos que buscan patrones histricos para predecir el futuro.

Clustering. - Esta tcnica consiste en encontrar grupos (clusters) de datos segn su grado de semejanza. Una aplicacin clsica es la de Segmentacin de Clientes.
TextMining: - Difiere del modelamiento predictivo por estar enfocado al procesamiento de documentos de texto.
7

MINERA DE DATOS (DATA MINING)

WebMining. - Ya sea para extraer informacin de manera automtica de la web (web crawling) o para detectar patrones sobre el comportamiento de los usuarios en su pgina web.
Sistemas de Recomendacin: - Sugieren a los usuario cosas que les podran interesar en base a patrones detectados a partir de su comportamiento histrico.

MINERA DE DATOS (DATA MINING)


Las herramientas del DATA MINING sirven para:
Predecir futuras tendencias y comportamientos, permitiendo en los negocios tomar decisiones proactivas y conducidas por un conocimiento acabado de la informacin. Exploran las BD en busca de patrones ocultos, encontrando informacin predecible que un experto no puede llegar a encontrar porque se encuentra fuera de su alcance.

MINERA DE DATOS (DATA MINING)

Analizar BD masivas para brindar respuesta a preguntas tales como:

Cules son las prioridades y tendencias de los clientes?. Quines son los ms rentables? Cmo pueden atraer ms clientes como ellos? Cmo determina que clientes adquirir y retener?.

10

Casos de Dataming: Los paales y las cervezas

Los viernes por la tarde, los hombres entre 25 y 35 aos que compraban cerveza tambin compraban paales.

Wal-Mart utiliz este resultado para reubicar estos productos en lugares estratgicamente dispuestos: pusieron la cerveza cerca de los paales.
16.000 de los 40.000 clientes que compraron paales tambin compraron cerveza (40%)
11

Fases de un proyecto de DATA MINING

Los pasos a seguir para la realizacin de un proyecto de minera de datos son siempre los mismos, independientemente de la tcnica especfica de extraccin de conocimiento usada: 1. 2. 3. 4. Determinacin de los objetivos. Preprocesamiento de los datos. Determinacin del modelo. Anlisis de los resultados.

12

MINERA DE DATOS (DATA MINING)

1. Determinacin de los objetivos. Trata de la delimitacin de los objetivos que el cliente desea bajo la orientacin del especialista en data mining.

13

MINERA DE DATOS (DATA MINING)

2. Preprocesamiento de los datos. Se refiere a la seleccin, la limpieza, el enriquecimiento, la reduccin y la transformacin de las bases de datos. Esta etapa consume generalmente alrededor del setenta por ciento del tiempo total de un proyecto de data mining.

14

MINERA DE DATOS (DATA MINING)

3. Determinacin del modelo. Se comienza realizando unos anlisis estadsticos de los datos, y despus se lleva a cabo una visualizacin grfica de los mismos para tener una primera aproximacin. Segn los objetivos planteados y la tarea que debe llevarse a cabo, pueden utilizarse algoritmos desarrollados en diferentes reas de la Inteligencia Artificial.

15

MINERA DE DATOS (DATA MINING)

4. Anlisis de los resultados. Verifica si los resultados obtenidos son coherentes y los coteja con los obtenidos por los anlisis estadsticos y de visualizacin grfica. El cliente determina si son novedosos y si le aportan un nuevo conocimiento que le permita considerar sus decisiones.

16

MINERA DE DATOS (DATA MINING)

17

MINERA DE DATOS (DATA MINING)

Tcnicas del Data Mining


Estadsticas Clustering Tcnicas de Clusterizacin Redes Neuronales rbol de Decisin

TCNICAS DEL DATA MINING

Estadsticas
tiles en descripcin y visualizacin simple de datos.
Test de hiptesis: Max, min, medias, sigma, frecuencias, .

Histogramas 2D
Bsqueda de correlaciones Regresiones lineales

Dificultades en Relaciones no lineales entre variables Distribuciones no gaussianas

TCNICAS DEL DATA MINING Clustering Tcnicas de Clusterizacin


Todas ellas agrupan los clientes pero con distintos mtodos y criterios Las tcnicas ms usadas son: Clsicas: Se agregan registros hasta llegar al nmero de grupos deseados o a la distancia mnima Redes neuronales F Kohonen. Mtodo: el ganador se lo lleva todo F Neural-Gas. Simula un gas formado de molculas

20

TCNICAS DEL DATA MINING

Redes Neuronales
Inspiradas en la estructura neuronal biolgica

Qu son? Grupo de neuronas (unidad bsica de procesamiento) interconectadas con distinta influencia mutua (peso). Aprenden a partir de ejemplos, como nosotros!!!!! Memoria, basada en los pesos
21

TCNICAS DEL DATA MINING

Redes Neuronales

Si datos histricos datos salida

aprender

22

TCNICAS DEL DATA MINING

Redes Neuronales
Son extremadamente tiles en: Clasificacin Objetivo: aprender la relacin Datos histricos si(=1), no(=0) Para nuevos clientes Datos nuevo cliente nmero entre 0 y 1 Es la probabilidad de que este cliente nos diga s Esta probabilidad junto a una estimacin de beneficios nos permitir decidir como actuar Son muy tiles en Estimacin Prediccin

23

TCNICAS DEL DATA MINING

Arboles de Decisin
Herramientas muy populares para clasificacin Atractivo: Sus resultados pueden expresarse mediante reglas ejecutables directamente en SQL Problemas: El nmero de reglas generalmente es enorme Son superadas por las redes (prediccin)

24

TCNICAS DEL DATA MINING

Arboles de Decisin
Cada rama se divide en otras para disminuir la diversidad. Diversidad: como ms baja es, indica predominio de una clase

El proceso termina por criterios de ganancia de informacin, entropa,...


25

Msica: Se escribe de forma extraa pero ilumina la vida Data Mining Se escribe de forma extraa pero ilumina el negocio"

27

Potrebbero piacerti anche