Sei sulla pagina 1di 25

Módulo 3

Unidad 3
Inteligencia de Negocios (BI)
Almacenamiento y extracción de
Datos (DWH)
Minería de Datos (DM)

Materia: MARKETING II
Profesor: Marcelo E. Ulla
3. Inteligencia de Negocios
(BI: Business Intelligence)
Quienes tienen la responsabilidad de conducir las organizaciones,
habitualmente deben tomar decisiones que pueden afectar el
rumbo de las mismas.

En esas circunstancias pueden decidir en función de sus propias


experiencias o del conocimiento y referencias de situaciones
similares vividas por otras empresas; esto puede conducir a
elecciones intuitivas, que en muchos casos pueden estar teñidas
de subjetividad.

La complejidad y competitividad del actual ambiente de negocios


y los permanentes cambios a los que las compañías deben
adaptarse hacen poco adecuado a este abordaje. Por lo cual, han
surgido sistemas informativos que, a partir de los datos
almacenados en el historial de registros de las empresas,
colaboran en el proceso de toma de decisiones empresariales,
para que el mismo esté basado en la información que se encuentra
allí contenida.

La Inteligencia de Negocios (en inglés Business Intelligence-BI)


comenzó a conocerse en el año 1996 a partir de un reporte
generado por la consultora internacional Gartner Group.

Una plataforma de BI comprende herramientas de consulta,


análisis y reporte de la información contenida en las cifras y datos
empresariales.

3.1. La toma de decisiones: Concepto


Si bien todos tenemos que tomar decisiones en nuestras vidas, algunas
situaciones tienen un nivel de importancia que justifica la aplicación de un
proceso específico que nos ayude a identificar y seleccionar las mejores
alternativas posibles.

En las organizaciones, los niveles directivos y gerenciales tienen una alta


responsabilidad en las decisiones que toman, ya que algunas de ellas
pueden definir la continuidad o no de las mismas. Incluso, algunos gerentes
llegan a expresar que “tomar decisiones” es su principal actividad en la
empresa.

Marketing II – Marcelo Ulla | 2


El elemento central en la toma de cualquier decisión es la “elección de la
mejor opción”, pero antes de llegar a dicha instancia es necesario identificar
y calificar adecuadamente las alternativas posibles; y es justamente allí
donde las estrategias y herramientas de la Inteligencia de negocios hacen su
principal aporte.

¿Qué se reconoce como Toma de Decisiones?

Al proceso de elegir entre cursos de acción alternativos con el


propósito de lograr una meta determinada o resolver algún
problema específico del negocio.

La información en el proceso de toma de decisiones

La información es el componente más importante del proceso, ya que


permite:

 Identificar situaciones problemáticas y oportunidades.

 Plantear alternativas viables que solucionen el problema.

 Comprobar el grado de satisfacción de las soluciones

Marketing II – Marcelo Ulla | 3


3.2. Inteligencia de Negocios (BI)
Business Intelligence reúne enormes cantidades de datos, los consolida
y organiza para tomar decisiones con la menor incertidumbre posible y
bajo ambientes controlados; de manera de obtener una ventaja
estratégica con respecto a la competencia.

Coloca la información correcta en las manos del usuario correcto, en


tiempo, forma y con la calidad deseada para soportar el proceso de toma
de decisiones.

¿Qué se entiende por Inteligencia de negocios?

Consiste en la aplicación de procesos, técnicas y


herramientas de alta tecnología para poner a disposición de
todos los niveles de la organización la capacidad de acceder a
información precisa y relevante, y de explotarla para lograr
ventajas competitivas.

Business Intelligence busca la manera de brindar herramientas que


permitan tomar mejores decisiones, de manera más fácil, más efectiva y
más rápidamente, permitiendo a las empresas ser proactivas y no reactivas.

¿Cuál es el objetivo de la Inteligencia de Negocios?

El objetivo principal de una solución de Business Intelligence es utilizar la


información como una política de negocio y como un diferenciador
estratégico. Utilizarla para llegar allí donde nadie llega, anticiparse a los
cambios, conocer las causas de los acontecimientos y tomar acciones
preventivas y correctivas.

¿Qué podemos conocer con B.I?

• Qué están comprando nuestros clientes y qué no.

• Cuáles son los incentivos que han funcionado en el pasado en esta


misma época del año.

• Qué producto en proporción arroja los mejores beneficios.

• Cuáles son las características de los clientes fraudulentos.

• Qué está haciendo la competencia y cómo influye en los clientes.

• Cómo se comparan los costos por línea de productos en los últimos


tres años.

Marketing II – Marcelo Ulla | 4


• Qué factores provocan incrementos de costos.

• Cómo afectan los incrementos en los márgenes de utilidad.

• Cuáles son los mejores clientes y a quiénes no conviene venderles.

• Cuál es el comportamiento del recupero de cobros en el último año


comparado con años anteriores.

• Qué pasaría si se bajara el precio de venta del principal producto.

• Qué factores influyen en la caída en mora de un buen cliente.

• Cuál es el límite de crédito que debería otorgar a los clientes.

• Qué tiempo en promedio hay que esperar para que un cliente


levante su deuda.

• Cómo se debe clasificar a los clientes de acuerdo a su patrón de


compra y qué grupos requieren mayor atención.

• Cómo detectar con anticipación la posible pérdida de un cliente en


base a su patrón de compra.

¿Cuáles son los principales componentes de una plataforma de


B.I?

Las herramientas de inteligencia de negocios es un tipo de software de


aplicaciones diseñado para colaborar con la inteligencia de negocios (BI) en
los procesos de las organizaciones. Específicamente se trata de
herramientas que asisten el análisis y la presentación de los datos.

Marketing II – Marcelo Ulla | 5


3.3. Almacén de Bases de Datos
(Datawarehouse - DWH)
El Almacén de Bases de Datos (en inglés Datawarehouse - DWH) es el lugar
en donde se depositan los datos historiados de la organización, el cual se
caracteriza por centralizar los datos corporativos, reuniendo en un único
sitio los datos –previamente depurados- provenientes de diferentes fuentes
y/o sistemas. De esta forma, facilita la extracción, el agrupamiento y el
análisis de información significativa para el proceso de toma de decisiones.

El DWH es el corazón de una solución de BI, y su principal ventaja radica


en su capacidad de integrar y procesar enormes cantidades de datos,
posibilitan la generación de modelos y/o cubos que facilitan el posterior
procesamiento de los mismos; siempre en un entorno independiente de los
sistemas operacional (ERP), lo cual facilita la consulta y acelera el
procesamiento de los mismos.

Como referencia histórica, podemos comentar que el concepto y definición


de DWH fue introducido por Bill Inmon.

¿Qué es un Datawarehouse? Según W.H. Inmon1

Es un repositorio de datos:

Específicos / Integrados / Históricos / No volátiles

que brindan soporte tecnológico al proceso de toma de decisiones.

Considerando la anterior definición, a continuación vamos a analizar qué


significan cada una de sus características:

Específicos: hace referencia a que el DWH está destinado a un fin


bien determinado: “colaborar en el proceso de toma de decisiones.”

Integrados: indica que deben vincularse de manera consistente


los datos almacenados, ya que la existencia de inconsistencias puede
llevarnos a decisiones equivocadas. Por otra parte, la información
puede agruparse en distintos niveles de agregación o detalle, lo cual
posibilita una mejor adaptación a los roles y necesidades de los
diferentes usuarios.

1 Fuente: DW: definiciones de Inmon y Kimball.


[http://informationmanagement.wordpress.com/2006/11/28/dw-definiciones-de-
inmon-y-kimball/] (Publicada 28/11/2006)

Marketing II – Marcelo Ulla | 6


Históricos: el eje del tiempo es el hilo conductor del DWH. La
cronología de los eventos, la secuencia de cifras y datos son los
pilares fundamentales de la estructura de un DWH. Ello permite
que podamos medir la evolución de lo que estemos observando y
detectar tendencias.

No volátil: es una condición excluyente que no se modifique


ningún dato almacenado en el DWH, se pueden combinar, sumar
restar, etc., pero nunca se deben cambiar o eliminar. Esta condición
hace que la información allí contenida sea permanente, pudiendo
agregarse nuevos elementos pero sin alterar los que ya existían.

Los Metadatos: básicamente son los “datos sobre los datos”.

Mediante ellos, es posible tener una clara definición de los mismos, conocer
de dónde provienen, identificar su frecuencia de actualización, conocer
quién es el responsable de su extracción, entre otras cosas, facilitando la
transferencia de la información desde los sistemas transaccionales (ERP) al
DWH.

3.4. Datamart
Básicamente, un Datamart es una simplificación o subconjunto del DWH
diseñada específicamente para ser utilizada por un área funcional o
departamento especializado de la organización.

Se destaca por una orientación bien definida que facilita la administración


de la información, ya que contiene una adecuada selección de los datos que
en se incluyen en su formulación y definen su estructura.

A título de ejemplo podemos citar el Datamart de Marketing y Ventas, el


Datamart de Finanzas, el Datamart de Producción o el de Logística, entre
otros.

Dentro de los tipos de Datamart que existen, podemos destacar los Cubos
OLAP, los cuales se conforman según los requisitos y las características
definidas por los usuarios de cada área o departamento.

En general, podemos destacar las siguientes ventajas que presentan los


Datamart:

 Menor volumen de datos


 Consultas más simples y rápidas.
 Validación directa de la información
 Facilidad para la historización de los datos

3.5. Data Warehousing

Marketing II – Marcelo Ulla | 7


Es una colección de información corporativa, derivada directamente de los
sistemas operacionales y/o de algunos orígenes de datos externos, cuyo
objetivo es servir a los propósitos del análisis y descubrimiento de
información clave para la toma de decisión. Es actualizado mediante
procesos complejos de transformación y está organizado por áreas de
interés.

¿Qué se entiende por Data Warehousing?

 Es una colección de datos orientados a una materia,


integrados, no volátiles e historiados; organizados
para el apoyo del proceso de toma de decisión.

Es una técnica para reunir y administrar datos de varias


fuentes con el fin de obtener una visión única y detallada de
una parte o de todo un negocio o actividad comercial.

La clave es utilizar la información que ha reunido una organización durante


sus ciclos de operaciones para ayudarle a reaccionar mejor, más elegante,
rápida y eficientemente. Organizar la información de manera que ésta
pueda ser utilizada como una ventaja estratégica frente a la competencia

DWH: características

• Brinda un sitio central donde buscar información.

• Brinda flexibilidad para la confección de reportes.

• Brinda flexibilidad de presentación de datos.

• Brinda documentación sobre conceptos del negocio.

• Provee los recursos necesarios para que cada persona de la


organización tenga a su disposición la información que necesita en
su actividad diaria.

• Ayuda a generar conocimiento a partir del mar de información con


el que cuentan las empresas.

• Permite mejorar los canales de comunicación internos.

• Es el eje central de una solución de Business Intelligence.

• Integra información de diversas áreas o sectores.

• Contiene información actual e histórica.

• Está orientado al sujeto y no al proceso.

• Sirve para manejar grandes volúmenes de datos

• La información ingresada no varía en el tiempo.

Marketing II – Marcelo Ulla | 8


• Todos sus esfuerzos están focalizados en las necesidades de
información estratégica.

Ventajas e inconvenientes de los almacenes de datos

Ventajas

Hay muchas ventajas por las que es recomendable utilizar un almacén de


datos. Algunas de ellas son:

 Los almacenes de datos hacen más fácil el acceso a una gran


variedad de datos a los usuarios finales

 Facilitan el funcionamiento de las aplicaciones de los sistemas de


apoyo a la decisión tales como informes de tendencia, por ejemplo:
obtener los ítems con la mayoría de las ventas en un área en
particular dentro de los últimos dos años; informes de excepción,
informes que muestran los resultados reales frente a los objetivos
planteados a priori.

 Los almacenes de datos pueden trabajar en conjunto y, por lo tanto,


aumentar el valor operacional de las aplicaciones empresariales, en
especial la gestión de relaciones con clientes.

Inconvenientes

Utilizar almacenes de datos también plantea algunos inconvenientes,


algunos de ellos son:

 A lo largo de su vida los almacenes de datos pueden suponer altos


costos. El almacén de datos no suele ser estático. Los costos de
mantenimiento son elevados.

 Los almacenes de datos se pueden quedar obsoletos relativamente


pronto.

 A veces, ante una petición de información éstos devuelven una


información subóptima, que también supone una pérdida para la
organización.

 A menudo existe una delgada línea entre los almacenes de datos y


los sistemas operacionales. Hay que determinar qué funcionalidades
de estos se pueden aprovechar y cuáles se deben implementar en el
data warehouse, resultaría costoso implementar operaciones no
necesarias o dejar de implementar alguna que sí vaya a necesitarse.

Dimensiones

Las dimensiones de un cubo son atributos relativos a las variables, son las
perspectivas de análisis de las variables (forman parte de la tabla de
dimensiones). Son catálogos de información complementaria necesaria
para la presentación de los datos a los usuarios, como por ejemplo:

Marketing II – Marcelo Ulla | 9


descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la
información general complementaria a cada uno de los registros de la tabla
de hechos. Las dimensiones poseen una granularidad menor, tomando
como valores un conjunto de elementos menor que el de las variables;
ejemplos de dimensiones podrían ser: “productos”, “localidades” (o zonas),
“el tiempo” (medido en días, horas, semanas, etc.).

DWH: modelo de datos

Marketing II – Marcelo Ulla | 10


Cubos de información

Los cubos de información funcionan como los cubos de rompecabezas en


los juegos, en el juego se trata de armar los colores y en el data warehouse
se trata de organizar los datos por tablas o relaciones; los primeros (el
juego) tienen 3 dimensiones, los cubos tienen un número indefinido de
dimensiones, razón por la cual también reciben el nombre de hipercubos.

Un cubo contendrá datos de una determinada variable que se desea


analizar, proporcionando una vista lógica de los datos provistos por el
sistema de información hacia el data warehouse, esta vista estará dispuesta
según unas dimensiones y podrá contener información calculada. El
análisis de los datos está basado en las dimensiones del hipercubo, por lo
tanto, se trata de un análisis multidimensional.

A la información de un cubo puede acceder el ejecutivo mediante "tablas


dinámicas" en una hoja de cálculo ó a través de programas personalizados.
Las tablas dinámicas le permiten manipular las vistas (cruces, filtrados,
organización, totales) de la información con mucha facilidad. Las diferentes
operaciones que se pueden realizar con cubos de información se producen
con mucha rapidez. Llevando estos conceptos a un data warehouse, ésta es
una colección de datos que está formada por «dimensiones» y «variables»,
entendiendo como dimensiones a aquellos elementos que participan en el
análisis y variables a los valores que se desean analizar.

Metadatos

Uno de los componentes más importantes de la arquitectura de un almacén


de datos son los metadatos. Se define comúnmente como "Informaciones
/ Datos acerca de los datos", en el sentido de que se trata de datos que
describen cuál es la estructura de los datos que se van a almacenar y cómo
se relacionan.

El metadato documenta, entre otras cosas, qué tablas existen en una base
de datos, qué columnas posee cada una de las tablas y qué tipo de datos se
pueden almacenar. Los datos son de interés para el usuario final, el
metadato es de interés para los programas que tienen que manejar estos
datos. Sin embargo, el rol que cumple el metadato en un entorno de
almacén de datos es muy diferente al rol que cumple en los ambientes
operacionales. En el ámbito de los data warehouse el metadato juega un
papel fundamental, su función consiste en recoger todas las definiciones de
la organización y el concepto de los datos en el almacén de datos.

Los Metadatos constan de los siguientes tipos de elementos:

• Ubicación y descripción de servidores, bases de datos, tablas,


nombres.
• Reglas.
• Seguridad.
• Definiciones físicas y lógicas.
• Antecedentes.

Marketing II – Marcelo Ulla | 11


• Propiedad / Gerencia.
• Criterios de envejecimiento y purga.
• Indicadores de Calidad.
• Unidades de medida.

Data Warehouse: acceso a los datos

• Programas de Aplicación.

• Generadores de Reportes.

• Planillas de cálculo.

• Herramientas de Sistemas de Soporte de Decisión (OLAP).

Funciones ETL (extracción, transformación y carga)

Los procesos de extracción, transformación y carga (ETL) son importantes


ya que son la forma en que los datos se guardan en un almacén de datos (o
en cualquier base de datos). Implican las siguientes operaciones:

 Extracción. Acción de obtener la información deseada a partir de


los datos almacenados en fuentes externas.

 Transformación. Cualquier operación realizada sobre los datos


para que puedan ser cargados en el data warehouse o se puedan
migrar de éste a otra base de datos.

 Carga. Consiste en almacenar los datos en la base de datos final,


por ejemplo el almacén de datos objetivo normal.

Query & Reporting

• Herramientas que facilitan la creación y organización de reportes y


gráficos estáticos, estadísticas básicas y creación de informes

• Herramientas y lenguajes de solicitud de datos

• Requieren conocimientos de estructuras de almacenamiento de


información

Ejemplo: SQL, Excel, MS Access

Herramientas OL AP

OLAP (ON LINE ANALYTICAL PROCESSING) es una categoría de


software que, a través de una interfaz sencilla y ágil, permite a analistas,
administradores y ejecutivos analizar datos corporativos desde diferentes

Marketing II – Marcelo Ulla | 12


puntos de vista, con niveles de granularidad y agregación variables, ya sean
datos históricos o proyecciones y mostrando los resultados en términos que
le son familiares al usuario, con el objeto de tomar decisiones.

Ejemplo: Metacube, Tableros de Indicadores y SAP

O.L.A.P.: 12 reglas

1 - Vista conceptual multidimensional.

2 - Transparencia.

3 - Accesibilidad.

4 - Performance de reportes consistente.

5 - Arquitectura Cliente/Servidor.

6 - Dimensionalidad genérica.

7 - Manejo de matriz dinámica

8 - Soporte multiusuario

9 - Operaciones entre dimensiones sin restricción

10- Manipulación de datos intuitivo

11- Reportes flexibles

12- Dimensiones y niveles de agregación ilimitados

DWH: Indicadores de Éxito

• ROI
– Se reducen los costos
– Se mejora la productividad
– Se incrementan las ganancias.

• El Data Warehouse es útil y se utiliza más


activamente.

• El proyecto se desarrolló en tiempo y forma.

• El usuario está satisfecho.

• Surgen requerimientos adicionales.

• Se cumplieron los objetivos.

• Hay herramientas para solucionar los problemas


de negocio.

Marketing II – Marcelo Ulla | 13


• Se detectan nuevas oportunidades de negocio.
Pasos del Análisis de Decisiones del DWH

Plataforma de Soporte de Decisiones

En el siguiente esquema podemos visualizar la estructura de la plataforma


que soporta el proceso de decisiones empresariales. En la base de la misma
se encuentran los tres enfoques metodológicos: Informático, Analítico (ésta
es la esencia del DWH) y Minería de datos.

En el cuerpo de la pirámide podemos ver que básicamente hay dos grandes


modalidades: Verificación y Descubrimiento.

Marketing II – Marcelo Ulla | 14


3.6. Los Sistemas de Producción
(OLTP)
Los sistemas OLTP (On-Line Transaction Proccesing) son sistemas
construidos para soportar la operatoria diaria de una empresa. Están
diseñados para proveer una alta performance en el tratamiento de
transacciones.

Se corresponden con los típicos sistemas de Facturación, Cuenta Corriente,


Alta de Clientes, Contabilidad, Planificación, Producción, entre otros.

Los Sistemas de Producción: características

• La información se encuentra organizada por aplicación.

• La información entre las aplicaciones puede ser inconsistente.

• El acceso a los datos es complicado.

• Los datos cambian constantemente.

• Los datos poseen un nivel de detalle transaccional.

• Proveen soporte para operaciones repetitivas altamente


estructuradas.

El DWH Vs. Sistemas Operacionales

Marketing II – Marcelo Ulla | 15


3.7. Minería de Datos (Data Mining–
DM)
“El marketing se está convirtiendo en una batalla basada más
en la información que en el poder de las ventas”.2
Philip Kotler

La Minería de Datos (en inglés Data Mining - DM) a diferencia del


Datawarehousing, es la modalidad de “descubrimiento” de información
valiosa contenida de manera implícita en los datos, pero que era
desconocida por la empresa. Dicho de otra forma, el DM busca
singularidades en los datos almacenados en el DWH, tratando de encontrar
relaciones o patrones que puedan ser estratégicos para el negocio.

El DM utiliza recursos tecnológicos más complejos, entre los cuales


podemos citar a las herramientas de Inteligencia Artificial como son las
Redes Neuronales y el Análisis Estadístico.

En resumen: ¿qué se entiende por Minería de Datos?

Es el proceso de descubrir a partir de grandes volúmenes de


datos y utilizando herramientas de alta tecnología,
relaciones, patrones y tendencias desconocidas hasta el
momento y que puedan ser utilizadas para obtener una
ventaja significativa con respecto a la competencia.

Desde el P.V. del negocio:

Es el proceso de extraer información útil, válida, desconocida y


comprensible para utilizarla en la toma de decisiones.

El proceso de minería se apoya en una serie de operaciones para descubrir


el conocimiento oculto en las bases de datos, detectar desviación e
identificar oportunidades de negocio.

D.M: modalidad

Como vimos en la pirámide que soporta la plataforma de soporte de


decisiones, la minería de datos es la la modalidad de descubrimiento del
soporte de decisiones, la cual es conducida por los datos y no por el analista
empresarial.

2
Fuente: Frases de Philip Kotler. [http://www.frasesypensamientos.com.ar/frases-de-
marketing.html] (28/03/2011)

Marketing II – Marcelo Ulla | 16


Principales características de la Minería de Datos

En esencia la Minería de Datos es explorar y analizar los datos que se


encuentran en las profundidades de las bases de datos, como los almacenes
de datos, que algunas veces contienen información almacenada durante
varios años.

Las herramientas de la minería de datos ayudan a extraer el mineral de la


información enterrado en archivos corporativos o en registros públicos,
archivados. Hurgar y sacudir a menudo implica el descubrimiento de
resultados valiosos e inesperados.

• Requieren para su funcionamiento de grandes volúmenes de


información (Data Warehouse).

• Debido a la gran cantidad de datos, algunas veces resulta necesario


usar procesamiento en paralelo para la minería de datos.

• Utilizan Redes Neuronales y Algoritmos Estadísticos para el


análisis.

• El entorno de la minería de datos suele tener una arquitectura


cliente-servidor.

• El margen de error es significativamente bajo.

• Las herramientas poseen módulos especializados en la presentación


de información.

• Sirve para detectar desviaciones, analizar las causas, identificar


soluciones, prever acontecimientos y relacionar hechos.

• Por ahora su uso está orientada al usuario experto

Marketing II – Marcelo Ulla | 17


Esquema del Sistema de Descubrimiento de Conocimientos

Proceso de Minería de Datos

Un proyecto de minería de datos tiene varias fases necesarias que son,


esencialmente:

 Comprensión del negocio y del problema que se quiere resolver.


 Determinación, obtención y limpieza de los datos necesarios.
 Creación de modelos matemáticos.
 Validación, comunicación, etc. de los resultados obtenidos.
 Integración, si procede, de los resultados en un sistema
transaccional o similar.

La relación entre todas estas fases sólo es lineal sobre el papel. En realidad,
es mucho más compleja y esconde toda una jerarquía de subfases. A través
de la experiencia acumulada en proyectos de minería de datos se han ido
desarrollando metodologías que permiten gestionar esta complejidad de
una manera más o menos uniforme.

Un proceso típico de minería de datos consta de los siguientes pasos


generales:

Marketing II – Marcelo Ulla | 18


Selección del conjunto de datos, tanto en lo que se refiere a las
variables objetivo (aquellas que se quiere predecir, calcular o inferir), como
a las variables independientes (las que sirven para hacer el cálculo o
proceso), como posiblemente al muestreo de los registros disponibles.

Análisis de las propiedades de los datos, en especial los histogramas,


diagramas de dispersión, presencia de valores atípicos y ausencia de datos
(valores nulos).

Transformación del conjunto de datos de entrada, se realizará de


diversas formas en función del análisis previo, con el objetivo de prepararlo
para aplicar la técnica de minería de datos que mejor se adapte a los datos y
al problema, a este paso también se le conoce como preprocesamiento de
los datos.

Seleccionar y aplicar la técnica de minería de datos, se construye el


modelo predictivo, de clasificación o segmentación.

Extracción de conocimiento, mediante una técnica de minería de datos,


se obtiene un modelo de conocimiento, que representa patrones de
comportamiento observados en los valores de las variables del problema o
relaciones de asociación entre dichas variables. También pueden usarse
varias técnicas a la vez para generar distintos modelos, aunque
generalmente cada técnica obliga a un preprocesado diferente de los datos.

Interpretación y evaluación de datos, una vez obtenido el modelo, se


debe proceder a su validación comprobando que las conclusiones que arroja
son válidas y suficientemente satisfactorias. En el caso de haber obtenido
varios modelos mediante el uso de distintas técnicas, se deben comparar los
modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de
los modelos alcanza los resultados esperados, debe alterarse alguno de los
pasos anteriores para generar nuevos modelos.

Una vez validado el modelo, si resulta ser aceptable (proporciona salidas


adecuadas y/o con márgenes de error admisibles) éste ya está listo para su
explotación. Los modelos obtenidos por técnicas de minería de datos se
aplican incorporándolos en los sistemas de análisis de información de las
organizaciones, e incluso, en los sistemas transaccionales

Técnicas de minería de datos

Las técnicas de la minería de datos provienen de la Inteligencia artificial y


de la estadística, dichas técnicas, no son más que algoritmos, más o menos
sofisticados que se aplican sobre un conjunto de datos para obtener unos
resultados.

Las técnicas más representativas son:

Marketing II – Marcelo Ulla | 19


Regresión lineal.- Es la más utilizada para formar relaciones
entre datos. Consiste en descubrir relaciones entre variables X e Y
del tipo:

Y = aX + b donde a y b son valores reales

Rápida y eficaz pero insuficiente en espacios multidimensionales


donde puedan relacionarse más de 2 variables. Además, sólo
permite gestionar valores reales y continuos.

Árboles de decisión.- Un árbol de decisión es un modelo de


predicción utilizado en el ámbito de la inteligencia artificial, dada
una base de datos se construyen estos diagramas de construcciones
lógicas, muy similares a los sistemas de predicción basados en
reglas, que sirven para representar y categorizar una serie de
condiciones que suceden de forma sucesiva, para la resolución de un
problema.

Un árbol de decisión toma de entrada un objeto o situación descrita


por un conjunto de atributos y regresa una decisión
“verdadero/falso''.

En general pueden tener un rango más amplio que simples


funciones Booleanas, pero por simplicidad, consideremos primero
sólo éstas.

Cada nodo interno corresponde a una prueba en el valor de uno de


los atributos y las ramas están etiquetadas con los posibles valores
de la prueba. Cada hoja especifica el valor de la clase.

Marketing II – Marcelo Ulla | 20


Modelos estadísticos.- Es una expresión simbólica en forma de igualdad
o ecuación que se emplea en todos los diseños experimentales y en la
regresión para indicar los diferentes factores que modifican la variable de
respuesta.

REDES NEURONALES: es un proceso opaco (caja negra) que permite, a


partir de variables de entrada, descubrir el valor de una o más variables
distintas.

Una Red Neuronal tiene como característica poder “aprender” y aprovechar


su “experiencia” para ajustar el modelo encontrado, en función, por
ejemplo, de la llegada de nuevos elementos.

Son ideales para el modelo NO LINEAL, COMPLEJO o de DATOS


INCOMPLETOSModelos estadísticos. Es una expresión simbólica en forma
de igualdad o ecuación que se emplea en todos los diseños.

Marketing II – Marcelo Ulla | 21


Data Mining: ámbitos de Aplicación

• Entidades financieras y compañías de seguros ==> Análisis


de Riesgo.

• Marketing Directo ===> Determinar los perfiles de clientes


potenciales con mayor probabilidad de respuesta.

• Empresas de Distribución ===> Determinar perfiles de


consumidores, efectos de promociones, contenido del carrito de
compras, etc.

• Marketing Relacional ===> Ayuda a identificar los clientes


susceptibles de abandonar la empresa por un competidor (Attrition
Model).

D.M: Operaciones más habituales

• Segmentación de Base de Datos: Esta técnica indirecta permite


agrupar distintos elementos de acuerdo a las características que
éstos poseen.

Aplicación:

ARMAR GRUPOS DE CLIENTES DE ACUERDO A SUS


CARACTERÍSTICAS, A SUS HÁBITOS DE CONSUMO, A SU
PERFIL DE PAGOS.

• Predicción: Esta técnica directa permite predecir el valor que


adoptará una variable o la probabilidad que adopte uno u otro valor
en función de otras.

Aplicación

ESTIMAR, DE ACUERDO A SUS CARACTERÍSTICAS, EL


VOLUMEN ANUAL DE INGRESOS QUE PRODUCIRÁN LOS
CLIENTES.

• Clasificación: Esta técnica directa permite identificar criterios o


grupos de condiciones sobre las variables de algún elemento para la
determinación del valor de la variable objetivo.

Aplicación:

CREAR UN MODELO QUE PERMITA COMPRENDER LAS


CARACTERÍSTICAS QUE POSEEN LOS CLIENTES MÁS
IMPORTANTES.

OTRA APLICACIÓN ES LA PREDICCIÓN DE SI UN CLIENTE


PERTENECERÁ AL GRUPO DE MEJORES CLIENTOS O NO.

• Asociación: Esta técnica indirecta permite determinar relaciones


entre elementos existentes en transacciones.

Marketing II – Marcelo Ulla | 22


Aplicación:

– DE ACUERDO A CIRCUITOS DE VIAJES QUE REALIZAN LOS


CLIENTES, DETERMINAR LAS PROBABILIDADES DE QUE
UN CLIENTE QUE SE ENCUENTRA EN UNA CIUDAD VIAJE
A OTRA.

– DE ACUERDO A LOS PRODUCTOS QUE COMPRAN LOS


CLIENTES, DETERMINAR LAS PROBABILIDADES DE QUE
UN CLIENTE QUE COMPRÓ “A” COMPRE “B”.

• Patrones Secuenciales: Esta técnica indirecta permite


determinar secuencias de eventos que ocurren a lo largo del tiempo.

Aplicación:

– DETERMINAR SECUENCIAS DE VUELOS DE LOS CLIENTES


DE MANERA DE ANTICIPARSE Y OFRECER ALGÚN TIPO DE
SERVICIO ADICIONAL O ALGUN DESCUENTO PARA QUE
REALICEN TODA LA SECUENCIA EN ESTA COMPAÑÍA.

– DETERMINAR SECUENCIAS DE PAGOS DE LOS CLIENTES


PARA PODER OFRECERLES LOS PRODUCTOS CREDITICIOS
QUE ELLOS NECESITEN.

• Frecuencias de Patrones: Esta técnica indirecta permite


determinar conjuntos de operaciones que se repiten en el tiempo.

Aplicación

– DETERMINAR LA PERIODICIDAD DE VUELOS DE LOS


CLIENTES DE MANERA DE ANTICIPARSE A ELLOS ANTES QUE
CONSULTEN EN OTRAS COMPAÑÍAS O PARA OFRECERLES
ALGÚN OTRO SERVICIO.

– EN FUNCIÓN DEL HISTORIAL DE USO DE DETERMINADOS


PRODUCTOS, VER LA POSIBILIDAD DE OFRECERLE EL
INDICADO SIN NECESIDAD DE ESPERAR A QUE EL CLIENTE
LO SOLICITE.

DM: Ejemplos de aplicación empresarial

• Detección de fraudes en las tarjetas de crédito.

“En 2001, las instituciones financieras a escala mundial perdieron más de


2.000 millones de dólares estadounidenses en fraudes con tarjetas de
crédito y débito. El Falcon Fraud Manager es un sistema inteligente que
examina transacciones, propietarios de tarjetas y datos financieros para
detectar y mitigar fraudes. En un principio estaba pensado, en
instituciones financieras de Norteamérica, para detectar fraudes en
tarjetas de crédito. Sin embargo, actualmente se le han incorporado
funcionalidades de análisis en las tarjetas comerciales, de combustibles y
de débito

Marketing II – Marcelo Ulla | 23


El sistema Falcon ha permitido ahorrar más de seiscientos millones de
dólares estadounidenses cada año y protege aproximadamente más de
cuatrocientos cincuenta millones de pagos con tarjeta en todo el mundo
-aproximadamente el sesenta y cinco por ciento de todas las transacciones
con tarjeta de crédito.

• Descubriendo el porqué de la deserción de clientes de una


compañía operadora de telefonía móvil.

Este estudio fue desarrollado en una operadora española que básicamente


situó sus objetivos en dos puntos: el análisis del perfil de los clientes que se
dan de baja y la predicción del comportamiento de sus nuevos clientes. Se
analizaron los diferentes históricos de clientes que habían abandonado la
operadora (12,6%) y de clientes que continuaban con su servicio (87,4%).
También se analizaron las variables personales de cada cliente (estado
civil, edad, sexo, nacionalidad, etc.). De igual forma se estudiaron, para
cada cliente, la morosidad, la frecuencia y el horario de uso del servicio,
los descuentos y el porcentaje de llamadas locales, interprovinciales,
internacionales y gratuitas.

Al contrario de lo que se podría pensar, los clientes que abandonaban la


operadora generaban ganancias.

 Prediciendo el tamaño de las audiencias televisivas.

La British Broadcasting Corporation (BBC) del Reino Unido emplea un


sistema para predecir el tamaño de las audiencias televisivas para un
programa propuesto, así como el tiempo óptimo de exhibición (Brachman
y otros, 1996). El sistema utiliza redes neuronales y árboles de decisión
aplicados a datos históricos de la cadena para determinar los criterios que
participan según el programa que hay que presentar.

La versión final se desempeña tan bien como un experto humano con la


ventaja de que se adapta más fácilmente a los cambios porque es
constantemente reentrenada con datos actuales”.3

3
Fuente: “Dataminig: Torturando a los datos hasta que confiesen”
Autor: Luis Carlos Molina Fénix –
[http://www.uoc.edu/web/esp/art/uoc/molina1102/molina1102.html] (28/03/2011)

Marketing II – Marcelo Ulla | 24


Bibliografía Lectura 3
DataWerehousing: la integración de información para la mejor toma de
decisiones – H. Gill y P. Rao – Ed. Prentice Hall

Data Mining for marketing, sales and customer support – M. Berry y G.


Linoff – Ed. Wiley.

El Datawerehouse / El Dataminig – J. Franco y EDS – Ed. Gestión 2000.

Las Nuevas Reglas del Marketing – Frederick Newell – Ed. McGraw Hill.

Marketing de Base de Datos; Arthur Hughes Barcelona; Editorial S; 1995.

www.uesiglo21.edu.ar

Marketing II – Marcelo Ulla | 25

Potrebbero piacerti anche