Sei sulla pagina 1di 8

EVOLUCIÓN HISTORIA DE LA MINERÍA DE DATOS

La minería de datos nació con la idea de aprovechar dos cosas: la ingente


cantidad de datos que se almacenaban en áreas como el comercio, la banca
o la sanidad, y la potencia de los nuevos ordenadores para realizar
operaciones de análisis sobre esos datos.
La idea de Minería de Datos no es nueva. Ya desde los años sesenta los
estadísticos manejaban términos como Data Fishing, Data Mining (DM) o Data
Archaeology con la idea de encontrar correlaciones sin una hipótesis previa
en bases de datos con ruido.
A principios de los años ochenta, Rakesh Agrawal, GioWiederhold, Robert Blum
y Gregory Piatetsky-Shapiro entre otros, empezaron a consolidar los términos
de Minería de Datos y KDD.
Esta tecnología ha sido un buen punto de encuentro entre personas
pertenecientes al ámbito académico y al de los negocios.
La evolución de sus herramientas en el transcurso del tiempo puede dividirse en
cuatro etapas principales:
• Colección de Datos (1960).
• Acceso de Datos (1980).
• Almacén de Datos y Apoyo a las Decisiones (principios de la década de 1990).
• Minería de Datos Inteligente. (-nales de la década de 1990).

¿QUE´ ES EL DATA MINING?
Data Mining (minería de datos) es el proceso de extracción de información
significativa de grandes bases de datos (información que revela inteligencia del
negocio) para permitir al usuario realizar predicciones que resuelven problemas
del negocio proporcionando una ventaja competitiva. Las herramientas de Data
Mining predicen las nuevas perspectivas y pronostican la situación futura de la
empresa, esto ayuda a los mismos a tomar decisiones de negocios
proactivamente.
La mayoría de compañías tienen una gran cantidad de datos almacenados en
sus ordenadores. Estos datos contienen una información que puede ser de gran
utilidad para los resultados de la empresa. La gran abundancia de datos o su
deficiente estructura puede hacer muy difícil extraer esta información útil. El
objetivo del Data Mining es la extracción de forma automática de información
relevante, útil y no evidente contenida en dichos datos. Existen tres razones
fundamentales por las cuales el Data Mining es una realidad en nuestros días:

• Avances tecnológicos en almacenamiento masivo de datos y CPU


• Existencia de nuevos algoritmos para extraer información en forma eficiente.
• Existencia de herramientas automáticas que no hacen necesario el ser un
experto en estadística, redes neuronales, o algoritmos matemáticos para
convertirse en un «DataMiner».

¿QUÉ PUEDE HACER EL DATA MINING?


Una empresa en posesión de unas bases de datos de calidad y tamaño suficiente
puede emplear el Data Mining para generar nuevas oportunidades de negocio,
dada su capacidad para proporcionar:

Predicción automática de comportamientos.


Generalmente se trata de problemas de clasificación. Como ejemplo podemos
citar el marketing dirigido. Data Mining usa los resultados de campañas de
marketing realizadas anteriormente para identificar el perfil de los clientes que
son más propensos a comprar el producto y de este modo permitirnos substituir
el correo masivo por el correo dirigido.
Predicción automática de tendencias.
Basándonos en base de datos históricas, Data Mining creara´ un modelo para
predecir las tendencias. Como ejemplos podemos citar la predicción de ventas
en el futuro o la predicción en mercados de capitales.
Descubrimiento automático de comportamientos desconocidos
anteriormente.
Las herramientas de Data Mining de visualización y clustering, permiten «ver»
nuestros datos desde una perspectiva distinta y por ello descubrir nuevas
relaciones entre ello
¿COMO HACER DE DATA MINING? TECNICAS

Todo proyecto de Data Mining se desarrolla aplicando ciertas técnicas de


especial interés en este campo. Las técnicas más utilizadas son:
Redes Neuronales. Son modelos no-lineales inspirados en las redes de
neuronas biológicas y se usan generalmente en problemas de clasificación y
predicción. Discutiremos su estructura con un poco más de detalle en los
ejemplos.
Arboles de decisión. Son estructuras en forma de árbol que representan
conjuntos de decisiones capaces de generar reglas para la clasificación de los
datos.
Algoritmos genéticos. Son modelos inspirados en la evolución de las especies
y que se aplican generalmente en problemas de optimización. Permiten incluir
fácilmente ligaduras complicadas que limitan la solución a un problema.
Clustering. Métodos de agrupación de datos que nos permiten clasificar los
datos por su similitud entre ellos. Son utilizadas con frecuencia para entender los
grupos naturales de clientes en empresas o bancos.

METODOLOGIA DE DATA MINING


Todo proyecto de Data Mining tiene unas fases bien definidas que van desde la
definición del problema hasta la ejecución y evaluación del modelo, pasando por
el estudio de los datos y la creación de dicho modelo.
APLICACIONES
Existen numerosas áreas donde la minería de datos se puede aplicar,
prácticamente en todas las actividades humanas que generen datos:
• Comercio y banca: segmentación de clientes, previsión de ventas, análisis
de riesgo.
• Medicina y Farmacia: diagnóstico de enfermedades y la efectividad de los
tratamientos.
• Seguridad y detección de fraude: reconocimiento facial, identificaciones
biométricas, accesos a redes no permitidos, etc.
• Recuperación de información no numérica: minería de texto, minería web,
búsqueda e identificación de imagen, video, voz y texto de bases de datos
multimedia.
• Astronomía: identificación de nuevas estrellas y galaxias.
• Geología, minería, agricultura y pesca: identificación de áreas de uso para
distintos cultivos o de pesca o de explotación minera en bases de datos de
imágenes de satélites.
• Ciencias Ambientales: identificación de modelos de funcionamiento de
ecosistemas naturales y/o artificiales para mejorar su observación, gestión
y/o control.
• Ciencias Sociales: Estudio de los flujos de la opinión pública. Planificación
de ciudades: identificar barrios con conflicto en función de valores
sociodemográficos, etc.

Por poner algunos ejemplos, en los negocios la minería de datos es una


disciplina que puede contribuir en la administración empresarial con respecto a
la relación con el cliente en donde permitirá el contacto específico solamente con
aquellos que presenten mayor probabilidad de responder positivamente a una
determinada oferta o promoción. En los hábitos de compra en los
supermercados, por ejemplo, se relaciona con la detección de los hábitos de
compra de los clientes en determinados días en donde se evaluará qué
productos consumen para focalizar la venta en ese punto. La minería de datos
también puede ser de utilidad para el departamento de recursos humanos de
una empresa, en donde se identificarán las características de los empleados que
presentan mayor éxito en su gestión. Esta información puede ayudar a los planes
de capacitación y de carrera de las personas que forman para de las
organizaciones.

¿DÓNDE SE USA LA MINERÍA DE DATOS?


En nuestra vida diaria se usa la Minería de Datos más a menudo de lo que
podríamos pensar, principalmente en los procesos de compra. Sin ir más lejos,
en los grandes supermercados se emplean los patrones de compra conjunta
para identificar asociaciones de productos y definir el modo en cómo se sitúa en
los diferentes pasillos y estanterías de los lineales.

EJEMPLOS DE LA MINERÍA DE DATOS

En los negocios
La minería de datos es una disciplina que puede contribuir en la administración
empresarial con respecto a la relación con el cliente en donde permitirá el
contacto específico solamente con aquellos que presenten mayor probabilidad
de responder positivamente a una determinada oferta o promoción.
Los hábitos de compra en los supermercados
Se relaciona con la detección de los hábitos de compra de los clientes en los
supermercados en determinados días en donde se evaluará que productos
consumen para focalizar la venta en ese punto.

Los fraudes
Se trata de la detección de las transacciones que provengan del blanqueo de
dinero o del fraude de las tarjetas de crédito o servicios de telefonía móvil.

Los recursos humanos


La minería de datos también puede ser de utilidad para el departamento de
recursos humanos de una empresa en donde se identificarán las características
de los empleados que presentan mayor éxito en su gestión. Esta información
puede ayudar a los planes de capacitación y de carrera de las personas que
forman para de las organizaciones.
Los Juegos
Consiste en el análisis y extracción de estrategias utilizas por las personas en
determinados juegos.

CONCLUSIÓN
Como te puedes dar cuenta, la Minería de Datos es utilizada en diferentes áreas
como en los negocios, en los hábitos de compra en los supermercados, en los
fraudes, en el comportamiento por el Internet, en el terrorismo, en los juegos, en
la ciencia e ingeniería, entre otras aplicaciones.

Potrebbero piacerti anche