Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
INTRODUCCION
Cada día las organizaciones se enfrentan a un mundo cada vez más competitivo y,
por tanto, las estrategias de administración deben ser flexibles para adaptarse a las
condiciones cambiantes del entorno. Lo que significa un gran reto para las
organizaciones es el poder manejar grandes volúmenes de información que estas
generan, y para conocer su entorno y poder predecir su evolución.
Los factores que en la actualidad nos han permitido generar tanta información son:
Todas estas ventajas nos han llevado a abusar del almacenamiento de la información
en las bases de datos. Es necesario contar con tecnologías que nos ayuden a
explotar el potencial de este tipo de datos.
CONCEPTO
Aunque algunos autores usan los términos Minería de Datos y KDD indistintamente,
como sinónimos, existen claras diferencias entre los dos. Así la mayoría de los
autores coinciden en referirse al KDD como un proceso que consta de un conjunto de
fases, una de las cuales es la minería de datos. De acuerdo con esto, el proceso de
minería de datos consiste únicamente en la aplicación de un algoritmo para extraer
patrones de datos y se llamará KDD al proceso completo que incluye pre-
procesamiento, minería y post-procesamiento de los datos.
En esta figura vemos las fases del proceso de KDD, una de las cuales es la Minería
de Datos
IMPORTANCIA
Las diferentes variaciones que están naciendo y que son objeto de investigación y de
estudio a nivel mundial, como lo son el Web Mining, Text Mining, Graphic Mining,
entre otros. Todo esto demuestra que el uso de técnicas y algoritmos para el estudio
de patrones y reglas en repositorios de datos, es aplicable y con gran importancia a
muchos formatos diferentes.
4. Medir los Resultados: Verifica si los resultados obtenidos son coherentes y los
coteja con los obtenidos por los análisis estadísticos y de visualización gráfica. El
cliente determina si son novedosos y si le aportan un nuevo conocimiento que le
permita considerar sus decisiones.
• Weka, KXEN
Text Mining: dado que el ochenta por ciento de la información de una compañía está
almacenada en forma de documentos, las técnicas como la categorización de texto, el
procesamiento de lenguaje natural, la extracción y recuperación de la información o el
aprendizaje automático, entre otras, apoyan al text mining (minería de texto). En
ocasiones se confunde el text mining con la recuperación de la información
(Information Retrieval o IR) (Hearst, 1999). Esta última consiste en la recuperación
automática de documentos relevantes mediante indexaciones de textos, clasificación,
categorización, etc. Generalmente se utilizan palabras clave para encontrar una
página relevante. En cambio, el text mining se refiere a examinar una colección de
documentos y descubrir información no contenida en ningún documento individual de
la colección; en otras palabras, trata de obtener información sin haber partido de algo
(Nasukawa y otros, 2001).
Si bien el data mining se presenta como una tecnología emergente, posee ciertas
ventajas, como ser:
• Trabajar con esta tecnología implica cuidar un sin número de detalles debido a
que el producto final involucra "toma de decisiones".
• Proporciona poderes de decisión a los usuarios del negocio que mejor entienden
el problema y el entorno y es capaz de medir la acciones y los resultados de la
mejor forma.
• Que no sea posible resolver los aspectos técnicos de hallar patrones en tiempo o
en espacio,
• Molina, L. C. (2002). Data mining: torturando a los datos hasta que confiesen.
http://www.uoc.edu/web/esp/art/uoc/molina1102/molina1102.html