Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
2016
1
INTELIGENCIA DE NEGOCIOS: MINERÍA DE DATOS Y DATAWAREHOUSE
DOCUMENTACION DE LA EXPOSICIÓN
INTELIGENCIA DE NEGOCIOS:
MINERÍA DE DATOS Y DATAWAREHOUSE
INGENIERO DE SISTEMAS
2016
2
CONTENIDO
INTELIGENCIA DE NEGOCIOS………………………………………………………...4
MINERÍA DE DATOS……………………………………………………………………..4
• Historia…………………………………………………………………………………4
• ¿Que es?………………………………………………………………………………5
• ¿Cómo es?…………………………………………………………………………….5
• ¿Para qué sirve?……………………………………………………………………...5
• características…………………………………………………………………………6
• Ventajas y desventajas……………………………………………………………….6
- Ventajas…………………………………………………………………………...6
- Desventajas……………………………………………………………………….7
• Implementación……………………………………………………………………….7
DATAWAREHOUSE………………………………………………………………………7
• Historia…………………………………………………………………………………7
• ¿Que es?………………………………………………………………………………8
• ¿Cómo es?……………………………………………………………………………8
• ¿Para qué sirve?……………………………………………………………………..9
• Características………………………………………………………………………...9
• Ventajas y desventajas……………………………………………………………….9
- Ventajas……………………………………………………………………………9
- Desventajas………………………………………………………………………10
• Implementación………………………………………………………………………10
Conclusión………………………………………………………………………………..10
Webgrafía………………………………………………………………………………...11
3
INTELIGENCIA DE NEGOCIOS:
MINERÍA DE DATOS Y DATAWAREHOUSE
INTELIGENCIA DE NEGOCIOS
MINERÍA DE DATOS
HISTORIA
La idea de data mining no es nueva. Ya desde los años sesenta los estadísticos
manejaban términos como data fishing, data mining o data archaeology con la idea
de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido.
A principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y
Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los términos de
data mining y KDD (Knowledge Discovery in Databases, Descubrimiento del
Conocimiento). A finales de los años ochenta sólo existían un par de empresas
dedicadas a esta tecnología; en 2002 existen más de 100 empresas en el mundo
que ofrecen alrededor de 300 soluciones. Las listas de discusión sobre este tema
las forman investigadores de más de ochenta países. Esta tecnología ha sido un
buen punto de encuentro entre personas pertenecientes al ámbito académico y al
de los negocios.
4
¿QUE ES?
Aunque desde un punto de vista académico el término data mining es una etapa
dentro de un proceso mayor llamado extracción de conocimiento en bases de
datos, en el entorno comercial, así como en este trabajo, ambos términos se usan
de manera indistinta.
Lo que en verdad hace el data mining es reunir las ventajas de varias áreas como
la Estadística, la Inteligencia Artificial, la Computación Gráfica, las Bases de Datos
y el Procesamiento Masivo, principalmente usando como materia prima las bases
de datos. Una definición tradicional es la siguiente: Un proceso no trivial de
identificación válida, novedosa, potencialmente útil y entendible de patrones
comprensibles que se encuentran ocultos en los datos (Fayyad y otros, 1996).
Desde el punto de vista empresarial , se define como: La integración de un
conjunto de áreas que tienen como propósito la identificación de un conocimiento
obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de
decisión (Molina y otros, 2001).
¿CÓMO ES?
5
CARACTERÍSTICAS
VENTAJAS Y DESVENTAJAS
VENTAJAS
-Enormes bases de datos pueden ser analizadas mediante la tecnología del Data
Mining. Estas Bases de datos pueden ser enormes tanto en largo como en ancho.
Por ejemplo, para cada cliente se puede tener cientos de atributos que contienen
información detallada; y además tener miles de registros de clientes.
-Como muchos modelos diferentes son validados, algunos resultados inesperados
tienden a aparecer. En muchos estudios, se ha descubierto que combinaciones
particulares de factores entregan efectos inesperados que entregan valor a la
compañía.
-El modelo es probado y comprobado usando técnicas estadísticas antes de ser
usado, luego las predicciones que se obtienen por el modelo son válidas y
confiables.
-La minería de datos permite construir y generar modelos en sólo uno minutos u
horas. El modelado se torna mucho más fácil puesto que muchos algoritmos son
probados y sólo el mejor modelo es entregado al usuario.
6
DESVENTAJAS
-Dependiendo del tipo de datos que se quieran recopilar puede conllevar mucho
trabajo o la necesidad de tecnología de elevado coste.
IMPLEMENTACIÓN
En Internet
— E-bussines: Perfiles de clientes, publicidad dirigida, fraude.
— Buscadores Inteligentes: Generación de jerarquías, bases de conocimiento
web.
— Gestión del Tráfico de la Red: Control de eficiencia y errores.
El Mundo de los Negocios
— Banca: Grupos de clientes, préstamos, oferta de productos.
— Compañías de Seguros: Detección de fraude, administración de recursos.
— Marketing: Publicidad dirigida, estudios de competencia.
En Mundo de la Ciencias
— Meteorología: Teleconexiones (asociaciones espaciales), predicción.
— Física: Altas energías, datos de colisiones de partículas (búsqueda de
patrones).
— Bio-Informática: Búsqueda de patrones en ADN, proyectos científicos como
genoma humano, datos geofísicos, altas energías, etc.
DATAWAREHOUSE
HISTORIA
7
¿QUE ES?
¿CÓMO ES?
8
¿PARA QUE SIRVE?
CARACTERÍSTICAS
VENTAJAS Y DESVENTAJAS
VENTAJAS
9
DESVENTAJAS
IMPLEMENTACIÓN
Los negocios necesitan aprovechar las posibilidades que les ofrece la actual
tecnología para permanecer competitivos y rentables.
El conocimiento del mercado y de los clientes se ha convertido en un factor de
supervivencia para las empresas, y el Data Warehouse se perfila como la
tecnología para lograr manejarlo.
Las organizaciones necesitan información renovada acerca de las tendencias
presentes para mantener su competitividad. Precisan saber qué es lo que está
pasando por las mentes de sus clientes.
Asimismo, necesitan determinar los requerimientos corporativas y traducirlos en
consultas que puedan ser respondidas a través del Data Warehouse.
Para ello, el Data Warehouse conserva información histórica y actual sobre un
negocio, y permite recuperar datos que, bajo la forma de informes, facilitan el
descubrimiento y las comprensión de patrones de comportamiento y tendencias de
las cuales resultan conclusiones o recomendaciones para los futuros cursos de
acción.
Sintetiza algunos datos muy importantes, otorgando al usuario nuevo
conocimiento comercial.
CONCLUSION
Los mercados están en un constante cambio; los consumidores se tornan cada día
más críticos; esperan cada vez un mejor producto, más individualizado y que
solucione sus problemas particulares.
La Competencia crece cada día más y nuevos medios de distribución y
almacenamiento se apoderan del mercado a una velocidad que no da tiempo para
la reacción.
Todos estos factores ejercen una presión sobre la organización y la empresa
actual. Para poder mantener(y más que mantener mejorar) una relación con el
cliente, y en consecuencia, mantenerse un liderazgo por sobre la competencia, se
hace necesario tener mecanismos de adaptación a las necesidades del cliente
(que, como ya mencionamos no son estáticas).
Es por esta razón que la velocidad y flexibilidad de la organización son factores
críticos a la hora de definir las ventajas competitivas de la empresa de hoy.
Uno de los cambios paradigmáticos que se propone es que hoy el cliente en sí
mismo forma el capital real de la empresa. Así, el foco ya no está en el producto
sino en los intereses del cliente.
10
WEBGRAFÍA
http://austineduardo.blogspot.com.co/2013/05/data-warehouse-y-mineria-de-
datos.html
http://www.dataprix.com/51-introducci-n
http://mineriadedatos-sosw.blogspot.com.co/2011/11/historia-de-la-mineria-de-
datos.html
http://es.slideshare.net/sebasrod/introduccin-al-datawarehouse-e-inteligencia-de-
negocios
http://exa.unne.edu.ar/informatica/SO/Mineria_Datos_Vallejos.pdf
http://dataminingsenatics.blogspot.com.co/p/principales-caracteristicas-y-
objetivos.html
http://matrixcpmsolutions.com/que-es-y-para-que-sirve-a-las-empresas-el-data-
warehouse/
http://www.aprenderaprogramar.com/index.php?option=com_content&id=252:mine
ria-de-datos-data-mining-ique-es-ipara-que-sirve-1o-parte-dv00105a&Itemid=164
11