Sei sulla pagina 1di 11

INTELIGENCIA DE NEGOCIOS: MINERÍA DE DATOS Y DATAWAREHOUSE

ANA BEATRIZ FERNANDA CORTES ORTIZ

TECNOLOGIA EN SISTEMAS DE INFORMACION

UNIVERSIDAD DEL VALLE

2016

1

INTELIGENCIA DE NEGOCIOS: MINERÍA DE DATOS Y DATAWAREHOUSE

ANA BEATRIZ FERNANDA CORTES ORTIZ

DOCUMENTACION DE LA EXPOSICIÓN

INTELIGENCIA DE NEGOCIOS:
MINERÍA DE DATOS Y DATAWAREHOUSE

LUIS ADRIAN LASSO

INGENIERO DE SISTEMAS

TECNOLOGIA EN SISTEMAS DE INFORMACION

UNIVERSIDAD DEL VALLE

2016
2

CONTENIDO

Inteligencia de negocios: Minería de datos y Datawarehouse……………………… 4

INTELIGENCIA DE NEGOCIOS………………………………………………………...4

MINERÍA DE DATOS……………………………………………………………………..4

• Historia…………………………………………………………………………………4
• ¿Que es?………………………………………………………………………………5
• ¿Cómo es?…………………………………………………………………………….5
• ¿Para qué sirve?……………………………………………………………………...5

• características…………………………………………………………………………6

• Ventajas y desventajas……………………………………………………………….6
- Ventajas…………………………………………………………………………...6
- Desventajas……………………………………………………………………….7

• Implementación……………………………………………………………………….7

DATAWAREHOUSE………………………………………………………………………7

• Historia…………………………………………………………………………………7
• ¿Que es?………………………………………………………………………………8
• ¿Cómo es?……………………………………………………………………………8
• ¿Para qué sirve?……………………………………………………………………..9

• Características………………………………………………………………………...9

• Ventajas y desventajas……………………………………………………………….9
- Ventajas……………………………………………………………………………9
- Desventajas………………………………………………………………………10

• Implementación………………………………………………………………………10

Conclusión………………………………………………………………………………..10

Webgrafía………………………………………………………………………………...11

3

INTELIGENCIA DE NEGOCIOS:
MINERÍA DE DATOS Y DATAWAREHOUSE

INTELIGENCIA DE NEGOCIOS

Hace referencia a un conjunto de productos y servicios para acceder a los datos,


analizarlos y convertirlos en información.
La Inteligencia de Negocios es una manera de manejar la información histórica de
una empresa a través de la construcción de un Data Warehouse, y explotarla con
fines de análisis para una mejor toma de decisiones.
A través de la creación de modelos de información multidimensionales una
organización puede beneficiarse al conocer de manera óptima cómo su negocio se
ha comportado a lo largo del tiempo, cómo se comporta en el presente y cómo se
estima se comportará en el futuro.
Algunos de los beneficios que obtienen las organizaciones al implementar este
sistemas son:
§ Capacidad de análisis.
§ Reducción de costos.
§ Reducción de tiempos de proceso.
§ Búsqueda de patrones desconocidos que sólo aparecen al momento en que
los datos son analizados.
§ Generación de pronósticos, presupuestación y planeación.
§ La inteligencia en el negocio electrónico, incluye actividades como el
procesamiento analítico en línea (OLAP) y aprovechamiento de datos,
también llamada extracción de datos o Minería de Datos.

MINERÍA DE DATOS

HISTORIA

La idea de data mining no es nueva. Ya desde los años sesenta los estadísticos
manejaban términos como data fishing, data mining o data archaeology con la idea
de encontrar correlaciones sin una hipótesis previa en bases de datos con ruido.
A principios de los años ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y
Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los términos de
data mining y KDD (Knowledge Discovery in Databases, Descubrimiento del
Conocimiento). A finales de los años ochenta sólo existían un par de empresas
dedicadas a esta tecnología; en 2002 existen más de 100 empresas en el mundo
que ofrecen alrededor de 300 soluciones. Las listas de discusión sobre este tema
las forman investigadores de más de ochenta países. Esta tecnología ha sido un
buen punto de encuentro entre personas pertenecientes al ámbito académico y al
de los negocios.

4

¿QUE ES?

Aunque desde un punto de vista académico el término data mining es una etapa
dentro de un proceso mayor llamado extracción de conocimiento en bases de
datos, en el entorno comercial, así como en este trabajo, ambos términos se usan
de manera indistinta.
Lo que en verdad hace el data mining es reunir las ventajas de varias áreas como
la Estadística, la Inteligencia Artificial, la Computación Gráfica, las Bases de Datos
y el Procesamiento Masivo, principalmente usando como materia prima las bases
de datos. Una definición tradicional es la siguiente: Un proceso no trivial de
identificación válida, novedosa, potencialmente útil y entendible de patrones
comprensibles que se encuentran ocultos en los datos (Fayyad y otros, 1996).
Desde el punto de vista empresarial , se define como: La integración de un
conjunto de áreas que tienen como propósito la identificación de un conocimiento
obtenido a partir de las bases de datos que aporten un sesgo hacia la toma de
decisión (Molina y otros, 2001).

¿CÓMO ES?

Supongamos una empresa de desarrollo de software. Un equipo de ingenieros


puede desarrollar aplicaciones informáticas y por cada una de ellas se recopilan
distintos datos relacionados con la métrica del software (por ejemplo Horas de
trabajo / Líneas de código / Número de errores por cada 1000 líneas de código,
etc.). ¿Para qué le serviría la minería de datos a la empresa de desarrollo de
software? Pues por ejemplo para saber el número de errores que previsiblemente
se va a encontrar en un proyecto y el tiempo que puede necesitar para corregirlos,
antes de que el proyecto en sí se haya desarrollado completamente.

¿PARA QUE SIRVE?

El objetivo general del proceso de minería de datos consiste en extraer


información de un conjunto de datos y transformarla en una estructura
comprensible para su uso posterior. Además de la etapa de análisis en bruto, que
involucra aspectos de bases de datos y gestión de datos, procesamiento de datos,
el modelo y las consideraciones de inferencia, métricas de Intereses,
consideraciones de la Teoría de la complejidad computacional, post-
procesamiento de las estructuras descubiertas, la visualización y actualización en
línea.

5

CARACTERÍSTICAS

§ Explorar los datos se encuentran en las profundidades de las bases de


datos, como los almacenes de datos, que algunas veces contienen
información almacenada durante varios años.
§ En algunos casos, los datos se consolidan en un almacén de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e
Intranet. El entorno de la minería de datos suele tener una arquitectura
cliente/servidor.
§ Las herramientas de la minería de datos ayudan a extraer el mineral de la
información enterrado en archivos corporativos o en registros públicos,
archivados
§ El minero es, muchas veces un usuario final con poca o ninguna habilidad
de programación, facultado por barrenadoras de datos y otras poderosas
herramientas indagatorias para efectuar preguntas adhoc y obtener
rápidamente respuestas.
§ Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos
e inesperados.
§ Las herramientas de la minería de datos se combinan fácilmente y pueden
analizarse y procesarse rápidamente.
§ Debido a la gran cantidad de datos, algunas veces resulta necesario usar
procesamiento en paralelo para la minería de datos.
§ La minería de datos produce cinco tipos de información:
— Asociaciones.
— Secuencias.
— Clasificaciones.
— Agrupamientos.
— Pronósticos.

VENTAJAS Y DESVENTAJAS

VENTAJAS

-Enormes bases de datos pueden ser analizadas mediante la tecnología del Data
Mining. Estas Bases de datos pueden ser enormes tanto en largo como en ancho.
Por ejemplo, para cada cliente se puede tener cientos de atributos que contienen
información detallada; y además tener miles de registros de clientes.
-Como muchos modelos diferentes son validados, algunos resultados inesperados
tienden a aparecer. En muchos estudios, se ha descubierto que combinaciones
particulares de factores entregan efectos inesperados que entregan valor a la
compañía.
-El modelo es probado y comprobado usando técnicas estadísticas antes de ser
usado, luego las predicciones que se obtienen por el modelo son válidas y
confiables.
-La minería de datos permite construir y generar modelos en sólo uno minutos u
horas. El modelado se torna mucho más fácil puesto que muchos algoritmos son
probados y sólo el mejor modelo es entregado al usuario.
6

DESVENTAJAS

-Dependiendo del tipo de datos que se quieran recopilar puede conllevar mucho
trabajo o la necesidad de tecnología de elevado coste.

-El pre procesamiento de datos puede llevar demasiado tiempo.

-No está asegurada la obtención de un modelo válido.

IMPLEMENTACIÓN

En Internet
— E-bussines: Perfiles de clientes, publicidad dirigida, fraude.
— Buscadores Inteligentes: Generación de jerarquías, bases de conocimiento
web.
— Gestión del Tráfico de la Red: Control de eficiencia y errores.
El Mundo de los Negocios
— Banca: Grupos de clientes, préstamos, oferta de productos.
— Compañías de Seguros: Detección de fraude, administración de recursos.
— Marketing: Publicidad dirigida, estudios de competencia.
En Mundo de la Ciencias
— Meteorología: Teleconexiones (asociaciones espaciales), predicción.
— Física: Altas energías, datos de colisiones de partículas (búsqueda de
patrones).
— Bio-Informática: Búsqueda de patrones en ADN, proyectos científicos como
genoma humano, datos geofísicos, altas energías, etc.

DATAWAREHOUSE

HISTORIA

En general el concepto se origino un poco antes de a mediados de los años 80s,


en esencia, dicha tecnología pretende proporcionar un modelo de arquitectura
para el flujo de datos de los sistemas operacionales y los ambientes de decisión.

Es decir intenta direccionar los diferentes problemas relacionados a este flujo de


datos, y los altos costos asociados. La ausencia de tal arquitectura ocasiona un
alto índice de redundancia en la administración y distribución de la información,
por ejemplo en empresas grandes las decisiones de los diferentes proyectos que
operan independientemente dependen de múltiples bases de datos, en donde en
la mayoría de los casos existe información en común que puede ser compartida
con el Data Warehouse sin necesidad de que dichos datos se repitan.

7

¿QUE ES?

Es un repositorio de datos de muy fácil acceso, alimentado de numerosas fuentes,


transformadas en grupos de información sobre temas específicos de negocios,
para permitir nuevas consultas, análisis, reportador y decisiones. En el contexto de
la informática, un almacén de datos (del inglés data warehouse) es una colección
de datos orientada a un determinado ámbito (empresa, organización, etc.),
integrado, no volátil y variable en el tiempo, que ayuda a la toma de decisiones en
la entidad en la que se utiliza. Se trata, sobre todo, de un expediente completo de
una organización, más allá de la información transaccional y operacional,
almacenado en una base de datos diseñada para favorecer el análisis y la
divulgación eficiente de datos (especialmente OLAP, procesamiento analítico en
línea).

¿CÓMO ES?

Un Data Warehouse se genera a partir de otras bases de datos, su construcción y


desarrollo requiere integrar varios componentes de tecnología y la habilidad para
hacerlos funcionar todos juntos .
El objetivo fundamental es transformar datos en conocimiento.
Para ello es necesario ensamblar datos existentes siguiendo instrucciones
precisas para obtener un óptimo resultado.
Para su construcción se debe considerar en primer lugar el hardware necesario,
dado que a mayor tamaño del almacén, mayor deberá ser la capacidad de
almacenamiento y el procesamiento. Luego el software y los datos que se
utilizarán.
Las Principales etapas de construcción del Almacén de Datos son:
• Extracción: Se crea los archivos de la Base de Datos para transacciones y se
guardan en el servidor que mantendrá el Almacén de Datos (se extrae la
información operacional).
• Depuración: Se unifica la información de los datos de manera que se pueda
insertar en el Almacén de Datos (se transforma la información a un formatos
consistentes).
• Carga: Se transfiere los archivos depurados a la base de datos que servirá como
almacén de datos.
• Comparación: Se comparan los datos del almacén con los originales.
De todas maneras, el éxito de Data Warehouse no está en su construcción, sino
en saber utilizarlo para mejorar procesos empresariales, operaciones y decisiones.

8

¿PARA QUE SIRVE?

§ Nos proporciona información clave para la toma de decisiones en la


empresa.
§ Mejora la calidad de las decisiones tomadas.
§ Estos datos son útiles a mediano y largo plazo.
§ Si las fuentes de los datos y los objetivos están claros, los sistemas son
sencillos de instalar.
§ Es útil también para el almacenamiento de análisis y consultas históricas.
§ Permite mayor flexibilidad y rapidez en el acceso a la información.
§ Brinda una comunicación fiable entre todos los departamentos de la
empresa.

CARACTERÍSTICAS

Un Data Warehouse es una colección de datos orientados a temas integrados, no


volátiles y variantes en el tiempo, organizados para soportar necesidades
empresariales.
Por ello es que un Data Warehouse se caracteriza por ser Integrado, Temático,
Histórico y No volátil.
§ Integrado, es decir que al Huir del entorno operacional al entorno de
almacén de datos, los datos asumen una codificación consistente.
§ Temático, debido a que almacena información resumida que se estructura
en función de temas empresariales u organizacionales.
§ Histórico, dado que contiene suficiente espacio para almacenar datos que
posean una antigüedad de diez años o mayor aun .
§ No volátil, es decir los datos no se modifican o cambian bajo ningún
concepto una vez introducidos en el almacén de datos, únicamente puede
ser cargados o leídos.

VENTAJAS Y DESVENTAJAS

VENTAJAS

§ Facilitan el acceso a los datos


§ Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a
la decisión tales como informes de tendencia.
§ Los almacenes de datos pueden trabajar en conjunto y, por lo tanto,
aumentar el valor operacional de las aplicaciones empresariales, en
especial la gestión de relaciones con clientes.

9

DESVENTAJAS

§ Implementar un Data warehouse implica un alto costo y no suele ser


estático necesita mantenimiento ya que su costo es elevado.
§ pueden quedar obsoletos en cualquier momento.
§ Se confunde con sistemas operacionales por que cumplen con algunas
funciones parecidas al data warehouse pero puede resultar peor por
algunas funciones no muy caras o que no se usen muy repetidamente.

IMPLEMENTACIÓN

Los negocios necesitan aprovechar las posibilidades que les ofrece la actual
tecnología para permanecer competitivos y rentables.
El conocimiento del mercado y de los clientes se ha convertido en un factor de
supervivencia para las empresas, y el Data Warehouse se perfila como la
tecnología para lograr manejarlo.
Las organizaciones necesitan información renovada acerca de las tendencias
presentes para mantener su competitividad. Precisan saber qué es lo que está
pasando por las mentes de sus clientes.
Asimismo, necesitan determinar los requerimientos corporativas y traducirlos en
consultas que puedan ser respondidas a través del Data Warehouse.
Para ello, el Data Warehouse conserva información histórica y actual sobre un
negocio, y permite recuperar datos que, bajo la forma de informes, facilitan el
descubrimiento y las comprensión de patrones de comportamiento y tendencias de
las cuales resultan conclusiones o recomendaciones para los futuros cursos de
acción.
Sintetiza algunos datos muy importantes, otorgando al usuario nuevo
conocimiento comercial.

CONCLUSION

Los mercados están en un constante cambio; los consumidores se tornan cada día
más críticos; esperan cada vez un mejor producto, más individualizado y que
solucione sus problemas particulares.
La Competencia crece cada día más y nuevos medios de distribución y
almacenamiento se apoderan del mercado a una velocidad que no da tiempo para
la reacción.
Todos estos factores ejercen una presión sobre la organización y la empresa
actual. Para poder mantener(y más que mantener mejorar) una relación con el
cliente, y en consecuencia, mantenerse un liderazgo por sobre la competencia, se
hace necesario tener mecanismos de adaptación a las necesidades del cliente
(que, como ya mencionamos no son estáticas).
Es por esta razón que la velocidad y flexibilidad de la organización son factores
críticos a la hora de definir las ventajas competitivas de la empresa de hoy.
Uno de los cambios paradigmáticos que se propone es que hoy el cliente en sí
mismo forma el capital real de la empresa. Así, el foco ya no está en el producto
sino en los intereses del cliente.
10

WEBGRAFÍA

http://austineduardo.blogspot.com.co/2013/05/data-warehouse-y-mineria-de-
datos.html
http://www.dataprix.com/51-introducci-n
http://mineriadedatos-sosw.blogspot.com.co/2011/11/historia-de-la-mineria-de-
datos.html
http://es.slideshare.net/sebasrod/introduccin-al-datawarehouse-e-inteligencia-de-
negocios
http://exa.unne.edu.ar/informatica/SO/Mineria_Datos_Vallejos.pdf
http://dataminingsenatics.blogspot.com.co/p/principales-caracteristicas-y-
objetivos.html
http://matrixcpmsolutions.com/que-es-y-para-que-sirve-a-las-empresas-el-data-
warehouse/
http://www.aprenderaprogramar.com/index.php?option=com_content&id=252:mine
ria-de-datos-data-mining-ique-es-ipara-que-sirve-1o-parte-dv00105a&Itemid=164

11

Potrebbero piacerti anche