Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Inteligencia de negocios
Contenido
1.
2.
OBJETIVOS........................................................................................................5
2.1 Objetivo General:...........................................................................................5
2.2
3.
Objetivos Especficos:...............................................................................5
MARCO TERICO.............................................................................................6
3.1. TOMA DE DESICIONES.................................................................................6
3.1.
4.
MINERIA DE DATOS...................................................................................7
3.1.1.
Agrupamiento ("Clustering")..............................................................7
3.1.2.
3.1.3.
Mtodos Estadsticos..........................................................................8
3.1.4.
3.1.5.
Reglas de Asociacin..........................................................................9
Bibliografa...............................................................................................................13
1.2. JUSTIFICACIN
Hoy en da es normal que las empresas de turismo cuenten con herramientas de
registro de usuarios, estas herramientas no slo se encargan del ingreso y salida
de los usuarios, tambin pueden llevar una estadstica de consumo, las cosas que
realizan, los atractivos que se visitan con mayor frecuencia entre otras muchas. El
problema radica en que es inservible recolectar unos datos importantes para la
organizacin si no se hace nada con ellos. Es por eso que la finalidad del presente
trabajo ser realizar un estudio de minera de datos, donde los datos a analizar
son los recolectados por algunos de los sectores tursticos de Bucaramanga
(hoteles, sitios tursticos, etc.) y a partir de esto poder establecer si existen
patrones de consumo y/o comportamiento con el fin de aprovecharlos.
2 OBJETIVOS
3 MARCO TERICO
MINERIA DE DATOS
Hace tan solo unos aos los datos de las empresas estaban orientados
principalmente, a alimentar sus sistemas contables y financieros as como
inventarios, los procesos de produccin, recursos humanos y ventas.
En la medida que los negocios mundiales se han hecho ms competitivos, los
datos cada vez cobran ms vida y se han convertido en informacin vital y
estratgica para la toma de decisiones. En tal sentido, las empresas han venido
evolucionando y han querido agregarle valor a la gran cantidad de informacin que
tienen almacenada en sus bases de datos. Para ello, se han interesado en
automatizar los procesos y poder as descubrir informacin valiosa, que de otra
manera seguira siendo subutilizada o simplemente desperdiciada.
Con la gran velocidad a la cual ha venido evolucionando la tecnologa, las
empresas de hoy disponen de herramientas de software y hardware cada vez ms
Minera
de
Datos
descubre
relaciones,
tendencias,
desviaciones,
4.
Aunque los componentes clave del Data Mining Minera de datos (DM) existen
desde hace dcadas en la investigacin en reas como la inteligencia artificial, la
estadstica o el aprendizaje automtico, se puede afirmar que ahora estamos
asistiendo al reconocimiento de la madurez de estas tcnicas, lo que, junto al
espectacular desarrollo de los motores de bases de datos y las herramientas para
integracin de informacin justifican su introduccin en la esfera empresarial.
Las races de la DM se remontan a los aos 50. Los departamentos de informtica
preparaban resmenes de la informacin, principalmente de tipo comercial, que se
encontraba en los ficheros del ordenador central, con el propsito de facilitar la
labor directiva. As nacieron los sistemas de informacin para la direccin, que sin
embargo, eran voluminosos, poco flexibles, y difciles de leer para los no
informticos. En los 60 nacen los sistemas gestores de base de datos que aun se
mostraban rgidos y carecan de flexibilidad para realizar consultas. Luego
aparecieron los motores relacionales resolviendo estos problemas, aunque los
informes resultaban muy laboriosos de preparar y depurar, perdindose relevancia
por su bajo nivel de actualizacin. Otro grave problema era la diversidad de bases
de datos no integradas establecidas por los diferentes departamentos de una
organizacin. Nadie reparaba en la posible utilidad futura de un sistema
interdependiente.
El Data Warehouse (DW) viene a solucionar este problema en los finales de los
80. La existencia de DW ha estimulado el desarrollo de los enfoques de DM, en
los que las tareas de anlisis se automatizan y dan un paso ms al posibilitar la
extraccin de conocimiento inductivo. (Martnez, 2016)
Desde los aos sesenta los estadsticos manejaban trminos como data fishing,
data mining o data archaeology, con la idea de encontrar correlaciones sin una
hiptesis previa en bases de datos con ruido. A principios de los aos
ochenta, Rakesh Agrawal, Gio Wiederhold, entre otros comenzaron a consolidar
los trminos de data mining.
A finales de los aos ochenta, slo existan un par de empresas dedicadas a esta
tecnologa; en el 2002 existan ms de 100 empresas en el mundo que ofrecan
alrededor de 300 soluciones. Las listas de discusin sobre este tema las forman
investigadores de ms de ochenta pases. Esta tecnologa ha sido un buen punto
de encuentro entre personas pertenecientes al mbito acadmico y al de los
negocios.
El data mining es una tecnologa compuesta por etapas que integra varias reas y
que no se debe confundir con un gran software. Durante el desarrollo de un
proyecto de este tipo se usan diferentes aplicaciones software en cada etapa que
pueden ser: estadsticas, de visualizacin de datos o de Inteligencia artificial,
principalmente. Actualmente existen aplicaciones o herramientas comerciales de
data mining muy poderosas que contienen un sinfn de utileras que facilitan el
desarrollo de un proyecto. (ecured, 2016)
En general, la estadstica es la primera ciencia que histricamente extrae
informacin de los datos bsicamente mediante metodologas procedentes de las
matemticas. Cuando se empez a usar los ordenadores como apoyo para esta
tarea surgi el concepto de Machine learning traducido como aprendizaje
automtico. Posteriormente con el incremento de tamao y la estructuracin de las
datos es cuando se empieza a hablar de minera de datos. La idea de data mining
no es nueva. Ya desde los aos sesenta los estadsticos manejaban trminos
como data shing, data mining o data archaeology con la idea de encontrar
correlaciones.
A principios de los aos ochenta, Rakesh Agrawal, Gio Wiederhold, Robert Blum y
Gregory Piatetsky-Shapiro, entre otros, empezaron a consolidar los trminos de
data mining, nales de los aos ochenta slo existan un par de empresas
dedicadas a esta tecnologa; actualmente existen ms de 100 empresas en el
mundo que ofrecen alrededor de 300 soluciones.
Propsito de la minera de datos:
-Explorar los datos se encuentran en las profundidades de las bases de datos,
como los almacenes de datos, que algunas veces contienen informacin
almacenada durante varios aos.
-En algunos casos, los datos se consolidan en un almacn de datos y en
mercados de datos; en otros, se mantienen en servidores de Internet e intranet.
-Las herramientas de la minera de datos ayudan a extraer el mineral de la
informacin enterrado en archivos corporativos o en registros pblicos, archivados
-Clasificar un dato dentro de una de las clases categricas predefinidas, preguntas
tales como: Cul es el riesgo de conceder un crdito a este cliente?
-Agrupar registros, observaciones o casos en clases de objetos similares.
5.
Anlisis de cluster
Dendongrama
MOTIVO
Media
N
Desv. tp.
Media
N
Desv. tp.
Total
Media
PROFESION
EDAD
2,59
3,69
33,64
311
311
311
1,024
1,869
7,732
2,55
3,00
60,00
51
51
51
1,064
1,637
6,696
2,58
3,59
37,36
N
Desv. tp.
362
362
362
1,029
1,851
11,911
Centroides
Kmo
KMO y prueba de Bartlett
Medida de adecuacin muestral de Kaiser-Meyer-Olkin.
Prueba de esfericidad de
Bartlett
,500
Chi-cuadrado aproximado
3,332
gl
Sig.
,343
EDAD
1,000
,002
,005
PROFESION
,002
,991
,095
EDAD
,005
,095
,991
,002
,005
PROFESION
,002
,096
EDAD
,005
,096
,500a
MOTIVO
Correlacin anti-imagen
PROFESION
,466
,500
a.
Por ser el kmo igual a 0,5 se observa en el cuadro de matriz anti-imagen que
ninguna de las tres variables analizadas presenta ruido en cuanto al anlisis de
los datos.
Varianza total explicada
Componente
Autovalores iniciales
Total
% de la
cuadrado de la extraccin
cuadrado de la rotacin
Total
varianza acumulado
% de la
varianza
acumulado
Total
% de la
varianza
acumulado
1,096
36,533
36,533 1,096
36,533
36,533 1,096
36,531
36,531
1,000
33,340
69,873 1,000
33,340
69,873 1,000
33,342
69,873
,904
30,127
100,000
rbol de decisiones:
Bibliografa
Artieta Pinedo, I. y. (1998). Introduccin a la Psicologa del. madrid: TROTTA.
ecured. (2016). ecured. Obtenido de http://www.ecured.cu/Miner%C3%ADa_de_Datos
http://mineria-datos-actualidad.blogspot.com.co/2012/05/origen-y-proposito-de-la-mineriade_12.html. (2016). mineria-datos-actualidad. Obtenido de http://mineria-datosactualidad.blogspot.com.co/2012/05/origen-y-proposito-de-la-mineria-de_12.html
Marina, J. A. (2005). El vuelo de la inteligencia. BARCELONA.
Marta Lorena Salinas Salazar, H. M. (2011). DevalSimWeb. Obtenido de
http://dearade.udea.edu.co/aula/pluginfile.php/1150/mod_resource/content/1/Compe
tencia_Toma_de_Decisiones.pdf
Martnez, M. B. (2016). bbeltran. Obtenido de MINERA DE DATOS:
http://bbeltran.cs.buap.mx/NotasMD.pdf
Novoa, M. E.-L. (2013). USO DE SISTEMAS DE INFORMACIN EN LAS EMPRESAS
OFERENTES. FACE, 65.
Orozco, J. G. (2000). eprints. Obtenido de http://eprints.rclis.org/10948/1/00243yuri34.pdf