Sei sulla pagina 1di 7

Instituto Tecnolgico Superior de

El Grullo
Ingeniera Informtica

Inteligencia de Negocios
LI. Juan Carlos Garca Seplveda
Sistemas de Gestin del Conocimiento

Eric Daniel Ramrez Bermejo


15 de Marzo de 2015

ndice
Preparacin de los Datos ............................................................................... 1
Minera de Datos ............................................................................................ 3
Patrones ......................................................................................................... 3
Evaluacin, Interpretacin y Visualizacin ..................................................... 4
Fuentes de Informacin .................................................................................. 5

La Gestin del Conocimiento es un concepto actualmente altamente aplicado en las


organizaciones que procura transferir el conocimiento y la experiencia de sus
recursos humanos, de forma tal que quede disponible y pueda ser utilizado por otros
miembros de dicha organizacin.
Implica una variedad de distintas tcnicas para capturar, organizar y almacenar el
conocimiento del personal de la organizacin para transformarlo en un activo
intelectual que brinde beneficios y se pueda compartir. En la actualidad las
tecnologas de la informacin permiten contar con herramientas que apoyan este
proceso, es decir, la recoleccin, la transferencia y la administracin sistemtica de
la informacin, junto con los sistemas diseados para dar un mejor uso a dicho
conocimiento.

Preparacin de los Datos


Los datos deben ser extrados de diversas fuentes, limpiados, transformados y
consolidados, cargados en la base de datos de apoyo para la toma de decisiones y
luego actualizados peridicamente. Cada una de estas operaciones involucra sus
propias consideraciones especiales.
1.- Extraccin
La extraccin es el proceso de capturar datos de la base de datos operacionales y
otras fuentes. Hay muchas herramientas disponibles para ayudar en esta tarea,
incluyendo herramienta proporcionadas por el sistema, programas de extraccin
personalizados y productos de extraccin comerciales.
2.- Limpieza
Pocas fuentes de datos controlan adecuadamente la calidad de los datos. Por
consecuencia, los datos requieren frecuentemente de una limpieza (por lo general
por lote) antes de que puedan ser introducidos en la base de datos de apoyo para
la toma de decisiones. Las operaciones de limpieza tpicas incluyen el llenado de

Pgina | 1

valores faltantes, la correccin de errores tipogrficos y otros de captura de datos,


el reemplazo de sinnimos por identificadores estndares etc.
3.- Transformacin y consolidacin
Aun despus de haber sido limpiados, es probable que los datos todava no estn
de la forma en que se requieren para el sistema de apoyo para la toma de decisiones
y por lo tanto, debern ser transformados adecuadamente. Por lo general, la forma
requerida ser un conjunto de archivos, uno por cada tabla identificada en el
esquema fsico. La transformacin es importante cuando necesitan mezclarse
varias fuentes de datos, un proceso al que se llama consolidacin.
4.- Carga
Los fabricantes de DBMS han puesto considerable importancia en la eficiencia de
las operaciones de carga. Para los propsitos actuales, consideramos que las
operaciones de carga incluyen (a) el movimientos de los datos transformados y
consolidados hacia la base de datos de apoyo para la toma de decisiones, (b) la
verificacin de su consistencia (es decir, verificacin de integridad) y (c) la
construccin de cualquier ndice necesario.
5.- Actualizacin
La mayora de las bases de datos de apoyo para la toma de decisiones (aunque no
todas) requieren una actualizacin peridica de los datos para mantenerlos
vigentes. La actualizacin involucra por lo general una carga parcial, aunque
algunas aplicaciones de apoyo para la toma de decisiones requieren la eliminacin
de lo que ha y en la base de datos y una recarga completa.
6.- Almacenes de datos operacionales
Un ODS (almacn de datos operacionales) es una coleccin de datos actuales
integrados y voltiles (actualizables) que estn orientados a un tema. El trmino
orientado a un tema significa que los datos en cuestin tienen que ver con alguna
rea temtica especfica (por ejemplo clientes, productos etc.).

Pgina | 2

Un almacn de datos operacionales puede ser usado (a) como un rea transitoria
para la reorganizacin fsica de los datos operacionales extrados, (b) para
proporcionar informen operacionales y (c) para apoyar la toma de decisiones
operacionales.

Minera de Datos
El datamining (minera de datos), es el conjunto de tcnicas y tecnologas que
permiten

explorar

grandes

bases

de

datos,

de

manera

automtica

semiautomtica, con el objetivo de encontrar patrones repetitivos, tendencias o


reglas que expliquen el comportamiento de los datos en un determinado contexto.
Bsicamente, el datamining surge para intentar ayudar a comprender el contenido
de un repositorio de datos. Con este fin, hace uso de prcticas estadsticas y, en
algunos casos, de algoritmos de bsqueda prximos a la Inteligencia Artificial y a
las redes neuronales.
El propsito de buscar patrones interesantes en los datos, patrones que pueden
usarse para especificar la estrategia del negocio o para identificar comportamientos
fuera de lo comn.

Patrones
La tarea de minera de datos real es el anlisis automtico o semi-automtico de
grandes cantidades de datos para extraer patrones interesantes hasta ahora
desconocidos, como los grupos de registros de datos (anlisis cluster), registros
poco usuales (la deteccin de anomalas) y dependencias (minera por reglas de
asociacin). Esto generalmente implica el uso de tcnicas de bases de datos como
los ndices espaciales. Estos patrones pueden entonces ser vistos como una
especie de resumen de los datos de entrada, y pueden ser utilizados en el anlisis
adicional o, por ejemplo, en la mquina de aprendizaje y anlisis predictivo.

Pgina | 3

Evaluacin, Interpretacin y Visualizacin


Se verifica que los resultados obtenidos sean consistentes y se compara con los
obtenidos mediante los mtodos estadsticos y grficos. Se determina finalmente si
aportan alguna novedad en las relaciones ocultas entre los datos que permitan guiar
toma de decisiones. Si existe una discrepancia se deben tomar en cuenta los que
se consideren ms confiables o reiniciar todo el proceso.
La visualizacin de datos es una tcnica adecuada para localizar patrones en un
conjunto de datos. Puede ser utiliza da al comienzo del proceso de Minera de Datos
para tener obtener una referencia de la calidad del conjunto de los datos.

Pgina | 4

Fuentes de Informacin

http://eprints.rclis.org/14884/1/DT_019.pdf

http://www.edutecne.utn.edu.ar/sistemas-informacion/Data%20MiningDataWarehouse.pdf

http://es.scribd.com/doc/246440564/Temas-Unidad-2-Inteligencia-deNegocios#scribd

Pgina | 5

Potrebbero piacerti anche