Sei sulla pagina 1di 44

FUNDAMENTOS DE

INTELIGENCIA DE
NEGOCIOS

CAPITULO 6
ARCHIVOS
CONVENCIONALES
Un archivo es un conjunto de registros y a cada registro lo conforman
campos, a cada campo lo integran caracteres o bytes y cada carácter
consta de ocho bits.

Existen dos formas de organizar los archivos: secuenciales y directos.

En los ARCHIVOS SECUENCIALES los registros se almacenan en una


secuencia que depende de algún criterio definido.

El uso de estos archivos, presenta algunas desventajas en el proceso de


actualización, consulta o registro de información cuando se maneja un
gran volumen de datos.

En los ARCHIVOS DIRECTOS se eliminan las desventajas de los anteriores,


ya que su manejo da mayor flexibilidad. Estos permiten accesar mediante
una llave dentro del archivo, a un registro de información sin tener que
buscar en cada uno de los registros del archivo.
Sin embargo, el almacenamiento y recuperación de datos convencional
presenta varios problemas:

Dependencia de datos-programa
Significa que para obtener un informe de empleados el programador
debe conocer cómo están almacenados los datos, en que orden están los
campos en el registro y finalmente, para lograr el informe es necesario
tener un programador que “programe” el informe en algún lenguaje de
programación.

Redundancia de datos
Se presenta cuando existen datos que utilizan diferentes departamentos
de una empresa.

Integridad de datos
Se refiere a que si algún departamento que tenga vinculación con otro,
cambia la descripción de algún producto, sin hacer lo mismo en el archivo
del otro almacén, provocará una falta de integridad de datos, lo que su
vez, generará informes erróneos.
BASES DE DATOS
Es una serie de datos organizados y relacionados entre sí, los
cuales son recolectados y explotados por los sistemas de
información de una empresa o negocio. También es una colección
de datos con las siguientes características: conjunto de datos
correlacionados; construida para un propósito específico; tiene
algunos usos de interés especial para ciertas personas;
representa algún aspecto del mudo real, por lo tanto, los cambios
en ese aspecto se deben reflejar en la base de datos; los datos se
almacenan de tal forma que son independientes de los programas
que los usan.

Las bases de datos proporcionan la infraestructura requerida por


los sistemas de apoyo a la toma de decisiones y por los sistemas
de información estratégicos, ya que explotan la información
contenida en las bases de datos de la organización para apoyar en
el proceso de la toma de decisiones o para lograr ventajas
competitivas.
SISTEMAS TRANSACCIONALES o
SISTEMAS ESTRATEGICOS (SIS)

Recolectan información que contendrá la base de datos, por


medio de funciones de creación, bajas o modificaciones de
la información. La forma de operar de estos sistemas puede
ser batch, o en línea, depende de la manera en que se
actualice la información de la base de datos. La información
recolectada por los sistemas de transaccionales o por los
sistemas estratégicos es explotada por los sistemas de
apoyo a las decisiones o por los sistemas estratégicos, que
proporcionan funciones de actualización en línea.
Un sistema de base de datos tiene cuatro componentes principales:

1. Datos: Son la base de los datos propiamente dicha. Una base de datos constituye
con datos almacenados y utilizados por los sistemas de una organización particular.

2. Hardware: Se refiere a los dispositivos de almacenamiento en donde reside la base


de datos.

3. Software: Es un conjunto de programas que se conoce como sistema manejador


de bases de datos. Este sistema maneja todas las solicitudes formuladas por los
usuarios a la base de datos.

4. Usuarios: Existen tres clases relacionados con una base de datos:

 El programador de aplicaciones, quien crea programas de aplicación que utiliza la


base de datos.

 El usuario final, quien accesa la base de datos por medio de un lenguaje de


consulta de programas de aplicación.

 El administrador de la base de datos, quien se encarga del control general del


sistema de base de datos.
VENTAJAS EN EL USO
DE LAS BASES DE DATOS
Algunas de las ventajas presentadas por la base de datos son:

 Globalización de la información
Permite a los diferentes usuarios considerar la información como
un recurso corporativo que carece de dueños específicos.

 Eliminación de información redundante


Con frecuencia los sistemas de aplicación desarrollados a través
de archivos, de tal suerte que si son dos sistemas de aplicación
requieren la misma información es muy posible que esta se
duplique.

 Eliminación de información incongruente


Si existen 2 o más archivos con la misma información, los
cambios que se hagan a estos deberán hacerse a todas las copias
de los archivos.
 Permite compartir información
Varios sistemas o usuarios pueden utilizar la misma entidad.

Permite mantener la integridad de la información


La integridad de la información es una de las cualidades altamente
deseable y tiene por objeto que sólo se almacene la información
correcta.

 Independencia de datos
Es quizás el que más ha ayudado a la rápida proliferación del
desarrollo de sistemas de base de datos. En el desarrollo de
sistemas a través de archivos convencionales, las aplicaciones o los
programas son dependientes de los datos que procesan, de tal
forma que si la estructura de un archivo se modifica al agregar un
campo adicional, el programador debe modificar todos los
programas.
EL SISTEMA
MANEJADOR DE BASE
DE DATOS (DBMS)
El DBMS es el software o conjunto de programas que se
encarga de manejar la creación y todos los accesos a la base
de datos. Mediante el DBMS se especifican los tipos de datos
a almacenar; por medio del DBMS se efectúa la carga de
información y también incluye módulos para realizar
consultas, actualizar y generar informes.

Se compone de 4 módulos:

 El primero para la definición de los datos


 El segundo con la finalidad de manipular, cambiar datos
 El tercero permite generar aplicaciones (programas)
 El cuarto hace las funciones de control, seguridad de
usuarios y datos.
Creación y
definición de la Definición
estructura lógica de de datos M
la base de datos
O

Consultar y T
Manipulación
actualizaciones de
de datos
la información O Base
de
R datos
Diseño de Generador
aplicaciones para de
el usuario D
aplicación B
M
S
Mecanismos de
seguridad y control Administración
de usuarios e de datos
información
EL ADMINISTRADOR
DE LA BASE DE DATOS
• EL DBA DEFINE Y CONTROLA LAS
BASES DE DATOS CORPORATIVAS,
TAMBIEN PROPORCIONA ASESORIA
A LOS USUARIOS Y EJECUTIVOS QUE
LO REQUIEREN
FUNCIONES

• APOYAR Y ASESORAR DURANTE EL PROCESO DE


ADQUISICION DEL DBMS
• DEFINIR LA INFORMACION QUE CONTENDRAN LAS BASES
DE DATOS CORPORATIVAS
• MANTENER LA RELACION Y LA COMUNICACIÓN ESTRECHA
CON LOS ESPEIALISTAS DEL DBMS
• DISEÑAR LAS ESTRUCTURAS DE ALMACENAMIENTO Y
ESTRATEGIAS DE ACCESO A LAS BASES DE DATOS
• ATENDER Y SERVIR COMO PUNTO DE
ENLACE ENTRE LOS USUARIOS DE LA
ORGANIZACION
• DEFINIR ESTANDARES Y
PROCEDIMIENTOS PARA RESPALDAR
Y RECUPERAR LA INFORMACION
QUE CONTIENEN LAS BASES DE
DATOS
TIPOS DE MODELO
DE
BASE DE DATOS
MODELO JERÁRGICO

La forma de esquematizar la información se realiza


a través de representaciones jerárquicas o
relaciones de padre/hijo, de manera similar a la
estructura de un árbol. El modelo jerárquico
representa dos tipos de relaciones entre dos datos:
relaciones de uno a uno y relaciones de uno a
muchos.
Ejemplo:

Entidad
Padre

Entidad
Primer Hijo

Entidad
Segundo
Hijo
MODELO DE RED
Este modelo permite la representación de mucho a a
muchos, de tal forma que cualquier registro dentro de la
base de datos puede tener varias ocurrencias superiores
a él.

Ésta era una de las principales limitantes del modelo


jerárquico de representación de datos y que la
información de cada uno de los alumnos era repetida
para cada uno de los maestros.
Ejemplo:
Curso Curso Curso
1 2 3

Estudiante Estudiante Estudiante Estudiante Estudiante


1 2 3 4 5
MODELO RELACIONAL

Este modelo ofrece mejores ventajas sobre los 2


modelos anteriores, entre ellas, el rápido entendimiento
por parte de usuarios que no tienen conocimiento
profundos sobre sistemas de bases de datos.
En este modelo toda la información se representa a
través de arreglos bidimensionales o tablas.
Ejemplo:
Clave de Dpto. Nombre del Dpto. Director Teléfono
SA Sistemas Administrativos Lic. Francisco Glz. 4 35 81 33
CP Contabilidad Pública C.P Alfonso Mtz 4 12 43 23
MKT Mercadotecnia Lic. Eugenio Herrera 4 34 11 89

Nómina`` Nombre Carrera Teléfono Clave de Departamento


N987 Esteban García LCP 4 34 22 67 CP
N534 Mario Cabello LSM 4 12 89 00 MKT
N321 Claudia Rico LAE 4 15 66 10 SI

Clave de Dpto. Plan Numero de Nombre Créditos


materia
SI 2000 100 Administración 10
CP 2003 110 Contabilidad administrativa 10
MKT 2001 95 Análisis Multivariante 8
Ventajas y Desventajas de los modelos de
bases de datos
JERÁRQUICO RED RELACIONAL

Conceptualmente Fácil Difícil Muy fácil

Facilidad de Muy difícil Menos difícil Difícil


diseño

Facilidad de Difícil Muy difícil Fácil


Mantenimiento

Redundancia de Alta Baja Alta


datos

Facilidad de uso media baja alta


BASES DE DATOS
DISTRIBUIDAS
MUCHAS ORGANIZACIONES QUE
SE ESNCUENTRAN DISPERSAS
GEOGRAFICAMENTE REQUIEREN
COMPARTIR INFORMACION. PARA
ELLO SIRVEN LAS BASES DE
DATOS DISTRIBUIDAS
CARACTERISTICAS
• NO ESTAN ALMACENADAS TOTALMENTE
EN UN SOLO LUGAR FISICO
• SE COMUNICAN POR ENLACES DE
COMUNICACIONES A TRAVES DE UNA RED
DE COMPUTADORAS DISPERSAS
GEOGRAFICAMENTE
PRINCIPALES PROBLEMAS

• DUPLICIDAD DE DATOS Y FALTA DE INTEGRIDA


EN EL MOMENTO DE REALIZAR
ACTUALIZACIONES A LOS MISMOS
• EL CONTROL DE LA INFORMACION PUEDE
CONSTITUIR UNA DESVENTAJA DEBIDO A QUE SE
ENCUENTRA DISEMINADA EN DIFERENTES
LOCALIDADES GEOGRAFICAS
MODALIDADES PARA CREAR BASES DE DATOS
DISTRIBUIDAS

• FRAGMENTAR LA BASE DE DATOS: CONSISTE EN


INSTALAR EN CADA COMPUTADORA SOLO LA PARTE DE
LA BASE DE DATOS QUE SE USARA CON MAS
FRECUENCIA EN LA ZONA GEOGRAFICA

• REPLICA DE LA BASE DE DATOS: CONSISTE EN REALIZAR


UNA COPIA TOTAL DE LA BASE DE DATOS E INSTALARLA
EN CADA UNA DE LAS COMPUTADORAS DE LA
ORGANIZACION
WAREHOUSE

DEFINICION
Según la definición de W.H. Inmon: “Un data warehouse es un
conjunto de datos integrados con orientación hacia una
materia, que varían con el tiempo y no son transitorios, los
cuales apoyan el proceso de toma de decisiones de una
administración”.

Es una arquitectura de información con fines de apoyo al


proceso de toma de decisiones estratégicas, que se separan de
los sistemas operativos y de producción con el fin de no
interferir con ellos.

En otras palabras, un data warehousing (almacén de datos) es el


almacenamiento de datos con fines estratégicos de negocio,
concepto muy opuesto al objetivo de las bases de datos
operativas.

La importancia reside en que son fuente de materia prima


selecta en los sistemas de apoyo para la toma de decisiones.
CARACTERISTICAS
A) Son datos organizados con orientación hacia entidades, por
ejemplo producto, cliente, en vez de estar orientados hacia el
proceso.

B) Se crean y diseñan fuera de las bases de datos operacionales.

C) Una vez que los datos son almacenados, estos no cambian y el


almacén de datos puede tener un tiempo de vida de 5 a 10 años.

D) Normalmente las únicas operaciones sobre la base de datos se


reducen a captura de datos y acceso a los mismos.

Las aplicaciones típicas de data warehouse se utilizan a diario en el


sector bancario y financiero, así como algunas otras en las áreas de
administración de riesgos de crédito. También son muy utilizadas en
empresas de artículos de consumo, para comprender los patrones de
compra y hábitos del consumidor.
Para lograr obtener beneficios de los datos almacenados en el
almacén de datos es necesaria la utilización de herramientas y
técnicas OLAP (OnLine Analytical Proccesing) o también
procesamiento analítico en línea, el cual permite consultar los
datos en diferentes formas utilizando varias dimensiones, por
ejemplo: producto, precio, zona, vendedor. Con OLAP es
posible realizar consultas que en una base de datos relacional
son muy difíciles de conseguir. Cabe mencionar que estas
tecnologías son indispensables para la Inteligencia de Negocios
(BI, Business Intelligence), dando a las organizaciones la
capacidad de almacenar y desarrollar conocimiento de
competidores, clientes y entidades vinculadas.
DATA MINING (MINERIA DE DATOS)

La minería de datos auxilia a los usuarios para procesar las


vastas reservas de datos y relaciones insospechadas, por
ejemplo, entre productos y clientes o patrones de compra de
los clientes. La meta es descubrir relaciones estratégicas
competitivas. Las herramientas de minería de datos son
esenciales para comprender el comportamiento de los clientes.

El auge de la minería de datos (data mining) se debe a que la


tecnología de data warehouse proporciona tres factores
básicos: a) un gran banco de datos bien organizados e
históricos, b) hardware y producto de bases de datos a precios
de datos y c) tecnología y herramientas para minería cada vez
mas desarrolladas.
CLASIFICACION
1. Análisis estadístico o de datos, utilizados para detectar
patrones no usuales de datos.

2. Descubrimiento de conocimientos, característica que tiene sus


raíces en la inteligencia artificial. Consiste en extraer de los datos
información implícita, no trivial, que no se conocía y es
potencialmente útil.

3. Otros, como sistemas de información geográfica. Los sistemas


de visualización geográfica relacionan los datos del data
warehouse en diferentes ubicaciones físicas con
representaciones geográficas.

La minería de datos busca descubrir información en los


almacenes de datos, siendo los siguientes tipos de información
los que se pueden obtener:
1. Asociaciones, eventos que ocurren en vinculación a otro evento:
por ejemplo, la compra de un producto “a” se asocia a un día de la
semana en que hay promociones.

2. Secuencias, aquí se descubre que un evento “a” se hace


comúnmente después de un evento “y”.

3. Agrupamiento, la minería crea grupos similares en el patrón de los


datos, por ejemplo crear grupos-perfiles de personas con base en el
consumo en un restaurante.

4. Clasificación, aquí se identifican patrones que enlazan los datos con


características de otros elementos definidos; por ejemplo, una
empresa puede clasificar a sus clientes como leales al revisar sus
consumos.

Las herramientas de minería de datos son muy poderosas, realizan un


análisis complejo de patrones y tendencias, que pueden usarse en
DATA MARTS
De hecho es un pequeño data warehouse, creado para una
determinada cantidad de usuarios de un área de la empresa. En otras
palabras, se trata de un subconjunto de un almacén de datos para un
propósito específico. Un data mart tiene como función apoyar a los
sistemas de toma de decisiones.

Algunos de los cuestionamientos que se deben solucionar cuando la


empresa cuenta con tecnología de apoyo, como son data warehouse y
el data mart, son los siguientes:

¿Quiénes son mis mejores clientes?, ¿Dónde se ubican?, ¿Qué


compran?, ¿Qué los caracteriza?, ¿Cuáles líneas de productos son las
mas rentables?, ¿Qué productos son mis 10 mejores?, ¿Qué productos
son mis 10 peores?, ¿Qué productos son los mas vendidos este mes?,
¿Cómo van mis avances respecto a lo planificado?, ¿Dónde se
concentra el 80% de mis ventas?, etc.

Potrebbero piacerti anche