Sei sulla pagina 1di 14

Universidad Tecnolgica Nacional - Facultad Crdoba

Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

UNIDAD 5: BASE DE DATOS


1. Base de Datos: concepto y requisitos que debe cumplir un buen Sistema de BD.
2. Estructura General de una Base de Datos: Entidad, Atributos, Clave y Relacin.
3. Tipos de Base de Datos: Jerrquicas, En Red y Relacionales.
4. BD Relacionales: requisitos que debe cumplir una tabla.

si
on

5. SGBD: Sistema de Gestin de Base de Datos o DBMS (Data Base Management Sytem).
a. Microsoft SQL Server.

tri

c. Microsoft Access

al

b. Oracle

ve
r

5.1. Algunos SGBD ms conocidos en el mercado:

ne

6. Lenguaje de Consulta Estructurado SQL a cualquier Base de Datos.

fM
ac
hi

6.1. Para qu utilizamos los comandos SQL


7. Datawarehouse y Datamining

pd

7.1. DW Empresarial

Material recopilado y organizado por Ing. Carrizo

Pgina 1 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

Base de Datos
1. Concepto:
Sistema formado por un conjunto de datos y un paquete de software para la gestin del mismo,
de tal modo que controla el almacenamiento de datos redundantes.
Los datos resultan independientes de los programas que los usan, se almacenan las relaciones
entre los datos junto con stos y se puede acceder a los datos de diversas formas.
Entendemos por Sistema un conjunto de elementos relacionados entre s y con su ambiente (contexto o
medio), cuya suma total es mayor que la suma de las partes tomadas en forma aislada (sinergia o accin
combinada), que tienen un objetivo comn.
Algunos requisitos que debe cumplir un buen Sistema de Base de Datos (BD) son:
Acceso mltiple: diversos usuarios pueden acceder a la BD, sin que se produzcan conflictos ni visiones
incoherentes.

Utilizacin mltiple: cada usuario podr tener una imagen o visin particular de la estructura de la BD.

Flexibilidad: se podrn usar distintos mtodos de acceso, con tiempos de respuesta razonablemente
pequeos.

Confidencialidad y seguridad: se controlar el acceso a los datos, incluso a nivel campo,


impidindoselo a los usuarios no autorizados.

Proteccin contra fallos: deben existir mecanismos concretos de recuperacin en caso e fallo de la
computadora.

Independencia fsica: se puede cambiar el soporte fsico de la BS (Ej.: modelo de discos), sin que eso
repercuta en la BD ni en los programas que la usan.

Independencia lgica: capacidad para que se puedan modificar los datos contenidos en la base, las
relaciones existentes entre ellos o incluir nuevos datos, sin afectar los programas que lo usan.

Redundancia controlada: los datos se almacenan una sola vez.

Interfaz de alto nivel: existe una forma sencilla y cmoda de utilizar la base, al menos se cuenta con
un lenguaje de programacin de alto nivel, que facilita la tarea.

ve
r

al

tri

ne

fM
ac
hi

si
on

Interrogacin directa o Query: existen facilidades para que se pueda tener acceso a los datos de
forma conversacional.

pd

2. Estructura general de una Base de Datos


En una BD se almacena informacin de una serie de objetos o elementos. Estos objetos reciben el nombre
de Entidades.
Una Entidad es cualquier ente sobre el cual se almacena informacin. Ej: Base de Datos Acadmica habr
informacin de las siguientes entidades: Alumno, Profesor, Asignatura, Especialidad, Plan de Estudio, Curso,
etc.
De cada Entidad se almacenan una serie de datos que se denominan Atributos de la Entidad. Ej: Los
Atributos de la Entidad Alumno son: DNI, Apellido y Nombres, Sexo, Fecha de Nacimiento, Ttulo
Secundario, etc.
Entidades y Atributos son conceptos abstractos.

Material recopilado y organizado por Ing. Carrizo

Pgina 2 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

En una BD, aunque la tecnologa evoluciona constantemente, la informacin de cada Entidad se almacena en
Registros, y cada Atributo en Campos de dicho registro.
Pero cada Entidad necesita Registros con una estructura especfica; es decir que en una BD hay diferentes
tipos de registros, uno por Entidad.
Un conjunto de Atributos (DNI, Apellido y Nombres, Sexo, etc.) de una Entidad (Alumno) es un
Identificador de dicha Entidad si el valor de dichos Atributos determina de forma unvoca cada uno de los
elementos de dicha Entidad y no existe ningn subconjunto de l que sea Identificador de la Entidad. Ej: en
la Entidad Alumno, el Atributo DNI es un identificador de esa Entidad.
En general, buscamos una ocurrencia de un Registro en una BD, conociendo el valor de unos o varios
campos y para que esta operacin sea rpida, estos campos deben estar definidos en la BD como Clave o
Llave de bsqueda de dicho registro.
Una Clave es un campo (Ej. DNI) o conjunto de campos (Ej. DNI y Legajo) cuyos valores permiten localizar
de forma rpida la Entidad (Ej. Alumno).
En una BD se almacenan, adems de las Entidades, las relaciones existentes entre ellas.

pd

fM
ac
hi

ne

tri

al

ve
r

si
on

Ej. En la BD Acadmica antes citada hay relaciones entre las siguientes Entidades: cursos y alumnos,
alumnos y profesores, profesores y asignaturas.

Material recopilado y organizado por Ing. Carrizo

Pgina 3 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

3. Tipos de Bases de Datos


Se clasifican en tres grupos:

Jerrquicas: es un caso particular de la estructura de red.

En Red: cualquier esquema se cree para una BD jerrquica, se puede utilizar para una en red.

Relacionales: son conceptualmente distintas a las dos anteriores. En las BD relacionales se almacenan y
manipulan las relaciones entre distintas Entidades de forma totalmente diferente.

4. Base de Datos Relacionales:


Es una BD formada por Tablas, donde una Tabla (Matriz) es una estructura bidimensional (filas*columnas)
formada por una secuencia de registros (filas) del mismo tipo.
A las tablas se les imponen ciertas condiciones, razn por la cual se pueden tratar como relaciones
matemticas; por ello se llaman BD relacionales.
Las Tablas deben cumplir las siguientes condiciones:
Todos los registros (filas) de una Tabla son del mismo tipo. Ej. Todos los Alumnos cargados en el Sist.
Acadmico tienen los mismos campos: DNI (Tipo de Campo Numrico de 8 dgitos), Apellido y Nombres
(Tipo de Campo Alfabtico de 35 dgitos), etc.

En ninguna Tabla aparecen campos repetidos. Ej. Un Alumno no puede tener dos DNI.

En ninguna Tabla existen registros duplicados. Ej: Un Alumno no debiera tener dos veces el campo
especialidad cargados en la Tabla Alumno, salvo que cursara dos carreras.

El orden de los Registros (Filas) en la Tabla es indiferente; ya que en cada momento se pueden recupera
los registros en un orden particular.

En cada Tabla hay una Clave (Llave de acceso a la Tabla), formada por uno (DNI) o varios campos (DNI
+ Legajo).

ne

tri

al

ve
r

si
on

fM
ac
hi

Hoy, la mayor parte de las BD disponibles tanto para uso personal como laboral son BD Relacionales.

5. SGBD (Sistema de Gestin de Base de Datos) o DBMS (Data Base Management System).
Conjunto de software destinado a la creacin, control y manipulacin de la informacin de una BD.

pd

Un SGBD permite realizar las siguientes tareas:

Acceso a los datos desde algn lenguaje de alto nivel.

Interrogacin o recuperacin de informacin directa en modo conversacional.

Definicin del esquema de Base y de los distintos subesquemas.

Organizacin fsica de la BD y recuperacin tras los fallos del sistema.

Un SGBD, al igual que un Sistema Operativo (SO), proporciona servicios tanto a usuarios como a otros
programas.

Material recopilado y organizado por Ing. Carrizo

Pgina 4 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

Cuando un usuario piensa que est utilizando el Sistema de Gestin, lo que realmente hace es usar un
programa que le proporciona una interfaz de usuario para trabajar con l.
Algunos generadores de BD muy conocidos comercialmente son:

SQL Server (versin 2000 o 2005),

ORACLE,

SysBase,

INFORMIX,

MySQL,

PARADOX,

ACCESS, etc.

si
on

En la actualidad las BD pueden definirse como Coleccin de datos y/o documentos digitales, que pueden ser
homogneos o no, que disponen de SGBD (relacionales o documentales) y un conjunto de aplicaciones que
hacen posible su publicacin, integracin y consulta dentro o fuera de Internet.

5.1. Algunos SGBD ms conocidos en el mercado son:

ve
r

a. Microsoft SQL Server

al

Es un SGBD relacionales basada en el lenguaje Transact-SQL, capaz de poner a disposicin de muchos


usuarios grandes cantidades de datos de manera simultnea.

tri

Entre sus caractersticas figuran:


de transacciones.

Escalabilidad, estabilidad y seguridad.

Soporta procedimientos almacenados.

Incluye tambin un potente entorno grfico de administracin, que permite el uso de comandos DDL y
DML grficamente.
Permite trabajar en modo Cliente-Servidor donde la informacin y datos se alojan en el servidor y las
terminales o clientes de la red slo acceden a la informacin.
Adems permite administrar informacin de otros servidores de datos

pd

fM
ac
hi

ne

Este sistema incluye una versin reducida, llamada MSDE con el mismo motor de base de datos pero
orientado a proyectos ms pequeos, que en su versin 2005 pasa a ser el SQL Express Edition.
Microsoft SQL Server constituye la alternativa de Microsoft a otros potentes sistemas gestores de bases de
datos como son Oracle, Sybase ASE, PostgreSQL o MySQL (es BD basada en Software Libre).
Es comn desarrollar completos proyectos complementando Microsoft SQL Server y Microsoft Access a
travs de los llamados ADP (Access Data Project).
De esta forma, se completa una potente base de datos (Microsoft SQL Server) con un entorno de desarrollo
cmodo y de alto rendimiento (VBA Access) a travs de la implementacin de aplicaciones de dos capas
mediante el uso de formularios Windows.

Material recopilado y organizado por Ing. Carrizo

Pgina 5 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

Para el desarrollo de aplicaciones ms complejas (tres o ms capas), Microsoft SQL Server incluye interfaces
de acceso para varias plataformas de desarrollo, entre ellas .NET.
Microsoft SQL Server, al contrario de su ms cercana competencia, no es multiplataforma, ya que slo est
disponible en Sistemas Operativos de Microsoft.

b. Oracle
Es un SGBD relacional fabricado por Oracle Corporation.
Se considera a Oracle como uno de los sistemas de bases de datos ms completos, destacando su:

Soporte de transacciones.

Estabilidad.

Escalabilidad.

Es multiplataforma.

si
on

Su mayor defecto es su enorme precio, que es de varios miles de euros (segn versiones y licencias).
Otro aspecto que ha sido criticado por algunos especialistas es la seguridad de la plataforma, y las polticas
de suministro de parches de seguridad, modificadas a comienzos de 2005 y que incrementan el nivel de
exposicin de los usuarios. En los parches de actualizacin provistos durante el primer semestre de 2005
fueron corregidas 22 vulnerabilidades pblicamente conocidas, algunas de ellas con una antigedad de ms
de 2 aos.

ve
r

Aunque su dominio en el mercado de servidores empresariales ha sido casi total hasta hace poco,
recientemente sufre la competencia del Microsoft SQL Server de Microsoft y de la oferta de otros RDBMS con
licencia libre como PostgreSQL, MySql o Firebird.

c. Microsoft Access

tri

al

Las ltimas versiones de Oracle han sido certificadas para poder trabajar bajo Linux.

fM
ac
hi

ne

Es un SGBD Relacional creado y modificado por Microsoft (DBMS) para uso personal de pequeas
organizaciones. Es un componente de la suite Microsoft Office aunque no se incluye en el paquete
"bsico". Una posibilidad adicional es la de crear ficheros con bases de datos que pueden ser consultados
por otros programas.
Entre las principales funcionalidades de Access se encuentran:

Modificar tablas de datos.

pd

Crear tablas de datos indexadas.

Relaciones entre tablas (creacin de BD relacionales).

Creacin de consultas y vistas.

Consultas referencias cruzadas.

Consultas de accin (INSERT, DELETE, UPDATE).

Formularios.

Informes.

Llamadas a la API de Windows.

Material recopilado y organizado por Ing. Carrizo

Pgina 6 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

Interaccin con otras aplicaciones que usen VBA (resto de aplicaciones de Microsoft Office, Autocad,
etc.).

Macros.

Interconexin con entornos de BD de gran nivel (como por ejemplo SQL Server) a travs de vinculacin.

Soporte de lectura de sistemas de archivos individuales (como FoxBase y similares) a travs de


vinculacin e importacin de datos.

Adems, permite crear frontends o programa que muestra la interfaz de usuario, de BD ms potentes ya
que es un sistema capaz de acceder a tablas externas a travs de ODBC como si fueran tablas Access.
Es un software de gran difusin entre pequeas empresas (PYMES) cuyas BD no requieren de excesiva
potencia, ya que se integra perfectamente con el resto de aplicaciones de Microsoft y permite crear
pequeas aplicaciones con unos pocos conocimientos de programacin.
Tiene un sistema de seguridad de cifrado bastante primitivo y puede ser la respuesta a proyectos de
programacin de pequeo y mediano tamao.
Access es mucho Access y sus limitaciones por ahora estn basadas en el tamao de la BD y en la tarea de
multifuncin que superando ms de 20 usuarios Clientes, la BD puede fallar con bloqueos importantes.
Por lo dems, Access puede tener mas de 1.000.000 de registros sin dar ningn tipo de problemas.

ve
r

si
on

Con Access se puede hacer todo lo que uno desee, hasta la aplicacin mas compleja que podamos imaginar,
todo depende de quien programe la BD, de como se estructure y de las consultas que realiza a las tablas.
Est claro que utilizar ndices ayuda a Access para agilizar la DB, pero es aconsejable no utilizarlos si deseas
manejar muchos Datos, as evitamos Bloqueos y el mal de Access, lo ideal es, que tu base de datos de
Access se mueva, relacione y busque la informacin con instrucciones SQL no muy complejas, se gana,
potencia y rigidez con Access.

al

Para BD de gran calibre (en cuanto a volumen de datos o de usuarios) es recomendable usar otros sistemas
como MySQL o Microsoft SQL Server, y cdigo VBA (Visual Basic para Aplicaciones).

tri

Entre sus mayores inconvenientes figuran que no es multiplataforma, pues slo est disponible para
sistemas operativos de Microsoft, y que no permite transacciones.

pd

fM
ac
hi

ne

Su uso es inadecuado para grandes proyectos de software que requieren tiempos de respuesta crticos o
muchos accesos simultneos a la BD.

Material recopilado y organizado por Ing. Carrizo

Pgina 7 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

Material de Lectura: Qu se entiende por Arquitectura Cliente-Servidor


Esta arquitectura consiste bsicamente en que un programa el Cliente informtico realiza peticiones a otro
programa, el servidor, que les da respuesta.
Aunque esta idea se puede aplicar a programas que se ejecutan sobre una sola computadora es ms
ventajosa en un Sistema Operativo multiusuario distribuido a travs de una red de computadoras.
En esta arquitectura la capacidad de proceso est repartida entre los Clientes y los Servidores, aunque son
ms importantes las ventajas de tipo organizativo debidas a la centralizacin de la gestin de la informacin
y la separacin de responsabilidades, lo que facilita y clarifica el diseo del sistema.
La separacin entre Cliente y Servidor es una separacin de tipo lgico, donde el servidor no se ejecuta
necesariamente sobre una sola mquina ni es necesariamente un slo programa.
Una disposicin muy comn son los sistemas multicapa en los que el servidor se descompone en diferentes
programas que pueden ser ejecutados por diferentes computadoras aumentando as el grado de
distribucin del sistema.

Ventajas de la arquitectura Cliente-Servidor

si
on

La arquitectura Cliente-Servidor sustituye a la arquitectura monoltica en la que no hay distribucin,


tanto a nivel fsico como a nivel lgico.

Centralizacin del control: los accesos, recursos y la integridad de los datos son controlados por el
servidor de forma que un programa cliente defectuoso o no autorizado no pueda daar el sistema.

Escalabilidad: se puede aumentar la capacidad de clientes y servidores por separado.

ve
r

al

El Servidor de cliente es la arquitectura de red que separa al cliente (a menudo un uso que utiliza un
interfaz utilizador grfico) de un servidor.

tri

Cada caso del software del cliente puede enviar peticiones a un servidor.

pd

fM
ac
hi

ne

Los tipos especficos de servidores incluyen los servidores web, los servidores del uso, los servidores de
archivo, los servidores terminales, y los servidores del correo. Mientras que sus propsitos varan algo, la
arquitectura bsica sigue siendo igual.

Material recopilado y organizado por Ing. Carrizo

Pgina 8 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

6.

Lenguaje de Consulta Estructurado SQL

Es un lenguaje de consulta comercial que proporciona una interfaz ms amigable al usuario.

El Lenguaje de Consulta Estructurado (Structured Query Language) es un lenguaje declarativo de


acceso a bases de datos relacionales que permite especificar diversos tipos de operaciones sobre las
mismas. Una de sus caractersticas es el manejo del lgebra y el clculo relacional permitiendo
lanzar consultas con el fin de recuperar informacin de inters de una base de datos, de una forma
sencilla.

Es un lenguaje de cuarta generacin (4GL).

Las partes ms importantes del SQL son:

DDL: Lenguaje de definicin de datos (que nos permite crear las estructuras )

DML: Lenguaje de manipulacin de datos (que nos permite tener acceso a las estructuras para suprimir,
modificar e insertar)

La estructura bsica de una expresin en SQL contiene 3 partes: Select, From y Where.

si
on

o La clusula Select se usa para listar los atributos que se desean en el resultado de una consulta.
o From, Lista las relaciones que se van a examinar en la evaluacin de la expresin.

ve
r

o Where, es la definicin de las condiciones a las que puede estar sujeta una consulta.
La consulta tpica de SQL tiene la siguiente forma:

al

Select A1,A2,A3...An From r1,r2,r3...rm Where Condicin(es)

tri

Donde:

A1,A2,A3...An: Representan a cada atributo(s) o campos de las tablas de la base de datos


relacional.

r1,r2,r3...rm: Representan a la(s) tabla(s) involucradas en la consulta.

fM
ac
hi

ne

Condicin: Es el enunciado que rige el resultado de la consulta.

pd

Si se omite la clusula Where, la condicin es considerada como verdadera, la lista de atributos


(A1,A2..An) puede sustituirse por un asterisco (*), para seleccionar todos los atributos de todas las
tablas que aparecen en la clusula From.

Los orgenes del SQL estn ligados a los de las bases de datos relacionales.
En 1970 E. F. Codd propone el modelo relacional y asociado a este un sublenguaje de acceso a los datos
basado en el clculo de predicados.
SQL (Structured Query Language) es un lenguaje de programacin diseado para almacenar, manipular y
recuperar datos almacenados en bases de datos relacionales.
La primera encarnacin de SQL apareci en 1974, cuando un grupo de IBM desarroll el primer prototipo de
una base de datos relacional. Relational Software (luego se convirti en Oracle) lanz la primera base de
datos relacional comercial.
Existen estndares para SQL.

Material recopilado y organizado por Ing. Carrizo

Pgina 9 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

Sin embargo, el SQL que puede utilizarse en cada uno de las principales RDBMS actuales viene en distintas
formas.
Esto se debe a dos razones:
1. El estndar SQL es bastante complejo, y no es prctico implementar el estndar completo, y
2. Cada proveedor de BD necesita una forma de diferenciar su producto de otros.

6.1. Para qu utilizamos los comandos SQL?


El uso comn es la seleccin de datos desde tablas ubicadas en una base de datos.
Inmediatamente, vemos dos palabras claves: necesitamos SELECT la informacin FROM una tabla, donde
la tabla es un contenedor que reside en la BD donde se almacena la informacin.
Las tablas son la estructura bsica donde se almacena la informacin en la base de datos.
Dado que en la mayora de los casos, no hay forma de que el proveedor de base de datos sepa con
antelacin cuales son sus necesidades de almacenamiento de datos, es probable que necesite crear tablas
en la base de datos usted mismo.

si
on

Muchas herramientas de BD permiten crear tablas sin ingresar SQL, pero debido a que las tablas son los
contenedores de toda la informacin.

ve
r

La sintaxis Create Table permite crear una tabla contituida por diferentes campos de distintos tipos de
datos. Algunos tipos de datos son: un entero (tal como 1), un nmero real (tal como 0,55), una lnea (tal
como 'sql'), una fecha/expresin de tiempo (tal como '25-ene-2000 03:22:22'), o incluso en formato binario.
Cuando especificamos una tabla, necesitamos especificar el tipo de dato asociado con cada columna (es
decir, especificaremos que First_Name es de char (50) tipo lo que significa que es una lnea con 50
caracteres).

al

La sintaxis SQL para CREATE TABLEes

fM
ac
hi

ne

tri

CREATE TABLE "nombre_tabla" ("columna 1" "tipo_de_datos_para_columna_1", "columna 2"


"tipo_de_datos_para_columna_2", ... )

El SQL trabaja con estructura Cliente/Servidor sobre una red de ordenadores.


El ordenador cliente es el que inicia la consulta; el ordenador servidor es que atiende esa consulta.

pd

El cliente utiliza toda su capacidad de proceso para trabajar; se limita a solicitar datos al ordenador servidor,
sin depender para nada ms del exterior. Estas peticiones y las respuestas son transferencias de textos que
cada ordenador cliente se encarga de sacar por pantalla, presentar en informes tabulados, imprimir,
guardar, etc., dejando el servidor libre.
El SQL permite:

Definir una base de datos mediante tablas.

Almacenar informacin en tablas.

Seleccionar la informacin que sea necesaria de la base de datos.

Realizar cambios en la informacin y estructura de los datos.

Combinar y calcular datos para conseguir la informacin necesaria.

Material recopilado y organizado por Ing. Carrizo

Pgina 10 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

SQL es el lenguaje de comunicacin entre el programa cliente y programa servidor, el motor de base de
datos es un programa servidor, en el que est la base de datos propiamente dicha.

El usuario accede con alguno de los programas cliente disponibles para realizar requerimientos al motor.
En este manual se explica como emplear SQL para:
Crear y modificar la estructura de una tabla de datos.

Seleccionar informacin de una tabla.

Aadir datos a una tabla.

Introducir informacin en una tabla.

Realizar consultas entre tablas con campos comunes.

pd

fM
ac
hi

ne

tri

al

ve
r

si
on

Material recopilado y organizado por Ing. Carrizo

Pgina 11 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

7. Datawarehouse (DW) y Datamining (DM)


Hoy en da las empresas cuentan en su mayora con la automatizacin de sus procesos, manejando

gran cantidad de datos en forma centralizada y manteniendo sus sistemas en lnea. En esta informacin

descansa el know-how de la empresa, constituyendo un recurso corporativo primario y parte importante de


su patrimonio.

El nivel competitivo alcanzado en las empresas les ha exigido desarrollar nuevas estrategias de

gestin. En el pasado, las organizaciones fueron tpicamente estructuradas en forma piramidal con

informacin generada en su base fluyendo hacia lo alto; y era en el estrato de la pirmide ms alto donde se
tomaban decisiones a partir de la informacin proporcionada por la base, con un bajo aprovechamiento del
potencial de esta informacin. Estas empresas, han reestructurado y eliminado estratos de estas pirmides y
han autorizado a los usuarios de todos los niveles a tomar mayores decisiones y responsabilidades. Sin
embargo, sin informacin slida para influenciar y apoyar las decisiones, la autorizacin no tiene sentido.

Esta necesidad de obtener informacin para una amplia variedad de individuos es la principal razn

de negocios que conduce al concepto de Datawarehouse. El nfasis no est slo en llevar la informacin

hacia lo alto sino que a travs de la organizacin, para que todos los empleados que la necesiten la tengan a

si
on

su disposicin.

El DW convierte entonces los datos operacionales de una organizacin en una herramienta

competitiva, por hacerlos disponibles a los empleados que lo necesiten para el anlisis y toma de decisiones.

ve
r

Una herramienta que surge de la mano del DW se denomina Data Mining, asociada a la extraccin

de oro de las rocas, extraer informacin oculta y predecible de grandes bases de datos, informacin que

al

puede aportar nuevos enfoques de nuestros propios negocios, hechos que acontecen con nuestros clientes

tri

que no los vemos a simple vista, pero se encuentran ocultos en ese cmulo de datos de transacciones que
para la empresa.

ne

tan celosamente custodiamos, informacin que si la aprovechamos pueden generar beneficios adicionales

El DM es una poderosa tecnologa nueva con gran potencial que ayuda a las compaas a

fM
ac
hi

concentrarse en la informacin ms importante de sus Bases de Informacin (DataWarehouse).

DM es una tecnologa de soporte para usuario final cuyo objetivo es extraer conocimiento til y

utilizable a partir de la informacin contenida en las bases de datos de las empresas

Las dos herramientas presentadas tienen por objetivo manejar eficientemente la informacin de

cada rea de la empresa, se pueden tomar mejores decisiones y as efectuar acciones apropiadas y

pd

finalmente conseguir un mejor control sobre la produccin empresarial.

Un Datawarehouse es una coleccin de datos en la cual se encuentra integrada la

informacin de una Institucin y que se usa como soporte para el proceso de toma de decisiones
gerenciales.

Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un

Warehouse, la experiencia ha demostrado que existen muchas dificultades potenciales.

La importante necesidad de informacin existente en la empresa, necesita ser satisfecha mediante

algn medio y es lo ms deseable que se realice de la forma ms eficiente posible.

Pero Qu limitaciones existen para satisfacer esta necesidad con la base de datos con la que

operan nuestros sistemas de transacciones?

Material recopilado y organizado por Ing. Carrizo

Pgina 12 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

Mediante un sistemas de informes o consultas avanzadas, sobre nuestra base de transacciones (las

cuales generalmente aplican modelos relacionales u objeto-relacionales), realizando la unin de las tablas
que uno desea y mediante la aplicacin de filtros utilizando los operadores clsicos: concatenacin,

proyeccin, seleccin, agrupamiento, (en SQL y extensiones), se puede realizar una aproximacin a las
necesidades habientes.

Pero Es esto lo que realmente se necesita?

Este planteamiento implica trabajar sobre una gran base de datos, con complejas relaciones entre

las tablas, o incluso con datos que se encuentran en distintas bases de datos, que pueden o no estar
correctamente validados y lo mas importante se debe conocer de antemano las consultas que se pueden

necesitar hacer, situacin solo se conoce efectivamente en el momento que se realiza el proceso de toma de
decisiones (lo que implicara un retraso en este proceso hasta que la consulta sea desarrollada u otra opcin
de muy improbable aplicacin ensearle a los gerentes a manejar SQL), problemas de inconsistencia,
inflexibilidad y carencia de integracin a travs de la empresa.

Con el objetivo de satisfacer esta necesidad de la manera ms eficaz y eficiente, ofreciendo la

si
on

flexibilidad que se requiere es que surge el concepto de Datawarehousing.


7.1. DW Empresarial

Almacenamiento, transformacin y distribucin de datos tiles para los responsables de tomar

Es un proceso que recopila datos de varias aplicaciones, en los sistemas operacionales de una

ve
r

decisiones

al

organizacin, integra la informacin en un modelo lgico, la almacena de modo que resulte accesible a

tri

los tomadores de decisiones y se las provee a travs de herramientas de consulta y generacin de


informes. El objetivo es poner informacin corporativa comparable y estandarizada en manos de

ne

Es un depsito de datos histricos extrados de bases de datos operacionales que pueden ser consultadas
para detectar tendencias comerciales o para soporte a la toma de decisiones.

fM
ac
hi

empleados para permitir una visin corporativa amplia de la empresa.

El objetivo principal es satisfacer los requerimientos de informacin internos de la empresa para una

mejor gestin, con eficiencia y facilidad de acceso.

pd

El DW puede verse como una bodega donde estn almacenados todos los datos necesarios para realizar

las funciones de gestin de la empresa, de manera que puedan utilizarse fcilmente segn se necesiten. El
contenido de los datos, la organizacin y estructura son dirigidos a satisfacer las necesidades de informacin
de analistas.

Los sistemas transaccionales son dinmicos, en el sentido que constantemente se encuentran

actualizando datos.

Los almacenes de datos (o Datawarehouse) generan bases de datos tangibles con una perspectiva

histrica, utilizando datos de mltiples fuentes que se fusionan en forma congruente. Estos datos se
mantienen actualizados, pero no cambian al ritmo de los sistemas transaccionales. Muchos datawarehouses
se disean para contener un nivel de detalle hasta el nivel de transaccin, con la intencin de hacer
disponible todo tipo de datos y caractersticas, para reportar y analizar.

Material recopilado y organizado por Ing. Carrizo

Pgina 13 de 14

Universidad Tecnolgica Nacional - Facultad Crdoba


Dptos. Ingeniera Industrial y Mecnica

Informtica I Fundamentos de Informtica

As, un Datawarehouse resulta ser un recipiente de datos transaccionales para proporcionar consultas

operativas, y la informacin para poder llevar a cabo anlisis multidimensional.

Un datawarehouse es una coleccin de datos orientada al negocio, integrada, variante en el tiempo y no

al

ve
r

si
on

voltil para el soporte del proceso de toma de decisiones de la empresa

tri

Los objetivos que persigue son:

Permitir el acceso a los datos de la organizacin en forma inmediata, sobre demanda y con alta

Manejar datos consistentes

El datawarehouse no es solo datos sino un conjunto de herramientas para consultar, analizar y presentar
informacin.

Ser el lugar donde se publican los datos que se usan en la organizacin.

La calidad de los datos en el datawarehouse debe ser una meta para la reingeniera del negocio.

pd

Permitir que los datos puedan ser separados y combinados

fM
ac
hi

performance.

ne

Material recopilado y organizado por Ing. Carrizo

Pgina 14 de 14

Potrebbero piacerti anche