Sei sulla pagina 1di 46

BASES DE DATOS SIC426

Ing. Rosa Navarrete, MSc.

11
Contenido

2. SISTEMAS DE BASE DE DATOS


2.1 Sistemas de archivo vs. DBMS
2.2 Evolucin de DBMS
2.3 Arquitectura de Base de datos
2.4 Usuarios de Base de datos

2
2. Sistemas de BD

Concepto de Base de Datos


La Federacin Internacional de Documentacin (FID)
define las bases de datos como: Conjunto de datos
homogneos, ordenados de una forma estructurada
que se presenta en forma legible por ordenador y se
refiere a una materia determinada, organizacin o
problema.
ANSI SQL 93: Conjunto de datos consistente y
usualmente persistente, organizado en un modo
sistemtico especfico que permita acceder a su
contenido de forma pertinente, fcil y rpida.
3
4
2.1 Sistemas de archivo vs. DBMS

En los primeros aos (dcada de los 70 y principios de los 80),


las aplicaciones de BD se construan directamente sobre los
sistemas de ficheros, lo cual tena muchas desventajas:
Redundancia e inconsistencia de los datos
Mltiples formatos de ficheros, duplicacin de informacin en
diferentes ficheros.
Ejemplo
Cuenta (nombre, direccion, telf, ci, cantidad)
Ingreso (nombre, direccion, telf, ci, cantidad, fecha)
Las actualizaciones de la informacin deba hacerse en mltiples
fuentes, por tanto daba lugar a inconsistencia.

5
2.1 Sistemas de archivo vs. DBMS

Datos aislados
Mltiples formatos y ficheros. Al trabajar con archivos de datos, las aplicaciones
se tienen que escribir para la estructura especfica de cada archivo de datos (ej.
un archivo de excel).
Problemas de integridad
Restricciones de integridad como sexo= M o F se encuentra en el cdigo del
programa y no establecido explcitamente en la estructura del fichero.
Difcil y costoso el modificar o aadir nuevas restricciones (altura>=0,
fecha>=hoy, etc.)
Dificultad en el acceso a los datos
Necesidad de escribir un programa para realizar cada proceso

6
2.1 Sistemas de archivo vs. DBMS

Atomicidad de las actualizaciones


Prdida de consistencia por realizacin de actualizaciones parciales.
Ejemplo: Transferencia de fondos de una cuenta a otra (debe restarse una
cantidad de una cuenta y sumarse esa misma cantidad a la otra, o no hacerse
nada).
Acceso concurrente por mltiples usuarios
Necesidad de acceso concurrente para incrementar el rendimiento
Acceso concurrente bajo control para evitar inconsistencias
Ejemplo: Se ha de impedir que dos personas estn actualizando la misma
cuenta corriente al tiempo.
Problemas de seguridad
Acceso restringido por perfil de usuario a datos y/o determinadas acciones
(actualizar cuenta, leer datos personales, insertar clientes, etc.).
Ejemplo: un profesor solo puede acceder a los registros de los estudiantes de
sus asignaturas, no de otras asignaturas.
7
2.1 Sistemas de archivo vs. DBMS

Ventajas de los DBMS.


Globalizacin de la informacin: recurso corporativo al servicio
de toda la organizacin
Elimina la redundancia.
Elimina la inconsistencia de datos.
Permite un fcil acceso a los datos.
Independencia de datos (separacin entre programas de
aplicacin y datos). Como en un archivo de datos, una base de
datos presenta informacin directamente al usuario. El DBMS
soporta a las aplicaciones para que utilicen distintas bases de
datos, sin tener que depender de formatos de datos especficos.

8
2.1 Sistemas de archivo vs. DBMS

Ventajas de los DBMS


Elimina problemas de seguridad (vulnerabilidad a cambios no
autorizados o prdida de datos).
Elimina anomalas de acceso concurrente debido al uso
simultneo por parte de multiples usuarios.
Elimina problemas de integridad con el uso de restricciones
para los datos.
Traduce las reglas de negocio al manejo de los datos
contextualizados.

9
2.2 Evolucin de DBMS

1950s and early 1960s:


Data processing using magnetic tapes for storage
Tapes provided only sequential access

Punched cards for input


Late 1960s and 1970s:
Hard disks allowed direct access to data
Network and hierarchical data models in widespread use
Ted Codd defines the relational data model
Would win the ACM Turing Award for this work

IBM Research begins System R prototype

UC Berkeley begins Ingres prototype

High-performance (for the era) transaction processing

10
2.2 Evolucin de DBMS

1980s:
Research relational prototypes evolve into commercial systems
SQL becomes industrial standard

Parallel and distributed database systems


Object-oriented database systems
1990s:
Large decision support and data-mining applications
Large multi-terabyte data warehouses
Emergence of Web commerce
Early 2000s:
XML and XQuery standards
Automated database administration
Later 2000s:
Giant data storage systems
Google BigTable, Yahoo PNuts, Amazon, ..
11
2.3 Arquitectura de base de datos

12
2.3 Arquitectura de base de datos
ANSI-SPARC (1975) propuso la arquitectura en tres niveles para
conseguir la separacin entre los programas de aplicacin y los datos
Nivel interno: Describe la estructura de almacenamiento fsico de
base de datos (rboles B+, montones, estructura de ndices). Los
datos se almacenan en este nivel. Cada DBMS implementa su propio
nivel interno. No estndar.
Nivel conceptual: Representacin del conjunto de datos
correspondiente al problema de informacin a gestionar. Recoge el
esquema conceptual, esto es, la estructura de la base de datos en
trminos de elementos lgicos (entidades, atributos, relaciones y
restricciones), ocultando los detalles fsicos de almacenamiento.
Nivel externo o de vistas: Esquemas que recogen las distintas
perspectivas de los usuarios y/o aplicaciones para cada proceso
(compras, matrcula, expedientes, etc.). Permiten ocultar informacin
por cuestiones de seguridad (Ley de proteccin de datos, datos
sensibles para la seguridad de una empresa, etc.)
13
2.3 Arquitectura de base de datos

Abstraccin de datos
NIVEL INTERNO (esquema interno)
(estructura fsica de la BD)
Describe la estructura fsica del almacenamiento de
la BD
Estrategia de almacenamiento
Algoritmos de indexacin
Compresin de datos
Caminos de acceso
Una sola visin (no lo percibe el usuario)

14
2.3 Arquitectura de base de datos

NIVEL CONCEPTUAL (visin de la organizacin)


Describe la estructura de toda la BD para la
organizacin
Como se ha definido la estructura de la BD.
(Todos los datos, sus relaciones, consideraciones
del modelo)
Restricciones de integridad y confidencialidad
Una sola visin corporativa

15
2.3 Arquitectura de base de datos

NIVEL DEL USUARIO (visin del usuario)


Describe la BD en los trminos que interesa a cada
usuario
Datos y relaciones que necesite
Restricciones de uso (que puede hacer el usuario)
Aplicaciones (tantas visiones como perfiles de
usuarios)

16
Abstraccin de datos ..

Las abstracciones permiten que:


La informacin solicitada por el usuario en
trminos del esquema externo sea
Correctamente extrada de la BD en trminos del
esquema conceptual y
Recuperada del almacenamiento fsico en trminos
del esquema interno.

17
2.3 Arquitectura de base de datos
Aplicacin
Aplicacin de Aplicacin de de
NIVEL DE
cuentas corporativas cuentas personales Prstamos
USUARIO

Modelo de Datos de Modelo de datos


NIVEL de cuentas De Prstamos
CONCEPTUAL

DBMS

NIVEL FISICO BASES DE


DATOS
18
2.3 Arquitectura de base de datos

La arquitectura de tres niveles es til para explicar el concepto


de independencia de datos:
Independencia lgica: capacidad de cambiar el nivel
conceptual sin tener que cambiar las vistas ni los programas de
aplicacin
Aadir restricciones de dominio, incorporar un nuevo atributo,
aadir nuevas relaciones,
Independencia fsica: capacidad de cambiar el nivel interno
sin tener que cambiar ni el nivel conceptual ni nivel externo.
Aadir ndices, ampliar espacio de almacenamiento, realizar
particiones, etc.

19
Elementos de una base de datos

En una base de datos se tienen 4 elementos:


1. Datos.- Deben cumplir 2 condiciones:
Deben ser integrados, es decir, recogen toda la
informacin (tratando de eliminar redundancia).
Deben ser compartidos a nivel de aplicacin.

2. Hardware.- El hardware se refiere a los volmenes de


almacenamiento secundario. Tpicamente los discos es donde
reside fsicamente la base de datos.
3. Software.- El SGBD (Sistema gestor de bases de datos) (Data
Base Management System, DBMS), es el encargado de
gestionar la base de datos, (administrar su contenido, garantizar
consistencia, persistencia, estabilidad, disponibilidad); esto es,
debe ofrecer facilidades para la insercin, borrado y
modificacin de la informacin, adicionalmente presentar una
interfaz abstracta al usuario.

20
2.4 Usuarios de la BD

4. Usuarios.
Programadores de aplicaciones.- disear y
programar las aplicaciones necesarias para la
utilizacin de la bases de datos, realizando las
peticiones pertinentes al SGBD.
Usuario final.- trabaja sobre los datos
almacenados en la base de datos. Hay usuarios
finales avanzados que por medio del lenguaje de
interrogacin SQL pueden acceder a los datos.
Administrador de base de datos.- Disear,
modificar la estructura de la base de datos.
Gestionar asignacin de almacenamiento,
respaldos y recuperacin de la BD.

21
Clasificacin de las bases de datos

Segn el contenido
Bases de datos bibliogrficas
Solo contienen un surrogante (representante) de la
fuente primaria, que permite localizarla. Un registro
tpico de una base de datos bibliogrfica contiene
informacin sobre el autor, fecha de publicacin,
editorial, ttulo, edicin, de una determinada
publicacin, etc. Puede contener un resumen o
extracto de la publicacin original.
Bases de datos de texto completo o
documentales
Almacenan las fuentes primarias, como por ejemplo,
todo el contenido de todas las ediciones de una
coleccin de revistas cientficas.
22
Tipos de bases de datos

Bases multimediales (imgenes, audio, video) Un ejemplo


son las bases de datos geogrficas; las bases de datos para
reconocimiento de patrones faciales.
Bases de datos o "bibliotecas" de informacin biolgica
Son bases de datos que almacenan diferentes tipos de
informacin proveniente de las ciencias de la vida o mdicas. Un
ejemplo son las bases de datos para identificacin de genotipos
(ADN).
Directorios
Un ejemplo son las guas telefnicas en formato electrnico.
Bases de datos empresariales. Mantienen informacin para
el soporte del manejo empresarial. Son soportes transaccionales
o de toma de decisiones.

23
Segn su almacenamiento
Bases de datos centralizadas
Datos almacenados en repositorios localizados en un nico
servidor o un cluster de servidores
Bases de datos distribuidas
Se almacenan en ms de un lugar fsico
Poseen una base de datos central duplicada en todos los
puntos remotos donde los datos se referencian con mas
frecuencia
Posee una Base de datos con un ndice central.
Base de Datos distribuida para localizar un registro lo
busca en los procesadores remotos y lo transmite al lugar
que es requerido.

24
Tipos de bases de datos

Segn su modelo de administracin de datos.


El modelo de datos es un grupo de herramientas
conceptuales para describir datos, sus relaciones, su
semntica y sus limitantes.
Los modelos de datos son abstracciones que
permiten la implementacin de un sistema eficiente
de BD; por lo general se refieren a algoritmos y
conceptos matemticos. Un modelo de datos consiste
de dos elementos:
Una notacin matemtica para expresar los datos

Operaciones en los datos para expresar consultas

25
Modelo de administracin de datos.

Se han propuesto varios modelos de


datos diferentes, los cuales pueden
dividirse en tres grupos:
Modelo lgico basado en objetos
Modelo lgico basado en registros
Modelos fsicos de datos

26
Modelo de administracin de datos

Modelo lgico basado en objetos


Estos modelos se utilizan para describir los datos en
los niveles conceptuales y de vistas. Se caracterizan
por el hecho de que perciben una estructura bastante
flexible y hacen posible especificar claramente las
restricciones de los datos.
Algunos de estos modelos son:
Modelo Entidad Relacin
Modelo orientado a objetos
Modelo Semntico de Datos
Modelo Infolgico

27
Modelo de administracin de datos

Modelos lgico basados en registros


Los modelos lgicos basados en registros se utilizan
para especificar tanto la estructura lgica general de
la base de datos como una descripcin en un nivel
ms alto de la implementacin. Los modelos de esta
divisin ms ampliamente aceptados son:
Modelo jerrquico

Modelo de red

Modelo relacional

Modelo multidimensional
28
Modelo de administracin de datos

Modelo fsico de datos


Los modelos fsicos de datos sirven para describir los
datos en el nivel ms bajo.
A diferencia de los modelos lgicos son muy pocos
los utilizados. Los ms conocidos son:
Modelo unificador
Modelo de cuadros
Los modelos fsicos de datos capturan aspectos de la
implantacin de los sistemas de base de datos.

29
Modelo de administracin de datos

Modelo jerrquico
Almacenan su informacin en una estructura
jerrquica; los datos se organizan en una forma
similar a un rbol (visto al revs), en donde un nodo
padre de informacin puede tener varios hijos. El
nodo que no tiene padres es llamado raz, y a los
nodos que no tienen hijos se los conoce como hojas.
Una de las principales limitaciones de este modelo es
su incapacidad de representar eficientemente la
redundancia de datos.
Son modelos que ya no tienen aceptacin. Ejemplos
de Gestores de BD Jerrquicas: Adabas, Focus.

30
Modelo de administracin de datos

Modelo de red
Modelo ligeramente distinto del jerrquico; su
diferencia fundamental es la modificacin del
concepto de nodo: la relacin jerrquica no es
estrictamente obligatoria, se permite que un mismo
nodo tenga varios padres, de manera que pueden
establecerse relaciones entre nodos hermanos. La
estructura en forma de rbol se convierte en una
estructura en forma de grafo dirigido.
Han sido reemplazados por modelos
multidimensionales

31
Modelo de administracin de datos

Modelo orientado a objetos


Tecnologa reciente, clave para el soporte de
aplicaciones multimediales orientadas a la web y con
lenguajes de desarrollo orientados a objetos.
Usa los conceptos de objetos, encapsulamiento,
herencia
La capacidad de encapsulamiento permite manejar
de mejor forma los datos complejos
La herencia permite crear nuevos objetos con
propiedades similares

32
Modelo de administracin de datos

Modelo relacional
Se basa en una percepcin del mundo real que
consiste en un conjunto de objetos bsicos llamados
entidades y relaciones entre estos objetos
EL objetivo es describir el sistema en trminos de
entidades y las relaciones entre entidades
Considera que todos los datos de la base de datos
estn almacenados en forma de tablas simples y
tablas de relaciones entre ellas
Este modelo puede enlazar elementos de varias
tablas para dar informacin a usuarios

33
Sistema de gestin de base de datos

Data Base Management System (DBMS)


Sistema de Gestin de Bases de datos (SGBD)
Software desarrollado a partir de programas y
archivos interrelacionados.
El sistema de base de datos se divide en mdulos
que tratan cada una de las responsabilidades del
sistema global.

34
Sistema de gestin de base de datos

El DBMS (Data Base Management System), es el


responsable de mantener la estructura de la base de
datos, lo que incluye:
El mantenimiento de las relaciones entre los datos de la
base de datos.
La garanta de que los datos estn correctamente
almacenados y de que no se infrinjan las reglas que definen
las relaciones entre los datos.
La recuperacin de todos los datos hasta un punto
coherente en caso de fallos del sistema.

35
Usuarios Programador de Administrador de la
inexpertos Usuarios expertos base de datos
Aplicaciones

Interfaces de aplicacin Programadores de aplicacin Consulta interactiva Esquema de la BD

Lenguaje de Lenguaje de
Procesador de
Manipulacin de datos Definicion de
consultas
DML Datos
SQL
DDL

Programas de
aplicacin Gestor de archivos DBMS

ESTRUCTURA
DEL
SISTEMA GLOBAL Archivos fsicos
de datos

Diccionario de datos 36
37
Estructura del sistema global

Gestor de Archivos:asigna espacio en disco para las


estructuras almacenadas
Gestor de base de datos: Proporciona la interfaz
entre los datos de la base de datos y los programas
Procesador de consultas: Traduce las sentencias del
Lenguaje de consulta para que entienda la base de
datos
Lenguaje de Manipulacion de datos (DML): permite
a los usuarios emplear sentencias para recuperar,
insertar, suprimir y modificar los datos de la base de
datos.
38
Estructura del sistema global

Lenguaje de de definicion de datos (DDL): define el


esquema de la base de datos asi como la estructura
de almacenamiento y definicion de tipo de datos.
Ademas requiere varias estructuras de datos para la
implementacion fisica como:
Archivos fsicos para los datos y para el log de
transacciones.
Diccionario de datos:Contiene toda la descripcion de
los objetos de una base de datos es decir son los
metadatos es decir datos de los datos
Indices:Proporcionan acceso rapido a determinados
datos.
39
Sistema de gestin de base de datos

Un DBMS debe garantizar:


Integridad, debe asegurar que la
informacin que se almacena en la BD es
exacta y que no es posible que se corrompa
por el uso o a lo largo del tiempo.
Disponibilidad, la BD debe estar disponible
para almacenar, modificar o recuperar
informacin, en cualquier momento

40
Sistema de gestin de base de datos

Concurrencia, la BD debe permitir el acceso


simultneo a la informacin que contiene, a
muchos usuarios.
Escalabilidad, la BD debe permitir
almacenar grandes cantidades de informacin
y facilitar el acceso a los datos a gran
velocidad, aunque aumente la informacin
almacenada, el nmero de usuarios o la
actividad de los mismos.

41
Sistema de gestin de base de datos

Seguridad, que incluye aspectos como:


asegurar la confidencialidad de la
informacin, controlar los privilegios de
acceso a los datos por parte de los usuarios,
garantizar la recuperacin de la informacin
en caso de accidentes o desastres, naturales
o provocados.

42
Tipos de DBMS

Se puede clasificar a los DBMS, por el tipo de


soporte de hardware que requieren o la
finalidad que tienen:
Los destinados a ordenadores personales o
incluso agendas electrnicas u organizadores
personales (PDA, Portable Digital Assistant).
Los destinados a soporte empresarial, que
requieren grandes servidores.

43
Tipos de DBMS

Tambin pueden clasificarse por su


estructura:
Relacional (RDBMS)
De objetos (OODBMS)
Objeto-relacionales (ORDBMS)

44
Aplicaciones de las bases de datos

A partir de los 80, se diferencian dos tipos de


aplicaciones para las BD:
OLTP (On Line Transaction Processing),
aplicacin en la cual el sistema debe
responder en lnea (inmediato) a las
peticiones del usuario. Cada peticin se
conoce como transaccin (ejemplos:
facturacin, inventario, cajeros de puntos de
venta, etc).
45
Aplicaciones de las bases de datos

OLAP (On Line Analytical Processing),


aplicacin que permite el anlisis de la
informacin almacenada en una BD.
(ejemplos: anlisis de tendencias de venta,
presupuestos, pronsticos de clima, etc.)
Dentro de esto caben las aplicaciones de
explotacin de minera de datos: Data Mining,
Data Warehouse, que soportan lo que se
denomina Business Intelligence

46

Potrebbero piacerti anche