Sei sulla pagina 1di 5

Una base de datos relacional es una

base de datos que cumple con el modelo

relacional, el cual es el modelo ms utilizado en la actualidad para implementar bases


de datos ya planificadas. Permiten establecer interconexiones (relaciones) entre los datos (que estn guardados en tablas), y a travs de dichas conexiones relacionar los datos de ambas tablas, de ah proviene su nombre:"Modelo Relacional". Tras ser postuladas sus bases en 1970 por Edgar Frank Codd, de los laboratorios IBM en San Jos (California), no tard en consolidarse como un nuevo paradigma en los modelos de base de datos.
1

Un sistema de gestin de bases de datos (SGBD o DBMS Database Management System ) consiste en una coleccin de datos interrelacionados y un conjunto de programas que permiten a los usuarios acceder y modificar dichos datos. La coleccin de datos se denomina base de datos. La arquitectura de un sistema de base de datos est influenciada en gran medida por el sistema informtico subyacente en el que se ejecuta el sistema de base de datos. En la arquitectura de un sistema de base de datos se reflejan aspectos como la conexin en red:

Base de datos Distribuidas Base de datos Paralelas

SGBD paralelo: Un SGBD que se ejecuta sobre mltiples procesadores y discos que han sido diseados para ejecutar operaciones en paralelo, cuando sea posible, con el propsito de mejorar el rendimiento. Los sistemas paralelos mejoran la velocidad de procesamiento y de E/S mediante la utilizacin de UCP y discos en paralelo. La fuerza que ha impulsado a los sistemas paralelos de bases de datos ha sido la demanda de aplicaciones que han de manejar bases de datos extremadamente grandes (del orden de terabytes, esto es, 1012 bytes) o que tienen que procesar un nmero enorme de transacciones por segundo (del orden de miles de transacciones por segundo).

Los sistemas paralelos de base de datos constan de varios procesadores y varios discos conectados a travs de una red de interconexin de alta velocidad. Para medir el rendimiento de los sistemas de base de datos existen 2 medidas principales: La productividad (throughput) que se entiende como el nmero de tareas que pueden completarse en un intervalo de tiempo determinado. El tiempo de respuesta (response time) que es la cantidad de tiempo que necesita para completar una nica tarea a partir del momento en que se enve. Un sistema que procese un gran nmero de pequeas transacciones puede mejorar su productividad realizando muchas transacciones en paralelo. Un sistema que procese transacciones ms largas puede mejorar tanto su productividad como sus tiempos de respuesta realizando en paralelo cada una de las subtareas de cada transaccin. Modelos de Arquitectura Memoria compartida. Todos los procesadores comparten una memoria comn. Disco compartido. Todos los procesadores comparten un disco comn. Sin compartimiento. Los procesadores no comparten ni memoria ni disco. Jerrquico. Es un hbrido de las anteriores.

El objetivo del paralelismo en los sistemas de bases de datos suele ser asegurar que la ejecucin del sistema continuar realizndose a una velocidad aceptable, incluso en el caso de que aumente el tamao de la base de datos o el nmero de transacciones (ampliabilidad).

1.Memoria compartida En una arquitectura de memoria compartida los procesadores y los discos tienen acceso a una memoria comn, normalmente a travs de un bus o de una red de interconexin. El beneficio de la memoria compartida es la extremada eficiencia en cuanto a la comunicacin entre procesadores; cualquier procesador puede acceder a los datos de la memoria compartida sin necesidad de la intervencin del software. Un procesador puede enviar mensajes a otros procesadores utilizando escrituras en la memoria de modo que la velocidad de envo es mucho mayor (normalmente es inferior a un microsegundo) que la que se alcanza con un mecanismo de comunicacin. El inconveniente de las mquinas con memoria compartida es que la arquitectura no puede ir ms all de 32 o 64 procesadores porque el bus o la red de interconexin se convertiran en un cuello de botella (ya que est compartido por todos los procesadores). Llega un momento en el que no sirve de nada aadir ms procesadores, ya que stos emplean la mayora de su tiempo esperando su turno para utilizar el bus y as poder acceder a la memoria. Las arquitecturas de memoria compartida suelen dotara cada procesador de una memoria cach muy grande para evitar las referencias a la memoria compartida siempre que sea posible. No obstante, en la cach no podrn estar todos los datos y no podr evitarse el acceso a la memoria compartida. Adems, las cachs necesitan mantener la coherencia; esto es, si un procesador realiza una escritura en una posicin de memoria, los datos de dicha posicin de memoria se deberan actualizar e no eliminar de cualquier procesador donde estuvieran los datos en cach. El mantenimiento de la coherencia de la cach aumenta la sobre carga cuando aumenta el nmero de procesadores. Por estas razones las mquinas con memoria compartida no pueden extenderse llegado un punto; las mquinas actuales con memoria compartida no pueden soportar ms de 64 procesadores.

2.Disco compartido En el modelo de disco compartido todos los procesadores pueden acceder directamente a todos los discos a travs de una red de interconexin, pero los procesadores tienen memorias privadas. Las arquitecturas de disco compartido ofrecen dos ventajas respecto de las de memoria compartida. Primero, el bus de la memoria deja de ser un cuello de botella, ya que cada procesador dispone de memoria propia. Segundo, esta arquitectura ofrece una forma barata para proporcionar una cierta tolerancia ante fallos: si falla un procesador (o su memoria) los dems procesadores pueden hacerse cargo de sus tareas, ya que la base de datos reside en los discos, a los cuales tienen acceso todos los procesadores. Utilizando una arquitectura RAID tambin puede conseguirse que el subsistema de discos sea tolerante ante fallos por s mismo. La arquitectura de disco compartido tiene aceptacin en bastantes aplicaciones. El problema principal de los sistemas de discos compartidos es ,de nuevo, la ampliabilidad. Aunque el bus de la memoria no es cuello de botella muy grande, la inter conexin con el subsistema de discos es ahora el nuevo cuello de botella; esto es especialmente grave en situaciones en las que la base de datos realiza un gran nmero de accesos a los discos. Los sistemas de discos compartidos pueden soportar un mayor nmero de procesadores en comparacin con los sistemas de memoria compartida, pero la comunicacin entre los procesadores es ms lenta (hasta unos pocos milisegundos si se carece de un hardware de propsito especial para comunicaciones), ya que se realiza a travs de una red de interconexin. Las agrupaciones DEC con Rdb constituyen uno de los primeros usuarios de la arquitectura de bases de datos de disco compartido (Rdb ahora es propiedad de Oracle y se denomina Oracle Rdb. Digital Equipment Corporation (DEC) es ahora propiedad de Compaq).

Arquitectura de SBDP 3.Sin compartimiento En un sistema sin compartimiento cada nodo de la mquina consta de un procesador, memoria y uno o ms discos. Los procesadores de un nodo pueden comunicarse con un procesador de otro nodo utilizando una red de interconexin de alta velocidad. Un nodo funciona como el servidor de los datos almacenados en los discos que posee. El modelo sin compartimiento salva el inconveniente de requerir que todas las operaciones de E/S vayan a travs de una nica red de interconexin, ya que las referencias a los discos locales son servidas por los discos locales de cada procesador; solamente van por la red las peticiones, los accesos a discos remotos y las relaciones de resultados. Es ms, habitualmente las redes de interconexin para los sistemas sin compartimiento se disean para ser ampliables por lo que su capacidad de transmisin crece a medida que se aaden nuevos nodos. Como consecuencia, las arquitecturas sin compartimiento son ms ampliables y pueden soportar con facilidad un gran

nmero de procesadores. El principal inconveniente de los sistemas sin compartimiento es el coste de comunicacin y de acceso a discos remotos, coste que es mayor que el que se produce en las arquitecturas de memoria o disco compartido, ya que el envo de datos provoca la intervencin del software en ambos extremos. La mquina de base de datos Teradata fue uno de los primeros sistemas comerciales que utilizaron la arquitecturas incompartimiento de bases de datos. Tambin se construyeron sobre arquitecturas sin compartimiento los prototipos de investigacin Grace y Gamma.

4.Jerrquica La arquitectura jerrquica combina las caractersticas de las arquitecturas de memoria compartida, de disco compartido y sin compartimiento. A alto nivel el sistema est formado por nodos que estn conectados mediante una red de interconexin y que no comparten ni memoria ni discos. As, el nivel ms alto es una arquitectura sin compartimiento. Cada nodo del sistema podra ser en realidad un sistema de memoria compartida con algunos procesadores. Alternativamente, cada nodo podra ser un sistema de disco compartido y cada uno de estos sistemas de disco compartido podra ser a su vez un sistema de memoria compartida. De esta manera, un sistema podra construirse como una jerarqua con una arquitectura de memoria compartida con pocos procesadores en la base, en lo ms alto una arquitectura sin comparti miento y quiz una arquitectura de disco compartido en el medio.

Potrebbero piacerti anche