Un Sistema de Bases de Datos Distribuidas se compone de
un conjunto de sitios (lugares) conectados entre s mediante algn tipo de red de comunicaciones, en el cual 1. Cada sitio es un sistema de base de datos en s mismo, pero 2. Los sitios han convenido en trabajar juntos, con el fin de que un usuario en cualquier sitio pueda obtener acceso a los datos de cualquier de la red tal como si los datos estuvieran almacenados en el sitio propio del usuario SISTEMAS DE BASES DE DATOS DISTRIBUIDAS
Cada sitio es un sistema de bases de datos. Esto es, cada
sitio tiene sus propias bases de datos reales locales, sus propios usuarios locales, sus propios SGBD y su propio administrador local de comunicacin de datos. El sistema de bases de datos distribuidas puede considerarse como una especie de sociedad entre los SGBD individuales locales de todos los sitios. Un nuevo componente de software en cada sitio (una extensin del SGBD local desde el punto de vista lgico) realiza las funciones de sociedad necesarias. El sistema de administracin (gestin) de bases de datos distribuida es la combinacin de este nuevo componente de software y el SGBD existente SISTEMAS DE BASES DE DATOS DISTRIBUIDAS
La Base de Datos Distribuida es un objeto virtual cuyas
partes componentes se almacenan fsicamente en varias bases de datos reales distintas ubicadas en diferentes sitios. Es la unin lgica de esas bases de datos. VENTAJAS DE LOS SBBD: La naturaleza distribuida de algunas aplicaciones de bases de datos. Mayor fiabilidad y disponibilidad. Posibilidad de compartir los datos al mismo tiempo que se mantiene un cierto grado de control local. Mejor rendimiento. SISTEMAS DE BASES DE DATOS DISTRIBUIDAS
PRINCIPIO FUNDAMENTAL O REGLA CERO DE
LOS SBDD: Desde el punto de vista del usuario, un sistema distribuido deber ser idntico a un sistema no distribuido. Esta regla conduce a doce objetivos o reglas secundarias: LAS DOCE REGLAS: 1. Autonoma local. 2. No dependencia de un sitio central. 3. Operacin continua. 4. Independencia con respecto a la localizacin (o transparencia de ubicacin). SISTEMAS DE BASES DE DATOS DISTRIBUIDAS
5. Independencia con respecto a la fragmentacin (o
transparencia de fragmentacin) Tcnicas de fragmentacin: tcnicas de diseo de bases de datos distribuidas que se ocupan en dividir la base de datos en unidades lgicas llamadas fragmentos, cuyo almacenamiento puede asignarse a los diferentes sitios. Tipos de Fragmentacin: Fragmentacin horizontal Fragmentacin vertical Fragmentacin mixta SISTEMAS DE BASES DE DATOS DISTRIBUIDAS
6. Independencia de rplica (o transparencia de
replicacin). En un sistema que maneja rplicas, una unidad lgica (sea una relacin o un fragmento de relacin) se puede representar en el nivel fsico mediante varias copias almacenadas o rplicas en muchos sitios distintos. La replicacin mejora el desempeo y la disponibilidad del objeto solicitado. SISTEMAS DE BASES DE DATOS DISTRIBUIDAS MTODO DE LA COPIA PRIMARIA Este mtodo maneja el problema que surge cuando se propaga la actualizacin de un objeto lgico replicado y un sitio con una de las copias no est disponible (por una falla del sitio o de la red). As, la estrategia de propagar las actualizaciones fracasar (la transaccin falla). . Una de las copias del objeto se designa como copia primaria. Las dems sern copias secundarias. . Las operaciones de actualizacin se consideran completas tan pronto como se halla modificado la copia primaria. El sitio de la copia primaria se encarga entonces de propagar la actualizacin a las copias secundarias en un momento posterior. SISTEMAS DE BASES DE DATOS DISTRIBUIDAS 7. Procesamiento distribuido de consultas. En una consulta donde estn implicados varios sitios, habr muchas maneras de trasladar los datos en la red y es crucial encontrar una estrategia eficiente. Supongamos que se realiza una consulta en el sitio S 1. El compilador en el sitio S rene todas las entradas del catlogo (locales y remotas) de todos los objetos referenciados por la consulta. 2. Luego genera una estrategia de acceso global, seleccionando el plan de acceso que tenga el menor costo (costo IO + costo CPU + costo de comunicacin) 3. Seguidamente el sitio S enva a cada sitio involucrado la porcin relevante (subconsulta) de la estrategia global. SISTEMAS DE BASES DE DATOS DISTRIBUIDAS 4. Luego cada sitio compila su propia porcin de la estrategia y almacena el cdigo compilado en su catlogo local, y enva la relacin resultante al sitio S. 5. El sitio S combina los resultados de las subconsultas y forma el resultado de la consulta. SISTEMAS DE BASES DE DATOS DISTRIBUIDAS 8. Manejo distribuido de transacciones. Tiene dos aspectos principales el control de concurrencia y recuperacin La estrategia de bloqueo es preferida para el control de concurrencia y el protocolo de compromiso de dos fases para el control de la recuperacin. En un sistema distribuido , las solicitudes de bloqueo, establecimiento y liberacin de bloqueos se convierten en mensajes si el objeto est en un sitio remoto, los mensajes implican costos adicionales. Si una transaccin T necesita actualizar un objeto del cual existen rplicas en n sitios remotos, y cada sitio se encarga de los bloqueos sobre los objetos en ese sitio, se requerirn por lo menos 5n mensajes. SISTEMAS DE BASES DE DATOS DISTRIBUIDAS En un sistema distribuido, una sola transaccin puede implicar la ejecucin de cdigo en varios sitios. Cada transaccin est compuesta de varios agentes, donde un agente es el proceso ejecutado en nombre de una transaccin dada en determinado sitio. No se permitir un bloqueo mutuo entre dos agentes de la misma transaccin. Otro problema con el bloqueo en un sistema distribuido es que puede conducir a un bloqueo mutuo global. La deteccin de bloqueos mutuos globales requiere juntar las grficas locales individuales, lo cual implica mayores costos adicionales de comunicacin. SISTEMAS DE BASES DE DATOS DISTRIBUIDAS SISTEMAS DE BASES DE DATOS DISTRIBUIDAS
9. Independencia con respecto al equipo
10. Independencia con respecto al sistema operativo. 11. Independencia con respecto a la red. 12. Independencia con respecto al SGBD El sistema distribuido puede ser homogneo o heterogneo.