Sei sulla pagina 1di 17

Fundamentos de Bases de Datos Distribuidas

TEMA VII

Grupo de Bases de Datos Avanzadas Univ. Carlos III de Madrid

Fundamentos de Bases de Datos Distribuidas VII.1 Introduccin

ndice
Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

VII.2 Definicin de Base de Datos Distribuida VII.3 Sistema Gestor de Bases de Datos Distribuidas VII.4 Tipos i de d SGBDDs VII.5 Problemas de los SGBDDs
TEMA VII
FBD3 VII.2

Fundamentos de Bases de Datos Distribuidas

Introduccin
Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Evolucin de las Bases de Datos BD Centralizadas

Sistemas Cliente/Servidor

BD Distribuidas
TEMA VII
FBD3 VII.3

Fundamentos de Bases de Datos Distribuidas Motivacin

Introduccin
Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Evitar la sobrecarga de trabajo en servidores (cuellos de botella) Se trata de varias BD almacenadas en diferentes nodos que:
forman una nica BD lgica cooperan ejecutando consultas o transacciones globales

TEMA VII

FBD3 VII.4

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Coleccin de mltiples bases de datos, datos lgicamente interrelacionadas (integradas), distribuidas sobre una red de ordenadores.

INTEGRACIN + DISTRIBUCIN

TEMA VII

FBD3 VII.5

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Integracin
Problemas derivados al desarrollar bases de datos independientes:

Datos redundantes
SGBD distintos Plataformas variadas

Inconsistencia en datos
Dificultad interoperatividad Aislamiento grupos usuarios

TEMA VII

FBD3 VII.6

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Distribucin
Finalidad: Comparticin de datos Optimizacin de datos
z Respecto a su disponibilidad z Respecto a su localizacin

TEMA VII

FBD3 VII.7

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Requisitos de una BD Distribuida


1) Integracin lgica de datos (un nico esquema global comn) 2) Almacenamiento fsico distribuido en sedes 3) Acceso comn (interfaz)
todos los usuarios pueden acceder a todos los datos (locales o remotos) en una nica operacin se puede acceder a datos de varias sedes E.d. un nico esquema y varios nodos de almacenamiento
TEMA VII
FBD3 VII.8

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Componentes
Bases de Datos Locales (BD local) Diccionario de datos global Procesador de Aplicaciones Distribuidas (SGBDD) SW y Red de comunicaciones

TEMA VII

FBD3 VII.9

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Imagen tomada de [1]

TEMA VII

FBD3 VII.10

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

ENFOQUES PARA EL ALMACENAMIENTO DISTRIBUIDO DE LOS DATOS . Rplica . Fragmentacin . Rplica y Fragmentacin

En el diccionario de la BDD se guardar informacin sobre la ubicacin de los datos, sobre los fragmentos de cada relacin y sobre la duplicacin de los datos.

TEMA VII

FBD3 VII.11

Fundamentos de Bases de Datos Distribuidas

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

VENTAJAS O Organizativas/Polticas: i ti /P lti


. Adaptacin a la organizacin de la institucin - unin de compaas / descentralizacin . Almacenar los datos donde son generados y/o usados . Proporcionar autonoma local . Coste

Econmicas: Tcnicas:
. . . . .
TEMA VII

. Flexibilidad

Disponibilidad Modularidad Mejora del rendimiento Crecimiento incremental Acceso concurrente


FBD3 VII.12

Fundamentos de Bases de Datos Distribuidas


. Co Complejidad p ej dad de del sistema s ste a

Definicin de Base de Datos Distribuida


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

INCONVENIENTES

. Distribucin del control - Problemas de Sincronizacin y Comunicacin . Dependencia de la red de comunicaciones . Dificultad de diseo productos comerciales . Poca madurez de los p . Funciones de administracin compleja . Dificultad de cambio . Personal especializado
TEMA VII
FBD3 VII.13

Fundamentos de Bases de Datos Distribuidas

Sistema Gestor de Bases de Datos Distribuidas


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Definicin Producto software capaz de gestionar una BDD, suministrando mecanismos de acceso que hacen transparente la distribucin Objetivos:
Transparencia de red Transparencia de fragmentacin Transparencia de rplicas

TEMA VII

FBD3 VII.14

Fundamentos de Bases de Datos Distribuidas

Tipos de SGBDDs
Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Segn g el g grado de homogeneidad g de los SGBD locales: SGBDD homogneos: todos los SGBD locales son iguales SGBDD heterogneos: los SGBD locales son distintos

Segn el grado de distribucin: Datos Distribuidos Datos Centralizados


TEMA VII

FBD3 VII.15

Fundamentos de Bases de Datos Distribuidas


Segn el grado de autonoma:

Tipos de SGBDDs
Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Sistemas Compuestos (Estrechamente Integrados): ninguna autonoma funcional en SGBD local. Todo acceso a travs del SGBDD. Sistemas Federados (Semiautnomos): SGBD locales autnomos, permite acceso a travs del SGBDD a partes de su BD. Sistemas Multi-Base de Datos (Autonoma Total): SGBD locales autnomos e independientes.

TEMA VII

FBD3 VII.16

Fundamentos de Bases de Datos Distribuidas


Sistemas Compuestos

Tipos de SGBDDs
Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Sistemas Federados

Sistemas MultiBase

Imagen tomada de [4]

TEMA VII

FBD3 VII.17

Fundamentos de Bases de Datos Distribuidas


1. Diseo Distribuido de BD:

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Particionamiento y Replicacin. Fragmentacin y Distribucin.

2. Procesamiento de Consultas y Optimizacin: 3. Propagacin de actualizaciones en caso de replicacin:


Solucin por medio de copia primaria

Estrategia global, seguida de optimizacin local en cada sede

4. Gestin de actualizaciones que involucren varias sedes en una nica transaccin:


Protocolo de confirmacin en dos fases

TEMA VII

FBD3 VII.18

Fundamentos de Bases de Datos Distribuidas


5. Gestin de concurrencia:

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

C Coste t d de las l tcnicas t i de d bloqueo bl por el l trfico t fi en la l red. d Solucin por copia primaria Aparicin de interbloqueo global - ms de un nodo implicado -

6. Recuperacin de fallos:

Reconfiguracin y Recuperacin (Sincronizacin). Archivo de log.

7 Integridad: 7. 8. Seguridad:

Restricciones locales y globales.

Usuarios y Sistemas Remotos.

TEMA VII

FBD3 VII.19

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Procesamiento y optimizacin de consultas Objetivo:


Reducir la cantidad de transferencia de datos por la red Aplicar una estrategia global de optimizacin z Realizar R li los l joins j i de d manera ptima ti z Tratar la consulta a alto nivel z Localizar datos y distribuir operaciones entre las distintas sedes
TEMA VII

FBD3 VII.20

10

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Procesamiento y optimizacin de consultas


Consulta en SQL

Nodo de Control
Optimizacin global Expresin de la consulta en lgebra de fragmentos

Nodo Local 1
Optimizacin local

Nodo Local n
Optimizacin local

TEMA VII

FBD3 VII.21

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Ejemplo de optimizacin de consultas EMPLEADO


(10.000 registros)

DEPARTAMENTO
(100 registros)

EMPLEADO (nss: char(9), nombre:char(15), apellido:char(15), nd:char(4),


direccin:char(57))

DEPARTAMENTO (numeroD:char(4), nombreD:char(10), nssgte:char(9),


fecha:char(12))

TEMA VII

FBD3 VII.22

11

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Ejemplo de optimizacin de consultas

(E l d Departamento) D t t ) Nombre, Apellido, NombreD (Empleado


Estrategias simples

Sede 1 Empleado

Sede 2 Departamento

Solucin 1: Sede 1 + Sede 2 > Sede3 1.000.000 + 3.500 = 1.003.500 bytes Solucin 2: Sede 1 > Sede 2 Sede 2 > Sede 3 1.000.000 + 10.000 reg.* 40 = 1.400.000 bytes Solucin 3: Sede 2 > Sede 1 Sede 1 > Sede 3 3.500 + 10.000 reg.* 40 = 403.500 bytes

Sede 3 Consulta

TEMA VII

FBD3 VII.23

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Propagacin de actualizaciones en caso de replicacin


a) Replicacin inmediata: copia instantnea a todas las sedes replicadas b) Copia primaria: propagacin diferida ) sede p primaria --> resto sedes b.1) b.2) sede primaria --> sede siguiente --> ...

TEMA VII

FBD3 VII.24

12

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Actualizaciones que involucren varias sedes en una nica transaccin


Transaccin: Unidad fundamental de recuperacin, consistencia y concurrencia. z Conjunto de operaciones primarias z No se puede dividir p de las transacciones Propiedades z Atomicidad (A) (todo o nada) z Consistencia (C) (conservar la integridad) z Aislamiento (I) (cambios invisibles hasta confirmacin) z Persistencia (D) (Una vez confirmada)
TEMA VII
FBD3 VII.25

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Actualizaciones que involucren varias sedes en una nica transaccin Protocolo CONFIRMACIN EN DOS FASES (TwoPhase-Commit) Sincroniza la actuacin de gestores de recursos independientes dentro de una nica Transaccin. El coordinador centraliza la decisin de confirmar, pero da a cada participante derecho de veto sobre toda la operacin. z Fase de Consulta. z Fase de Confirmacin
TEMA VII
FBD3 VII.26

13

Fundamentos de Bases de Datos Distribuidas 2PC FASE I: Consulta Coordinador

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Sede 1
ready? OK

Sede 2 Sede 3

2PC FASE II: Confirmacin S d 1 Sede Coordinador Sede 2 Sede 3


TEMA VII
FBD3 VII.27

Fundamentos de Bases de Datos Distribuidas 2 PC FASE I: Consulta Coordinador

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Sede 1
ready? OK

Sede 2 Sede 3

2PC FASE II: Confirmacin S d 1 Sede Coordinador Sede 2 Sede 3


TEMA VII
FBD3 VII.28

14

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Gestin de Concurrencia Nuevos problemas:


Mltiples copias Fallos en z Sedes z Red R d comunicacin i i Confirmacin distribuida Interbloqueo distribuido

TEMA VII

FBD3 VII.29

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Procesos Gestin Concurrencia


COPIA DISTINGUIDA
SEDE PRIMARIA: slo un coordinador para todas las sedes SEDE PRIMARIA CON SEDE DE RESPALDO: se designa una sede de respaldo para la sede primaria COPIA PRIMARIA: copias de datos distinguidas almacenadas en distintas sedes

VOTACIN
Las solicitudes de bloqueo se envan a todas las sedes que participan. Si la mayora aceptan la transaccin, se realiza.

TEMA VII

FBD3 VII.30

15

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Recuperacin ante fallos Tipos de fallos:


En una sede --> protocolos de confirmacin en 3 fases Prdida de mensaje --> uso de protocolos de transmisin fiables
(TCP)

Fallo de enlace de comunicacin: transmisin reiterada sin ack


para distinguirlo --> ruta alternativa

Segmentacin de la red (no existe ruta alternativa)

TEMA VII

FBD3 VII.31

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Integridad
Problemas de integridad ms intensos en SGBDD Inconsistencia entre las Restricciones Locales Dificultad en especificar las Restricciones Globales Inconsistencia entre las Restricciones Locales y las Globales

TEMA VII

FBD3 VII.32

16

Fundamentos de Bases de Datos Distribuidas

Problemas de los SGBDD


Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

Seguridad
Confianza en los usuarios, en la red y en los sitios remotos Identificacin y Autenticacin Remotas A nivel de usuarios A nivel de nodos Distribucin de las reglas de autorizacin Encriptacin Mecanismos de vistas globales
TEMA VII
FBD3 VII.33

Fundamentos de Bases de Datos Distribuidas

Bibliografa
Grupo de Bas ses de Datos Avanzadas Univ. Carlo os III de Madrid

1. Miguel, g , A. De, , Piattini, , M. Fundamentos y modelos de Bases de Datos, Ed. Rama 1999 2. Miguel, A. De, Piattini, M. y Marcos, E. Diseo de Bases de Datos Relacionales, Ed. Rama 1999 3. Miguel, A. De, Martnez, P., Castro, E., Cavero, J.M., Cuadra, D., Iglesias, A.M. y Nieto, C. Diseo de Bases de Datos. Problemas Resueltos, Ed. Rama, 2001 4. Oszu, M.T. y Valduriez, P., Principles of Distributed database systems, 2 Edicin, Prentice Hall, 1999

Tema I

FBD3 VII.34

17

Potrebbero piacerti anche