Sei sulla pagina 1di 13

UNIDAD DE ESTUDIOS SUPERIORES

ALMOLOYA DE ALQUISIRAS

MATERIA:
BASES DE DATOS DISTRIBUIDAS

RESUMEN UNIDAD II

ALUMNO:
MARCO ANTONIO REYES COLIN

DOCENTE:
JOSUE IVAN CALIXTO ALBARRAN

GRUPO:
02SC191

NOVENO SEMESTRE

SEPTIEMBRE 2017.
DISEN O DE BASES DE DATOS DISTRIBUIDAS

2.1 Consideraciones de diseo de bases de datos distribuidas.

Qu es una base de datos distribuida?

A una base de datos distribuida tambin se le conoce como BDD; esta es una
coleccin de datos, los cuales se relacionan lgicamente pero se encuentran
dispersos en diferentes puntos de una red de computadoras.

Base de Datos

Servidor

Cliente

Por qu se elaboran las bases de datos distribuidas?

Existen diversas razones para construirlas, entre ellas encontramos la facilidad para
compartir informacin, fiabilidad y disponibilidad, as como agilizar el procedimiento
de consultas.

Desventajas de las BDD:

Desarrollos de software mas costosos.


Mayor posibilidad de errores.
Costos extra de procesamiento.

Ventajas de las BDD:

Capacidad de compartir y acceder a la informacin de una forma fiable y


eficaz.
Utilizacin compartida de los datos.
Distribucin del control.
Existe un administrador global de la base de datos que se encarga de todo
el sistema.

Fiabilidad y disponibilidad

Si se produce un fallo en una localidad de un sistema distribuido, es posible que las


dems localidades puedan seguir trabajando.

El sistema debe detectar cuando falla una localidad y tomar las medidas necesarias
para recuperarse del fallo. El sistema no debe seguir utilizando la localidad que fallo,
y cuando esta sea reparada, debe contarse con mecanismos para reintegrarla al
sistema con el mnimo de complicaciones.

La disponibilidad es importante para los sistemas de bases de datos que se utilizan


en aplicaciones de tiempo real.

2.2 Diccionario de datos.

Es el lugar donde se deposita informacin acerca de todos los datos que forman la
base de datos. Es una gua en la que se describe la base de datos y los objetos que
la forman.

Un diccionario de datos es una lista de todos los elementos incluido en el conjunto


de los diagramas de flujo de datos que describen un sistema.

Los elementos principales en un sistema son: el flujo de datos, el almacenamiento


de datos y los procesos. El diccionario de datos almacena detalles y descripciones
de estos elementos.

El diccionario contiene las caractersticas lgicas de los sitios donde se almacenan


los datos del sistema, incluyendo nombre, descripcin, contenido y organizacin.
Identifica los procesos donde se emplean los datos y los sitios donde se necesita el
acceso inmediato a la informacin.

Un diccionario de datos debe cumplir las siguientes caractersticas:

Debe soportar las descripciones de los modelos conceptual, lgico, interno y


externo de la dase de datos.
Debe estar integrado dentro del SGBD.
Debe apoyar la transferencia eficiente de informacin al SGBD. La conexin
entre los modelos internos y externo debe ser realizada en un tiempo de
ejecucin.
Debe comenzar con la reorganizacin de versiones de produccin de la base
de datos. Adems debe reflejar los cambios en la descripcin de la BD.
Cualquier cambio a la descripcin de programas ha de ser reflejado
automticamente en la librera de descripcin de programas con la ayuda del
diccionario de datos.
Debe estar almacenado en un medio de almacenamiento con acceso directo
para la fcil recuperacin de informacin.

Ejemplo de diccionario de datos:

2.3 Niveles de transparencia.

La transparencia se puede entender como la separacin de la semntica de alto


nivel de un sistema de los aspectos de bajo nivel relacionados a la implementacin
del mismo. Un nivel de transparencia adecuado permite ocultar los detalles de
implementacin a las capas de alto nivel de un sistema y a otros usuarios.

En sistemas de bases de datos distribuidos el propsito fundamental de la


transparencia es proporcionar independencia de datos en el ambiente distribuido.
La independencia de datos es la inmunidad de las aplicaciones de usuario a los
cambios en la definicin y/u organizacin de los datos y viceversa. La independencia
de datos se puede dar en dos aspectos: lgica y fsica.

Los niveles de transparencia son:

1) De Distribucin: Que este perfectamente organizada segn el numero de


sedes.
2) De Transacciones: Que las operaciones a realizar se hagan sin problemas.
3) De Rendimiento: Que nunca se vea afectado el sistema ni la velocidad del
mismo.
4) De Red: Que no se noten los usuarios conectados al sistema al realizar
transacciones.

Organizacin en Capas de los Niveles de Transparencia

Se pueden encontrar diferentes aspectos relacionados con la transparencia. Por


ejemplo, puede existir transparencia en el manejo de copias repetidas o
transparencia en la distribucin o fragmentacin de la informacin.

2.3.1 Transparencia de localizacin.

Transparencia sobre la localizacin de datos: Esto es, el comando que se usa es


independiente de la ubicacin de los datos en la red y del lugar en donde la
operacin se lleve a cabo.

La transparencia de localizacin busca que los usuarios no puedan distinguir la


localizacin de los recursos.
La transparencia de localizacin se logra creando un conjunto de seudnimos o
alias para cada usuario. As, el usuario puede referirse a los datos usando nombres
sencillos que el sistema traduce a nombres completos. Con el uso de seudnimos,
no ser necesario que el usuario conozca la localizacin fsica de un dato. Adems,
el administrador de la base de datos puede cambiar un dato de una localidad a otra
sin afectar a los usuarios.

2.3.2 Transparencia de fragmentacin.

La transparencia a nivel de fragmentacin de datos permite que cuando los objetos


de la bases de datos estn fragmentados, el sistema tiene que manejar la
conversin de consultas de usuario definidas sobre relaciones globales a consultas
definidas sobre fragmentos.

Es el mayor nivel, el usuario o programador no necesita saber que una base de


datos esta en particiones. Ni los nombres, ni la ubicacin se especifican antes de
acceder a los datos.

Permite al usuario acceso a la informacin de un archivo fragmentado como si todos


los datos del archivo estuvieran en una misma computadora. Es decir, cuando se
crea transparencia de fragmentacin, el sistema crea la ilusin de que los archivos
no estn fragmentados

2.3.3 Transparencia de rplica.

Los usuarios no pueden indicar el nmero de copias existentes. La transparencia


sobre la replicacin de datos se refiere a que si existen rplicas de objetos de la
base de datos, su existencia debe ser controlada por el sistema, no por usuario, se
debe tener en cuenta que cuando el sistema se encarga de manejar las rplicas en
un sistema, el trabajo de ste es mnimo por lo que se puede obtener una eficiencia
mayor.

Ventajas:

Disponibilidad: El sistema sigue funcionando aun en caso de cada de uno


de los nodos.
Aumento de paralelismo: Varios nodos pueden realizar consultas en paralelo
sobre la misma tabla. Cuantas ms replicas existan de la tabla, mayor ser
la posibilidad de que el dato buscado se encuentre en el nodo desde el que
se realiza la consulta, minimizando con ello el trfico de datos entre nodos.

2.4 Fragmentacin de datos.

La fragmentacin consiste en particional la informacin para distribuir cada parte en


diferentes lugares de la red. De forma que cada relacin se divide en varios
fragmentos. Cada fragmento se guarda en una localizacin diferente.

La fragmentacin de la informacin se puede


llevar a cabo de tres formas:

Fragmentacin vertical.
Fragmentacin horizontal.
Fragmentacin mixta o hibrida.

2.4.1 Fragmentacin horizontal.

Se realiza sobre las tuplas de la relacin, es decir que cada fragmento ser un
subconjunto de las tuplas de la relacin.

Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen
mediante una operacin de seleccin. Su reconstruccin se realizar mediante la
unin de los fragmentos componentes.
Existen dos tipos de fragmentacin como es: fragmentacin horizontal primaria y la
fragmentacin horizontal derivada.

La fragmentacin horizontal primaria. Consiste en particionar las tuplas


(columnas) de una relacin global en subconjuntos, donde cada subconjunto tenga
propiedades comunes, se puede definir expresando cada fragmento como una
operacin de seleccin sobre la relacin global.

Ejemplo: Considere la Relacin J

J1 Escuela = CIME

J2 Escuela = EISIC

La fragmentacin horizontal derivada. Consiste en dividir una relacin partiendo


de los predicados definidos sobre alguna otra, debido a que la relacin R depende
de la relacin Q, sobre cuyos atributos est definido el predicado de la
fragmentacin.

Ejemplo: Considere las Relaciones


Esta relacin puede ser fragmentada horizontalmente basada en la escuela en la
cual el estudiante est matriculado. La escuela sin embargo no es un atributo del
estudiante.

Escuela = CIME (Fragmentacin Horizontal primaria)

Fragmentacin Horizontal derivada

Escuela = EISIC (Fragmentacin Horizontal primaria)


Fragmentacin Horizontal derivada

2.4.2 Fragmentacin vertical.

El objetivo de la fragmentacin vertical consiste en dividir la relacin en un conjunto


de relaciones ms pequeas tal que algunas de las aplicaciones de usuario slo
hagan uso de un fragmento. Sobre este marco, una fragmentacin ptima es aquella
que produce un esquema de divisin que minimiza el tiempo de ejecucin de las
aplicaciones que emplean esos fragmentos.

La fragmentacin vertical se basa en los atributos de la relacin para realizar la


divisin, es decir: la subdivisin de atributos en grupos. La fragmentacin es
correcta si cada atributo se mapea en al menos un atributo del fragmento.

Ejemplo: Considere la Relacin J

J1 Informacin de Notas
J2 Informacin de Nombres y Escuelas

2.4.3 Fragmentacin hbrida.

Cuando el proceso de particin hace uso de los dos tipos anteriores. La


fragmentacin mixta puede llevarse a cabo de tres formas diferentes:

1.- Desarrollando primero la fragmentacin vertical y posteriormente, aplicando


particin horizontal de los fragmentos verticales (denominada particin VH).

2.- Aplicando primero una divisin horizontal para luego, sobre los fragmentos
generados, desarrollar una fragmentacin vertical (llamada particin HV).

3.- De forma directa considerando la semntica de las transacciones.

Ejemplo: Considere la Relacin J


Fragmentacin Horizontal Previa

Escuela = EISIC

Informacin de Notas (Fragmentacin Vertical)

2.5 Distribucin de datos.

Describe el proceso de decidir donde localizar los datos. Una de las decisiones
ms importantes que el diseador de bases de datos distribuidas debe tomar es el
posicionamiento de los datos en el sistema y el esquema bajo el cual lo desea hacer.

CENTRALIZADA

Es muy similar al modelo de Cliente/Servidor en el sentido que la BDD est


centralizada en un lugar y los usuarios estn distribuidos.

REPLICADAS

El esquema de BDD de replicacin consiste en que cada nodo debe tener su copia
completa de la base de datos. Es fcil ver que este esquema tiene un alto costo en
el almacenamiento de la informacin.

PARTICIONADAS

Este modelo consiste en que solo hay una copia de cada elemento, pero la
informacin est distribuida a travs de los nodos. En cada nodo se aloja uno o ms
fragmentos disjuntos de la base de datos.
2.5.1 Algoritmos de distribucin de datos no replicados.

Debido al uso que se da a las redes de computadoras en la actualidad incluyendo


Internet, cada vez es ms factible implementar Sistemas de Bases de Datos
Distribuidas, sin embargo, esta tecnologa lleva a los desarrolladores a enfrentar
un problema, la carencia de metodologas y herramientas de apoyo para su diseo
que permitan decidir la ubicacin de los datos en cada uno de los diferentes sitios
que componen la red de computadoras.

Este problema se conoce como diseo de la distribucin y nace de la necesidad de


especificar las unidades de almacenamiento adecuadas, ya sea fragmentos
verticales, horizontales o mixtos, junto con su ubicacin dentro de la aplicacin. El
Modelo FURD, ha sido desarrollado para resolver el problema del diseo de
las Bases de Datos Distribuidas, el cual esta divido en dos etapas o fases: la
fragmentacin y la ubicacin de fragmentos.

Estas fases ya se concentran en el Modelo FURD. Una vez que se resuelve el


Modelo FURD se puede dar solucin al problema del diseo. Sin embargo la
dificultad radica precisamente en la forma de resolverlo, pues es un problema de
optimizacin muy complejo que a medida que va creciendo su tamao, se
va haciendo ms difcil la forma de resolverse.

2.5.2 Algoritmos de distribucin de datos replicados.

Se refiere al almacenamiento de copias de datos en sitios mltiples, puede ser para


satisfacer requerimientos de informacin, adems de mejorar la disponibilidad de
los datos y el tiempo respuesta; finalmente estas copias reducen los costos de
comunicacin y de consulta total.

Los datos replicados se someten a la regla de consistencia mutua, la cual requiere


que todas las copias de fragmentos de datos sean idnticas, esto quiere decir que
cuando hay una actualizacin de la base de datos se realiza en todos los sitios
donde hay replicas.

Conclusin: Las bases de datos son una coleccin de datos, una base de datos distribuida es
tambin una coleccin de datos, la diferencia es que se encuentran en varios servidores los
cuales estn situados en puntos geogrficos distintos.

Potrebbero piacerti anche