Sei sulla pagina 1di 26

FACULTAD DE CIENCIA Y TECNOLOGIA

MATERIA: SISTEMAS DISTRIBUIDOS

1. SISTEMAS DISTRIBUIDOS

Docente Fecha

: :

MSc. Ing. Andrea Teresa Cubillos Johnen Septiembre, 2013

DEFINICION DE BASE DE DATOS DISTRIBUIDA


Base de datos donde la informacin esta fsicamente almacenada en diferentes puntos y en sistemas diferentes.
Principio Fundamental

Ante el usuario, un sistema distribuido debe lucir exactamente igual que un sistema que no es distribuido
En otras palabras, los usuarios de un sistema distribuido deben ser capaces de comportarse exactamente como si no fuera distribuido. Todos los problemas de los sistemas distribuidos son, o deberan ser, problemas internos o en el nivel de implementacin, y no externos o en el nivel de usuario.

OBJETIVOS DE UNA BASE DE DATOS DISTRIBUIDA


Un sistema distribuido debe aparecer al usuario como un sistema centralizado.
Transparencia a la localizacin Transparencia a la fragmentacin Transparencia a la replicacin

CRITERIOS DE DISEO DE UN SISTEMA DISTRIBUIDO


1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. Autonoma local No depender de un sitio central Operatoria continua Independencia de la localidad Independencia de la fragmentacin Independencia de la replicacin Procesamiento de consultas distribuidas Transacciones distribuidas Independencia del hardware Independencia del Sistema Operativo Independencia de la red Independencia de la base de datos

AUTONOMIA LOCAL
Los sitios en un sistema distribuido deben ser autnomos.
La autonoma local significa que todas las operaciones en un sitio dado estn controladas por ese sitio; ningn sitio X debe depender de algn otro sitio Y para su operacin satisfactoria. La seguridad, integridad y representacin de almacenamiento de los datos locales permanecen bajo el control y jurisdiccin del sitio local.

NO DEPENDER DE UN SITIO CENTRAL


La autonoma local implica que todos los sitios deben ser tratados como iguales. Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio maestro central para algn servicio central, tal que todo el sistema dependa de ese sitio central.
Razones por las cuales no debera haber un sitio central: El sitio central puede ser un cuello de botella El sistema sera vulnerable; es decir, si el sitio central falla, tambin fallar todo el sistema

OPERATORIA CONTINUA
Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad.
Confiabilidad. La probabilidad de que el sistema est listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algn componente independiente. Disponibilidad. La probabilidad de que el sistema est listo y funcionando continuamente a lo largo de un perodo especificado.

INDEPENDENCIA DE LA LOCALIDAD
Conocida tambin como transparencia de ubicacin.
Los usuarios no tienen que saber dnde estn almacenados fsicamente los datos, sino que deben ser capaces de comportarse como si todos los datos estuvieran almacenados en su propio sitio local. Esto simplifica los programas de los usuarios. En particular, permite que los datos emigren de un sitio a otro sin invalidar ninguno de estos programas o actividades. especificado.

INDEPENDENCIA DE LA FRAGMENTACION
Un sistema soporta la fragmentacin de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento fsico.
La fragmentacin es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicacin donde son usados ms frecuentemente para que la mayora de las operaciones sean locales y se reduzca el trfico en la red. Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentacin alguna

INDEPENDENCIA DE LA REPLICACION
El sistema soporta replicacin de datos cuando un fragmento puede ser representado por muchas copias distintas, o rplicas, guardadas en muchos sitios distintos.
Las rplicas son necesarias por dos razones principales: 1. Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos) Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras est disponible al menos una copia).

2.

Por supuesto, la principal desventaja de las rplicas es que al actualizarlas es necesario actualizar todas: el problema de la propagacin de la actualizacin.

PROCESAMIENTO DE CONSULTAS DISTRIBUIDAS


La optimizacin es importante en un sistema distribuido que en uno centralizado, incluso mucho ms.
El punto bsico es que en una consulta que involucra a varios sitios, habr muchas formas posibles de mover los datos en el sistema para satisfacer la solicitud, y es crucialmente importante que se encuentre una estrategia eficiente.

TRANSACCIONES DISTRIBUIDAS
Existen dos aspectos principales en la administracin de transacciones: control de recuperacin y control de la concurrencia.
Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido. Ya que una sola transaccin puede involucrar la ejecucin de cdigo en muchos sitios. Puede involucrar actualizaciones en muchos sitios y se debe de cuidar que la transaccin no caiga en un bloqueo mortal (basado en el bloqueo). Para el control de la recuperacin, es necesario asegurarse que una transaccin dada sea atmica en el ambiente distribuido, el sistema debe por lo tanto asegurarse de que la transaccin sea confirmada o deshecha (se puede utilizar el protocolo de confirmacin de dos fases).

INDEPENDENCIA DEL HARDWARE


Soporte para un gran nmero de mquinas diferentes. Poder integrar todos los datos de todos estos sistemas y presentar al usuario una imagen del sistema nico.

INDEPENDENCIA DEL SISTEMA OPERATIVO


Obviamente es necesario no slo tener la posibilidad de ejecutar el mismo DBMS en diferentes plataformas de hardware, sino tambin ejecutarlo en diferentes plataformas de sistema operativo.

INDEPENDENCIA DE LA RED
Si el sistema va a tener la posibilidad de soportar muchos sitios distintos es obviamente necesario tener la posibilidad de soportar tambin una variedad de redes de comunicacin distintas.

INDEPENDENCIA DE LA BASE DE DATOS


Lo que se necesita es que todos los ejemplares de DBMS en sitios diferentes soporten la misma interfaz.
Aunque no tienen que ser necesariamente copias del mismo software DBMS. En otras palabras, sera posible que el sistema distribuido fuera heterogneo, al menos en cierto grado. Sera muy bueno si diferentes DBMS pudieran participar de alguna forma en un sistema distribuido.

DESVENTAJAS DE UN SISTEMA DISTRIBUIDO


La mayor desventaja es el hecho de que los sistemas distribuidos son complejos (al menos desde el punto de vista tcnico).
Por supuesto, de manera ideal esa complejidad debe ser problema del implementador y no del usuario. Pero es probable que algunos aspectos aparecern ante los usuarios, a menos que se tomen precauciones muy cuidadosas.

PROBLEMAS DE UN SISTEMA DISTRIBUIDO


Optimizacin del procesamiento de preguntas Propagacin de actualizaciones Mayor problema con los accesos concurrentes Problemas con el manejo del catalogo

COMPONENTES DE UN SISTEMA DISTRIBUIDO


Componente de manejo de Base de Datos (DB) El componente de Comunicacin de Datos (DC) El Diccionario de Datos (DD), el cual es extendido para representar informacin sobre la distribucin de los datos sobre la red

El componente de base de datos distribuida (BDD)

TIPOS DE SISTEMAS DISTRIBUIDOS


homogeneidad / heterogeneidad autonoma transparencia de la distribucin

GRADO DE HOMOGENEIDAD
Un DDBMS homogneo se caracteriza principalmente por la utilizacin del modelo descendente para la conceptualizacin del diseo de la BD, en donde la fragmentacin vertical u horizontal de un esquema global de datos determina la naturaleza de cada uno de los componentes de la BDD

Un DDBMS heterogneo se caracteriza por la diversidad de DBMSs, modelos de


diseo, sistemas operativos, conceptualizacin del diseo y hardware utilizado en cada uno de sus componentes de BD La heterogeneidad debida a diversos DBMSs es comn en organizaciones que crecen sin una planeacin en cuanto a sus sistemas de informacin. Dichos sistemas evolucionan paulatinamente en diferentes DBMSs o diferentes modelos de conceptualizacin, tales como: jerrquico, de red, relacional u orientado a objetos.

HETEROGENEIDAD SEMANTICA
Ocurre cuando existe una diferencia en el significado, interpretacin o uso del mismo modelo de datos

GRADO DE AUTONOMIA
Es el grado de independencia de operacin de cada uno de los DBMS componentes del DDBMS AUTONOMIA DE DISEO La capacidad de que cada Base de Datos Componente (BDC) decida los aspectos concernientes con su diseo. Es decir, las personas involucradas son libres de decidir cualquier particularidad e incluso decidir que DBMS usar.

ASPECTOS A CONSIDERAR EN LA AUTONOMIA DE DISEO


El universo de datos relevante para el sistema La representacin (modelo de datos, lenguaje de consultas) y el nombrado de los datos La conceptualizacin o interpretacin semntica de los datos (heterogeneidad semntica) Restricciones usadas para administrar los datos La funcionalidad del sistema La asociacin y comparticin con otros sistemas y La implementacin (p.e. registros y estructuras de archivos).

AUTONOMIA DE COMUNICACION
La habilidad de que una BDC decida comunicarse o no con otro componente de una misma federacin
Autonoma de ejecucin Es la habilidad de una BDC para ejecutar operaciones locales sin la interferencia de operaciones externas, en el orden que la BDC lo decida Autonoma de asociacin

Cada BDC decide cunto y cundo puede compartir su funcionalidad y recursos


con otros componentes, inclusive la capacidad de asociarse o retirarse de una o ms federaciones

GRADO DE TRANSPARENCIA DE DISTRIBUCION


Si el usuario percibe un solo esquema integrado sin informacin alguna relativa a la fragmentacin, replicacin o distribucin, se dice que el DDBMS tiene un alto grado de transparencia de distribucin.
Si el usuario puede ver toda la fragmentacin, el reparto y la aplicacin, el DDBMS no tiene transparencia de distribucin

Potrebbero piacerti anche