Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
MAPAS
CATEDRTICO:
ALUMNO:
GRUPO LIA-I7
Memoria Compartida Disco Compartido Sin Compartimento Jerrquica Sesgo de valores de los atributos: Un determinado valor para Un atributo es ms frecuente que otro
Tipos de arquitecturas:
Sesgo de la divisin: Desequilibrio en la carga de la Distribucin aunque no haya sesgo en los atributos
Turno Rotatorio: Asignar la iesima tupla al Disco i mod n. Asegura distribucin homognea Divisin por Asociacin: Definir una funcin F(a1, ..an) ! Particin Divisin por Rangos: Dado un atributo partirlo en rangos y Cada rango se almacena en un disco
El tiempo de una transaccin es el mismo pero se incrementa la productividad (throughput) Se pueden hacer en paralelo cada uno de los nodos del rbol de operaciones.
PARALELISMO ENTRE CONSULTAS Consideraciones de implementacin: Los conjuntos son parte constitutiva de las bases de datos y por tanto son susceptibles a ser paralelizables
Coherencia del cache Evitar que dos procesadores modifiquen al tiempo un mismo dato (Protocolos de Bloqueo)
Ordenamiento:
Realizar una particin de los datos para cada procesador (depende del esquema de particionamiento utilizado). Hacer merge de cada una de las partes ordenadas
PARALELISMO EN OPERACIONES
Reunin:
Por divisin:
Solo para equireuniones y los atributos de reunin deben ser los mismos del particionamiento. Las dos relaciones deben particionarse con la misma funcion o rango. Cada procesador se encarga de
Para reuniones con condiciones de desigualdad Se parte una de las relaciones y se replica la otra en cada procesador. La relacin pequea suele replicarse.
Seleccin: Si la condicin es una condicin de particionamiento, cada procesador puede seleccionar algunas tuplas y luego reunirlas
Paralelismo de encauzamiento:
Tiempo de ejecucin
Una operacin consume el resultado de otra No siempre es til pues una operacin puede requerir la totalidad de las tuplas y no bastarle resultados parciales No siempre las operaciones son tan largas para esperar Ti = Tinicio + max(op0, ..., opn) + Treunion
Carlos A.
Paralelismo Independiente:
Cada operacin se realiza por separado y luego otra operacin las rene
los
Non-Uniform Memory Access: El acceso a memoria tiene un costo dependiendo del nodo
Escalabilidad de HW y RED: La interconexin entre los nodos es de vital importancia (latencia en el B.W. Y en el I/O)
Escalabilidad del S.O: Manejo de la memoria compartida, sincronizacin y acceso a los recursos
Caractersticas
Grupo de datos que pertenecen a un sistema pero a su vez esta repartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localizacin geogrfica,
Replicacin de Datos: Copias mltiples de datos que incrementa la localidad y la disponibilidad de datos
No hay estructuras intersitios. Uso de optimizacin global para reducir transferencia de datos
Fragmentation Schema: Traduccin entre relaciones globales y fragmentos. (Una relacin global puede consistir de varios fragmentos pero un fragmento est asociado con slo una relacin global) Global Schema: Define todos los datos que estn incluidos en la bd distribuida tal como si la bd no fuera distribuida. Consiste de una definicin de relaciones globales.
Local Maping Schema: Traduce los fragamentos locales a los objetos que son manejados por el SMBD local
-Transparencia de Fragmentacin
-Transparencia de Localizacin
-Independencia de BD locales
El sistema conserva varias copias o rplicas idnticas de una tabla. Cada rplica se almacena en un nodo diferente.
Replica
TIPOS DE ALMACENAMIENTO
1.-Fragmentacin Horizontal Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a travs de una operacin de seleccin y su reconstruccin se realizar con una operacin de unin de los fragmentos componentes. Fragmentacin Mixta
Fragmentacin
Como el mismo nombre indica es una combinacin de las dos anteriores vistas he aqu un ejemplo a partir de una tabla fragmentada horizontalmente.
Fragmentacin Vertical Cada fragmento se sita en un nodo. Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a travs de una operacin de proyeccin. Cada fragmento debe incluir la clave primaria de la tabla.
El acceso a los datos es ms rpido debido a que los datos se localizan ms cercanos al lugar donde se utilizan.
El procesamiento es rpido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo,
VENTAJAS Y DESVENTAJAS
El control de concurrencia y los mecanismos de recuperacin son mucho ms complejos que en un sistema centralizado dado que los datos pueden estar replicados.
Es compleja el aseguramiento de la integridad de la informacin en presencia de fallas no predecibles tanto de componentes de hardware como de software. La integridad se refiere a la consistencia, validez y exactitud de la informacin. Es ms complicado el control y la manipulacin de los datos
Funciones
Ambientes
Homogneas:
Heterogneas:
Todos los sitios tienen el mismo SGBD, son conscientes de la existencia de los dems sitios y cooperan en el procesamiento de las solicitudes. Los sitios locales mantienen un mismo esquema y SGBD.
Cada sitio puede tener un SGBD distinto as como esquemas diferentes. Puede que algunos sitios no conozcan a otros. Puede que solo ofrezcan facilidades limitadas para la cooperacin en el procesamiento de transacciones.