Sei sulla pagina 1di 21

INSTITUTO TECNOLGICO SUPERIOR DE CALKINI EN EL ESTADO DE CAMPECHE

Base de datos distribuidas


PROCESAMIENTO DISTRIBUIDO DE CONSULTAS Repeticin y Fragmentacin
ING. JORGE ALBERTO POOT XIU

CANDELARIA DE JESUS PECH DZUL 0660 NORMA LETICIA CANUL TUN 0627 MARIA MARLENE PECH KEB 0657

PROCESAMIENTO DISTRIBUIDO DE CONSULTAS

En el procesamiento distribuido de consultas se estudia el coste de las comunicaciones. Objetivo: la reduccin de la cantidad de datos transferidos. Optimizacin mediante operacin de semijoin. En un sistema distribuido existen factores que complican el proceso de consulta en comparacin con los sistemas centralizados.

Costo de transferencia de datos a travs de la red.

PROCESAMIENTO DISTRIBUIDO DE CONSULTAS


Ejemplo de consulta distribuida:
NODO 1 EMPLEADO

Nombre
NODO 2:

Apellido COD Dir

Sexo Sueldo

Fecha Nac. Dpto.

DEPARTAMENTO
NombreDpto NDpto Responsable Edificio

NODO 1 10.000 tuplas. Cada tupla tiene 100 bytes El campo COD tiene 9 bytes El campo Depto tiene 4 bytes El campo Nombre tiene 15 bytes El campo Apellido tiene 15 bytes

NODO 2 100 tuplas. Cada tupla tiene 35 bytes El campo NDpto tiene 4 bytes El campo Responsable tiene 9 bytes El campo Edificio tiene 10 bytes

PROCESAMIENTO DISTRIBUIDO DE CONSULTAS


Ejemplo de consulta distribuida:
Tamao de la relacin EMPLEADO es 100 * 10.000 = 106 bytes Tamao de la relacin DEPARTAMENTO es 35 * 100 = 3500 bytes. Consideremos la consulta: Por cada empleado, obtener el nombre del empleado y el nombre del departamento al que pertenece. La expresin de sta consulta en lgebra relacional ser:

Q : Nombre , Apellido, NombreDpto EMPLEADO * DEPARTAMEN TO

El resultado de sta consulta constar de 10.000 tuplas. Cada tupla resultante ser de una longitud de 40 bytes. El tamao del resultado ser por tanto de 400.000 bytes. Supongamos que el resultado viaja al nodo 3, denominado nodo respuesta ya que ser el lugar donde se requiera el resultado de dicha consulta. Sin embargo, ni la relacin EMPLEADO ni DEPARTAMENTO residen en dicho nodo.

Ejemplo de consulta distribuida:


Q : Nombre , Apellido, NombreDpto EMPLEADO * DEPARTAMEN TO

Contador 15 + 15 40*10000 15+15+10= 0 40 400000

Nodo2 departamento nombreDpto 10

Nodo1 empleado
Nombre apellido 15 15

Resultado de consulta

Estrategias:

1.

Transferir la relacin EMPLEADO y DEPARTAMENTO al nodo respuesta (nodo 3) y realizar all la operacin de join. En ste caso se transfieren 1.000.000 + 3.500 = 1.003.500 bytes.
Contador 1000000 + 1000000 0 3500 1003500

Nodo2 departamento 3500

Nodo3 resultado

Nodo1 empleado
1000000

Estrategias:

2.

Transferir la relacin EMPLEADO al nodo 2, ejecutar el join en este nodo y enviar el resultado al nodo 3. Esto implicara transferir 1.000.000 bytes de EMPLEADO + 400.000 bytes del resultado, es decir: 1.400.000 bytes.
Contador

0 1000000+400000

Nodo2 departamento 1400000

1400000

Nodo3 resultado Nodo1 empleado 1000000

ESTRATEGIAS 3. Transferir la relacin DEPARTAMENTO al nodo 1, ejecutar el join en este nodo y enviar el resultado al nodo 3. En este caso, los bytes transferidos sern: 3.500 de la relacin DEPARTAMENTO ms 400.000 del resultado. Es decir 403.500 bytes.
Contador 3500+400000 3500 0 Nodo2 departamento 3500

403500

Nodo1 empleado 403500

Nodo3 Resultado

Repeticin y fragmentacin
Las tcnicas de rplica y fragmentacin se pueden aplicar sucesivamente a la misma relacin de partida. Un fragmento se puede replicar y a su vez esa rplica ser fragmentada, para luego replicar alguno de esos fragmentos.

Transparencia de la repeticin y la fragmentacin No es conveniente requerir que los usuarios hagan referencia a una copia especfica de un elemento de informacin. El sistema debe ser el que determine a qu copia debe acceder cuando se le solicite su lectura y debe modificar todas las copias cuando se produzca una peticin de escritura.

REPETICION
El sistema conserva varias copias o rplicas idnticas de una tabla. Cada rplica se almacena en un nodo diferente. Ventajas: Disponibilidad: el sistema sigue funcionando an en caso de cada de uno de los nodos. Aumento del paralelismo: Varios nodos pueden realizar consultas en paralelo sobre la misma tabla. Cuantas ms rplicas existan de la tabla, mayor ser la posibilidad de que el dato buscado se encuentre en el nodo desde el que se realiza la consulta, minimizando con ello el trfico de datos entre nodos.

REPETICION
Inconveniente: Aumento de la sobrecarga en las actualizaciones: El sistema debe asegurar que todas las rplicas de la tabla sean consistentes. Cuando se realiza una actualizacin sobre una de las rplicas, los cambios deben propagarse a todas las rplicas de dicha tabla a lo largo del sistema distribuido.

Fragmentacin
La fragmentacin puede ser horizontal o vertical y se puede aplicar sucesiva y alternativamente sobre la misma tabla. Cada fragmento se encontrar en nodos diferentes.

Fragmentacin horizontal
Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a travs de una operacin de seleccin y su reconstruccin se realizar con una operacin de unin de los fragmentos componentes. Cada fragmento se sita en un nodo. Pueden existir fragmentos no disjuntos: combinacin de fragmentacin y replicacin.

Fragmentacin horizontal
Ejemplo:
Se ilustra una posible fragmentacin de la tabla Alumnos de dos fragmentos: uno para el nodo de la EUI y otro para el nodo de la EUIT.

Fragmentacin horizontal

La recuperacin de la relacin original se realizar a partir de la unin de cada uno de los fragmentos: T= T1 T2...Tn
En este caso: ALUMNOS=ALUMNOS_EUI ALUMNOS_EUIT

Fragmentacin vertical
Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a travs de una operacin de proyeccin. Cada fragmento debe incluir la clave primaria de la tabla. Su reconstruccin se realizar con una operacin de join de los fragmentos componentes. Cada fragmento se sita en un nodo. Pueden existir fragmentos no disjuntos: combinacin de fragmentacin y replicacin.

Fragmentacin vertical
Supongamos que en el rectorado existen dos departamentos ubicados en distinto lugares y con necesidades distintas de informacin.
Departamento Infraestructura

Datos Rectorado

Departamento ordenacin acadmica

Fragmentacin mixta
Surge como la aplicacin combinada de la fragmentacin horizontal y vertical. Ejemplo: Podemos partir de la relacin resultante de la fragmentacin horizontal en la tabla de alumnos. Supongamos que en la EUI existen dos nodos dedicados a distintas funciones. Uno de ellos sera el de secretara que maneja la informacin referente a los alumnos y sus becas. Otro podra ser el de Jefatura de Estudios que utiliza la informacin referente a las notas de ingreso de los distintos alumnos. Tendramos el siguiente esquema:

Fragmentacin mixta
Secretaria

Datos EUI
Resultante de fragmentacin horizontal previa

Jefatura estudios

Referencias Electrnicas
http://www.oei.eui.upm.es/Asignaturas/BD/ DYOBD/DISTRIBUIDAS_texto.pdf

Potrebbero piacerti anche