Sei sulla pagina 1di 11

SISTEMAS DE BASES DE

DATOS PARALELAS

SISTEMAS DE BASES DE DATOS


PARALELAS
Actualmente los Sistemas Paralelos se estn
comercializando con xito por prcticamente
todos los fabricantes de BD.
Este cambio lo han impulsado las siguientes
tendencias:

Los requisitos transaccionales de las empresas han aumentado, con el


uso creciente de las computadoras.

El crecimiento de la WWW y los datos recogidos por los visitantes han


producido BD extremadamente grandes en muchas empresas.

Las empresas utilizan volmenes crecientes de datos para planificar


sus actividades y sus tarifas.

SISTEMAS DE BASES DE DATOS


PARALELAS

Las consultas utilizadas para estos fines se denominan


consultas de Ayuda a la Toma de Decisiones y las necesidades
de datos para las mismas pueden llegar a los terabytes.

Los sistemas con un nico procesador no son capaces de tratar


volmenes de datos tan grandes a la velocidad necesaria.

La naturaleza orientada a conjuntos de las consultas de BD se


presta de manera natural a la paralelizacin.

Varios sistemas comerciales y de investigacin han


demostrado la potencia y dimensionalidad del procesamiento
paralelo de consultas.

Con el abaratamiento de los microprocesadores, las mquinas


paralelas se han vuelto comunes y relativamente baratas.

SISTEMAS DE BASES DE DATOS


PARALELAS
El paralelismo se utiliza para proporcionar aceleracin, y
las consultas se ejecutan ms rpido debido a que se
proporcionan ms recursos, como procesadores y discos.
El paralelismo tambin se utiliza para proporcionar
ampliabilidad, y las cargas de trabajo crecientes se
tratan sin aumentar el tiempo de respuesta mediante un
aumento en el grado de paralelismo.
PARALELISMO DE E/S
En su forma ms sencilla, el paralelismo de E/S se refiere
a la reduccin del tiempo necesario para recuperar
relaciones del disco dividindolas en varios discos.

PARALELISMO ENTRE CONSULTAS


Se ejecutan en paralelo entre s diferentes consultas o
transacciones.
La productividad de transacciones puede aumentarse
con esta forma de paralelismo.
Sin embargo, el tiempo de respuesta de cada
transaccin no es menor que si stas se ejecutaran
aisladamente.
El uso principal del paralelismo entre consultas es
ampliar
los
sistemas
de
procesamiento
de
transacciones para permitir un nmero mayor de
transacciones por segundo.

El paralelismo entre consultas es la forma ms


sencilla de paralelismo que se permite en los
sistemas de BD, especialmente en los Sistemas
Paralelos de Memoria Compartida.
Los SBD diseados para sistemas con un nico
procesador pueden utilizarse en arquitecturas
paralelas de memoria compartida con pocos o
ningn cambio.
Esto dado que incluso los sistemas secuenciales de
BD permiten el procesamiento concurrente.

Las transacciones que se habran realizado de manera


concurrente en tiempo compartido en una mquina
secuencial, se realizan en paralelo en la arquitectura
paralela de memoria compartida.
Permitir el paralelismo entre consultas es ms
complicado en las arquitecturas de disco compartido y
sin compartimiento.
Los procesadores tienen que realizar algunas tareas,
como los bloqueos y el registro histrico, de forma
coordinada, y eso exige que se intercambien mensajes.

Los sistemas con arquitectura paralela tambin


deben asegurar que dos procesadores no actualicen
simultneamente los mismos datos de manera
independiente.
Cuando un procesador tiene acceso a los datos o los
actualiza, el sistema de BD debe asegurar que el
procesador tenga la ltima versin de stos en
memoria intermedia.
Esto ltimo se conoce
Coherencia Cach.

como

el

problema

de

PARALELISMO EN CONSULTAS
Se refiere a la ejecucin en paralelo de una nica
consulta en varios procesadores y disco.
El uso de paralelismo en consultas es importante para
acelerar las consultas de ejecucin larga.
El paralelismo entre consultas no ayuda en esta labor,
dado que cada consulta se ejecuta de manera
secuencial.
Para valorar esta caracterstica, considrese
consulta que exija que se ordene una relacin:

una

PARALELISMO EN CONSULTAS
Supngase que la relacin se ha dividido en varios
discos mediante la divisin por rango, basado en
algn atributo.
Y que se solicita la ordenacin basado en el atributo
de divisin.
La ordenacin se puede realizar de la manera
siguiente:

Cada particin se ordena en paralelo

Y las particiones ordenadas se concatenan para obtener la relacin ordenada final.

Por lo que se puede hacer paralela una consulta haciendo


paralelas las operaciones que la forman.
Existe otra fuente de paralelismo para la evaluacin de
las consultas: el rbol de Operadores de una consulta
puede contener varias operaciones.
Se puede hacer paralela la evaluacin del rbol de
operadores evaluando en paralelo algunas de las
operaciones que no tengan ninguna dependencia entre s.
Pueden ejecutarse en paralelo en procesadores
separados, uno que genere el resultado que consuma el
otro.

Potrebbero piacerti anche