Sei sulla pagina 1di 11

UNIVERSIDAD AUTNOMA DEL ESTADO DE MXICO CENTRO UNIVERSITARIO UAEM ATLACOMULCO

PROGRAMA EDUCATIVO INFORMATICA ADMINISTRATIVA

UNIDAD DE APRENDIZAJE: BASES DE DATOS RELACIONALES

MAPAS

CATEDRTICO:

LIA ELIZABETH EVANGELISTA NAVA

ALUMNO:

AQUILES SORIA GONZLEZ

GRUPO LIA-I7

PERIODO ESCOLAR 2013-B

ATLACOMULCO, MXICO, NOVIEMBRE 2013

Memoria Compartida Disco Compartido Sin Compartimento Jerrquica Sesgo de valores de los atributos: Un determinado valor para Un atributo es ms frecuente que otro

Tipos de arquitecturas:

La divisin entre los discos no es equitativa Clasificacin:

BASES DE DATOS PARALELAS

Aumento de la velocidad en el acceso a los datos

Sesgo de la divisin: Desequilibrio en la carga de la Distribucin aunque no haya sesgo en los atributos

Divisin de las relaciones en varios discos (particiones) Tcnicas de divisin

Turno Rotatorio: Asignar la iesima tupla al Disco i mod n. Asegura distribucin homognea Divisin por Asociacin: Definir una funcin F(a1, ..an) ! Particin Divisin por Rangos: Dado un atributo partirlo en rangos y Cada rango se almacena en un disco

El tiempo de una transaccin es el mismo pero se incrementa la productividad (throughput) Se pueden hacer en paralelo cada uno de los nodos del rbol de operaciones.

Varias transacciones al tiempo

PARALELISMO ENTRE CONSULTAS Consideraciones de implementacin: Los conjuntos son parte constitutiva de las bases de datos y por tanto son susceptibles a ser paralelizables

Coherencia del cache Evitar que dos procesadores modifiquen al tiempo un mismo dato (Protocolos de Bloqueo)

Puede presentare paralelismo en o entre operaciones

Ordenamiento:

Realizar una particin de los datos para cada procesador (depende del esquema de particionamiento utilizado). Hacer merge de cada una de las partes ordenadas

PARALELISMO EN OPERACIONES

Reunin:

Por divisin:

Reunin con fragmentos y replicas:

Solo para equireuniones y los atributos de reunin deben ser los mismos del particionamiento. Las dos relaciones deben particionarse con la misma funcion o rango. Cada procesador se encarga de

En general, se pueden dividir ambas relaciones y construir una matriz de procesadores

Para reuniones con condiciones de desigualdad Se parte una de las relaciones y se replica la otra en cada procesador. La relacin pequea suele replicarse.

Agregacin: Calcular resultados parciales y luego calcular el resultado total

Eliminacin de duplicados: Utilizar un ordenamiento paralelo y luego realizar la eliminacin

Seleccin: Si la condicin es una condicin de particionamiento, cada procesador puede seleccionar algunas tuplas y luego reunirlas

Paralelismo de encauzamiento:

PARALELISMO EN OTRAS OPERACIONES

Tiempo de ejecucin
Una operacin consume el resultado de otra No siempre es til pues una operacin puede requerir la totalidad de las tuplas y no bastarle resultados parciales No siempre las operaciones son tan largas para esperar Ti = Tinicio + max(op0, ..., opn) + Treunion
Carlos A.

Paralelismo Independiente:

Problemas del Paralelismo


Sesgo Cuello de botella en los recursos Costo de reunin y de inicio

Cada operacin se realiza por separado y luego otra operacin las rene

Nodo: Equipo de cmputo con CPU, memoria, almacenamiento e intercomunicacin.

Uniform Memory Access: Todos procesadores acceden a la memoria a la misma velocidad.

los

Non-Uniform Memory Access: El acceso a memoria tiene un costo dependiendo del nodo

ARQUITECTURAS DE HARDWARE PARALELAS Niveles de Escalabilidad

Escalabilidad del DBMS: El motor paraleliza las consultas o un agente externo


Carlos

Escalabilidad de HW y RED: La interconexin entre los nodos es de vital importancia (latencia en el B.W. Y en el I/O)

Escalabilidad del S.O: Manejo de la memoria compartida, sincronizacin y acceso a los recursos

Caractersticas

Grupo de datos que pertenecen a un sistema pero a su vez esta repartido entre ordenadores de una misma red, ya sea a nivel local o cada uno en una diferente localizacin geogrfica,

Control jerrquico: DBA global y DBA local

BASES DE DATOS DISTRIBUIDAS

Transparencia en la Distribucin: Localizacin de los datos es un aspecto adicional de independencia de datos

Problemas de seguridad intrnsecos

Replicacin de Datos: Copias mltiples de datos que incrementa la localidad y la disponibilidad de datos

No hay estructuras intersitios. Uso de optimizacin global para reducir transferencia de datos

Fragmentation Schema: Traduccin entre relaciones globales y fragmentos. (Una relacin global puede consistir de varios fragmentos pero un fragmento est asociado con slo una relacin global) Global Schema: Define todos los datos que estn incluidos en la bd distribuida tal como si la bd no fuera distribuida. Consiste de una definicin de relaciones globales.

Allocation Schema: Define el sitio (o sitios) en el cual un fragmennto est localizado.


ARQUITECTURA

Local Maping Schema: Traduce los fragamentos locales a los objetos que son manejados por el SMBD local

Separacin entre fragmentacin y localizacin.

-Transparencia de Fragmentacin

-Control explcito de redundancia

-Transparencia de Localizacin

-Independencia de BD locales

El sistema conserva varias copias o rplicas idnticas de una tabla. Cada rplica se almacena en un nodo diferente.

Replica

TIPOS DE ALMACENAMIENTO
1.-Fragmentacin Horizontal Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a travs de una operacin de seleccin y su reconstruccin se realizar con una operacin de unin de los fragmentos componentes. Fragmentacin Mixta

Fragmentacin

Existen tres tipos de fragmentacin la horizontal, la vertical y la mixta

Como el mismo nombre indica es una combinacin de las dos anteriores vistas he aqu un ejemplo a partir de una tabla fragmentada horizontalmente.

Fragmentacin Vertical Cada fragmento se sita en un nodo. Una tabla T se divide en subconjuntos, T1, T2, ...Tn. Los fragmentos se definen a travs de una operacin de proyeccin. Cada fragmento debe incluir la clave primaria de la tabla.

El acceso a los datos es ms rpido debido a que los datos se localizan ms cercanos al lugar donde se utilizan.

El procesamiento es rpido debido a que varios nodos intervienen en el procesamiento de una carga de trabajo,

Nuevos nodos se pueden agregar fcil y rpidamente.

Mayor tolerancia a los fallos


Leer ms: http://www.monografias. com/trabajos82/base-datosdistribuidas/base-datosdistribuidas.shtml#ixzz2lJgnn aNU

Control local de los datos con que se interacta.

VENTAJAS Y DESVENTAJAS

El control de concurrencia y los mecanismos de recuperacin son mucho ms complejos que en un sistema centralizado dado que los datos pueden estar replicados.

Es compleja el aseguramiento de la integridad de la informacin en presencia de fallas no predecibles tanto de componentes de hardware como de software. La integridad se refiere a la consistencia, validez y exactitud de la informacin. Es ms complicado el control y la manipulacin de los datos

Decide sobre cual copia de los datos replicados acceder.

Realiza la recuperacin ante los fallos.

Mantiene la consistencia de las copias de los datos replicados.

Funciones

SISTEMAS DE GESTIN DE BASES DE DATOS DISTRIBUIDA

Ambientes

Homogneas:

Heterogneas:

Todos los sitios tienen el mismo SGBD, son conscientes de la existencia de los dems sitios y cooperan en el procesamiento de las solicitudes. Los sitios locales mantienen un mismo esquema y SGBD.

Cada sitio puede tener un SGBD distinto as como esquemas diferentes. Puede que algunos sitios no conozcan a otros. Puede que solo ofrezcan facilidades limitadas para la cooperacin en el procesamiento de transacciones.

Potrebbero piacerti anche