Sei sulla pagina 1di 5

Algoritmos de distribucion de datos 1.

Los algoritmos de distribucin de datos (carga) de procesamiento independiente proveen un conjunto de beneficios a las aplicaciones paralelas tales como: la minimizacin de su tiempo de ejecucin, la maximizacin de uso de los recursos, etc. pero por su naturaleza paralela, la implementacin de un algoritmo de distribucin de datos es compleja lo que puede originar que no cumpla con las especificaciones para las que fue diseado. 2.5.1 Algoritmos Distribucin Datos No Replicados Debido al uso que se da a las redes de computadoras en la actualidad incluyendo Internet, cada vez es ms factible implementar Sistemas de Bases de Datos Distribuidas, sin embargo, esta tecnologa lleva a los desarrolladores a enfrentar un problema, la carencia de metodologas y herramientas de apoyo para su diseo que permitan decidir la ubicacin de los datos en cada uno de los diferentes sitios que componen la red de computadoras. Este problema se conoce como Diseo de la Distribucin y nace de la necesidad de especificar las unidades de almacenamiento adecuadas, ya sea fragmentos verticales, horizontales o mixtos, junto con su ubicacin dentro de la aplicacin . El Modelo FURD, ha sido desarrollado para resolver el problema del diseo de las Bases de Datos Distribuidas, el cual esta divido en dos etapas o fases: la fragmentacin y la ubicacin de fragmentos. Estas fases ya se concentran en el Modelo FURD. Una vez que se resuelve el Modelo FURD se puede dar solucin al problema del diseo. Sin embargo la dificultad radica precisamente en la forma de resolverlo, pues es un problema de optimizacin muy complejo que a medida que va creciendo su tamao, se va haciendo ms difcil la forma de resolverse. 2.5.2 Algoritmos Distribucin Datos Replicados Al tratarse de algoritmos de distribucin replicados o no replicados la definicin de nuestro problema y variables ser diferente. Estas restricciones son: 1 Restriccin. Cada atributo se almacena solamente en un solo sitio (Para bases de datos distribuidas no replicadas) 2 Restriccin. Cada atributo m se ubica en un sitio i que al menos ejecute una consulta que involucre al atributo (Para bases de datos distribuidas replicadas)

2.5 DISTRIBUCION DE DATOS Describe el proceso de decidir donde localizar los datos. Una de las decisiones ms importantes que el diseador de bases de datos distribuidas debe tomar es el posicionamiento de los datos en el sistema y el esquema bajo el cual lo desea hacer Replicacin de datos La replicacin de datos se refiere al almacenamiento de copias de datos en sitios mltiples servidos por una red de computadoras. Pueden guardarse copias de fragmento para satisfacer requerimientos de informacin especficos. La replicacin en SQL Server consiste, en el transporte de datos entre dos o ms instancias deservidores. Base de datos totalmente replicada guarda varias copias de cada fragmento de la base de datos en varios sitios. No es prctica debido la cantidad de carga impuesta al sistema. Base de datos parcialmente replicada , guarda mltiples copias de algunos fragmentos de la base de datos en mltiples sitios. Se tiene un buen manejo Base de datos no replicada , guarda cada fragmento de base de datos en un solo sitio. Suponga que la base de datos A esta dividida en fragmentos: A1 Y A2 dentro de una base de datos distribuida replicada, es posible el escenario ilustrado en lafig.10.20: el fragmento A1 se guarda en los sitios S1 y S2, mientras que el A2 se guarda en los sitios S2y S3.

Los datos replicados requiere que todas las copias de fragmentos de datos sean idntica, por consiguiente para mantener la consistencia de los datos entre las replicas, el DDBMS debe garantizar que se realice una actualizacin de la base de datos donde existen replicas. La

replicacin exige ms complejidad de procesamiento del DDBMS por que cada copia de dato debe ser mantenida por el sistema. Si la base de datos est fragmentada el DDBMS debe decidir que copia accesa Una operacin read (lectura) selecciona la copia ms cercana parasatisfacer la transaccin. Una operacin write (escritura) requiere que todas las copias se seleccionen y se actualizan. Tipos de replicacin Los tipos bsicos de replicacin son: replicacin de instantneas replicacin transaccional replicacin de mezcla REPLICACIN DE INSTANTNEAS En la replicacin de instantneas los datos se copian tal y como aparecenexactamente en un momento determinado.Por consiguiente, no requiere uncontrolcontinuo de los cambios.Las publicaciones de instantneas se suelen replicar con menos frecuencia queotros tipos de publicaciones.Puede llevar mstiempopropagar las modificaciones de datos a los suscriptores.Se recomienda utilizar: cuando la mayora de los datos no cambian con frecuencia REPLICACIN TRANSACCIONAL En este caso se propaga una instantnea inicial de datos a los suscriptores, ydespus, cuando se efectan las modificaciones en el publicador, lastransacciones individuales se propagan a los suscriptores REPLICACIN DE MEZCLA Permite que varios sitios funcionen en lnea o desconectados de maneraautnoma, y mezclar ms adelante las modificaciones de datos realizadas en unresultado nico y uniforme. TIPOS DE RELACIONES:1.- RELACIONES BASE O REALES: Corresponde al concepto de Tabla esdecir una relacin autnoma cuya importancia est dada por el diseador para unuso especifico dentro de una aplicacin 2.- RELACIONES VIRTUALES: (Relaciones de Vistas) Una vista es unarelacin derivada con nombre representada dentro del sistema exclusivamentemediante su definicin en trmino de otras relaciones, no posee datos

almacenados propios, separados y distinguibles a diferencia de las relacionesBases, en si una VISTA. 3.- RELACIONES INSTANTANEAS: (Snap Shop) Es tambin una relacinderivada con nombre como una vista pero a diferencia de esta ltima lasinstantneas son reales no virtuales, es decir, estn representadas no solo por sudefinicin, en trmino de otras relaciones con nombre, sino, tambin por suspropios datos almacenados:(Snap Shop = consulta rpida, corta)Las estrategias que se tienen son: Colocacin centralizada de los datos, toda la base de datos se guarda enun sitio Colocacin particionada de los datos, la base de datos se divide en variaspartes desarticuladas (fragmentos) y se guardan en varios sitios. Colocacin replicada de los datos, se guardan copias de uno o msfragmentos de la base de datos en varios sitios. La distribucin de los datos se logra mediante la particin de los datos,replicados de los datos o mediante una combinacin de ambas. La colocacin de los datos est estrechamente relacionada en como la BDse divide o fragmenta. La colocacin de los datos ve que datos localizar yen donde. Los algoritmos de colocacin de los datos consideran varios factores,incluidos: Objetivos de desempeo y disponibilidad de los datos. Tamao, numero de filas y el nmero de relaciones que una entidadmantiene con otras entidades. Tipos de transacciones a ser aplicadas a la base de datos. 2.5 1 ALGORITMOS DE DISTRIBUCION DE DATOS NO REPLICADOS Permite maximizar el costo de comunicacin y al mismo tiempo maximizar eltiempo de respuesta. El administrador de bases de datos debe de evaluar el modode operar de la base de datos, es decir como su nombre lo indica no podemosrealizar el algoritmo en aquellas copias, pero debe ser sobre la base de datosoriginal. La fragmentacin hibrida es de preferencia lo que debe de llevar este tipode algoritmos, porque estas utilizan las tres fragmentaciones y las msaconsejables.Hablar de algoritmos implica sobre la ProgramacinHay gestores que son muy flexibles en cuestiones de programacin, mientras queotros ofrecen ms rendimiento. As, al disear el algoritmo tendr que hacer todala informacin referente a la vida de la base de datos pero por otro lado deber buscar siempre de darle soluciones al usuario, pues este ser el que al final decuentas interesa.Existen en la actualidad infinidad de tecnologas en cuanto a los gestores de labase de datos se refiere, el que utilizaremos (el ms actual) ser SQL SERVER,este gestor comenz a crearse por la dcada de los 90s, ofrece muchas ventajassobre otros gestores, la nica

desventaja que podramos encontrar en sucompatibilidad con los Windows ms comerciales como el 98, XP entre otros.Se preguntaran que tiene que ver el gestor con los algoritmos de datos noreplicados, sin embargo la respuesta es muy sencilla, y esta es que este algoritmoes fcil de implantar en SQL SERVER. 2.5.2 ALGORITMOS DE DISTRIBUCION DE DATOS REPLICADOS Se refiere al almacenamiento de copias de datos en sitios mltiples, puede ser para satisfacer requerimientos de informacin, adems de mejorar ladisponibilidad de los datos y el tiempo respuesta; finalmente estas copias reducenlos costos de comunicacin y de consulta total.Los datos replicados se someten a la regla de consistencia mutua, la cual requiereque todas las copias de fragmentos de datos sean idnticas, esto quiere decir quecuando hay una actualizacin de la base de datos se realiza en todos los sitiosdonde hay replicas.El algoritmo de distribucin de datos replicados ser realizado principalmente paralos datos que ya tengan una copia aunque es muy til, lo cual podemos asegurar que su utilizacin y programacin depender de un 100% del gestor que seutilizandoSQL SERVER a pesar de su facilidad de utilizacin tambin incorporaherramientas sofisticadas para aquellos usuarios de nivel avanzado. Entre algunasde las novedades que trae SQL SERVER, es que integra un servidor completo yun mdulo para la transformacin de datos.Otras de las caractersticas que posee SQL SERVER es un bloqueo dinmico anivel de fila, paralelismo entre consultas; consultas distribuidas y permite aceptar bases de datos de gran tamao.Para crear una base de datos en SQL SERVER lo podemos hacer primeramenteusando el asistente de base de datos y la interfaz predefinida para la creacin debase de datos. Tabla en SQL SERVER Columna NameData TypeLenghtAllow Nulls Esta parte se debecolocar todos losnombres de loscampos que tendrla tabla.Aqu se coloca eltipo de dato quelleva el campoanteriormenteubicado.Tamao delcampo.Si se activa estaopcin significaraque esta opcinpermitir valoresnulos. Propiedades de los campos de las tablas Descripcin.- Esta propiedad es exclusiva para el diseador o bien para eladministrador.Default value.- Se usa para especificar un valor predeterminado para la columna.Precisin.- Se utiliza para campos numricos, por aqu se indica la cantidad dedgitos que llevara un nmero.Scale.- Indica el nmero de dgitos decimales.Identify.- Si esta opcin se marca con un si estaremos indicando que el campotendr un nmero generado automticamente.Identify Seed.- Indica el valor inicial para el primer registr.Identify Increment.- Indica el valor del incremento.Is Row Guid.- Esta propiedad creara un contenido global y nico. Cualquier tablapuede tener este tipo de columna en el momento que se crea necesario por eldiseador.Frmula.- Es una propiedad exclusiva y diseadas para aquellos campos quenecesitan alguna funcin.Collation.- En este campo se debe de especificar a qu base de datos pertenecela tabla que estamos generando se hace por default esta tabla pertenecer a labase de datos desde donde fue fragmentada

Potrebbero piacerti anche