Sei sulla pagina 1di 13

UNIDAD 1 MODELOS EMERGENTES DE BASES DE DATOS 1.1 Bases de datos orientadas a objetos.

Las Bases de datos orientados a objetos se propusieron con la idea de satisfacerlas necesidades de las aplicaciones ms complejas. El enfoque orientado a objetos ofrece la flexibilidad para cumplir con algunos de estos requerimientos sin estar limitado por los tipos de datos y los lenguajes de consulta disponibles en los sistemas de bases de datos tradicionales. Como cualquier Base de Datos programable, una Base de Datos Orientada a Objetos (BDOO) proporciona un ambiente para el desarrollo de aplicaciones y un depsito persistente listo para su explotacin. Una BDOO almacena y manipula informacin que puede ser digitalizada (presentada) como objetos, adems proporciona un acceso gil y permite una gran capacidad de manipulacin. Las bases de datos orientadas a objetos (BDOO) son aquellas cuyo modelo de datos est orientado a objetos y almacenan y recuperan objetos en los que se almacena estado y comportamiento. Su origen se debe a que en los modelos clsicos de datos existen problemas para representar cierta informacin, puesto que aunque permiten representar gran cantidad de datos, las operaciones que se pueden realizar con ellos son bastante simples. Las clases utilizadas en un determinado lenguaje de programacin orientado a objetos son las mismas clases que sern utilizadas en una BDOO; de tal manera, que no es necesaria una transformacin del modelo de objetos para ser utilizado por un SGBDOO. De forma contraria, el modelo relacional requiere abstraerse lo suficiente como para adaptar los objetos del mundo real a tablas. Las bases de datos orientadas a objetos surgen para evitar los problemas que surgen al tratar de representar cierta informacin, aprovechar las ventajas del paradigma orientado a objetos en el campo de las bases de datos y para evitar transformaciones entre modelos de datos (usar el mismo modelo de objetos).

1.1.1 Definicin y conceptos de las BDOO. Base de datos orientada a objetos (BDOO): una coleccin persistente y compatible de objetos definida por un modelo de datos orientado a objetos. Modelo de datos orientado a objetos: Un modelo de datos que captura la semntica de los objetos soportados en la programacin orientada a objetos. Sistema Gestor de Bases de Datos Orientadas a Objetos (SGBDOO): El gestor de una base de datos orientada a objetos. Los principales conceptos que se utilizan en las Bases de Datos Orientada a Objetos (BDOO) son las siguientes:

Identidad de objetos

Constructores de tipos Encapsulamiento


Compatibilidad con los lenguajes de programacin Jerarquas de tipos y herencia

Manejo de objetos complejos

Polimorfismo y sobrecarga de operadores

Creacin de versiones.

1.1.2 El modelo de datos orientado a objetos. Las aplicaciones de las bases de datos en reas como el diseo asistido por computadora, la ingeniera de software y el procesamiento de documentos no sea justan al conjunto de suposiciones que se hacen para aplicaciones del estilo de procesamiento de datos. El modelo de datos orientado a objetos se ha propuesto para tratar algunos de estos nuevos tipos de aplicaciones. El modelo de bases de

datos orientado a objetos es una adaptacin a los sistemas de bases de datos. Se basa en el concepto de encapsulamiento de datos y cdigo que opera sobre estos en un objeto. Los objetos estructurados se agrupan en clases. El conjunto de clases est estructurado en sub y superclases basado en una extensin del concepto ISA del modelo Entidad - Relacin. Puesto que el valor de un dato en un objeto tambin es un objeto, es posible representar el contenido del objeto dando como resultado un objeto compuesto. El propsito de los sistemas de BD datos es la gestin de grandes cantidades de informacin. Las primeras bases de datos surgieron del desarrollo de los sistemas de gestin de archivos. Estos sistemas primero evolucionaron en bases de datos de red o en bases de datos jerrquicas y, ms tarde, en bases de datos relacionales.

1.1.3 El estndar ODMG. El modelo de objetos ODMG permite que tanto los diseos, como las implementaciones, sean portables entre los sistemas que lo soportan. Dispone de las siguientes primitivas de modelado: Los componentes bsicos de una base de datos orientada a objetos son los objetos y los literales. Un objeto es una instancia auto contenida de una entidad de inters del mundo real. Los objetos tienen algn tipo de identificador nico. Un literal es un valor especfico, como Amparo o 36. Los literales no tienen identificadores. Un literal no tiene que ser necesariamente un solo valor, puede ser una estructura o un conjunto de valores relacionados que se guardan bajo un solo nombre. Los objetos y los literales se categorizan en tipos. Cada tipo tiene un dominio especfico compartido por todos los objetos y literales de ese tipo. Los tipos tambin pueden tener comportamientos. Cuando un tipo tiene comportamientos, todos los objetos de ese tipo comparten los mismos comportamientos. En el sentido prctico, un tipo puede ser una clase de la que se crea un objeto, una interface o un tipo de datos para un literal (por ejemplo, integer). Un objeto se puede pensar como una instancia de un tipo. Lo que un objeto sabe hacer son sus operaciones. Cada operacin puede requerir datos de entrada (parmetros de entrada) y puede devolver algn valor de un tipo conocido.

Los objetos tienen propiedades, que incluyen sus atributos y las relaciones que tienen con otros objetos. El estado actual de un objeto viene dado por los valores actuales de sus propiedades. Una base de datos es un conjunto de objetos almacenados que se gestionan de modo que puedan ser accedidos por mltiples usuarios y aplicaciones. La definicin de una base de datos est contenida en un esquema que se ha creado mediante el lenguaje de definicin de objetos ODL (Object Definition Language) que es el lenguaje de manejo de datos que se ha definido como parte del estndar propuesto para las bases de datos orientadas a objetos.

1.1.4 Encapsulamiento, herencia y polimorfismo en BDOO. Una base de datos orientada a objetos es una base de datos que incorpora todos los conceptos importantes del paradigma de objetos:

Encapsulacin - Propiedad que permite ocultar la informacin al resto de los objetos, impidiendo as accesos incorrectos o conflictos. Herencia - Propiedad a travs de la cual los objetos heredan comportamiento dentro de una jerarqua de clases. Polimorfismo - Propiedad de una operacin mediante la cual puede ser aplicada a distintos tipos de objetos.

En bases de datos orientadas a objetos, los usuarios pueden definir operaciones sobre los datos como parte de la definicin de la base de datos. Una operacin (llamada funcin) se especifica en dos partes. La interfaz (o signatura) de una operacin incluye el nombre de la operacin y los tipos de datos de sus argumentos (o parmetros). La implementacin (o mtodo) de la operacin se especifica separadamente y puede modificarse sin afectar la interfaz. Los programas de aplicacin de los usuarios pueden operar sobre los datos invocando a dichas operaciones a travs de sus nombres y argumentos, sea cual sea la forma en la que se han implementado. Esto podra denominarse independencia entre programas y operaciones.

1.1.5 Persistencia, concurrencia y recuperacin en BDOO. Persistencia Esta se refiere a la capacidad de manipular directamente los datos almacenados en una base de datos usando un lenguaje de programacin orientado a objetos. Esto contrasta con una base de datos utilizada por SQL o una interfaz utilizada por ODBC o JDBC. Utilizando un objeto de base de datos significa que se puede tener un mayor rendimiento y se aminora la escritura de cdigo. Con la persistencia la manipulacin de objetos se realiza directamente por el lenguaje de programacin de la misma manera que en la memoria, sin persistencia de objetos. Esto se logra mediante el uso inteligente de almacenamiento en cach. Concurrencia Los SMBDOO deben poder ser accesibles por mltiples usuarios. Cuando una aplicacin est acezando a una seccin de la base de datos, otras aplicaciones deben poder acceder a otras secciones de la base de datos. La concurrencia permite a los usuarios cooperar y colaborar en una aplicacin. Los mecanismos de control de concurrencia son necesarios para reforzar las propiedades de las transacciones (ACID). Los modos bsicos de control de concurrencia son: Modo Pesimista Modo optimista Modo mixto Modo semi-optimista

El modo pesimista obliga a una transaccin a esperar a que se resuelva el conflicto que pueda o ponga en riesgo la concurrencia para dejarle continuar cuando el conflicto haya sido resuelto. El modo optimista deje correr la transaccin como si no ocurriera ningn conflicto y resuelve este al final del commit, generalmente se emplea usando estampas de tiempo y copias de los elementos de la transaccin. El modo mixto combina diferentes controles de concurrencia a diferentes objetos y tipos de datas en una misma transaccin. El modo semi-optimista es una variante del modo mixto que no detiene a la transaccin hasta que esta termina. Los principales mecanismos de control de concurrencia son tres: Candados que prohben accesos que puedan provocar conflictos de acceso Estampas de tiempo.- estas permiten impedir violaciones a los datos Guardar mltiples versiones de los objetos de datos. Recuperacin Con recuperacin nos referimos al proceso de aplicacin de consistencia despus de que una transaccin ha abortado como resultado de fallas de hardware o problemas de comunicacin. Las fallas del sistemas, tanto de hardware como de software no deben repercutir en estados de inconsistencia de la base datos. La recuperacin es la tcnica que asegura que eso no ocurra. La recuperacin puede ser total o parcial dependiendo de las circunstancias, de la recuperabilidad. 1.2 Bases de datos multidimensionales (BDM). Son bases de datos ideadas para desarrollar aplicaciones muy concretas, como creacin de Cubos OLAP. Bsicamente no se diferencian demasiado de las bases

de datos relacionales (una tabla en una base de datos relacional podra serlo tambin en una base de datos multidimensional), la diferencia est ms bien a nivel conceptual; en las bases de datos multidimensionales los campos o atributos de una tabla pueden ser de dos tipos, o bien representan dimensiones de la tabla, o bien representan mtricas que se desean estudiar. 1.2.1 Definicin y conceptos de las BDM. Las bases de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y pueden verse como bases de datos de una sola tabla, superculiaridad es que por cada dimensin tienen un campo (o columna), y otro campo por cada mtrica o hecho, es decir estas tablas almacenan registros cuyos campos son de la forma: (d1,d2,d3,...,f1,f2,f3,...)Donde los campos 'di' hacen referencia a las dimensiones de la tabla, y los campos 'fi' a las mtricas o hechos que se quiere almacenar, estudiar o analizar. Cada una de estas tablas puede asimilarse a un hipercubo o -ms concretamente si de herramientas OLAP se trata- a un cubo OLAP, donde las dimensiones del mismo se corresponden los campos de dimensiones de la tabla (campos 'di...'), y el valor almacenado en cada celda del cubo equivale a la mtrica o mtricas (campos 'fi...') almacenadas en la tabla. Implementacin Lo ms importante a tener en cuenta para implementar esta estructura de datos es que la tabla contiene todas las n-tuplas, con los valores de las dimensiones, o ndice del cubo, y los valores de las mtricas previamente calculados para el cruce de valores del ndice en cuestin. 1.2.2 Modelos conceptuales multidimensionales. En una base de datos multidimensional, la informacin se representa como matrices multidimensionales, cuadros de mltiples entradas o funciones de varias variables sobre conjuntos finitos. Cada una de estas matrices se denomina Cubo. El esquema de un cubo queda determinado dando a conocer sus ejes con sus

respectivas estructuras y la estructura de los datos que se presentan en cada celda de la matriz. Se asume que los datos en todas las celdas son uniformes, es decir, todas las posiciones de la matriz tienen datos con igual estructura.

Una instancia de un cubo, queda determinada por un conjunto de datos para cada eje y un conjunto de datos para la matriz. A los ejes se les llama Dimensiones y al dato que se presenta en la matriz, se le llama Medida. A los elementos del producto cartesiano de los ejes (dimensiones) se le llama Coordenadas. La matriz definida, puede ser dispersa. (Funcin parcial). 1.2.3 Cubos e hipercubos de datos. Los cubos de informacin o cubos OLAP funcionan como los cubos de rompecabezas en los juegos, en el juego se trata de armar los colores y en el datawarehouse se trata de organizar los datos por tablas o relaciones; los primeros (e luego) tienen 3 dimensiones, los cubos OLAP tienen un nmero indefinido de dimensiones, razn por la cual tambin reciben el nombre de hipercubos. Un cubo OLAP contendr datos de una determinada variable que se desea analizar, proporcionando una vista lgica de los datos provistos por el sistema de informacin hacia el data warehouse, esta vista estar dispuesta segn unas dimensiones y podr contener informacin calculada. El anlisis de los datos est b asado en las dimensiones del hipercubo, por lo tanto, se trata de un anlisis multidimensional. A la informacin de un cubo puede acceder el ejecutivo mediante tablas dinmicas en una hoja de clculo o a travs de programas personalizados. Las tablas dinmicas le permiten manipular las vistas (cruces, filtrados, organizacin, totales) de la informacin con mucha facilidad. Las diferentes operaciones que se pueden realizar con cubos de informacin se producen con mucha rapidez. Llevando estos conceptos a un data warehouse, ste es una coleccin de datos que est formada por dimensiones y variables, entendiendo como

dimensiones a aquellos elementos que participan en el anlisis y variables a los valores que se desean analizar.

Dimensiones Las dimensiones de un cubo son atributos relativos a las variables, son las perspectivas de anlisis de las variables (forman parte de la tabla de dimensiones).Son catlogos de informacin complementaria necesaria para la presentacin de los datos a los usuarios, como por ejemplo: descripciones, nombres, zonas, rangos de tiempo, etc. Es decir, la informacin general complementaria a cada uno de los registros de la tabla de hechos. Variables Tambin llamadas indicadores de gestin, son los datos que estn siendo analizados. Forman parte de la tabla de hechos. Ms formalmente, las variables representan algn aspecto cuantificable o medible de los objetos o eventos a analizar. Normalmente, las variables son representadas por valores detallados y numricos para cada instancia del objeto o evento medido. En forma contraria, las dimensiones son atributos relativos a las variables, y son utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas. Las dimensiones pose en una granularidad menor, tomando como valores un conjunto de elementos menores que el de las variables; ejemplos de dimensiones podran ser: productos, localidades (o zonas), el tiempo (medido en das, horas) . 1.2.4 Estructuras no-jerrquicas y jerrquicas de los datos. Una Base de datos jerrquica es un tipo de Sistema Gestor de Bases de Datos que, cmo su nombre indica, almacenan la informacin en una estructura jerrquica que enlaza los registros en forma de estructura de rbol (similar a un rbol visto al revs), en donde un nodo padre de informacin puede tener varios nodos hijo. Esta relacin jerrquica no es estrictamente obligatoria, de manera que

pueden establecerse relaciones entre nodos hermanos. En este caso la estructura en forma de rbol se convierte en una estructura en forma de grafo dirigido. Esta variante se denomina Bases de datos de red. Como funcionan: A diferencia del modelo relacional, el modelo jerrquico no diferencia una vista lgica de una vista fsica de la base de datos. De manera quelas relaciones entre datos se establecen siempre a nivel fsico, es decir, mediante referencia a direcciones fsicas del medio de almacenamiento (sectores y pistas). Los datos se almacenan en la forma de registros, el equivalente a las filas del modelo relacional. Cada registro consta de un conjunto de campos, el equivalente a las columnas del modelo relacional. Un conjunto de registros con los mismos campos se denomina fichero (record type, en ingls), el equivalente a las tablas del modelo relacional. El modelo jerrquico facilita relaciones padre-hijo, es decir, relaciones 1: N (de uno a varios) del modelo relacional. Pero a diferencia de ste ltimo, las relaciones son unidireccionales. En justicia, dichas relaciones son hijo-padre, pero no padre-hijo. Por ejemplo, el registro de un empleado (nodo hijo) puede relacionarse con el registro de su departamento (nodo padre), pero no al contrario. Esto implica que solamente se puede consultar la base de datos desde los nodos hoja hacia el nodo raz. La consulta en el sentido contrario requiere una bsqueda secuencial por todos los registros de la base de datos (por ejemplo, para consultar todos los empleados de un departamento). En las bases de datos jerrquicas no existen ndices que faciliten esta tarea. Las relaciones jerrquicas entre diferentes tipos de datos pueden hacer que sea muy sencillo responder a determinadas preguntas, pero muy difcil el contestar a otras.

1.2.5 Operadores para datos agregados multidimensionales. A pesar de los buenos resultados obtenidos con el modelo relacional en los sistemas Operacionales, la utilizacin de este modelo en aplicaciones orientadas a

la toma de decisiones presenta varias carencias, Una de las principales carencias es el bajo rendimiento de las consultas: el modelo relacional est orientado a transacciones que manejan pocos registros simultneamente, mientras que los sistemas de ayuda a la toma de decisiones (DSS) tienden a procesar grandes volmenes de datos. Otra de las limitaciones es la propia estructura de la base de datos: las consultas realizadas en los DSS son muy complejas y su definicin no est fijada de antemano. Como las consultas dependen de lo que necesite el usuario en cada momento, con un modelo relacional se debera generar un ndice por cada posible consulta que desee el usuario, lo que dificulta la gestin y mantenimiento de la base de datos. Por otra parte, si lo que se quiere es acceder a un dato individual bsico como puede ser el importe de una operacin concreta, la ventaja del modelo multidimensional desaparece en favor del relacional. stos son capaces de recuperar un dato individual con mayor eficiencia que las multidimensionales y, dada su utilizacin masiva en sistemas OLTP, estn optimizados para la insercin de registros y el control concurrente de usuarios. En el modelo de datos multidimensional, los datos se organizan en torno a los conceptos de la empresa y la estructura de datos manejada en este modelo son matrices multidimensionales o hipercubos. Un hipercubo consiste en un conjunto de celdas, de tal manera que cada una est identificada por la combinacin de los miembros de las diferentes dimensiones y contiene el valor de la medida analizada para dicha combinacin de dimensiones. Las variables o medidas son aquellas caractersticas del negocio que pueden ser cuantificadas y son seleccionadas para el anlisis. Por ejemplo: ventas, compras, costes, Se corresponden con los datos numricos. Los valores que toman las variables son el resultado de las diferentes combinaciones posibles de los miembros de las dimensiones sobre las que se definen. 1.2.6 Consultas multidimensionales de datos. Las consultas D base constan de archivos que permiten realizar muchas tareas diferentes con los datos. Se pueden utilizar las consultas para controlar los campos de datos que se pueden ver. Tambin se pueden utilizar las consultas

para controlar los registros que visualiza D base. Las consultas pueden cambiar el orden de presentacin de datos y pueden incluso actualizarlos. Las consultas no contienen informacin de la base de datos, sino tan solo las instrucciones necesarias para seleccionar los registros y campos requeridos de una base de datos. Consulta de un campo para una entrada carcter: Se pueden crear consultas simples para encontrar todos los registros que con tienen una entrada de carcter especfica. Se puede utilizar la coincidencia exacta u operadores relacionales cuando se realiza la bsqueda. Puesto que se deben en cerrar las cadenas de caracteres entre comillas, se puede buscar una coincidencia exacta colocando la cadena de caracteres que se necesite encontrar entre comillas. Almacenamiento y uso de consultas: D base IV puede almacenar una consulta como archivo. Esto ofrece la ventaja de reutilizar la consulta posteriormente sin reentrar en ella. Para utilizar cualquier consulta almacenada en disco se selecciona un archivo de consultas del panel de consultas del centro de control con la apropiada base de datos en uso. Las condiciones que tambin se denominan filtros establecidas por esta consulta se ponen en vigor automticamente para ocultar los registros que presenta D base. Se puede utilizar para afectar a la visualizacin de los registros sobre la pantalla o para restringir los registros presentados en los informes que se crean. Consulta de campos numricos: La bsqueda de valores numricos permite operar con todos los registros de empleado con un cdigo de trabajo especfico o todos los registros de un nmero de cliente particular. Se controlan los registros que cumplan la consulta en base a los contenidos de un campo numrico en lugar de un campo carcter, pero la mayor parte de las caractersticas de las consultas utilizadas para campos numricos son exactamente las mismas que se utilizan para campos de carcter. Se pueden utilizar ejemplos de coincidencia exacta para localizar datos. Puesto que estamos trabajando con datos numricos, las comillas no se necesitan.

Tambin se puede utilizar muchos de los operadores relacionales que utilizaron con los campos de carcter. Consulta de campo de fecha: La consulta de los campos de fecha no es diferente del acceso a otros tipos de campos. D base reconoce los campos de fecha y los trata como una entrada de fecha si se incluyen de las llaves { }. Se utilizan los ejemplos bajo este tipo de campos para encontrar una coincidencia exacta o relacional. Se pueden utilizar ejemplos relacionales para localizar todos los registros anteriores y posteriores a una fecha dada. Tambin se pueden encontrar registros dentro de un rango especifico de fechas colocando en el ejemplo dos expresiones relacionadas separadas por coma (,). Consultas de campos lgicos: Los campos lgicos contienen indicadores de verdadero o falso. Cuando se crea un ejemplo de un campo lgico, se puede hacer que D base busque valores verdaderos o falsos colocando .T. o .F. como un ejemplo debajo del tipo de campo. D base tambin acepta .t., .f., ..f., .Y., .N., .y., y .n., como entradas para este campo. Las operaciones ms comunes realizadas sobre los datos multidimensionales son: cube y roll up definidas en Cube calcula todas las posibles agregaciones que resultan de las combinaciones de atributos incluidos en la clusula de la consulta, generando totales y subtotales para dichas combinaciones de los atributos.

Potrebbero piacerti anche