Sei sulla pagina 1di 63

Base de Datos?

Las definiciones de Base de Datos son numerosas. Todas coinciden en que es un Conjunto de Datos Almacenados en un Soporte de Acceso Directo. Los Datos estn Interrelacionados y Estructurados de acuerdo a un Modelo que sea capaz de Recoger el Mximo Contenido Semntico.

Definicin 1:
"Coleccin de Datos Interrelacionados Almacenados en Conjunto sin Redundancias Perjudiciales o Innecesarias; su finalidad es servir a una o ms aplicaciones de la mejor forma posible; los datos se almacenan de modo que resulten independientes de los programas que los usan; se emplean mtodos bien determinados para incluir nuevos datos y para modificar o extraer los datos almacenados". Martin, 1975.

Definicin 2:
"Coleccin integrada y generalizada de datos, estructurada atendiendo a las relaciones naturales de modo que suministre todos los caminos de acceso necesarios a cada unidad de datos con objeto de poder atender todas las necesidades de los diferentes usuarios". Deen, 1985.

Definicin 3:

"Coleccin de datos integrados, con redundancia controlada y con una estructura que refleje las interrelaciones y restricciones existentes en el mundo real ; los datos, que han de ser compartidos por diferentes usuarios y aplicaciones, deben mantenerse independientes de stas, y su definicin y descripcin, nicas para cada tipo de datos, han de estar almacenadas junto con los mismos. Los procedimientos de actualizacin y recuperacin, comunes y bien determinados, habrn de ser capaces de conservar la integridad, seguridad y confidencialidad del conjunto de los datos". A.de Miguel, 1993. Definicin 4: "Una Base de Datos consiste en alguna Coleccin de Datos Persistentes e Independientes Usados por una Organizacin Determinada." (Date, 1995)

0.1.- Caractersticas del Dato:


No efmero, en el sentido que permanece en el tiempo Estructurado, para que facilite el compartirlos por aquellos que lo necesiten. Operacional, Transaccional, manipularlos aplicando operadores para obtener resultados Sentido Semntico Integro, en el sentido que refleja una Realidad Existente

De hecho los datos que contiene una Base de Datos tiene una caracterstica especial, se les reconoce como Datos de Operacin.

Datos de Operacin: los datos de una Base de Datos se consideran DATOS de OPERACION, distinguindose de los Datos de Entrada y de Salida. Una Base de Datos, es un Conjunto de Datos de Operacin Almacenados y Utilizados por los Sistemas de Aplicacin de una Organizacin Especfica. Cualquier organizacin necesita disponer de una gran cantidad de datos acerca de su funcionamiento. Estos constituyen sus datos de operacin. Los datos de Operacin no incluyen datos de entrada o de salida, colas de espera de trabajo o cualquier otro dato de ndole transitoria.

0.1.1 Conceptos Errneos de Base de Datos Para entender esto, presentemos algunos conceptos errneos que se asumen en relacin a Base de Datos, Estos son: - ... la BD es un sinnimo de Sistema de Informacin Gerencial (SIG) o Sistema de Informacin para Ejecutivos (SIE). - ... una BD significa el desarrollo de sistemas complejos. - ... aplicar BD es realizar el desarrollo de aplicaciones con un Sistema de Gestin de Base de Datos (SGBD).

- ... todos los items (elementos) de datos de la organizacin estn contenidos en la BD, como una combinacin simple de los mismos. - ... hay nicamente una BD y cada elemento de los datos es almacenado una sola vez. - ... cada aplicacin debe contar con su propia BD. - ... convertir a BD es redefinir los archivos de un sistema desarrollado en forma tradicional a un Sistema de Gestin de Base de Datos (SGBD). - ... un Sistema de Gestin de Base de Datos (SGBD) es un Sistema de Gestin de Archivos (SGA).

0.1.2 Mas. Conceptos de Base de Datos


Veamos el concepto de BD a partir de una serie de definiciones u opiniones de diferentes personalidades: - "... BD es una coleccin de informacin que ha sido creada para satisfacer uno o ms objetivos precisos" de Michel Adiba & Claude Delobel en "Les Modeles Relationnels de Base de Donnes", 1976.

- "... BD es la coleccin de ocurrencias de mltiples tipos de registros, conteniendo relaciones entre los registros, datos agregados y elementos de datos" de James Martin en "Computer Data-Base Organization", 1977. - "... BD es la coleccin de datos operacionales almacenados que son usados por el sistema de aplicaciones de una determinada empresa" de C.J. Date, 1981. - "... BD es una coleccin no redundante de datos compatible entre diferentes aplicaciones" de Howe, 1983. - "... BD es una coleccin de informacin organizada que a travs de mecanismos, facilita el uso de la informacin" de Paul Jones &Robert Curtice, 1988. Una Sntesis de Cada Una de Estas Definiciones nos lleva a Consolidar el Concepto diciendo que: "Base de Datos es la representacin de la realidad (entiendase como organizacin) en forma de datos; los que estan entrelazados de la manera mas coherente posible, almacenados con una redundancia calculada y estructurados de tal manera que facilite su explotacin, y que se pueda satisfacer las necesidades de informacin de los diferentes usuarios".

CONCEPTOS:
Base de Datos: conjunto de datos relacionados, con una determinada estructura lgica, almacenados fsicamente en forma de ficheros informticos. Redundancia: un mismo dato almacenado varias veces. Problemas: 1) Gasto de capacidad de almacenamiento 2) Posibilidad de informacin inconsistente. Ejemplo: edad de una persona. Las bases de datos pretenden reducir en lo posible la existencia de redundancia en los datos almacenados. Integridad: son veraces y consistentes los datos? verifican las restricciones que pudieran haberse definido sobre ellos?

son correctos los datos despus de un fallo de hardware o software? Ejemplos: Apellido de una persona (comprobacin de la letra). Fecha de nacimiento de una persona (no todos los valores de das, meses y aos ..........son correctos). Edad de una persona (valor no negativo). "No puede existir en la base de datos ninguna persona cuyos ingresos medios en ..........los ltimos 5 aos no excedan una determinada cantidad", etc.

Independencia de los datos: inmunidad de las aplicaciones a los cambios de la estructura de almacenamiento de los datos y su estrategia de acceso. Caractersticas que son propias de las bases de datos :

Una base de datos no solo debe almacenar entidades y atributos (recordar los sistemas tradicionales de archivos), sino que tambin debe almacenar interrelaciones entre datos.

La redundancia de datos debe ser controlada, de forma que no existan duplicidades perjudiciales ni innecesarias. Las redundancias fsicas, convenientes muchas veces a fin de responder a objetivos de eficiencia, deben ser tratadas por el mismo sistema, de modo que no puedan producirse incoherencias. Esto significa que en las bases de datos NO

est permitida la redundancia lgica, pero si se admite cierta redundancia fsica por motivos de eficiencia.

Las bases de datos pretenden servir a toda la organizacin, es decir a mltiples usuarios y a diferentes aplicaciones (recordando los sistemas tradicionales de archivos).

La independencia, tanto lgica como fsica, de los tratamientos sobre los datos y estos mismos, ha tenido una enorme influencia en la arquitectura de los SGBD (recordar los sistemas tradicionales de archivos).

La definicin y descripcin del conjunto de datos contenido en la base debe ser nica e integrada con los mismos datos. (recordar los sistemas tradicionales de archivos). En las bases de datos, la descripcin, y en algunos casos, tambin una definicin y documentacin completas (metadatos) se almacenan junto con los datos, de modo que stos estn documentados, y cualquier cambio que se produzca en la documentacin debe quedar recogido en el sistema.

La actualizacin y recuperacin de las bases de datos debe realizarse mediante procesos bien determinados, incluidos en el SGBD; procedimientos que han de estar diseados de modo que se mantenga la integridad, seguridad y confidencialidad de la base.

Aunque usualmente se utilizan indistintamente los trminos "datos" e "informacin", en rigor existe una importancia distincin entre ellos: "Datos" se refiere a los valores registrados fsicamente en la base de datos, e "Informacin" alude al significado de esos valores segn el sentido que les otorgue un humano. El contenido de la base de datos puede estructurarse en tres niveles: 1. Campo: unidad de datos individual de menor tamao y con significado pleno. Los campos pueden agruparse para constituir otros ms complejos (ej. fecha de nacimiento). Pueden ser de naturaleza numrica o alfabtica, en general. Tienen un tamao asociado, medido fsicamente en bytes. 2. Registro: conjunto de campos intrnsecamente relacionados mediante una significacin comn a una entidad. Suele constituir la unidad bsica de acceso a la base de datos (contenido que se puede almacenar o recuperar en un solo acceso). 3. Fichero (FILE): conjunto de ocurrencias de un mismo tipo de registro.

El objetivo de disminuir la redundancia de un conjunto de datos determina dos caractersticas fundamentales que poseer cualquier sistema de Bases de Datos: Integrada: se entiende que una base de datos puede considerarse como una unificacin de varios archivos de datos independientes, donde se elimina parcial o totalmente cualquier redundancia entre los mismos. P.e. una base de datos especfica puede contener registros de TRABAJADOR, que incluyen el nombre, direccin, departamento, salario, etc. y, existir registros de CAPACITACION que representan inscripciones de empleados en cursos de capacitacin. Supongamos que para llevar a cabo el proceso de administracin de los cursos se necesita conocer el departamento de cada estudiante inscrito. Desde luego, no hay necesidad de incluir este dato (redundante) en los registro de CAPACITACION, siempre se puede obtener recurriendo a los registros de TRABAJADOR correspondiente.

Compartida: Se entiende que partes individuales de la Base


de Datos pueden compartirse entre varios usuarios distintos, en el sentido que cada uno de ellos puede tener acceso a la misma parte de la Base de Datos y utilizarla con propsitos diferentes. Tal comportamiento es en verdad consecuencia del hecho de que la Base de Datos es integrada.

Independencia Dato-Proceso
Una de las principales ventajas que provee una base de Datos es la independencia entre los datos y los tratamientos que se hacen de ellos. A diferencia de los sistemas orientados a procesos, en los cuales los datos eran sumamente dependientes de los programas al extremo que lenguajes como COBOL definan en su cdigo la estructura de los archivos, esto lo podemos ver actualmente en C y Pascal. Lo anterior es asimilable a los cambios que organizaciones, generalmente aquellos son de banco que cambia su imagen corporativa, que se eliminen funciones de atencin a pblico o de reduccin de personal, etc. sufren las Forma, un agreguen o produccin,

Los cambios de Fondo no son habituales en las organizaciones, ellos tiene que ver con cambios en la Misin de la Organizacin, en los Objetivos. Si un banco cambia de imagen corporativa logo, forma de atencin, etc., son cambios de Forma y tienen bsicamente que ver con variaciones en los procesos y eventualmente con algunos datos. Ahora si el banco quiere transformarse en una Sociedad Financiera, entonces la situacin es ms compleja y profunda, la misin organizacional cambia, el objetivo cambia y, por lo mismo, el cambio es radical afectando todos los elementos que componen la organizacin, todos aquellos

elementos donde se refleja el sentido organizacional, es decir afecta directamente a los datos y sus relaciones cambio que indirectamente afectara a los procesos que manejan estos datos. El concepto de Base de Datos rescata aquella dependencia que tienen los procesos de los datos y la radicaliza priorizando la independencia de estos ltimos, determinando mecanismos de definicin y de descripcin que no requieren de procesos.

1.3.-Ventajas de las bases de datos

Cuadro resumen de las ventajas de las bases de datos Referidas a Los datos

Ventajas Independencia de estos respecto de los

tratamientos y viceversa Mejor disponibilidad de los mismos Mayor eficiencia en codificacin y entrada Mayor coherencia Mayor valor informativo Mejor y ms normalizada documentacin de la informacin la recogida,

Los resultados

Los usuarios

Acceso ms rpido y sencillo de los usuarios finales Ms facilidades para compartir los datos por el conjunto de los usuarios Mayor flexibilidad para demandas cambiantes. atender a

1.4.-Desventajas de las bases de datos

Cuadro resumen de las desventajas de las bases de datos Relativas a Desventajas

La implantacin

Costosa en equipos (lgico y fsico) Ausencia de estndares Larga y difcil puesta en marcha Rentabilidad a mediano plazo Personal especializado Desfase entre teora y prctica

Los usuarios

Anlisis del cuadro anterior Instalacin costosa: Referido a equipos, nuevas instalaciones o ampliaciones, sistemas operativos, compiladores, SGBD comerciales, computadores ms poderosos, etc. Personal especializado: es clave la administracin de la base de datos, se requiere de conocimientos especficos. Desfase entre teora y prctica: muchos ejecutivos asumen que ciertas funcionalidades son ya un hecho, cuando en realidad son estudios tericos.

Existe tambin una resistencia al cambio, sobre todo que este involucra a toda la organizacin. En el xito de esto el papel mediador de los profesionales de informtica es fundamental, sobre todo en organizaciones

grandes donde una base de datos se puede ver como la centralizacin del poder en manos de unos pocos, generalmente los encargados de su administracin. Un sistema de bases de datos contempla los siguientes componentes:

La base de datos El Sistema de Gestin de Bases de Datos, Manejador de la Base de Datos(SGBD, DBMS) o motor, tal como Oracle, Sybase, etc. Programas de aplicacin Un conjunto de usuarios (finales, DBA(programas de acceso a la base de datos), programadores de aplicaciones, etc.) Mquinas Programas utilitarios( generadores de informes, de interfaces, herramientas de desarrollo, de administracin, etc.)

Clasificacin de las bases de datos


Desde el punto de vista de la consulta, una base de datos puede ser: Online, si su soporte fsico es la memoria de un ordenador de servicios y es consultada a distancia, mediante comunicacin telemtica, desde un equipo informtico terminal.

De esta forma, el usuario se conecta al ordenador que contiene la informacin y realiza las operaciones que desee, desconectndose al final. Slo utiliza el ordenador de la base de datos el tiempo que tarda en hacer la consulta, compartiendo tiempo y ordenador con otros mltiples usuarios que tambin pueden estar accediendo.

Autnoma, si se encuentra en un soporte independiente,


fcilmente manejable e intercambiable, y puede ser consultada en el ordenador del propio usuario. ste es el caso, por ejemplo, de las bases de datos que actualmente se estn ofreciendo en soporte CD-ROM. Es interesante observar que el usuario no tiene la "propiedad", en el sentido jurdico, de la base de datos.

Desde el punto de vista de la de datos puede ser:

Comercializacin, una base

Abierta si se ofrece comercial o gratuitamente al mercado o pblico en general que pueda estar interesado. Por ejemplo, una base de datos de legislacin, estadsticas varias, productos comerciales, etc.

Cerrada si la base de datos es desarrollada por una


persona fsica o jurdica, ya sea privada o pblica, para su uso interno.

Por ejemplo, una base de datos de clientes de un gran almacn, de contribuyentes, etc.

Desde el punto de vista de la una base de datos puede ser:

Localizacin Geogrfica,

Centralizada:

todos los datos estn fsicamente almacenados en el mismo sistema informtico y bajo un control unitario. Los datos pueden estar aplicaciones y usuarios. compartidos por mltiples

Distribuida: los datos estn almacenados en varios


sistemas informticos geogrficamente conectados mediante una red telemtica. repartidos y

Problema de la localizacin de los datos. La administracin de la base de datos puede realizarse en varios lugares distintos y por personas distintas. Toda esta problemtica debe ser transparente a los usuarios, el cual no necesita saber dnde estn realmentte almacenados los datos a los que accede.

Modelo de datos: estructura general de los datos y tcnicas


de acceso proporcionadas por un SGBD. Un SGBD usa siempre un nico modelo de datos. Hay tres modelos de datos posibles:

Relacional. Es el ms empleado. Todos los datos visibles al usuario estn organizados estrictamente como tablas de valores. Todas las operaciones sobre la base de datos operan sobre esas tablas. Cada fila de una tabla es una instancia de los datos. Cada columna de una tabla es un atributo (valor indivisible que tiene significado por s solo). Es el modelo de datos ms sencillo y cercano a la forma humana de organizar la informacin.

SGBD relacionales La implementacin en un SGBD del modelo relacional no es sencilla dada la potencia terica del modelo. Requiere un relativamente elevado espacio en disco y memoria de ordenador para su funcionamiento. Las caractersticas que debe tener un SGBD relacional son las siguientes: 1.Poder manejar la base de datos como un todo. 2.A nivel lgico, todos los datos se representan mediante valores contenidos en tablas. 3.Un dato debe ser accesible especificando un valor de clave primaria, un nombre de tabla y un nombre de atributo. 4.Puede haber valores nulos. 5.La descripcin del diseo de la base de datos (catalog) se considera tambin a nivel lgico como valores tabulares y

debe ser manipulable de la misma manera que la propia informacin de la base de datos. 6.Los datos deben ser fsicamente independientes de los programas de aplicacin que trabajen sobre la base de datos. 7.En lo posible, las aplicaciones deben ser independientes de los cambios realizados en las tablas. 8.La definicin de reglas y restricciones de integridad debe ser inherente al sistema y debe poder realizarse mediante el DDL. No se debe dejar a las aplicaciones el mantenimiento de la integridad. 9.Se debe lograr, en o posible, independencia respecto a la distribucin fsica de los datos. 10.Un SGBD relacional puede tener asociado un DML con procedimientos que permita tratamientos tupla a tupla por separado (registro a registro), pero debe impedirse que mediante un tratamiento de este tipo puedan soslayarse o ignorarse las restricciones de integridad.

Red. Tambin denominado modelo CODASYL. Fue el primero en aparecer comercialmente, a principios de los aos 70. Se caracteriza por almacenar direcciones de otros datos junto a la misma informacin. Es un modelo cercano al modo de almacenamiento interno del ordenador. Los datos se expresan como registros y las relaciones entre datos como sets.

Dos datos estn unidos por una direccin de memoria almacenada al lado de uno de ellos. Esa direccin es la del otro dato. Las direcciones son propias del ordenador, y no tienen sentido lgico para las personas. El tipo de registro es el equivalente a una tabla en el modelo relacional, y se implementa fsicamente mediante un fichero.

Jerrquico. Es muy similar al modelo de datos en red,


pero con la salvedad de que los registros se organizan con estructura de rbol.

En resumen, podemos deducir caractersticas de Base de Datos son: 1. Conjunto (coleccin) de datos.

que las principales

2. Datos interrelacionados y estructurados. 3. Redundancia controlada.

4. Independencia de datos y de procesos. 5. Soporta mltiples usuarios y mltiples aplicaciones. 6. La actualizacion y recuperacion de datos debe asegurar Integridad, Seguridad y Confidencialidad de los datos. 0.1.3 Conceptos Asociados a Base de Datos Cuando nos referimos a Base de Datos, estamos haciendo referencia a un conjunto de conceptos que manejamos cotidianamente y que estn fuertemente ligados al concepto mismo de Base de Datos. As tenemos que: Base de Datos involucra un conocimiento profundo y detallado de la realidad referida a la organizacin. La Base de Datos debe ser la representacin ms fidedigna de la organizacin. - Los datos que representan la organizacin debern ser utilizados de manera coordinada e integral que facilite la "difusin" de los mismos. El proceso de difusin de los datos obliga a definir y establecer objetivos que protejan la organizacin. En consecuencia, existen cuatro conceptos stos son: involucrados;

1) Coherencia, asociado a la validez de los datos. 2) Integridad, sobre el total de la informacin a representar. 3) Seguridad, como garanta de los datos en su representacin. 4) Confidencialidad, otorgando acceso de acuerdo a los niveles de la organizacin. 0.1.4 Porqu Base de Datos? Segn C.J. DATE en "An Introduction to Database Systems" 3th. Edition de 1982, dice : a) La redundancia puede ser reducida. No es posible asegurar que toda la redundancia sea eliminada; pero es posible que por diversas razones se requiera mantener mltiples copias de la misma data. b) La inconsistencia puede ser evitada. Este es un corolario de "a". Es claro que si cada factor es representado por una entrada simple (es decir, si la redundancia es eliminada) no pueden ocurrir inconsistencias. Alternativamente, si la redundancia no es eliminada pero es controlada, entonces el sistema podra garantizar que la base de datos no sea nunca inconsistente a la vista del

usuario, asegurando que cualquier cambio debe realizarse automticamente en todas las entradas posibles. Este proceso es conocido como " Actualizacin Simultnea" (propagating updates). c) La data puede ser compartida. d) Los estndares pueden ser reformados. Con un control central de la base de datos, el Administrador de Base de Datos (DBA = Data Base Administrator) puede asegurar que todos los estndares aplicables sern seguidos en la representacin de la data. La estandarizacin de los formatos de data almacenados es particularmente deseable como una ayuda para el intercambio de data (data interchange) o migracin entre sistemas. e) Las restricciones de seguridad pueden ser aplicables. Teniendo completa jurisdiccin sobre la data operativa, el DBA: - Puede asegurar que los accesos a la base de datos sern a travs de los propios canales (accesos/caminos que se definan).

- Puede definir chequeos de autorizacin para el acceso a la data. f) La integridad puede ser mantenida. El problema de integridad es el problema de asegurar que la data en la base de datos es Exacta y Precisa. La redundancia puede ser Eliminada, pero la base de datos puede contener data Incorrecta. g) Los Requerimientos Balanceados. en Conflicto Pueden ser

Conociendo la totalidad de los requerimientos de la empresa, el DBA puede estructurar el sistema de base de datos para proveer un servicio total que sea "el mejor para la empresa". 0.1.5Motivaciones de Base de Datos Las personas encuentran una serie de razones para decidir la necesidad de Transformar (convertir) un Sistema Orientado a Archivos en un sistema apoyado en una Base de Datos. Estas razones pueden ser: 1. Relaciones complejas en el modelo de informacin.

2. Alta volatilidad en los requerimientos de las aplicaciones y, como consecuencia, una excesiva carga de reprogramacin. 3. Necesidad de integracin de nuevas aplicaciones junto con las ya existentes. 4. Exceso de redundancias no controladas con resultados incoherentes. 5. Requerimientos de diferentes tipos de registros en los archivos. 6. Conveniencia de modos mltiples de acceso (secuencial, directo, indexado, etc.). 7. Exigencia de modos mltiples de tratamiento (batch u online) para los mismos conjuntos de datos. 8. Requerimientos en cuanto Confidencialidad y Rendimiento. a Seguridad,

Paralelamente, existen una serie de motivaciones que llevan a los responsables en el uso de la tecnologa de Base de Datos, estas pueden ser: - Motivaciones de orden tecnolgico La informtica provee en la actualidad un sin nmero de herramientas, entre las que podemos incluir a los Sistemas de Gestin de Base de Datos (SGBD = Data Base Management

System) llamados tambin hoy en da "Motor de Base de Datos". Estas herramientas vienen desarrollndose en una diversidad de formas (tcnicas) que estn asociadas directamente al aumento de capacidad del hardware (velocidad de procesamiento y almacenamiento) y la baja de precio de estos; y que tienen como objetivo la mejora de la Productividad y Calidad en el desarrollo y uso del software de aplicacin. - Motivaciones de Orden Organizacional El estudio de la organizacin de la empresa es de vital importancia en BD, en donde se debe determinar el funcionamiento de la misma y clasificar los diversos procesos en los tres niveles de la empresa (estratgico, tctico y operacional). Es decir, que la ejecucin de un Planeamiento Estratgico de Informacin pasa necesariamente por el uso de tcnicas y herramientas asociadas a BD. - Motivaciones de orden econmico Si bien es cierto, el esfuerzo inicial en BD puede ser costoso, este es, con el tiempo, de gran rentabilidad por las ventajas intrnsecas que redundarn en beneficio de la empresa; claro est que una mala aplicacin de la misma, puede traer consecuencias imprevisibles y altos costos. 0.1.6 Enfoque Tradicional versus Base de Datos

Podemos analizar rpidamente los enfoques por lo que ha evolucionado. 1. Enfoque Tradicional, usando archivos tradicionales y cuyas Caractersticas son: - Las aplicaciones son propietarias de sus archivos - Programas dependientes de la estructura y contenido de los archivos - Dificultad para compartir datos. y, sus principales problemas son: Alto nivel de redundancia Genera sistemas rgidos (inflexibles) Alto costo de mantenimiento Falta de control sobre los datos de Datos, cuyas principales

2. Enfoque de Base caractersticas son:

- Un archivo puede llegar a ser usado por diversas Aplicaciones - Control centralizado sobre los datos : - Reduce redundancia - Evita inconsistencias - Facilita el control de estndares

- Mayor seguridad - Reduce los efectos producidos por cambios - Reduce costos de mantenimiento de programas Esta basado en la independencia de datos, que es ventajosa por diversas razones: 1. Las modificaciones de las estructuras de almacenamiento fsico no involucran modificaciones en los programas de aplicacin. 2. La introduccin de nuevas tecnologas en las memorias auxiliares no afectan los programas de aplicacin. 3. Los datos son compartidos puesto que vistas diferentes pueden ser extradas de la misma estructura de almacenamiento, por lo tanto la duplicacin de datos se reduce. 4. La programacin de las aplicaciones es facilitada dado que ella es realizada sobre vistas determinadas y que ella no est involucrada por las estructuras de almacenamiento fsico ni por los problemas de acceso. 5. La ejecucin de operaciones ilcitas tales como la actualizacin o eliminacin de datos que no pertenecen a una vista es fcilmente prohibida. 0.1.7 Qu es un Ambiente de Base de Datos? Vemoslo grficamente, a travs de sus componentes mas importantes:

REPOSITORIO/ INTERFAZ DICCIONARIO/ DEL SISTEMA <> DIRECTORIO/ CON EL USUARIO ENCICLOPEDIA BASE DE DATOS SGBD SISTEMA DE ADMINISTRACION GESTION <> DE DE BASE DE BASE DE DATOS DATOS

El Diseo Conceptual en el Proceso de Desarrollo de Software. Consideremos el Ciclo de Vida Clsico de un producto Software. Dentro del desarrollo, las primeras etapas son las que cobran mayor importancia, ya que en ellas se debe centrar la mayor cantidad de esfuerzo, para asegurar una mayor calidad del producto.

Ciclo de Vida Clsico.

Dentro de estas etapas, se encuentra el Diseo. El Diseo como actividad se puede entender en distintos niveles de abstraccin, separndolo en:

Diseo Conceptual, Diseo Lgico y Diseo Fsico. El Diseo Conceptual es de un alto nivel de abstraccin, y puede confundirse su inicio con el trmino de la etapa de anlisis, ya que permite visualizar de mejor manera un problema.

Adems este diseo no est necesariamente asociado a priori con una plataforma de implementacin, sino que ms cercano a la realidad, al problema a solucionar.

El Diseo Lgico se acerca ms a la Implementacin del producto en una Plataforma Computacional, integrando consideraciones para la plataforma especfica en cuestin.

Finalmente el Diseo Fsico es una especificacin tal que representa Exactamente la Implementacin del Producto.

En el siguiente diagrama se puede apreciar el proceso de diseo de bases de datos.

Los requisitos de datos constituyen un componente de los requisitos de un producto y son una entrada al diseo conceptual.

Proceso de Diseo de Bases de Datos

Diseo Conceptual.

Recibe como entrada la especificacin de requerimientos y su resultado es el Esquema Conceptual de la Base de Datos, que es una Descripcin de Alto Nivel de la Estructura de la Base de Datos, independiente del software que se use para manipularla. Modelos Conceptuales: Individual. MER, Modelos OO, Formalismo

Diseo Lgico. Recibe como entrada el Esquema Conceptual y da como resultado un Esquema Lgico, que es una Descripcin de la Estructura de la Base de Datos que puede procesar el Software DBMS. Modelos Lgicos: Relacional, de Redes, Jerrquico.

Diseo Fsico.

Recibe como entrada el Esquema Lgico y da como Resultado un Esquema Fsico, que es una Descripcin de la Implementacin de una Base de Datos en la Memoria Secundaria, describe las estructuras de almacenamiento y los mtodos usados para tener un acceso efectivo a los datos. Modelos Fsicos: Modelo Unificador, Memoria de Elementos.

En la Figura 1.3.- se puede observar un esquema general del la arquitectura de una base de datos, en la cual se detallan los principales componentes de ella adems de las relaciones entre ellos y la base de datos lgica. Veamos una descripcin simple del aquellos elementos: Una Vista Externa es una visin particular de un usuario o un grupo de usuarios de la Base de Datos. El Esquema Externo representa una forma de definicin o formalizacin de esta vista externa. La Vista Conceptual pretende ser la representacin total y abstracta de los datos que componen la Base; la formalizacin de esta se logra mediante el Esquema Conceptual. Por ltimo, la Vista Interna es de un nivel muy bajo y corresponde al almacenamiento fsico de los datos de la Base, sobre un Esquema Interno que es la formalizacin de esto, e.d. tipos de registros almacenados, ndices, etc. Las correspondencias se pueden definir como una asociacin de distintas representaciones para un mismo dato. Un DSL es un sublenguaje de datos, es una combinacin de dos lenguajes: un lenguaje de definicin de datos (DDL) y un

lenguaje de manipulacin de Datos (DML). Este lenguaje representa un nexo entre el Sistema de Base de Datos y algn lenguaje anfitrin (p.e. COBOL, FORTRAN, C, etc.); e.d., el DSL provee herramientas a los lenguajes tradicionales para que se integren al Sistema de Base de Datos. Puede haber distintos tipos de DSL para un mismo sistema. DBMS es la sigla en ingls de Sistema de Administracin de Bases de Datos (SABD), que corresponde al Software que maneja todos los accesos a la Base de Datos, e.d. cada solicitud de acceso de un usuario al SABD es interpretada e inspeccionadas las correspondencias, generando, a continuacin, una respuesta coherente a las necesidades de la pregunta. La interfaz con el Usuario es el lmite de acceso que tiene un Usuario comn a la Base, todo lo que est bajo este lmite es transparente (desconocido) para l. Por ltimo, el Administrador de Bases de Datos (DBA) corresponde a la persona o grupo de personas encargada del control general del sistema. Sus responsabilidades o funciones incluyen:

Decidir el contenido de la Base de Datos: comprende la identificacin de entidades de inters para la organizacin y los datos a registrar de stas entidades. Luego se define el contenido de la Base de Datos generando un Modelo Conceptual. Decidir la estructura de almacenamiento y la estrategia de acceso: esto es decidir como deben representarse los datos

en forma interna y hacer la correspondencia entre estos y el modelo conceptual ya definido. Vincularse con los usuarios: comprende toda una labor de prestacin de servicios que busca garantizar la existencia, en la Base, de los datos necesarios y la formalizacin de los distintos esquemas externos. Definir los controles de autorizacin y procedimientos de validacin: involucra la definicin de restricciones de seguridad y proteccin para la conservacin de la integridad de los Datos. Definir una estrategia de respaldo y recuperacin: esto corresponde a un esquema de seguridad ms amplio que lo anterior y, bsicamente, su objetivo es la operacin exitosa del sistema. Controles de desempeo y responder a los cambios de requerimiento: la idea aqu es lograr un desempeo aceptable, segn expectativas, del Sistema mediante mecanismos de control.

1.6.- El sistema de Gestin de Bases de Datos (SGBD o DBMS) Un sistema de gestin de bases de datos consiste de una coleccin de datos interrelacionados y un conjunto de programas para acceder a esos datos. La coleccin de datos es la base de datos, y es la que contiene informacin por ejemplo acerca de una empresa determinada. El objetivo principal de un SGBD es proporcionar un entorno que sea a la vez conveniente y eficiente para ser utilizado al extraer y almacenar informacin en la base de datos.

Toda organizacin puede verse en tres niveles de gestin: operacional, tctico y estratgico. Muchas veces se produce una desconexin de los sistemas que caracterizan a estos niveles, pues constituyen sistemas aislados, sin relacin entre ellos. Esto produce un aumento del costo global de creacin y mantenimiento del sistema de informacin, produce redundancias e incoherencias. Esto impide una gestin racional de los datos. La base de datos es un depsito nico de datos para toda la organizacin, por lo que debe ser capaz de integrar los distintos sistemas y aplicaciones, atendiendo a las necesidades de los usuarios en los tres niveles. Otra definicin de Manejadores de Base de Datos: Programas (software de ordenador) que posibilitan la existencia y utilizacin de las bases de datos. En ingls: DBMS (Data Base Management System). Funciones tpicas:

Definicin de los datos, de su estructura lgica, sus relaciones y restricciones. Modificacin (dem). Consulta de la informacin almacenada. Insercin de nueva informacin. Modificacin de la informacin almacenada. Borrado de la informacin almacenada. Mantenimiento de la integridad. Asegurar la privacidad de los datos (accesos no autorizados, intrusos, curiosos, etc). Asegurar la seguridad de los datos (borrados accidentales, fallos diversos, catstrofes, etc) mediante tcnicas de respaldo y recuperacin.

Control de concurrencia o de los accesos simultneos a la base de datos. Muy importante si varios usuarios comparten la utilizacin de una misma base de datos.

El objetivo del SGBD es suministrar la interfaz entre el conjunto de los datos y dichos usuarios. El SGBD tambin debe proporcionar a los otros usuarios (analistas, programadores, administradores) las correspondientes herramientas que les permitan un adecuado desarrollo de sus funciones.

Definicin del SGBD El SGBD es un conjunto coordinado de programas,

procedimientos, lenguajes, etc. que suministra, tanto a usuarios no informticos como a los analistas, programadores o al administrador, los medios necesarios para describir, recuperar y manipular los datos almacenados en la base, manteniendo su integridad, confidencialidad y seguridad.

Funciones del SGBD De Descripcin o Definicin

Debe permitir al administrador de la base especificar los datos que la integran, su estructura y las relaciones que existen entre ellos, las reglas de integridad semntica, los controles a efectuar antes de autorizar el acceso a la base, etc., as como las caractersticas de tipo fsico y las vistas lgicas de los usuarios. Esta funcin la realiza el lenguaje de definicin de datos (LDD), propio del SGBD, y debe ser capaz de definir las estructuras de datos a los tres niveles (nivel externo, nivel lgico global o conceptual y nivel interno). A nivel interno se define:

Espacio reservado para la base(volmenes, cilindros y pistas) Longitud de los campos Modo de representacin de los datos (binario, decimal, alfanmerico, etc.) Caminos de acceso como punteros e ndices.

A nivel externo y conceptual, la funcin de descripcin proporciona los instrumentos para la definicin de entidades, su identificacin, atributos, interrelaciones entre ellas, autorizaciones de acceso, restricciones de integridad, etc. El SGBD, adems de describir, debe permitir la correspondencia o mapping entre estos niveles. De Manipulacin Permite a los usuarios de la base (todos) buscar, eliminar o modificar los datos de la base, de acuerdo a las especificaciones y normas de seguridad dadas por el administrador. Esto se realiza mediante el lenguaje de manipulacin de datos (LMD), mediante un conjunto de instrucciones (lenguaje husped) que son admitidas por un lenguaje de programacin

(lenguaje anfitrin), o bien, mediante un lenguaje autocontenido, que posee todas las instrucciones necesarias para llevar a cabo estas tareas. De Utilizacin Rene todas las interfaces que necesitan los diferentes tipos de usuarios para comunicarse con la base y proporciona un conjunto de procedimientos para el administrador. Algunas de estas funciones de servicio son:

cambiar capacidades de los archivos obtener estadsticas de utilizacin respaldos cargar y descarga de la base seguridad, etc.

Componentes de un SGBD 1. Lenguaje de definicin de datos (DDL: Data Definition Language). Sencillo lenguaje artificial para definir y describir los objetos de la base de datos, su estructura, relaciones y restricciones. En la prctica puede consistir en un subconjunto de instrucciones de otro lenguaje informtico. Aparte suele poseer dos subconjuntos de instrucciones:
o

Lenguaje de definicin del almacenamiento de los datos (DSDL: Data Storage Definition Language): permite especificar caractersticas fsicas de la base de datos

(volmenes y archivos donde van a ser almacenados los datos, etc). Lenguaje de control de datos (DCL: Data Control Language): encargado del control y seguridad de los datos (privilegios y modos de acceso, etc).

2. Lenguaje de manipulacin de datos (DML: Data Manipulation Language). Lenguaje artificial de cierta complejidad que permite el manejo y procesamiento del contenido de la base de datos. En la prctica puede consistir en un subconjunto de instrucciones de otro lenguaje informtico. Las aplicaciones que trabajan sobre la base de datos se programan en un lenguaje de programacin (C, Cobol, ...) insertando en el cdigo fuente sentencias del DML. Al utilizar un DML se deben especificar los datos que sern afectados por las sentencias del lenguaje. Un DML puede tener o no procedimientos, segn sea necesario especificar ademns cnmo deben obtenerse esos datos. Los DML con procedimientos tienen sentencias de control de flujo como bucles o condicionales. Los DML sin procedimientos son conocidos tambin como declarativos.

3. Diccionario de datos. Conjunto de archivos que almacenan convenientemente las definiciones realizadas utilizando el DML. 4. Gestor: componente software (programa) encargado de la interface entre las peticiones de los usuarios de la base de datos y los propios datos en s. Interaccin con el sistema operativo. El uso real un SGBD puede realizarse de forma nica o combinada utilizando directamente el DDL y el DML o bien a travs de una interfaz grfica o basada en mens. Aunque usualmente se utilizan indistintamente los trminos "datos" e "informacin", en rigor existe una importancia distincin entre ellos: "datos" se refiere a los valores registrados fsicamente en la base de datos, e "informacin" alude al significado de esos valores segn el sentido que les otorgue un humano. El contenido de la base de datos puede estructurarse en tres niveles: 4. Campo: unidad de datos individual de menor tamao y con significado pleno. Los campos pueden agruparse para constituir otros ms complejos (ej. fecha de nacimiento). Pueden ser de naturaleza numrica o alfabtica, en general. Tienen un tamao asociado, medido fsicamente en bytes. 5. Registro: conjunto de campos intrnsecamente relacionados mediante una significacin comn a una entidad. Suele constituir la unidad bsica de acceso a la base de datos (contenido que se puede almacenar o recuperar en un solo acceso). 6. Fichero: conjunto de ocurrencias de un mismo tipo de registro.

Lenguajes de los SGBD (continuacin...) Las distintas funciones que cumple un SGBD, hace necesario contar con diferentes lenguajes y procedimientos que permitan la comunicacin con la base de datos. Por tipo de funcin, tendremos lenguajes de definicin y lenguajes de manipulacin. Por tipo de usuarios tendremos lenguajes para informticos y lenguajes para no informticos o usuarios finales. Estos ltimos, pueden tener aplicaciones formalizables tal como la gestin de personal o no formalizables como cualquier proceso de toma de decisiones. Cuando se trata de procesos formalizables, usualmente los programadores de aplicaciones escriben los procedimientos en programas. Si el proceso no es formalizable, escribir un programa no es aconsejable. Es conveniente que el mismo usuario final resuelva directamente sus requerimientos mediante los instrumentos que el SGBD pone a su alcance. Por otro lado, los usuarios informticos, como el DBA, analistas y programadores requerirn medios poderosos por los cuales podrn definir, extraer y manipular los datos en algn lenguaje de programacin. A este lenguaje se le llama lenguaje anfitrin (por ejemplo, C). Casi la totalidad de los SGBD disponen de lenguajes de 4ta generacin, que se caracterizan por ser poco procedimentales y el acceso a la base de datos se realiza mediante sentencias

embebidas en el lenguaje de 4ta generacin y escritas en SQL (SGBD relacionales). Los lenguajes que por si mismos pueden actuar con la base de datos, sin necesidad de apoyarse en otro lenguaje se llaman autocontenidos. Lenguajes de manipulacin de datos Para cumplir los objetivos asignados a la funcin de manipulacin, se ha de contar con lenguajes que den a los usuarios la posibilidad de referirse a determinados conjuntos de datos que cumplan ciertas condiciones (criterio de seleccin). El SQL como lenguaje de manipulacin de datos tiene la propiedad dual, es decir, puede actuar como husped o autocontenido. Los LMD pueden ser procedimentales o no procedimentales, es decir, si necesitamos especificar con detalle el acceso a la base tendremos un lenguaje procedimental. Los lenguajes orientados al usuario final deben ser lo menos procedurales posible. Aqu basta con decir qu se quiere, sin explicar cmo obtenerlo. Por otro lado, los LMD pueden ser navegacionales, que recuperan o actualizan datos registro a registro. Otros lenguajes actan sobre un conjunto de registros, de forma que una nica sentencia puede dar lugar a la recuperacin o actualizacin del conjunto de registros que cumpla el criterio de seleccin especificado, tal como el SQL. Modelo de Datos.

Dentro de la problemtica del diseo de bases de datos, los modelos de datos cumplen un importante rol, pues son las herramientas que nos permiten generar los esquemas de bases de datos, los que regirn su estructura. Un modelo de datos define las reglas por las cuales los datos son estructurados. Esta estructuracin, sin embargo, no da una interpretacin completa acerca del significado de los datos y de la forma en que sern usados. Las operaciones permitidas sobre datos deben ser definidas. Muchos modelos conceptuales, como el MER, no incluan operaciones en sus definiciones preliminares, por lo que fueron propuestas en estudios posteriores. Se define el modelo de datos M consistente de dos partes: G: un conjunto de reglas generadoras de esquemas. O: un conjunto de operaciones.

El conjunto de reglas G expresa las propiedades estticas de un modelo de datos y corresponden a lo que se denomina generalmente Data Definition Language (DDL). Este define las estructuras permitidas para el modelo de datos M, es decir, generan esquemas. El conjunto G se puede dividir en dos: Gs: reglas generadoras de las estructuras permitidas. Gc: reglas generadoras de las restricciones del modelo.

As, Gs genera las categoras y estructuras para un modelo, y Gc las restricciones. Utilizando esta ltima notacin, un esquema S consiste de dos partes: una estructura Ss y restricciones Sc, donde Sc es una lista explcita de restricciones que deben ser satisfechas en todo momento. Un modelo de datos tambin puede tener restricciones que son inherentes a l, las que generalmente se incorporan en Ss (la estructura). Las reglas de generacin G son generadoras de un conjunto de esquemas S, en el que cada uno de ellos define estructuras y restricciones particulares para los datos. Hay muchas bases de datos D en trminos de la ocurrencia del esquema S, pero todos tienen la misma estructura genrica y obedecen a las mismas restricciones definidas en S. En resumen:

Figura 2.3.- Modelo de Datos

Las propiedades dinmicas de un modelo de datos son expresadas por un conjunto de operaciones O, las que generalmente son llamadas Data Manipulation Language (DML). Estas propiedades definen las acciones permitidas para una base de datos, tal que transforme la ocurrencia Di en la ocurrencia Dj. SQL SQL (Structured Query Language) es un potente lenguaje informtico que cumple las funciones de DDL y DML en los SGBD relacionales. Su origen est en el lenguaje SEQUEL (Structured English QUEry Language) desarrollado en IBM en los aos 1974-75. Oracle fue el primer fabricante de sistemas de bases de datos en comercializar una implementacin de SQL en

1979. IBM lanz el producto SQL/DS en 1981 y dos aos ms tarde el conocido DB2. Se trata de un lenguaje fuertemente basado en el ingls, que puede ser utilizado en modo conversacional mediante un intrprete o bien formando parte de un programa desarrollado en un lenguaje de programacin anfitrin como C, Cobol, etc. (SQL embebido). La caracterstica relacional ms importante de SQL es que permite acceder a los datos sin necesidad de especificar cmo se ha de realizar dicho acceso permitiendo as la "navegacin automtica" por los datos. El lenguaje ha sido normalizado por varios organismos, si bien los muchos aspectos que tradicionalmente han quedado indefinidos en tales normalizaciones y qu e por lo tanto en la prctica quedan como responsabilidad de los fabricantes han ocasionado variaciones de diversa importancia entre las diferentes implementaciones comerciales. La versin actual ms comn del lenguaje es la denominado SQL2 que respecto al estndar anterior presenta las ventajas de un mayor incremento de la capacidad expresiva, nuevos operadores aadidos y mejor tratamiento de errores, entre otras. SQL3 incorpora al lenguaje caractersticas propias del paradigma de orientacin a objeto.

Componentes de los Sistemas de Bases de Datos


Un sistema de bases de datos contempla los siguientes componentes:

La base de datos

El Sistema de Gestin de Bases de Datos(SGBD, DBMS) o motor, tal como Oracle, Sybase, etc.

Programas de aplicacin

Un conjunto de usuarios (finales, DBA, programadores de aplicaciones, etc.)

Mquinas

Programas utilitarios( generadores de informes, de interfaces, herramientas de desarrollo, de administracin, etc.)

En la Figura 1.3.- se puede observar un esquema general del la arquitectura de una base de datos, en la cual se detallan los principales componentes de ella adems de las relaciones entre ellos y la base de datos lgica.

Veamos una descripcin simple del aquellos elementos: Una Vista Externa es una visin particular de un usuario o un grupo de usuarios de la Base de Datos. El Esquema Externo representa una forma de definicin o formalizacin de esta vista externa. La Vista Conceptual pretende ser la representacin total y abstracta de los datos que componen la Base. La formalizacin de esta se logra mediante El Esquema Conceptual. Por ltimo, la Vista Interna es de un nivel muy bajo y corresponde al almacenamiento fsico de los datos de la Base, sobre un Esquema Interno que es la formalizacin de esto, e.d. tipos de registros almacenados, ndices, etc. Las correspondencias se pueden definir como una asociacin de distintas representaciones para un mismo dato. Un DSL es un sublenguaje de datos, es una combinacin de dos lenguajes: un lenguaje de definicin de datos (DDL) y un lenguaje de manipulacin de Datos (DML). Este lenguaje representa un nexo entre el Sistema de Base de Datos y algn lenguaje anfitrin (p.e. COBOL, FORTRAN, C, etc.); e.d., el DSL provee herramientas a los lenguajes

tradicionales para que se integren al Sistema de Base de Datos. Puede haber distintos tipos de DSL para un mismo sistema. DBMS es la sigla en ingls de Sistema de Administracin de Bases de Datos, que corresponde al Software que maneja todos los accesos a la Base de Datos, e.d. cada solicitud de acceso de un usuario al SABD es interpretada e inspeccionadas las correspondencias, generando, a continuacin, una respuesta coherente a las necesidades de la pregunta. La interfaz con el Usuario es el lmite de acceso que tiene un Usuario comn a la Base, todo lo que est bajo este lmite es transparente (desconocido) para l. Por ltimo, el Administrador de Bases de Datos (DBA) corresponde a la persona o grupo de personas encargada del control general del sistema. Sus responsabilidades o funciones incluyen:

Decidir el contenido de la Base de Datos Decidir la estructura de almacenamiento y la estrategia de acceso Vincularse con los usuarios Definir los controles de autorizacin y procedimientos de validacin Definir una estrategia de respaldo y recuperacin Controles de desempeo y responder a los cambios de requerimiento

Lenguajes de los SGBD Las distintas funciones que cumple un SGBD, hace necesario contar con diferentes lenguajes y procedimientos que permitan la comunicacin con la base de datos. Por tipo de funcin, tendremos lenguajes de definicin y lenguajes de manipulacin. Por tipo de usuarios tendremos lenguajes para informticos y lenguajes para no informticos o usuarios finales. Estos ltimos, pueden tener aplicaciones formalizables tal como la gestin de personal o no formalizables como cualquier proceso de toma de decisiones. Cuando se trata de procesos formalizables, usualmente los programadores de aplicaciones escriben los procedimientos en programas. Si el proceso no es formalizable, escribir un programa no es aconsejable. Es conveniente que el mismo usuario final resuelva directamente sus requerimientos mediante los instrumentos que el SGBD pone a su alcance. Por otro lado, los usuarios informticos, como el DBA, analistas y programadores requerirn medios poderosos por los cuales podrn definir, extraer y manipular los datos en algn lenguaje

de programacin. A este lenguaje se le llama lenguaje anfitrin (por ejemplo, C). Casi la totalidad de los SGBD disponen de lenguajes de 4ta generacin, que se caracterizan por ser poco procedimentales y el acceso a la base de datos se realiza mediante sentencias embebidas en el lenguaje de 4ta generacin y escritas en SQL (SGBD relacionales). Los lenguajes que por si mismos pueden actuar con la base de datos, sin necesidad de apoyarse en otro lenguaje se llaman autocontenidos. Lenguajes de manipulacin de datos (DML o LMD)

Para cumplir los objetivos asignados a la funcin de manipulacin, se ha de contar con lenguajes que den a los usuarios la posibilidad de referirse a determinados conjuntos de datos que cumplan ciertas condiciones (criterio de seleccin). El SQL como lenguaje de manipulacin de datos tiene la propiedad dual, es decir, puede actuar como husped o autocontenido. Los LMD o DML pueden ser procedimentales o no procedimentales, es decir, si necesitamos especificar con detalle el acceso a la base tendremos un lenguaje procedimental. Los lenguajes orientados al usuario final deben ser lo menos procedurales posible. Aqu basta con decir qu se quiere, sin explicar cmo obtenerlo.

Por otro lado, los LMD pueden ser navegacionales, que recuperan o actualizan datos registro a registro. Otros lenguajes actan sobre un conjunto de registros, de forma que una nica sentencia puede dar lugar a la recuperacin o actualizacin del conjunto de registros que cumpla el criterio de seleccin especificado, tal como el SQL. Uno de los principales objetivos de las bases de datos es conseguir la independencia entre las estructuras lgica y fsica de los datos, que tiene como consecuencia la independencia entre datos y aplicaciones. As, los cambios en la estructura de los datos tengan una repercusin mnima en los programas de aplicacin y viceversa. Este concepto de independencia implica la separacin entre el almacenamiento y la organizacin lgica de los datos, con lo que se consigue:

Los datos se presentarn de formas distintas, segn las necesidades de los usuarios.

El almacenamiento de los datos, su estructura lgica y los programas de aplicacin sern independientes unos de otros.

Este objetivo, ha tenido gran influencia en la arquitectura de los SGBD.

En los SI existen 2 estructuras: La lgica (vista del usuario) y La fsica (forma en que se encuentran los datos en el almacenamiento). En las bases de datos aparece un nuevo nivel de abstraccin llamado nivel conceptual, estructura lgica global, esquema. Esta estructura intermedia es una representacin global de los datos independiente de equipos y los usuarios (visin de la empresa).

Los otros dos niveles corresponden al nivel de mquina o interno y al nivel de usuario o externo. La estructura lgica de usuario o esquema externo(nivel usuario) es la visin que tiene de la base de datos cada usuario en particular. La estructura lgica global o esquema responde al enfoque del conjunto de la empresa (visin del administrador).

La estructura fsica o esquema interno es la forma como se organizan los datos en el medio de almacenamiento fsico. Esquema Externo / Nivel Externo En el debern encontrarse reflejados solo aquellos datos e interrelaciones que necesite un usuario en particular. Tambin deben especificarse las restricciones de uso, como por ejemplo, derecho a borrar o insertar determinados datos. Habr tantos esquemas externos como exijan las diferentes aplicaciones y un mismo esquema externo puede ser utilizado por varias aplicaciones. Este nivel se ocupa de las vistas individuales de los usuarios. Los usuarios pueden ser programadores de aplicaciones o usuarios finales. Estos usuarios disponen de un lenguaje, que para los usuarios finales ser un lenguaje de consulta o algn lenguaje de aplicacin especial, manejado por ejemplo por mens o forms. Los usuarios programadores de aplicaciones tendrn lenguajes de programacin convencionales o algn lenguaje propio de 4ta generacin. El SQL(Structured Query Language) es usado en casi todos los sistemas relacionales actuales. En casi todos los sistemas el SQL puede utilizarse como lenguaje interactivo o de consulta o bien embebido en otros lenguajes, tal como COBOL por ejemplo. Recordar lo visto anteriormente en los lenguajes de un SGBD. Esquema o Estructura Lgico Global / Nivel conceptual

Tiene por objetivo describir en trminos abstractos pero con absoluta fidelidad una cierta realidad de una organizacin y de su proceso de gestin. Por ser la visin general de los datos, deber incluir la descripcin de todos los datos e interrelaciones entre stos, restricciones de integridad y confidencialidad. Este nivel se define mediante un esquema conceptual. Para escribirlo se utiliza un DDL conceptual. Es importante sealar que para que exista independencia de los datos, las definiciones en DDL conceptual no debern implicar consideraciones de estructura de almacenamiento, deben ser definiciones de contenidos de informacin. Por lo tanto, en el esquema conceptual no debe haber representaciones de campos almacenados, secuencia de registros, indexacin, etc. El paso del mundo real al esquema conceptual corresponde a un proceso de modelizacin. En este punto es donde se utilizan los modelos conceptuales. Esquema interno/ Nivel Interno Este esquema es dependiente del DBMS. Sin embargo, existen elementos comunes que son:

Estrategia de almacenamiento: almacenamiento de datos

Asignar

espacios

de

Camino de acceso: Se incluye la especificacin de claves primarias, secundarias, ndices, claves de ordenacin. Tcnicas de compresin de datos Tcnicas de criptografa Correspondencia conceptual/interna: especifica como se representan los registros y campos conceptuales en el nivel interno. Si se altera la definicin de la estructura de almacenamiento, la correspondencia conceptual/interna deber modificarse tambin. Tcnicas de Tuning y optimizacin Dispositivos de memoria: tamao de la pgina, nro. de pginas asignadas a cada rea de almacenamiento, tamao de los buffers de E/S. Organizaciones fsicas: para mejorar la recuperacin y los tiempos de acceso, el sistema debe dar facilidades al DBA para definir hashing, agrupamientos, etc. Control de acceso: reglas para proteger la confidencialidad y seguridad de la base de datos.

Tcnica de Organizacin de archivos Lenguajes de Alto Nivel

Ventajas - Permite al programador utilizar proposiciones independientes al dispositivo empleado para la creacin y d procesamiento de los archivos. - La tcnica de direccionamiento, creacin y mantenimiento de la trayectoria de los datos son transparentes al usuario. - Aumatta la productividad del programador ya que represeanta un ~9 ,eficaz de marta geaera.cia pa la realibcin-de accesos'; : mediante C18v.e3.mltipl0f. - Se pueden desarrollar aplicaciones sus necesidad de escribir largos programas en lenguajes de alto nivel. - Suministra al programador sin experiencia herramientas para llevar a cabo consultas con lenguajes especiales y sencillos. Por ejemplo: El RPG - Report Pro~ Ganerator.

Desventajas - Representa altos costos del "software" porque se requieren muchas horashombre para poder desarrollar un sistema convencional de informacin. - Representa poca eficiencia de consultas, en especial si se intentan usar tcnicas de claves mltiples, - Depatde totalmente de los mtodos de acceso en los que se basa el sistema operativo para la creacin y el procesamiento de sus archivos de datos. - El manejo de matrices y operaciones aritmticas complejas no pueden manejarse fcilmente con el FMS. - El manejo de los datos queda restringido a los mtodos bsicos de acceso, lo que dificulta las consultas de claves mltiples en archivos mltiples. - No puede efectuar recuperaciones complejas de informacin. Dowentajas

'

FMS

Tcnica de Organizacin de archivos DBMS

Ventajas - Se pueden recuperar sitnultneanaente distintos archivos usasrdo claves de ba~ mltiple. - Se puede tener acceso a datos de diferatnes m~os con una sla consulta. - La recuperacin de datos se realiza san necesidad de demasiada programacin.

BIBLIOGRAFIA

Date, C.J. "An Introduction to Database System", vol 1 5th edition, Addison-Wesley Publishing Co (1986) Codd, E.F. "The Relational Model for Databse Management", Addison-Wesley Co. 1990 Batini, Ceri, Navathe,"Diseo Conceptual de bases de datos", Addison-Wesley, 1994 Adoracion de Miguel y Piattini, "Concepcion y Diseo de Bases de Datos". Addison-Wesley, 1993 Korth and Silberschatz, " Fundamentos de Bases de Datos". 2 da.edicin.Mac Graw Hill. Irene Luque Ruiz y Miguel Angel Gmez-Nieto. Diseo y uso de Bases de Datos Relacionales. Editorial RA-MA, 1997. Abraham Silberschatz, Henry F. Korth y S. Sudarshan. Fundamentos de bases de datos (3a edicin). McGrawHill, 1998. Adoracin de Miguel y Mario Piattini. Fundamentos y modelos de bases de datos. Editorial RA-MA, 1997. George Koch. ORACLE 7. Manual de referencia McGrawHill, 1994.

Potrebbero piacerti anche