Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Contenidos:
1
1.1 Concepto de sistema de base de datos y sistema manejador de base de datos
(SMBD).
System R
IBM's System R fue desarrollado durante al última etapa de los años 70 para demostrar
que el modelo relacional puede trabajar. Se implementó las estructuras de datos del
modelo relacional y se realizaron operaciones sobre estas estructuras. Varias productos
comerciales de Sistemas de Gestión de Base de Datos Relacional (RDBMS) surgieron de
este proyecto.
2
evitar posibles resultados anómalos.
Aislamiento de datos.
Debido a que los datos están dispersos en varios archivos, y los archivos pueden
estar en diferentes formatos, es difícil escribir nuevos programas de aplicación para
recuperar los datos apropiados.
Problemas de integridad.
Los valores de los datos almacenados en la base de datos deben satisfacer ciertos
tipos de restricciones de consistencia. Los desarrolladores hacen cumplir esas
restricciones en el sistema añadiendo el código apropiado en los diversos
programas. Sin embargo, cuando se añaden nuevas restricciones, es difícil cambiar
los programas para hacer que se cumplan. El problema es complicado cuando las
restricciones implican diferentes elementos de datos de diferentes archivos.
Problemas de atomicidad.
Un sistema de un computador, como cualquier otro dispositivo mecánico o
eléctrico, esta sujeto a fallo. En muchas aplicaciones es crucial asegurar que, una
3
vez que un fallo ha ocurrido y se ha detectado, los datos se restauran al estado de
consistencia que existía antes del fallo.
Problemas de seguridad.
No todos los usuarios de un sistema de bases de datos deberían poder acceder a
todos los datos. Como los programas de aplicación se añaden al sistema de una
forma ad hoc, es difícil garantizar tales restricciones de seguridad.
Abstracción de datos
Para que el sistema sea útil debe recuperar los datos eficientemente. Esta preocupación
ha conducido al diseño de de estructuras de datos complejas para la representación de
los datos en la base de datos. Como muchos usuarios de sistemas de base de datos no
están familiarizados con computadores, los desarrolladores esconden la complejidad a los
usuarios a través de varios niveles de abstracción para simplificar la interacción de los
usuarios con el sistema:
Nivel físico:
El nivel mas bajo de abstracción describe cómo se almacenan realmente los datos.
En el nivel físico se describen en detalle las estructuras de datos complejas de bajo
nivel.
Nivel lógico:
El siguiente nivel más alto de abstracción describe qué datos se almacenan en la
base de datos y qué relaciones existen entre esos datos. La base de datos
completa se describe así en términos de un número pequeño de estructuras
relativamente simples. Aunque la implementación de estructuras de nivel lógico
puede involucrar estructuras complejas del nivel físico, los usuarios del nivel lógico
no necesitan preocuparse de esta complejidad. Los administradores de base de
datos, que deben decidir la información que se mantiene en la base de datos, usan
el nivel lógico de abstracción.
Nivel de vistas:
El nivel mas alto de abstracción describe solo parte de la base de datos completa.
4
A pesar del uso de estructuras mas simples en el nivel lógico, queda algo de
complejidad, debido a la variedad de información almacenada en una gran base de
datos. Muchos usuarios del sistema de base de datos no necesitan toda esa
información. En su lugar, tales usuarios necesitan acceder solo a una parte de la
base de datos. Para que su interacción con el sistema sea mas sencilla, se define
la abstracción a nivel de vistas. El sistema puede proporcionar muchas vistas para
la misma base de datos. Además de esconder detalles del nivel lógico de la base
de datos, las vistas también proporcionan un mecanismo de seguridad para evitar
que los usuarios accedan a ciertas partes de la base de datos.
Cliente - Servidor
En una arquitectura monolítica no hay distribución; los tres niveles tienen lugar en el
mismo equipo.
5
1.2 Componentes de un DBMS.
Base de Datos Relacional: una base de datos relacional almacena información en tablas
así que este puede ser accedido en un número de maneras diferentes.
Base de Datos de Archivos Planos: una base datos de archivos planos colecciona data
en archivos conteniendo líneas de textos.
Base de Datos Orientadas a Objetos: una base de datos orientada a objeto almacena
tipos de datos definidos en objetos de clases y subclases.
SQL
Los datos en una base de datos esta almacenada en un repositorio central. El sistema de
gestión de base de datos soporta un lenguaje de consulta que habilita a los usuarios a
manipular la data. El lenguaje de consulta para base de datos relacionales es llamado
Lenguaje de Consulta Estructurado (SQL). SQL esta dividido en subconjuntos de
lenguaje.
Las Sentencias del lenguaje de definición de datos (DDL) que posee SQL operan en base
a tablas. Las Principales sentencias DDL son las siguientes:
CREATE TABLE
DROP TABLE
ALTER TABLE
CREATE INDEX
DROP INDEX
6
concurrentemente el acceso a los datos.
Un administrador de una base de datos gestiona todas las actividades relacionadas con el
mantenimiento y control de un ambiente de base de datos. ellos a menudo son
responsables del control de los derechos de acceso y permisos para ciertos tipos de datos
en la base de datos.
Adherencia a estándares:
Con un DBMS, un método de acceso a datos estándar puede ser asegurado. El
uso del Lenguaje de Consulta Estructurado (SQL) es un ejemplo de un estándar
asegurado.
7
Incremento de la productividad:
Un DBMS provee rutinas de manejo de datos de bajo nivel que usualmente se
necesitan para ser escritos dentro de un programa. Esto le permite a los
programadores concentrarse sobre la funcionalidad necesitada por los usuarios. En
un sistema de archivos planos, por el contrario, los programadores tendrán en
concentrarse en proveer funcionalidad de bajo nivel dentro de los programas que
accedan a los datos.
Manejo de la concurrencia:
Con muchos DBMS, mecanismos existen que permiten el acceso concurrente a los
datos.
Desventajas
Tamaño y Complejidad:
El diseñador de la base de datos y el administrador deben tener un sólido
conocimiento de la funcionalidad que un DBMS ofrece para realizar su completo
potencial. Una base de datos que modela las reglas de negocios de una
organización puede ser compleja, tanto para crearla como para mantenerla. Esto
puede resultar también en grandes cantidades de espacio en disco siendo utilizado.
Costos:
Un DBMS puede ser muy costoso debido a que se tiene que comprar software
adicional. Adicionalmente convertir la vieja data al nuevo formato del DBMS debe
ser considerado, junto con el tiempo y el costo del entrenamiento de los empleados
que usan el nuevo sistema.
Los Sistemas Gestores de Bases de Datos son un tipo de software muy específico,
dedicado a servir de interfaz entre la Base de datos y el usuario, las aplicaciones que la
utilizan. Se compone de un lenguaje de definición de datos, de un lenguaje de
manipulación de datos y de un lenguaje de consulta. En los textos que tratan este tema, o
temas relacionados, se mencionan los términos SGBD y DBMS, siendo ambos
equivalentes, y acrónimos, respectivamente, de Sistema Gestor de Bases de Datos y
DataBase Management System, su expresión inglesa.
8
Tareas y funciones a realizar por un Administrador de Bases de Datos.
Antes de que una base de datos sea creada, información acerca de la base de datos es
recolectada y los planes y objetivos de la organización son documentadas. Esto ayuda a
determinar las necesidades que la base de datos deberá reunir y el alcance de la
aplicación.
Una actividad común durante esta fase de planificación de la base de datos es la creación
de un modelo de datos corporativo. Un modelo de dato es utilizado para mostrar datos
importantes, relaciones de los datos, y como esos datos están asociados con una unidad
funcional clave a través de la organización. Un modelo de datos puede asemejarse a un
diagrama Entidad Relación (ER) simplificado.
● Misión
Declara el propósito específico de la base de datos en términos amplios sin la
definición de las tareas específicas pertinentes a la implementación de la base de
datos.
● Requerimientos de datos
● Objetivos
Requerido para el sistema de base de datos desde la perspectiva de los usuarios.
● Restricciones
Posibles restricciones, incluyendo requerimientos de velocidad y plataformas de
hardware.
9
● Misceláneas
Incluye seguridad, confiabilidad, mantenibilidad, portabilidad, y extensibilidad, una
agenda preliminar y presupuesto.
● Glosario de términos
Típicamente, cada termino introducido en un glosario tiene una breve Descripción,
posibles sinónimos, y una referencia para otros términos contenidos en el glosario
con el cual aquí esta un enlace lógico.
Después que las ambigüedades han sido identificadas, ellas son removidas por
reemplazar los términos incorrectos con los más apropiados. si una decisión es difícil de
alcanzar correspondiente a un termino, el usuario quien provee la información debe ser
entrevistado nuevamente y aclararlo.
El sistema de gestión de base de datos relacional fue diseñado por el Dr. Edgar Codd y
desde entonces ha sido conocido como las reglas de Codd.
Regla 1:
La regla de información, esta relacionada con las tablas.
Regla 2:
La segunda regla es la regla de acceso garantizado. esta establece que todos los datos
en una base de datos relacional esta garantizado para ser lógicamente accesible
recurriendo a una combinación de nombre de la tabla, valor de clave primaria, y nombre
de columna. la regla de acceso garantizado establece que usted deberá ser capaz de
localizar cada pieza de información, o entrada de dato, en una tabla de datos con solo el
nombre de la tabla, el nombre del campo, y el valor de la clave primaria.
La clave primaria es un valor asociado con una entrada de dato. Cuando este valor es
especificado, la asociada entrada de dato puede ser localizada. La clave primaria es una
parte esencial de la tabla. Cada tabla en una base de datos relacional debe tener una
clave primaria, y cada valor para la clave primaria debe tener un único identificador.
Regla 3:
La tercera regla cubre el tratamiento sistemático de los valores nulos. Esta regla establece
que los valores nulos son soportados completamente por los sistemas de gestión de base
de datos relacional (RDBMSs) para representar información faltante y información
10
inaplicable, independientemente del tipo de dato.
Los valores nulos son soportados en un RDBMS y son importantes debido a que ellos
representan la ausencia de información.
Las reglas de Codd establecen que los valores nulos no son permitidos en cada columna
clave primaria.
El sistema de gestión de base de datos relacional es definido por las reglas de Codd. Las
primeras tres reglas son relacionadas a tablas.
Regla 4:
Establece que la descripción de la base de datos está representada al nivel lógico en la
misma forma como la data ordinaria así los usuarios autorizados pueden aplicar el mismo
lenguaje relacional para sus interrogaciones así como las aplicadas a los datos regulares.
Codd estable que los usuarios deben tener la posibilidad de tratar con los datos en el
diccionario de datos tan fácilmente como losa datos en la base de datos. esto significa
que un usuario podrá encontrar información en el diccionario de datos acerca de como
esta estructurada la base de datos. Esta información debe estar almacenada en
relaciones.
Regla 10:
Independencia de la integridad.
Esta establece que las restricciones de integridad específicas para un particular base de
datos relacional deben ser definida en un sublenguaje de datos relacional y almacenada
en el diccionario de datos, no en los programas de aplicación.
● Integridad referencial: establece que para cada distinto valor de clave foránea no
nulo en una base de datos relacional, aquí debe tener su correspondiente valor
clave primaria del mismo dominio.
La regla 10 contiene una importante expansión. Esta establece que adicionalmente a las
dos reglas de integridad que aplican a todas las bases de datos relacionales, aquí hay
11
una necesidad clara de poder especificar restricciones adicionales de integridad reflejando
tanto las políticas del negocio como las políticas gubernamentales.
Las reglas de integridad son parte esencial de una base de datos relacional. Es mucho
mas fácil ya sea accidentalmente, o a propósito, derribar estas reglas si ellas están
almacenadas en una aplicación.
Regla 12:
Establece que si un sistema relacional tiene un lenguaje de bajo nivel, este bajo nivel no
puede ser utilizado para derribar o saltarse las reglas de integridad y restricciones
expresadas en las reglas de alto nivel, las cuales han sido aplicadas a las relaciones y
son almacenadas en el diccionario de datos.
Esta regla establece que no debe ser posible para un usuario utilizar un lenguaje de bajo
nivel para realizar cambios a registros individuales el cual derriba las reglas de integridad
de alto nivel. Cambios incluyen adiciones, eliminaciones y modificaciones a los registros.
Las reglas de Codd relacionadas al diccionario de datos establecen que todas las base de
datos deben tener un diccionario de datos y las reglas de integridad pueden ser
almacenadas en este diccionario. Además, el lenguaje utilizado para manipular la base de
datos no puede ser usado para derribar estas reglas de integridad.
Las reglas 5, 6 y 7, Codd muestra como los datos deben ser actualizados en una base de
datos.
Regla 5:
Establece que un sistema relacional puede soportar varios lenguajes y varios modos de
uso de terminal. Sin embargo, aquí debe estar al menos un lenguaje cuyas sentencias
son expresadas mediante alguna sintaxis bien definida.
Codd lista los ítems que deben ser soportados por un solo lenguaje. Los ítems son:
● Definición de datos
● Definición de vistas
● Manipulación de datos
● Restricciones de integridad
● Autorización
● Límites de la transacción
Esta regla básicamente establece que debe haber un único lenguaje que permite
manipular la base de datos. Aunque las bases de datos son generalmente manipuladas
mediante una interface gráfica de usuario (GUI), aquí se encuentra aún un lenguaje
subyacente.
12
Regla 6:
Establece que todas las vistas que son actualizables teóricamente son también
actualizables por el sistema. Una vista puede ser igual a la respuesta (answer) de una
consulta (query)
Codd establece que usted puede ser capaz de ver datos en una tabla y también ser capaz
de modificar estos datos. Sin embargo, Codd expande esta regla por lo cual usted solo
debe tener la posibilidad de modificar estos datos si los datos actualizados tienen sentido
de acuerdo a la estructura de la base de datos. No se puede modificar o actualizar los
datos porque este dato es derivado de un número diferente de registros de datos.
Regla 7:
Establece que la capacidad de manejar una relación base o una relación derivada como
un simple operando no solo para la recuperar los datos sino también para la inserción,
actualización, y borrado de los datos. Codd usa el término relación al referirse a una tabla.
Esta regla establece que usted tiene la capacidad de modificar o actualizar datos con un
simple comando. Se pueden eliminar registros individualmente, pero también debería ser
capaz de eliminar registros colectivamente por utilizar un simple comando. Esta regla es
importante debido a que se reduce la cantidad de código que se necesita escribir para
especificar la actualización.
Regla 8:
Esta regla establece que los programas de aplicación permanecen intactos lógicamente
aun si algunos cambios son hechos en la representación de almacenamiento o en los
métodos de acceso. Esta regla establece que la interacción del usuario sebe estar
separada de la estructura física de la base de datos.
Regla 9:
Establece que los programas de aplicación permanecen lógicamente intactos aun si
cambios de preservación-información de algún tipo que teóricamente previene intacto
debilitación son hechas en las relaciones base.
Esta regla es cercanamente relacionada con la regla 8. Esta indica que la interacción
lógica debe estar separada de la estructura física de la base de datos.
la reglas de independencia lógica y física permiten que los gestores de base de datos
modifiquen la estructura subyacente sin trastornar la manera en que los usuarios trabajan
y sin el requerimiento de que los programas sean reescritos.
Regla 11:
Establece que un RDBMS tiene independencia de distribución. Codd expande esta regla
indicando que la interacción lógica debe permanecer intacta cuando la distribución de los
datos es primero introducida y también cuando los datos esta redistribuidos. Esta regla
aplica a las base de datos dentro de una red. Usuarios pueden estar distribuidos a través
de una red a, similarmente, datos pueden ser distribuidos a través de la misma red. Aun si
las relaciones son movidas alrededor d ellas, los usuarios no deben enterarse de el
cambio de la localización.
13
La ventaja de tener la interacción lógica separada de la distribución de los datos es que
los cambios pueden ser fácilmente hechos para la distribución de los datos.
Según las reglas de Codd 8, 9 y 11, la interacción lógica y del usuario deben estar
separadas de a estructura física de una base de datos.
1.4 Transacciones.
Gestión de transacciones
Varias operaciones sobre la base de datos forman a menudo una única unidad lógica de
trabajo.
Una transacción es una colección de operaciones que se lleva a cabo como una única
función lógica en una aplicación de bases de datos. Cada transacción es una unidad de
atomicidad y consistencia. Cada transacción es una unidad de atomicidad y consistencia.
14
la consistencia de los datos puede no ser preservada, incluso aunque cada transacción
individualmente sea correcta. Es responsabilidad del gestor de control de concurrencia
controlar la interacción entre las transacciones concurrentes para asegurar la consistencia
de la base de datos.
Los sistemas de bases de datos diseñados para uso sobre pequeñas computadoras
personales pueden no tener todas las características vistas.
Propiedades ACID.
Durabilidad es la propiedad que asegura que una vez realizada la operación, ésta
persistirá y no se podrá deshacer aunque falle el sistema.
15
Actividades:
Individuales:
Especificar sentencias SQL que permitan la realización de consultas, inserción,
modificación y eliminación de registros en una base de datos.
Grupales:
Diseño de una Base de Datos para un Sistema de Información
Comunitarias:
Glosario de términos.
ACID:
En el contexto de bases de datos se denomina ACID a la propiedad de una base de datos
para realizar transacciones seguras. Así pues ACID compliant define a un sistema de
gestión de bases de datos que puede realizar transacciones seguras.
AD HOC:
El término también se utiliza en la informática para referirse a consultas en bases de datos
"ad hoc querying" o "ad hoc reporting", esto implica que el sistema permite al usuario
personalizar una consulta en tiempo real, en vez de estar atado a los queries
prediseñados para reportes.
RDBMS
Sistema de Gestión de Bases de Datos Relacional.
DBMS
Sistema de Gestión de Base de Datos
Tabla:
Relación de datos
Tupla:
Registro de una tabla
SQL:
Lenguaje de Consulta Estructurado
Curso de Thomson NETg CIW Database Specialist Part - Introducción al Diseño de Base
de Datos. www.CIWcertified.com
Wikipedia
http://es.wikipedia.org
16