Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
-
DESARROLLO
Esta guía se divide en tres partes introductorias. La primera es la base fundamental para entender
qué es una base de datos y por qué son deseables en general los sistemas de bases de datos. Se
hará un estudio entre los sistemas relacionales y los no relacionales. A continuación, la parte 2
presenta una visión histórica de cómo estos sistemas gestores de información han evolucionado al
pasar el tiempo, entendiéndose entonces, cómo se pasa de almacenar información en cintas
magnéticas (1950) a utilizar modernas alternativas en línea que gestionan mayor cantidad de
contenido y más rápido. La parte 3 constituye la arquitectura general para los sistemas de bases
de datos más exactamente la arquitectura ANSI/SPARC también llamada arquitectura de tres
esquemas. Será usada en casi todo el contenido de este documento en las siguientes unidades.
Dando un enfoque muy general, un sistema de bases de datos no es más que un sistema
para archivar en computador información relevante. Dicho de otra manera, se podría
considerar como un archivador electrónico donde su único propósito es mantener
información y lograr que esté disponible cundo se necesite. Al usuario que interactúe con el
sistema tendrá a su disposición diversas operaciones sobre estos archivos, las más comunes
son:
La información que se maneje puede ser cualquier cosa, hay que decir que el individuo u
organización que requiera de este sistema debe almacenar datos que se consideren
importantes
Figura 1: Componentes principales de un sistema de base de datos
1.1.1 La información
Hay que comenzar diciendo que existen sistemas de bases de datos para máquinas
pequeñas que tienen poco nivel de procesamiento por lo cual ofrecen un servicio un tanto
limitado, es decir, la capacidad de conexiones hechas por múltiples usuarios hace que el
sistema se ralentice. Para mitigar esto se usan macrocomputadoras.
En conclusión, la información que se maneje en sistemas grandes debe estar integrada y
compartida, esto se considera una ventaja inmensa para sistemas macro por la gran
manipulación de datos.
• Integrada
Significa que la base de datos en tanto como sea posible debe evitar la redundancia de
datos, logrando una unificación entre sus archivos. Por ejemplo, en cierta base de
datos se tiene un archivo CLIENTE, con datos nombre, apellido, teléfono, dirección y
también un archivo ESCRITURA, que representa los bienes que tiene cada cliente.
Suponga que para registrar un bien en el archivo ESCRITURA se necesita la dirección
del cliente, es evidente que no hace falta incluir esta información porque siempre
podrá obtenerse mediante una consulta al archivo CLIENTE.
• Compartida
Significa que los elementos de la base de datos pueden ser accedidos por diferentes
usuarios al tiempo, para propósitos distintos o no. En el ejemplo
CLIENTE/ESCRITURA anteriormente mencionado los datos del cliente pueden ser
usados por un usuario para gestionar una escritura en cuestión y por otro para sacar un
detallado informe del cliente.
1.1.2 Equipo
1.1.3 Programas
Entre toda la arquitectura física del computador o máquina donde se ejecute el sistema y
los usuarios que interactúan con ella, existe un nivel de programas o sistemas de
administración de bases de datos (DBMS, database management system). El DBMS es el
encargado de procesar todas las peticiones de los usuarios y hacer la comunicación a nivel
de equipo.
Básicamente cuando el usuario hace una consulta SQL el DBMS es el encargado de ir a la
base de datos y traer la información. Aunque este componente de software es el más
importante de todo el sistema no hay que dejar pasar por alto las librerías, utilerías,
herramientas de diseño y desarrollo de aplicaciones etcétera.
1.1.4 Usuarios
Los datos en una base de datos conviene llamarlos persistentes, ésta es, por excelencia una
característica de estos sistemas. Por ejemplo, hágase la idea que una compañía no guardara
la información de sus empleados, clientes u operaciones. Sería un caos tratar de llevar una
administración de esa manera.
Las entidades o esquemas representan objetos o conceptos del mundo real. Las entidades
están constituidas por un nombre y el conjunto de sus atributos. Siguiendo con el ejemplo
de CLIENTE/ESCRITURA, habría dos entidades por supuesto. Si se quisiera representar la
entidad CLIENTE seria:
Una interrelación es esa conexión que une o relaciona de cierta forma dos entidades, es
decir, en el ejemplo anterior un CLIENTE puede tener uno o más bienes por consiguiente
tienen ESCRITURAS. Más adelante se retomará el tema a profundidad.
A mediados de los años ochenta se dio origen a los sistemas de archivos, cumplían con lo
requerido para la época, la información perduraba por periodos largos y permitía almacenar
grandes volúmenes de datos. Sin embargo, estos sistemas no garantizaban que no se
perdiera información sin respaldo y que su manipulación fuera totalmente accesible. Al no
contar con un lenguaje de consulta que facilite el acceso a los datos y que múltiples
usuarios no puedan tener acceso a la información al tiempo son aspectos que hacen a este
sistema de archivos una mala idea para gestionar información y peor aún si es a escala
macro.
Todo el boom de las bases de datos actuales se debe al señor Ted Codd cuando escribió su
famoso e importante trabajo en 1970. Codd propuso que los datos debían organizarse en
forma de tablas también conocidas esquemas, entidades o relaciones. Con el fin de lograr
una estructura capas de contestar consultas diversas. Gracias a este modelo relacional nace
uno de los mejores
Lenguajes de consultas SQL (Structured Query Language, lenguaje de consulta
estructurado).
Las entidades son tablas. Las columnas están encabezadas por atributos que describen las
entradas de las columnas. Por
ejemplo, se considera la entidad FACTURAS, la cual registra el número de factura, cliente,
valor y la fecha. La tabla quedaría de la siguiente manera.
Cada renglón por debajo de los atributos (factura, cliente, valor y fecha) se denominan
tuplas, en el ejemplo hay tres tuplas.
La segunda tupla por ejemplo indica que la factura numero 002 pertenece al cliente Cesar
con un valor de 200.000 y se realizó en la fecha 29/09/2009. Supóngase que no se conoce el
cliente que realizo la factura 003, para esto podríamos hacer una consulta SQL en manera
de ejemplo:
• Jeffrey, U, Introducción a los sistemas de bases de datos, Ed. Pearson Educación, 1999.
• De Miguel, A.; Piattini, M, Concepción y Diseño de Bases de Datos. Del Modelo E/R al Modelo
Relacional. Ed. RaMa, 1993.
• Santos, E, Bases de Datos.,Ed. Servicio Publicaciones de la E.U. de Informática, 1998.
• Fernández, C, El Modelo Relacional de Datos: De los Fundamentos a los Modelos Deductivos. Ed.
Diaz de Santos, 1987.
• Date, C, Introducción a los Sistemas de Bases de Datos , Ed. AddisonWesley Iberoamericana, 1990.
• Hursch, C; Hursh, J, SQL. El Lenguaje de Consulta Estructurado, Ed. RaMa, 1998.
• Kprth, H, Fundamentos de Bases de Datos, Ed. McGrawHill, 1998.
• Hector García-Molina, Jeffrey Ullman, and Jennifer Widow, Database systems: the complete book,
Addison Wesley, 2001.
• Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Introduction to datamining, Addison Wesley,
2006
• Hastie Trevor, Tibshirani Robert, Friedman Jerome, The elements of stadistical learning: data
mining, inference, and prediction, Springer, 2009