Sei sulla pagina 1di 25

AA1- Introducción a las bases de datos

Evolución histórica

El término bases de datos fue escuchado por primera vez en un simposio


celebrado en California en 1963.

En una primera aproximación, se puede decir que una base de datos es un


conjunto de información relacionada que se encuentra agrupada o
estructurada.

Desde el punto de vista informático, una base de datos es un sistema


formado por un conjunto de datos almacenados en discos que permiten el
acceso directo a ellos y un conjunto de programas que manipulen ese
conjunto de datos.

Por su parte, un sistema de Gestión de Bases de datos es un tipo de


software muy específico dedicado a servir de interfaz entre la base de
datos, el usuario y las aplicaciones que la utilizan; o lo que es lo mismo,
una agrupación de programas que sirven para definir, construir y
manipular una base de datos, permitiendo así almacenar y posteriormente
acceder a los datos de forma rápida y estructurada.

Actualmente, las bases de datos están teniendo un impacto decisivo sobre


el creciente uso de las computadoras.

Los orígenes de las bases de datos se remontan a la Antigüedad donde ya


existían bibliotecas y toda clase de registros. Además, también se
utilizaban para recoger información sobre las cosechas y censos. Sin
embargo, su búsqueda era lenta y poco eficaz y no se contaba con la
ayuda de máquinas que pudiesen reemplazar el trabajo manual.
Posteriormente, el uso de las bases de datos se desarrolló a partir de las
necesidades de almacenar grandes cantidades de información o datos.
Sobre todo, desde la aparición de las primeras computadoras, el concepto
de bases de datos ha estado siempre ligado a la informática.

En 1884 Herman Hollerith creó la máquina automática de tarjetas


perforadas, siendo nombrado así el primer ingeniero estadístico de la
historia. En esta época, los censos se realizaban de forma manual.

Ante esta situación, Hollerith comenzó a trabajar en el diseño de una


maquina tabuladora o cansadora, basada en tarjetas perforadas.

Posteriormente, en la década de los cincuenta se da origen a las cintas


magnéticas, para automatizar la información y hacer respaldos. Esto sirvió
para suplir las necesidades de información de las nuevas industrias. Y a
través de este mecanismo se empezaron a automatizar información, con
la desventaja de que solo se podía hacer de forma secuencial.
Década de 1960

Posteriormente en la época de los sesenta, las computadoras bajaron los


precios para que las compañías privadas las pudiesen adquirir; dando paso
a que se popularizara el uso de los discos, cosa que fue un adelanto muy
efectivo en la época, debido a que a partir de este soporte se podía
consultar la información directamente, sin tener que saber la ubicación
exacta de los datos.

En esta misma época se dio inicio a las primeras generaciones de bases de


datos de red y las bases de datos jerárquicas, ya que era posible guardar
estructuras de datos en listas y árboles.

Otro de los principales logros de los años sesenta fue la alianza de IBM y
American Airlines para desarrollar SABRE, un sistema operativo que
manejaba las reservas de vuelos, transacciones e informaciones sobre los
pasajeros de la compañía American Airlines.

Y, posteriormente, en esta misma década, se llevó a cabo el desarrollo del


IDS desarrollado por Charles Bachman (que formaba parte de la CODASYL)
supuso la creación de un nuevo tipo de sistema de bases de datos
conocido como modelo en red que permitió la creación de un standard en
los sistemas de bases de datos gracias a la creación de nuevos lenguajes
de sistemas de información.

CODASYL (Conference on Data Systems Languages) era un consorcio de


industrias informáticas que tenían como objetivo la regularización de un
lenguaje de programación estándar que pudiera ser utilizado en multitud
de ordenadores.

Los miembros de este consorcio pertenecían a industrias e instituciones


gubernamentales relacionadas con el proceso de datos, cuya principal
meta era promover un análisis, diseño e implementación de los sistemas
de datos más efectivos; y aunque trabajaron en varios lenguajes de
programación como COBOL, nunca llegaron a establecer un estándar fijo,
proceso que se llevó a cabo por ANSI.

Década de 1970

Por lo que respecta a la década de los setenta, Edgar Frank Codd,


científico informático ingles conocido por sus aportaciones a la teoría de
bases de datos relacionales, definió el modelo relacional a la par que
publicó una serie de reglas para los sistemas de datos relacionales a través
de su artículo “Un modelo relacional de datos para grandes bancos de
datos compartidos”.

Este hecho dio paso al nacimiento de la segunda generación de los


Sistemas Gestores de Bases de Datos.

Como consecuencia de esto, durante la década de 1970, Lawrence J.


Ellison, más conocido como Larry Ellison, a partir del trabajo de Edgar F.
Codd sobre los sistemas de bases de datos relacionales, desarrolló el
Relational Software System, o lo que es lo mismo, lo que actualmente se
conoce como Oracle Corporation, desarrollando así un sistema de gestión
de bases de datos relacional con el mismo nombre que dicha compañía.
Posteriormente en la época de los ochenta también se desarrollará el SQL
(Structured Query Language) o lo que es lo mismo un lenguaje de
consultas o lenguaje declarativo de acceso a bases de datos relacionales
que permite efectuar consultas con el fin de recuperar información de
interés de una base de datos y hacer cambios sobre la base de datos de
forma sencilla; además de analiza grandes cantidades de información y
permitir especificar diversos tipos de operaciones frente a la misma
información, a diferencia de las bases de datos de los años ochenta que se
diseñaron para aplicaciones de procesamiento de transacciones.

Pero cabe destacar que ORACLE es considerado como uno de los sistemas
de bases de datos más completos que existen en el mundo, y aunque su
dominio en el mercado de servidores empresariales ha sido casi total
hasta hace relativamente poco, actualmente sufre la competencia del SQL
Server de la compañía Microsoft y de la oferta de otros Sistemas
Administradores de Bases de Datos Relacionales con licencia libre como es
el caso de PostgreSQL, MySQL o Firebird que aparecerían posteriormente
en la década de 1990.

Década de 1980

Por su parte, a principios de los años ochenta comenzó el auge de la


comercialización de los sistemas relacionales, y SQL comenzó a ser el
estándar de la industria, ya que las bases de datos relacionales con su
sistema de tablas (compuesta por filas y columnas) pudieron competir con
las bases jerárquicas y de red, como consecuencia de que su nivel de
programación era sencillo y su nivel de programación era relativamente
bajo.

Década años 1990


En la década de 1990 la investigación en bases de datos giró en torno a las
bases de datos orientadas a objetos. Las cuales han tenido bastante éxito
a la hora de gestionar datos complejos en los campos donde las bases de
datos relacionales no han podido desarrollarse de forma eficiente. Así se
desarrollaron herramientas como Excel y Access del paquete de Microsoft
Office que marcan el inicio de las bases de datos orientadas a objetos.

Así se creó la tercera generación de sistemas gestores de bases de datos.

Fue también en esta época cuando se empezó a modificar la primera


publicación hecha por ANSI del lenguaje SQL y se empezó a agregar
nuevas expresiones regulares, consultas recursivas, triggers y algunas
características orientadas a objetos, que posteriormente en el siglo XXI
volverá a sufrir modificaciones introduciendo características de XML,
cambios en sus funciones, estandarización del objeto sequence y de las
columnas autonuméricas. Y además, se creará la posibilidad de que SQL se
pueda utilizar conjuntamente con XML, y se definirá las maneras de cómo
importar y guardar datos XML en una base de datos SQL. Dando asi, la
posibilidad de proporcionar facilidades que permiten a las aplicaciones
integrar el uso de XQuery (lenguaje de consulta XML) para acceso
concurrente a datos ordinarios SQL y documentos XML. Y posteriormente,
se dará la posibilidad de usar la clausula order by.

Aunque el boom de la década de los noventa será es el nacimiento del


World Wide Web a finales de la década, ya que a través de este se
facilitará la consulta a bases de datos.
SIGLO XXI

En la actualidad, las tres grandes compañías que dominan el mercado de


las bases de datos son IBM, Microsoft y Oracle. Por su parte, en el campo
de internet, la compañía que genera gran cantidad de información es
Google. Aunque existe una gran variedad de software que permiten crear
y manejar bases de datos con gran facilidad, como por ejemplo LINQ, que
es un proyecto de Microsoft que agrega consultas nativas semejantes a las
de SQL a los lenguajes de la plataforma .NET. El objetivo de este proyecto
es permitir que todos los códigos hechos en Visual Studio sean también
orientados a objetos; ya que antes de LINQ, la manipulación de datos
externos tenía un concepto más estructurado que orientado a objetos; y
es por eso que trata de facilitar y estandarizar el acceso a dichos objetos.

Modelos de bases de datos:

Bases de datos jerárquicas

En este modelo los datos se organizan en forma de árbol invertido


(algunos dicen raíz), en donde un nodo padre de información puede tener
varios hijos. El nodo que no tiene padres es llamado raíz, y a los nodos que
no tienen hijos se les conoce como hojas.

Las bases de datos jerárquicas son especialmente útiles en el caso de


aplicaciones que manejan un gran volumen de información y datos muy
comprimidos permitiendo crear estructuras estables y de gran
rendimiento. Una de las principales limitaciones de este modelo es su
incapacidad de representar eficientemente la redundancia de datos.

Base de datos de red

Este es un modelo ligeramente distinto del jerárquico, su diferencia


fundamental es la modificación del concepto de nodo: se permite que un
mismo nodo tenga varios padres (posibilidad no permitida en el modelo
jerárquico). Fue una gran mejora con respecto al modelo jerárquico, ya
que ofrecía una solución eficiente al problema de redundancia de daatos;
pero, aun así, la dificultad que significa administrar la información en una
base de datos de red ha significado que sea un modelo utilizado en su
mayoría por programadores más que por usuarios finales.

Bases de datos relacionales

Este es el modelo utilizado en la actualidad para representar problemas


reales y administrar datos dinámicamente. Tras ser postulados sus
fundamentos en 1970 por Edgar Frank Codd, de los laboratorios IBM en
San José (California), no tardó en consolidarse como un nuevo paradigma
en los modelos de base de datos. Su idea fundamental es el uso de
“relaciones”. Estas relaciones podrían considerarse en forma lógica como
conjuntos de datos llamados” tuplas”. Pese a que esta es la teoría de las
bases de datos relacionales creadas por Codd, la mayoría de las veces se
conceptualiza de una manera más fácil de imaginar. Esto es pensando en
cada relación como si fuese una tabla que está compuesta por registros
(las filas de una tabla), que representarían las tuplas y campos (las
columnas de una tabla)

En este modelo, el lugar y la forma en que se almacenan los datos no


tienen relevancia (a diferencia de otros modelos como el jerárquico y el de
red). Esto tiene la considerable ventaja de que es más fácil de entender y
de utilizar para un usuario esporádico de la base de datos. La información
puede ser recuperada o almacenada mediante” consultas” que ofrecen
una amplia flexibilidad y poder para administrar la información.

El lenguaje más habitual para construir las consultas a bases de datos


relacionales es SQL, Structured Query Language o Lenguaje Estructurado
de Consultas, un estándar implementando por los principales motores o
sistemas de gestión de bases de datos relacionales.

Durante su diseño, una base de datos relacional pasa por un proceso al


que se le conoce como normalización de una base de datos.
Concepto, Estructura de datos

Definimos un Sistema Gestor de Bases de Datos o SGBD, también llamado


DBMS (Data Base Management System ) como una colección de datos
relacionados entre sí, estructurados y organizados, y un conjunto de
programas que acceden y gestionan esos datos. La colección de esos datos
se denomina Base de Datos o BD, (DB Data Base ).
Una estructura de datos es una forma de organizar datos en una
computadora para que puedan ser utilizados de manera eficiente

Reglas de integridad en el modelo relacional

Regla O: debe ser relacional, una base de datos y un sistema de gestión.

Para que el sistema sea considerado relacional, debe usar sus capacidades
relacionales exclusivamente para gestionar bases de datos.

Regla 1: regla de la información.

Toda la información de la base de datos deber estar representada


explícitamente en el esquema lógico. Es decir, todos los datos están en las
tablas.

Regla 2: regla del acceso garantizado

Para todos y cada uno de los datos (valores atómicos) de una base de
datos relacional ( BDR) se garantiza que son accesibles a nivel lógico
utilizado con una combinación de nombre tabla, valor de clave primaria y
nombre columna.

Cualquier dato almacenado en una BDR tiene que poder ser direccionado
unívocamente. Para ello hay que indicar en qué tabla está, cuál es la
columna y cuál es la fila (mediante la clave primaria). Por tanto se necesita
el concepto de clave primaria, que no es soportado en muchas
implementaciones. En estos casos, para lograr un efecto similar se puede
hacer lo siguiente: Hacer que los atributos clave primaria no puedan ser
nulos (NOT NULL). Crear un índice único sobre la clave primaria. No
eliminar nunca el índice.

Regla 3: tratamiento sistemático de valores nulos

Los valores nulos (que son distintos de la cadena vacía, blancos,0…) se


soportan en los SGBD totalmente relacionales para representar
información desconocida o no aplicable de manera sistemática,
independientemente del tipo de datos.

Se reconoce la necesidad de la existencia de valores nulos, para un


tratamiento sistemático de los mismos. Hay problemas para soportar los
valores nulos en las operaciones relacionales, especialmente en las
operaciones lógicas.

Lógica trivaluada. Es una posible solución. Existen tres (no dos) valores de
verdad: Verdadero, Falso y Desconocido (null). Se crean tablas de verdad
para las operaciones lógicas:

Null y null= falso verdadero Y null = null

Falso y null= Falso Verdadero O null= verdadero

Etc,,,

Un inconveniente es que de cara al usuario el manejo de los lenguajes


relacionales se complica pues es más difícil de entender.

Regla 4: diccionario dinámico en línea basado en el modelo relacional

La descripción de la base de datos se representa a nivel lógico de la misma


manera que los datos normales, de modo que los usuarios autorizados
pueden aplicar el mismo lenguaje relacional a su consulta, igual que lo
aplican a los datos normales. Es una consecuencia de la regla 1 que se
destaca por su importancia. Los metadatos se almacenan usando el
modelo relacional, con todas las consecuencias.

Regla 5: regla del sublenguaje de datos completo.

Un sistema relacional debe soportar varios lenguajes y varios modos de


uso de terminal (por ejemplo, rellenar formularios). Sin embargo, debe
existir al menos un lenguaje cuyas sentencias sean expresables, mediante
una sintaxis bien definida, como cadenas de caracteres y que sea
completo, soportando: Definición de datos, Definición de vistas,
Manipulación de datos (interactiva y por programa), Limitantes de
integridad, Limitantes de transacción ( iniciar, realizar, deshacer) ( Begin,
commit, rollback). Además de poder tener interfaces más amigables para
hacer consultas, etc. Siempre debe de haber una manera de hacerlo todo
de manera textual, que es tanto como decir que puede ser incorporada en
un programa tradicional. Un lenguaje que cumple esto en gran medida es
SQL.

Regla 6: regla de actualización de vistas:

Todas las vistas que son teóricamente actualizaciones se deben actualizar


por el sistema. El problema es determinar cuáles son las vistas
teóricamente actualizables, ya que no es muy claro. Cada sistema puede
hacer unas suposiciones particulares sobre las vistas que son actualizables.

Regla 7: inserción, actualización y borrado de alto nivel

La capacidad de manejar una relación base o derivada como un solo


operando se aplica no sólo a la recuperación de los datos(consultas), si no
también a la inserción, actualización y borrado de datos. Esto es el
lenguaje de manejo de datos también debe ser de alto nivel ( de conjuntos
). Algunas bases de datos inicialmente sólo podían modificar las tuplas de
la base de datos una en una (un registro de cada vez)

Regla 8: independencia física de datos

Los programas de aplicación y actividades de terminal permanecen


inalterados a nivel físico cuando quiera que se realicen cambios en las
representaciones de almacenamiento o métodos de acceso.
El modelo relacional es un modelo lógico de datos, y consulta las
características de su representación física. Es la capacidad de modificar el
esquema interno sin tener que alterar el esquema conceptual (o los
externos). Por ejemplo, puede ser necesario reorganizar ciertos ficheros
físicos con el fin de mejorar el rendimiento de las operaciones de consulta
o de actualización de datos. La independencia física se refiere sólo a la
separación entre las aplicaciones y las estructuras físicas de
almacenamiento. La capacidad de modificar el esquema conceptual sin
obligar a rescribir los programas de aplicación.

Regla 9: independencia lógica de datos

Los programas de aplicación y actividades de terminal permanecen


inalterados a nivel lógico cuando quiera que se realicen cambios a las
tablas base que preserven la información.

Cuando se modifica el esquema lógico preservando información (no


valdría p.ej. eliminar un atributo) no es necesario modificar nada en
niveles superiores. Ejemplos de cambios que preserven la información,
añadir un atributo a una tabla base, sustituir dos tablas base por la unión
de las mismas. Usando vistas de la unión puedo recrear las tablas
anteriores…

Depurar las vistas de désenos y contenerla estable.

Regla 10; independencia de integridad

Los limitantes de integridad específicos para una determinada base de


datos relacional deben poder ser definidos en el sublenguaje de datos
relacional y almacenables en el catálogo, no en los programas de
aplicación.

El objetivo de las bases de datos no es sólo almacenar los datos, sino


también sus relaciones y evitar que estas (limitantes) se codifiquen en los
programas. Por tanto, es una BDR se deben poder definir limitantes de
integridad. Cada vez se van ampliando más los tipos de limitantes de
integridad que se pueden utilizar en los SGBDR, aunque hasta hace poco
eran muy escasos. Como parte de los limitantes inherentes al modelo
relacional (forman parte de su definición) están: Una BDR tiene integridad
de entidad. Es decir, toda tabla debe tener una clave primaria. Una BDR
tiene integridad referencial, es decir, toda clave externa no nula debe
existir en la relación donde es primaria.

Regla 11: independencia de distribución

Una base de datos relacional tiene independencia de distribución. Las


mismas órdenes y programas se ejecutan igual en una BD centralizada que
es una distribuida. Las BDR son fácilmente distribuibles: Las tablas se
dividen en fragmentos que se distribuyen, Cuando se necesitan las tablas
completas se recombinan usando operaciones relacionales con los
fragmentos, Sin embargo, se complica más la gestión interna de la
integridad, etc. Esta regla es responsable de tres tipos de transparencia de
distribución: Transparencia de localización. El usuario tiene la impresión
de que trabaja con un BD local. (aspecto de la regla de independencia
física) Transparencia de fragmentación. El usuario no se da cuenta de que
la relación con que trabaja está fragmentada. (aspecto de la regla de
independencia lógica de datos). Transparencia de replicación. El usuario
no se da cuenta de que pueden existir copias (réplicas) de una misma
relación en diferentes lugares.

Regla 12: regla de la no subversión

Si un sistema relacional tiene un lenguaje de bajo nivel (un registro cada


vez), ese bajo nivel no puede ser usado para saltarse (subvertir) las reglas
de integridad y los limitantes expresados en los lenguajes relacionales de
más alto nivel ( una relación( conjunto de registros) de cada vez)

Algunos problemas no se pueden solucionar directamente con el lenguaje


de alto nivel. Normalmente se usa SQL inmerso en un lenguaje anfitrión
para solucionar estos problemas. Se utiliza el concepto de cursor para
tratar individualmente las tuplas de una relación. En cualquier caso, no
debe ser posible saltarse los limitantes de integridad impuestos al tratar
las tablas a ese nivel.
Guapa, guapa y guapa!!! – Viva la Virgen y Viva la Madre de Dios

Funciones y Componentes de un DBMS

Siendo entonces la Base de datos una colección de archivos


interrelacionados creados con un DBMS. El contenido de una base de
datos esta almacenada de tal manera que los datos estén disponibles para
los usuarios, una finalidad de la base de datos es eliminar la redundancia o
al menos minimizarla. La DB no es, en si un cúmulo de información, sino
solo un “almacén” de datos, lo que ha hecho indispensable el desarrollo
de sistemas que lo administren y procesen, siendo estos los DBMS.

El propósito general de los DBMS es el de manejar de manera clara,


sencilla y ordenada a los datos de una Base de Datos (DB) que
posteriormente se convertirán en información relevante, para un buen
manejo de los datos

Funciones que deben cumplir los DBMS:

Abstracción de los datos: Los DBMS ahorran a los usuarios detalles acerca
del almacenamiento físico de los datos. Da lo mismo si una base de datos
ocupa uno o cientos de archivos, este hecho se hace transparente al
usuario. Así, se definen varios niveles de abstracción.

Independencia: La independencia de los datos consiste en la capacidad de


modificar el esquema (físico o lógico) de una base de datos sin tener que
realizar cambios en las aplicaciones que se sirven de ella.

Consistencia: En aquellos casos en los que no se ha logrado eliminar la


redundancia, será necesario vigilar que aquellos datos que aparecerán
repetidos se actualice de forma coherente, es decir, que todos los datos
repetidos se actualicen de forma simultánea

Seguridad: Los datos almacenados en una base de datos puede llegar a


tener un gran valor. Los DBMS deben garantizar que estos datos se
encuentren seguros frente a usuarios que puedan altéralos, frente a
ataques que deseen manipular o destruir los datos.

Integridad

Se trata de adoptar las medidas necesarias para garantizar la validez de los


datos almacenados, Es decir, se trata de proteger los datos ante fallos de
hardware, datos introducidos por usuario, o cualquier otra circunstancia
capaz de corromper los datos almacenados.

Copia de seguridad o respaldo: Los DBMS deben proporcionar una forma


eficiente de realizar copias de respaldo de los datos almacenados y de
restaurar a partir de estas copias los datos que se hayan podido perder.
Control de concurrencia:

En la mayoría de entornos, lo más habitual es que sean muchas las


personas que acceden a una base de datos, bien para recuperar datos,
bien para almacenarla. Y es también frecuente que dichos accesos se
realicen de forma simultánea. Así pues, un DBMS debe controlar este
acceso concurrente a la DB, que podría derivar en inconsistencias,

Tiempo de respuesta: es deseable minimizar el tiempo que el DBMS tarda


en darnos la información solicitada y en almacenar los cambios realizados.

Componentes de un DBMS

Un sistema de base de datos se encuentra dividido en módulos cada uno


de los cuales controla una parte de la responsabilidad total de sistema

En la mayoría de los casos, el sistema operativo proporciona únicamente


los servicios más básicos y el sistema de la base de datos debe partir de
esa base y controlar además el manejo correcto de los datos. Así el diseño
de un sistema de base de datos debe incluir la interfaz entre el sistema de
base de datos y el sistema operativo.

Los componentes funcionales de un sistema de base de datos, son:

Gestor de archivos:

Gestiona la asignación de espacio en la memoria del disco y de las


estructuras de datos usadas para representar datos.

Manejador de base de datos:

Sirve de interfaz entre los datos y los programas de aplicación

Procesador de consultas:

Traduce las proposiciones en lenguajes de consulta a instrucciones de bajo


nivel, Además convierte la solicitud del usuario en una forma más
eficiente.
Compilador de DDL.

Convierte las proposiciones DDL en un conjunto de tablas que contienen


metadatos, estas se almacenan en el diccionario de datos.

Archivo de datos:

En él se encuentran almacenados físicamente los datos de una


organización.

Diccionario de datos:

Contiene la información referente a la estructura de la base de datos.

Índices:

Permiten un rápido acceso a registros que contiene valores específicos,

Tipos de usuarios: Informáticos y no informáticos:

Usuarios Informáticos:

Los usuarios informáticos están operando dentro de un DBMS en los


niveles de Diseño: Físico y Conceptual.

Nivel Físico

Es aquel en el que se determinan las características de almacenamiento en


el medio secundario. Los diseñadores de este nivel poseen un amplio
dominio de cuestiones técnicas y de manejo de hardware ( uno o mas
computadoras, medios de almacenamiento secundario: discos duros, CDR,
etc.

Nivel Conceptual
Es aquel en el que se definen las estructuras lógicas de almacenamiento y
las relaciones que se darán entre ellas. Ejemplos comunes de este nivel
son el diseño de los registros y las ligas que permitirán la conexión entre
registros de un mismo archivo, de archivos distintos incluso, de ligas hacia
archivos

Usuarios no informáticos:

Es el que finalmente accede a la BD a través del DBMS, conocido como


nivel de Edición.

Nivel de Edición

Es aquel en el que se presenta al usuario final y que puede tener


combinaciones o relaciones entre los datos que conforman a la base de
datos global. Puede definirse como la forma en el que el usuario aprecia la
DB y sus relaciones.

Administrador de la base de datos: Funciones y responsabilidades


Es la persona o equipo de personas profesionales responsables del control
y manejo del sistema de base de datos

Los sistemas de base de datos se diseñan para manejar grandes


cantidades de datos, la manipulación de los datos involucra tanto la
definición de estructuras para el almacenamiento de la DB como la
provisión de mecanismos para la manipulación de la DB, además un
sistema de base de datos debe tener implementados mecanismos de
seguridad que garanticen la integridad de la DB, a pesar de caídas del
sistema.

Funciones y responsabilidades:
Definir el esquema conceptual:

Debe decidir cuáles son los datos que debe mantenerse en la BD, es decir,
identificar las entidades que interesan a la empresa y los datos que deben
registrarse acerca de esas entidades. Este proceso se denomina diseño
lógico de BD.

Definir el esquema interno:

Debe decidir cómo se representará los datos en la BD almacenada. A éste


proceso se le denomina diseño físico de la Bd. El DBA se vale del DDl
interno para crear la definición de estructura de almacenamiento y la
correspondencia pertinente entre los esquemas interno y conceptual

Vincularse con los usuarios:

El DBA debe encargarse de la comunicación con los usuarios, garantizar la


disponibilidad de los datos que requieren y escribir los esquemas
necesarios. Las consultas sobre diseño de aplicaciones, la impartición
técnica, la ayuda en la localización y resolución de problemas, y otros
servicios profesionales similares relacionados con el sistema.

Definir las verificaciones de seguridad e integridad:

Las verificaciones de seguridad e integridad pueden considerarse parte del


esquema conceptual.

Definir las verificaciones de seguridad e integridad:

Cuando una empresa se decide a utilizar un sistema de BD, se vuelve


dependiente en grado sumo del funcionamiento correcto de ese sistema.
En caso de que sufra daño cualquier porción de la BD resulta esencial
poder reparar los datos implicados con un mínimo de retraso y afectando
lo menos posible al resto del sistema. El DBA debe definir y poner en
práctica un plan de recuperación adecuado que incluya, por ejemplo, una
descarga o “vaciado” periódico de la BD en un medio de almacenamiento
de respaldo, y procedimientos para cargar otra vez la BD a partir del
vaciado más reciente cuando sea necesario.

Supervisar el desempeño y responder a cambios en los requerimientos:

Es responsabilidad del DBA organizar el sistema de modo que se obtenga


el desempeño que sea mejor para la empresa, y realizar los ajustes
apropiados cuando cambien los requerimientos.

Tipos de lenguaje de la base de datos. (DDL, DML, DCL)

Un lenguaje de base de datos o lenguaje de definición de datos (Data


Definition Languaje, DDL por sus siglas en inglés) es un lenguaje
proporcionado por el sistema de gestión de base de datos que permite a
los programadores de la misma llevar a cabo tareas de definición de las
estructuras que almacenarán los datos así como de los procedimientos o
funciones que permitan consultarlos-

Un Data Denition Languaje o Lenguaje de descripción de datos (DDL) es un


lenguaje de programación para definir estructuras de datos. El término
DDL fue introducido por primera vez en relación con el modelo de base de
datos CODASYL, donde el esquema de la base de datos ha sido escrito en
un lenguaje de descripción de datos que describe los registros, los
campos, y “conjuntos” que conforman el usuario modelo de datos.

Lenguaje de bases de datos DML:

Lenguaje de manipulación de datos ( Data Manipulation Languaje, DML) es


un lenguaje proporcionado por los sistemas gestores de bases de datos
que permite a los usuarios de la misma llevar a cabo las tareas de consulta
o modificación de los datos contenidos en las Bases de Datos del Sistema
Gestor de Bases de Datos.

El lenguaje de manipulación de datos más popular hoy en día es SQL,


usado para recuperar y manipular datos en una base de datos relacional.
Otro ejemplo de DML usado por bases de datos puede ser CODASYL, u
otras.

Clasificación de los DML:

Se clasifican en dos grandes grupos:

Lenguaje de consulta procedimentales:

En este tipo de lenguaje el usuario da instrucciones al sistema para que


realice una serie de procedimientos u operaciones en la base de datos
para calcular un resultado final.

Lenguaje de consulta no procedimentales:

En los lenguajes no procedimentales el usuario describe la información


deseada sin un procedimiento específico para obtener esa información

Lenguaje de Control de Datos DCL: (DCL por sus siglas en inglés: Data
Control Language) es un lenguaje proporcionado por el Sistema de
Gestión de Base de Datos que incluye una serie de comandos SQL que
permiten al administrador controlar el acceso a los datos contenidos en la
Base de Datos

Diccionario de datos: Concepto, contenido, tipo y uso.

Arquitectura del modelo de referencia ANSI/X3/SPARC

ADMINISTRADOR

DE EMPRESA

PROCESADOR DE
ADMINISTRADOR ADMINISTRADOR
DE APLICACIONES ESQUEMA CONCEPTUAL DE APLICACIONES
PROCESADO
PROCESADOR DE
R DE
DICCIONAR ESQUEMA
ESQUEMA
IO DE EXTERNO
INTERNO
DATOS

TRASFORMAD TRASFORMADOR
TRASFORMADOR
OR
ALMACENAMIENTO ALMACENAMIENTO
ALMACENAMIE
EXTERNO
NTO INTERNO CONCEPTUAL

CONCEPTUAL
SBSISTEMA DE
ALMACENAMIE APLICACIÓN
NTO

USUARIOS
PROGRAMADORES
MEMORIA del Modelo de referencia ANSI/x3/ SPARC
Los objetivos FINALES
SECUNDARIA
SECUNDA
SECUNDSECUNDA
RIA

Niveles de la arquitectura: Interna –conceptual –externa


Nivel interno o Físico( Almacenamiento físico): se encarga de engranar con
el software más interno de cada máquina (Sistema Operativo y Sistema de
Gestión de ficheros). El esquema interno especifica qué y cómo son
almacenados los datos. Describe la estructura de la B.D. en forma de
Modelo Conceptual de almacenamiento.

Nivel Conceptual:

materializa el lugar donde definir el resultado del diseño de la B.D. El


esquema conceptual debe captar y almacenar el “universo del discurso”
que describe a la organización o empresa y que es necesaria para su
funcionamiento (capacidad semántica) sirve de punto de control para
futuros desarrollos de la B.D., aísla la representación de la información de
los requerimientos de la máquina y de las exigencias de cada usuario en
particular e independiza la definición de la información de los SGPD en
concreto.

Nivel lógico o externo(Vistas de usuario):

Contiene las vistas externas de la B.D. que estás asociadas cada una a un
esquema externo y permite ver cada tipo de usuario de la B:D. sólo
aquella parte del esquema que es de su interés.

Potrebbero piacerti anche