Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CONCEPTOS GENERALES
Que es una Base de Datos:
Una base de datos es una coleccin de informacin, accedida y administrada por un SGBD
(Sistema Gestor de Bases de Datos) o en ingls DBMS (Database Manager System).
_______________
Restricciones
Son reglas que deben mantener los datos almacenados en la base de datos. No
se deben quebrantar a menos que tenga otra relacin de una tabla de uno a
muchos.
Correspondencia de cardinalidades
Dado un conjunto de relaciones en el que participan dos o ms conjuntos de
entidades, la correspondencia de cardinalidad indica el nmero de entidades
con las que puede estar relacionada una entidad dada.
Restricciones de participacin
Dado un conjunto de relaciones R en el cual participa un conjunto de entidades
A, dicha participacin puede ser de dos tipos:
Total: Cuando cada entidad en A participa en al menos una relacin de R.
Definicin de requerimientos
Diseo conceptual
Diseo lgico de la base de datos
Opcionalidad:
Es el tipo de relacin que describe si una entidad est relacionada de manera
obligatoria con otra entidad.
1
0
Obligatoria
Opcional
SUBLENGUAJES DE DATOS
Un sistema de bases de datos proporciona un lenguaje de definicin de
datos para especificar el esquema de la base de datos y un lenguaje de
manipulacin de datos para expresar las consultas a la base de datos y las
modificaciones.
Un modelo de datos es un lenguaje que, tpicamente, tiene dos sublenguajes:
Select
Insert
Delete
Update
DICCIONARIO DE DATOS
Un diccionario de datos es un conjunto de metadatos que contiene las
caractersticas lgicas de los datos que se van a utilizar en el sistema que se
programa, incluyendo nombre, descripcin, alias, contenido y organizacin.
Estos diccionarios se desarrollan durante el anlisis de flujo de datos y ayuda a los
analistas que participan en la determinacin de los requerimientos del sistema, su
contenido tambin se emplea durante el diseo del proyecto.
Normalizacin.
El proceso de normalizacin de bases de datos consiste en aplicar una serie de
reglas a las relaciones obtenidas tras el paso del modelo entidad-relacin al
modelo relacional.
Las bases de datos relacionales se normalizan para:
Evitar la redundancia de los datos.
Evitar problemas de actualizacin de los datos en las tablas.
Proteger la integridad de los datos.
Grados de normalizacin
Pedidos
Nombre_Productos
Costo_Producto
Imagen_Producto
Nombre_Ci_ Envios
Ahora tiene dos tablas. Pero todava hay un problema. No hay forma de
relacionar los datos de la tabla original con los de la nueva tabla. Para hacerlo,
debe aadir un campo clave a la segunda tabla de forma que se establezca la
relacin. Aada a la tabla Productos una clave primaria que se llame
ID_Producto y aada una clave a la tabla Clientes que la relacione con la tabla
Productos. El campo ID_Producto es el candidato ideal.
Primera Forma Normal
Clientes
ID_Productos
ID_Clientes
Nombre
Apellidos
Direccin
Numero_Pedido
Fecha_Pedido
Cantidad_Pedido
Clave_Cia_Envios
Nombre_Ci_ Envios
Pedidos
ID_Productos
Nombre_Productos
Costo_Producto
Imagen_Producto
Pedidos
Productos
ID_Productos
ID_Clientes
Nombre
Apellidos
Direccin
Numero_Pedido
Nombre_Cia_Envios
ID_Productos
Nombre_Productos
Cantidad_Pedido
ID_Producto
Fecha_Compra
Costos_Productos
Imagen_Producto
REGLAS DE CODD
Determinan la fidelidad de un Sistema Relacional al Modelo Relacional.
Regla 0: el sistema debe ser relacional, base de datos y administrador de sistema. Ese
sistema debe utilizar sus facilidades relacionales (exclusivamente) para manejar la base de
datos.
Regla 2: la regla del acceso garantizado, todos los datos deben ser accesibles sin
ambigedad. Esta regla es esencialmente una nueva exposicin del requisito fundamental para
las llaves primarias. Dice que cada valor escalar individual en la base de datos debe ser
lgicamente direccionable especificando el nombre de la tabla, la columna que lo contiene y la
llave primaria.
Regla 5: la regla comprensiva del sublenguaje de los datos, el sistema debe soportar
por lo menos un lenguaje relacional que;
1.
2.
3.
Regla 6: regla de actualizacin, todas las vistas que son tericamente actualizables
deben ser actualizables por el sistema.
Regla 9: independencia de datos lgica, los cambios al nivel lgico (tablas, columnas,
filas, etctera) no deben requerir un cambio a una solicitud basada en la estructura. La
independencia de datos lgica es ms difcil de lograr que la independencia fsica de datos.
1.
cuando una versin distribuida del SGBD se introdujo por primera vez
2.
Regla 12: la regla del de la no subversin, si el sistema proporciona una interfaz de bajo
nivel (de registro a la vez) y luego de que esa interfaz no se pueda utilizar para subvertir el
sistema, por ejemplo: sin pasar por seguridad relacional o limitacin de integridad.
SQL
El lenguaje de consulta estructurado o SQL (por sus siglas en ingls structured query language)
es un lenguaje declarativo de acceso a bases de datos relacionales que permite especificar
diversos tipos de operaciones en stas. Una de sus caractersticas es el manejo del lgebra y
el clculo relacional permitiendo efectuar consultas con el fin de recuperar -de una forma
sencilla- informacin de inters de una base de datos, as como tambin hacer cambios sobre ella.
Select
Insert
Delete
Update
TRANSACCION
Unidad de ejecucin de un programa que accede y posiblemente actualice
varios elementos de datos se inicia por la ejecucin de un programa de usuario
escrito en un lenguaje de manipulacin de datos de alto nivel o en un lenguaje
de programacin( sql, c,java,pl-sql)
Atomicidad:
Consistencia
Aislamiento
Durabilidad
Activa
Parcialmente Comprometida
Comprometida
Fallida
Abortada
RECUPERACION
PUNTOS DE SINCRONIZACION
La ejecucin de una operacin COMMIT o ROLLBACK establece lo que se conoce como un punto de
sincronizacin. Un punto de sincronizacin representa el lmite entre 2 transacciones consecutivas, de
modo que corresponde al final de una unidad lgica de trabajo, y por tanto al punto ene l cul la BD
est en un estado de consistencia. Las nicas operaciones que establecen un punto de sincronizacin
son COMMIT, ROLLBACK y el inicio de un programa.
Cuando se establece un punto de sincronizacin:
Fallas del Sistema, las cuales afectan a todas las transacciones que se estn realizando pero
no daan fsicamente a la BD. Las fallas del sistema se conocen tambin como cadas suaves.
Fallas de los Medios de Almacenamiento, las cuales si causan daos a la BD, o a una porcin
de ella, y afectan al menos a las transacciones que estn utilizando esa porcin. Las fallas de los
medios de almacenamiento se denominan a veces cadas duras.
FALLA DEL SISTEMA
El punto crtico de una falla del sistema es que se pierde el contenido de la memoria principal. Por
tanto, ya no se conocer el estado preciso de la transaccin que se estuviera realizando en el
momento de la falla; esa transaccin jams se podr completar con xito, por lo cul ser preciso
anularla cuando se reinicie el sistema.
Cada cierto intervalo previamente establecido el sistema establece un punto de revisin de manera
automtica. El establecimiento de un punto de revisin implica:
a)
b)
El registro de punto de revisin incluye una lista de todas las transacciones que se estaban realizando
en el momento de establecerse el punto de revisin. Para comprender la forma como se utiliza esta
informacin deber leerse de la siguiente manera:
Comenzar con 2 listas de transacciones, la lista ANULAR y la lista REPETIR. Igualar la lista
ANULAR a la lista de todas las transacciones incluidas en el registro de punto de revisin. Dejar vaca
la lista REPETIR.
2.
3.
la lista ANULAR.
4.
Enseguida el sistema revisar la bitcora hacia atrs, anulando todas las transacciones de la lista
ANULAR. A continuacin la revisar otra vez hacia delante, realizando de nuevo todas las
transacciones de la lista REPETIR. Por ltimo, una vez terminada toda esa actividad de recuperacin,
el sistema estar listo para aceptar trabajos nuevos.
FALLA DE LOS MEDIOS DE ALMACENAMIENTO
Una falla de los medios de almacenamiento es un percance ene l cual se destruye fsicamente alguna
porcin de la BD. La recuperacin de una falla semejante implica en esencia cargar de nuevo la BD a
partir de una copia de respaldo y utilizar despus la bitcora para realizar de nuevo todas las
transacciones terminadas desde que se hizo esa copia de respaldo. No hay necesidad de anular las
transacciones inconclusas en el momento de la falla, porque por definicin todas las modificaciones de
esas transacciones ya se anularon de todas maneras.
La parte de restauracin de la utilera servir entonces para recrear la BD despus de una falla de los
medios de almacenamiento a partir de una copia de respaldo especificada.
DATAWAREHOUSING
En el contexto de la informtica, un almacn de datos (del ingls data warehouse) es una
coleccin de datosorientada a un determinado mbito (empresa, organizacin, etc.), integrado, no
voltil y variable en el tiempo, que ayuda a la toma de decisiones en la entidad en la que se utiliza.
Se trata, sobre todo, de un expediente completo de una organizacin, ms all de la informacin
transaccional y operacional, almacenado en una base de datos diseada para favorecer el anlisis
y la divulgacin eficiente de datos (especialmente OLAP, procesamiento analtico en lnea). El
almacenamiento de los datos no debe usarse con datos de uso actual. Los almacenes de datos
contienen a menudo grandes cantidades de informacin que se subdividen a veces en unidades
lgicas ms pequeas dependiendo del subsistema de la entidad del que procedan o para el que
sean necesario.
Data marts
Los Data marts son subconjuntos de datos de un data warehouse para reas especificas.
Entre las caractersticas de un data mart destacan:
Usuarios limitados.
rea especifica.
Cubos de informacin
Los cubos de informacin o cubos OLAP funcionan como los cubos de
rompecabezas en los juegos, en el juego se trata de armar los colores y en el
data warehouse se trata de organizar los datos por tablas o relaciones; los
primeros (el juego) tienen 3 dimensiones, los cubos OLAP tienen un nmero
indefinido de dimensiones, razn por la cual tambin reciben el nombre
de hipercubos. Un cubo OLAP contendr datos de una determinada variable que se
desea analizar, proporcionando una vista lgica de los datos provistos por
el sistema de informacin hacia el data warehouse, esta vista estar dispuesta
segn unas dimensiones y podr contener informacin calculada. El anlisis de
los datos est basado en las dimensiones del hipercubo, por lo tanto, se trata
de un anlisis multidimensional.
A la informacin de un cubo puede acceder el ejecutivo mediante "tablas
dinmicas" en una hoja de clculo o a travs de programas personalizados. Las
tablas dinmicas le permiten manipular las vistas (cruces, filtrados,
organizacin, totales) de la informacin con mucha facilidad. Las diferentes
operaciones que se pueden realizar con cubos de informacin se producen con
mucha rapidez. Llevando estos conceptos a un data warehouse, ste es una
coleccin de datos que est formada por dimensiones y variables,
entendiendo como dimensiones a aquellos elementos que participan en el
anlisis y variables a los valores que se desean analizar.
Dimensiones
Las dimensiones de un cubo son atributos relativos a las variables, son las
perspectivas de anlisis de las variables (forman parte de la tabla de
dimensiones). Son catlogos de informacin complementaria necesaria para la
presentacin de los datos a los usuarios, como por ejemplo: descripciones,
nombres, zonas, rangos de tiempo, etc. Es decir, la informacin general
complementaria a cada uno de los registros de la tabla de hechos.
Variables
Tambin llamadas indicadores de gestin, son los datos que estn siendo
analizados. Forman parte de la tabla de hechos. Ms formalmente, las variables
representan algn aspecto cuantificable o medible de los objetos o eventos a
analizar. Normalmente, las variables son representadas por valores detallados
y numricos para cada instancia del objeto o evento medido. En forma
contraria, las dimensiones son atributos relativos a las variables, y son
utilizadas para indexar, ordenar, agrupar o abreviar los valores de las mismas.
Las dimensiones poseen una granularidad menor, tomando como valores un
conjunto de elementos menor que el de las variables; ejemplos de dimensiones
podran ser: productos, localidades (o zonas), el tiempo (medido
en das, horas, semanas, etc.), ...
Ejemplos
Ejemplos de variables podran ser:
Beneficios
Gastos
Ventas
etc.
tiempo (medido de diferentes maneras, por horas, por das, por meses, por aos, ...)
etc.