Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introduccin:
En la actualidad las organizaciones manejan una gran cantidad de informacin, al ser estos
datos parte fundamental, por lo cual debe tenerlos almacenados en una base de datos y
manejados de una forma autnoma para poder evitar la prdida de tiempo dinero lo cual
generara perjuicios para la corporacin.
Uno de los pasos fundamentales en el proceso de la construccin de una aplicacin fiable
en el mundo real es el diseo de la base de datos. La complejidad en el diseo de la base de
datos, depender de cuanta y que tipo de informacin ser almacenada en la misma y es
irrepetible. Pero todo se basar en los principios que trataremos en el presente documento.
Administracin de datos
Jerarqua de datos:
En la mayora de los casos los datos estn organizados de manera que comienza con la
unidad ms pequea de informacin (bit) y de manera sucesiva se llega a formar la base de
datos. Al continuar en la jerarqua de la base de datos, nos encontramos con el campo el
cual esta conformadora los caracteres que describen un atributo de un objeto; a su vez el
conjunto de campos da lugar a los registros los cuales estn relacionados de igual manera
forma un archivo que es el conjunto de registros ordenados de manera coherente para dar
una informacin de acuerdo al contexto en el cual se le haga la consulta.
Entidades, Atributos y llaves de datos
Procedamos a definir los conceptos propuestos. Afirmaremos que la entidad de la clase
generalizada de personas lugares o cosas para los cuales se recaban y mantienen datos. De
manera distinta un atributo es una caracterstica relevante de una entidad, lo cual le da un
valor especifico con respecto al resto. Afirmamos que tanto las entidades como los
atributos son cruciales en las bases de datos por lo que representan en su conjunto.
La llave constituye un registro utilizado para identificar este, de manera similar la llave
primaria representa un medio de identificacin nico en un registro, de tal manera ningn
registro puede llevar la misma clase primaria por el uso de identificacin entre los registros
para poder modificar, acceso y organizar. Para una mayor fiabilidad en la base datos, se
recurre a la llave secundaria la cual guarda mayor informacin relacionada al individuo u
objeto, con la posibilidad de almacenar mayor informacin que la llave primaria.
Enfoque de la base de datos:
Bajo el enfoque tradicional de la base de datos, al momento de realizar una consulta las
aplicaciones un archivo independiente diseado para esa aplicacin en especfico, es decir
se encuentran aislados de otros aplicativos de consulta. En la actualidad se usa el enfoque
de base datos para la administracin de datos, en el cual mltiples aplicaciones comparten
informacin entre si lo cual genera una red de informacin mucho ms amplio y diverso.
Esto se logra con el DBMS que utiliza un grupo de programas que genera una interfaz entre
las bases de datos, el usuario y los programas de aplicacin.
El modelo relacional describe los datos mediante el uso de un formato tabular estndar. En
una base de datos estructurada de acuerdo con este modelo, todos los elementos de datos se
colocan en tablas bidimensionales llamadas relaciones, que constituyen el equivalente
lgico de los archivos. Las tablas de las bases de datos relacionales organizan los datos en
renglones y columnas, es decir, simplifican su acceso y manejo.
En el modelo relacional, cada rengln (registro) de una tabla representa una entidad de
datos, mientras que cada columna (campo) representa atributos, cada uno de los cuales slo
puede aceptar ciertos valores, que cuando estn permitidos, se llaman dominio. El dominio
de un atributo en particular indica qu valores pueden colocarse en cada columna de la
tabla relacional.
Manejo de datos
Despus de ingresar los datos en una base relacional, los usuarios los consultan y analizan.
Entre las operaciones bsicas que se pueden hacer con los datos se encuentran la seleccin,
la proyeccin y la unin.
Seleccin involucra la eliminacin de renglones de acuerdo con cierto criterio.
Proyeccin Manipulacin de datos para eliminar columnas en una tabla.
Unin Manipulacin de datos para combinar dos o ms tablas.
Siempre y cuando compartan al menos un atributo de datos, las tablas de una base de datos
relacional se pueden enlazar para brindar informacin y reportes tiles. Ser capaz de
enlazar tablas entre s a travs de atributos de datos comunes representa uno de los aspectos
principales de la flexibilidad y capacidad de las bases de datos relacionales.
en la tabla de proyecto, la cual nos conduce al NSS del gerente (098-40-1370) en la tabla de
departamento, que a su vez nos gua hasta el nombre del gerente (Fiske) y la fecha de su
contratacin (01-05-1985) registrada en la tabla degerente. Observe que algunas
organizaciones utilizan el nmero deseguro social (NSS) en vez del nmero de empleado.
Una de las ventajas principales de la base de datos relacional es que permite enlazar tablas
como se muestra en la tabla anterior. Este enlace es de suma utilidad cuando se necesita
informacin de mltiples tablas. Por ejemplo, el nmero del seguro social del gerente se
conserva en la tabla gerente. Si se llegara a necesitar este nmero, se puede obtener
mediante un enlace con dicha tabla.
El modelo de base de datos relacional es, de manera definitiva, el que ms se emplea
en la actualidad. Es ms fcil de controlar, ms flexible y ms intuitivo que otros
modelos, debido a que su organizacin se basa en la utilizacin de tablas.
Debido a las ventajas del modelo relacional, muchas compaas lo usan en grandes bases de
datos corporativas como las de marketing y contabilidad. Este modelo se utiliza con
computadoras personales y sistemas mainframe.
Diseo y modificacin de una base de datos relacional
Las bases de datos relacionales proporcionan muchas herramientas, consejos y atajos para
simplificar el proceso de diseo y modificacin de una base de datos.
Depuracin de datos
Proceso de bsqueda y reparacin de inconsistencias para garantizar que los datos sean
precisos y completos.
Los datos valiosos son precisos, completos, econmicos, flexibles, confiables, relevantes,
sencillos, oportunos, verificables, accesibles y seguros. La base de datos tambin debe estar
diseada de manera adecuada. El propsito de la depuracin de datos es desarrollarlos con
estas caractersticas. Considere la base de datos de un centro deportivo diseada para
registrar los pagos de los socios. La tabla contiene los atributos nombre, nmero telefnico,
gnero, cuotas pagadas y fecha de pagos. Como se muestra en los registros de la tabla,
Anita Brown y Sim Thomas ya pagaron sus cuotas del mes de septiembre. Sim liquid su
cuota en dos pagos. Observe que ninguna llave primaria identifica de manera nica cada
registro. Como se ver a continuacin, este problema debe corregirse.
Tabla de
Pago de
cuotas del
centro
deportivo
Debido a que Sim Thomas pag su cuota dos veces en el mes de septiembre, los datos que
se encuentran en la base son redundantes. El nombre, nmero telefnico y gnero de Tomas
aparece en dos registros. Observe tambin que los datos son inconsistentes: Thomas cambi
su nmero telefnico, pero slo uno de los registros refleja el cambio. Algo que reduce an
ms la confiabilidad de esta base de datos es la falta de una llave primaria que identifica de
manera nica el registro de Sim Thomas. El primer Thomas podra ser Sim, pero el segundo
podra ser Steve Thomas. Dichos problemas e irregularidades en los datos se llaman
anomalas y, a menudo, dan como resultado informacin incorrecta, lo que ocasiona que los
usuarios de la base no obtengan informacin confiable acerca de las condiciones reales. Las
anomalas deben corregirse. Para resolver estos problemas que enfrenta el centro deportivo,
podemos agregar una llave primaria como el nmero de socio, y poner los datos en dos
tablas: una tabla de los socios del centro deportivo con su gnero, nmero telefnico e
informacin relacionada, y otra de cuotas pagadas con el monto del pago y la fecha. Ambas
tablas incluyen el atributo nmero de socio, de tal forma que se pueden enlazar.
Tabla de
Socios
del
centro
deportivo
Tabla de
Cuotas pagadas
Las relaciones de las tablas reducen la redundancia y eliminan el problema potencial que
representa tener dos nmeros telefnicos diferentes para un mismo socio. Asimismo,
observe que el nos proporciona una llave primaria a cada registro de la tabla Socios del
centro deportivo. Debido a que la tabla Cuotas pagadas muestra dos registros de pago (15
dlares cada uno) con el mismo nmero de socio (ns656), slo una persona hizo los pagos,
no dos. A menudo se utilizan mtodos de formalizacin, por ejemplo, la normalizacin de
bases de datos, para depurar problemas que pudieran presentar los datos.
Archivo plano
Un archivo plano consiste en un simple programa de base de datos cuyos registros no estn
relacionados entre s. Con frecuencia, se utiliza para almacenar y manipular una sola tabla o
archivo y no usa ninguno de los modelos de bases de datos que ya se estudiaron, como el
modelo relacional. Muchos programas de hoja de clculo y procesador de palabra cuentan
con facilidades de archivo plano. Estos paquetes de software pueden clasificar tablas y
efectuar clculos y comparaciones sencillas. OneNote, de Microsoft, est diseado para que
la gente escriba ideas, pensamientos y notas en un archivo de computadora. Cuando se
emplea este programa, cada nota puede colocarse en cualquier lugar de la pgina o en una
caja dentro de sta llamada contenedor.
Un solo usuario
Por lo general, una base de datos instalada en una computadora personal es para un solo
usuario. Office
Access y FileMaker Pro, de Microsoft, estn diseadas para soportar implantaciones de un
solo usuario.
InfoPath, tambin de Microsoft, constituye otro ejemplo de un programa de base de datos
que soporta a un solo usuario. Este software es parte de la suite Office que ayuda a las
personas a recabar y organizar informacin proveniente de un nmero variado de fuentes.
Adems, cuenta con formas integradas que se utilizan para ingresar informacin acerca de
gastos, datos de horarios y una gran variedad de informacin.
Mltiples usuarios
Los negocios pequeos, medianos y grandes necesitan dbms multiusuario para compartir
informacin con
toda la organizacin a travs de una red. Estos sistemas, ms caros y poderosos, permiten
que decenas o cientos de personas accedan al mismo sistema de base de datos de manera
simultnea. Entre los proveedores ms populares de sistemas de bases de datos
multiusuario destacan Oracle, Microsoft, Sybase e IBM. Un gran nmero de bases de datos
para un solo usuario como Access puede implantarse para soporte multiusuario a travs de
una red, aunque a veces estas bases estn limitadas en cuanto a la cantidad de usuarios que
pueden soportar. Todos los dbms comparten funciones comunes, como ofrecer una vista al
usuario, el almacenamiento y recuperacin fsica de datos de la base de datos, modifi car
sta, manipular los datos y generar reportes. Con estas herramientas se manejan las tareas
ms complejas de procesamiento de datos y, debido a que son accesadas a travs de una
red, una base de datos puede dar servicio en muchos sitios en todo el mundo
Una vista al usuario
Debido a que el dbms es responsable del acceso a la base de datos, uno de los primeros
pasos de la instalacin y uso de una base de datos de gran tamao implica informar al dbms
acerca de la estructura lgica y fsica de los datos y las relaciones entre los que
corresponden a cada usuario. A esta descripcin se le llama esquema (como un diagrama
esquemtico). Por lo general, los grandes sistemas de bases de datos, como Oracle, utilizan
esquemas para definir las tablas y otras caractersticas de las bases de datos asociadas con
una persona o usuario.
datos, esto es, una descripcin detallada de todos los que se utilizan en la base de datos.
Dicho diccionario contiene la informacin siguientes:
Nombre del elemento de datos.
Alias u otros nombres que pueden utilizarse para describir el elemento.
Rango de valores que pueden utilizarse.
Tipo de datos (por ejemplo, alfanumricos o numricos).
Cantidad de espacio de almacenamiento necesario para el elemento.
Datos acerca de la persona responsable de actualizar el diccionario y de los diferentes
usuarios que pueden tener acceso a l.
Lista de los reportes que utilizan el elemento de datos.
ALMACENAMIENTO Y RECUPERACION DE DATOS
Una funcin del DBMS es servir como interfaz entre un programa de aplicacin y la base
de datos. Cuando un programa de aplicacin necesita datos, los solicita a travs de un
DBMS.
El programa de aplicacin solicita estos datos al DBMS. En el proceso, el programa sigue
una trayectoria lgica de acceso. Enseguida, el DBMS, que trabaja en conjunto con los
diferentes programas del sistema, accede a un dispositivo de almacenamiento, por ejemplo,
una unidad de disco donde se almacenan los datos.
Los sistemas de bases de datos requieren un administrador de bases de datos (DBA) con
muchas destrezas. Se espera que ste posea una idea muy clara de los negocios principales
de la organizacin, maneje con mucha habilidad determinados sistemas de administracin
de bases de datos y est actualizado en las tecnologas de vanguardia y los nuevos mtodos
de diseo.
El DBA trabaja en conjunto con los usuarios para decidir el contenido de la base de datos,
esto es, para determinar exactamente qu entidades son de inters y qu atributos se
registrarn acerca de ellas.
El DBA tambin trabaja con programadores, ya que la funcin de stos es disear
aplicaciones para garantizar que sus programas cumplan con los estndares y convenciones
del sistema de administracin de la base de datos.
BASE DE DATOS DISTRIBUIDAS Base de datos en la cual los datos pueden estar
repartidas en varias bases mas pequeas conectadas a traves de dispositivos de
telecomunicaciones.
USO DE UNA BASE DE DATOS DISTRIBUIDA
Para un fabricante de ropa, las computadoras pueden estar colocadas en la matriz del
corporativo, en el centro de investigacion y desarrollo, en el almacen y en las tiendas al
Tipo de anlisis
que soporta
Destrezas que se
requieren del
usuario
OLAP
Soporta el anlisis de
datos y la toma de
decisiones
Anlisis de datos de
arriba hacia abajo y
mediante
consultas
Un conocimiento
profundo
de los datos y su contexto
de negocios
Minera de datos
Soporta el anlisis de datos
y la toma de decisiones
Anlisis de datos se abajo
hacia arriba y mediante la
bsqueda
Debe confiar en las
herramientas de minera
de datos para encontrar
hiptesis vlidas y que
valgan la pena