Sei sulla pagina 1di 6

Fundamentos De

Bases De Datos Firmado digitalmente por


Atzikan Irak Estrada Bernal
Fecha: 2017.06.19 02:09:52
-05'00'

Investigacin
Unidad 5 y 6

Atzikan Irak Estrada Bernal

Ivn Azamar Palma

18 de junio de 2017
Contenido
Antecedentes histricos. ................................................................................................................................ 1
Aplicaciones. .................................................................................................................................................. 1
5 lgebra relacional. ........................................................................................................................................... 2
5.1 Operaciones fundamentales del lgebra relacional .................................................................................. 2
5.2 lgebra relacional extendida. ................................................................................................................... 2
6 Introduccin al lenguaje SQL. .......................................................................................................................... 3
6.1 Caractersticas.......................................................................................................................................... 3
6.2 Lenguaje de Definicin de Datos (LDD) ................................................................................................... 3
Tabla 1.1 lenguaje de definicin de datos .................................................................................................. 3
6.3 Lenguaje de Manipulacin de Datos (LMD).............................................................................................. 3
Tabla 1.2 lenguaje de manipulacin de datos. ........................................................................................... 3
Conclusin ...................................................................................................................................................... 5
Bibliografa...................................................................................................................................................... 5

Antecedentes histricos.
Al principio de los aos setenta, los laboratorios de investigacin Santa Teresa de IBM empezaron a
trabajar en el proyecto System R. El objetivo de este proyecto era implementar un prototipo de SGBD
relacional; por lo tanto, tambin necesitaban investigar en el campo de los lenguajes de bases de
datos relacionales. A mediados de los aos setenta, el proyecto de IBM dio como resultado un primer
lenguaje denominado SEQUEL (Structured English Query Language), que por razones legales se
denomin ms adelante SQL (Structured Query Language). Al final de la dcada de los setenta y al
principio de la de los ochenta, una vez finalizado el proyecto System R, IBM y otras empresas
empezaron a utilizar el SQL en sus SGBD relacionales, con lo que este lenguaje adquiri una gran
popularidad. En 1982, ANSI (American National Standards Institute) encarg a uno de sus comits
(X3H2) la definicin de un lenguaje de bases de datos relacionales. Este comit, despus de evaluar
diferentes lenguajes, y ante la aceptacin comercial del SQL, eligi un lenguaje estndar que estaba
basado en ste prcticamente en su totalidad. El SQL se convirti oficialmente en el lenguaje
estndar de ANSI en el ao 1986, y de ISO (International Standards Organization) en 1987. Tambin
ha sido adoptado como lenguaje estndar por FIPS (Federal Information Processing Standard), Unix
X/Open y SAA (Systems Application Architecture) de IBM. En el ao 1989, el estndar fue objeto de
una revisin y una ampliacin que dieron lugar al lenguaje que se conoce con el nombre de SQL1 o
SQL89. En el ao 1992 el estndar volvi a ser revisado y ampliado considerablemente para cubrir
carencias de la versin anterior. Esta nueva versin del SQL, que se conoce con el nombre de SQL2
o SQL92
Aplicaciones.
Las aplicaciones en red son cada da ms numerosas y verstiles. En muchos casos, el esquema
bsico de operacin es una serie de scripts que rigen el comportamiento de una base de datos.
Debido a la diversidad de lenguajes y de bases de datos existentes, la manera de comunicar entre
unos y otras sera realmente complicada a gestionar de no ser por la existencia de estndares que
nos permiten el realizar las operaciones bsicas de una forma universal. Es de eso de lo que trata el
Structured Query Language que no es ms que un lenguaje estndar de comunicacin con bases
de datos. Hablamos por tanto de un lenguaje normalizado que nos permite trabajar con cualquier
tipo de lenguaje en combinacin con cualquier tipo de base de datos. El hecho de que sea estndar
no quiere decir que sea idntico para cada base de datos. En efecto, determinadas bases de datos
implementan funciones especficas que no tienen necesariamente que funcionar en otras. Aparte de
esta universalidad, el SQL posee otras dos caractersticas muy apreciadas. Por una parte, presenta
una potencia y versatilidad notables que contrasta, por otra, con su accesibilidad de aprendizaje.

1
5 lgebra relacional.
5.1 Operaciones fundamentales del lgebra relacional
La operacin unin () permite combinar los datos de dos relaciones. El resultado de aplicar una
operacin de unin es una tabla formada con las columnas de una de ellas y las filas de ambas
tablas, excluyendo las que sean duplicadas, que slo aparecen una vez. La sintaxis de la unin en
SQL es la siguiente:
(SELECT <lista de atributos> FROM nombre_tabla1) UNION (SELECT <lista de atributos> FROM
nombre_tabla2).
La operacin interseccin ( ) permite identificar las tuplas que son comunes a dos relaciones. La
sintaxis de la interseccin en SQL es la siguiente:
(SELECT <lista de atributos> FROM nombre_tabla1) INTERSECT (SELECT <lista de atributos>
FROM nombre_tabla2).
La operacin diferencia (-) permite identificar tuplas que estn en una tabla que no se encuentran en
otra tabla. La sintaxis de la diferencia en SQL es la siguiente:
(SELECT <lista de atributos> FROM nombre_tabla1) MINUS (SELECT <lista de atributos> FROM
nombre_tabla2).
La operacin producto cartesiano, que se indica por el smbolo * o por el smbolo x, es idntica a la
operacin en matemticas que crea el producto cartesiano de dos conjuntos. La sintaxis del producto
cartesiano en SQL es la siguiente:
SELECT <lista de atributos> FROM nombre_tabla1 CROSS JOIN nombre_tabla2.
La seleccin () extrae tuplas de una relacin dada que satisfagan una condicin especificada. La
sintaxis de la seleccin en MySQL es la siguiente:
SELECT <lista de atributos> FROM nombre_ tabla1 WHERE condicin.
La operacin de proyeccin puede pensarse como la eliminacin de las columnas no deseadas, a
diferencia de otras operaciones del lgebra relacional, la operacin de proyectar no requiere de una
palabra clave especial o smbolo. Ms bien, para crear una proyeccin, se lista simplemente la
relacin original seguida de las columnas que se quieren conservar encerradas entre corchetes.
Con la operacin reunin se construye una relacin concatenando cada tupla de la primera relacin
con cada una de las tuplas de la segunda, siempre que ambas tuplas satisfagan la condicin dada.
Esta condicin se establece usando operadores relacionales (>, <, =) y operadores lgicos (AND,
OR, NOT). La reunin natural conecta relaciones cuando las columnas comunes tienen valores
iguales. En la reunin externa se incluyen las tuplas de una tabla que no estn relacionadas con la
otra tabla, concatenando con nulos. Es una variante del Join en la que se intenta mantener toda la
informacin de los operandos, incluso para aquellas filas que no participan en el Joinn las tuplas que
no tienen correspondencia en el Join se rellenan con nulos. La reunin (theta) es un producto
cartesiano seguido de una restriccin.
5.2 lgebra relacional extendida.
La operacin proyeccin generalizada ampla la operacin proyeccin permitiendo que se utilicen
funciones aritmticas en la lista de proyeccin. La operacin proyeccin generalizada tiene la forma:
F1,F2,...,Fn (E).
Las funciones de agregacin son funciones que toman una coleccin de valores y devuelven como
resultado un nico valor. Las funciones de agregacin ms habituales son sum (Suma), avg (Media
aritmtica), count (nmero de elementos), min y max (Mnimo y mximo, respectivamente).
La operacin reunin externa es una ampliacin de la operacin reunin para
trabajar con la informacin que falta. Esta operacin tiene tres formas diferentes: reunin externa por
la izquierda, reunin externa por la derecha y reunin externa completa. La reunin externa por la
izquierda toma todas las tuplas de la relacin de la izquierda que no coincidan con ninguna tupla de
la relacin de la derecha, las rellena con valores nulos en todos los dems atributos de la relacin
de la derecha y las aade al resultado de la reunin natural. La reunin externa por la derecha es
simtrica de la reunin externa por la izquierda. La reunin externa completa realiza estas dos
operaciones, rellenando las tuplas de la relacin de la izquierda que no coincidan con ninguna tupla
de la relacin de la derecha y las tuplas de la relacin de la derecha que no coincidan con ninguna
tupla de la relacin de la izquierda, y aadindolas al resultado de la reunin.

2
6 Introduccin al lenguaje SQL.
6.1 Caractersticas
La caracterstica relacional ms importante de SQL es que permite acceder a los datos sin necesidad
de especificar cmo se ha de realizar dicho acceso permitiendo as la navegacin automtica por los
datos. SQL est diseado para responder a preguntas del tipo Qu quiero hacer? al contrario que
los otros lenguajes de programacin, que intentan resolver cuestiones del tipo Cmo lo hago? SQL
usa los trminos tabla, fila y columna para relacin, tupla y atributo, respectivamente. SQL significa
Lenguaje Estructurado de Consultas (Structured Query Languaje) y se ha establecido Como el
lenguaje estndar de bases de datos relacionales, esto significa que su uso est generalizado a nivel
internacional. El lenguaje SQL tiene varios componentes, los bsicos son: El lenguaje de definicin
de datos para especificar el esquema de la base de datos. El lenguaje de manipulacin de datos
para expresar las consultas a la base de datos y las modificaciones. Integridad rdenes para
especificar las restricciones de integridad que deben satisfacer los datos almacenados en la base de
datos. Las actualizaciones que violen las restricciones de integridad se rechazan. Autorizacin
rdenes para especificar derechos de acceso para las relaciones y las vistas.
6.2 Lenguaje de Definicin de Datos (LDD)
En el lenguaje SQL se puede trabajar a nivel del Lenguaje de Definicin de Datos (LDD) (en ingls
DDL: Data Definition Languaje), es la parte de SQL dedicada a la definicin de la base de datos,
consta de sentencias para definir la estructura de la base de datos, permite definir gran parte del
nivel interno de la base de datos. La definicin de la estructura de la base de datos incluye tanto la
creacin inicial de los diferentes objetos que formaran la base de datos, como el mantenimiento de
la estructura. Las sentencias LDD utilizan unos verbos que se repiten para los distintos objetos. Por
ejemplo, para crear un objeto nuevo el verbo ser CREATE y a continuacin el tipo de objeto a crear.
CREATE DATABASE es la sentencia para crear una base de datos, CREATE TABLE nos permite
crear una nueva tabla, CREATE INDEX crea un nuevo ndice. Para la eliminar un objeto utilizaremos
el verbo DROP (DROP TABLE, DROP INDEX) y para la modificar algo de la definicin de un objeto
ya creado utilizamos el verbo ALTER (ALTER TABLE, ALTER INDEX).
CREATE objeto Crear
ALTER objeto Modificar
DROP objeto Eliminar
RENAME objeto Renombrar
TRUNCATE objeto Eliminar
Tabla 1.1 lenguaje de definicin de datos
6.3 Lenguaje de Manipulacin de Datos (LMD)
El Lenguaje de Manipulacin de Datos (LMD) (en ingls DML: Data Management Languaje), en este
nivel es en donde trabajan los usuarios. El LMD est formado por un conjunto de instrucciones que
permiten al usuario hacer consultas, llenar formularios y/o generar reportes, en funcin de la
autorizacin que tenga para realizar las operaciones. El LMD es un lenguaje de manipulacin de
datos, este es un tipo de lenguaje declarativo; esto significa que el usuario expresa qu informacin
desea obtener de la base de datos, pero no indica la forma en la cual esta informacin se debe
localizar y recuperar. El LMD se usa para modificar tuplas (registros) de la base de datos. Adems
del DQL, con la instruccin SELECT, lo forman las instrucciones INSERT, UPDATE, MERGE y
DELETE.
SELECT Recupera datos desde uno o varias tablas
INSERT Agrega un registro a una tabla
UPDATE Modifica en contenido de los campos en una tabla
DELETE Elimina registros de una tabla
Graba en el medio de almacenamiento las
COMMIT
modificaciones introducidas
Deshace las modificaciones introducidas despus
ROLBACK
del ltimo Commit
Tabla 1.2 lenguaje de manipulacin de datos.

3
Ejemplo
En la prctica, el Join es muy til cuando necesitamos extraer datos de dos tablas al mismo tiempo,
entonces por medio de un Join no necesitamos hacer dos accesos si queremos el IdUsuario, el
nombre y apellido paterno de los integrantes de un proyecto.
ALUMNOS
IdUsuario Nombre APaterno AMaterno Correo
MGomez Mario Gmez Prez mg@gmail.com
AEstrada Atzikan Estrada Bernal aeb@gmail.com
LGalvan Luz Moreno Galvn lmg@hotmail.com
ERodriguez Evaristo Rodrguez Fernndez evar@hotmail.com
INTEGRANTES
IdUsuario IdProyecto Rol
MGomez 2017p03 Lder
AEstrada 2017p04 Lder
LGalvan 2017p04 Alumno
ERodriguez 2017p03 Alumno
Y la instruccin es la siguiente:
SELECT IdUsuario, Nombre, APaterno FROM Usuarios
NATURAL JOIN Integrantes
WHERE Integrantes.IdProyecto = 2017p04;
IdUsuario Nombre APaterno
AEstrada Atzikan Estrada
LGalvan Luz Moreno
Preguntas
Que diferencia existe entre datos estructurados, semiestructurados y no estructurados?
Los datos estructurados es informacin bien organizada que siempre est definida por el tipo de dato
que es, como su nombre lo dice tienen una estructura, un ordenamiento y principalmente es la
informacin que viene de las bases de datos. Los datos semiestructurados no tienen un orden fijo,
pero aun as lo tienen que permite identificarlos, por ejemplo, una pgina HTML que se declaran los
datos, pero sin especificar de que tipo. Y los datos no estructurados es informacin que no tiene un
ordenamiento o una estructura definida solo son datos que no tienen un campo especifico como
imgenes, videos, audios, etc. Entonces la diferencia seria la forma que estn conformados, el
ordenamiento que tienen y la facilidad con la que son manipulados.
Por qu es importante mencionar el volumen, la velocidad, la variedad, la veracidad y el valor
de la informacin?
Es importante conocer el volumen de informacin con la que se est trabajando para as implementar
la tecnologa adecuada para el anlisis de datos y de esta forma no atiborrar de datos innecesarios.
La velocidad es importante en la fluidez de los datos para su correcto procesamiento y manipulacin
como cuando se toman de decisiones. La veracidad es un desafo a implementarse debido a los
grandes volmenes de informacin que se maneja ya que los datos deben de ser inequvocos. En el
caso de la variedad es un tema de importancia debido a que los datos vienen en diferentes tipos y
cada vez ms complejos, y es vital que las tecnologas identifiquen que tipo de dato estn
procesando. Y de toda la gran cantidad de datos puede existir informacin de mucho valor que puede
aportar a la entidad recursos para explotar dicha informacin.
Cules son las herramientas informticas para el anlisis del bigdata?
En el libro Big Data se hace referencia a herramientas como MapReduce que es un framework para
el procesamiento de datos paralelo y distribuido. Tambin se habla de bases de datos NoSQL que
fueron diseadas para el manejo de grandes volmenes de informacin de forma rpida y no siguen
el modelo tradicional de las bases de datos, sino que se basan en clave-valor. Se me mencionan
Cassandra, DynamoDB, Neo4J, InifnityGraph, Apache HBase, Hypertable, MongoDB, CouchDB y
Memcached. Y por ltimo se hace mayor nfasis a Hadoop que es un framework que permite trabajar
con miles de nodos y volmenes de datos del orden de petabytes. Es una multiplataforma
implementada en el lenguaje Java. Sus tres componentes bsicos son: Hadoop Distributed File
System, Hadoop MaoReduce y Hadoop Common.

4
Conclusin
De manera general, este trabajo de investigacin permite aprender las caractersticas que se deben
de tomar en cuenta para poder manipular sin ningn problema una base de datos; poder tener
acceso a la informacin, borrarla, modificar o actualizar. Adems, a cmo definir qu datos se deben
mostrar al ingresar alguna indicacin, como enlazar las tuplas de nuestro sistema de base de datos,
entre otras acciones que en un momento dado se requieran para que los usuarios que interacten
con el sistema puedan realizar sus consultas, generen informes o realicen alguna otra operacin con
la informacin que contenga la base de datos. El lgebra relacional define un conjunto de
operaciones algebraicas que operan sobre tablas y devuelven tablas como resultado. Estas
operaciones se pueden combinar para obtener expresiones que formulan las consultas deseadas.
El lgebra define las operaciones bsicas usadas en los lenguajes de consulta relacionales. El
lgebra relacional proporciona un conjunto de operaciones para manipular relaciones. Estas
operaciones se pueden clasificar de la forma siguiente. Operaciones conjuntistas: unin,
interseccin, diferencia y producto cartesiano. Operaciones especficamente relacionales: seleccin,
proyeccin y combinacin. Y estas operaciones del lgebra relacional pueden formar secuencias
que permiten resolver consultas complejas en una base de datos. Partiendo de conceptos bsicos
en matemticas como la teora de conjuntos podemos resolver problemas tan complejos como la
recuperacin de informacin de una base de datos, con slo conjeturar cada una de nuestras tablas
como conjuntos y aplicarles operaciones de lgebra relacional, siendo mucho ms sencillo la
interpretacin de las sentencias de los lenguajes de consulta a bases de datos. Un esquema de base
de datos se especifica mediante un conjunto de definiciones expresadas mediante un lenguaje
especial llamado lenguaje de definicin de datos (LDD). Nos permite crear y definir nuevas bases de
datos, campos e ndices. Un lenguaje de manipulacin de datos (LMD) es un lenguaje que permite
a los usuarios acceder o manipular los datos organizados mediante el modelo de datos apropiado.
Nos permite generar consultas para ordenar, filtrar y extraer datos de la base de datos. Es difcil
suponer hoy en da la concentracin de informacin sin bases de datos, las pequeas o grandes
industrias tienen como base de su sistema informtico la construccin de base de datos con la que
podemos tener gran versatilidad. La seguridad en las bases de datos es muy importante debido a
que garantiza la integridad fsica y lgica de los datos. El lenguaje SQL est compuesto por
comandos, clusulas, operadores y funciones de agregado. Estos elementos se combinan en las
instrucciones para crear, actualizar y manipular las bases de datos. El objetivo bsico de toda base
de datos es el almacenamiento de smbolos, nmeros y letras carentes de un significado en s, que
con un tratamiento adecuado se hace necesario la creacin de un sistema que ayude al diseador a
crear estructuras correctas y fiables, minimizando los tiempos de diseo y explotando todos los
datos. Un sistema gestor de bases de datos consiste en una coleccin de datos interrelacionados y
una coleccin de programas para acceder a esos datos. Los sistemas de bases de datos se disean
para almacenar grandes cantidades de informacin. Por debajo de la estructura de datos est el
modelo de datos, una coleccin de herramientas conceptuales para describir los datos, las
relaciones, la semntica de los datos y las relaciones de los datos.

Bibliografa
1.- Silberschatz Abraham, Korth F. Henry, & Sudarshan S. (2002). FUNDAMENTOS DE BASES DE
DATOS (4 edicin). (pp.7-71). Madrid Espaa: McGraw-Hill Inc.
2.- Oppel Andy, Sheldon Robert. (2010). FUNDAMENTOS DE SQL (3 edicin). (pp.15-21). Mxico:
McGraw-Hill Inc.
3.- Gabillaud Jerome. (2010). SQL Y ALGEBRA RELACIONAL. Barcelona, Espaa: ENI.
4.- Godoc Eric. (2010). SQL LOS FUNDAMENTOS DEL LENGUAJE. (pp.19-137). Barcelona,
Espaa: ENI.

Potrebbero piacerti anche