Sei sulla pagina 1di 26

TECNOLGICO NACIONAL DE MXICO

INSTITUTO TECNOLGICO DE TIJUANA


DEPARTAMENTO DE SISTEMAS Y COMPUTACIN

Administracin de base de datos


SCB-1001SC6A

Docente: Leslie Astudillo


Hora: 19:00 - 20:00 hrs

1.2 Anlisis de Gestor de Base de Datos

Equipo:

Camargo Daz Juan Manuel - 13211420


Guzmn Moreno Misael - 14212027
ndice
ndice 2

Oracle 4
Historia y Evolucin 4
Caractersticas 5
Ventajas 5
Desventajas 5
Requisitos de Instalacin 6
Costos 6
Principal Mercado 7

MongoDB 8
Historia y Evolucin 8
Caractersticas 8
Consultas Ad hoc 8
Ventajas 9
Desventajas 9
Requisitos de Instalacin 10
Costos 10
Principal Mercado 10

MySQL 11
Historia y Evolucin 11
Caractersticas 11
Ventajas 12
Desventajas 12
Requisitos de Instalacin 12
Costos 12

Cassandra 12
Historia y Evolucin 13
Caractersticas 13
Ventajas 14
Desventajas 16
Requisitos de Instalacin 17
Costos 17
Principal Mercado 17

DB2 18
Historia y Evolucin 18
Caractersticas 19
Ventajas 19
Desventajas 21
Requisitos de Instalacin 22
Costos 22
Principal Mercado 23

AWS SimpleDB 24
Caractersticas 24
Ventajas 24
Desventajas 25
Requisitos de Instalacin 25
Costos 25
Principal Mercado 25

Referencias 26
Oracle

Historia y Evolucin

El manejador de Base de datos Oracle, surgi a final de los aos 70 y principio de los
aos 80. George Koch y su equipo de tropas de asalto de tcnicos fue el primero en
desembarcar en el terreno de Oracle en 1982.

Durante un proceso de evaluacin de sistema de gestin de base de datos para una


importante aplicacin comercial que George estaba diseando y construyendo.
Cuando termin, la evaluacin fue descrita en Computer World como el estudio ms
severo de SGBD que se haba hecho nunca.El estudio fue tan riguroso con los
vendedores cuyos productos haba estudiado George, que la prensa hizo eco de sus
palabras en lugares tan distantes como Nueva Zelanda.
Oracle conocida entonces como Relational Software, tena poco ms de 25
empleados en aquel tiempo y solo unos pocos clientes importantes
Sin embargo, cuando se complet el estudio, Oracle fue declarada vencedora.
George afirm que el SGBD Oracle era tcnicamente el mejor producto del mercado

La compaa de Oracle Corporation estaba trabajando entonces para perfeccionar su


joven producto, para comprender los tipos de caractersticas y funcionalidad que
podra hacerlo til y productivo en el mundo de los negocios.
El esfuerzo contribuy a su refinamiento. Algunas de las caractersticas de Oracle,
tales como las salidas de SQL*FORMS fueron el resultado de dicho esfuerzo.

Evolucin

El poderoso modelo relacional ha evolucionado desde herramientas y los modelos de


datos de redes. La mayor manera aceptada y usada de un modelo de datos es el
modelo relacional.

Un modelo relacional posee tres grandes aspectos:

Estructuras: Definicin de objetos que contengan datos y que son accesibles a los
usuarios.

Operaciones: Definir acciones que manipulen datos u objetos

Reglas: Leyes para gobernar la informacin, como y quien manipular.


Caractersticas

Puede ejecutarse en todas las plataformas, desde una Pc hasta un


supercomputador.
Oracle soporta todas las funciones que se esperan de un servidor "serio": un
lenguaje de diseo de bases de datos muy completo (PL/SQL) que permite
implementar diseos "activos", con triggers y procedimientos almacenados,
con una integridad referencial declarativa bastante potente.
Permite el uso de particiones para la mejora de la eficiencia, de replicacin e
incluso ciertas versiones admiten la administracin de bases de datos
distribuidas.
Existe incluso una versin personal para Windows 9x, lo cual es un punto a
favor para los desarrolladores que se llevan trabajo a casa.

Ventajas

Oracle es el motor de base de datos objeto-relacional ms usado a nivel


mundial.
Oracle es la base de datos con ms orientacin hacia internet.
Permite el uso de particiones para la mejora de la eficiencia, de replicacin e
incluso ciertas versiones admiten la administracin de bases de datos
distribuidas.
El software del servidor puede ejecutarse en multitud de sistemas operativos.

Desventajas

Las versiones ms recientes de Oracle son la 11g, 10g, 9g, 8g, desde el
lanzamiento original de la 8 se sucedieron varias versiones con correcciones,
hasta alcanzar la estabilidad en la 8.0.3. El motivo de tantos fallos fue, al
parecer, la remodelacin del sistema de almacenamiento por causa de la
introduccin de extensiones orientadas a objetos.

El mayor inconveniente de Oracle es quizs su precio. Incluso las licencias de


Personal Oracle son caras.
Necesidad de ajustes. Un error frecuente consiste en pensar que basta instalar
el Oracle en un servidor y enchufar directamente las aplicaciones clientes. Un
Oracle mal configurado puede ser lento.
Tambin es elevado el coste de la informacin, y slo ltimamente han
comenzado a aparecer buenos libros sobre asuntos tcnicos distintos de la
simple instalacin y administracin.

Requisitos de Instalacin

Memoria: el requisito mnimo de memoria es de 1 GB. La imagen ISO de Live


Media y los instaladores de GUI y de texto pueden funcionar con una cantidad
de memoria limitada. Los requerimientos exactos varan segn las
especificaciones del sistema.

Espacio en el disco: se recomienda tener, al menos, 13 GB de espacio en el


disco. El espacio se consume del modo siguiente:

rea de intercambio y dispositivo de volcado: los tamaos predeterminados


de los volmenes de volcado e intercambio creados por los programas de
instalacin de Solaris varan segn la cantidad de memoria disponible en el
sistema y otras variables.
Entorno de inicio (BE): un entorno de inicio ZFS tiene aproximadamente entre
4 y 6 GB. Cada entorno de inicio ZFS que se clona de otro entorno de inicio
ZFS no necesita espacio en disco adicional.
Componentes del sistema operativo Oracle Solaris: todos los subdirectorios
del sistema de archivos raz que forman parte de la imagen del sistema
operativo, con la excepcin de /var, deben estar en el mismo conjunto de
datos que el sistema de archivos raz.

Slo x86 (compatibilidad para ejecutar varios sistemas operativos): puede


realizar una particin del disco que contendr el sistema operativo antes de
una instalacin o durante una instalacin.

Costos
Version----------------------------Usuario-------------------Procesador
Standard Edition................US$ 300.00.....................US$ 15,000.00
Enterprise Edition...........US$ 800.00......................US$ 40,000.00
Principal Mercado
Oracle est principalmente enfocado en las empresas, ya que manejan la base de
datos ms usado, ocupa el primer lugar en la categora de las bases de datos y el
sptimo lugar a nivel mundial de las compaas de tecnologas de la informacin.
MongoDB

Historia y Evolucin

El desarrollo de MongoDB empez con la empresa de software 10gen Inc. (ahora


llamada MongoDB Inc.) en 2007 cuando estaban desarrollando una plataforma como
servicio (PaaS) similar al conocido Google App Engine.6 En 2009 MongoDB fue
lanzado como un producto independiente y publicado bajo la licencia de cdigo
abierto AGPL.

En marzo de 2011, se lanz la versin 1.4 y se consider ya como una base de datos
lista para su uso en produccin.

Caractersticas

Consultas Ad hoc

MongoDB soporta la bsqueda por campos, consultas de rangos y expresiones


regulares. Las consultas pueden devolver un campo especfico del documento pero
tambin puede ser una funcin JavaScript definida por el usuario.

Replicacin
MongoDB soporta el tipo de replicacin primario-secundario. Cada grupo de primario
y sus secundarios se denomina replica set .13 El primario puede ejecutar comandos
de lectura y escritura. Los secundarios replican los datos del primario y slo se
pueden usar para lectura o para copia de seguridad, pero no se pueden realizar
escrituras. Los secundarios tiene la habilidad de poder elegir un nuevo primario en
caso de que el primario actual deje de responder.
Balanceo de carga
MongoDB se puede escalar de forma horizontal usando el concepto de shard.14 El desarrollador
elige una clave de sharding, la cual determina cmo sern distribuidos los datos de una coleccin.
Los datos son divididos en rangos (basado en la clave de sharding) y distribuidos a travs de
mltiples shard. Cada shard puede ser una replica set. MongoDB tiene la capacidad de ejecutarse
en mltiple servidores, balanceando la carga y/o replicando los datos para poder mantener el
sistema funcionando en caso que exista un fallo de hardware. La configuracin automtica es fcil
de implementar bajo MongoDB y se pueden agregar nuevas servidores a MongoDB con el
sistema de base de datos funcionando.
Almacenamiento de archivos
MongoDB puede ser utilizado como un sistema de archivos, tomando la ventaja de la
capacidad que tiene MongoDB para el balanceo de carga y la replicacin de datos
utilizando mltiples servidores para el almacenamiento de archivos. Esta funcin se
llama GridFS y es ms bien una implementacin en los drivers, no en el servidor, por
lo que est incluida en los drivers oficiales que la compaa de MongoDB desarrolla.
Estos drivers exponen funciones y mtodos para la manipulacin de archivos y
contenido a los desarrolladores. En un sistema con mltiple servidores, los archivos
pueden ser distribuidos y replicados entre los mismos y de una forma transparente,
de esta forma se crea un sistema eficiente que maneja fallos y balanceo de carga.
Agregacin
proporciona un framework de agregacin que permite realizar operaciones similares
a las que se obtienen con el comando SQL "GROUP BY". El framework de agregacin
est construido como un pipeline en el que los datos van pasando a travs de
diferentes etapas en los cuales estos datos son modificados, agregados, filtrados y
formateados hasta obtener el resultado deseado. Todo este procesado es capaz de
utilizar ndices si existieran y se produce en memoria. Asimismo, MongoDB
proporciona una funcin MapReduce que puede ser utilizada para el procesamiento
por lotes de datos y operaciones de agregacin.

Ventajas

Mongo DB tiene la capacidad de realizar consultas utilizando javascript,.


se utiliza un sistemas de archivos, ya que cuenta con la capacidad para
balancear la carga y recopilacin de datos utilizando mltiples servidores para
almacenamiento de archivo.
El desarrollador elige una llave shard(clave).
La configuracin automtica, se puede agregar nuevas mquinas a mongo DB
con el sistema de base corriendo.

Desventajas
mongo DB bloquea la base de datos cada vez que se realiza un escritura, lo
que reduce la concurrencia dramticamente.
retorna cuando no se a escrito la informacin en el espacio de
almacenamiento permanente, puede ocasionar prdida de informacin.
tiene problemas de rendimiento cuando el volumen de datos supera los 100
GB.
Requisitos de Instalacin

Funciona con cualquier sistema operativo de Windows y Linux.


No debe ser un sistema operativo de 32 bits.
Mnimo de 512 MB de memoria RAM.

Costos
Es un software libre.

Principal Mercado
Algunas compaas como MTV, network, crarglist y fourquare.
maneja los sistemas operativos: windows, linux y us.
inicio en el mercado del 2007.
MySQL

Historia y Evolucin

El origen de MySQL se remonta a la dcada de los ochenta. Michael Widenius,


tambin conocido como Monty, un joven programador que realizaba complejas
aplicaciones en lenguaje BASIC, al no encontrar un sistema de almacenamiento de
archivos que le resultara satisfactorio, pens en construir el suyo propio. Aos
despus, en 1995, y en colaboracin con David Axmark, Widenius desarroll un
producto que bsicamente era el resultado de sus investigaciones, ms dos
aportaciones nuevas: el uso del lenguaje SQL y la accesibilidad a travs de Internet.
As naci MySQL y tambin la empresa MySQL AB.

La evolucin de MySQL se produce con las sugerencias de los usuarios, canalizadas


por la empresa MySQL AB, que contrata a programadores de todo el mundo para
que, a travs de Internet, vayan ampliando y mejorando el producto. Las versiones,
como es costumbre en este tipo de software libre, se van colgando en Internet para
que los usuarios puedan disponer de ellas.

Caractersticas

Aprovecha la potencia de sistemas multiprocesador, gracias a su


implementacin multihilo.
Soporta gran cantidad de tipos de datos para las columnas.
Dispone de API's en gran cantidad de lenguajes (C, C++, Java, PHP, etc).
Gran portabilidad entre sistemas.
Soporta hasta 32 ndices por tabla.
Gestin de usuarios y passwords, manteniendo un muy buen nivel de
seguridad en los datos.
Condicin de open source de MySQL hace que la utilizacin sea gratuita y se
puede modificar con total libertad.
Se puede descargar su cdigo fuente. Esto ha favorecido muy positivamente
en su desarrollo y continuas actualizaciones.
Ventajas

MySQL software es Open Source


Velocidad al realizar las operaciones, lo que le hace uno de los gestores con
mejor rendimiento.
Bajo costo en requerimientos para la elaboracin de bases de datos, ya que
debido a su bajo consumo puede ser ejecutado en una mquina con escasos
recursos sin ningn problema.
Facilidad de configuracin e instalacin.
Soporta gran variedad de Sistemas Operativos
Baja probabilidad de corromper datos, incluso si los errores no se producen en
el propio gestor, sino en el sistema en el que est.

Desventajas

Un gran porcentaje de las utilidades de MySQL no estn documentadas.


No es intuitivo, como otros programas (ACCESS).

Requisitos de Instalacin

Un sistema operativo Windows de 32 bits


Soporte para protocolo TCP/IP.
Una copia de la distribucin binaria de MySQL para Windows
Una herramienta capaz de leer ficheros .zip, para descomprimir el fichero de
distribucin.

Costos
Es un software libre.

Principal Mercado
utilizada por propiedades web de perfil alto, como Facebook, Twitter, YouTube y los
cinco sitios web principales.

Cassandra
Historia y Evolucin
Apache Cassandra fue desarrollado en Facebook para potenciar su funcin Inbox
Search de Avinash Lakshman (uno de los autores del Amazon Dynamo) y Prashant
Malik. Fue lanzado como un proyecto de cdigo abierto en el cdigo de Google en
julio de 2008. En marzo de 2009, se convirti en un proyecto de incubadora Apache.
El 17 de febrero de 2010 se gradu a un proyecto de nivel superior.

Caractersticas
Apache Cassandra es una base de datos NoSQL distribuida y basada en un modelo
de almacenamiento de clave-valor, de cdigo abierto que est escrita en Java.
Permite grandes volmenes de datos en forma distribuida. Por ejemplo, lo usa Twitter
para su plataforma. Su objetivo principal es la escalabilidad lineal y la disponibilidad.
La arquitectura distribuida de Cassandra est basada en una serie de nodos iguales
que se comunican con un protocolo P2P con lo que la redundancia es mxima. Est
desarrollada por Apache Software Foundation.
Cassandra ofrece soporte robusto para mltiples centros de datos, con la replicacin
asincrnica sin necesidad de un servidor maestro, que permiten operaciones de baja
latencia para todos los clientes.

Cassandra tambin ofrece un gran rendimiento. En 2012, investigadores de la


Universidad de Toronto que estudian los sistemas NoSQL concluyeron que "En
trminos de escalabilidad, hay un claro ganador a travs de nuestros experimentos.
Cassandra logra el ms alto rendimiento para el nmero mximo de nodos en todos
los experimentos", aunque "esto tiene como precio una alta latencia de escritura y
lectura".
El modelo de datos de Cassandra consiste en particionar las filas, que son
reorganizadas en tablas . Las claves primarias de cada tabla tiene un primer
componente que es la clave de particin. Dentro de una particin, las filas son
agrupadas por las columnas restantes de la clave. Las dems columnas pueden ser
indexadas por separado de la clave primaria.
Las tablas se pueden crear, eliminar y alterar en tiempo de ejecucin sin bloquear
actualizaciones y consultas.

Cassandra no soporta joins o subqueries, sino que enfatiza en la desnormalizacin a


travs de caractersticas como colecciones.

En las versiones iniciales utilizaba un API propia para poder acceder a la base de
datos. En los ltimos tiempos estn apostando por un lenguaje denominado CQL
(Cassandra Query Language, no confundir con Contextual Query Language) que
posee una sintaxis similar a SQL aunque con muchas menos funcionalidades. Esto
hace que iniciarse en el uso de la misma sea ms sencillo. Permite acceder en Java
desde JDBC.

Ventajas
1. Open Source
Cassandra es el proyecto de cdigo abierto de Apache, esto significa que est
disponible GRATIS! S, puede descargar la aplicacin y utilizar la forma que desee. De
hecho, su naturaleza de cdigo abierto ha dado a luz a una gran comunidad de
Cassandra donde personas de ideas afines comparten sus puntos de vista, consultas y
sugerencias relacionadas con Big Data. Adems, Cassandra se puede integrar con
otros proyectos Apache open-source como Hadoop (con la ayuda de MapReduce),
Apache Pig y Apache Hive.

2. Arquitectura Peer to Peer


Cassandra sigue una arquitectura peer-to-peer, en lugar de arquitectura maestro-
esclavo. Por lo tanto, no hay punto nico de fracaso en Cassandra. Adems, cualquier
nmero de servidores / nodos se puede agregar a cualquier cluster de Cassandra en
cualquiera de los centros de datos. Como todas las mquinas estn en el mismo nivel,
cualquier servidor puede entretener la peticin de cualquier cliente. Sin duda, con su
robusta arquitectura y caractersticas excepcionales, Cassandra ha elevado la barra
muy por encima de otras bases de datos.

3. Escalabilidad Elstica
Una de las mayores ventajas del uso de Cassandra es su escalabilidad elstica.
Cassandra cluster puede ser fcilmente ampliado o reducido. Curiosamente, cualquier
nmero de nodos se pueden agregar o eliminar en el cluster de Cassandra sin mucha
perturbacin. No es necesario reiniciar el clster ni cambiar las consultas relacionadas
con la aplicacin de Cassandra mientras se ampla o disminuye la escala. Esta es la
razn por Cassandra es popular de tener un rendimiento muy alto para el mayor
nmero de nodos. A medida que ocurre el escalado, el rendimiento de lectura y
escritura aumenta simultneamente con un tiempo de inactividad cero o cualquier
pausa en las aplicaciones.
4. Alta disponibilidad y tolerancia a fallos
Otra caracterstica llamativa de Cassandra es la replicacin de datos que hace que
Cassandra sea altamente disponible y tolerante a fallos. Replicacin significa que cada
informacin se almacena en ms de una ubicacin. Esto se debe a que, incluso si falla
un nodo, el usuario debera ser capaz de recuperar los datos con facilidad desde otra
ubicacin. En un clster Cassandra, cada fila se replica en funcin de la clave de fila.
Puede establecer el nmero de rplicas que desea crear. Al igual que el escalado, la
replicacin de datos tambin puede ocurrir a travs de mltiples centros de datos.
Esto conduce adems a un alto nivel de respaldo y las competencias de recuperacin
en Cassandra.

5. Alto rendimiento
La idea bsica detrs del desarrollo de Cassandra era aprovechar las capacidades
ocultas de varias mquinas multincleo.Cassandra ha hecho realidad este sueo!
Cassandra ha demostrado un rendimiento brillante bajo grandes conjuntos de
datos.Por lo tanto, Cassandra es amado por las organizaciones que se ocupan de
enorme cantidad de datos todos los das y al mismo tiempo no puede permitirse el
lujo de perder tales datos.

6. Orientada a columnas
Cassandra tiene un modelo de datos de muy alto nivel, orientado a columnas.
Significa, Cassandra almacena las columnas basadas en los nombres de las columnas,
dando lugar a un corte muy rpido. A diferencia de las bases de datos tradicionales,
donde los nombres de columnas slo consisten en metadatos, en los nombres de
columnas de Cassandra tambin pueden constar los datos reales. As, las filas de
Cassandra pueden consistir en masas de columnas, en contraste con una base de
datos relacional que consiste en un nmero de columnas. Cassandra est dotada de
un rico modelo de datos.
7. Libre de esquema
Desde su creacin, Cassandra es famosa por ser una base de datos sin esquemas ni
esquemas en su familia de columnas. En Cassandra, las columnas se pueden crear a
su voluntad dentro de las filas. El modelo de datos de Cassandra tambin es conocido
como un modelo de datos opcional de esquema. En contraste con una base de datos
tradicional, en Cassandra no es necesario mostrar todas las columnas necesarias para
su aplicacin en la superficie, ya que no se espera que cada fila tenga el mismo
conjunto de columnas.

8. Consistencia afinable
Caractersticas como la consistencia sintonizable, hace Cassandra una base de datos
incomparable. En Cassandra, la consistencia puede ser de dos tipos: consistencia
eventual y consistencia fuerte. Usted puede adoptar cualquiera de estos, basado en
sus requisitos. La consistencia eventual garantiza que el cliente sea aprobado tan
pronto como el clster acepte la escritura.Considerando que, consistencia fuerte
significa que cualquier actualizacin se transmite a todas las mquinas o todos los
nodos donde los datos particulares se encuentra. Usted tambin tiene la libertad de
mezclar la consistencia eventual y fuerte. Por ejemplo, puede ir para la consistencia
eventual en el caso de centros de datos remotos donde la latencia es bastante alta e ir
para la consistencia fuerte para los centros de datos locales donde la latencia es baja.
Desventajas
La replicacin significa que los datos se replican en varios nodos a medida que
se configuran. Por ejemplo, cada registro que escribo puedo tenerlo replicado
a 2 o 3 o incluso 10 otros nodos. Pero esto tambin significa que cualquier
dato malo tambin se reproduce. As que tienes que tener cuidado de no
hacerlo. (Por ej en el cuadro ID de usuario, si accidentalmente puse id = -1,
name = 'Moe', direccin = 'bla' y esto es incorrecto segn la lgica de negocio,
Cassandra todava tomarlo y replicarlo. As que la replicacin doesn' t significa
automticamente que sus datos son seguros.

Reparaciones - Este es el concepto especfico de Cassandra y no es tan trivial


para entender, y mucho menos maestro. La mayora de los usuarios lo dejan
en la base de datos. (Esto es cuando algunos nodos mueren pero no vuelven
dentro de una ventana que permite que otros nodos pasen los datos que el
nodo falt. Para los nodos ex A, B, C hay 1-100 registros duplicados entre todos
ellos. Ahora C, se muere y 101 a 200. A o B pueden mantener los registros para
que C vuelva a subir Si C regresa dentro de una ventana, si no, A y B dejarn
caer esos registros mantenido en nombre de C. Para corregir el clster, se
debe ejecutar una reparacin ( Tenga en cuenta que los datos no se pierden,
es slo que A y B tienen copias pero C no lo hace si su aplicacin necesita
Quorum o todos los nodos para tener la copia entonces sus lecturas pueden
fallar por un tiempo. )

No puede ejecutar consultas imprevistas porque el almacenamiento de datos


en disco o en mem es tal que no puede consultar en ninguna columna que
desee. Tendr que aadir explcitamente ndices. Esto lo morder si
simplemente asume que slo tiene que crear una tabla utilizando CQL
(Cassandra Query Language) que est modelado en SQL.
Tambin a diferencia de RDBMS / SQL mundo, se aconseja desnormalizar su base de
datos a expensas de almacenar datos redundantes. Esto es para optimizar sus
tiempos de lectura. Esto se relaciona con el otro punto que hice acerca de no poder
consultar en ninguna columna.
Esto tambin significa que no puede esperar que la base de datos haga validaciones
como restricciones nulas, violaciones de unicidad, etc. La aplicacin tiene que hacer
cumplir eso. Esto es cierto para la mayora de los DB de NoSQL, as que esto es ms
como un gotcha.

A medida que avanza ms en Cassandra hay ms cosas que usted puede


necesitar prestar atencin. No todos estos son precisos. (Cuenta de filas, por
ejemplo, o estadsticas relacionadas con la lectura y escritura, etc.) Esto
significa que no se puede ajustar la configuracin aleatoriamente y arreglar el
clster si algo comienza a fallar. Realmente necesitas hacer un estudio
detallado.

Requisitos de Instalacin
La ltima versin de Java 8, ya sea el Oracle Java Standard Edition 8 o OpenJDK 8 .
Para usar cqlsh, la ltima versin de Python 2.7 .

Costos
Open Source as que no tiene costo.

Principal Mercado
Cassandra tiene un mercado amplio de clientes pero no tiene un grupo en especfico
de consumidores, sin embargo existen grandes empresas que la usan:

Netflix
Facebook
Twitter
Reddit
Zoho
Wikimedia
Apple
DB2

Historia y Evolucin
Desde la dcada de 1970, cuando IBM Research invent el Modelo Relacional y el
Lenguaje de Consulta Estructurado (SQL), IBM ha desarrollado una familia completa
de servidores de datos. El desarrollo se inici en plataformas mainframe como Virtual
Machine (VM), Virtual Storage Extended (VSE) y Multiple Virtual Storage (MVS). En
1983 naci DB2 para MVS Versin 1. "DB2" se utiliz para indicar un cambio de las
bases de datos jerrquicas -como el Sistema de Gestin de la Informacin (IMS)
popular en el momento- a las nuevas bases de datos relacionales . El desarrollo de
DB2 continu en las plataformas de mainframe, as como en las plataformas
distribuidas.
En 1996, IBM anunci DB2 Universal Database (UDB) Versin 5 para plataformas
distribuidas. Con esta versin, DB2 pudo almacenar todo tipo de datos electrnicos,
incluyendo datos relacionales tradicionales, as como documentos de audio, video y
texto. Era la primera versin optimizada para la Web y soportaba una variedad de
plataformas distribuidas -por ejemplo, OS / 2, Windows, AIX, HP-UX y Solaris- de
mltiples proveedores. Adems, esta base de datos universal fue capaz de funcionar
en una variedad de hardware, desde sistemas uniprocesador y sistemas de
multiprocesador simtrico (SMP) hasta sistemas de procesamiento masivo (MPP) y
grupos de sistemas SMP.

Aunque el modelo relacional para almacenar datos es el ms frecuente en la industria


actual, el modelo jerrquico nunca perdi su importancia. En los ltimos aos, debido
a la popularidad de Xtensional Markup Language (XML), se ha producido un
resurgimiento en el uso del modelo jerrquico. XML, un lenguaje flexible y
descriptivo, se basa en el modelo jerrquico para almacenar datos. Con la aparicin
de nuevas tecnologas Web, la necesidad de almacenar tipos de datos no
estructurados, y compartir e intercambiar informacin entre empresas, XML resulta
ser el mejor lenguaje para satisfacer estas necesidades. Hoy vemos un crecimiento
exponencial del uso de documentos XML.

IBM reconoci tempranamente la importancia de XML, y se hicieron grandes


inversiones para entregar tecnologa pureXML; una tecnologa que proporciona un
mejor soporte para almacenar documentos XML en DB2. Despus de cinco aos de
desarrollo, el esfuerzo de 750 desarrolladores, arquitectos e ingenieros dio sus frutos
con el lanzamiento del primer servidor hbrido de datos en el mercado: DB2 9. DB2 9,
disponible desde julio de 2006, es un hbrido (tambin conocido como multi -
structured) de datos porque permite almacenar datos relacionales, as como datos
jerrquicos, de forma nativa. Mientras que otros servidores de datos del mercado y
versiones anteriores de DB2 podan almacenar documentos XML, el mtodo de
almacenamiento utilizado no era ideal para el rendimiento y la flexibilidad. Con la
tecnologa pureXML de DB2 9, los documentos XML se almacenan internamente de
una manera jerrquica analizada, como un rbol; por lo tanto, trabajar con
documentos XML se ha mejorado mucho. En 2007, IBM ha ido an ms lejos en su
soporte para pureXML, con la liberacin de DB2 9.5. DB2 9.5, la ltima versin de
DB2, no slo mejora e introduce nuevas caractersticas de pureXML, sino que
tambin aporta mejoras en la instalacin, administracin, administracin, escalabilidad
y rendimiento, administracin y monitoreo de la carga de trabajo, cumplimiento
normativo, determinacin de problemas y soporte para el desarrollo de aplicaciones ,
y soporte para aplicaciones de socios comerciales.

Caractersticas
IBM cree en desbloquear el potencial de sus datos, no reducirlo. Mantenemos
nuestras bases de datos a un nivel ms alto, facilitando el despliegue de sus datos
donde sea necesario, adaptndonos con fluidez a sus necesidades cambiantes e
integrndonos con mltiples plataformas, lenguajes y cargas de trabajo. IBM Db2 es
compatible con diversos sistemas que van desde mainframes ( Db2 para z / OS )
hasta sistemas distribuidos (antes DB2 en Linux, Unix y Windows ).

Ventajas
Poderoso lenguaje de consulta de estructura

DB2 tiene un dialecto de lenguaje de consulta estructurado (SQL) ms potente que la


oferta SQL de Microsoft. DB2 tiene caractersticas tales como tablas de objetos, antes
de activadores, soporte de mtodos Java, mltiples funciones definidas por el usuario
y soporte para matrices. MS SQL no admite ninguna de estas funciones. SQL permite
el acceso directo a los datos a travs de la interfaz de administracin de bases de
datos de DB2. Tambin puede ser incrustado en el cdigo de programas de
aplicacin escritos en otros idiomas, como COBOL y Java. Esta flexibilidad y lista de
funciones se combinan para convertir a DB2 en un potente sistema de gestin de
bases de datos relacional.

Soporte de mltiples plataformas

IBM produce versiones de DB2 que se ejecutan en todas las plataformas disponibles,
en lugar de basarse slo en plataformas basadas en Windows. En la lista de
plataformas soportadas de DB2 se incluyen AIX, HP-UX, Linux y Sun. Esta capacidad
de ejecutar en una variedad de plataformas de hardware / software aporta una
flexibilidad a la tabla que otros motores de base de datos no ofrecen. IBM tambin
ofrece DB2 como parte de un paquete preconfigurado junto con el sistema operativo.
Esta combinacin produce un mejor rendimiento ya que el sistema operativo est
configurado para el soporte de base de datos DB2 fuera de la caja, ahorrando tiempo
al administrador del sistema.

Gestin de la memoria autoajustable

El ajuste de la base de datos es parte del arte y parte de la ciencia, y normalmente


toma una cantidad significativa de tiempo del administrador de la base de datos.
Parte de este trabajo de configuracin requiere configurar la memoria para las
diferentes cargas de trabajo para lograr el mejor rendimiento. Durante el da, el
acceso suele ser a travs de aplicaciones en lnea, con acceso aleatorio a registros a
travs de la base de datos. Por la noche, la carga de trabajo tpicamente cambia a un
formato de lote, con el procesamiento secuencial de registros siendo la norma. DB2
Versin 9 ofrece una caracterstica denominada Self-tuning Memory Management
(STMM), que permite a la base de datos cambiar automticamente la asignacin de
memoria cuando hay un cambio en la carga de trabajo. Esto optimiza el rendimiento
haciendo ajustes sobre la marcha a la memoria de la base de datos y las
agrupaciones de bfer sin necesidad de intervencin humana.

Soporte de IBM

Una ventaja importante de DB2 es que se trata de una oferta de IBM. Desarrollado
hace muchos aos en los laboratorios de bases de datos de IBM, DB2 ha ganado
funcin tras caracterstica a lo largo de los aos. IBM produce actualizaciones de
software y parches de forma controlada despus de exhaustivas pruebas. El soporte
de software de alta calidad de IBM es un factor en la popularidad de DB2, junto con la
estabilidad del sistema que resulta de ese soporte. Los dlares de investigacin y
desarrollo de IBM continan mejorando el producto convirtiendo a DB2 en una
opcin ideal para un RDBMS.
Desventajas
Es difcil encontrar buenos DB2 DBAs rpidamente para un nuevo proyecto a
diferencia de Oracle o SQL-Server DBAs. Actualizar los Oracle DBAs a DB2 es fcil,
considerando la cantidad de materiales y tutoriales disponibles en Internet para DB2.
Por lo tanto, los equipos del proyecto deben buscar buenas personas RDBMS y
capacitarlos para un nuevo proyecto en DB2 en lugar de simplemente buscar DBAs
DB2 puros que la mayora de las veces terminan en frustracin. De esta manera, ms
DB2 DBAs estarn disponibles y al mismo tiempo los empleados existentes y los
recursos de tiempo completo estarn motivados para aprender una tecnologa de
base de datos exigente.

Hay muchas herramientas de supervisin grandes y eficientes en DB2, pero en


ninguna parte se menciona cul es la recomendada por IBM. Por lo tanto, en muchas
ocasiones encontramos que los desarrolladores y los DBA terminan usando
herramientas menos eficientes para el sistema de monitoreo o el rendimiento.
Siempre que los clientes compren una Licencia o Paquete de DB2, tambin deben
solicitar la mejor Herramienta de Monitoreo para su entorno. De esta forma, los
nuevos DBA tambin se vuelven muy productivos para el equipo, ya que todos ellos
podran no ser expertos para ejecutar todos los comandos a nivel de sistema. por
ejemplo, IBM Optim Performance Manager es una gran herramienta y debe
aprovecharse tanto para los DBA de DB2 como para los usuarios de Business cuando
compres un producto DB2.

Aparte de las dos preocupaciones anteriores (Menor nmero de DBA de DB2 y


disponibilidad de varias herramientas puede confundir a los clientes en algn
momento), encuentro que todo es genial con DB2 y sus productos relacionados:

En la parte Herramientas, me puse en contacto con el equipo de productos de IBM


sobre lo que estn haciendo actualmente para los clientes nuevos y existentes al
recomendar las mejores herramientas. Fueron muy rpido para darme los detalles
sobre el mismo y yo estaba bastante satisfecho con su estrategia actual para hacer
frente a mi preocupacin. Actualmente, IBM ha consolidado el enfoque de
Administracin, Gestin, Supervisin y Optimizacin en una nica plataforma
denominada IBM Data Server Manager. Este producto combina las capacidades de
Optim Performance Manager, Optim Configuration Manager y Optim Workload Tuner,
y la administracin bsica incluida en Data Studio en una sola oferta ms consumible
con una experiencia simplificada de funcionamiento y funcionamiento, flujos de
trabajo guiados y despliegue a vistas detalladas cuando sea necesario . Hay un 0
costo DSM Base Edition til como una entrada
punto y capacidades de ofrecimiento avanzadas en DSM Enterprise Edition.
Requisitos de Instalacin

Costos
Principal Mercado
Compaas grandes y con necesidad de bases de datos establecidas y altamente
escalables.
AWS SimpleDB

Caractersticas
Amazon SimpleDB es una base de datos distribuida escrita en Erlang por
Amazon.com . Se utiliza como un servicio web en concierto con Amazon Elastic
Compute Cloud (EC2) y Amazon S3 y es parte de Amazon Web Services . Se anunci
el 13 de diciembre de 2007.

Al igual que con EC2 y S3, Amazon cobra honorarios por el almacenamiento, la
transferencia y el rendimiento de SimpleDB a travs de Internet. El 1 de diciembre de
2008, Amazon introdujo nuevos precios con Free Tier para 1 GB de datos y 25 horas
de mquina. La transferencia a otros Servicios Web de Amazon es gratuita.

Amazon SimpleDB es un almacn de datos no relacionales de alta disponibilidad,


flexible y escalable que descarga el trabajo de administracin de bases de datos.
Proporciona las principales funciones de bases de datos de indexacin de datos y
consulta en la nube.

Ventajas
Uno de los principales beneficios tcnicos de Amazon SimpleDB es la replicacin
automtica y redundante geogrficamente. Cada vez que almacena un elemento de
datos, se crean varias rplicas en distintos centros de datos de la regin
seleccionada. En el caso improbable de que el centro de datos se quede sin
suministro elctrico, esto garantiza la disponibilidad y durabilidad de los datos.
Amazon SimpleDB tambin indexa automticamente los datos, lo que permite realizar
consultas de forma eficiente y ofrece una API sencilla para tareas de almacenamiento
y acceso. Finalmente, los desarrolladores disfrutan de la seguridad y fiabilidad del
entorno de clculo probado de Amazon.
Tradicionalmente, las caractersticas de disponibilidad y durabilidad de Amazon
SimpleDB se alcanzaban gracias a una base de datos relacional en clster que
necesitaba una inversin inicial considerable, implica una complejidad superior a la
necesaria y requera un administrador de bases de datos que mantuviera y
administrara el entorno. La naturaleza no relacional de Amazon SimpleDB tambin
permite disponer de escenarios ampliables con pocas necesidades de administracin
(mediante la creacin de dominios adicionales) y realizar cambios inmediatos en el
modelo de datos.

Desventajas

Requisitos de Instalacin
Siendo un servicio en la nube no requiere de un sistema operativo o un
requerimiento mnimo.

Costos
Puede comenzar con Amazon SimpleDB de forma gratuita. Los clientes nuevos y
existentes reciben 25 horas de mquina SimpleDB y 1 GB de almacenamiento gratis
cada mes. Muchas aplicaciones pueden funcionar permanentemente con estos
lmites de capa gratuita.

Las primeras 25 horas de mquina de Amazon SimpleDB que se consuman


cada mes son gratis
$0.140 USD por cada hora de mquina para Amazon SimpleDB consumida a
partir de ah

Principal Mercado
Desarrolladores que busquen una base de datos pequea y flexible que les permita
las funcionalidades de un gestor de base de datos sin la necesidades de una
implementacin tan grande.
Referencias
http://cassandra.apache.org/doc/latest/getting_started/installing.html
https://www.quora.com/What-are-advantages-and-disadvantages-of-Cassandra-
database-You-know-I-need-these-parameters-Distribution-Replication-Object-
Oriented-XML-and-unique-properties-of-it
https://www.edureka.co/blog/apache-cassandra-advantages/
https://es.wikipedia.org/wiki/Apache_Cassandra#Usuarios_Conocidos
https://www.cursor-distribution.de/en/distribution/sales-db2/db2-price-lists
http://www.informit.com/articles/article.aspx?p=1163083
https://www.techwalla.com/articles/the-advantages-of-db2
https://www.ibm.com/analytics/us/en/db2/
https://www.quora.com/What-are-the-major-draw-backs-and-limitations-in-the-DB2-
database
https://www.ibm.com/support/knowledgecenter/en/SSEPGG_9.7.0/com.ibm.db2.luw.q
b.server.doc/doc/r0006867.html
http://docs.aws.amazon.com/AmazonSimpleDB/latest/DeveloperGuide/Introduction.ht
ml
https://en.wikipedia.org/wiki/Amazon_SimpleDB

Potrebbero piacerti anche